spss秩和检验.docx
《spss秩和检验.docx》由会员分享,可在线阅读,更多相关《spss秩和检验.docx(19页珍藏版)》请在冰豆网上搜索。
spss秩和检验
秩和检验
前面介绍的均数的区间估计及假设检验,都是要求个体变量值服从正态分布,或根据中心极限定理,当样本较大时,样本均数服从正态分布。
这种要求样本来自总体分布型是的,在此根底上对总体参数进展估计或检验,称为参数统计〔parametricstatistics〕。
但在医学研究中,许多数据不符合参数统计的要求,这时有两种处理的方法。
一是,进展数据转换,使其符合参数统计方法的要求。
二是,选择非参数检验方法,非参数检验(non-parametrictest)方法是对样本来自的总体分布不作要求〔如不要求样本来自正态分布〕的一类假设检验方法。
非参数检验的主要优点是对样本的总体分布不作要求,适用的围广,尤其是当变量中有不确定数值时,如<0.5mg,可用非参数检验。
同时,非参数检验方法存在其致命的缺点,其检验成效低于相应的参数统计方法。
因此,如果数据符合参数统计的要求首选参数统计方法;如果数据不符合参数统计的要求有两个选择,一是选择非参数检验方法。
下面介绍了属于非参检验的两种秩和检验〔ranksumtest〕方法。
二是,将数据经过变换使其符合参数统计方法,再选择参数统计方法,本节介绍了几种数据变换方法。
应用条件
①总体分布形式未知或分布类型不明;
②偏态分布的资料:
③等级资料:
不能准确测定,只能以严重程度、优劣等级、次序先后等表示;
④不满足参数检验条件的资料:
各组方差明显不齐。
⑤数据的一端或两端是不确定数值,如“>50mg〞等。
一、配对资料的Wilcoxon符号秩和检验〔Wilcoxonsigned-ranktest〕
例1对10名安康人分别用离子交换法与蒸馏法,测得尿汞值,如表9.1的第〔2〕、〔3〕栏,问两种方法的结果有无差异?
表110名安康人用离子交换法与蒸馏法测定尿汞值(μg/l)
样品号
〔1〕
离子交换法
〔2〕
蒸馏法
〔3〕
差值
(4)=
(2)(3)
秩次
〔5〕
1
0.5
0.0
0.5
2
2
2.2
1.1
1.1
7
3
0.0
0.0
0.0
—
4
2.3
1.3
1.0
6
5
6.2
3.4
2.8
8
6
1.0
4.6
-3.6
-9
7
1.8
1.1
0.7
3.5
8
4.4
4.6
-0.2
-1
9
2.7
3.4
-0.7
-3.5
10
1.3
2.1
-0.8
-5
T+=+26.5
T-=-18.5
差值先进展正态性及方差齐性检验,看是否可以做参数检验,其检验效能高于非参数检验。
〔下同〕
H0:
Md〔差值的总体中位数〕=0H1:
Md≠0α=0.05
T++T-=1+2+3+…n=n(n+1)/2
1小样本〔n≤50〕--查T界值表
根本思想:
如果无效假设H0成立,那么正负秩和的绝对值从理论上说应相等,都等于n(n+1)/4,既使有抽样误差的影响正负T值的绝对值相差也不应过大。
反过来说,如果实际计算出的正负T值绝对值相差很大,我们只能认为H0成立的可能性很小。
界值的判断标准
假设下限表中概率值
假设T≤下限或T≥上限,那么P值≤表中概率值
2大样本时〔n>50〕,正态近似法〔Z检验〕
根本思想:
假定无效假设H0成立,那么正负秩和的绝对值应相等,随着n增大T逐渐趋近于均数等于n(n+1)/4、方差为n(n+1)(2n+1)/24的正态分布。
所以可用近似正态法计算Z值。
即:
*校正公式:
当一样秩次个数较多时
tj:
第j个一样秩次的个数
SPSS:
建立变量名:
录入数值:
统计分析:
分析——非参数检验——两相关样本〔配对样本〕
结果分析:
表一:
第一行:
b-a的负秩〔NegativeRanks〕有5个〔右上角的a在表下方有注释〕,平均秩次为5.3,负秩和为26.5。
第二行:
正秩,正秩的个数,平均秩次,正秩和。
表二:
可用正秩和18.5或负秩和26.5计算,习惯上用较小的秩和计算Z值。
p=0.635大于0.05,不拒绝H0,还不能认为两种方法有差异。
二、两个独立样本比拟的Wilcoxon秩和检验(Wilcoxonranksumtest)
1.原始数据的两样本比拟
例2某实验室观察局部温热治疗小鼠移植肿瘤的疗效,以生存日数作为观察指标,试检验两组小鼠生存日数有无差异?
实验组
对照组
生存日数
秩次
生存日数
秩次
10
9.5
2
1
12
12.5
3
2
15
15
4
3
15
16
5
4
16
17
6
5
17
18
7
6
18
19
8
7
20
20
9
8
23
21
10
9.5
90以上
22
11
11
12
12.5
13
14
n1=10
T1=170
n2=12
T2=83
时间资料不服从正态分布
H0:
两总体分布位置一样H1:
两总体分布位置不同a=0.05
记n较小组秩和为T,样本量n1。
如果n1=n2,可取任秩和
1查表法:
查T界值表:
n1≤10,n2n1≤10
界值的判断标准:
假设下限表中概率值
假设T≤下限或T≥上限,那么P值≤表中概率值
2正态近似法
当n1或n2-n1超出T界值表的围时,随n增大,T的分布逐渐逼近均数为n(n+1)/4、方差为n(n+1)(2n+1)/24的正态分布,所以可用近似正态法计算Z值。
即:
*校正公式〔当一样秩次较多时〕
SPSS
建立变量名:
录入数值:
统计分析:
结果分析:
Z值为-3.630,p<0.001,拒绝H0
2.频数表资料〔或等级资料〕的两样本比拟
例320名正常人和32名铅作业工人尿棕色素定性检查结果见下表。
问铅作业工人尿棕色素是否高于正常人?
结果
〔1〕
人数
秩次
围
〔5〕
平均秩次〔6〕
秩和
正常人
(2)
铅作业工人
(3)
合计
(4)
正常人
(7)=
(2)(6)
铅作业工人
(8)=(3)(6)
-
18
8
26
1-26
13.5
243
108
2
10
12
27-38
32.5
65
325
++
0
7
7
39-45
42.0
0
294
+++
0
3
3
46-48
47.0
0
141
++++
0
4
4
49-52
50.5
0
202
合计
n1=20
n2=32
52
-
-
T1=308
T2=1070
取n较小组的秩和为T值,用校正公式计算。
即:
SPSS:
建立变量名:
录入数值:
统计分析:
结果分析:
同两个独立样本比拟的Wilcoxon秩和检验
Mann-WhitneyTest
P<0.001,拒绝H0
三、多个样本比拟的秩和检验(Kruskal-WallisHtest)
1.原始数据法
例4某研究者测定正常人、单纯性肥胖、皮质醇增多症者各10人的血浆总皮质醇含量见下表,问这三组人的血浆总皮质醇含量有无差异?
三组人的血浆总皮质醇含量测定值〔μg/L〕
正常人
单纯性肥胖
皮质醇增多症
测定值
秩次
测定值
秩次
测定值
秩次
0.4
1
0.6
2
9.8
20
1.9
4
1.2
3
10.2
21
2.2
6
2.0
5
10.6
22
2.5
8
2.4
7
13.0
23
2.8
9
3.1
10.5
14.0
25
3.1
10.5
4.1
14
14.8
26
3.7
12
5.0
16
15.6
27
3.9
13
5.9
17
15.6
28
4.6
15
7.4
19
21.6
29
6.0
18
13.6
24
24.0
30
Ri
ni
96.5
10
117.5
10
251
10
H0:
:
三组人的血浆总皮质醇含量总体分布位置一样
H1:
三组人的血浆总皮质醇含量总体分布位置不全一样
a=0.05
SPSS
建立变量名
录入数值:
统计分析:
结果分析:
假设g〔组数〕=3且最小样本例数大于5或g>3时,H或HC近似服从自由度为g-1的卡方分布。
H=18.130,自由度=2,P<0.001,拒绝H0,三组总体分布位置不全一样,需做两两比拟。
2.频数表法:
例5
〔单向有序分类变量的多个样本比拟〕
用A、B、C三种药物治疗单纯性慢性支气管炎,结果见表第〔1〕~〔5〕栏,问三种药物的总体疗效是否不同。
表三种药物疗效比拟的秩和检验计算过程
疗效
〔1〕
药物
合计
〔5〕
秩次
围
〔6〕
平均
秩次〔7〕
秩和R1
(8)=
(2)(7)
秩和R2
(9)=
(3)(7)
秩和R3
(10)=
(4)(7)
A
〔2〕
B
〔3〕
C
〔4〕
治愈
17
5
3
25
1~25
13.0
221.0
65.0
39.0
显效
51
11
17
79
26~104
65.0
3315.0
715.0
1105.0
好转
33
52
47
132
105~236
170.5
5626.5
8866.0
8013.5
无效
7
24
26
57
237~293
265.0
1855.0
6360.0
6890.0
合计
108
92
93
293
—
—
11017.5
16006.0
16047.5
检验步骤如下:
(1)建立检验假设
H0:
三种药物疗效的总体分布一样
H1:
三种药物疗效的总体分布不同或不全一样
=0.05
(2)编秩
用各疗效等级的合计值排序确定秩次围,如表第〔6〕栏所示,A、B、C三种药物总的治愈人数是25,他们的秩次围是1~25。
同理疗效为“显效〞组的秩次围是26~104,以此类推。
再对第〔6〕栏秩次围的上下限求和取平均值得各等级的平均秩次,如第〔7〕栏所示,疗效为“治愈〞组的平均秩次为
=13。
(3)求秩和
分别用第〔2〕~〔4〕栏各等级的频数与〔7〕栏平均秩次相乘再求和,如第〔8〕~〔10〕栏所示。
(4)计算统计量H值
将第〔8〕~〔10〕栏的总秩和ΣT1、ΣT2、ΣT3代入公式(11.15)计算H值。
假设各样本一样秩次较多时〔如超过25%〕,由公式〔11.15)计算所得H值偏小,应按公式〔11.16〕和公式〔11.17〕对H值作校正计算Hc
H=
(∑
)-3(N+1)
H=
(
+
+
)-3(293+1)=48.23
C=1-(tj3-tj)/(N3-N)
C=1-(253-25)(793-79)(1323-132)(573-57)/(2933-293)=0.9086
Hc=H/C
Hc=48.23/0.9086=53.08
(5)确定P值和作出统计结论
假设组数k=3,每组例数均小于或等于5,可查附表H界值表,得出P值。
本例各组例数均大于5,已超出附表的围,那么H值近似服从ν=k-1的χ2分布,可查附表的χ2界值表。
故按ν=3-1=2,查χ2界值表得χ20。
05〔2〕=5.99,因为53.08>5.99,故P<0.05。
按α=0.05水平拒绝H0,承受H1认为三种药物的疗效不同或不全一样。
用SPSS统计软件中的nonparametrictests—KIndependentSamples—Kruskal-WallisH程序做秩和检验得到Hc统计量。
四、Friedman秩和检验
用于随机区组设计的非参数方法,分别在每个区组编秩。
秩和检验方法要点和考前须知
检验方法
方法要点
考前须知
配对样本的符号秩检验
1.依差值大小编秩,再冠以差值的符号,任取T+、T-作为T,查附表9,T界值表。
T>T界值,P>α。
2.n>50,用z检验。
编秩时假设差值绝对值一样符号相反,取平均秩次。
0差值省略。
两独立样本的秩和检验〔分布位置〕
1.按两组数据由小到大统一编秩,以n1较小者为T,查附表10T界值表。
T在界值围,P>α。
2.n1>10或n1-n2>10时,用z检验。
1.编秩时假设一样数据在不同组,取平均秩次。
2.当一样秩次较多时,使用校正公式。
成组设计多样本比拟的秩和检验(K-W检验)
1.将k组数据由小到大统一编秩,求各组秩和Ri。
2.计算H值,用ν=k-1查χ2界值表,确定P值。
3.拒绝H0时,应作多个样本两两比拟的秩和检验。
1.编秩时假设一样数据在不同组,取平均秩次。
2.当一样秩次较多时,使用校正公式。