spss秩和检验.docx

资源描述

spss秩和检验.docx

《spss秩和检验.docx》由会员分享，可在线阅读，更多相关《spss秩和检验.docx（19页珍藏版）》请在冰豆网上搜索。

spss秩和检验.docx

spss秩和检验

秩和检验

前面介绍的均数的区间估计及假设检验，都是要求个体变量值服从正态分布，或根据中心极限定理，当样本较大时，样本均数服从正态分布。

这种要求样本来自总体分布型是的，在此根底上对总体参数进展估计或检验，称为参数统计〔parametricstatistics〕。

但在医学研究中，许多数据不符合参数统计的要求，这时有两种处理的方法。

一是，进展数据转换，使其符合参数统计方法的要求。

二是，选择非参数检验方法，非参数检验（non-parametrictest）方法是对样本来自的总体分布不作要求〔如不要求样本来自正态分布〕的一类假设检验方法。

非参数检验的主要优点是对样本的总体分布不作要求，适用的围广，尤其是当变量中有不确定数值时，如<0.5mg,可用非参数检验。

同时，非参数检验方法存在其致命的缺点，其检验成效低于相应的参数统计方法。

因此，如果数据符合参数统计的要求首选参数统计方法；如果数据不符合参数统计的要求有两个选择，一是选择非参数检验方法。

下面介绍了属于非参检验的两种秩和检验〔ranksumtest〕方法。

二是，将数据经过变换使其符合参数统计方法，再选择参数统计方法，本节介绍了几种数据变换方法。

应用条件

①总体分布形式未知或分布类型不明；

②偏态分布的资料：

③等级资料：

不能准确测定，只能以严重程度、优劣等级、次序先后等表示；

④不满足参数检验条件的资料：

各组方差明显不齐。

⑤数据的一端或两端是不确定数值，如“>50mg〞等。

一、配对资料的Wilcoxon符号秩和检验〔Wilcoxonsigned-ranktest〕

例1对10名安康人分别用离子交换法与蒸馏法，测得尿汞值，如表9.1的第〔2〕、〔3〕栏，问两种方法的结果有无差异？

表110名安康人用离子交换法与蒸馏法测定尿汞值（μg/l）

样品号

〔1〕

离子交换法

〔2〕

蒸馏法

〔3〕

差值

（4）=

（2）（3）

秩次

〔5〕

0.5

0.0

0.5

2.2

1.1

0.0

—

2.3

1.3

1.0

6.2

3.4

2.8

1.0

4.6

-3.6

-9

1.8

1.1

0.7

3.5

4.4

4.6

-0.2

-1

2.7

3.4

-0.7

-3.5

1.3

2.1

-0.8

-5

T+=+26.5

T-=-18.5

差值先进展正态性及方差齐性检验，看是否可以做参数检验，其检验效能高于非参数检验。

〔下同〕

H0：

Md〔差值的总体中位数〕=0H1：

Md≠0α=0.05

T++T-=1+2+3+…n=n（n+1）/2

1小样本〔n≤50〕--查T界值表

根本思想：

如果无效假设H0成立，那么正负秩和的绝对值从理论上说应相等，都等于n（n+1）/4，既使有抽样误差的影响正负T值的绝对值相差也不应过大。

反过来说，如果实际计算出的正负T值绝对值相差很大，我们只能认为H0成立的可能性很小。

界值的判断标准

假设下限表中概率值

假设T≤下限或T≥上限，那么P值≤表中概率值

2大样本时〔n>50〕，正态近似法〔Z检验〕

根本思想：

假定无效假设H0成立，那么正负秩和的绝对值应相等，随着n增大T逐渐趋近于均数等于n（n+1）/4、方差为n（n+1）（2n+1）/24的正态分布。

所以可用近似正态法计算Z值。

即：

*校正公式：

当一样秩次个数较多时

tj：

第j个一样秩次的个数

SPSS:

建立变量名：

录入数值：

统计分析：

分析——非参数检验——两相关样本〔配对样本〕

结果分析：

表一：

第一行：

b-a的负秩〔NegativeRanks〕有5个〔右上角的a在表下方有注释〕，平均秩次为5.3，负秩和为26.5。

第二行：

正秩，正秩的个数，平均秩次，正秩和。

表二：

可用正秩和18.5或负秩和26.5计算，习惯上用较小的秩和计算Z值。

p=0.635大于0.05，不拒绝H0，还不能认为两种方法有差异。

二、两个独立样本比拟的Wilcoxon秩和检验（Wilcoxonranksumtest）

1．原始数据的两样本比拟

例2某实验室观察局部温热治疗小鼠移植肿瘤的疗效，以生存日数作为观察指标，试检验两组小鼠生存日数有无差异？

实验组

对照组

生存日数

秩次

生存日数

秩次

9.5

12.5

9.5

90以上

12.5

n1=10

T1=170

n2=12

T2=83

时间资料不服从正态分布

H0：

两总体分布位置一样H1：

两总体分布位置不同a=0.05

记n较小组秩和为T，样本量n1。

如果n1=n2，可取任秩和

1查表法：

查T界值表：

n1≤10，n2n1≤10

界值的判断标准：

假设下限表中概率值

假设T≤下限或T≥上限，那么P值≤表中概率值

2正态近似法

当n1或n2-n1超出T界值表的围时，随n增大，T的分布逐渐逼近均数为n（n+1）/4、方差为n（n+1）（2n+1）/24的正态分布，所以可用近似正态法计算Z值。

即：

*校正公式〔当一样秩次较多时〕

SPSS

建立变量名：

录入数值：

统计分析：

结果分析：

Z值为-3.630，p＜0.001，拒绝H0

2.频数表资料〔或等级资料〕的两样本比拟

例320名正常人和32名铅作业工人尿棕色素定性检查结果见下表。

问铅作业工人尿棕色素是否高于正常人？

结果

〔1〕

人数

秩次

围

〔5〕

平均秩次〔6〕

秩和

正常人

（2）

铅作业工人

（3）

合计

（4）

正常人

（7）=

（2）（6）

铅作业工人

（8）=（3）（6）

1-26

13.5

243

108

27-38

32.5

325

39-45

42.0

294

+++

46-48

47.0

141

++++

49-52

50.5

202

合计

n1=20

n2=32

T1=308

T2=1070

取n较小组的秩和为T值，用校正公式计算。

即：

SPSS：

建立变量名：

录入数值：

统计分析：

结果分析：

同两个独立样本比拟的Wilcoxon秩和检验

Mann-WhitneyTest

P＜0.001，拒绝H0

三、多个样本比拟的秩和检验（Kruskal-WallisHtest）

1．原始数据法

例4某研究者测定正常人、单纯性肥胖、皮质醇增多症者各10人的血浆总皮质醇含量见下表，问这三组人的血浆总皮质醇含量有无差异？

三组人的血浆总皮质醇含量测定值〔μg/L〕

正常人

单纯性肥胖

皮质醇增多症

测定值

秩次

测定值

秩次

测定值

秩次

0.4

0.6

9.8

1.9

1.2

10.2

2.2

2.0

10.6

2.5

2.4

13.0

2.8

3.1

10.5

14.0

3.1

10.5

4.1

14.8

3.7

5.0

15.6

3.9

5.9

15.6

4.6

7.4

21.6

6.0

13.6

24.0

96.5

117.5

251

H0:

：

三组人的血浆总皮质醇含量总体分布位置一样

H1：

三组人的血浆总皮质醇含量总体分布位置不全一样

a=0.05

SPSS

建立变量名

录入数值：

统计分析：

结果分析：

假设g〔组数〕=3且最小样本例数大于5或g>3时，H或HC近似服从自由度为g-1的卡方分布。

H=18.130，自由度=2，P＜0.001，拒绝H0，三组总体分布位置不全一样，需做两两比拟。

2．频数表法：

例5

〔单向有序分类变量的多个样本比拟〕

用A、B、C三种药物治疗单纯性慢性支气管炎，结果见表第〔1〕~〔5〕栏,问三种药物的总体疗效是否不同。

表三种药物疗效比拟的秩和检验计算过程

疗效

〔1〕

药物

合计

〔5〕

秩次

围

〔6〕

平均

秩次〔7〕

秩和R1

（8）=

（2）（7）

秩和R2

（9）=

（3）（7）

秩和R3

（10）=

（4）（7）

〔2〕

〔3〕

〔4〕

治愈

1~25

13.0

221.0

65.0

39.0

显效

26~104

65.0

3315.0

715.0

1105.0

好转

132

105~236

170.5

5626.5

8866.0

8013.5

无效

237~293

265.0

1855.0

6360.0

6890.0

合计

108

293

—

11017.5

16006.0

16047.5

检验步骤如下：

（1）建立检验假设

H0:

三种药物疗效的总体分布一样

H1:

三种药物疗效的总体分布不同或不全一样

=0.05

（2）编秩

用各疗效等级的合计值排序确定秩次围，如表第〔6〕栏所示，A、B、C三种药物总的治愈人数是25，他们的秩次围是1~25。

同理疗效为“显效〞组的秩次围是26~104，以此类推。

再对第〔6〕栏秩次围的上下限求和取平均值得各等级的平均秩次，如第〔7〕栏所示，疗效为“治愈〞组的平均秩次为

=13。

（3）求秩和

分别用第〔2〕~〔4〕栏各等级的频数与〔7〕栏平均秩次相乘再求和，如第〔8〕~〔10〕栏所示。

（4）计算统计量H值

将第〔8〕~〔10〕栏的总秩和ΣT1、ΣT2、ΣT3代入公式（11.15）计算H值。

假设各样本一样秩次较多时〔如超过25%〕，由公式〔11.15）计算所得H值偏小，应按公式〔11.16〕和公式〔11.17〕对H值作校正计算Hc

（∑

）-3（N+1）

（

）-3（293+1）=48.23

C=1-（tj3-tj）/（N3-N）

C=1-（253-25）（793-79）（1323-132）（573-57）/（2933-293）=0.9086

Hc=H/C

Hc=48.23/0.9086=53.08

（5）确定P值和作出统计结论

假设组数k=3,每组例数均小于或等于5，可查附表H界值表，得出P值。

本例各组例数均大于5，已超出附表的围，那么H值近似服从ν=k-1的χ2分布，可查附表的χ2界值表。

故按ν=3-1=2，查χ2界值表得χ20。

05〔2〕=5.99，因为53.08>5.99，故P<0.05。

按α=0.05水平拒绝H0，承受H1认为三种药物的疗效不同或不全一样。

用SPSS统计软件中的nonparametrictests—KIndependentSamples—Kruskal-WallisH程序做秩和检验得到Hc统计量。

四、Friedman秩和检验

用于随机区组设计的非参数方法，分别在每个区组编秩。

秩和检验方法要点和考前须知

检验方法

方法要点

考前须知

配对样本的符号秩检验

1.依差值大小编秩，再冠以差值的符号，任取T+、T-作为T，查附表9，T界值表。

T>T界值，P>α。

2.n>50，用z检验。

编秩时假设差值绝对值一样符号相反，取平均秩次。

0差值省略。

两独立样本的秩和检验〔分布位置〕

1.按两组数据由小到大统一编秩，以n1较小者为T，查附表10T界值表。

T在界值围，P>α。

2.n1>10或n1-n2>10时，用z检验。

1.编秩时假设一样数据在不同组，取平均秩次。

2.当一样秩次较多时，使用校正公式。

成组设计多样本比拟的秩和检验（K-W检验）

1.将k组数据由小到大统一编秩，求各组秩和Ri。

2.计算H值，用ν=k-1查χ2界值表，确定P值。

3.拒绝H0时，应作多个样本两两比拟的秩和检验。

1.编秩时假设一样数据在不同组，取平均秩次。

2.当一样秩次较多时，使用校正公式。

展开阅读全文