第九章秩和检验优质PPT.ppt
《第九章秩和检验优质PPT.ppt》由会员分享,可在线阅读,更多相关《第九章秩和检验优质PPT.ppt(80页珍藏版)》请在冰豆网上搜索。
非参数统计非参数统计(non-parametricstatistics)有许多资料不符合参数统计的要求,不有许多资料不符合参数统计的要求,不能用参数统计的方法进行检验,而需要能用参数统计的方法进行检验,而需要一种不依赖于总体分布类型,也不对总一种不依赖于总体分布类型,也不对总体参数进行统计推断的假设检验,称为体参数进行统计推断的假设检验,称为非参数检验。
非参数检验。
非参数分析方法的优缺点非参数分析方法的优缺点优点:
优点:
不受总体分布条件的限制,适用范围广;
某不受总体分布条件的限制,适用范围广;
某些不便准确测定,只能以严重程度,好坏优劣,些不便准确测定,只能以严重程度,好坏优劣,次第先后等作记录的资料也可应用。
次第先后等作记录的资料也可应用。
对资料没有特殊要求,例如对资料没有特殊要求,例如不受分布的影响(偏态、分布不明的资料)不受分布的影响(偏态、分布不明的资料)不受方差齐性的限制不受方差齐性的限制不受变量类型的影响不受变量类型的影响不受样本量的影响不受样本量的影响非参数分析方法的优缺点非参数分析方法的优缺点缺点:
缺点:
适用于参数检验的资料若用非参数检验会造适用于参数检验的资料若用非参数检验会造成信息损失,导致检验效率较低。
即当成信息损失,导致检验效率较低。
即当H0H0不真,不真,非参数检验可能不如参数检验能较灵敏地拒绝非参数检验可能不如参数检验能较灵敏地拒绝H0H0,犯第二类错误的概率比参数检验大犯第二类错误的概率比参数检验大。
若资料适用于参数方法(如正态分布,方差若资料适用于参数方法(如正态分布,方差齐性等,级就尽可能不用非参数方法)齐性等,级就尽可能不用非参数方法)第一类错误与第二类错误第一类错误与第二类错误客观实际客观实际拒绝拒绝H0不拒绝不拒绝H0H0成立成立第一类错误第一类错误,(误诊率,假阳误诊率,假阳性率性率)推断正确推断正确H0不成立推断正确推断正确第二类错误第二类错误(漏诊率,假(漏诊率,假阴性率)阴性率)优点点:
对资料的信息利用充分对资料的信息利用充分统计分析的效率高统计分析的效率高缺点:
对资料的要求高对资料的要求高适用范围有限适用范围有限Statistics7/45参数分析方法的优缺点参数分析方法的优缺点常用的非参数检验方法常用的非参数检验方法秩和检验秩和检验Ridit分析分析卡方检验卡方检验K-S法法秩相关分析(等级相关分析)秩相关分析(等级相关分析)cpd法法(积差交叉法)积差交叉法)游程检验游程检验Statistics9/45秩秩和和检检验验秩和检验(秩和检验(ranksumtest)是最常用的的非)是最常用的的非参数检验方法,也称参数检验方法,也称秩转换秩转换(ranktransform-ation),该方法在非参数检验中占有重要地位。
),该方法在非参数检验中占有重要地位。
原理:
是首先将原始数据从小到大,或是首先将原始数据从小到大,或等级从弱到等级从弱到强转换成秩后,再对基于强转换成秩后,再对基于秩次秩次的统计量(如秩的统计量(如秩和),进行检验,做出统计推断。
故又称基于秩和),进行检验,做出统计推断。
故又称基于秩次的非参数检验。
次的非参数检验。
秩号:
将各原始数据从小到大排列,分别给每个将各原始数据从小到大排列,分别给每个数据一个顺序号,也就是秩号数据一个顺序号,也就是秩号(rank)。
如:
967.513秩号:
3124秩和:
秩和:
用秩次代替原始数据,在计算各组秩次之用秩次代替原始数据,在计算各组秩次之和;
和;
秩和检验:
基于秩和提供的信息,对不同总基于秩和提供的信息,对不同总体的平均水平进行假设检验。
体的平均水平进行假设检验。
秩和检验常用方法秩和检验常用方法l配对设计资料的符号秩和检验配对设计资料的符号秩和检验l两独立样本差别的秩和检验两独立样本差别的秩和检验l完全随机设计多组差别的秩和检验完全随机设计多组差别的秩和检验l多个样本间两两比较的秩和检验多个样本间两两比较的秩和检验第一节第一节WilcoxonWilcoxon符号秩和检验符号秩和检验一、配对设计的两样本比较一、配对设计的两样本比较一、配对设计的两样本比较一、配对设计的两样本比较Statistics10/45什么叫配对设计?
什么叫配对设计?
是是将将实验对象按一定条件配成对子,如将年龄、实验对象按一定条件配成对子,如将年龄、体重一致的动物配成对子,再随机分配每对中的两体重一致的动物配成对子,再随机分配每对中的两个对象接受不同的处理方式;
或同一样品用两种方个对象接受不同的处理方式;
或同一样品用两种方法(或仪器等)检验的结果;
或同一受试对象两个法(或仪器等)检验的结果;
或同一受试对象两个部位的数据。
配对设计可增强组间的均衡性,提高部位的数据。
配对设计可增强组间的均衡性,提高实验效率。
实验效率。
WilcoxonWilcoxon符号秩和检验符号秩和检验(WilcoxonWilcoxon配对法,或配对法,或WilcoxonWilcoxonsignedranksignedranktesttest)是推断其差值是否来自中位数为零的总体是推断其差值是否来自中位数为零的总体的方法,可用于计量配对设计资料差值的比的方法,可用于计量配对设计资料差值的比较和单一样本与总体中位数的比较较和单一样本与总体中位数的比较Statistics11/45请看请看课本课本P152P152例题例题11-111-1为观察血浆置换法治疗出凝血功能异常为观察血浆置换法治疗出凝血功能异常的临床疗效的临床疗效,某医师治疗了某医师治疗了11例出凝血功例出凝血功能异常患者,置换前后各患者的凝血酶原能异常患者,置换前后各患者的凝血酶原时间见表时间见表11-1。
该医师采用两样本均数比。
该医师采用两样本均数比较的检验,结果,差异有统计学意义,由较的检验,结果,差异有统计学意义,由此认为血浆置换治疗前后凝血酶原时间有此认为血浆置换治疗前后凝血酶原时间有差别。
差别。
Statistics11/45问题问题l
(1)该资料为何种类型资料?
)该资料为何种类型资料?
l
(2)该研究属于何种设计方案?
)该研究属于何种设计方案?
l(3)该医师所选用的统计分析方法是否正)该医师所选用的统计分析方法是否正确?
为什么?
确?
l(4)该资料应采用何种统计方法进行分)该资料应采用何种统计方法进行分析?
析?
其步骤如何?
Statistics11/45Statistics11/45
(1)该资料为计量资料。
)该资料为计量资料。
(2)该研究属自身配对设计方案。
)该研究属自身配对设计方案。
(3)该医医师所所选用的用的统计分析方法不正确。
分析方法不正确。
原因在于:
自身配自身配对设计资料一般料一般选用配用配对检验,而该医师采用完全随检验,而该医师采用完全随机设计两样本均数比较的机设计两样本均数比较的t检验,统计检验,统计方法与设计类型不符;
方法与设计类型不符;
该医师未考该医师未考虑资料是否满足虑资料是否满足t检验的应用条件。
检验的应用条件。
建立检验假设,确定检验水准建立检验假设,确定检验水准HH00:
差值的总体中位数为零,即:
差值的总体中位数为零,即MMdd=0=0HH11:
MMdd00=0.05=0.05计算检验统计量计算检验统计量v求各对测量值的差值求各对测量值的差值v编秩:
编秩原则编秩:
编秩原则12/45按照差值的绝对值从小到大编秩按照差值的绝对值从小到大编秩v差值为差值为00者不参加编秩者不参加编秩v绝对值相等,符号相同时顺次编绝对值相等,符号相同时顺次编秩秩v绝对值相等,符号相反时取平均秩次绝对值相等,符号相反时取平均秩次v求秩和、确定检验统计量求秩和、确定检验统计量T值值分别求出正、负秩和,正秩和以分别求出正、负秩和,正秩和以T+T+表示,负表示,负秩和以秩和以T-T-表示。
任取正秩和或负秩和为统计表示。
任取正秩和或负秩和为统计量量T值。
其中值。
其中T+T-=n(n+1)/2T+T-=n(n+1)/2,nn为有效对子数为有效对子数确定确定PP值、作出统计推断结论值、作出统计推断结论v查表法:
查表法:
用于有效对子数用于有效对子数n50(P345)n50(P345)若若T值在上、下界值范围内,则值在上、下界值范围内,则P0.05若若T值在上、下界值上或范围外值在上、下界值上或范围外,则,则P0.0514/45StatisticsStatistics15/45v正态近似法:
正态近似法:
用于有效对子数用于有效对子数nn50501)1)当差值绝对值相同的个数当差值绝对值相同的个数n25%n25%时时差值绝对值相同差值绝对值相同即指相同秩。
指差值的绝对值即指相同秩。
指差值的绝对值相等者取平均秩。
也就是秩次相等的个数,可用相等者取平均秩。
也就是秩次相等的个数,可用tjtj表示。
如表示。
如t1t1指第一个出现相同秩次的个数。
本例中指第一个出现相同秩次的个数。
本例中有两个秩次为有两个秩次为2.5(2.5(指绝对值指绝对值),则,则t1=2;
t1=2;
有两个秩有两个秩次为次为6.5,6.5,则则t2=2t2=2。
当。
当tjn25%tjn25%时,公式如下时,公式如下2)2)当差值绝对值相同的个数当差值绝对值相同的个数n25%n25%时时上式中,上式中,tjtj为为第第jj个差值绝对值相同的个数个差值绝对值相同的个数Statistics16