Wilcoxon符号秩检验_精品文档.ppt
《Wilcoxon符号秩检验_精品文档.ppt》由会员分享,可在线阅读,更多相关《Wilcoxon符号秩检验_精品文档.ppt(33页珍藏版)》请在冰豆网上搜索。
2.2Wilcoxon符号秩检验WilcoxonWilcoxon符号秩检验符号秩检验(Wilcoxonsigned-(Wilcoxonsigned-ranktest)ranktest)是非参数统计中符号检验法的改进,是非参数统计中符号检验法的改进,它不仅利用了观察值和它不仅利用了观察值和原假设中心位置原假设中心位置的差的的差的正负,还利用了差的值的大小的信息。
虽然是正负,还利用了差的值的大小的信息。
虽然是简单的非参数方法,但却体现了秩的基本思想。
简单的非参数方法,但却体现了秩的基本思想。
m例例2.42.4下面是下面是1010个欧洲城镇每人每年平均消费个欧洲城镇每人每年平均消费的酒量(相当于纯酒精数)(单位:
升)。
数据的酒量(相当于纯酒精数)(单位:
升)。
数据已经按升幂排列。
已经按升幂排列。
4.125.187.639.7410.394.125.187.639.7410.3911.9212.3212.8913.5414.4511.9212.3212.8913.5414.45人们普遍认为欧洲各国人均年消费酒量的中人们普遍认为欧洲各国人均年消费酒量的中位数相当于纯酒精位数相当于纯酒精88升,也就是升,也就是meme00=8=8。
由数据。
由数据算得的中位数为算得的中位数为11.1611.16。
因此,我们的检验设。
因此,我们的检验设为:
为:
HH00:
meme88,HH11:
me8me8m先计算每个样本值和原假设中先计算每个样本值和原假设中meme00的值之差,的值之差,即即XXii88。
m考虑这些差的绝对值并将绝对值从小到大排考虑这些差的绝对值并将绝对值从小到大排序,从而求出这些绝对值的秩。
序,从而求出这些绝对值的秩。
m再计算比再计算比88大的样本对应的绝对值的秩之和,大的样本对应的绝对值的秩之和,如果这个和比较大,我们就拒绝原假设,接受备如果这个和比较大,我们就拒绝原假设,接受备择假设。
择假设。
m问题一般提法:
问题一般提法:
假定样本假定样本XX11,X,Xnn来自分布来自分布连续对称的连续对称的总体总体XX,在此假定下总体,在此假定下总体XX的中位数等于均值。
的中位数等于均值。
问题主要是检验中位数,即原检验为问题主要是检验中位数,即原检验为HH00:
me=meme=me00,相对于各种单双边的备择假设。
,相对于各种单双边的备择假设。
注注:
(11)与符号检验不同:
)与符号检验不同:
WilcoxonWilcoxon符号秩检验假设符号秩检验假设总体分布是对称的。
总体分布是对称的。
(22)在总体分布对称的假设下,即设总体)在总体分布对称的假设下,即设总体XX的分布的分布关于点关于点对称,则对称,则XX的均值和中位数相同,且均为的均值和中位数相同,且均为。
所以。
所以检验总体中位数可等价于检验总体对称检验总体中位数可等价于检验总体对称中心。
中心。
即即检验的检验的原假设原假设HH00:
M=MM=M00等价于等价于HH00:
=00(相对于各种单双边的备择假设)。
(相对于各种单双边的备择假设)。
m检验步骤:
检验步骤:
HH00:
00(对应于各单双边备择假设)(对应于各单双边备择假设)Step1.Step1.计算计算i=1,2,i=1,2,n,n。
记差为。
记差为zzi.i.Step2.Step2.将差将差zzi.i.的绝对值,即的绝对值,即,按从小到大的顺序排列。
由于总体服从连续型分按从小到大的顺序排列。
由于总体服从连续型分布,不妨假定样本互不相等,都不等于布,不妨假定样本互不相等,都不等于00,且样本,且样本差的绝对值也互不相等。
所以可得到样本差的绝对值也互不相等。
所以可得到样本zzi.i.的绝的绝对值的秩,不妨记对值的秩,不妨记的秩为的秩为RRii。
Step3.tep3.符号秩和检验统计量为符号秩和检验统计量为其中其中或者取检验统计量为或者取检验统计量为其中其中主要取主要取WW为检验统计量。
为检验统计量。
mStep4Step4设设ww表示由样本算出的表示由样本算出的WW的值。
的值。
(11)HH00:
00,HH11:
00pp值值P(WP(Www);(22)HH00:
00,HH11:
00。
若若HH11成立,则总体成立,则总体XX的分布关于点的分布关于点对称。
对称。
从而有,从而有,P(X0)P(X0)P(Xa)P(Xa)P(X8M8下面来用下面来用WilcoxonWilcoxon符号秩检验,等价于检验符号秩检验,等价于检验HH00:
88,HH11:
88m检验步骤检验步骤Step1.Step1.对于对于i=1,2,i=1,2,n,n,计算得到新的,计算得到新的样本样本zzii和它们对应的秩如下:
和它们对应的秩如下:
样本xi4.125.187.639.7410.3911.9212.3212.913.5414.45zi的符号zi的绝对值3.882.190.371.742.393.924.324.895.546.45秩53124678910mStep2.Step2.计算计算WW。
WW+=2+4+6+7+8+9=2+4+6+7+8+910104646利用利用WW的分布,辅以统计软件,可计算出的分布,辅以统计软件,可计算出pp值值0.0320.032。
mStep3.Step3.所以给定所以给定0.050.05时,此时可拒绝原假时,此时可拒绝原假设,认为欧洲人均酒精年消费多于设,认为欧洲人均酒精年消费多于88升。
升。
W的分布性质设独立同分布样本设独立同分布样本xx11,x,xnn来自连续对称总体来自连续对称总体X,XX,X分布的对称中心为分布的对称中心为。
为方便讨论,不妨设原。
为方便讨论,不妨设原假设为假设为HH00:
00,即总体分布关于原点即总体分布关于原点00对称的条件下,讨论对称的条件下,讨论WW的性质。
的性质。
注:
注:
WW与与WW有下列关系:
有下列关系:
WW+W+W-=n(n=n(n1)/21)/2m(关键)性质关键)性质2.12.1令令则在总体的分则在总体的分布关于原点布关于原点00对称时,对称时,WW与与SS同分布。
同分布。
注:
注:
SS是是WW当当RRiiii时的特殊情况。
研究时的特殊情况。
研究WW的分布的分布可转为研究可转为研究SS的分布。
的分布。
m概率分布概率分布m性质性质2.22.2在总体的分布关于原点在总体的分布关于原点00对称时,对称时,WW的的概率分布为概率分布为P(WP(W+=d)=P(S=d)=P(Sd)=td)=tnn(d)/2(d)/2nn,其中,其中,dd0,1,2,0,1,2,n(n+1)/2,n(n+1)/2,ttnn(d)(d)表示从表示从1,2,1,2,n,n这这nn个数中任取若干个数(包括一个个数中任取若干个数(包括一个都不取),其和恰为都不取),其和恰为dd,共有多少种取法。
,共有多少种取法。
m对称性对称性m性质性质2.32.3在总体的分布关于原点在总体的分布关于原点00对称时,对称时,WW服服从对称分布,对称中心为从对称分布,对称中心为n(n+1)/4n(n+1)/4,即:
对所有,即:
对所有的的d=0,1,2,d=0,1,2,n(n+1)/4,n(n+1)/4,有,有P(WP(W+=n(n+1)/4=n(n+1)/4d)d)P(WP(W+=n(n+1)/4+d),=n(n+1)/4+d),P(WP(W+n(n+1)/4n(n+1)/4d)d)P(WP(W+n(n+1)/4+d)n(n+1)/4+d)。
m期望方差及渐近正态性期望方差及渐近正态性m性质性质2.42.4在总体分布关于原点在总体分布关于原点00对称时,对称时,E(WE(W+)=n(n+1)/4)=n(n+1)/4,DD(WW+)=n(n+1)(2n+1)/24=n(n+1)(2n+1)/24。
m性质性质2.52.5若总体分布关于原点若总体分布关于原点00对称,则在样对称,则在样本容量本容量nn趋于无穷大时,趋于无穷大时,WW+有渐近正态性:
有渐近正态性:
WWNN(n(n+1)/n(n+1)/44,n(n+1)(2n+1)/24n(n+1)(2n+1)/24)m有结的情况下,用平均秩法。
有结的情况下,用平均秩法。
m性质性质2.62.6在总体的分布关于原点在总体的分布关于原点00对称,有结秩取对称,有结秩取平均时,平均时,E(WE(W+)=n(n+1)/4)=n(n+1)/4,DD(WW+)=n(n+1)(2n+1)/24=n(n+1)(2n+1)/24其中其中gg表示结的个数,表示结的个数,表示第表示第ii个结的长度。
个结的长度。
m有结时,有结时,WW的期望和方差实际上是条件期望和的期望和方差实际上是条件期望和方差,它们是在样本数据中给定有方差,它们是在样本数据中给定有gg个结,且结的长个结,且结的长度分别给定为度分别给定为时的条件期望和条件方差。
时的条件期望和条件方差。
m与符号检验的比较。
与符号检验的比较。
续例续例2.22.2两个不同方向的假设检验。
两个不同方向的假设检验。
考虑下面的假设检验:
考虑下面的假设检验:
HH00:
M=12.5,HM=12.5,H11:
M12.5M8M8(H1H1)对这两个问题分别用对这两个问题分别用WilcoxonWilcoxon符号秩检验和符符号秩检验和符号检验方法。
号检验方法。
m符号检验结果符号检验结果对于检验(对于检验(H1H1):
):
SS=3,S=3,S+=7,=7,检验统计量检验统计量KKSS33,pp值值0.1718750.171875,对,对0.050.05,不能拒绝,不能拒绝HH00。
对于检验(对于检验(H2H2):
):
SS=7,S=7,S+=3,=3,检验统计量检验统计量KKSS33,pp值值0.1718750.171875,对,对0.050.05,不能拒绝,不能拒绝HH00。
结果完全对称!
说明符号检验只与符号有关!
结果完全对称!
说明符号检验只与符号有关!
mWilcoxonWilcoxon符号秩检验结果符号秩检验结果对于检验(对于检验(H1H1):
):
检验统计量检验统计量WW+=46=46,pp值值0.032230.03223,对,对0.050.05,拒绝,拒绝HH00。
对于检验(对于检验(H2H2):
):
检验统计量检验统计量WW1111,pp值值0.052730.05273,对,对0.050.05,不能拒绝,不能拒绝HH00。
结果不对称!
说明结果不对称!
说明WilcoxonWilcoxon符号秩检验不仅与符号符号秩检验不仅与符号有关,还和数值大小有关!
有关,还和数值大小有关!
Wilcoxon符号秩检验置信区间mWalshWalsh平均平均为利用更多的信息,可求每两个数的平均为利用更多的信息,可求每两个数的平均(X(XiiXXjj)/2,i)/2,ijj,(一共有,(一共有n(n+1)/2n(n+1)/2个)来扩个)来扩大样本数目。
这样的平均称为大样本数目。
这样的平均称为WalshWalsh平均平均。
mWalshWalsh平均和平均和WW+的关系。
的关系。
在原假设成立的条件下,即在原假设成立的条件下,即HH00:
00成立,有成立,有特别当原假设为特别当原假设为HH00:
00成立,有成立,有mHodgeHodgeLehmannLehmann估计量估计量利用利用WalshWalsh平均可以得到对称中心平均可以得到对称中心的点估的点估计,即可由计,即可由WalshWalsh平均的中位数来估计对称中心,平