1、2.2 Wilcoxon符号秩检验 WilcoxonWilcoxon符号秩检验符号秩检验 (Wilcoxon signed-(Wilcoxon signed-rank test)rank test)是非参数统计中符号检验法的改进,是非参数统计中符号检验法的改进,它不仅利用了观察值和它不仅利用了观察值和原假设中心位置原假设中心位置的差的的差的正负,还利用了差的值的大小的信息。虽然是正负,还利用了差的值的大小的信息。虽然是简单的非参数方法,但却体现了秩的基本思想。简单的非参数方法,但却体现了秩的基本思想。m例例 2.4 2.4 下面是下面是1010个欧洲城镇每人每年平均消费个欧洲城镇每人每年平均消
2、费的酒量(相当于纯酒精数)(单位:升)。数据的酒量(相当于纯酒精数)(单位:升)。数据已经按升幂排列。已经按升幂排列。4.12 5.18 7.63 9.74 10.39 4.12 5.18 7.63 9.74 10.39 11.92 12.32 12.89 13.54 14.45 11.92 12.32 12.89 13.54 14.45 人们普遍认为欧洲各国人均年消费酒量的中人们普遍认为欧洲各国人均年消费酒量的中 位数相当于纯酒精位数相当于纯酒精8 8升,也就是升,也就是meme0 0=8=8。由数据。由数据 算得的中位数为算得的中位数为11.1611.16。因此,我们的检验设。因此,我们的
3、检验设为:为:H H0 0:meme8 8 ,H H1 1:me 8me 8m 先计算每个样本值和原假设中先计算每个样本值和原假设中meme0 0的值之差,的值之差,即即X Xi i8 8。m 考虑这些差的绝对值并将绝对值从小到大排考虑这些差的绝对值并将绝对值从小到大排序,从而求出这些绝对值的秩。序,从而求出这些绝对值的秩。m 再计算比再计算比8 8大的样本对应的绝对值的秩之和,大的样本对应的绝对值的秩之和,如果这个和比较大,我们就拒绝原假设,接受备如果这个和比较大,我们就拒绝原假设,接受备择假设。择假设。m问题一般提法:问题一般提法:假定样本假定样本X X1 1,X ,X n n来自分布来自
4、分布连续对称的连续对称的总体总体X X,在此假定下总体,在此假定下总体X X的中位数等于均值。的中位数等于均值。问题主要是检验中位数,即原检验为问题主要是检验中位数,即原检验为H H0 0:me=meme=me0 0,相对于各种单双边的备择假设。,相对于各种单双边的备择假设。注注:(1 1)与符号检验不同:)与符号检验不同:WilcoxonWilcoxon符号秩检验假设符号秩检验假设总体分布是对称的。总体分布是对称的。(2 2)在总体分布对称的假设下,即设总体)在总体分布对称的假设下,即设总体X X的分布的分布关于点关于点对称,则对称,则X X的均值和中位数相同,且均为的均值和中位数相同,且均
5、为。所以。所以检验总体中位数可等价于检验总体对称检验总体中位数可等价于检验总体对称中心。中心。即即检验的检验的原假设原假设 H H0 0:M=MM=M0 0 等价于等价于 H H0 0:=0 0(相对于各种单双边的备择假设)。(相对于各种单双边的备择假设)。m检验步骤:检验步骤:H H0 0:0 0 (对应于各单双边备择假设)(对应于各单双边备择假设)Step 1.Step 1.计算计算 i=1,2,i=1,2,n,n。记差为。记差为z z i.i.Step 2.Step 2.将差将差z z i.i.的绝对值,即的绝对值,即 ,按从小到大的顺序排列。由于总体服从连续型分按从小到大的顺序排列。由
6、于总体服从连续型分布,不妨假定样本互不相等,都不等于布,不妨假定样本互不相等,都不等于0 0,且样本,且样本差的绝对值也互不相等。所以可得到样本差的绝对值也互不相等。所以可得到样本z z i.i.的绝的绝对值的秩,不妨记对值的秩,不妨记 的秩为的秩为R R i i。Step 3.tep 3.符号秩和检验统计量为符号秩和检验统计量为 其中其中 或者取检验统计量为或者取检验统计量为 其中其中主要取主要取W W为检验统计量。为检验统计量。mStep 4Step 4 设设w w表示由样本算出的表示由样本算出的W W的值。的值。(1 1)H H0 0:0 0,H H1 1:0 0 p p值值P(WP(W
7、 w w );(2 2)H H0 0:0 0,H H1 1:00。若若H H1 1成立,则总体成立,则总体X X的分布关于点的分布关于点对称。对称。从而有,从而有,P(X0)P(X0)P(Xa)P(Xa)P(X 8M 8下面来用下面来用WilcoxonWilcoxon符号秩检验,等价于检验符号秩检验,等价于检验 H H0 0:8 8 ,H H1 1:8 8m检验步骤检验步骤 Step 1.Step 1.对于对于 i=1,2,i=1,2,n,n,计算得到新的,计算得到新的样本样本z zi i和它们对应的秩如下:和它们对应的秩如下:样本 xi4.12 5.18 7.63 9.7410.3911.9
8、212.3212.913.5414.45 zi的符号 zi的绝对值3.88 2.19 0.37 1.742.393.924.324.895.546.45 秩 5 3 1 2 4 6 7 8 9 10m Step 2.Step 2.计算计算W W。W W+=2+4+6+7+8+9=2+4+6+7+8+910104646 利用利用W W的分布,辅以统计软件,可计算出的分布,辅以统计软件,可计算出p p值值 0.0320.032。mStep 3.Step 3.所以给定所以给定0.050.05时,此时可拒绝原假时,此时可拒绝原假设,认为欧洲人均酒精年消费多于设,认为欧洲人均酒精年消费多于8 8升。升。
9、W的分布性质 设独立同分布样本设独立同分布样本x x1 1,x,xn n来自连续对称总体来自连续对称总体X,XX,X分布的对称中心为分布的对称中心为。为方便讨论,不妨设原。为方便讨论,不妨设原假设为假设为 H H0 0:0 0,即总体分布关于原点即总体分布关于原点0 0对称的条件下,讨论对称的条件下,讨论W W的性质。的性质。注:注:W W与与W W有下列关系:有下列关系:W W+W+W-=n(n=n(n1)/21)/2 m(关键)性质关键)性质 2.12.1 令令 则在总体的分则在总体的分布关于原点布关于原点0 0对称时,对称时,W W与与S S同分布。同分布。注:注:S S是是W W当当R
10、 Ri ii i时的特殊情况。研究时的特殊情况。研究W W的分布的分布可转为研究可转为研究S S的分布。的分布。m概率分布概率分布m性质性质 2.22.2 在总体的分布关于原点在总体的分布关于原点0 0对称时,对称时,W W的的概率分布为概率分布为 P(WP(W+=d)=P(S=d)=P(Sd)=t d)=t n n(d)/2(d)/2n n,其中,其中,d d0,1,2,0,1,2,n(n+1)/2,n(n+1)/2,t tn n(d)(d)表示从表示从1,2,1,2,n,n这这n n个数中任取若干个数(包括一个个数中任取若干个数(包括一个都不取),其和恰为都不取),其和恰为d d,共有多少
11、种取法。,共有多少种取法。m对称性对称性m性质性质 2.32.3 在总体的分布关于原点在总体的分布关于原点0 0对称时,对称时,W W服服从对称分布,对称中心为从对称分布,对称中心为n(n+1)/4n(n+1)/4,即:对所有,即:对所有的的d=0,1,2,d=0,1,2,n(n+1)/4,n(n+1)/4,有,有 P(WP(W+=n(n+1)/4=n(n+1)/4 d )d )P(WP(W+=n(n+1)/4+d ),=n(n+1)/4+d ),P(W P(W+n(n+1)/4 n(n+1)/4 d )d )P(WP(W+n(n+1)/4+d )n(n+1)/4+d )。m期望方差及渐近正态
12、性期望方差及渐近正态性m性质性质 2.42.4 在总体分布关于原点在总体分布关于原点0 0对称时,对称时,E(WE(W+)=n(n+1)/4)=n(n+1)/4,D D(W W+)=n(n+1)(2n+1)/24=n(n+1)(2n+1)/24。m性质性质 2.52.5 若总体分布关于原点若总体分布关于原点0 0对称,则在样对称,则在样本容量本容量n n趋于无穷大时,趋于无穷大时,W W+有渐近正态性:有渐近正态性:W W N N(n(n+1)/n(n+1)/4 4,n(n+1)(2n+1)/24n(n+1)(2n+1)/24)m有结的情况下,用平均秩法。有结的情况下,用平均秩法。m性质性质2
13、.6 2.6 在总体的分布关于原点在总体的分布关于原点0 0对称,有结秩取对称,有结秩取平均时,平均时,E(WE(W+)=n(n+1)/4)=n(n+1)/4,D D(W W+)=n(n+1)(2n+1)/24=n(n+1)(2n+1)/24其中其中g g表示结的个数,表示结的个数,表示第表示第i i个结的长度。个结的长度。m有结时,有结时,W W的期望和方差实际上是条件期望和的期望和方差实际上是条件期望和方差,它们是在样本数据中给定有方差,它们是在样本数据中给定有g g个结,且结的长个结,且结的长度分别给定为度分别给定为 时的条件期望和条件方差。时的条件期望和条件方差。m与符号检验的比较。与
14、符号检验的比较。续例续例 2.2 2.2 两个不同方向的假设检验。两个不同方向的假设检验。考虑下面的假设检验:考虑下面的假设检验:H H0 0:M=12.5,HM=12.5,H1 1:M12.5 M8 M8 (H1H1)对这两个问题分别用对这两个问题分别用WilcoxonWilcoxon符号秩检验和符符号秩检验和符号检验方法。号检验方法。m符号检验结果符号检验结果 对于检验(对于检验(H1H1):):S S=3,S=3,S+=7,=7,检验统计量检验统计量K KS S3 3,p p值值0.1718750.171875,对,对0.050.05,不能拒绝,不能拒绝H H0 0。对于检验(对于检验(
15、H2H2):):S S=7,S=7,S+=3,=3,检验统计量检验统计量K KS S3 3,p p值值0.1718750.171875,对,对0.050.05,不能拒绝,不能拒绝H H0 0。结果完全对称!说明符号检验只与符号有关!结果完全对称!说明符号检验只与符号有关!mWilcoxonWilcoxon符号秩检验结果符号秩检验结果 对于检验(对于检验(H1H1):):检验统计量检验统计量W W+=46=46,p p值值0.032230.03223,对,对0.050.05,拒绝,拒绝H H0 0。对于检验(对于检验(H2H2):):检验统计量检验统计量W W1111,p p值值0.052730
16、.05273,对,对0.050.05,不能拒绝,不能拒绝H H0 0。结果不对称!说明结果不对称!说明WilcoxonWilcoxon符号秩检验不仅与符号符号秩检验不仅与符号有关,还和数值大小有关!有关,还和数值大小有关!Wilcoxon符号秩检验置信区间mWalshWalsh平均平均 为利用更多的信息,可求每两个数的平均为利用更多的信息,可求每两个数的平均 (X(Xi iX Xj j)/2,i)/2,i j j,(一共有,(一共有 n(n+1)/2 n(n+1)/2 个)来扩个)来扩 大样本数目。这样的平均称为大样本数目。这样的平均称为WalshWalsh平均平均。mWalshWalsh平均和平均和W W+的关系。的关系。在原假设成立的条件下,即在原假设成立的条件下,即 H H0 0:0 0成立,有成立,有 特别当原假设为特别当原假设为H H0 0:0 0成立,有成立,有 mHodgeHodgeLehmannLehmann估计量估计量 利用利用WalshWalsh平均可以得到对称中心平均可以得到对称中心的点估的点估计,即可由计,即可由WalshWalsh平均的中位数来估计对称中心,平
copyright@ 2008-2022 冰豆网网站版权所有
经营许可证编号:鄂ICP备2022015515号-1