《非参数统计》与MATLAB编程第四章符号秩和检验法.docx
《《非参数统计》与MATLAB编程第四章符号秩和检验法.docx》由会员分享,可在线阅读,更多相关《《非参数统计》与MATLAB编程第四章符号秩和检验法.docx(8页珍藏版)》请在冰豆网上搜索。
《非参数统计》与MATLAB编程第四章符号秩和检验法
第四章符号和检验法
函数signrank
格式p=signrank(x)原假设为x的中位数为0,显著性水平为0.05的双侧检验。
p=signrank(x,m)原假设为x的中位数为m,显著性水平为0.05的双侧检验。
p=signrank(x,m,alpha)原假设为x的中位数为m,显著性水平为alpha的双侧检验。
[p,h]=signrank(...,'alpha',alpha)
例:
[p,h]=signrank(...,'alpha',0.01)
[p,h,stats]=signrank(...,'method',‘exact’)
用精确的方法
[p,h]=signrank(...,'method',‘approximate’)
用正态近似的方法
[p,h,stats]=signrank(x,y,'alpha',0.01,'method','exact')
[p,h,stats]=signrank(y1,y2,0.01,'method','approximate')
所P值除以2,得到相应单侧检验的P值。
§4.2
x=[20.323.52219.12124.716.118.521.924.223.425];
y=[1821.722.51721.224.817.214.92021.122.723.7];
[p,h,stats]=signtest(x,y)
p=
0.3877
h=
0
stats=
sign:
4
length(find((x-y)>0))
ans=
8
2*(1-binocdf(7,12,0.5))
ans=
0.3877
p=0.3877与书上算的不一样,书上算错了。
符号检验接受原假设。
W+
个数
取的值
0
1
不取任何数
1
1
1
2
1
2
3
2
3、(1,2)
4
2
4、(1,3)
5
3
5、(1+4)、(2+3))
6
4
6、(1,5)、(2,4)、(1,2,3)
7
5
7、(1,6)、(2,5)、(3,4)、(1,2,4)
8
6
8、(1,7)、(2,6)、(3,5)、(1,2,5)、(1,3,4)
9
8
9、(1,8)、(2,7)、(3,6)、(4,5)、(1,2,6)、(1,3,5)、(2,3,4)
10
10
10、(1,9)、(2,8)、(3,7)、(4,6)、(1,2,7)、(1,3,6)、(2,3,5)、(4,5,1)、(1、2、3、4)
11
12
11、(1,10)、(2,9)、(3,8)、(4,7)、(5,6)、(1,2,8)、(1,3,7)、(1,4,6)、(2,3,6)、(2,4,5)、(1,2,3,5)
符号秩和检验:
[p,h,stats]=signrank(x,y)
p=
0.02685546875000
h=
1
stats=
signedrank:
11
P43,表4.5中:
3+2+1+5=11,12*13/2-11
ans=
67
a=
1
1
1
2
2
3
4
5
6
8
10
12
p=2*sum(a)/2^12
p=
0.02685546875000
在显著性水平0.05下,拒绝原假设。
符号秩和检验应用的条件:
假设总体服从对称分布,而符号检验不需要。
习题四
1.
x1=[22.3225.7624.2321.3523.4326.9718.3620.7524.0726.4325.4127.22];
x2=[21.2523.9724.7719.2623.1226.0019.4017.1822.2323.3524.9825.90]
符号秩和
[p,h,stats]=signrank(x1,x2)
p=
0.01220703125000
h=
1
stats=
signedrank:
8
在0.05显著性下,拒绝原假设,有差异。
2.
符号检验法:
[p,h,stats]=signtest(x1,x2)
p=
0.03857421875000
h=
1
stats=
sign:
2
[h,p,ci,tstat]=ttest(x1,x2)
h=
1
p=
0.00888227075133
ci=
0.379924103111732.10174256355494
tstat=
tstat:
3.17229233575613
df:
11
sd:
1.35497372220969
3.
x1=[390390450380400390350400370430]
x2=[270280350300300340290320280320]
x3=x2+100
[phstats]=signrank(x1,x3)
p=
0.26562500000000
h=
0
stats=
signedrank:
9
或者:
[p,h,stats]=signrank(x1-x2,100)
p=
0.26562500000000
h=
0
stats=
signedrank:
9
接受原假设,差价是100
L-H估计:
a=x1-x2
a=
1201101008010050608090110
b=sort([mean(nchoosek(a,2),2);a']);
中位数:
median(b)
ans=
90
见《非参数统计》吴喜之,第40页,查表,对于n=10,k=9
[b(9+1)b(10*11/2-9)]
ans=
75105
置信度95.2%的区间为[75,105]
大样本连续性修正公式如下所示:
n=10
k=round(n*(n+1)/4-1.96*sqrt(n*(n+1)*(2*n+1)/24)-0.5)
k=
8
[b(k+1)b(10*11/2-k)]
ans=
75105
置信度95%的置信区间为[75,105]
基于符号检验的点估计与区间估计:
点估计:
median(x1-x2)
ans=
95
中位数me的各层的区间估计
第一层:
置信度
1-0.5^9
ans=
0.99804687500000
或1-binocdf(0,10,0.5)/0.5
ans=
0.99804687500000
第二层:
1-0.5^9-12*0.5^9
ans=
0.97460937500000
1-binocdf(1,12,0.5)/0.5
ans=
0.99365234375000
第三层:
1-binocdf(2,12,0.5)/0.5
ans=
0.96142578125000
第四层:
1-binocdf(3,12,0.5)/0.5
ans=
0.85400390625000
sort(x1-x2)
ans=
5060808090100100110110120
因此,置信度为0.96142578的置信区间为(80,110)