《非参数统计》与MATLAB编程第四章符号秩和检验法.docx

资源描述

《非参数统计》与MATLAB编程第四章符号秩和检验法.docx

《《非参数统计》与MATLAB编程第四章符号秩和检验法.docx》由会员分享，可在线阅读，更多相关《《非参数统计》与MATLAB编程第四章符号秩和检验法.docx（8页珍藏版）》请在冰豆网上搜索。

《非参数统计》与MATLAB编程第四章符号秩和检验法.docx

《非参数统计》与MATLAB编程第四章符号秩和检验法

第四章符号和检验法

函数signrank

格式p=signrank（x）原假设为x的中位数为0，显著性水平为0.05的双侧检验。

p=signrank（x,m）原假设为x的中位数为m，显著性水平为0.05的双侧检验。

p=signrank（x,m，alpha）原假设为x的中位数为m，显著性水平为alpha的双侧检验。

[p,h]=signrank（...,'alpha',alpha）

例：

[p,h]=signrank（...,'alpha',0.01）

[p,h,stats]=signrank（...,'method',‘exact’）

用精确的方法

[p,h]=signrank（...,'method',‘approximate’）

用正态近似的方法

[p,h,stats]=signrank（x,y,'alpha',0.01,'method','exact'）

[p,h,stats]=signrank（y1,y2,0.01,'method','approximate'）

所P值除以2，得到相应单侧检验的P值。

§4.2

x=[20.323.52219.12124.716.118.521.924.223.425];

y=[1821.722.51721.224.817.214.92021.122.723.7];

[p,h,stats]=signtest（x,y）

0.3877

stats=

sign:

length（find（（x-y）>0））

ans=

2*（1-binocdf（7,12,0.5））

ans=

0.3877

p=0.3877与书上算的不一样，书上算错了。

符号检验接受原假设。

W+

个数

取的值

不取任何数

3、（1，2）

4、（1，3）

5、（1+4）、（2+3））

6、（1，5）、（2，4）、（1，2，3）

7、（1，6）、（2，5）、（3，4）、（1，2，4）

8、（1，7）、（2，6）、（3，5）、（1，2，5）、（1，3，4）

9、（1，8）、（2，7）、（3，6）、（4，5）、（1，2，6）、（1，3，5）、（2，3，4）

10、（1，9）、（2，8）、（3，7）、（4，6）、（1，2，7）、（1，3，6）、（2，3，5）、（4，5，1）、（1、2、3、4）

11、（1，10）、（2，9）、（3，8）、（4，7）、（5，6）、（1，2，8）、（1，3，7）、（1，4，6）、（2，3，6）、（2，4，5）、（1，2，3，5）

符号秩和检验：

[p,h,stats]=signrank（x,y）

0.02685546875000

stats=

signedrank:

P43，表4.5中：

3+2+1+5=11，12*13/2-11

ans=

p=2*sum（a）/2^12

0.02685546875000

在显著性水平0.05下，拒绝原假设。

符号秩和检验应用的条件：

假设总体服从对称分布，而符号检验不需要。

习题四

1．

x1=[22.3225.7624.2321.3523.4326.9718.3620.7524.0726.4325.4127.22];

x2=[21.2523.9724.7719.2623.1226.0019.4017.1822.2323.3524.9825.90]

符号秩和

[p,h,stats]=signrank（x1,x2）

0.01220703125000

stats=

signedrank:

在0.05显著性下，拒绝原假设，有差异。

2．

符号检验法：

[p,h,stats]=signtest（x1,x2）

0.03857421875000

stats=

sign:

[h,p,ci,tstat]=ttest（x1,x2）

0.00888227075133

ci=

0.379924103111732.10174256355494

tstat=

tstat:

3.17229233575613

df:

sd:

1.35497372220969

3．

x1=[390390450380400390350400370430]

x2=[270280350300300340290320280320]

x3=x2+100

[phstats]=signrank（x1,x3）

0.26562500000000

stats=

signedrank:

或者：

[p,h,stats]=signrank（x1-x2,100）

0.26562500000000

stats=

signedrank:

接受原假设，差价是100

L-H估计：

a=x1-x2

1201101008010050608090110

b=sort（[mean（nchoosek（a,2）,2）;a']）;

中位数：

median（b）

ans=

见《非参数统计》吴喜之，第40页，查表,对于n=10，k=9

[b（9+1）b（10*11/2-9）]

ans=

75105

置信度95.2%的区间为[75,105]

大样本连续性修正公式如下所示：

n=10

k=round（n*（n+1）/4-1.96*sqrt（n*（n+1）*（2*n+1）/24）-0.5）

[b（k+1）b（10*11/2-k）]

ans=

75105

置信度95%的置信区间为[75，105]

基于符号检验的点估计与区间估计：

点估计：

median（x1-x2）

ans=

中位数me的各层的区间估计

第一层：

置信度

1-0.5^9

ans=

0.99804687500000

或1-binocdf（0,10,0.5）/0.5

ans=

0.99804687500000

第二层：

1-0.5^9-12*0.5^9

ans=

0.97460937500000

1-binocdf（1,12,0.5）/0.5

ans=

0.99365234375000

第三层：

1-binocdf（2,12,0.5）/0.5

ans=

0.96142578125000

第四层：

1-binocdf（3,12,0.5）/0.5

ans=

0.85400390625000

sort（x1-x2）

ans=

5060808090100100110110120

因此，置信度为0.96142578的置信区间为（80，110）

展开阅读全文