非参数统计部分课后习题参考答案.docx
《非参数统计部分课后习题参考答案.docx》由会员分享,可在线阅读,更多相关《非参数统计部分课后习题参考答案.docx(13页珍藏版)》请在冰豆网上搜索。
非参数统计部分课后习题参考答案
课后习题参考答案
第一章p23-25
2、
(2)有两组学生,第一组八名学生的成绩分别为x1:
100,99,99,100,99,100,99,99;第二组三名学生的成绩分别为x2:
75,87,60。
我们对这两组数据作同样水平a=的t检验(假设总体均值为u):
H0:
u=100H1:
u<100。
第一组数据的检验结果为:
df=7,t值为,单边p值为,结论为“拒绝H0:
u=100。
”(注意:
该组均值为);第二组数据的检验结果为:
df=2,t值为,单边p值为;结论为“接受H0:
u=100。
”(注意:
该组均值为)。
你认为该问题的结论合理吗说出你的理由,并提出该如何解决这一类问题。
答:
这个结论不合理(6分)。
因为,第一组数据的结论是由于p-值太小拒绝零假设,这时可能犯第一类错误的概率较小,且我们容易把握;而第二组数据虽不能拒绝零假设,但要做出“在水平a时,接受零假设”的说法时,还必须涉及到犯第二类错误的概率。
(4分)然而,在实践中,犯第二类错误的概率多不易得到,这时说接受零假设就容易产生误导。
实际上不能拒绝零假设的原因很多,可能是证据不足(样本数据太少),也可能是检验效率低,换一个更有效的检验之后就可以拒绝了,当然也可能是零假设本身就是对的。
本题第二组数据明显是由于证据不足,所以解决的方法只有增大样本容量。
(4分)
第三章p68-71
3、在某保险种类中,一次关于1998年的索赔数额(单位:
元)的随机抽样为(按升幂排列):
4632,4728,5052,5064,5484,6972,7596,9480,14760,15012,18720,21240,22836,52788,67200。
已知1997年的索赔数额的中位数为5064元。
(1)是否1998年索赔的中位数比前一年有所变化能否用单边检验来回答这个问题(4分)
(2)利用符号检验来回答
(1)的问题(利用精确的和正态近似两种方法)。
(10分)
》
(3)找出基于符号检验的95%的中位数的置信区间。
(8分)
解:
(1)1998年的索赔数额的中位数为9480元比1997年索赔数额的中位数5064元是有变化,但这只是从中位数的点估计值看。
如果要从普遍意义上比较1998年与1997年的索赔数额是否有显著变化,还得进行假设检验,而且这个问题不能用单边检验来回答。
(4分)
(2)符号检验(5分)
设假设组:
H0:
M=M0=5064
H1:
M≠M0=5064
符号检验:
因为n+=11,n-=3,所以k=min(n+,n-)=3
精确检验:
二项分布b(14,,
,双边p-值为,大于a=,所以在a水平下,样本数据还不足以拒绝零假设;但假若a=,则样本数据可拒绝零假设。
查二项分布表得a=的临界值为(3,11),同样不足以拒绝零假设。
正态近似:
(5分)
np=14/2=7,npq=14/4=
z=(3+/
≈>Za/2=
—
仍是在a=的水平上无法拒绝零假设。
说明两年的中位数变化不大。
(3)中位数95%的置信区间:
(5064,21240)(8分)
7、一个监听装置收到如下的信号:
0,1,0,1,1,1,0,0,1,1,0,0,0,0,1,1,1,1,1,1,1,1,1,0,1,0,0,1,1,1,0,1,0,1,0,1,0,0,0,0,0,0,0,0,1,0,1,1,0,0,1,1,1,0,1,0,1,0,0,0,1,0,0,1,0,1,0,1,0,0,0,0,0,0,0,0。
能否说该信号是纯粹随机干扰(10分)
解:
建立假设组:
H0:
信号是纯粹的随机干扰
H1:
信号不是纯粹的随机干扰(2分)
游程检验:
因为n1=42,n2=34,r=37。
(2分)根据正态近似公式得:
U=
(2分)
(2分)
取显著性水平a=,则Za/2=,故接受零假设,可以认为信号是纯粹的随机干扰的。
(2分)
{
第四章p91-94
1、在研究计算器是否影响学生手算能力的实验中,13个没有计算器的学生(A组)和10个拥有计算器的学生(B组)对一些计算题进行了手算测试.这两组学生得到正确答案的时间(分钟)分别如下:
A组:
28,20,20,27,3,29,25,19,16,24,29,16,29
B组:
40,31,25,29,30,25,16,30,39,25
能否说A组学生比B组学生算得更快利用所学的检验来得出你的结论.(12分)
解、利用Wilcoxon两个独立样本的秩和检验或Mann-WhitneyU检验法进行检验。
建立假设组:
H0:
两组学生的快慢一致;
H1:
A组学生比B组学生算得快。
(2分)
两组数据混合排序(在B组数据下划线):
3,16,16,16,19,20,20,24,25,25,25,25,27,28,29,29,29,29,30,30,31,39,40(2分)
A组秩和RA=1+3*2+5+*2+8++13+14+*3=120;
】
B组秩和RB=3+*3++*2+21+22+23=156(2分)
A组逆转数和UA=120-(13*14)/2=29
B组逆转数和UB=156-(10*11)/2=101(2分)
当nA=13,nB=10时,样本量较大,超出了附表的范围,不能查表得Mann-Whitney秩和检验的临界值,所以用正态近似。
计算
(2分)
当显著性水平a取时,正态分布的临界值Za/2=(1分)
由于Z(1分)
4、在比较两种工艺(A和B)所生产的产品性能时,利用超负荷破坏性实验。
记下损坏前延迟的时间名次(数目越大越耐久)如下:
方法:
ABBABABAABAAABABAAAA
:
序:
1234567891011121314151617181920
用Mann-Whitney秩和检验判断A工艺是否比B工艺在提高耐用性方面更优良(10分)
解、设假设组:
H0:
两种工艺在提高耐用性方面的优良性一致;
H1:
A工艺比B工艺更优良(1分,假设也可用符号表达式)
根据样本数据知nA=13;nB=7(1分),计算
A工艺的秩和RA=1+4+6+8+9+11+12+13+15+17+18+19+20=153;(1分)
B工艺的秩和RB=2+3+5+7+10+14+16=57(1分)
A工艺的Mann-Whitney秩和UA=RA-nA(nA+1)/2=153-(13*14)/2=62(1分)
B工艺的Mann-Whitney秩和UB=RB-nB(nB+1)/2=57-(7*8)/2=29(1分)
当nA=13,nB=7时,样本量较大,超出了附表的范围,不能查表得Mann-Whitney秩和检验的临界值,所以用正态近似。
计算
…
(2分)
当显著性水平a取时,正态分布的临界值Za/2=(1分)
由于Z(1分)
第五章p118-121
1、对5种含有不同百分比棉花的纤维分别做8次抗拉强度试验,试验结果如表4所示(单位:
g/cm2):
表4
棉花纤维百分比(%)
【
15
20
25
30
35
抗拉强度
411
1268
1339
1480
)
986
705
846
1198
1198
775
493
1057
】
1339
1268
493
634
916
1198
1480
775
%
634
1057
1339
1268
352
846
1127
916
986
(
352
564
775
1480
1127
564
705
634
@
1268
1480
423
试问不同百分比纤维的棉花其平均抗拉强度是否一样,利用Kruskall—Wallis检验法。
(14分)
解:
建立假设组:
H0:
不同百分比纤维的棉花其平均抗拉强度一样;
H1:
不同百分比纤维的棉花其平均抗拉强度不一样。
(2分)
已知,k=5,n1=n2=n3=n4=n5=8(2分)。
混合排序后各观察值的秩如表4所示:
表4
【
棉花纤维百分比(%)
15
20
25
30
35
抗拉强度
3
&
35
28
28
15
。
35
10
28
<
15
10
35
?
15
!
10
4
R
166
】
nj
8
8
8
8
8
根据表4计算得:
(6分)
由于自由度k-1=5-1=4,nj=8>5,是大样本,所以根据水平a=,查X2分布表得临界值C=,(2分)
因为Q>C,故以5%的显著水平拒绝H0假设,不同百分比纤维的棉花其平均抗拉强度不一样。
(2分)
…
7、按照一项调查,15名顾客对三种电讯服务的态度(“满意”或“不满意”)为(15分)
服务
消费者(爱好用“1”表示,不爱好用“0”表示)
合计
A
1
1
1
1
:
1
1
1
1
0
1
1
1
1
1
`
0
13
B
1
0
0
0
1
1
0
{
1
0
0
0
1
1
1
1
8
C
)
0
0
0
1
0
0
0
0
0
0
;
0
1
0
0
0
2
合计
2
1
1
《
2
2
2
1
2
0
1
1
3
2
、
2
1
23
解:
建立假设组:
H0:
顾客对3种服务的态度无显著性差异;
H1:
顾客对3种服务的态度有显著性差异。
(2分)
本例中,k=3,n=15。
(2分)又因
(5分)自由度k-1=3-1=2,(2分)取显著性水平a=,查X2分布表得临界值c=,(2分)因为Q>C,故以5%的显著水平拒绝H0假设,即顾客对3种服务的态度有显著性差异。
(2分)
8、调查20个村民对3个候选人的评价,答案只有“同意”或“不同意”两种,结果见表1:
表1
|
候选人
20个村民的评价(“同意”为1,“不同意”为0)
A
1
1
0
0
0
0
1
&
0
0
0
1
0
0
1
1
0
0
】
1
1
1
B
0
1
1
0
1
0
?
1
1
0
0
0
1
0
0
0
1
|
0
0
0
1
C
0
0
1
1
1
*
1
0
0
0
0
1
0
1
1
1
!
1
1
0
1
0
试检验村民对这三个候选人的评价有没有区别
解:
建立假设组:
H0:
三个候选人在村民眼中没有区别
H1:
三个候选人在村民眼中有差别(2分)
数据适合用CochranQ检验(2分)。
而且已知n=20,k=3,∑xi=∑yj=28。
(2分)
&
计算结果见表3:
表3
3个候选人
20个村民的评价(“同意”为1,“不同意”为0)
Xi
A
1
1
0
0
\
0
0
1
0
0
0
1
0
0
1
1
0
0
1
1
1
9
B
0
1
~
1
0
1
0
1
1
0
0
0
1
。
0
0
0
1
0
0
0
1
8
C
>
0
0
1
1
1
1
0
0
0
0
|
1
0
1
1
1
1
1
0
1
0
;
11
Yj
1
2
2
1
2
1
2
1
、
0
0
2
1
1
2
2
2
1
1
【
2
2
28
根据表2计算得:
(2分)
则
(2分)
取显著性水平a=,查卡方分布表得卡方临界值C=,由于Q(2分)
第八章P170-171
2.下面是某车间生产的一批轴的实际直径(单位:
mm):
;
能否表明该尺寸服从均值为10,标准差为的正态分布(分别用K-S拟合检验和卡方拟合检验)。
当n=10,a=时查表得K-S拟合检验的临界值为。
(24分)
解:
建立假设组:
H0:
该车间生产的轴直径服从均值为10,标准差为的正态分布;
H1:
该车间生产的轴直径服从均值为10,标准差为的正态分布(2分)
首先将样本数据按升序排列,并对数据进行标准化处理,即Zi=(xi-10)/(1分),并列在计算表中。
(1)K-S正态拟合检验见表1:
表1K-S拟合检验计算表
样本数据xi
标准化值
<
Zi
正态区间
正态累计概率
实际累计频率
离差
(1)
(2)
(3)
(4)
(5)
…
(6)=(4)-(5)
(-∞,-3)
[-3,
、
[,
|
[,
[,
:
[,
[,
~
[,
)
[,
[,
]
-
-
[,∞)
K-S拟合检验统计量取最大的绝对离差Dn=(5分),由于检验统计量小于临界值,所以无法拒绝零假设,即可以说该车间生产的轴直径服从均值为10,标准差为的正态分布(2分)。
(2)卡方正态拟合检验见表2:
表2卡方拟合检验计算表
!
样本数据xi
标准化值
Zi
正态区间
正态概率
预期频数Еi
=(4)×10
小预期频数合并
实际频数Oi
(Oi-Еi)2/Еi
|
(1)
(2)
(3)
(4)
(5)
(6)
(7)
(8)
》
(-∞,-3)
5
[-3,
-
[,
[,
、
[,
@
[,
[,
^
2
[,
[,
1
<
[,
1
-
-
…
[,∞)
1
合计
-
-
¥
10
由于存在小预期频数,所以要合并,直到预期频数都大于1(见第(6)列),同时计算合并后的实际频数(该步正确2分)。
从表2得卡方检验统计量Q=(6分),自由度df=k-1=5-1=4(2分),查卡方分布表得a=的临界值C=(左尾),右尾临界值(2分),说明检验统计量Q落在肯定域,不能拒绝零假设,即可以说该车间生产的轴直径服从均值为10,标准差为的正态分布(2分)。
第九章p184-186
1、美国在1995年因几种违法而被捕的人数按照性别为:
表1
`
性别
男
女
谋杀
13927
1457
抢劫
116741
12068
恶性攻击
"
328476
70938
偷盗
236495
29866
非法侵占
704565
351580
偷盗机动车
119175
#
18058
纵火
11413
2156
从这些罪行的组合看来,是否与性别无关如果只考虑谋杀与抢劫罪,结论是否一样(20分)
解:
本题适合用独立性卡方检验。
建立假设组H0:
犯罪类型与性别无关
H1:
犯罪类型与性别有关
r=7,c=2.自由度df=(7-1)(2-1)=6
a=,查表得X2,6)=
<
Eij=ni.。
n
计算结果见下表:
男(Qi1)
女(Qi2)
合计
Ei1
Ei2
(Qij-Eij)^2/Eij
~
谋杀
13927
1457
15384
$
抢劫
116741
12068
128809
;
恶性攻击
328476
70938
399414
303146
偷盗
【
236495
29866
266361
非法侵占
704565
%
351580
1056145
偷盗机动车
119175
18058
137233
纵火
11413
2156
13569
X^2=
合计
1530792
486123
2016915
由于X2=>X2,6)=,所以拒绝零假设,说明罪行与性别有关。
如果只考虑谋杀与抢劫,则
男(Qi1)
女(Qi2)
合计
Ei1
Ei2
(Qij-Eij)^2/Eij
谋杀
13927
1457
15384
抢劫
116741
12068
128809
116727
X^2=
合计
130668
13525
144193
由于X2=(20分)