非参数统计部分课后习题参考答案.docx

上传人:b****5 文档编号:3785187 上传时间:2022-11-25 格式:DOCX 页数:13 大小:71.75KB
下载 相关 举报
非参数统计部分课后习题参考答案.docx_第1页
第1页 / 共13页
非参数统计部分课后习题参考答案.docx_第2页
第2页 / 共13页
非参数统计部分课后习题参考答案.docx_第3页
第3页 / 共13页
非参数统计部分课后习题参考答案.docx_第4页
第4页 / 共13页
非参数统计部分课后习题参考答案.docx_第5页
第5页 / 共13页
点击查看更多>>
下载资源
资源描述

非参数统计部分课后习题参考答案.docx

《非参数统计部分课后习题参考答案.docx》由会员分享,可在线阅读,更多相关《非参数统计部分课后习题参考答案.docx(13页珍藏版)》请在冰豆网上搜索。

非参数统计部分课后习题参考答案.docx

非参数统计部分课后习题参考答案

课后习题参考答案

第一章p23-25

2、

(2)有两组学生,第一组八名学生的成绩分别为x1:

100,99,99,100,99,100,99,99;第二组三名学生的成绩分别为x2:

75,87,60。

我们对这两组数据作同样水平a=的t检验(假设总体均值为u):

H0:

u=100H1:

u<100。

第一组数据的检验结果为:

df=7,t值为,单边p值为,结论为“拒绝H0:

u=100。

”(注意:

该组均值为);第二组数据的检验结果为:

df=2,t值为,单边p值为;结论为“接受H0:

u=100。

”(注意:

该组均值为)。

你认为该问题的结论合理吗说出你的理由,并提出该如何解决这一类问题。

答:

这个结论不合理(6分)。

因为,第一组数据的结论是由于p-值太小拒绝零假设,这时可能犯第一类错误的概率较小,且我们容易把握;而第二组数据虽不能拒绝零假设,但要做出“在水平a时,接受零假设”的说法时,还必须涉及到犯第二类错误的概率。

(4分)然而,在实践中,犯第二类错误的概率多不易得到,这时说接受零假设就容易产生误导。

实际上不能拒绝零假设的原因很多,可能是证据不足(样本数据太少),也可能是检验效率低,换一个更有效的检验之后就可以拒绝了,当然也可能是零假设本身就是对的。

本题第二组数据明显是由于证据不足,所以解决的方法只有增大样本容量。

(4分)

第三章p68-71

3、在某保险种类中,一次关于1998年的索赔数额(单位:

元)的随机抽样为(按升幂排列):

4632,4728,5052,5064,5484,6972,7596,9480,14760,15012,18720,21240,22836,52788,67200。

已知1997年的索赔数额的中位数为5064元。

(1)是否1998年索赔的中位数比前一年有所变化能否用单边检验来回答这个问题(4分)

(2)利用符号检验来回答

(1)的问题(利用精确的和正态近似两种方法)。

(10分)

(3)找出基于符号检验的95%的中位数的置信区间。

(8分)

解:

(1)1998年的索赔数额的中位数为9480元比1997年索赔数额的中位数5064元是有变化,但这只是从中位数的点估计值看。

如果要从普遍意义上比较1998年与1997年的索赔数额是否有显著变化,还得进行假设检验,而且这个问题不能用单边检验来回答。

(4分)

(2)符号检验(5分)

设假设组:

H0:

M=M0=5064

H1:

M≠M0=5064

符号检验:

因为n+=11,n-=3,所以k=min(n+,n-)=3

精确检验:

二项分布b(14,,

,双边p-值为,大于a=,所以在a水平下,样本数据还不足以拒绝零假设;但假若a=,则样本数据可拒绝零假设。

查二项分布表得a=的临界值为(3,11),同样不足以拒绝零假设。

正态近似:

(5分)

np=14/2=7,npq=14/4=

z=(3+/

≈>Za/2=

仍是在a=的水平上无法拒绝零假设。

说明两年的中位数变化不大。

(3)中位数95%的置信区间:

(5064,21240)(8分)

7、一个监听装置收到如下的信号:

0,1,0,1,1,1,0,0,1,1,0,0,0,0,1,1,1,1,1,1,1,1,1,0,1,0,0,1,1,1,0,1,0,1,0,1,0,0,0,0,0,0,0,0,1,0,1,1,0,0,1,1,1,0,1,0,1,0,0,0,1,0,0,1,0,1,0,1,0,0,0,0,0,0,0,0。

能否说该信号是纯粹随机干扰(10分)

解:

建立假设组:

H0:

信号是纯粹的随机干扰

H1:

信号不是纯粹的随机干扰(2分)

游程检验:

因为n1=42,n2=34,r=37。

(2分)根据正态近似公式得:

U=

(2分)

(2分)

取显著性水平a=,则Za/2=,故接受零假设,可以认为信号是纯粹的随机干扰的。

(2分)

{

第四章p91-94

1、在研究计算器是否影响学生手算能力的实验中,13个没有计算器的学生(A组)和10个拥有计算器的学生(B组)对一些计算题进行了手算测试.这两组学生得到正确答案的时间(分钟)分别如下:

A组:

28,20,20,27,3,29,25,19,16,24,29,16,29

B组:

40,31,25,29,30,25,16,30,39,25

能否说A组学生比B组学生算得更快利用所学的检验来得出你的结论.(12分)

解、利用Wilcoxon两个独立样本的秩和检验或Mann-WhitneyU检验法进行检验。

建立假设组:

H0:

两组学生的快慢一致;

H1:

A组学生比B组学生算得快。

(2分)

两组数据混合排序(在B组数据下划线):

3,16,16,16,19,20,20,24,25,25,25,25,27,28,29,29,29,29,30,30,31,39,40(2分)

A组秩和RA=1+3*2+5+*2+8++13+14+*3=120;

B组秩和RB=3+*3++*2+21+22+23=156(2分)

A组逆转数和UA=120-(13*14)/2=29

B组逆转数和UB=156-(10*11)/2=101(2分)

当nA=13,nB=10时,样本量较大,超出了附表的范围,不能查表得Mann-Whitney秩和检验的临界值,所以用正态近似。

计算

(2分)

当显著性水平a取时,正态分布的临界值Za/2=(1分)

由于Z

(1分)

4、在比较两种工艺(A和B)所生产的产品性能时,利用超负荷破坏性实验。

记下损坏前延迟的时间名次(数目越大越耐久)如下:

方法:

ABBABABAABAAABABAAAA

序:

1234567891011121314151617181920

用Mann-Whitney秩和检验判断A工艺是否比B工艺在提高耐用性方面更优良(10分)

解、设假设组:

H0:

两种工艺在提高耐用性方面的优良性一致;

H1:

A工艺比B工艺更优良(1分,假设也可用符号表达式)

根据样本数据知nA=13;nB=7(1分),计算

A工艺的秩和RA=1+4+6+8+9+11+12+13+15+17+18+19+20=153;(1分)

B工艺的秩和RB=2+3+5+7+10+14+16=57(1分)

A工艺的Mann-Whitney秩和UA=RA-nA(nA+1)/2=153-(13*14)/2=62(1分)

B工艺的Mann-Whitney秩和UB=RB-nB(nB+1)/2=57-(7*8)/2=29(1分)

当nA=13,nB=7时,样本量较大,超出了附表的范围,不能查表得Mann-Whitney秩和检验的临界值,所以用正态近似。

计算

(2分)

当显著性水平a取时,正态分布的临界值Za/2=(1分)

由于Z

(1分)

第五章p118-121

1、对5种含有不同百分比棉花的纤维分别做8次抗拉强度试验,试验结果如表4所示(单位:

g/cm2):

表4

棉花纤维百分比(%)

15

20

25

30

35

抗拉强度

411

1268

1339

1480

986

705

846

1198

1198

775

493

1057

1339

1268

493

634

916

1198

1480

775

%

634

1057

1339

1268

352

846

1127

916

986

352

564

775

1480

1127

564

705

634

@

1268

1480

423

试问不同百分比纤维的棉花其平均抗拉强度是否一样,利用Kruskall—Wallis检验法。

(14分)

解:

建立假设组:

H0:

不同百分比纤维的棉花其平均抗拉强度一样;

H1:

不同百分比纤维的棉花其平均抗拉强度不一样。

(2分)

已知,k=5,n1=n2=n3=n4=n5=8(2分)。

混合排序后各观察值的秩如表4所示:

表4

棉花纤维百分比(%)

15

20

25

30

35

抗拉强度

3

&

35

28

28

15

35

10

28

<

15

10

35

?

15

10

4

R

166

nj

8

8

8

8

8

根据表4计算得:

(6分)

由于自由度k-1=5-1=4,nj=8>5,是大样本,所以根据水平a=,查X2分布表得临界值C=,(2分)

因为Q>C,故以5%的显著水平拒绝H0假设,不同百分比纤维的棉花其平均抗拉强度不一样。

(2分)

7、按照一项调查,15名顾客对三种电讯服务的态度(“满意”或“不满意”)为(15分)

服务

消费者(爱好用“1”表示,不爱好用“0”表示)

合计

A

1

1

1

1

1

1

1

1

0

1

1

1

1

1

`

0

13

B

1

0

0

0

1

1

0

{

1

0

0

0

1

1

1

1

8

C

0

0

0

1

0

0

0

0

0

0

;

0

1

0

0

0

2

合计

2

1

1

2

2

2

1

2

0

1

1

3

2

2

1

23

解:

建立假设组:

H0:

顾客对3种服务的态度无显著性差异;

H1:

顾客对3种服务的态度有显著性差异。

(2分)

本例中,k=3,n=15。

(2分)又因

(5分)自由度k-1=3-1=2,(2分)取显著性水平a=,查X2分布表得临界值c=,(2分)因为Q>C,故以5%的显著水平拒绝H0假设,即顾客对3种服务的态度有显著性差异。

(2分)

8、调查20个村民对3个候选人的评价,答案只有“同意”或“不同意”两种,结果见表1:

表1

|

候选人

20个村民的评价(“同意”为1,“不同意”为0)

A

1

1

0

0

0

0

1

&

0

0

0

1

0

0

1

1

0

0

1

1

1

B

0

1

1

0

1

0

?

1

1

0

0

0

1

0

0

0

1

|

0

0

0

1

C

0

0

1

1

1

*

1

0

0

0

0

1

0

1

1

1

!

1

1

0

1

0

试检验村民对这三个候选人的评价有没有区别

解:

建立假设组:

H0:

三个候选人在村民眼中没有区别

H1:

三个候选人在村民眼中有差别(2分)

数据适合用CochranQ检验(2分)。

而且已知n=20,k=3,∑xi=∑yj=28。

(2分)

&

计算结果见表3:

表3

3个候选人

20个村民的评价(“同意”为1,“不同意”为0)

Xi

A

1

1

0

0

\

0

0

1

0

0

0

1

0

0

1

1

0

0

1

1

1

9

B

0

1

~

1

0

1

0

1

1

0

0

0

1

0

0

0

1

0

0

0

1

8

C

>

0

0

1

1

1

1

0

0

0

0

|

1

0

1

1

1

1

1

0

1

0

11

Yj

1

2

2

1

2

1

2

1

0

0

2

1

1

2

2

2

1

1

2

2

28

根据表2计算得:

(2分)

(2分)

取显著性水平a=,查卡方分布表得卡方临界值C=,由于Q

(2分)

第八章P170-171

2.下面是某车间生产的一批轴的实际直径(单位:

mm):

能否表明该尺寸服从均值为10,标准差为的正态分布(分别用K-S拟合检验和卡方拟合检验)。

当n=10,a=时查表得K-S拟合检验的临界值为。

(24分)

解:

建立假设组:

H0:

该车间生产的轴直径服从均值为10,标准差为的正态分布;

H1:

该车间生产的轴直径服从均值为10,标准差为的正态分布(2分)

首先将样本数据按升序排列,并对数据进行标准化处理,即Zi=(xi-10)/(1分),并列在计算表中。

(1)K-S正态拟合检验见表1:

表1K-S拟合检验计算表

样本数据xi

标准化值

<

Zi

正态区间

正态累计概率

实际累计频率

离差

(1)

(2)

(3)

(4)

(5)

(6)=(4)-(5)

(-∞,-3)

[-3,

[,

|

[,

[,

:

[,

[,

~

[,

[,

[,

]

-

-

[,∞)

K-S拟合检验统计量取最大的绝对离差Dn=(5分),由于检验统计量小于临界值,所以无法拒绝零假设,即可以说该车间生产的轴直径服从均值为10,标准差为的正态分布(2分)。

(2)卡方正态拟合检验见表2:

表2卡方拟合检验计算表

!

样本数据xi

标准化值

Zi

正态区间

正态概率

预期频数Еi

=(4)×10

小预期频数合并

实际频数Oi

(Oi-Еi)2/Еi

|

(1)

(2)

(3)

(4)

(5)

(6)

(7)

(8)

(-∞,-3)

5

[-3,

-

[,

[,

[,

@

[,

[,

^

2

[,

[,

1

<

[,

1

-

-

[,∞)

1

合计

-

-

10

由于存在小预期频数,所以要合并,直到预期频数都大于1(见第(6)列),同时计算合并后的实际频数(该步正确2分)。

从表2得卡方检验统计量Q=(6分),自由度df=k-1=5-1=4(2分),查卡方分布表得a=的临界值C=(左尾),右尾临界值(2分),说明检验统计量Q落在肯定域,不能拒绝零假设,即可以说该车间生产的轴直径服从均值为10,标准差为的正态分布(2分)。

第九章p184-186

1、美国在1995年因几种违法而被捕的人数按照性别为:

表1

`

性别

谋杀

13927

1457

抢劫

116741

12068

恶性攻击

"

328476

70938

偷盗

236495

29866

非法侵占

704565

351580

偷盗机动车

119175

#

18058

纵火

11413

2156

从这些罪行的组合看来,是否与性别无关如果只考虑谋杀与抢劫罪,结论是否一样(20分)

解:

本题适合用独立性卡方检验。

建立假设组H0:

犯罪类型与性别无关

H1:

犯罪类型与性别有关

r=7,c=2.自由度df=(7-1)(2-1)=6

a=,查表得X2,6)=

<

Eij=ni.。

n

计算结果见下表:

 

男(Qi1)

女(Qi2)

合计

Ei1

Ei2

(Qij-Eij)^2/Eij

~

 

谋杀

13927

1457

15384

$

抢劫

116741

12068

128809

;

恶性攻击

328476

70938

399414

303146

偷盗

236495

29866

266361

非法侵占

704565

%

351580

1056145

偷盗机动车

119175

18058

137233

纵火

11413

2156

13569

X^2=

合计

1530792

486123

2016915

 

 

由于X2=>X2,6)=,所以拒绝零假设,说明罪行与性别有关。

如果只考虑谋杀与抢劫,则

 

男(Qi1)

女(Qi2)

合计

Ei1

Ei2

(Qij-Eij)^2/Eij

 

谋杀

13927

1457

15384

抢劫

116741

12068

128809

116727

X^2=

合计

130668

13525

144193

 

 

由于X2=

(20分)

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 外语学习 > 日语学习

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1