统计学第七章第八章课后题答案Word文档格式.docx

资源描述

统计学第七章第八章课后题答案Word文档格式.docx

《统计学第七章第八章课后题答案Word文档格式.docx》由会员分享，可在线阅读，更多相关《统计学第七章第八章课后题答案Word文档格式.docx（14页珍藏版）》请在冰豆网上搜索。

统计学第七章第八章课后题答案Word文档格式.docx

2000。

（3）已知样本均值为=120元,置信水平1－=95％，得=1.96，

这时总体均值的置信区间为=120±

4.2=

可知,如果样本均值为120元，总体均值95%的置信区间为（115。

8，124.2）元。

3．从一个总体中随机抽取n=100的随机样本,得到=104560，假定总体标准差σ=85414,试构建总体均值µ

的95%的置信区间。

已知n=100,=104560，σ=85414，1—α＝95％，

由于是正态总体，且总体标准差已知。

总体均值μ在1—α置信水平下的置信区间为

104560±

1。

85414÷

√100

=104560±

16741.144

4．从总体中抽取一个n=100的简单随机样本，得到=81，s=12。

要求:

1）构建µ

的90％的置信区间.

2）构建µ

的95％的置信区间。

3）构建µ

的99％的置信区间。

由于是正态总体,但总体标准差未知。

总体均值μ在1-α置信水平下的置信区间公式为

81±

12÷

√100=81±

1。

1）1-α＝90%，1。

其置信区间为81±

1.98

2）1—α＝95%，

2.352

3）1-α＝99％，2。

3。

096

5．利用下面的信息，构建总体均值的置信区间。

1）=25,σ=3。

5，n=60，置信水平为95％

2）=119,s=23。

89，n=75，置信水平为98%

3）=3。

149,s=0.974，n=32，置信水平为90％

∵

∴1）1-α＝95%，

其置信区间为：

25±

3。

5÷

√60

=25±

0.885

2）1-α＝98%，则α=0.02,α/2=0。

01,1-α/2=0。

99,查标准正态分布表，可知：

2.33

其置信区间为:

119±

2.33×

23.89÷

√75

=119±

6.345

3）1—α＝90％,1。

149±

1.65×

0.974÷

√32

=3.149±

0.284

6．利用下面的信息，构建总体均值µ

的置信区间：

1）总体服从正态分布，且已知σ=500，n=15，=8900，置信水平为95％.

N=15，为小样本正态分布，但σ已知.则1-α＝95％，。

其置信区间公式为

∴置信区间为：

8900±

1.96×

500÷

√15=（8646.7，9153。

2）

2）总体不服从正态分布,且已知σ=500，n=35，=8900,置信水平为95%。

为大样本总体非正态分布,但σ已知.则1-α＝95%，.其置信区间公式为

√35=（8733.99066.1）

3）总体不服从正态分布，σ未知，n=35，=8900,s=500,置信水平为90%。

解:

为大样本总体非正态分布，且σ未知，1—α＝90％，1。

65。

8900±

√35=（87619039）

4）总体不服从正态分布，σ未知，n=35,=8900，s=500，置信水平为99％。

为大样本总体非正态分布,且σ未知，1-α＝99％，2.58。

其置信区间为：

2.58×

√35=（8681.99118.1）

7。

某大学为了解学生每天上网的时间，在全校7500名学生中采取不重复抽样方法随机抽取36人，调查他们每天上网的时间,得到下面的数据（单位：

小时）:

3.1

6.2

5.8

2.3

4.1

5。

4.5

4.4

2.0

2.6

6。

3.5

2。

1.9

1.2

5.1

4.3

4.2

0.8

1.5

4.7

0.5

求该校大学生平均上网时间的置信区间，置信水平分别为90%、95％和99％。

8.从一个正态总体中随机抽取样本量为8的样本，各样本值分别为：

10，8，12，15，6,13,5,11.求总体均值µ

的95%置信区间。

本题为一个小样本正态分布,σ未知。

先求样本均值：

=80÷

8=10

再求样本标准差：

=√84/7=3.4641

于是，的置信水平为的置信区间是

，

已知，n=8，则,α/2=0。

025，查自由度为n-1=7的分布表得临界值2。

所以，置信区间为：

10±

45×

3.4641÷

√7

9。

某居民小区为研究职工上班从家里到单位的距离，抽取了由16个人组成的一个随机样本，他们到单位的距离分别是：

10，3,14，8,6，9，12,11,7，5，10，15，9，16,13，2.假设总体服从正态分布，求职工上班从家里到单位平均距离的95%的置信区间.

10。

从一批零件是随机抽取36个，测得其平均长度是149。

5，标准差是1。

93。

2）求确定该种零件平均长度的95%的置信区间。

3）在上面估计中,你使用了统计中的哪一个重要定理?

请解释.

1）这是一个大样本分布。

已知N=36，=149.5，S=1。

93,1—α=0。

95,.

149。

5±

1.93÷

√36

2）中心极限定理论证：

如果总体变量存在有限的平均数和方差，那么，不论这个总体的分布如何，随着样本容量的增加，样本均值的分布便趋近正态分布。

在现实生活中，一个随机变量服从正态分布未必很多，但是多个随机变量和的分布趋于正态分布则是普遍存在的。

样本均值也是一种随机变量和的分布,因此在样本容量充分大的条件下，样本均值也趋近于正态分布，这为抽样误差的概率估计理论提供了理论基础。

11。

某企业生产的袋装食品采用自动打包机包装,每袋标准重量为100克,现从某天生产的一批产品中按重复抽样随机抽取50包进行检查，测得每包重量如下:

（略）

已知食品包重服从正态分布,要求:

1）确定该种食品平均重量的95%的置信区间.

2）如果规定食品重量低于100克属于不合格，确定该批食品合格率的95％的置信区间。

12。

假设总体服从正态分布,利用下面的数据构建总体均值μ的99％的置信区间。

样本均值

样本标准差：

尽管总体服从正态分布，但是样本n=25是小样本，且总体标准差未知，应该用T统计量估计。

1—α=0。

99,则α=0.01,α/2=0.005，查自由度为n—1=24的分布表得临界值2.8

的置信水平为的置信区间是

13。

一家研究机构想估计在网络公司工作的员工每周加班的平均时间,为此随机抽取了18个员工。

得到他们每周加班的时间数据如下（单位：

小时）：

假定员工每周加班的时间服从正态分布。

估计网络公司员工平均每周加班时间的90％的置信区间。

小样本，总体方差未知，用t统计量

均值=13。

56，样本标准差s=7。

801

置信区间：

=0.90，n=18,==1.7369

==（10.36，16.75）

14.利用下面的样本数据构建总体比例丌的置信区间：

3）n=44,p=0.51，置信水平为99%

4）n=300，p=0。

82，置信水平为95%

5）n=1150,p=0.48，置信水平为90％

1）1-α=99％，α=0.01，α/2=0。

005，1—α/2=0.995，查标准正态分布表,则2。

2）1—α＝95%,

3）1—α＝90%,1.65

分别代入

15.在一项家电市场调查中，随机抽取了200个居民户,调查他们是否拥有某一品牌的电视机，其中拥有该品牌电视机的家庭占23%。

求总体比例的置信区间，置信水平分别为90％和95%.

已知样本容量n=200，为大样本，拥有该品牌电视机的家庭比率p=23％，

拥有该品牌电视机的家庭比率的抽样标准误差为

===2.98％

⑴双侧置信水平为90％时，通过2－1=0.90换算为单侧正态分布的置信水平=0.95，查单侧正态分布表得=1。

64，

此时的置信区间为=23%±

64×

98％=

可知，当置信水平为90%时，拥有该品牌电视机的家庭总体比率的置信区间为（18.11％，27。

89％）。

⑵双侧置信水平为95%时，得=1。

此时的置信区间为=23％±

2.98％=

可知，当置信水平为95%时，拥有该品牌电视机的家庭总体比率的置信区间为

；

（17.16%，28。

84％）。

16.一位银行的管理人员想估计每位顾客在该银行的月平均存款额。

他假设所有顾客月存款额的标准差为1000元，要求的估计误差在200元以内，置信水平为99%。

应选取多大的样本?

已知1-α=99％，则2。

58.E=200，σ=1000元。

则N=（²

σ²

）÷

E²

=（2。

58²

1000²

200²

≈167

（得数应该是166.41，不管小数后是多少，都向上进位取整，因此至少是167人）

17.要估计总体比例丌，计算下列条件下所需的样本量.

6）E=0.02，丌=0。

40，置信水平96％

7）E=0.04,丌未知，置信水平95％

8）E=0。

05,丌=0。

55，置信水平90%

1）已知1-α=96%，α/2=0.02，则2.06

N=｛²

丌（1—丌）｝÷

=2.06²

0.4×

0.6÷

0.02²

≈2547

2）已知1—α=95％，α/2=0。

025，则1。

丌未知，则取使丌（1—丌）最大时的0.5。

丌（1—丌）}÷

=1.96²

5×

0.5÷

04²

≈601

3）置信水平90%,1—α＝90％，1。

65，

N=｛²

丌（1-丌）｝÷

=1.65²

55×

45÷

05²

≈270

18。

某居民小区共有居民500户，小区管理者准备采用一项新的供水设施，想了解居民是否赞成。

采取重复抽样方法随机抽取了50户,其中有32户赞同，18户反对。

9）求总体中赞成该项改革的户数比例的置信区间（α=0.05）

10）如果小区管理者预计赞成的比例能达到80%，估计误差不超过10％，应抽取多少户进行调查（α=0.05）

（1）赞成比率的抽样标准误差为==6。

788%

由双侧正态分布的置信水平1－=95%，得=1。

96，

计算得此时总体户数中赞成该项改革的户数比率的置信区间为

=64%±

788％=

可知,置信水平为95％时,总体中赞成该项改革的户数比率的置信区间为（50。

70%，77。

30％）。

（2）如预计赞成的比率能达到80%，即p=80%，

由=6.788％,即=6。

788％

得样本容量为n==34.72取整为35,

即可得，如果小区管理者预计赞成的比率能达到80%，应抽取35户进行调查.

19根据下面的样本结果，计算总体标准差σ的90%的置信区间:

1）=21，S=2,N=50

2）=1.3，S=0。

02，N=15

3）=167，S=31,N=22

1）大样本,σ未知，置信水平90%，1-α＝90％,1。

21±

65×

2÷

√50

2）小样本，σ未知，置信水平90%，1—α＝90％，则查自由度为n—1=14的分布表得临界值1。

761

=1.3±

1.761×

0.02÷

√15

3）大样本,σ未知,置信水平90%,1—α＝90％，1.65

167±

31÷

√22

20顾客到银行办理业务时往往需要等待一段时间，而等待时间的长短与许多因素有关，比如,银行业务员办理业务的速度，顾客等待排队的方式等。

为此，某银行准备采取两种排队方式进行试验，第一种排队方式是：

所有顾客都进入一个等待队列；

第二种排队方式是：

顾客在三个业务窗口处列队三排等待.为比较哪种排队方式使顾客等待的时间更短，银行各随机抽取10名顾客，他们在办理业务时所等待的时间（单位:

分钟）如下:

方式1

7.3

7.4

方式2

4。

6.7

8.5

9.3

要求：

（1）构建第一种排队方式等待时间标准差的95％的置信区间。

估计统计量

经计算得样本标准差=3.318

=0。

95,n=10，==19。

02，==2。

==（0。

1075，0。

7574）

因此，标准差的置信区间为（0.3279,0.8703）

（2）构建第二种排队方式等待时间标准差的95％的置信区间.

经计算得样本标准差=0。

2272

置信区间:

95，n=10,==19.02,==2。

==（1.57，11。

06）

因此,标准差的置信区间为（1。

25，3.33）

（3）根据

（1）和

（2）的结果，你认为哪种排队方式更好？

第一种方式好，标准差小！

第八章假设检验

1．假设检验和参数估计有什么相同点和不同点？

参数估计与假设检验是统计推断的两个组成部分。

相同点:

它们都是利用样本对总体进行某种推断。

不同点：

推断的角度不同。

参数估计讨论的是用样本统计量估计总体参数的方法，总体参数μ在估计前是未知的。

而在假设检验中，则是先对μ的值提出一个假设，然后利用样本信息去检验这个假设是否成立.

2．什么是假设检验中的显著性水平？

统计显著是什么意思?

显著性水平用α表示，在假设检验中，它的含义是当原假设正确时却被拒绝的概率或风险,即假设检验中犯弃真错误的概率.它是由人们根据检验的要求确定的。

（我理解的统计学意义,统计显著是统计上专用的判定标准，指在一定的概率原则下，可以承认一种趋势或者合理性达到的程度,达到为统计上水平显著，达不到为统计上水平不显著）

3．什么是假设检验中的两类错误?

弃真错误（α错误）:

当原假设为真时拒绝原假设,所犯的错误成为第I类错误，又称为弃真错误。

犯第I类错误的概率常记作α。

取伪错误（β错误）：

当原假设为假时没有拒绝原假设，所犯的错误称为第II类错误,又称取伪错误。

犯第II类错误概率常记作β.

发生第I类错误的概率也常被用于检验结论的可靠性度量。

假设检验中犯第I类错误的概率被称为显著性水平,记作α.

4．两类错误之间存在什么样的数量关系?

在样本容量n一定的情况下，假设检验不能同时做到犯α和β两类错误的概率都很小。

若减小α错误，就会增大犯β错误的机会；

若减小β错误，也会增大犯α错误的机会。

要使α和β同时变小只有增大样本容量.但样本容量增加要受人力、经费、时间等很多因素的限制,无限制增加样本容量就会使抽样调查失去意义.因此假设检验需要慎重考虑对两类错误进行控制的问题。

5．解释假设检验中的P值。

如果原假设为真，所得到的样本结果会像实际观测结果那么极端或更极端的概率,称为P值。

也称为观察到的显著性水平。

P值是反映实际观测到的数据与原假设H0之间不一致程度的一个概率值。

P值越小，说明实际观测到的数据与H0之间不一致程度就越大。

6．显著性水平与P值有何区别？

α（显著性水平）是一个判断的标准（当原假设为真，却被拒绝的概率），而P是实际统计量对应分位点的概率值（当原假设为真时，所得到的样本观察结果或更极端结果出现的概率）。

可以通过α计算置信区间,然后与统计量进行比较判断，也可以通过统计量计算对应的p值，然后与α值比较判断。

7．假设检验依据的基本原理是什么？

假设检验利用的是小概率原理，小概率原理是指发生概率很小的随机事件在一次试验中是几乎不可能发生的。

根据这一原理,可以先假设总体参数的某项取值为真，也就是假设其发生的可能性很大，然后抽取一个样本进行观察，如果样本信息显示出现了与事先假设相反的结果且与原假设差别很大，则说明原来假定的小概率事件在一次实验中发生了,这是一个违背小概率原理的不合理现象，因此有理由怀疑和拒绝原假设；

否则不能拒绝原假设。

8．你认为在单侧检验中原假设和备择假设的方向应该如何确定？

假设问题有两种情况,一种是所考察的数值越大越好（左单侧检验或下限检验），临界值和拒绝域均在左侧；

另一种是数值越小越好（右单侧检验或上限检验），临界值和拒绝域均在右侧.

1．已知某炼铁厂的含碳量服从正态分布N（4。

55,0.108²

）,现在测定了9炉铁水，其平均含碳量为4。

484。

如果估计方差没有变化，可否认为现在生产的铁水平均含碳量为4。

55（α=0.05）？

已知μ0=4.55，σ²

=0.108²

N=9，=4。

484，

这里采用双侧检验，小样本,σ已知,使用Z统计。

假定现在生产的铁水平均含碳量与以前无显著差异.则,

H0:

μ=4。

55；

H1:

μ≠4。

α=0。

05，α/2=0。

025,查表得临界值为1.96

计算检验统计量：

=（4.484—4。

55）/（0.108/√9）

=—1.833

决策:

∵Z值落入接受域，∴在α=0.05的显著性水平上接受H0.

结论：

有证据表明现在生产的铁水平均含碳量与以前没有显著差异，可以认为现在生产的铁水平均含碳量为4.55。

2．一种元件,要求其使用寿命不得低于700小时。

现从一批这种元件中随机抽取36件，测得其平均寿命为680小时。

已知该元件寿命服从正态分布，σ=60小时，试在显著性水平0.05下确定这批元件是否合格。

已知N=36，σ=60，=680，μ0=700

这里是大样本，σ已知，左侧检验，采用Z统计量计算。

提出假设：

假定使用寿命平均不低于700小时

H0：

μ≥700

H1：

μ〈700

α=0。

05，左检验临界值为负，查得临界值：

—Z0。

05=-1.645

计算检验统计量：

=（680—700）/（60/√36）

=-2

决策：

∵Z值落入拒绝域，∴在α=0.05的显著性水平上拒绝H0,接受H1

结论：

有证据表明这批灯泡的使用寿命低于700小时，为不合格产品.

3．某地区小麦的一般生产水平为亩产250公斤，其标准差是30公斤。

现用一种化肥进行试验，从25个小区抽样，平均产量为270公斤。

这种化肥是否使小麦明显增产（α=0.05）？

已知μ0=250,σ=30,N=25,=270

这里是小样本分布，σ已知，用Z统计量。

右侧检验，α=0。

05，则Zα=1.645

提出假设：

假定这种化肥没使小麦明显增产。

即H0：

μ≤250

H1:

μ＞250

计算统计量：

Z=（-μ0）/（σ/√N）=（270-250）/（30/√25）=3.33

Z统计量落入拒绝域，在α=0。

05的显著性水平上，拒绝H0，接受H1。

决策：

有证据表明，这种化肥可以使小麦明显增产。

4．糖厂用自动打包机打包,每包标准重量是100千克。

每天开工后需要检验一次打包机工作是否正常。

某日开工后测得9包重量（单位：

千克）如下：

已知包重服从正态分布,试检验该日打包机工作是否正常。

（α=0。

05）

已知N=9,这里是小样本正态分布，σ未知，双侧检验，采用t统计量，自由度为N-1=8.α=0。

05，则Tα/2=2。

=99。

≈1.22

提出假设，假设打包机工作正常：

即H0:

μ=100

H1：

μ≠100

=（99.98-100）/（1.22/√9）≈-0。

049

结论:

∵t值落入接受域，∴在α=0。

05的显著性水平上接受H0

有证据表明这天的打包机工作正常。

5．某种大量生产的袋装食品,按规定不得少于250克。

今从一批该食品中任意抽取50袋，发现有6袋低于250克。

若规定不符合标准的比例超过5％就不得出厂，问该批食品能否出厂（α=0.05）?

6．某厂家在广告中声称，该厂生产的汽车轮胎在正常行驶条件下超过目前的平均水平25000公里。

对一个由15个轮胎组成的随机样本做了试验，得到样本均值和标准差分别为27000

展开阅读全文