统计学第七章第八章课后题答案.docx
《统计学第七章第八章课后题答案.docx》由会员分享,可在线阅读,更多相关《统计学第七章第八章课后题答案.docx(24页珍藏版)》请在冰豆网上搜索。
统计学第七章第八章课后题答案
统计学复习笔记
第七章参数估计
一、考虑题
1.解释估计量和估计值
在参数估计中,用来估计总体参数的统计量称为估计量。
估计量也是随机变量。
如样本均值,样本比例、样本方差等。
根据一个详细的样本计算出来的估计量的数值称为估计值。
2.简述评价估计量好坏的标准
〔1〕无偏性:
是指估计量抽样分布的期望值等于被估计的总体参数。
〔2〕有效性:
是指估计量的方差尽可能小。
对同一总体参数的两个无偏估计量,有更小方差的估计量更有效。
〔3〕一致性:
是指随着样本量的增大,点估计量的值越来越接近被估总体的参数。
3.怎样理解置信区间
在区间估计中,由样本统计量所构造的总体参数的估计区间称为置信区间。
置信区间的阐述是由区间和置信度两局部组成。
有些新闻媒体报道一些调查结果只给出百分比和误差〔即置信区间〕,并不说明置信度,也不给出被调查的人数,这是不负责的表现。
因为降低置信度可以使置信区间变窄〔显得“准确〞〕,有误导读者之嫌。
在公布调查结果时给出被调查人数是负责任的表现。
这样那么可以由此推算出置信度〔由后面给出的公式〕,反之亦然。
4.解释95%的置信区间的含义是什么
置信区间95%仅仅描绘用来构造该区间上下界的统计量(是随机的)覆盖总体参数的概率。
也就是说,无穷次重复抽样所得到的所有区间中有95%〔的区间〕包含参数。
不要认为由某一样本数据得到总体参数的某一个95%置信区间,就以为该区间以0.95的概率覆盖总体参数。
5.简述样本量与置信程度、总体方差、估计误差的关系。
1.估计总体均值时样本量n为
2.样本量n与置信程度1-α、总体方差
、估计误差E之间的关系为
▪与置信程度成正比,在其他条件不变的情况下,置信程度越大,所需要的样本量越大;
▪与总体方差成正比,总体的差异越大,所要求的样本量也越大;
▪与与总体方差成正比,样本量与估计误差的平方成反比,即可以承受的估计误差的平方越大,所需的样本量越小。
二、练习题
1.从一个标准差为5的总体中采用重复抽样方法抽出一个样本量为40的样本,样本均值为25。
1)样本均值的抽样标准差
等于多少?
2)在95%的置信程度下,估计误差是多少?
解:
1〕σ=5,n=40,=25
∵
∴
=5/√40≈0.79
2〕
∵
∴估计误差E=1.96×5÷√40≈1.55
2.某快餐店想要估计每位顾客午餐的平均花费金额,在为期3周的时间里选取49名顾客组成了一个简单随机样本。
1)假定总体标准差为15元,求样本均值的抽样标准误差。
2)在95%的置信程度下,求估计误差。
3)假如样本均值为120元,求总体均值µ的95%的置信区间。
解:
1〕σ=15,n=49
∵
∴
=15÷√49=2.14
2〕
∵
∴估计误差E=1.96×15÷√49≈4.2
3〕=120
∵置信区间为±E
∴其置信区间=120±4.2
3.
从一个总体中随机抽取n=100的随机样本,得到=104560,假定总体标准差σ=85414,试构建总体均值µ的95%的置信区间。
解:
n=100,=104560,σ=85414,1-α=95%,
由于是正态总体,且总体标准差。
总体均值μ在1-α置信程度下的置信区间为
104560±1.96×85414÷√100
=104560±16741.144
4.
从总体中抽取一个n=100的简单随机样本,得到=81,s=12。
要求:
1)构建µ的90%的置信区间。
2)构建µ的95%的置信区间。
3)构建µ的99%的置信区间。
解:
由于是正态总体,但总体标准差未知。
总体均值μ在1-α置信程度下的置信区间公式为
81±
×12÷√100=81±
×1.2
1〕1-α=90%,
1.65
其置信区间为81±1.98
2〕1-α=95%,
其置信区间为81±2.352
3)1-α=99%,
2.58
其置信区间为81±3.096
5.利用下面的信息,构建总体均值的置信区间。
1)
=25,σ=3.5,n=60,置信程度为95%
2)
=119,s=23.89,n=75,置信程度为98%
3)
=3.149,s=0.974,n=32,置信程度为90%
解:
∵
∴1〕1-α=95%,
其置信区间为:
25±1.96×3.5÷√60
=25±0.885
2〕1-α=98%,那么α=0.02,α/2=0.01,1-α/2=0.99,查标准正态分布表,可知:
2.33
其置信区间为:
119±2.33×23.89÷√75
=119±6.345
3)1-α=90%,
1.65
其置信区间为:
3.149±1.65×0.974÷√32
=3.149±0.284
6.利用下面的信息,构建总体均值µ的置信区间:
1)
总体服从正态分布,且σ=500,n=15,=8900,置信程度为95%。
解:
N=15,为小样本正态分布,但σ。
那么1-α=95%,
。
其置信区间公式为
∴置信区间为:
8900±1.96×500÷√15=〔8646.7,9153.2〕
2)
总体不服从正态分布,且σ=500,n=35,=8900,置信程度为95%。
解:
为大样本总体非正态分布,但σ。
那么1-α=95%,
。
其置信区间公式为
∴置信区间为:
8900±1.96×500÷√35=〔8733.99066.1〕
3)
总体不服从正态分布,σ未知,n=35,=8900,s=500,置信程度为90%。
解:
为大样本总体非正态分布,且σ未知,1-α=90%,
1.65。
其置信区间为:
8900±1.65×500÷√35=〔87619039〕
4)
总体不服从正态分布,σ未知,n=35,=8900,s=500,置信程度为99%。
解:
为大样本总体非正态分布,且σ未知,1-α=99%,
2.58。
其置信区间为:
8900±2.58×500÷√35=〔8681.99118.1〕
7.某大学为理解学生每天上网的时间,在全校7500名学生中采取重复抽样方法随机抽取36人,调查他们每天上网的时间,得到下面的数据〔单位:
小时〕〔略〕。
求该校大学生平均上网时间的置信区间,置信程度分别为90%
解:
先求样本均值:
=3.32
再求样本标准差:
置信区间公式:
8.从一个正态总体中随机抽取样本量为8的样本,各样本值分别为:
10,8,12,15,6,13,5,11。
求总体均值µ的95%置信区间。
解:
此题为一个小样本正态分布,σ未知。
先求样本均值:
=80÷8=10
再求样本标准差:
=√84/7=3.4641
于是,
的置信程度为
的置信区间是
,n=8,那么
α/2=0.025,查自由度为n-1=7的
分布表得临界值
2.45
所以,置信区间为:
10±2.45×3.4641÷√7
9.某居民小区为研究职工上班从家里到单位的间隔,抽取了由16个人组成的一个随机样本,他们到单位的间隔分别是:
10,3,14,8,6,9,12,11,7,5,10,15,9,16,13,2。
假设总体服从正态分布,求职工上班从家里到单位平均间隔的95%的置信区间。
解:
小样本正态分布,σ未知。
,n=16,
,那么
α/2=0.025,查自由度为n-1=15的
分布表得临界值
2.14
样本均值
=150/16=9.375
再求样本标准差:
=√253.75/15≈4.11
于是,
的置信程度为
的置信区间是
9.375±2.14×4.11÷√16
10.从一批零件是随机抽取36个,测得其平均长度是149.5,标准差是1.93。
1)求确定该种零件平均长度的95%的置信区间。
2)在上面估计中,你使用了统计中的哪一个重要定理?
请解释。
解:
1〕这是一个大样本分布。
N=36,=149.5,S=1.93,1-α=0.95,
。
其置信区间为:
149.5±1.96×1.93÷√36
2〕中心极限定理论证:
假如总体变量存在有限的平均数和方差,那么,不管这个总体的分布如何,随着样本容量
的增加,样本均值的分布便趋近正态分布。
在现实生活中,一个随机变量服从正态分布未必很多,但是多个随机变量和的分布趋于正态分布那么是普遍存在的。
样本均值也是一种随机变量和的分布,因此在样本容量
充分大的条件下,样本均值也趋近于正态分布,这为抽样误差的概率估计理论提供了理论根底。
11.某企业消费的袋装食品采用自动打包机包装,每袋标准重量为100克,现从某天消费的一批产品中按重复抽样随机抽取50包进展检查,测得每包重量如下:
〔略〕
食品包重服从正态分布,要求:
1)确定该种食品平均重量的95%的置信区间。
2)假如规定食品重量低于100克属于不合格,确定该批食品合格率的95%的置信区间。
解:
1〕此题为一个大样本正态分布,σ未知。
N=50,µ=100,1-α=0.95,
。
①每组组中值分别为97、99、101、103、105,即此50包样本平均值
=〔97+99+101+103+105〕/5=101
②样本标准差为:
=√{〔97-101〕²×2+〔99-101〕²×3+〔101-101〕²×34+〔103-101〕²×7+〔105-101〕²×4}÷〔50-1〕≈1.666
③其置信区间为:
101±1.96×1.666÷√50
2〕∵不合格包数〔<100克〕为2+3=5包,5/50=10%〔不合格率〕,即P=90%。
∴该批食品合格率的95%置信区间为:
=0.9±1.96×√(0.9×0.1)÷50=0.9±1.96×0.042
12.假设总体服从正态分布,利用下面的数据构建总体均值μ的99%的置信区间。
〔略〕
解:
样本均值
样本标准差:
尽管总体服从正态分布,但是样本n=25是小样本,且总体标准差未知,应该用T统计量估计。
1-α=0.99,那么α=0.01,α/2=0.005,查自由度为n-1=24的
分布表得临界值
2.8
的置信程度为
的置信区间是
13.一家研究机设想估计在网络公司工作的员工每周加班的平均时间,为此随机抽取了18个员工,得到他们每周加班的时间数据如下〔单位:
小时〕:
〔略〕
假定员工每周加班的时间服从正态分布,估计网络公司员工平均每周加班时间的90%的置信区间。
解:
①N=18<30,为小样本正态分布,σ未知。
②样本均值
=244/18=13.56
样本标准差:
=
③1-α=90%,α=0.1,α/2=0.05,那么查自由度为n-1=17的
分布表得临界值
1.74
④
的置信程度为
的置信区间是
14.利用下面的样本数据构建总体比例丌的置信区间:
1)n=44,p=0.51,置信程度为99%
2)n=300,p=0.82,置信程度为95%
3)n=1150,p=0.48,置信程度为90%
解:
1〕1-α=99%,α=0.01,α/2=0.005,1-α/2=0.995,查标准正态分布表,那么
2.58
2〕1-α=95%,
3〕1-α=90%,
1.65
分别代入
15.在一项家电市场调查中,随机抽取了200个居民户,调查他们是否拥有某一品牌的电视机,其中拥有该品牌电视机的家庭占23%。
求总体比例的置信区间,置信程度分别为90%和95%。
解:
1〕置信程度90%,1-α=90%,
1.65,N=200,P=23%。
代入
2〕置信程度95%,1-α=95%,
,N=200,P=23%。
代入
16.一位银行的管理人员想估计每位顾客在该银行的月平均存款额。
他假设所有顾客月存款额的标准差为1000元,要求的估计误差在200元以内,置信程度为99%。
应选取多大的样本?
解:
1-α=99%,那么
2.58。
E=200,σ=1000元。
那么N=〔
²×σ²〕÷E²=〔2.58²×1000²〕÷200²≈167
〔得数应该是166.41,不管小数后是多少,都向上进位取整,因此至少是167人〕
17.要估计总体比例丌,计算以下条件下所需的样本量。
1)E=0.02,丌=0.40,置信程度96%
2)E=0.04,丌未知,置信程度95%
3)E=0.05,丌=0.55,置信程度90%
解:
1〕1-α=96%,α/2=0.02,那么
2.06
N={
²×丌〔1-丌〕}÷E²=2.06²×0.4×0.6÷0.02²≈2547
2)1-α=95%,α/2=0.025,那么
1.96
丌未知,那么取使丌〔1-丌〕最大时的0.5。
N={
²×丌〔1-丌〕}÷E²=1.96²×0.5×0.5÷0.04²≈601
3〕置信程度90%,1-α=90%,
1.65,
N={
²×丌〔1-丌〕}÷E²=1.65²×0.55×0.45÷0.05²≈270
18.某居民小区共有居民500户,小区管理者准备采用一项新的供水设施,想理解居民是否赞成。
采取重复抽样方法随机抽取了50户,其中有32户赞同,18户反对。
1)求总体中赞成该项改革的户数比例的置信区间〔α=0.05〕
2)假如小区管理者预计赞成的比例能到达80%,估计误差不超过10%,应抽取多少户进展调查〔α=0.05〕
解:
1〕
N=50,P=32/50=0.64,α=0.05,α/2=0.025,那么
1.96
置信区间:
P±
√{P〔1-P〕/N}=0.64±1.96√0.64×0.36/50
=0.64±1.96×0.48/7.07=0.64±0.133
2〕丌=0.8,E=0.1,α=0.05,α/2=0.025,那么
1.96
N=
²丌(1-丌)/E²=1.96²×0.8×0.2÷0.1²≈62
19.根据下面的样本结果,计算总体标准差σ的90%的置信区间:
1〕
=21,S=2,N=50
2〕
=1.3,S=0.02,N=15
3〕
=167,S=31,N=22
解:
1〕大样本,σ未知,置信程度90%,1-α=90%,
1.65
21±1.65×2÷√50
2〕小样本,σ未知,置信程度90%,1-α=90%,那么查自由度为n-1=14的
分布表得临界值
1.761
=1.3±1.761×0.02÷√15
3)大样本,σ未知,置信程度90%,1-α=90%,
1.65
167±1.65×31÷√22
20.题目(略)
1)构建第一种排队方式等待时间标准差的95%的置信区间
2)构建第二种排队方式等待时间标准差的95%的置信区间
3)根据1)和2)的结果,你认为哪种排队方式更好?
解:
此题为小样本正态分布,σ未知,应用公式
置信程度95%,1-α=95%,那么查自由度为n-1=9的
分布表得临界值
2.31
1〕
=7.15,
=√2.045/9≈0.48
其置信区间为7.15±2.31×0.48÷√10
2)
=7.15
=√0/9=0
其置信区间为7.15±0
4)第二种排队方式更好.
〔19题是对总体方差的估计,应该用卡方统计量进展估计,20题是对两个总体参数的估计,这二种类型教师未讲,不是本次考试的内容,不能用Z统计量像估计总体均值和比例那样去估计,详细内容见书上P188――P194〕
第八章假设检验
一、考虑题
1.假设检验和参数估计有什么一样点和不同点?
解:
参数估计与假设检验是统计推断的两个组成局部。
一样点:
它们都是利用样本对总体进展某种推断。
不同点:
推断的角度不同。
参数估计讨论的是用样本统计量估计总体参数的方法,总体参数μ在估计前是未知的。
而在假设检验中,那么是先对μ的值提出一个假设,然后利用样本信息去检验这个假设是否成立。
2.什么是假设检验中的显著性程度?
统计显著是什么意思?
解:
显著性程度用α表示,在假设检验中,它的含义是当原假设正确时却被回绝的概率或风险,即假设检验中犯弃真错误的概率。
它是由人们根据检验的要求确定的。
〔我理解的统计学意义,统计显著是统计上专用的断定标准,指在一定的概率原那么下,可以成认一种趋势或者合理性到达的程度,到达为统计上程度显著,达不到为统计上程度不显著〕
3.什么是假设检验中的两类错误?
解:
弃真错误〔α错误〕:
当原假设为真时回绝原假设,所犯的错误成为第I类错误,又称为弃真错误。
犯第I类错误的概率常记作α。
取伪错误〔β错误〕:
当原假设为假时没有回绝原假设,所犯的错误称为第II类错误,又称取伪错误。
犯第II类错误概率常记作β。
发生第I类错误的概率也常被用于检验结论的可靠性度量。
假设检验中犯第I类错误的概率被称为显著性程度,记作α。
4.两类错误之间存在什么样的数量关系?
在样本容量n一定的情况下,假设检验不能同时做到犯α和β两类错误的概率都很小。
假设减小α错误,就会增大犯β错误的时机;假设减小β错误,也会增大犯α错误的时机。
要使α和β同时变小只有增大样本容量。
但样本容量增加要受人力、经费、时间等很多因素的限制,无限制增加样本容量就会使抽样调查失去意义。
因此假设检验需要慎重考虑对两类错误进展控制的问题。
5.解释假设检验中的P值。
解:
假如原假设为真,所得到的样本结果会像实际观测结果那么极端或更极端的概率,称为P值。
也称为观察到的显著性程度。
P值是反映实际观测到的数据与原假设H0之间不一致程度的一个概率值。
P值越小,说明实际观测到的数据与H0之间不一致程度就越大。
6.显著性程度与P值有何区别?
解:
α〔显著性程度〕是一个判断的标准〔当原假设为真,却被回绝的概率),而P是实际统计量对应分位点的概率值〔当原假设为真时,所得到的样本观察结果或更极端结果出现的概率〕。
可以通过α计算置信区间,然后与统计量进展比拟判断,也可以通过统计量计算对应的p值,然后与α值比拟判断。
7.假设检验根据的根本原理是什么?
解:
假设检验利用的是小概率原理,小概率原理是指发生概率很小的随机事件在一次试验中是几乎不可能发生的。
根据这一原理,可以先假设总体参数的某项取值为真,也就是假设其发生的可能性很大,然后抽取一个样本进展观察,假如样本信息显示出现了与事先假设相反的结果且与原假设差异很大,那么说明原来假定的小概率事件在一次实验中发生了,这是一个违犯小概率原理的不合理现象,因此有理由疑心和回绝原假设;否那么不能回绝原假设。
8.你认为在单侧检验中原假设和备择假设的方向应该如何确定?
解:
假设问题有两种情况,一种是所考察的数值越大越好〔左单侧检验或下限检验〕,临界值和回绝域均在左侧;另一种是数值越小越好〔右单侧检验或上限检验〕,临界值和回绝域均在右侧。
二、练习题
1.某炼铁厂的含碳量服从正态分布N〔4.55,0.108²〕,如今测定了9炉铁水,其平均含碳量为4.484。
假如估计方差没有变化,可否认为如今消费的铁程度均含碳量为4.55〔α=0.05〕?
解:
μ0=4.55,σ²=0.108²,N=9,
=4.484,
这里采用双侧检验,小样本,σ,使用Z统计。
假定如今消费的铁程度均含碳量与以前无显著差异。
那么,
H0:
μ=4.55;H1:
μ≠4.55
α=0.05,α/2=0.025,查表得临界值为
1.96
μ0
计算检验统计量:
=(4.484-4.55)/(0.108/√9)
=-1.833
决策:
∵Z值落入承受域,∴在α=0.05的显著性程度上承受H0。
结论:
有证据说明如今消费的铁程度均含碳量与以前没有显著差异,可以认为如今消费的铁程度均含碳量为4.55。
2.一种元件,要求其使用寿命不得低于700小时。
现从一批这种元件中随机抽取36件,测得其平均寿命为680小时。
该元件寿命服从正态分布,σ=60小时,试在显著性程度0.05下确定这批元件是否合格。
解:
N=36,σ=60,
=680,μ0=700
这里是大样本,σ,左侧检验,采用Z统计量计算。
提出假设:
假定使用寿命平均不低于700小时
H0:
μ≥700
H1:
μ<700
α=0.05,左检验临界值为负,查得临界值:
-Z0.05=-1.645
计算检验统计量:
=(680-700)/(60/√36)
=-2
决策:
∵Z值落入回绝域,∴在α=0.05的显著性程度上回绝H0,承受H1
结论:
有证据说明这批灯泡的使用寿命低于700小时,为不合格产品。
3.某地区小麦的一般消费程度为亩产250公斤,其标准差是30公斤。
现用一种化肥进展试验,从25个小区抽样,平均产量为270公斤。
这种化肥是否使小麦明显增产〔α=0.05〕?
解:
μ0=250,σ=30,N=25,
=270
这里是小样本分布,σ,用Z统计量。
右侧检验,α=0.05,那么Zα=1.645
提出假设:
假定这种化肥没使小麦明显增产。
即H0:
μ≤250
H1:
μ>250
计算统计量:
Z=〔
-μ0〕/〔σ/√N〕=〔270-250〕/〔30/√25〕=3.33
结论:
Z统计量落入回绝域,在α=0.05的显著性程度上,回绝H0,承受H1。
决策:
有证据说明,这种化肥可以使小麦明显增产。
4.糖厂用自动打包机打包,每包标准重量是100千克。
每天开工后需要检验一次打包机工作是否正常。
某日开工后测得9包重量〔单位:
千克〕如下:
〔略〕
包重服从正态分布,试检验该日打包机工作是否正常。
〔α=0.05〕
解:
N=9,这里是小样本正态分布,σ未知,双侧检验,采用t统计量,自由度为N-1=8。
α=0.05,那么Tα/2=2.37
=99.98
≈1.22
提出假设,假设打包机工作正常:
即H0:
μ=100
H1:
μ≠100
计算统计量:
=〔99.98-100〕/〔1.22/√9〕≈-0.049
结论:
∵t值落入承受域,∴在α=0.05的显著性程度上承受H0
决策:
有证据说明这天的打包机工作正常。
5.某种大量消费的袋装食品,按规定不得少于250克。
今从一批该食品中任意抽取50袋,发现有6袋低于250克。
假设规定不符合标准的比例超过5%就不得出厂,问该批食品能否出厂〔α=0.05〕?
解:
N=50,P=6/50=0.12,为大样本,右侧检验,用Z统计量计算。
α=0.05,即Zα=1.645
H0:
丌≤5%
H1:
丌>5%
=(0.12-0.05)/√(0.05×0.95÷50)≈2.26
〔因为没有找到丌表示的公式,这里用P0表示丌0〕
结论:
因为Z值落入回绝域,所以在α=0