统计学第七章第八章课后题答案之欧阳理创编.docx
《统计学第七章第八章课后题答案之欧阳理创编.docx》由会员分享,可在线阅读,更多相关《统计学第七章第八章课后题答案之欧阳理创编.docx(17页珍藏版)》请在冰豆网上搜索。
统计学第七章第八章课后题答案之欧阳理创编
统计学复习笔记
第七章
时间:
2021.03.05
创作:
欧阳理
第八章参数估计
一、思考题
1.解释估计量和估计值
在参数估计中,用来估计总体参数的统计量称为估计量。
估计量也是随机变量。
如样本均值,样本比例、样本方差等。
根据一个具体的样本计算出来的估计量的数值称为估计值。
2.简述评价估计量好坏的标准
(1)无偏性:
是指估计量抽样分布的期望值等于被估计的总体参数。
(2)有效性:
是指估计量的方差尽可能小。
对同一总体参数的两个无偏估计量,有更小方差的估计量更有效。
(3)一致性:
是指随着样本量的增大,点估计量的值越来越接近被估总体的参数。
3.怎样理解置信区间
在区间估计中,由样本统计量所构造的总体参数的估计区间称为置信区间。
置信区间的论述是由区间和置信度两部分组成。
有些新闻媒体报道一些调查结果只给出百分比和误差(即置信区间),并不说明置信度,也不给出被调查的人数,这是不负责的表现。
因为降低置信度可以使置信区间变窄(显得“精确”),有误导读者之嫌。
在公布调查结果时给出被调查人数是负责任的表现。
这样则可以由此推算出置信度(由后面给出的公式),反之亦然。
4.解释95%的置信区间的含义是什么
置信区间95%仅仅描述用来构造该区间上下界的统计量(是随机的)覆盖总体参数的概率。
也就是说,无穷次重复抽样所得到的所有区间中有95%(的区间)包含参数。
不要认为由某一样本数据得到总体参数的某一个95%置信区间,就以为该区间以0.95的概率覆盖总体参数。
5.简述样本量与置信水平、总体方差、估计误差的关系。
1.估计总体均值时样本量n为
其中:
2.样本量n与置信水平1-α、总体方差、估计误差E之间的关系为
▪与置信水平成正比,在其他条件不变的情况下,置信水平越大,所需要的样本量越大;
▪与总体方差成正比,总体的差异越大,所要求的样本量也越大;
▪与与总体方差成正比,样本量与估计误差的平方成反比,即可以接受的估计误差的平方越大,所需的样本量越小。
二、练习题
1.从一个标准差为5的总体中采用重复抽样方法抽出一个样本量为40的样本,样本均值为25。
1)样本均值的抽样标准差等于多少?
2)在95%的置信水平下,估计误差是多少?
解:
1)已知σ=5,n=40,=25
∵
∴=5/√40≈0.79
2)已知
∵
∴估计误差E=1.96×5÷√40≈1.55
2.某快餐店想要估计每位顾客午餐的平均花费金额,在为期3周的时间里选取49名顾客组成了一个简单随机样本。
1)假定总体标准差为15元,求样本均值的抽样标准误差。
2)在95%的置信水平下,求估计误差。
3)如果样本均值为120元,求总体均值µ的95%的置信区间。
解:
1)已知σ=15,n=49
∵
∴=15÷√49=2.14
2)已知
∵
∴估计误差E=1.96×15÷√49≈4.2
3)已知=120
∵置信区间为±E
∴其置信区间=120±4.2
3.从一个总体中随机抽取n=100的随机样本,得到=104560,假定总体标准差σ=85414,试构建总体均值µ的95%的置信区间。
解:
已知n=100,=104560,σ=85414,1-a=95%,
由于是正态总体,且总体标准差已知。
总体均值m在1-a置信水平下的置信区间为
104560±1.96×85414÷√100
=104560±16741.144
4.从总体中抽取一个n=100的简单随机样本,得到=81,s=12。
要求:
1)构建µ的90%的置信区间。
2)构建µ的95%的置信区间。
3)构建µ的99%的置信区间。
解:
由于是正态总体,但总体标准差未知。
总体均值m在1-a置信水平下的置信区间公式为
81±×12÷√100=81±×1.2
1)1-a=90%,1.65
其置信区间为81±1.98
2)1-a=95%,
其置信区间为81±2.352
3)1-a=99%,2.58
其置信区间为81±3.096
5.利用下面的信息,构建总体均值的置信区间。
1)=25,σ=3.5,n=60,置信水平为95%
2)=119,s=23.89,n=75,置信水平为98%
3)=3.149,s=0.974,n=32,置信水平为90%
解:
∵
∴1)1-a=95%,
其置信区间为:
25±1.96×3.5÷√60
=25±0.885
2)1-a=98%,则a=0.02,a/2=0.01,1-a/2=0.99,查标准正态分布表,可知:
2.33
其置信区间为:
119±2.33×23.89÷√75
=119±6.345
3)1-a=90%,1.65
其置信区间为:
3.149±1.65×0.974÷√32
=3.149±0.284
6.利用下面的信息,构建总体均值µ的置信区间:
1)总体服从正态分布,且已知σ=500,n=15,=8900,置信水平为95%。
解:
N=15,为小样本正态分布,但σ已知。
则1-a=95%,。
其置信区间公式为
∴置信区间为:
8900±1.96×500÷√15=(8646.7,9153.2)
2)总体不服从正态分布,且已知σ=500,n=35,=8900,置信水平为95%。
解:
为大样本总体非正态分布,但σ已知。
则1-a=95%,。
其置信区间公式为
∴置信区间为:
8900±1.96×500÷√35=(8733.99066.1)
3)总体不服从正态分布,σ未知,n=35,=8900,s=500,置信水平为90%。
解:
为大样本总体非正态分布,且σ未知,1-a=90%,1.65。
其置信区间为:
8900±1.65×500÷√35=(87619039)
4)总体不服从正态分布,σ未知,n=35,=8900,s=500,置信水平为99%。
解:
为大样本总体非正态分布,且σ未知,1-a=99%,2.58。
其置信区间为:
8900±2.58×500÷√35=(8681.99118.1)
7.某大学为了解学生每天上网的时间,在全校7500名学生中采取重复抽样方法随机抽取36人,调查他们每天上网的时间,得到下面的数据(单位:
小时)(略)。
求该校大学生平均上网时间的置信区间,置信水平分别为90%
解:
先求样本均值:
=3.32
再求样本标准差:
置信区间公式:
8.从一个正态总体中随机抽取样本量为8的样本,各样本值分别为:
10,8,12,15,6,13,5,11。
求总体均值µ的95%置信区间。
解:
本题为一个小样本正态分布,σ未知。
先求样本均值:
=80÷8=10
再求样本标准差:
=√84/7=3.4641
于是,的置信水平为的置信区间是
,
已知,n=8,则,α/2=0.025,查自由度为n-1=7的分布表得临界值2.45
所以,置信区间为:
10±2.45×3.4641÷√7
9.某居民小区为研究职工上班从家里到单位的距离,抽取了由16个人组成的一个随机样本,他们到单位的距离分别是:
10,3,14,8,6,9,12,11,7,5,10,15,9,16,13,2。
假设总体服从正态分布,求职工上班从家里到单位平均距离的95%的置信区间。
解:
小样本正态分布,σ未知。
已知,n=16,,则,α/2=0.025,查自由度为n-1=15的分布表得临界值2.14
样本均值=150/16=9.375
再求样本标准差:
=√253.75/15≈4.11
于是,的置信水平为的置信区间是
,
9.375±2.14×4.11÷√16
10.从一批零件是随机抽取36个,测得其平均长度是149.5,标准差是1.93。
1)求确定该种零件平均长度的95%的置信区间。
2)在上面估计中,你使用了统计中的哪一个重要定理?
请解释。
解:
1)这是一个大样本分布。
已知N=36,=149.5,S=1.93,1-α=0.95,。
其置信区间为:
149.5±1.96×1.93÷√36
2)中心极限定理论证:
如果总体变量存在有限的平均数和方差,那么,不论这个总体的分布如何,随着样本容量的增加,样本均值的分布便趋近正态分布。
在现实生活中,一个随机变量服从正态分布未必很多,但是多个随机变量和的分布趋于正态分布则是普遍存在的。
样本均值也是一种随机变量和的分布,因此在样本容量充分大的条件下,样本均值也趋近于正态分布,这为抽样误差的概率估计理论提供了理论基础。
11.某企业生产的袋装食品采用自动打包机包装,每袋标准重量为100克,现从某天生产的一批产品中按重复抽样随机抽取50包进行检查,测得每包重量如下:
(略)
已知食品包重服从正态分布,要求:
1)确定该种食品平均重量的95%的置信区间。
2)如果规定食品重量低于100克属于不合格,确定该批食品合格率的95%的置信区间。
解:
1)本题为一个大样本正态分布,σ未知。
已知N=50,µ=100,1-α=0.95,。
①每组组中值分别为97、99、101、103、105,即此50包样本平均值=(97+99+101+103+105)/5=101
②样本标准差为:
=√{(97-101)²×2+(99-101)²×3+(101-101)²×34+(103-101)²×7+(105-101)²×4}÷(50-1)≈1.666
③其置信区间为:
101±1.96×1.666÷√50
2)∵不合格包数(<100克)为2+3=5包,5/50=10%(不合格率),即P=90%。
∴该批食品合格率的95%置信区间为:
=0.9±1.96×√(0.9×0.1)÷50=0.9±1.96×0.042
12.假设总体服从正态分布,利用下面的数据构建总体均值μ的99%的置信区间。
(略)
解:
样本均值
样本标准差:
尽管总体服从正态分布,但是样本n=25是小样本,且总体标准差未知,应该用T统计量估计。
1-α=0.99,则α=0.01,α/2=0.005,查自由度为n-1=24的分布表得临界值2.8
的置信水平为的置信区间是 ,
13.一家研究机构想估计在网络公司工作的员工每周加班的平均时间,为此随机抽取了18个员工,得到他们每周加班的时间数据如下(单位:
小时):
(略)
假定员工每周加班的时间服从正态分布,估计网络公司员工平均每周加班时间的90%的置信区间。
解:
①N=18<30,为小样本正态分布,σ未知。
②样本均值=244/18=13.56
样本标准差:
=
③1-α=90%,α=0.1,α/2=0.05,则查自由度为n-1=17的分布表得临界值1.74
④的置信水平为的置信区间是 ,
14.利用下面的样本数据构建总体比例丌的置信区间:
1)n=44,p=0.51,置信水平为99%
2)n=300,p=0.82,置信水平为95%
3)n=1150,p=0.48,置信水平为90%
解:
1)1-α=99%,α=0.01,α/2=0.005,1-α/2=0.995,查标准正态分布表,则2.58
2)1-a=95%,
3)1-a=90%,1.65
分别代入
15.在一项家电市场调查中,随机抽取了200个居民户,调查他们是否拥有某一品牌的电视机,其中拥有该品牌电视机的家庭占23%。
求总体比例的置信区间,置信水平分别为90%和95%。
解:
1)置信水平90%,