大学统计学第七章练习题及答案.docx
《大学统计学第七章练习题及答案.docx》由会员分享,可在线阅读,更多相关《大学统计学第七章练习题及答案.docx(20页珍藏版)》请在冰豆网上搜索。
大学统计学第七章练习题及答案
第7章参数估计
练习题
(1)样本均值的抽样标准差x等于多少?
(2)
在95%的置信水平下,边际误差是多少?
49名顾客
7.2某快餐店想要估计每位顾客午餐的平均花费金额,在为期3周的时间里选取
组成了一个简单随机样本。
(1)假定总体标准差为15元,求样本均值的抽样标准误差;
(2)在95%的置信水平下,求边际误差;
(3)如果样本均值为120元,求总体均值的95%的置信区间。
解.已知.根据查表得z/2=1.96
(2)•已知z/2=1.96
所以边际误差
1.96*-4^=4.2
.49
X104560,假定总体标准差
(3)置信区间:
XZS120151.96115.8,124.2
2Tn;49
7.3从一个总体中随机抽取
n100的随机样本,得到
85414,构建总体均值的95%的置信区间。
Z1.96
2
XZ2...n
104560
16741.144
87818.856
XZ2.,n
104560
16741.144
121301.144
置信区间:
(87818.856,
121301.144
(1)构建的90%的置信区间。
(2)构建的95%的置信区间。
(3)构建的99%的置信区间。
解;由题意知n
100,X81,s
12.
(1)置信水平为
1
90%,
则Z
~2
1.645.
S
12
由公式X
z
~2
~T81
一n
1.645
811974
100
即811.97479.026,82.974,
则的90%的置信区间为79.026~82.974
即812.352=(78.64883.352),
则的95%的置信区间为78.648~83.352
即813.1
则的99%的置信区间为
7.5禾U用下面的信息,构建总体均值的置信区间。
(1)x
25,
3.5,n60,
置信水平为95%。
(2)x
119.6,
s23.89,n
75,置信水平为98%。
(3)x
3.419,
s0.974,n
32,置信水平为90%。
⑴X
25,
3.5,n
60,置信水平为
95%
解:
Z1.96,
~2
2-n
1.96
3.50.89
.60
置信下限:
:
X
Z250.8924.11
2■■-n
置信上限:
:
X
Z一250.8925.89
2-n
置信区间为(24.11,25.89)
⑵X119.6,s23.89,n75,置信水平为98%
解:
Z2.33
2
s
23.89
6.43
Z2.33
2n
75
置信下限:
X
119.66.43113.17
置信上限:
119.66.43126.03
2■-n
置信区间为(113.17,26.03)
⑶x=3.419,s=0.974,n=32,置信水平为90%
所以该总体的置信区间为
0.283
即3.4190.283=(3.136,3.702)所以该总体的置信区间为3.136~3.702.
(1)
总体服从正态分布,且已知
500,n
15,x8900,置信水平为95%
(2)
总体不服从正态分布,
且已知
500,n
35
x8900,置信水平为95%
(3)
总体不服从正态分布,
未知,
n35,
x
8900,s500,置信水平为
90%。
(4)
总体不服从正态分布,
未知,
n35,
x
8900,s500,置信水平为
99%。
7.6禾U用下面的信息,构建总体均值
的置信区间。
O
O
(3)解:
已知n35,x8900,s=500,由于总体方差未知,但为大样本,
可用样本方差来代替总体方差
•••置信水平1—=90%•••z1.645
2
所以总体均值的置信区间为(8761,9039)
(4)解:
已知n35,x8900,s500,由于总体方差未知,但为大样
本,可用样本方差来代替总体方差
置信水平1—a=99%•z2.58
2
•置信区间为X
s500
z89002.58(8682,9118)
2.n.35
所以总体均值的置信区间为(8682,9118)
7.7某大学为了解学生每天上网的时间,在全校7500名学生中采取不重复抽样方法随机抽
取36人,调查他们每天上网的时间,得到的数据见Book7.7(单位:
h)。
求该校大学生
平均上网时间的置信区间,置信水平分别为90%、95%和99%。
解:
已知:
X3.3167s1.6093n=36
1•当置信水平为90%时,z1.645,
2
所以置信区间为(2.88,3.76)2•当置信水平为95%时,z1.96,
2
所以置信区间为(2.80,3.84)3.当置信水平为99%时,z2.58,
2
所以置信区间为(2.63,4.01)
7.8从一个正态总体中随机抽取样本量为8的样本,各样本值见Book7.8。
求总体均值95%
0.05,t0.05(81)2.365
的置信区间。
已知:
总体服从正态分布,但未知,n=8为小样本,
根据样本数据计算得:
x10,s3.46
7.9某居民小区为研究职工上班从家里到单位的距离,抽取了由16个人组成的一个随机样
本,他们到单位的距离(单位:
km)数据见Book7.9。
求职工上班从家里到单位平均距
离95%的置信区间。
=0.05,以5/2(161)2.131
已知:
总体服从正态分布,但未知,n=16为小样本,
根据样本数据计算可得:
X9.375,s=4.113
从家里到单位平均距离得95%的置信区间为:
s
xt/2-
Jn
4113
9.3752.1319.3752.191
V14
即(7.18,11.57)。
7.10从一批零件中随机抽取36个,测得其平均长度为149.5cm,标准差为1.93cm。
(1)试确定该种零件平均长度95%的置信区间。
(2)在上面的估计中,你使用了统计中的哪一个重要定理?
请简要解释这一定理。
解:
已知103,n=36,X=149.5,置信水平为1-=95%,查标准正态分布表得
/2=1.96.
根据公式得:
103
x
/2=149.51.96
JnV36
即149.51.96——=(148.9,150.1)
136
答:
该零件平均长度95%的置信区间为148.9~150.1
(3)在上面的估计中,你使用了统计中的哪一个重要定理?
请简要解释这一定理。
答:
中心极限定理论证。
如果总体变量存在有限的平均数和方差,那么,不论这
个总体的分布如何,随着样本容量的增加,样本均值的分布便趋近正态分布。
在现实生活中,
一个随机变量服从正态分布未必很多,但是多个随即变量和的分布趋于正态分布则是普遍存
在的。
样本均值也是一种随机变量和的分布,因此在样本容量充分大的条件下,样本均值也
趋近正态分布,这位抽样误差的概率估计理论提供了理论基础。
7.11某企业生产的袋装食品采用自动打包机包装,每袋标准重量为100g。
现从某天生产的
一批产品中按重复抽样随机抽取50包进行检查,测得每包重量(单位:
g)见Book7.11。
已知食品重量服从正态分布,要求:
(1)确定该种食品平均重量的95%的置信区间。
(2)如果规定食品重量低于100g属于不合格,确定该批食品合格率的95%的置信区
间。
(1)已知:
总体服从正态分布,但未知。
n=50为大样本。
=0.05,0.05/2=1.96
根据样本计算可知=101.32s=1.63
该种食品平均重量的95%的置信区间为
—/2S/Vn101.321.96*1.63/J50101.320.45
即(100.87,101.77)
(2)由样本数据可知,样本合格率:
p45/500.9。
该批食品合格率的95%的置信区
间为:
17(1__p),cc|o.9(10.9)
p/2=0.91.96:
=0.90.08,即(0.82,0.98)
VnV50
答:
该批食品合格率的95%的置信区间为:
(0.82,0.98)
7.12假设总体服从正态分布,利用Book7.12的数据构建总体均值的99%的置信区间。
根据样本数据计算的样本均值和标准差如下;
—
0.8706
x=16.13
=0.8706E=Z——=2.58*=0.45
"2Jn5
置信区间为xE所以置信区间为(15.68,16.58)
18
7.13一家研究机构想估计在网络公司工作的员工每周加班的平均时间,为此随机抽取了
名员工,得到他们每周加班的时间数据见Book7.13(单位:
h)。
假定员工每周加班的时
间服从正态分布,估计网络公司员工平均每周加班时间的90%的置信区间。
解:
已知X=13.567.800.1n=18
E=*.n
2
置信区间=[x-n,X+.n]
■2/2
所以置信区间=[13.56-1.645*(7.80/.18),13.56+1.645*(7.80/..18)]
=[10.36,16.76]
7.14禾U用下面的样本数据构建总体比例的置信区间。
(1)
n
44,p
0.51,置信水平为
99%。
(2)
n
300,p
0.82,置信水平为
95%。
(3)
n
1150,p
0.48,置信水平为90%。
(1)
n
44,p
0.51,置信水平为
99%。
解:
由题意,已知n=44,置信水平a=99%,Za/2=2.58
又检验统计量为:
Pz•.p(1P),故代入数值计算得,
Vn
Pzj—=(0.316,0.704),总体比例的置信区间为(0.316,0.704)
解:
由题意,已知n=300,置信水平a=95%,Za/2=1.96
又检验统计量为:
PZ、P(1p),故代入数值计算得,
丫n
(3)n1150,p0.48,置信水平为90%。
解:
由题意,已知n=1150,置信水平a=90%,Za/2=1.645
又检验统计量为:
PZ、p(1—P),故代入数值计算得,
Pzj—=(0.456,0.504),总体比例的置信区间为(0.456,0.504)
¥n
(1)当置信水平为1-=90%时,Z/2=1.645
所以p
fp(1P)"心1'0.23(10.23)
z/20.231.645.=0.230.04895
:
n,200
即0.23
0.04895=(0.1811,0.2789),
(2)当置信水平为1-=95%时,Z/2=1.96
0.231.96.O'23(1°.23)=0.230.05832
V200
即0.230.05832=(0.1717,0.28835);
答:
在居民户中拥有该品牌电视机的家庭在置信水平为90%的置信区间为
(18.11%,27.89%),在置信水平为95%的置信区间为(17.17%,28.835%)
7.16一位银行的管理人员想估计每位顾客在该银行的月平均存款额。
他假设所有顾客月存
款额的标准差为1000元,要求估计误差在200元以内,应选取多大的样本?
解:
已知1OOO,E=1000,199%,z/22.58
7.17要估计总体比例
答:
置信水平为99%,应取167个样本。
(1)
E
0.02,
0.40,
置信水平为
96%。
(2)
E
0.04,
未知,置信水平为95%。
(3)
E
0.05,
0.55,
置信水平为
90%。
(1)
解:
已知E
0.02,
0.40,,
/2=2.05
由
n
2
/2
(1)/
2得
,计算下列个体所需的样本容量。
22
n2.050.40(10.4)0.02=2522
答:
个体所需的样本容量为2522。
(2)解:
已知E
0.04,
/2=1.96
由
n
/22(1
)/2得
n
1.962
0.520.04
2601
答:
个体所需的样本容量为601。
(3)解:
已知0.05,0.55,/2=1.645
由n/22
(1)/2得
n1.64520.550.450.052=268
答:
个体所需的样本容量为268。
7.18某居民小区共有居民500户,小区管理者准备采取一向新的供水设施,想了解居民是否赞成。
采取重复抽样方法随机抽取了50户,其中有32户赞成,18户反对。
(1)求总体中赞成该项改革的户数比例的置信区间,置信水平为95%。
(2)如果小区管理者预计赞成的比例能达到80%,应抽取多少户进行调查?
(1)已知:
n=50Z1.96
根据抽样结果计算的样本比例为P=32/50=60%
根据(7.8)式得:
P、吓64%1.96(更尸
即64%12.63%(51.37%,76.63%)
答:
置信区间为(51.37%,76.63%)
(2)已知80%
10%Z1.96
2
则有:
n
2
Z.*
(1)
2
2
1.962*0.8(10.8)
0.1
62
答:
应抽取62户进行调查
的90%的置信区间。
(1)x
21,
s
2,n
50。
(2)x
1.3,
s
0.02,
n15<
(3)x
167,
s
31,
n22。
解:
已知1
90%,
10%-
2
1)
查表知
2(n
1)
67,
12(n
2
2
由公式
(n1)
2
s2
2
(n1)s
2
~2
1-
2
得
(501)*
22
(50
2
1)*22
\67
34
2)
查表知
2(n
1)
23.6848,
7.19根据下面的样本结果,计算总体标准差
2
解得(1.72,2.40)
2
0.05,1
-0.95
2
1)34
2(n
2
1)6.57063
由公式
(n1)s2
(n
1)s2
2
1-
2
得(151)*0.022寸丫23.6848
(151)*0.022
6.57063
解得(0.0150.029)
2z八
3)查表知(n1)
32.6705,
2(n
1)11.5913
2(n1)s2
2
2
由公式(n1s
~2
得(221)*312
寸”32.6705
(221)*312
11.5913
,解得(24.85,41.73)
7.20顾客到银行办理业务时往往需要等待一些时间,而等待时间的长短与许多因素有关,
比如,银行的业务员办理业务的速度,顾客等待排队的方式等等。
为此,某银行准备采
取两种排队方式进行试验,第一种排队方式是所有顾客都进入一个等待队列;第二种排
队方式是:
顾客在三个业务窗口处列队三排等待。
为比较哪种排队方式使顾客等待的时
间更短,银行各随机抽取了10名顾客,他们在办理业务时所等待的时间(单位:
min)
见Book7.20。
(1)构建第一种排队方式等待时间标准差的95%的置信区间。
(2)构建第二种排队方式等待时间标准差的95%的置信区间。
(3)根据
(1)和
(2)的结果,你认为哪种排队方式更好?
7.21从两个正态总体中分别抽取两个独立的随机样本,它们的均值和标准差如下表:
来自总体
1的样本
来自总体
2的样本
14
门2
7
X1
53.2
X2
43.4
2
S1
96.8
2
S2
102.0
(1)
求1
2的90%的置信区间。
(2)
求1
2的95%的置信区间。
(3)
求1
2的99%的置信区间。
7.22从两个正态总体中分别抽取两个独立的随机样本,它们的均值和标准差如下表:
来自总体1的样本
来自总体2的样本
x125
X223
S216
s;20
(1)设mn2100,求1
295%的置信区间。
(2)
设m
n210
2
,1
2,求1
2的95%的置信区间。
(3)
设n,
n210
2
,1
2,求1
2的95%的置信区间。
(4)
设m
10,n2
20
22
12,求
12的95%的置信区间。
(5)
设n1
10,n2
20,
22,
12,求
12的95%的置信区间。
7.23Book7.23是由4对观察值组成的随机样本。
(1)计算A与B各对观察值之差,再利用得出的差值计算d和sd。
(2)设!
和2分别为总体A和总体B的均值,构造di2的95%的置信区间。
7.24一家人才测评机构对随机抽取的10名小企业的经理人用两种方法进行自信心测试,得
到的自信心测试分数见Book7.24。
构建两种方法平均自信心得分之差d12的
95%的置信区间。
7.25从两个总体中各抽取一个n1n2250的独立随机样本,来自总体1的样本比例为
P1
40%,
来自总体2的样本比例为P230%
(1)
构造
12的90%的置信区间。
(2)
构造
12的95%的置信区间。
7.26生产工序的方差是工序质量的一个重要度量。
当方差较大时,需要对工序进行改进以
减小方差。
两部机器生产的袋茶重量(单位:
g)的数据见Book7.26。
构造两个总体方
差比2/;的95%的置信区间。
2%。
如果要求95%的置信区间,若要求
7.27根据以往的生产数据,某种产品的废品率为边际误差不超过4%,应抽取多大的样本?
P(1P)
2P(1P)
n=
p(1p)1.9620.020.98
答:
所以应取样本数48。
7.28某超市想要估计每个顾客平均每次购物花费的金额。
根据过去的经验,标准差大约为120元,现要求以95%的置信水平估计每个购物金额的置信区间,并要求边际误差不超过20元,应抽取多少个顾客作为样本?
解:
已知120,E20,当a0.05时,z0.05/21.96。
应抽取的样本量为:
2222
n(z/2)2佔6;120139
E20
7.29假定两个总体的标准差分别为112,215,若要求误差范围不超过5,相应的
置信水平为95%,假定mn2,估计两个总体均值之差12时所需的样本量为多
大。
为12时所需的样本量为多大。