统计学第五版课后答案Word下载.docx
《统计学第五版课后答案Word下载.docx》由会员分享,可在线阅读,更多相关《统计学第五版课后答案Word下载.docx(22页珍藏版)》请在冰豆网上搜索。
12.0
4
16.0
7
28.0
9
36.0
40.0
12
48.0
60.0
68.0
72.0
76.0
80.0
84.0
88.0
92.0
96.0
100.0
Total
从频数看出,众数Mo有两个:
19、23;
从累计频数看,中位数Me=23。
⑵根据定义公式计算四分位数。
Q1位置=25/4=6.25,因此Q仁19,Q3位置=3X25/4=18.75,因此Q3=27,或者,由于25
和27都只有一个,因此Q3也可等于25+0.75X2=26.5。
(3)计算平均数和标准差;
Mean=24.00;
Std.Deviation=6.652
(4)计算偏态系数和峰态系数:
Skewness=1.080Kurtosis=0.773
(5)对网民年龄的分布特征进行综合分析:
分布,均值=24、标准差=6.652、呈右偏分布。
如需看清楚分布形态,需要进行分组。
为分组情况下的直方图:
3.0
tnuoc
1111Q■1■■111■■■IIir
1516171819202122232425272930313438
I
2-
为分组情况下的概率密度曲线:
15161718
1920
21222324
2527293031
343841
分组:
1、确定组数:
才1g^
ig
(2)
.Ig25二1.1.398
Ig20.30103
二5.64,取k=6
2、确定组距:
组距=(最大值-最小值)-组数=(41-15)-6=4.3,取5
3、分组频数表
网络用户的年龄(Binned)
<
=15
16-20
8
32.0
21-25
26-30
31-35
36-40
41+
分组后的均值与方差:
23.3000
7.02377
Variance
49.333
Skewness
1.163
Kurtosis
1.302
分组后的直方图:
Mean=23.30
Std.Dev.=7.024
N=25
4.6在某地区抽取120家企业,按利润额进行分组,结果如下:
按利润额分组(万元)
企业数(个)
200~300
300~400
400~500
42
500~600
600以上
11
合计
120
(1)计算120家企业利润额的平均数和标准差。
(2)计算分布的偏态系数和峰态系数。
解:
企业利润组中值
Mi(万元)
426.6667
116.48445
0.208
Std.ErrorofSkewness
0.221
-0.625
Std.ErrorofKurtosis
0.438
Mean=426.67
Std.Dev.=116.484
N=120
Casesweightedby企业个数
4.9一家公司在招收职员时,首先要通过两项能力测试。
在A项测试中,其平均分数是100分,标准差是15分;
在B项测试中,
其平均分数是400分,标准差是50分。
一位应试者在A项测试中得了115分,在B项测试中得了425分。
与平均分数相比,该应
试者哪一项测试更为理想?
应用标准分数来考虑问题,该应试者标准分数高的测试理想。
x-x115-100x-x425-400
Za===1;
Zb===0.5因此,A项测试结果理想。
s15s50
4.11对10名成年人和10名幼儿的身高进行抽样调查,结果如下:
成年组
166169172177180170172174168173
幼儿组
68696870717372737475
(1)如果比较成年组和幼儿组的身高差异,你会采用什么样的统计量?
为什么?
均值不相等,用离散系数衡量身高差异。
(2)比较分析哪一组的身高差异大?
平均
172.1
71.3
标准差
4.20佃51
2.496664
离散系数
0.024415
0.035016
幼儿组的身高差异大。
7.3从一个总体中随机抽取n=100的随机样本,得到x=104560,假定总体标准差b=86414,构建总体均值瓦的95%的置信区间。
已知n=100,x=104560,卢85414,1-:
■=95%
由于是正态总体,且总体标准差已知。
总体均值」在1<置信水平下的置信区间为
104560±
1.96X85414-V100=104560±
16741.144
==1.2
7.4从总体中抽取一个n=100的简单随机样本,得到x=81,s=12o
样本均值服从正态分布:
讥n或xlNi.g'
'
置信区间为:
「n丿I’n丿
(1)构建岂的90%的置信区间。
ZG2=z),05=1.645,置信区间为:
(81-1.645X1.2,81+1.645X1.2)=(79.03,82.97)
⑵构建「的95%的置信区间。
Z住2=Zj.025=1.96,置信区间为:
(81-1.96X1.2,81+1.96X1.2)=(78.65,83.35)
(3)构建」的99%的置信区间。
Z(y2=Z0.005=2.576,置信区间为:
(81-2.576X1.2,81+2.576X1.2)=(77.91,84.09)
7.5利用下面的信息,构建总体均值的置信区间
(1)x=25,b=3.5,n=60,置信水平为95%
(2)x=119.6,s=23.89,n=75,置信水平为95%
(3)x=3.419,s=0.974,n=32,置信水平为90%
衣土』曲竿或未知)解:
T'
/•1)1-:
.=95%,-J一'
-'
其置信区间为:
25±
1.96X3.5-V60=25±
0.885
2)1-:
.=98%,_则:
=0.02,:
/2=0.01,1-:
./2=0.99,查标准正态分布表,可知:
2.33
其置信区间为:
119.6±
2.33X23.89-V75=119.6±
6.345
3)1-尸90%1.65其置信区间为:
3.149±
1.65X0.974-V32=3.149±
0.284
7.7某大学为了解学生每天上网的时间,在全校7500名学生中采取重复抽样方法随机抽取36人,调查他们每天上网的时间,得
到下面的数据
(2)抽样平均误差:
重复抽样:
匚=1.61/6=0.268
s=、一n
3.3
3.1
6.2
5.8
2.3
4.1
5.4
4.5
3.2
4.4
2.0
2.6
6.4
1.8
3.5
5.7
2.1
1.9
1.2
5.1
4.3
4.2
3.6
0.8
1.5
4.7
1.4
2.9
2.4
0.5
2.5
求该校大学生平均上网时间的置信区间,置信水平分别为95%
(1)样本均值X=3.32,样本标准差s=1.61;
=0.268X、一0.995=0.268X0.998=0.267
(3)置信水平下的概率度:
1-a=0.95,t=Z/=z0.025=1.96
(4)边际误差(极限误差):
也x=t<
Tx=Zy21-a=0.95,也x=t=Z0.02^yx
重复抽样:
=Zot2=Z0.025Qx=1.96X0.268=0.525
不重复抽样:
也x=乙2=Z0.025Qx=1.96X0.267=0.523
(5)置信区间:
1-:
-=0.95,
x—x,xx=3.32—0.525,3.320.525=(2.79,3.85)
x—x,xx=3.32—0.441,3.320.441=(2.80,3.84)
7.8从一个正态总体中随机抽取样本量为8的样本,各样本值分别为:
10、8、12、15、6、13、5、11.,求总体均值的95%的置
信区间
-工扎
先求样本均值:
本题为一个小样本正态分布,
狂一
=80-8=10
于是,
再求样本标准差:
V84/7=3.4641
卩的置信水平为1-a的置信区间是
已知1-a=25,n=8,_则a=0.05,a/2=0.025,查自由度为n-1=7的一分布表得临界值
ST
2.45
所以,置信区间为:
10±
2.45X3.4641-V7
7.11某企业生产的袋装食品采用自动打包机包装,每袋标准重量为l00g。
现从某天生产的一批产品中按重复抽样随机抽取50
包进行检查,测得
每包重量(g)
包数
96~98
98~100
100~102
102~104
104~106
合计
已知食品包重量服从正态分布,要求:
(1)确定该种食品平均重量的95%的置信区间。
解:
大样本,总体方差未知,用z统计量
二LW
、、n
置信区间:
S
.n
样本均值=101.4,样本标准差s=1.829
X乙2
1—肚=0.95,Z/2=Zo.025=4.96
”101.4—1.96疋1:
829,101.4+1.96父18291=(100.89,101.91)
VV50V50丿
(2)如果规定食品重量低于l00g属于不合格,确定该批食品合格率的95%的置信区间。
总体比率的估计大样本,总体方差未知,用z统计量
LN0,1
样本比率=(50-5)/50=0.9
f
P久2
PZ2
P(—P)
(
0.9—1.96
0.91-0.9
1—E=0.95,^2=Z0.025=12.96
=(0.8168,0.9832)
7.佃某小区共有居民500户,小区管理着准备采用一项新的供水设施,想了解居民是否赞成。
采取重复抽样方法随机抽取了50户,
其中有32户赞成,18户反对。
1)已知N=50,P=32/50=0.64,a=0.05,a12=0.025,则
1.96
P±
-<
V{P(1-P)/N}
=0.64±
1.96V0.64X0.36/50=0.64
±
1.96X0.48/7.07=0.64
0.133
2)已知丌=0.8,E=0.1,
a=0.05,
a/2=0.025
N=
=叼72丌(1-丌)/E2=1.962X0.8X0.2-0.12"
62
8.1已知某炼铁厂的含碳量服从正态分布N(4.55,0.1082),现在测定了9炉铁水,其平均含碳量为4.484,如果估计方差没有变化,
可否认为现在生产的铁水平均含碳量为4.55?
已知卩0=4.55,
a2=0.1082,
N=9,
=4.484
这里采用双侧检验,小样本,
a已知,使用Z统计。
假定现在生产的铁水平均含碳量与以前无显著差异。
则,
H0:
卩=4.55
H1
a=0.05,a/2=0.025
,查表得临界值为
计算检验统计量:
=(4.484-4.55)/(0.108/
V9)=-1.833
决策:
tZ值落入接受域,.••在:
=0.05的显著性水平上接受H0。
4.55
结论:
有证据表明现在生产的铁水平均含碳量与以前没有显著差异,可以认为现在生产的铁水平均含碳量为
8.2—种元件,要求其使用寿命不得低于700小时。
现从一批这种元件中随机抽取36件,测得其平均寿命为680小时。
已知该
元件寿命服从正态分布,:
二=60小时,试在显著性水平0.05下确定这批元件是否合格。
H0:
详700;
応700已知:
X=680c=60
由于n=36>
30,大样本,因此检验统计量:
680二700
6036
当a=0.05,查表得Z=1.645。
因为ZV-乙.,故拒绝原假设,接受备择假设,说明这批产品不合格。
8.3某地区小麦的一般生产水平为亩产250公斤,其标准差为30公斤,先用一种花费进行试验,从25个小区抽样,平均产量为270
公斤。
这种化肥是否使小麦明显增产?
已知g0=250,a=30,N=25,x=270这里是小样本分布,a已知,用Z统计量。
右侧检验,a=0.05,_则Z炸1.645
提出假设:
假定这种化肥没使小麦明显增产。
即H0:
g<
250H1:
g>
250
计算统计量:
Z=(X-g0)/(aVN)=(270-250)/(30/V25)=3.33
Z统计量落入拒绝域,在a=0.05的显著性水平上,拒绝H0,接受H1。
有证据表明,这种化肥可以使小麦明显增产。
10..1从3个总体中各抽取容量不同的样本数据,结果如下。
检验3个总体的均值之间是否有显著差异
方差分析:
单因素方差分析
SUMMARY
组
观测数
求和
方差
样本1
5
790
158
61.5
样本2
600
150
36.66667
样本3
507
169
121
方差分析
差异源
SSdfMS
P-valueFcrit
组间
组内
618.9167
598
2309.4583
966.44444
4.65740.0408778.021517
总计1216.91711
10.。
2下面是来自5个总体的样本数据
37
12.33333
4.333333
48
0.666667
样本
80
样本5
6
78
13
SS
df
MS
F
P-value
Fcrit
93.76812
23.44203
15.82337
1.02E-05
4.579036
26.66667
1.481481
总计
120.4348
10.3一家牛奶公司有4台机器装填牛奶,每桶的容量为4L。
下面是从4台机器中抽取的样本数据:
机器l
机器2
机器3
机器4
4.05
3.99
3.97
4.00
4.01
4.02
3.98
4.04
3.95
4.0l
取显著性水平a=0.01,检验4台机器的装填量是否相同?
不相同。
地区
人均GDP元)
人均消费水平(元)
ANOVA
平方和
均方
显著性
0.007
0.002
8.721
0.001
0.004
0.000
总数
0.011
每桶容量(L)
11.6下面是7个地区2000年的人均国内生产总值(GDP)和人均消费水平的统计数据:
地区人均GDP元)人均消费水平(元)
北京
22460
7326
辽宁
11226
4490
上海
34547
11546
江西
4851
2396
河南
5444
2208
贵州
2662
1608
陕西
4549
2035
要求:
⑴人均GDP作自变量,人均消费水平作因变量,绘制散点图,并说明二者之间的关系形态。
(2)计算两个变量之间的线性相关系数,说明两个变量之间的关系强度。
(3)利用最小二乘法求出估计的回归方程,并解释回归系数的实际意义。
(4)计算判定系数,并解释其意义。
(5)检验回归方程线性关系的显著性(a=0.05)。
(6)如果某地区的人均GDP为5000元,预测其人均消费水平。
⑺求人均GDP为5000元时,人均消费水平95%的置信区间和预测区间。
6000
4000
2000
人12000
消
费
水
平10000
元
)
8000
010000200003000040000
人均GDP(元)
(1)可能存在线性关系
(2)相关系数:
有很强的线性关系。
相关性
人均GDP(元)
Pearson相关性
.998(**)
显著性(双侧)
**.在.01水平(双侧)上显著相关。
(3)回归方程:
回归系数的含义:
人均GDP没增加1元,人均消费增加0.309元
系数(a)
模型
非标准化系数标准化系数
B标准误Beta
t
(常量)
人均GDP
(元)
734.693139.540
0.3090.0080.998
5.265
36.492
0.003
a.因变量:
(4)人均GDP对人均消费的影响达到99.6%
模型摘要
R
R方调整的R方估计的标准差
.998(a)
0.9960.996247.303
a.预测变量:
(常量),人均GDP(元)
(5)F检验:
ANOVA(b)
回归
81,444,968.680
1,331.692
.000(a)
残差
305,795.034
61,159.007
81,750,763.714
a.预测变量:
b.因变量:
回归系数的检验:
t检验
B
标准误
Beta
734.693
0.309
139.540
0.008
0.998
(6)某地区的人均GDP为5000元,预测其人均消费水平为2278.10657元。
(7)人均GDP为5000元时,人均消费水平95%的置信区间为[1990.74915,2565.46399],预测区间为[1580.46315,2975.74999]。
(1)求总体中赞成该项改革的户数比例的置