统计学贾俊平课后习题答案.docx
《统计学贾俊平课后习题答案.docx》由会员分享,可在线阅读,更多相关《统计学贾俊平课后习题答案.docx(22页珍藏版)》请在冰豆网上搜索。
统计学贾俊平课后习题答案
附录:
教材各章习题答案
第1章统计与统计数据
1.1
(1)数值型数据;
(2)分类数据;(3)数值型数据;(4)顺序数据;(5)分类数据。
1.2
(1)总体是“该城市所有的职工家庭”,样本是“抽取的2000个职工家庭”;
(2)城市所有职工家庭的年人均收入,抽取的“2000个家庭计算出的年人均收入。
1.3
(1)所有IT从业者;
(2)数值型变量;(3)分类变量;(4)观察数据。
1.4
(1)总体是“所有的网上购物者”;
(2)分类变量;(3)所有的网上购物者的月平均花费;(4)统计
量;(5)推断统计方法。
1.5(略)。
1.6(略)。
第2章数据的图表展示
2.1
(1)属于顺序数据。
(2)频数分布表如下服务质量等级评价的频数分布
服务质量等级
家庭数/频率
频率/%
A
14
14
B
21
21
C
32
32
D
18
18
E
15
15
合计
100
100
3)条形图(略)
4)帕累托图(略)
2.2
(1)频数分布表如下
40个企业按产品销售收入分组表
按销售收入分组
/万元
企业数
/个
频率
/%
向上累积
向下累积
企业数
频率
企业数
频率
100以下
5
12.5
5
12.5
40
100.0
100~110
9
22.5
14
35.0
35
87.5
110~120
12
30.0
26
65.0
26
65.0
120~130
7
17.5
33
82.5
14
35.0
130~140
4
10.0
37
92.5
7
17.5
140以上
3
7.5
40
100.0
3
7.5
合计
40
100.0
—
—
—
—
2)某管理局下属40个企分组表
按销售收入分组/万元
企业数/个
频率/%
先进企业
11
27.5
良好企业
11
27.5
一般企业
9
22.5
落后企业
9
22.5
合计
40
100.0
2.3频数分布表如下
某百货公司日商品销售额分组表
按销售额分组/万元
频数/天
频率/%
25~30
4
10.0
30~35
6
15.0
35~40
15
37.5
40~45
9
22.5
45~50
6
15.0
合计
40
100.0
直方图(略)
2.4茎叶图如下
茎
叶
数据个数
1
8
8
9
3
2
0
1
1
3
3
6888999
12
3
1
3
5
6
9
5
4
1
2
3
6
6
7
6
5
0
1
2
7
4
箱线图(略)
2.5
(1)排序略
(2)频数分布表如下
100只灯泡使用寿命非频数分布
按使用寿命分组/小时
灯泡个数/只
频率/%
650~660
2
2
660~670
5
5
670~680
6
6
680~690
14
14
690~700
26
26
700~710
18
18
710~720
13
13
720~730
10
10
730~740
3
3
740~750
3
3
合计
100
100
3)直方图(略)
4)茎叶图如下
茎叶
65
66
67
68
69
5566677888899
70
71
720122567899
73356
74147
2.6
(1)频数分布表如下
按重量分组
频率/包
40~42
2
42~44
3
44~46
7
46~48
16
48~50
17
52~52
10
52~54
20
54~56
8
56~58
10
58~60
4
60~62
3
合计
100
(2)直方图(略)。
(3)食品重量的分布基本上是对称的
2.7
(1)频数分布表如下
按重量误差分组
频数/个
10~20
0
20~30
5
30~40
7
40~50
8
50~60
13
60~70
9
70~80
6
80~90
2
合计
50
2)直方图(略)
2.8
(1)属于数值型数据
(2)分组结果如下
分组
天数/天
-25~-20
6
-20~-15
8
-15~-10
10
-10~-5
13
-5~0
12
0~5
4
5~10
7
合计60
(3)直方图(略)。
2.9
(1)直方图(略)。
(2)自学考试人员年龄的分布为右偏
2.11
2.12
2.13
2.14
2.15
第3
3.1
3.2
3.3
3.4
3.5
3.6
1)茎叶图如下
A班
树茎
B班
数据个数
树叶
树叶
数据个数
0
3
59
2
1
4
4
0448
4
2
97
5
12
11
9
6
9
23
7
00113449
8
7
6655200
8
123345
6
6
632220
9
011456
6
0
10
000
3
2.10
2)A班考试成绩的分布比较集中,且平均分数较高;B班考试成绩的分布比A班分散,
且平均成绩较A班低。
(略)。
(略)。
(略)。
(略)。
箱线图如下:
(特征请读者自己分析)
章数据的概括性度量
(1)M010;Me10;x9.6。
(2)QL5.5;QU12。
(3)s4.2。
(4)左偏分布。
(1)M019;Me23。
(1);。
2)QL5.5;QU12。
(3)x24;s6.65。
(4)SK1.08;K0.77。
(5)略。
(1)略。
(2)x7;s0.71。
(3)v10.102;v20.274。
(4)选方法一,因为离散程度小。
(1)x=274.1(万元);Me=272.5。
2)QL=260.25;QU=291.25。
3)s21.17(万元)。
甲企业平均成本=19.41(元),乙企业平均成本=18.29(元);原因:
尽管两个企业的单位成本相同,但单位成本较低的产品在乙企业的产量中所占比重较大,因此拉低了总平均成本。
(1)x=426.67(万元);s116.48(万元)。
(2)SK0.203;K0.688。
3.7
(1)
(2)两位调查人员所得到的平均身高和标准差应该差不多相同,因为均值和标准差的
大小基本上不受样本大小的影响。
(3)具有较大样本的调查人员有更大的机会取到最高或最低者,因为样本越大,变化的范围就可能越大。
3.8
(1)女生的体重差异大,因为女生其中的离散系数为0.1大于男生体重的离散系数0.08。
(2)男生:
x=27.27(磅),s2.27(磅);
女生:
x=22.73(磅),s2.27(磅);(3)68%;
(4)95%。
3.9通过计算标准化值来判断,zA1,zB0.5,说明在A项测试中该应试者比平均分数高出1个标准差,而在B项测试中只高出平均分数0.5个标准差,由于A项测试的标准化值高于B项测试,所以A项测试比较理想。
3.10通过标准化值来判断,各天的标准化值如下表
日期周一周二周三周四周五周六周日
标准化值Z3-0.6-0.20.4-1.8-2.20
周一和周六两天失去了控制。
3.11
(1)离散系数,因为它消除了不同组数据水平高地的影响。
4.2
(2)成年组身高的离散系数:
vs0.024;
s172.1
2.3幼儿组身高的离散系数:
vs0.032;
s71.3
由于幼儿组身高的离散系数大于成年组身高的离散系数,说明幼儿组身高的离散程度相对较大。
3.12下表给出了一些主要描述统计量,请读者自己分析。
方法A
方法B
方法C
平均
165.6
平均
128.73
平均
125.53
中位数
165
中位数
129
中位数
126
众数
164
众数
128
众数
126
标准偏差
2.13
标准偏差
1.75
标准偏差
2.77
极差
8
极差
7
极差
12
最小值
162
最小值
125
最小值
116
最大值
170
最大值
132
最大值
128
3.13
(1)方差或标准差;
(2)商业类股票;(3)(略)
第4章抽样与参数估计
4.1
(1)200。
(2)5。
(3)正态分布。
(4)(1001)
4.2
(1)32。
(2)0.91。
4.3
0.79。
4.4
2
(1)x25~N(17,2)。
(2)x100~N(17,1)。
4.5
(1)1.41。
(2)1.41,1.41,1.34。
4.6
(1)0.4。
(2)0.024。
(3)正态分布。
4.7
(1)0.050,0.035,0.022,016。
(2)当样本量增大时,样本比例的标准差越来越小
4.8
(1)x2.14;
(2)E=4.2;(3)(115.8,124.2)
4.9
(87819,121301)。
4.10
(1)81±1.97;
(2)81±2.35;(3)81±3.10。
4.11
(1)(24.11,25.89);
(2)(113.17,126.03);(3)(3.136,3.702)
4.12
(1)(8687,9113);
(2)(8734,9066);(3)(8761,9039);(4)(8682,9118)
4.13
(2.88,3.76);(2.80,3.84);(2.63,4.01)。
4.14
(7.1,12.9)。
4.15
(7.18,11.57)。
4.16
(1)(148.9,150.1);
(2)中心极限定理。
4.17
(1)(100.9,123.7);
(2)(0.017,0.183)。
4.18
(15.63,16.55)。
4.19
(10.36,16.76)。
4.20
(1)(0.316,0.704);
(2)(0.777,0.863);(3)(0.456,0.504)。
4.21
(18.11%,27.89%);(17.17%,22.835)。
4.22
167。
4.23
(1)2522;
(2)601;(3)268。
4.24
(1)(51.37%,76.63%);
(2)36。
4.25
(1)(2.13,2.97);
(2)(0.015,0.029);(3)(25.3,42.5)。
4.26
(1)(0.33,0.87);
(2)(1.25,3.33);(3)第一种排队方式更好。
4.27
48。
4.28
139。
5章
假设检验
5.1研究者想要寻找证据予以支持的假设是“新型弦线的平均抗拉强度相对于以前提高了”,所以原假设与备
择假设应为:
H0:
1035,H1:
1035。
5.2=“某一品种的小鸡因为同类相残而导致的死亡率”,H0:
0.04,H1:
0.04
5.3H0:
65,H1:
65
5.4
(1)第一类错误是该供应商提供的这批炸土豆片的平均重量的确大于等于60克,但检验结果却提供证
据支持店方倾向于认为其重量少于60克;
(2)第二类错误是该供应商提供的这批炸土豆片的平均重量其实少于60克,但检验结果却没有提供足
够的证据支持店方发现这一点,从而拒收这批产品;
(3)连锁店的顾客们自然看重第二类错误,而供应商更看重第一类错误。
2)如果zz0.05,就拒绝H0
3)检验统计量z=2.94>1.645,所以应该拒绝H0
5.6z=3.11,拒绝H0。
5.7t1.66,不拒绝H0。
5.8z2.39,拒绝H0。
5.9t1.04,不拒绝H0
5.10z2.44,拒绝H0。
5.11z=1.93,不拒绝H0。
5.12z=7.48,拒绝H0。
2
5.13=206.22,拒绝H0
5.14F2.42,拒绝H0。
第6章方差分析
6.1F4.6574F0.018.0215(或Pvalue0.04090.01),不能拒绝原假设。
6.2F15.8234F0.014.579(或Pvalue0.000010.01),拒绝原假设。
6.3F10.0984F0.015.4170(或Pvalue0.0006850.01),拒绝原假设。
6.4F11.7557F0.053.6823(或Pvalue0.0008490.05),拒绝原假设。
6.5F17.0684F0.053.8853(或Pvalue0.00030.05),拒绝原假设。
xAxB44.43014.4LSD5.85,拒绝原假设;
xAxC44.442.61.8LSD5.85,不能拒绝原假设;
xBxC3042.612.6LSD5.85,拒绝原假设。
6.6方差分析表中所缺的数值如下表:
差异源
SS
df
MS
F
P-value
Fcrit
组间
420
2
210
1.478
0.245946
3.354131
组内
3836
27
142.07
—
—
—
总计
4256
29
—
—
—
—
F1.478F0.053.554131(或Pvalue0.2459460.05),不能拒绝原假设。
第7章相关与回归分析
7.1
(1)散点图(略),产量与生产费用之间正的线性相关关系。
(2)r0.920232。
(3)检验统计量t14.4222t22.2281,拒绝原假设,相关系数显著。
7.2
(1)散点图(略)。
(2)r0.8621。
7.3
(1)?
0表示当x0时y的期望值。
(2)?
1表示x每变动一个单位y平均下降0.5个单位。
(3)E(y)7。
2
7.4
(1)R90%。
(2)se1。
7.5
(1)散点图(略)。
(2)r0.9489。
(3)y?
0.11810.00358x。
回归系数?
10.00358表示运送距离每增加1公里,运送时间平均增加0.00358天。
7.6
(1)散点图(略)。
二者之间为高度的正线性相关关系。
(2)r0.998128,二者之间为高度的正线性相关关系。
(3)估计的回归方程为:
y?
734.69280.308683x。
回归系数?
10.308683表示人均GDP每增加1元,人均消费水平平均增加0.308683元。
2
(4)判定系数R20.996259。
表明在人均消费水平的变差中,有99.6259%是由人均GDP决定的。
(5)检验统计量F1331.692F6.61,拒绝原假设,线性关系显著。
(6)y?
5000734.69280.30868350002278.1078(元)。
(7)置信区间:
[1990.749,2565.464];预测区间:
[1580.463,2975.750]。
7.7
(1)散点图(略),二者之间为负的线性相关关系。
(2)估计的回归方程为:
y?
430.18924.7x。
回归系数?
14.7表示航班正点率每增加1%,顾
客投诉次数平均下降4.7次。
(3)检验统计量t4.959t22.3060(P-Value=0.001108<0.05),拒绝原假设,回归系
数显著。
(4)y?
80430.18924.78054.1892(次)。
(5)置信区间:
(37.660,70.619);预测区间:
(7.572,100.707)。
7.8Excel输出的结果如下(解释与分析请读者自己完成)
MultipleR
0.7951
RSquare
0.6322
AdjustedRSquare
0.6117
标准误差
2.6858
观测值
20
方差分析
df
SS
MS
F
SignificanceF
回归分析
1
223.1403
223.1403
30.9332
2.79889E-05
残差
18
129.8452
7.2136
总计
19
352.9855
Coefficients
标准误差
tStat
P-value
Lower95%
Upper95%
Intercept
49.3177
3.8050
12.9612
0.0000
41.3236
57.3117
XVariable1
0.2492
0.0448
5.5618
0.0000
0.1551
0.3434
7.9
(1)方差分析表中所缺的数值如下方差分析表
变差来源
df
SS
MS
F
SignificanceF
回归
1
1422708.6
1422708.6
354.277
2.17E-09
残差
10
40158.07
4015.807
—
—
总计
11
1642866.67
—
SSR1422708.60
(2)R20.866086.60%。
表明汽车销售量的变差中有86.60%是由于
SST1642866.67
广告费用的变动引起的。
(3)rR20.86600.9306。
(4)y?
363.68911.420211x。
回归系数?
11.420211表示广告费用每增加一个单位,销售量平均增加1.420211个单位。
(5)SignificanceF=2.17E-09<0.05,线性关系显著。
7.10y?
13.62542.3029x;R293.74%;se3.8092。
7.11
(1)27。
(2)4.41。
(3)拒绝H0。
(4)r0.7746。
(5)拒绝H0。
7.12
(1)15.95E(y)18.05
2)14.651y019.349
7.13y?
46.2915.24x;441.555E(y40)685.045
7.14y?
25.030.0497x11.928x2;预测28.586。
7.15(略)。
7.16
(1)显著。
(2)显著。
(3)显著。
7.17
(1)y?
88.63771.6039x1
(2)y?
83.23012.2902x11.3010x2。
(3)不相同。
方程
(1)中的回归系数?
11.6039表示电视广告费用每增加1万元,月销售额平均增加1.6039万元;方程
(1)中的回归系数?
12.2902表示在报纸广告费用不变的条件下,电视广告费用每增加1万元,月销售额平均增加2.2902万元。
(4)R291.91%;Ra288.66%。
(5)1的P-Value=0.0007,2的P-Value=0.0098,均小于0.05,两个回归系数均显著。
7.18
(1)y?
0.591022.3865x1327.6717x2
(2)回归系数?
122.3865表示降雨量每增加1毫mm,小麦收获量平均增加22.3865kg/hm2;回归
系数?
2327.6717表示温度每增加10C,小麦收获量平均增加327.6717kg/mh2。
(3)可能存在。
7.19
(1)y?
148.70050.8147x10.8210x20.1350x3。
(2)R289.75%;Ra287.83%。
(3)SignificanceF=3.88E-08<0.05,线性关系显著。
(4)1的P-Value=0.1311>0.05,不显著;2的P-Value=0.0013<0.05,显著;3的
P-Value=0.0571>0.05,不显著。
第8章时间序列分析和预测
8.1
(1)时间序列图(略)。
(2)13.55%。
(3)1232.90(亿元)。
8.2
(1)时间序列图(略)。
(2)1421.2(公斤/公顷)
3)0.3时的预测值:
F20011380.18,误差均方=291455;0.5时的预测值:
F20011407.23,误差均方=239123。
0.5更合适。
8.3
(1)3期移动平均预测值=630.33(万元)。
(2)0.3时的预测值:
F19567.95,误差均方=87514.7;0.4时的预测值:
F19591.06,误差均方=62662.5;0.5时的预测值:
F19606.54,误差均方=
50236。
0.5更合适
(3)趋势方程Y?
t239.7321.9288t。
估计标准误差sY31.6628。
8.4
(1)趋势图(略)。
(2)趋势方程Y?
t145.781.16077t。
2001年预测值=3336.89(亿元)。
8.5
(1)趋势图(略)。
(2)线性趋势方程Y?
69.520213.9495t,2000年预测值=585.65(万吨)。
8.6线性趋势:
Y?
374.16130.6137t;二次曲线:
Y?
381.64421.8272t0.03