统计学16章答案.docx
《统计学16章答案.docx》由会员分享,可在线阅读,更多相关《统计学16章答案.docx(21页珍藏版)》请在冰豆网上搜索。
![统计学16章答案.docx](https://file1.bdocx.com/fileroot1/2023-2/8/b15c2cc2-124f-4c33-8480-4ca6c11c4e49/b15c2cc2-124f-4c33-8480-4ca6c11c4e491.gif)
统计学16章答案
第二章、练习题及解答
1.某商品专卖店2012年10月8日销售流水帐如下
销售单号
销售员姓名
性别
销售型号
单价
销售数量
销售额
071008001
赵灵儿
女
C型
1200
1
1200
071008002
赵灵儿
女
C型
1200
1
1200
071008003
李逍遥
男
A型
800
1
800
071008004
林月如
女
B型
1000
1
1000
071008005
赵灵儿
女
A型
800
1
800
071008006
赵灵儿
女
C型
1200
1
1200
071008007
林月如
男
A型
800
1
800
071008008
李逍遥
女
C型
1200
1
1200
071008009
李逍遥
女
A型
800
1
800
071008010
赵灵儿
女
B型
1000
1
1000
071008011
林月如
男
C型
1200
1
1200
071008012
林月如
女
C型
1200
1
1200
071008013
赵灵儿
女
A型
800
1
800
071008014
林月如
女
C型
1200
1
1200
071008015
赵灵儿
女
C型
1200
1
1200
要求:
(1)利用excel软件,分别按销售员和销售型号进行分类汇总。
(2)利用excel软件,按销售员统计其不同销售型号的销售量与销售额(数据透视表).
解:
(1)
按销售型号进行汇总
销售单号
销售员姓名
性别
销售型号
单价
销售数量
销售额
71008003
李逍遥
男
A型
800
1
800
71008005
赵灵儿
女
A型
800
1
800
71008007
林月如
男
A型
800
1
800
71008009
李逍遥
女
A型
800
1
800
71008013
赵灵儿
女
A型
800
1
800
A型汇总
5
4000
71008004
林月如
女
B型
1000
1
1000
71008010
赵灵儿
女
B型
1000
1
1000
B型汇总
2
2000
71008001
赵灵儿
女
C型
1200
1
1200
71008002
赵灵儿
女
C型
1200
1
1200
71008006
赵灵儿
女
C型
1200
1
1200
71008008
李逍遥
女
C型
1200
1
1200
71008011
林月如
男
C型
1200
1
1200
71008012
林月如
女
C型
1200
1
1200
71008014
林月如
女
C型
1200
1
1200
71008015
赵灵儿
女
C型
1200
1
1200
C型汇总
8
9600
总计
15
15600
(2)按销售员统计其不同销售型号的销售量与销售额(数据透视表)
销售员
销售型号
数据
A型
B型
C型
总计
李逍遥
销售数量
2
0
1
3
销售额
1600
0
1200
2800
林月如
销售数量
1
1
3
5
销售额
800
1000
3600
5400
赵灵儿
销售数量
2
1
4
7
销售额
1600
1000
4800
7400
销售数量合计
5
2
8
15
销售额合计
4000
2000
9600
15600
2.为了确定灯泡的使用寿命(小时),在一批灯泡中随机抽取100只进行测试,所得结果如下:
700
716
728
719
685
709
691
684
705
718
706
715
712
722
691
708
690
692
707
701
708
729
694
681
695
685
706
661
735
665
668
710
693
697
674
658
698
666
696
698
706
692
691
747
699
682
698
700
710
722
694
690
736
689
696
651
673
749
708
727
688
689
683
685
702
741
698
713
676
702
701
671
718
707
683
717
733
712
683
692
693
697
664
681
721
720
677
679
695
691
713
699
725
726
704
729
703
696
717
688
要求:
(1)利用excel软件,对以上数据进行排序.
(2)以组距为10进行等距分组,生成频数分布表,并绘制直方图。
解:
(1)数据排序结果(升序)
651
658
661
664
665
666
668
671
673
674
676
677
679
681
681
682
683
683
683
684
685
685
685
688
688
689
689
690
690
691
691
691
691
692
692
692
693
693
694
694
695
695
696
696
696
697
697
698
698
698
698
699
699
700
700
701
701
702
702
703
704
705
706
706
706
707
707
708
708
708
709
710
710
712
712
713
713
715
716
717
717
718
718
719
720
721
722
722
725
726
727
728
729
729
733
735
736
741
747
749
(2)
灯泡的使用寿命频数分布表
分组
频数(只)
频率(%)
650—660
2
2
660-670
5
5
670-680
6
6
680-690
14
14
690—700
26
26
700-710
18
18
710-720
13
13
720-730
10
10
730-740
3
3
740-750
3
3
合计
100
100
直方图
3.某公司下属40个销售点2012年的商品销售收入数据如下:
单位:
万元
152
124
129
116
100
103
92
95
127
104
105
119
114
115
87
103
118
142
135
125
117
108
105
110
107
137
120
136
117
108
97
88
123
115
119
138
112
146
113
126
要求:
(1)根据上面的数据进行适当分组,编制频数分布表,绘制直方图。
(2)制作茎叶图,并与直方图进行比较。
解:
(1)频数分布表
分组
频数(个)
频率(%)
85-95
3
7。
5
95-105
6
15.0
105-115
9
22。
5
115—125
11
27。
5
125-135
4
10。
0
135-145
5
12。
5
145—155
2
5.0
合计
40
100
或:
(2)茎叶图
树茎
树叶
数据个数
8
9
10
11
12
13
14
15
78
257
033455788
023*********
0345679
5678
26
2
2
3
9
12
7
4
2
1
4。
2006~2011年我国就业人口人员数(年底数)如下表所示:
年份
就业人员
(万人)
三次产业就业人数
第一产业
第二产业
第三产业
2006
74978
31941
18894
24143
2007
75321
30731
20186
24404
2008
75564
29923
20553
25087
2009
75828
28890
21080
25857
2010
76105
27931
21842
26332
2011
76420
26594
22544
27282
要求:
(1)利用excel软件,绘制就业人数的条形图。
(2)分别绘制一、二、三次产业就业人数的条形图并比较分析。
(3)根据2006年和2011年这两年就业人数的三次产业构成数据,分别绘制饼形图并比较分析.
解:
(1)
(2)
二、三产业就业人数条形图请自己绘制。
(3)
第一产业就业人数及其比重下降,第二、三产业人数比重上升。
具体情况自己分析。
第三章、练习题及解答
1.已知下表资料:
日产量(件)
工人数(人)
工人比重(%)
25
30
35
40
45
20
50
80
36
14
10
25
40
18
7
合计
200
100
试根据频数和频率资料,分别计算工人平均日产量.
解:
计算表
日产量(件)x
工人数(人)f
工人比重(%)f/∑f
xf
xf/∑f
25
20
10
500
2.5
30
50
25
1500
7。
5
35
80
40
2800
14
40
36
18
1440
7.2
45
14
7
630
3。
15
合计
200
100
6870
34.35
根据频数计算工人平均日产量:
(件)
根据频率计算工人平均日产量:
(件)
结论:
对同一资料,采用频数和频率资料计算的变量值的平均数是一致的。
2。
某企业集团将其所属的生产同种产品的9个下属单位按其生产该产品平均单位成本的分组资料如下表:
单位产品成本(元/件)
单位数
产量比重(%)
10~12
12~14
14~18
2
3
4
20
42
38
合计
9
100
试计算这9个企业的平均单位成本.解:
单位产品成本(元/件)
单位数
产量比重(%)
f/∑f
组中值(元)x
X·f/∑f
10~12
2
20
11
2。
2
12~14
3
42
13
5.46
14~18
4
38
16
6。
08
合计
9
100
—
13.74
这9个企业的平均单位成本==13。
74(元)
3.某专业统计学考试成绩资料如下:
按成绩分组(分)
学生数(人)
60以下
60~70
70~80
80~90
90~100
100以上
4
8
14
20
9
5
合计
60
试计算众数、中位数。
解:
众数的计算:
根据资料知众数在80~90这一组,故L=80,d=90-80=10,fm=20,fm—1=14,fm+1=9,
(分)
中位数的计算:
根据和向上累积频数信息知,中位数在80~90这一组。
(分)
4。
利用练习题1题资料计算200名工人日产量的标准差,并计算离散系数。
(只按照频数计算即可)
解:
计算表
日产量(件)x
工人数(人)f
25
20
1748。
45
30
50
946.125
35
80
33.8
40
36
1149。
21
45
14
1587.915
合计
200
5465.5
5.一家公司在招收职员时,首先要通过两项能力测试.在A项测试中,平均分数是80分,标准差是15分;在B项测试中,平均分数是200分,标准差是50分.一位应试者在A项测试中得了95分,在B项测试中得了225分。
与平均分数相比,该位应试者哪一项测试更为理想?
解:
计算各自的标准分数:
,
因为A测试的标准分数高于B测试的标准分,所以该测试者A想测试更理想.
第四章练习题及解答
1.解:
由于Z服从标准正态分布,查表得
,,
,,
(1)
(2)
(3)
2.解:
对数据进行整理,30个样本数据极差为1。
99.将数据分为7组,组距为0。
3,如下表所示:
分组
频数
8。
51—8.80
2
8.81-9。
10
3
9.11—9。
40
7
9。
41-9.70
9
9.71—10。
00
3
10.01—10。
30
5
10.31—10.60
1
对应频数直方图为:
观察上图,数据基本上拟合正态分布曲线,可以认为汽车耗油量基本服从正态分布。
3。
解:
已知:
,,同时由于样本量很大,可以看作重置抽样来处理。
根据公式4。
5可以得到:
(1)
(2),
(3)根据中心极限定理,近似服从均值为200,标准差为5的正态分布。
4.解:
已知:
,同时由于样本量很大,可以看作重置抽样来处理。
根据公式4.7可以得到:
(1)
(2),;
(3)根据中心极限定理,p近似服从均值为0.4,标准差为0.0219的正态分布.
5.解:
(1),
;
(2)由于从总体中重置抽取的样本,考虑抽取顺序情况下共有种可能样本。
(3)如下表所示:
样本序号
样本单位
样本均值
样本序号
样本单位
样本均值
1
54,54
54
19
63,54
58。
5
2
54,55
54.5
20
63,55
59
3
54,59
56.5
21
63,59
61
4
54,63
58。
5
22
63,63
63
5
54,64
59
23
63,64
63。
5
6
54,68
61
24
63,68
65.5
7
55,54
54。
5
25
64,54
59
8
55,55
55
26
64,55
59。
5
9
55,59
57
27
64,59
61。
5
10
55,63
59
28
64,63
63。
5
11
55,64
59.5
29
64,64
64
12
55,68
61.5
30
64,68
66
13
59,54
56。
5
31
68,54
61
14
59,55
57
32
68,55
61。
5
15
59,59
59
33
68,59
63。
5
16
59,63
61
34
68,63
65。
5
17
59,64
61.5
35
68,64
66
18
59,68
63.5
36
68,68
68
(4)样本均值频数表:
分组
频数
54-56
4
56-58
4
58—60
9
60—62
7
62—64
7
64-66
3
66-68
2
样本均值频数直方图:
由上图可以发现,样本均值近似服从正态分布;
(5)由样本方差均值公式可以得到:
;
可以看出,样本均值与总体均值很接近,样本标准差则比总体方差小。
第五章、练习题及解答
1。
解:
(1)已知,故:
;
(2)由题目可知:
,故查表可知:
估计误差;
(3)由题目可知:
,由置信区间公式可得:
即快餐店所有顾客午餐平均花费金额的95%的置信区间为(115。
8,124.2)元。
2.解:
(1)总体服从正态分布,,则的95%置信区间为:
(2)总体不服从正态分布,且样本属于大样本,,则的95%置信区间为:
(3)总体不服从正态分布,未知,因此使用样本方差代替总体方差,,则的90%置信区间为:
(4)总体不服从正态分布,未知,因此使用样本方差代替总体方差,,则的95%置信区间为:
3。
解:
整理数据可以得到,,,由于属于大样本,所以使用正态分布来构建置信区间.
当,该校大学生平均上网时间的90%置信区间为:
小时
当,该校大学生平均上网时间的95%置信区间为:
小时
当,该校大学生平均上网时间的95%置信区间为:
小时
4。
解:
(1)由题目可知:
,,,由于抽取的样本属于大样本,所以,总体中赞成新措施的户数比例的95%置信区间为:
(2)由题目可知:
估计误差,,,得到:
即样本个数至少为62户。
或直接将带入n确定的公式,即,
5.解:
(1)整理数据可以得到:
,,,由于抽取的样本属于小样本,所以由CHIINV函数得:
,,由此可以得到第一种排队方式等待时间标准差的95%的置信区间为:
(2)整理数据可以得到:
,,第二种排队方式等待时间标准差的95%的置信区间为:
(3)比较两种方法的标准差置信区间,第一种方法的置信区间更小,说明第一种方法等待时间的离散程度更小,比第二种方式好。
6.解:
由题目可以得到:
当,的95%置信区间为:
当,的95%置信区间为:
7。
解:
由样本数据计算得到:
,,
则自信心得分之差的95%的置信区间为:
8.解:
由题目可以得到:
,,
当,的90%置信区间为:
当,的95%置信区间为:
9.解:
由题目可以得到:
,,
,
两个总体方差比的95%的置信区间为:
10.解:
由题目可以得到:
使用过去经验数据,则可以认为已知,即,在95%置信度下,估计误差,因此:
即样本个数至少为139个.
11。
解:
由题目可以得到:
总体已知,即,,,在95%置信度下,估计误差,因此:
即两个总体的样本各至少为57个。
第六章、练习题及解答
1。
解:
由题目可以得到:
;
提出原假设与备择假设:
,;
该检验属于右侧单边检验,因此得到拒绝域为:
;
在大样本条件下检验统计量为:
,落入拒绝域中,因此拒绝原假设,认为如今每个家庭每天收看电视的平均时间较十年前显著增加了。
(或利用Excel的“1—NORMSDIST(3。
1113)”函数得到检验P=0。
0009<0.01,则拒绝原假设)
2.解:
由题目可以得到:
,根据样本数据计算得到:
;
提出原假设与备择假设:
;
该检验属于左侧单边检验,因此得到拒绝域为:
;
在大样本且总体方差未知条件下检验统计量为:
,落入拒绝域中,因此拒绝原假设,认为该城市空气中悬浮颗粒的平均值显著低于过去的平均值.
(或利用Excel的“NORMSDIST(-2。
3949)”函数得到检验P=0。
0083〈0。
01,则拒绝原假设)
3.解:
由题目可以得到:
,计算样本数据得到,;
提出原假设与备择假设:
,;
该检验属于双边检验,因此得到拒绝域为:
;
在服从正态分布的小样本且总体方差未知条件下检验统计量为:
落入接受域中,因此不能拒绝原假设,没有证据表明该企业生产的金属板不符合要求.
(或利用“TDIST(1.04,19,2)”函数得到检验P=0。
3114>0。
05,则不能拒绝原假设)
4.解:
由题目可以得到:
,计算样本数据得到;
提出原假设与备择假设:
,;
该检验属于右侧单边检验,因此得到拒绝域为:
;
在大样本条件下检验统计量为:
落入拒绝域中,因此拒绝原假设,认为生产商的说法属实,该城市的人早餐饮用牛奶的比例高于17%。
(或利用“1—NORMSDIST(2.4412)”函数得到检验P=0。
0073<0.05,则拒绝原假设)
5。
解:
提出原假设与备择假设:
,;
在大样本条件下检验统计量为:
利用“2*(1-NORMSDIST(5。
1450))”函数,得到双尾值为,由于,拒绝原假设,认为两种装配操作的平均装配时间之差不等于5分钟。
6。
解:
设:
“看后”平均得分为,“看前”平均得分,“看后”平均得分与“看前"平均得分之差为;
提出原假设与备择假设:
,;
根据样本数据计算得到:
;
在配对的小样本条件下检验统计量为:
利用Excel“=TDIST(1。
3572,7,1)”得到的单尾概率值为0。
10842,由于,不能拒绝原假设,没有证据表明广告提高了平均潜在购买力得分。
7。
解:
设:
方法一培训测试平均得分为,方法二培训测试平均得分为;
提出原假设与备择假设:
,;
根据样本数据计算得到:
,,,,,
由于小样本情况下总体方差未知且不相等,t分布自由度为:
在小样本条件下检验统计量为:
利用Excel的“=TDIST(5.2183,24,2)”函数,得到的双尾概率值为0.00002,由于,拒绝原假设,认为两种培训方法的效果存在显著差异。
8.解:
设:
男性经理认为自己成功的人数比例为,女性经理认为自己成功的人数比例为,两个样本合并后得到的合并比例为;
提出原假设与备择假设:
,;
根据样本数据计算得到:
两个样本的比例分别为:
41%,24%
两个样本合并后得到的合并比例;
检验统计量为:
利用Excel的“=2*(1—NORMSDIST(2。
5373))”函数,得到检验概率值为0.0112,由于,所以拒绝原假设,认为男女经理认为自己成功的人数比例具有显著差异。
9。
解:
设:
新肥料获得的平均产量为,旧肥料获得的平均产量为;
(1)两种肥料产量的方差未知但相等,即时:
提出原假设和备择假设:
;
根据样本数据计算得:
,,,,,;
总体方差的合并估计量为:
检验统计量为:
利用Excel的“=TDIST(5。
4271,38,1)”函数,得到单尾概率值为0。
000002,由于,拒绝原假设,认为新肥料获得的平均产量显著地高于旧肥料。
(以上也可由Excel中的[t-检验:
双样本等方差假设]给出)
两种肥料产量的方差未知且不相等,即时:
提出原假设与备择假设:
;
根据样本数据计算得到:
,,,,
由于小样本情况下总体方差未知且不相等,t分布自由度为:
在小样本条件下检验统计量为:
利用Excel的“=TDIST(5。
4271,37,1)"函数,得到单尾概率值为0.000002,由于,拒绝原假设,认为新肥料获得的平均产量显著地高于旧肥料。
(以上也可由Excel中的[t-检验:
双样本异方差假设]给出)
(2)设:
使用新肥料的田地为样本1,使用旧肥料的田地为样本1
提出原假设与备择假设:
;
利用Excel中的“-检验:
双样本方差”()得到的检验结果如下表所示:
F—检验双样本方差分析
变量1
变量2
平均