统计学16章答案.docx

资源描述

统计学16章答案.docx

《统计学16章答案.docx》由会员分享，可在线阅读，更多相关《统计学16章答案.docx（21页珍藏版）》请在冰豆网上搜索。

统计学16章答案.docx

统计学16章答案

第二章、练习题及解答

1.某商品专卖店2012年10月8日销售流水帐如下

销售单号

销售员姓名

性别

销售型号

单价

销售数量

销售额

071008001

赵灵儿

女

C型

1200

071008002

赵灵儿

女

C型

1200

071008003

李逍遥

男

A型

800

071008004

林月如

女

B型

1000

071008005

赵灵儿

女

A型

800

071008006

赵灵儿

女

C型

1200

071008007

林月如

男

A型

800

071008008

李逍遥

女

C型

1200

071008009

李逍遥

女

A型

800

071008010

赵灵儿

女

B型

1000

071008011

林月如

男

C型

1200

071008012

林月如

女

C型

1200

071008013

赵灵儿

女

A型

800

071008014

林月如

女

C型

1200

071008015

赵灵儿

女

C型

1200

要求：

（1）利用excel软件，分别按销售员和销售型号进行分类汇总。

（2）利用excel软件,按销售员统计其不同销售型号的销售量与销售额（数据透视表）.

解：

（1）

按销售型号进行汇总

销售单号

销售员姓名

性别

销售型号

单价

销售数量

销售额

71008003

李逍遥

男

A型

800

71008005

赵灵儿

女

A型

800

71008007

林月如

男

A型

800

71008009

李逍遥

女

A型

800

71008013

赵灵儿

女

A型

800

A型汇总

4000

71008004

林月如

女

B型

1000

71008010

赵灵儿

女

B型

1000

B型汇总

2000

71008001

赵灵儿

女

C型

1200

71008002

赵灵儿

女

C型

1200

71008006

赵灵儿

女

C型

1200

71008008

李逍遥

女

C型

1200

71008011

林月如

男

C型

1200

71008012

林月如

女

C型

1200

71008014

林月如

女

C型

1200

71008015

赵灵儿

女

C型

1200

C型汇总

9600

总计

15600

（2）按销售员统计其不同销售型号的销售量与销售额（数据透视表）

销售员

销售型号

数据

A型

B型

C型

总计

李逍遥

销售数量

销售额

1600

1200

2800

林月如

销售数量

销售额

800

1000

3600

5400

赵灵儿

销售数量

销售额

1600

1000

4800

7400

销售数量合计

销售额合计

4000

2000

9600

15600

2.为了确定灯泡的使用寿命（小时）,在一批灯泡中随机抽取100只进行测试，所得结果如下：

700

716

728

719

685

709

691

684

705

718

706

715

712

722

691

708

690

692

707

701

708

729

694

681

695

685

706

661

735

665

668

710

693

697

674

658

698

666

696

698

706

692

691

747

699

682

698

700

710

722

694

690

736

689

696

651

673

749

708

727

688

689

683

685

702

741

698

713

676

702

701

671

718

707

683

717

733

712

683

692

693

697

664

681

721

720

677

679

695

691

713

699

725

726

704

729

703

696

717

688

要求：

（1）利用excel软件，对以上数据进行排序.

（2）以组距为10进行等距分组，生成频数分布表,并绘制直方图。

解：

（1）数据排序结果（升序）

651

658

661

664

665

666

668

671

673

674

676

677

679

681

682

683

684

685

688

689

690

691

692

693

694

695

696

697

698

699

700

701

702

703

704

705

706

707

708

709

710

712

713

715

716

717

718

719

720

721

722

725

726

727

728

729

733

735

736

741

747

749

（2）

灯泡的使用寿命频数分布表

分组

频数（只）

频率（%）

650—660

660-670

670-680

680-690

690—700

700-710

710-720

720-730

730-740

740-750

合计

100

直方图

3.某公司下属40个销售点2012年的商品销售收入数据如下：

单位：

万元

152

124

129

116

100

103

127

104

105

119

114

115

103

118

142

135

125

117

108

105

110

107

137

120

136

117

108

123

115

119

138

112

146

113

126

要求：

（1）根据上面的数据进行适当分组，编制频数分布表，绘制直方图。

（2）制作茎叶图,并与直方图进行比较。

解：

（1）频数分布表

分组

频数（个）

频率（%）

85-95

7。

95-105

15.0

105-115

22。

115—125

27。

125-135

10。

135-145

12。

145—155

5.0

合计

100

或:

（2）茎叶图

树茎

树叶

数据个数

257

033455788

023*********

0345679

5678

4。

2006～2011年我国就业人口人员数（年底数）如下表所示：

年份

就业人员

（万人）

三次产业就业人数

第一产业

第二产业

第三产业

2006

74978

31941

18894

24143

2007

75321

30731

20186

24404

2008

75564

29923

20553

25087

2009

75828

28890

21080

25857

2010

76105

27931

21842

26332

2011

76420

26594

22544

27282

要求：

（1）利用excel软件，绘制就业人数的条形图。

（2）分别绘制一、二、三次产业就业人数的条形图并比较分析。

（3）根据2006年和2011年这两年就业人数的三次产业构成数据，分别绘制饼形图并比较分析.

解：

（1）

（2）

二、三产业就业人数条形图请自己绘制。

（3）

第一产业就业人数及其比重下降,第二、三产业人数比重上升。

具体情况自己分析。

第三章、练习题及解答

1.已知下表资料：

日产量（件）

工人数（人）

工人比重（％）

合计

200

100

试根据频数和频率资料,分别计算工人平均日产量.

解：

计算表

日产量（件）x

工人数（人）f

工人比重（％）f/∑f

xf/∑f

500

2.5

1500

7。

2800

1440

7.2

630

3。

合计

200

100

6870

34.35

根据频数计算工人平均日产量：

（件）

根据频率计算工人平均日产量:

（件）

结论:

对同一资料，采用频数和频率资料计算的变量值的平均数是一致的。

2。

某企业集团将其所属的生产同种产品的9个下属单位按其生产该产品平均单位成本的分组资料如下表：

单位产品成本（元/件）

单位数

产量比重（%）

10～12

12～14

14～18

合计

100

试计算这9个企业的平均单位成本.解：

单位产品成本（元/件）

单位数

产量比重（%）

f/∑f

组中值（元）x

X·f/∑f

10～12

2。

12～14

5.46

14～18

6。

合计

100

—

13.74

这9个企业的平均单位成本==13。

74（元）

3.某专业统计学考试成绩资料如下：

按成绩分组（分）

学生数（人）

60以下

60～70

70~80

80～90

90～100

100以上

合计

试计算众数、中位数。

解:

众数的计算：

根据资料知众数在80～90这一组，故L=80，d=90-80=10,fm=20,fm—1=14，fm+1=9,

（分）

中位数的计算:

根据和向上累积频数信息知,中位数在80～90这一组。

（分）

4。

利用练习题1题资料计算200名工人日产量的标准差，并计算离散系数。

（只按照频数计算即可）

解：

计算表

日产量（件）x

工人数（人）f

1748。

946.125

33.8

1149。

1587.915

合计

200

5465.5

5.一家公司在招收职员时，首先要通过两项能力测试.在A项测试中，平均分数是80分,标准差是15分；在B项测试中，平均分数是200分，标准差是50分.一位应试者在A项测试中得了95分，在B项测试中得了225分。

与平均分数相比,该位应试者哪一项测试更为理想？

解：

计算各自的标准分数：

，

因为A测试的标准分数高于B测试的标准分，所以该测试者A想测试更理想.

第四章练习题及解答

1.解：

由于Z服从标准正态分布,查表得

，，

（1）

（2）

（3）

2.解：

对数据进行整理，30个样本数据极差为1。

99.将数据分为7组,组距为0。

3，如下表所示:

分组

频数

8。

51—8.80

8.81-9。

9.11—9。

9。

41-9.70

9.71—10。

10.01—10。

10.31—10.60

对应频数直方图为:

观察上图，数据基本上拟合正态分布曲线,可以认为汽车耗油量基本服从正态分布。

3。

解：

已知:

，，同时由于样本量很大,可以看作重置抽样来处理。

根据公式4。

5可以得到：

（1）

（2）,

（3）根据中心极限定理，近似服从均值为200,标准差为5的正态分布。

4.解:

已知：

，同时由于样本量很大，可以看作重置抽样来处理。

根据公式4.7可以得到：

（1）

（2），；

（3）根据中心极限定理，p近似服从均值为0.4，标准差为0.0219的正态分布.

5.解：

（1），

；

（2）由于从总体中重置抽取的样本，考虑抽取顺序情况下共有种可能样本。

（3）如下表所示:

样本序号

样本单位

样本均值

样本序号

样本单位

样本均值

54，54

63，54

58。

54,55

54.5

63，55

54，59

56.5

63，59

54，63

58。

63,63

54，64

63,64

63。

54，68

63，68

65.5

55，54

54。

64，54

55,55

64，55

59。

55，59

64，59

61。

55，63

64，63

63。

55，64

59.5

64，64

55，68

61.5

64，68

59,54

56。

68，54

59，55

68，55

61。

59，59

68，59

63。

59，63

68，63

65。

59，64

61.5

68，64

59,68

63.5

68,68

（4）样本均值频数表:

分组

频数

54-56

56-58

58—60

60—62

62—64

64-66

66-68

样本均值频数直方图：

由上图可以发现，样本均值近似服从正态分布；

（5）由样本方差均值公式可以得到：

；

可以看出，样本均值与总体均值很接近,样本标准差则比总体方差小。

第五章、练习题及解答

1。

解:

（1）已知，故：

;

（2）由题目可知：

，故查表可知：

估计误差；

（3）由题目可知：

，由置信区间公式可得:

即快餐店所有顾客午餐平均花费金额的95％的置信区间为（115。

8,124.2）元。

2.解：

（1）总体服从正态分布，，则的95％置信区间为：

（2）总体不服从正态分布，且样本属于大样本，，则的95％置信区间为：

（3）总体不服从正态分布，未知，因此使用样本方差代替总体方差，，则的90％置信区间为：

（4）总体不服从正态分布，未知,因此使用样本方差代替总体方差，，则的95%置信区间为：

3。

解：

整理数据可以得到，，，由于属于大样本，所以使用正态分布来构建置信区间.

当，该校大学生平均上网时间的90%置信区间为：

小时

当，该校大学生平均上网时间的95％置信区间为：

小时

当，该校大学生平均上网时间的95%置信区间为:

小时

4。

解：

（1）由题目可知：

，，，由于抽取的样本属于大样本，所以，总体中赞成新措施的户数比例的95%置信区间为：

（2）由题目可知:

估计误差，,,得到:

即样本个数至少为62户。

或直接将带入n确定的公式，即，

5.解:

（1）整理数据可以得到：

，，，由于抽取的样本属于小样本，所以由CHIINV函数得：

，,由此可以得到第一种排队方式等待时间标准差的95％的置信区间为：

（2）整理数据可以得到：

，，第二种排队方式等待时间标准差的95%的置信区间为：

（3）比较两种方法的标准差置信区间，第一种方法的置信区间更小，说明第一种方法等待时间的离散程度更小,比第二种方式好。

6.解：

由题目可以得到：

当，的95%置信区间为：

当，的95％置信区间为:

7。

解：

由样本数据计算得到:

，，

则自信心得分之差的95％的置信区间为:

8.解：

由题目可以得到：

，,

当,的90％置信区间为:

当，的95%置信区间为:

9.解:

由题目可以得到：

，，

，

两个总体方差比的95%的置信区间为：

10.解：

由题目可以得到：

使用过去经验数据，则可以认为已知,即，在95％置信度下，估计误差,因此：

即样本个数至少为139个.

11。

解：

由题目可以得到：

总体已知，即，,，在95％置信度下，估计误差，因此:

即两个总体的样本各至少为57个。

第六章、练习题及解答

1。

解:

由题目可以得到：

；

提出原假设与备择假设：

，；

该检验属于右侧单边检验，因此得到拒绝域为：

；

在大样本条件下检验统计量为：

，落入拒绝域中,因此拒绝原假设，认为如今每个家庭每天收看电视的平均时间较十年前显著增加了。

（或利用Excel的“1—NORMSDIST（3。

1113）”函数得到检验P=0。

0009<0.01，则拒绝原假设）

2.解：

由题目可以得到:

，根据样本数据计算得到：

；

提出原假设与备择假设：

；

该检验属于左侧单边检验，因此得到拒绝域为:

；

在大样本且总体方差未知条件下检验统计量为：

，落入拒绝域中，因此拒绝原假设，认为该城市空气中悬浮颗粒的平均值显著低于过去的平均值.

（或利用Excel的“NORMSDIST（-2。

3949）”函数得到检验P=0。

0083〈0。

01，则拒绝原假设）

3.解:

由题目可以得到：

，计算样本数据得到，；

提出原假设与备择假设：

，;

该检验属于双边检验，因此得到拒绝域为：

;

在服从正态分布的小样本且总体方差未知条件下检验统计量为：

落入接受域中，因此不能拒绝原假设，没有证据表明该企业生产的金属板不符合要求.

（或利用“TDIST（1.04，19，2）”函数得到检验P=0。

3114>0。

05,则不能拒绝原假设）

4.解：

由题目可以得到：

，计算样本数据得到;

提出原假设与备择假设:

，；

该检验属于右侧单边检验，因此得到拒绝域为：

；

在大样本条件下检验统计量为：

落入拒绝域中，因此拒绝原假设，认为生产商的说法属实,该城市的人早餐饮用牛奶的比例高于17%。

（或利用“1—NORMSDIST（2.4412）”函数得到检验P=0。

0073<0.05，则拒绝原假设）

5。

解：

提出原假设与备择假设：

，；

在大样本条件下检验统计量为：

利用“2*（1-NORMSDIST（5。

1450））”函数，得到双尾值为，由于，拒绝原假设，认为两种装配操作的平均装配时间之差不等于5分钟。

6。

解：

设：

“看后”平均得分为，“看前”平均得分，“看后”平均得分与“看前"平均得分之差为；

提出原假设与备择假设:

，;

根据样本数据计算得到：

；

在配对的小样本条件下检验统计量为：

利用Excel“=TDIST（1。

3572,7，1）”得到的单尾概率值为0。

10842,由于，不能拒绝原假设，没有证据表明广告提高了平均潜在购买力得分。

7。

解：

设：

方法一培训测试平均得分为，方法二培训测试平均得分为；

提出原假设与备择假设：

，；

根据样本数据计算得到：

，，,，,

由于小样本情况下总体方差未知且不相等，t分布自由度为：

在小样本条件下检验统计量为：

利用Excel的“=TDIST（5.2183，24,2）”函数，得到的双尾概率值为0.00002，由于，拒绝原假设，认为两种培训方法的效果存在显著差异。

8.解：

设:

男性经理认为自己成功的人数比例为,女性经理认为自己成功的人数比例为，两个样本合并后得到的合并比例为；

提出原假设与备择假设:

，；

根据样本数据计算得到:

两个样本的比例分别为：

41％，24％

两个样本合并后得到的合并比例；

检验统计量为：

利用Excel的“=2＊（1—NORMSDIST（2。

5373））”函数，得到检验概率值为0.0112，由于，所以拒绝原假设，认为男女经理认为自己成功的人数比例具有显著差异。

9。

解:

设：

新肥料获得的平均产量为，旧肥料获得的平均产量为；

（1）两种肥料产量的方差未知但相等，即时：

提出原假设和备择假设：

；

根据样本数据计算得：

，，,，，；

总体方差的合并估计量为：

检验统计量为：

利用Excel的“=TDIST（5。

4271，38,1）”函数,得到单尾概率值为0。

000002,由于，拒绝原假设，认为新肥料获得的平均产量显著地高于旧肥料。

（以上也可由Excel中的[t-检验：

双样本等方差假设］给出）

两种肥料产量的方差未知且不相等，即时：

提出原假设与备择假设：

;

根据样本数据计算得到:

，，，，

由于小样本情况下总体方差未知且不相等，t分布自由度为：

在小样本条件下检验统计量为：

利用Excel的“=TDIST（5。

4271，37,1）"函数，得到单尾概率值为0.000002，由于，拒绝原假设，认为新肥料获得的平均产量显著地高于旧肥料。

（以上也可由Excel中的[t-检验：

双样本异方差假设]给出）

（2）设:

使用新肥料的田地为样本1，使用旧肥料的田地为样本1

提出原假设与备择假设：

；

利用Excel中的“-检验：

双样本方差”（）得到的检验结果如下表所示：

F—检验双样本方差分析

变量1

变量2

平均

展开阅读全文