第2章 统计数据的描述.docx

上传人:b****5 文档编号:3429461 上传时间:2022-11-23 格式:DOCX 页数:19 大小:142.26KB
下载 相关 举报
第2章 统计数据的描述.docx_第1页
第1页 / 共19页
第2章 统计数据的描述.docx_第2页
第2页 / 共19页
第2章 统计数据的描述.docx_第3页
第3页 / 共19页
第2章 统计数据的描述.docx_第4页
第4页 / 共19页
第2章 统计数据的描述.docx_第5页
第5页 / 共19页
点击查看更多>>
下载资源
资源描述

第2章 统计数据的描述.docx

《第2章 统计数据的描述.docx》由会员分享,可在线阅读,更多相关《第2章 统计数据的描述.docx(19页珍藏版)》请在冰豆网上搜索。

第2章 统计数据的描述.docx

第2章统计数据的描述

第2章统计数据的描述——练习题

●1.为评价家电行业售后服务的质量,随机抽取了由100家庭构成的一个样本。

服务质量的等级分别表示为:

A.好;B.较好;C.一般;D.差;E.较差。

调查结果如下:

B

E

C

C

A

D

C

B

A

E

D

A

C

B

C

D

E

C

E

E

A

D

B

C

C

A

E

D

C

B

B

A

C

D

E

A

B

D

D

C

C

B

C

E

D

B

C

C

B

C

D

A

C

B

C

D

E

C

E

B

B

E

C

C

A

D

C

B

A

E

B

A

C

D

E

A

B

D

D

C

A

D

B

C

C

A

E

D

C

B

C

B

C

E

D

B

C

C

B

C

(1)指出上面的数据属于什么类型;

(2)用Excel制作一张频数分布表;

(3)绘制一张条形图,反映评价等级的分布。

解:

(1)由于表2.21中的数据为服务质量的等级,可以进行优劣等级比较,但不能计算差异大小,属于顺序数据。

(2)频数分布表如下:

服务质量等级评价的频数分布

服务质量等级

家庭数(频数)

频率%

A

14

14

B

21

21

C

32

32

D

18

18

E

15

15

合计

100

100

(3)条形图的制作:

将上表(包含总标题,去掉合计栏)复制到Excel表中,选定整个表格后点击:

图表向导→条形图→选择子图表类型→完成(见Excel练习题2.1)。

即得到如下的条形图:

 

●2.某行业管理局所属40个企业2002年的产品销售收入数据如下(单位:

万元):

152

124

129

116

100

103

92

95

127

104

105

119

114

115

87

103

118

142

135

125

117

108

105

110

107

137

120

136

117

108

97

88

123

115

119

138

112

146

113

126

(1)根据上面的数据进行适当的分组,编制频数分布表,并计算出累积频数和累积频率;

(2)如果按规定:

销售收入在125万元以上为先进企业,115万~125万元为良好企业,105万~115万元为一般企业,105万元以下为落后企业,按先进企业、良好企业、一般企业、落后企业进行分组。

解:

(1)要求对销售收入的数据进行分组,

全部数据中,最大的为152,最小的为87,知数据全距为152-87=65;

为便于计算和分析,确定将数据分为6组,各组组距为10,组限以整10划分;

为使数据的分布满足穷尽和互斥的要求,注意到,按上面的分组方式,最小值87可能落在最小组之下,最大值152可能落在最大组之上,将最小组和最大组设计成开口形式;

按照“上限不在组内”的原则,用划记法统计各组内数据的个数——企业数,也可以用Excel进行排序统计(见Excel练习题2.2),将结果填入表内,得到频数分布表如下表中的左两列;

将各组企业数除以企业总数40,得到各组频率,填入表中第三列;

在向上的数轴中标出频数的分布,由下至上逐组计算企业数的向上累积及频率的向上累积,由上至下逐组计算企业数的向下累积及频率的向下累积。

整理得到频数分布表如下:

40个企业按产品销售收入分组表

按销售收入分组

(万元)

企业数

(个)

频率

(%)

向上累积

向下累积

企业数

频率

企业数

频率

100以下

100~110

110~120

120~130

130~140

140以上

5

9

12

7

4

3

12.5

22.5

30.0

17.5

10.0

7.5

5

14

26

33

37

40

12.5

35.0

65.0

82.5

92.5

100.0

40

35

26

14

7

3

100.0

87.5

65.0

35.0

17.5

7.5

合计

40

100.0

(2)按题目要求分组并进行统计,得到分组表如下:

某管理局下属40个企分组表

按销售收入分组(万元)

企业数(个)

频率(%)

先进企业

良好企业

一般企业

落后企业

11

11

9

9

27.5

27.5

22.5

22.5

合计

40

100.0

 

●3.某百货公司连续40天的商品销售额如下(单位:

万元):

41

25

29

47

38

34

30

38

43

40

46

36

45

37

37

36

45

43

33

44

35

28

46

34

30

37

44

26

38

44

42

36

37

37

49

39

42

32

36

35

根据上面的数据进行适当的分组,编制频数分布表,并绘制直方图。

解:

全部数据中,最大的为49,最小的为25,知数据全距为49-25=24;

为便于计算和分析,确定将数据分为5组,各组组距为5,组限以整5的倍数划分;

为使数据的分布满足穷尽和互斥的要求,注意到,按上面的分组方式,最小值24已落在最小组之中,最大值49已落在最大组之中,故将各组均设计成闭口形式;

按照“上限不在组内”的原则,用划记法或用Excel统计各组内数据的个数——天数,(见Excel练习题2.3)并填入表内,得到频数分布表如下表中的左两列;

将各组天数除以总天数40,得到各组频率,填入表中第三列;

得到频数分布表如下:

某百货公司日商品销售额分组表

按销售额分组(万元)

频数(天)

频率(%)

25~30

30~35

35~40

40~45

45~50

4

6

15

9

6

10.0

15.0

37.5

22.5

15.0

合计

40

100.0

直方图:

将上表(包含总标题,去掉合计栏)复制到Excel表中,点击:

图表向导→柱形图→选择子图表类型→完成。

即得到如下的直方图:

(见Excel练习题2.3)

 

●4.为了确定灯泡的使用寿命(小时),在一批灯泡中随机抽取100只进行测试,所得结果如下:

700

716

728

719

685

709

691

684

705

718

706

715

712

722

691

708

690

692

707

701

708

729

694

681

695

685

706

661

735

665

668

710

693

697

674

658

698

666

696

698

706

692

691

747

699

682

698

700

710

722

694

690

736

689

696

651

673

749

708

727

688

689

683

685

702

741

698

713

676

702

701

671

718

707

683

717

733

712

683

692

693

697

664

681

721

720

677

679

695

691

713

699

725

726

704

729

703

696

717

688

(1)利用计算机对上面的数据进行排序;

(2)以组距为10进行等距分组,整理成频数分布表,并绘制直方图;

(3)绘制茎叶图,并与直方图作比较。

解:

(1)排序:

将全部数据复制到Excel中,并移动到同一列,点击:

数据→排序→确定,即完成数据排序的工作。

(见Excel练习题2.4)

(2)按题目要求,利用已排序的Excel表数据进行分组及统计,得到频数分布表如下:

(见Excel练习题2.4)

100只灯泡使用寿命非频数分布

按使用寿命分组(小时)

灯泡个数(只)

频率(%)

650~660

2

2

660~670

5

5

670~680

6

6

680~690

14

14

690~700

26

26

700~710

18

18

710~720

13

13

720~730

10

10

730~740

3

3

740~750

3

3

合计

制作直方图:

将上表(包含总标题,去掉合计栏)复制到Excel表中,选择全表后,点击:

图表向导→柱形图→选择子图表类型→完成。

即得到如下的直方图:

(见Excel练习题2.4)

(3)制作茎叶图:

以十位以上数作为茎,填入表格的首列,将百、十位数相同的数据的个位数按由小到大的顺序填入相应行中,即成为叶,

得到茎叶图如下:

65

1

8

66

1

4

5

6

8

67

1

3

4

6

7

9

68

1

1

2

3

3

3

4

5

5

5

8

8

9

9

69

0

0

1

1

1

1

2

2

2

3

3

4

4

5

5

6

6

6

7

7

8

8

8

8

9

9

70

0

0

1

1

2

2

3

4

5

6

6

6

7

7

8

8

8

9

71

0

0

2

2

3

3

5

6

7

7

8

8

9

72

0

1

2

2

5

6

7

8

9

9

73

3

5

6

74

1

4

7

将直方图与茎叶图对比,可见两图十分相似。

●5.下面是北方某城市1~2月份各天气温的记录数据:

-3

2

-4

-7

-11

-1

7

8

9

-6

-7

-14

-18

-15

-9

-6

-1

0

5

-4

-9

-3

-6

-8

-12

-16

-19

-15

-22

-25

-24

-19

-21

-8

-6

-15

-11

-12

-19

-25

-24

-18

-17

-24

-14

-22

-13

-9

-6

0

-1

5

-4

-9

-3

-3

2

-4

-4

-16

-1

7

5

-6

-5

(1)指出上面的数据属于什么类型;

(2)对上面的数据进行适当的分组;

(3)绘制直方图,说明该城市气温分布的特点。

解:

(1)由于各天气温的记录数据属于数值型数据,它们可以比较高低,且0不表示没有,因此是定距数据。

(2)分组如下:

由于全部数据中,最大的为9,最小的为-25,知数据全距为9-(-25)=34;

为便于计算和分析,确定将数据分为7组,各组组距为5,组限以整5的倍数划分;

为使数据的分布满足穷尽和互斥的要求,注意到,按上面的分组方式,最小值-25已落在最小组之中,最大值9已落在最大组之中,故将各组均设计成闭口形式;

按照“上限不在组内”的原则,用划记法(或Excel排序法,见Excel练习题2.5)统计各组内数据的个数——天数,并填入表内,得到频数分布表如下表;

北方某城市1~2月份各天气温

分组

天数(天)

-25~-20

8

-20~-15

8

-15~-10

10

-10~-5

14

-5~0

14

0~5

4

5~10

7

合计

(3)制作直方图:

将上表(包含总标题,去掉合计栏)复制到Excel表中,点击:

图表向导→柱形图→选择子图表类型→完成。

即得到如下的直方图:

(见Excel练习题2.5)

●6.下面是某考试管理中心对2002年参加成人自学考试的12000名学生的年龄分组数据:

年龄

18~19

21~21

22~24

25~29

30~34

35~39

40~44

45~59

%

1.9

34.7

34.1

17.2

6.4

2.7

1.8

1.2

(1)对这个年龄分布作直方图;

(2)从直方图分析成人自学考试人员年龄分布的特点。

解:

(1)制作直方图:

将上表复制到Excel表中,点击:

图表向导→柱形图→选择子图表类型→完成。

即得到如下的直方图:

(见Excel练习题2.6)

(2)年龄分布的特点:

自学考试人员年龄的分布为右偏。

 

●9.某百货公司6月份各天的销售额数据如下(单位:

万元):

257

276

297

252

238

310

240

236

265

278

271

292

261

281

301

274

267

280

291

258

272

284

268

303

273

263

322

249

269

295

(1)计算该百货公司日销售额的均值、中位数和四分位数;

(2)计算日销售额的标准差。

解:

(1)将全部30个数据输入Excel表中同列,点击列标,得到30个数据的总和为8223,

于是得该百货公司日销售额的均值:

(见Excel练习题2.9)

=

=

=274.1(万元)

或点选单元格后,点击“自动求和”→“平均值”,在函数EVERAGE()的空格中输入“A1:

A30”,回车,得到均值也为274.1。

在Excel表中将30个数据重新排序,则中位数位于30个数据的中间位置,即靠中的第15、第16两个数272和273的平均数:

Me=

=272.5(万元)

由于中位数位于第15个数靠上半位的位置上,所以前四分位数位于第1~第15个数据的中间位置(第8位)靠上四分之一的位置上,

由重新排序后的Excel表中第8位是261,第15位是272,从而:

QL=261+

=261.25(万元)

同理,后四分位数位于第16~第30个数据的中间位置(第23位)靠下四分之一的位置上,由重新排序后的Excel表中第23位是291,第16位是273,从而:

QU=291-

=290.75(万元)。

(2)未分组数据的标准差计算公式为:

s=

利用上公式代入数据计算是个较为复杂的工作。

手工计算时,须计算30个数据的离差平方,并将其求和,()再代入公式计算其结果:

得s=21.1742。

(见Excel练习题2.9)

我们可以利用Excel表直接计算标准差:

点选数据列(A列)的最末空格,再点击菜单栏中“∑”符号右边的小三角“▼”,选择“其它函数”→选择函数“STDEV”→“确定”,在出现的函数参数窗口中的Number1右边的空栏中输入:

A1:

A30,→“确定”,即在A列最末空格中出现数值:

21.17412,即为这30个数据的标准差。

于是:

(万元)。

(见Excel练习题2.9)

●10.甲乙两个企业生产三种产品的单位成本和总成本资料如下:

产品

名称

单位成本

(元)

总成本(元)

甲企业

乙企业

A

B

C

15

20

30

2100

3000

1500

3255

1500

1500

比较哪个企业的总平均成本高?

并分析其原因。

解:

设产品单位成本为x,产量为f,则总成本为xf,

由于:

平均成本

=

=

,而已知数据中缺产量f的数据,

又因个别产品产量f=

=

从而

=

,于是得:

甲企业平均成本=

=19.41(元),

乙企业平均成本=

=18.29(元),

对比可见,甲企业的总平均成本较高。

原因:

尽管两个企业的单位成本相同,但单位成本较低的产品在乙企业的产量中所占比重较大,因此拉低了总平均成本。

●11.在某地区抽取的120家企业按利润额进行分组,结果如下:

按利润额分组(万元)

企业数(个)

200~300

19

300~400

30

400~500

42

500~600

18

600以上

11

合计

120

计算120家企业利润额的均值和标准差。

解:

设各组平均利润为x,企业数为f,则组总利润为xf,

由于数据按组距式分组,须计算组中值作为各组平均利润,列表计算得:

按利润额分组(万元)

组中值

企业数(个)

总利润

x

f

xf

200~300

250

19

4750

300~400

350

30

10500

400~500

450

42

18900

500~600

550

18

9900

600以上

650

11

7150

合计

120

51200

于是,120家企业平均利润为:

=

=

=426.67(万元);

分组数据的标准差计算公式为:

s=

手动计算须列表计算各组数据离差平方和(x-426.67)2f,并求和,再代入计算公式:

列表计算如下

组中值

企业数(个)

(x-426.67)2f

x

f

250

19

593033.4891

350

30

176348.667

450

42

22860.1338

550

18

273785.2002

650

11

548639.1779

合计

120

1614666.668

表格中(x-426.67)2f的计算方法:

方法一:

将表格复制到Excel表中,点击第三列的顶行单元格后,在输入栏中输入:

=(a3-426.67)*(a3-426.67)*b3,回车,得到该行的计算结果;

点选结果所在单元格,并将鼠标移动到该单元格的右下方,当鼠标变成黑“+”字时,压下左键并拉动鼠标到该列最后一组数据对应的单元格处放开,则各组数据的(x-426.67)2f计算完毕;

于是得标准差:

(见Excel练习题2.11)

s=

=

=116.48(万元)。

点击第三列的合计单元格后,点击菜单栏中的“∑”号,回车,即获得第三列数据的和。

方法二:

将各组组中值x复制到Excel的A列中,并按各组次数f在同列中复制,使该列中共有f个x,120个数据生成后,点选A列的最末空格,再点击菜单栏中“∑”符号右边的小三角“▼”,选择“其它函数”→选择函数“STDEV”→“确定”,在出现的函数参数窗口中的Number1右边的空栏中输入:

A1:

A30,→“确定”,即在A列最末空格中出现数值:

116.4845,即为这120个数据的标准差。

(见Excel练习题2.11)

于是得标准差:

s=116.4845(万元)。

●12.为研究少年儿童的成长发育状况,某研究所的一位调查人员在某城市抽取100名7~17岁的少年儿童作为样本,另一位调查人员则抽取了1000名7~17岁的少年儿童作为样本。

请回答下面的问题,并解释其原因。

(1)哪一位调查研究人员在其所抽取的样本中得到的少年儿童的平均身高较大?

或者这两组样本的平均身高相同?

(2)哪一位调查研究人员在其所抽取的样本中得到的少年儿童身高的标准差较大?

或者这两组样本的标准差相同?

(3)哪一位调查研究人员有可能得到这1100名少年儿童的最高者或最低者?

或者对两位调查研究人员来说,这种机会是相同的?

解:

(1)

(2)两位调查人员所得到的平均身高和标准差应该差不多相同,因为均值和标准差的大小基本上不受样本大小的影响。

(3)具有较大样本的调查人员有更大的机会取到最高或最低者,因为样本越大,变化的范围就可能越大。

 

●13.一项关于大学生体重状况的研究发现,男生的平均体重为60公斤,标准差为5公斤;女生的平均体重为50公斤,标准差为5公斤。

请回答下面的问题:

(1)是男生的体重差异大还是女生的体重差异大?

为什么?

(2)以磅为单位(1公斤=2.2磅),求体重的平均数和标准差。

(3)粗略地估计一下,男生中有百分之几的人体重在55公斤到65公斤之间?

(4)粗略地估计一下,女生中有百分之几的人体重在40公斤到60公斤之间?

解:

(1)由于两组的平均体重不相等,应通过比较离散系数确定体重差异较大的组:

因为女生的离散系数为

V=

=0.1

男生体重的离散系数为

V=

=0.08

对比可知女生的体重差异较大。

(2)男生:

=

=132(磅),

s=

=11(磅);

女生:

=

=110(磅),

s=

=11(磅);

(3)男生体重在55公斤到65公斤之间,即为以平均体重60为中心,一个标准差5为允许误差来估算平均体重的区间,即Z=1,应得置信程度F(z)=68%;

(4)女生体重在40公斤到60公斤之间,即为以平均体重50为中心,两个标准差5为允许误差来估算平均体重的区间,即Z=2,应得置信程度F(z)=95%。

●14.对10名成年人和10名幼儿的身高(厘米)进行抽样调查,结果如下:

成年组

166

169

172

177

180

170

172

174

168

173

幼儿组

68

69

68

70

71

73

72

73

74

75

(1)要比较成年组和幼儿组的身高差异,你会采用什么样的指标测度值?

为什么?

(2)比较分析哪一组的身高差异大?

解:

(1)应采用离散系数,因为成年人和幼儿的身高处于不同的水平,采用标准差比较不合适。

离散系数消除了不同组数据水平高低的影响,采用离散系数就较为合理。

(2)利用Excel进行计算,得成年组身高的平均数为172.1,标准差为4.202,从而得:

成年组身高的离散系数:

又得幼儿组身高的平均数为71.3,标准差为2.497,从而得:

幼儿组身高的离散系数:

由于幼儿组身高的离散系数大于成年组身高的离散系数,说明幼儿组身高的离散程度相对较大。

●15.一种产品需要人工组装,现有三种可供选择的组装方法。

为检验哪种方法更好,随机抽取15个工人,让他们分别用三种方法组装。

下面是15个工人分别用三种方法在相同的时

展开阅读全文
相关资源
猜你喜欢
相关搜索
资源标签

当前位置:首页 > 小学教育 > 学科竞赛

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1