统计学习题1.docx

上传人:b****5 文档编号:5238196 上传时间:2022-12-14 格式:DOCX 页数:17 大小:128.88KB
下载 相关 举报
统计学习题1.docx_第1页
第1页 / 共17页
统计学习题1.docx_第2页
第2页 / 共17页
统计学习题1.docx_第3页
第3页 / 共17页
统计学习题1.docx_第4页
第4页 / 共17页
统计学习题1.docx_第5页
第5页 / 共17页
点击查看更多>>
下载资源
资源描述

统计学习题1.docx

《统计学习题1.docx》由会员分享,可在线阅读,更多相关《统计学习题1.docx(17页珍藏版)》请在冰豆网上搜索。

统计学习题1.docx

统计学习题1

(一).下面是北方某城市1~2月份各天气温的记录数据:

-3

2

-4

-7

-11

-1

7

8

9

-6

-7

-14

-18

-15

-9

-6

-1

0

5

-4

-9

-3

-6

-8

-12

-16

-19

-15

-22

-25

-24

-19

-21

-8

-6

-15

-11

-12

-19

-25

-24

-18

-17

-24

-14

-22

-13

-9

-6

0

-1

5

-4

-9

-3

-3

2

-4

-4

-16

-1

7

5

-6

-5

1.指出上面数据属于什么类型?

2.对上面数据进行适当分组

3.绘制直方图,说明该城市气温分布的特点

解:

(1)由于各天气温的记录数据属于数值型数据,它们可以比较高低,且0不表示没有,因此是定距数据。

(2)分组如下:

由于全部数据中,最大的为9,最小的为-25,知数据全距为9-(-25)=34;

为便于计算和分析,确定将数据分为7组,各组组距为5,组限以整5的倍数划分;

为使数据的分布满足穷尽和互斥的要求,注意到,按上面的分组方式,最小值-25已落在最小组之中,最大值9已落在最大组之中,故将各组均设计成闭口形式;

按照“上限不在组内”的原则,用划记法或Excel排序法统计各组内数据的个数——天数,并填入表内,得到频数分布表如下表;

北方某城市1~2月份各天气温

按气温分组

频数

-25~-20

8

-20~-15

8

-15~-10

10

-10~-5

14

-5~-0

14

0~5

4

5~10

7

合计

65

 

(二).某百货公司6月份各天的销售额数据如下(单位:

万元):

257

276

297

252

238

310

240

236

265

278

271

292

261

281

301

274

267

280

291

258

272

284

268

303

273

263

322

249

269

295

(1)计算该百货公司日销售额的均值、中位数和四分位数;

(2)计算日销售额的标准差。

解:

(1)

将全部30个数据输入Excel表中同列,点选单元格后,点击“自动求和”→“平均值”,在函数EVERAGE()的空格中输入“A1:

A30”,回车,

=274.1(万元)

在Excel表中将30个数据重新排序,则中位数位于30个数据的中间位置,即靠中的第15、第16两个数272和273的平均数:

=272.5(万元)

由于中位数位于第15个数靠上半位的位置上,所以前四分位数位于第1~第15个数据的中间位置(第8位)靠上四分之一的位置上,

由重新排序后的Excel表中第8位是261,第15位是272,从而:

同理,后四分位数位于第16~第30个数据的中间位置(第23位)靠下四分之一的位置上,由重新排序后的Excel表中第23位是291,第16位是273,从而:

(2)未分组数据的标准差计算公式为:

点选数据列(A列)的最末空格,再点击菜单栏中“∑”符号右边的小三角“▼”,选择“其它函数”→选择函数“STDEV”→“确定”,在出现的函数参数窗口中的Number1右边的空栏中输入:

A1:

A30,→“确定”,即在A列最末空格中出现数值:

21.17412,即为这30个数据的标准差。

于是:

s=21.17412

(三).在某地区抽取的120家企业按利润额进行分组,结果如下:

按利润额分组(万元)

企业数(个)

200~300

19

300~400

30

400~500

42

500~600

18

600以上

11

合计

120

计算120家企业利润额的均值和标准差。

解:

设各组平均利润为

,企业数为

,则组总利润为

由于数据按组距式分组,须计算组中值作为各组平均利润,列表计算得:

按利润额分组(万元)

组中值

企业数(个)

总利润

200~300

250

19

4750

300~400

350

30

10500

400~500

450

42

18900

500~600

550

18

9900

600以上

650

11

7150

合计

120

51200

于是,120家企业平均利润为:

=426.67(万元);

分组数据的标准差计算公式为:

s=

手动计算须列表计算各组数据离差平方和

,并求和,再代入计算公式:

列表计算如下

组中值x

企业数(个)a

(x-426.67)^2*a

250

19

593033.4891

350

30

176348.667

450

42

22860.1338

550

18

273785.2002

650

11

548639.1779

合计

120

1614666.668

表格中

的计算方法:

将表格复制到Excel表中,点击第三列的顶行单元格后,在输入栏中输入:

=(a3-426.67)*(a3-426.67)*b3,回车,得到该行的计算结果;

点选结果所在单元格,并将鼠标移动到该单元格的右下方,当鼠标变成黑“+”字时,压下左键并拉动鼠标到该列最后一组数据对应的单元格处放开,则各组数据的(x-426.67)2f计算完毕;于是得标准差:

s=116.48(万元)。

(四).一种产品需要人工组装,现有三种可供选择的组装方法。

为检验哪种方法更好,随机抽取15个工人,让他们分别用三种方法组装。

下面是15个工人分别用三种方法在相同的时间内组装的产品数量(单位:

个):

方法A

方法B

方法C

164

129

125

167

130

126

168

129

126

165

130

127

170

131

126

165

130

128

164

129

127

168

127

126

164

128

127

162

128

127

163

127

125

166

128

126

167

128

116

166

125

126

165

132

125

(1)你准备采用什么方法来评价组装方法的优劣?

(2)如果让你选择一种方法,你会作出怎样的选择?

试说明理由。

解:

(1)下表给计算出这三种组装方法的一些主要描述统计量:

方法A

方法B

方法C

平均

165.6

平均

128.7333

平均

125.5333

中位数

165

中位数

129

中位数

126

众数

164

众数

128

众数

126

标准偏差

2.131398

标准偏差

1.75119

标准偏差

2.774029

极差

8

极差

7

极差

12

最小值

162

最小值

125

最小值

116

最大值

170

最大值

132

最大值

128

离散系数

0.012871

离散系数

0.013603

离散系数

0.022098

评价优劣应根据离散系数,离散系数=标准偏差/平均据上得:

方法A的离散系数VA=0.012871,

方法B的离散系数VB=0.013603,

方法C的离散系数VC=0.022098;

对比可见,方法A的离散系数最低,说明方法A最优。

(2)我会选择方法A,因为方法A的平均产量最高而离散系数最低,说明方法A的产量高且稳定,有推广意义。

(五).为评价家电行业售后服务的质量,随机抽取了由100家庭构成的一个样本。

服务质量的等级分别表示为:

A.好;B.较好;C.一般;D.差;E.较差。

调查结果如下:

B

E

C

C

A

D

C

B

A

E

D

A

C

B

C

D

E

C

E

E

A

D

B

C

C

A

E

D

C

B

B

A

C

D

E

A

B

D

D

C

C

B

C

E

D

B

C

C

B

C

D

A

C

B

C

D

E

C

E

B

B

E

C

C

A

D

C

B

A

E

B

A

C

D

E

A

B

D

D

C

A

D

B

C

C

A

E

D

C

B

C

B

C

E

D

B

C

C

B

C

(1)指出上面的数据属于什么类型;

(2)用Excel制作一张频数分布表;

(3)绘制一张条形图,反映评价等级的分布。

解:

(1)由于表中的数据为服务质量的等级,可以进行优劣等级比较,但不能计算差异大小,属于顺序数据。

(2)频数分布表如下:

服务质量等级评价的频数分布

服务质量等级

家庭数(频数)

频率%

A

14

14

B

21

21

C

32

32

D

18

18

E

15

15

合计

100

100

(3)条形图的制作:

将上表(包含总标题,去掉合计栏)复制到Excel表中,点击:

图表向导→条形图→选择子图表类型→完成。

即得到如下的条形图:

(六).为了确定灯泡的使用寿命(小时),在一批灯泡中随机抽取100只进行测试,所得结果如下:

700

716

728

719

685

709

691

684

705

718

706

715

712

722

691

708

690

692

707

701

708

729

694

681

695

685

706

661

735

665

668

710

693

697

674

658

698

666

696

698

706

692

691

747

699

682

698

700

710

722

694

690

736

689

696

651

673

749

708

727

688

689

683

685

702

741

698

713

676

702

701

671

718

707

683

717

733

712

683

692

693

697

664

681

721

720

677

679

695

691

713

699

725

726

704

729

703

696

717

688

(1)利用计算机对上面的数据进行排序;

(2)以组距为10进行等距分组,整理成频数分布表,并绘制直方图;

(3)绘制茎叶图,并与直方图作比较。

解:

(1)排序:

将全部数据复制到Excel中,并移动到同一列,点击:

数据→排序→确定,即完成数据排序的工作。

(2)按题目要求,利用已排序的Excel表数据进行分组及统计,得到频数分布表如下:

100只灯泡使用寿命非频数分布

按使用寿命分组(小时)

灯泡个数(只)

频率(%)

650~660

2

2

660~670

5

5

670~680

6

6

680~690

14

14

690~700

26

26

700~710

18

18

710~720

13

13

720~730

10

10

730~740

3

3

740~750

3

3

合计

100

100

制作直方图:

将上表(包含总标题,去掉合计栏)复制到Excel表中,选择全表后,点击:

图表向导→柱形图→选择子图表类型→完成。

即得到如下的直方图:

(3)制作茎叶图:

以十位以上数作为茎,填入表格的首列,将百、十位数相同的数据的个位数按由小到大的顺序填入相应行中,即成为叶,

得到茎叶图如下:

65

1

8

66

1

4

5

6

8

67

1

3

4

6

7

9

68

1

1

2

3

3

3

4

5

5

5

8

8

9

9

69

0

0

1

1

1

1

2

2

2

3

3

4

4

5

5

6

6

6

7

7

8

8

8

8

9

9

70

0

0

1

1

2

2

3

4

5

6

6

6

7

7

8

8

8

9

71

0

0

2

2

3

3

5

6

7

7

8

8

9

72

0

1

2

2

5

6

7

8

9

9

73

3

5

6

74

1

4

7

将直方图与茎叶图对比,可见两图十分相似。

(7)对10名成年人和10名幼儿的身高进行抽样调查,结果如下:

成年组

166169l72177180170172174168173

幼儿组

686968707l7372737475

要求:

(1)如果比较成年组和幼儿组的身高差异,你会采用什么样的统计量?

为什么?

解:

均值不相等,用离散系数衡量身高差异。

(2)比较分析哪一组的身高差异大?

解:

(1)应采用离散系数,因为成年人和幼儿的身高处于不同的水平,采用标准差比较不合适。

离散系数消除了不同组数据水平高低的影响,采用离散系数就较为合理。

利用Excel进行计算,把上面数据输到excel表格中,用AVERAGE和STDEV函数分别算出成年组和幼儿组的平均数和方差;

成年组

幼儿组

平均数

172.1

71.3

标准差

4.201851444

2.496664441

离散系数

0.024415174

0.035016332

由表可知,幼儿组身高的离散系数大于成年组身高的离散系数,说明幼儿组身高的离散程度相对较大。

八.调节一个装瓶机使其对每个瓶子的灌装量均值为

盎司,通过观察这台装瓶机对每个瓶子的灌装量服从标准差

盎司的正态分布。

随机抽取由这台机器灌装的9个瓶子形成一个样本,并测定每个瓶子的灌装量。

试确定样本均值偏离总体均值不超过0.3盎司的概率。

解:

总体方差知道的情况下,均值的抽样分布服从

的正态分布,由正态分布,标准化得到标准正态分布:

z=

,因此,样本均值不超过总体均值的概率P为:

=

=

=

=2

-1,查标准正态分布表得

=0.8159

因此,

=0.6318

九.假定装瓶机对瓶子的灌装量服从方差

的标准正态分布。

假定我们计划随机抽取10个瓶子组成样本,观测每个瓶子的灌装量,得到10个观测值,用这10个观测值我们可以求出样本方差

,确定一个合适的范围使得有较大的概率保证S2落入其中是有用的,试求b1,b2,使得

解:

更加样本方差的抽样分布知识可知,样本统计量:

此处,n=10,

,所以统计量

根据卡方分布的可知:

又因为:

因此:

则:

查概率表:

=3.325,

=19.919,则

=0.369,

=1.88

(十)

,……,

表示从标准正态总体中随机抽取的容量,n=6的一个样本,试确定常数b,使得

解:

由于卡方分布是由标准正态分布的平方和构成的:

设Z1,Z2,……,Zn是来自总体N(0,1)的样本,则统计量

服从自由度为n的χ2分布,记为χ2~χ2(n)

因此,令

,则

,那么由概率

,可知:

b=

,查概率表得:

b=12.59

(十一)一项关于大学生体重状况的研究发现.男生的平均体重为60kg,标准差为5kg;女生的平均体重为50kg,标准差为5kg。

请回答下面的问题:

(1)是男生的体重差异大还是女生的体重差异大?

为什么?

(2)以磅为单位(1kg=2.21b),求体重的平均数和标准差。

(3)粗略地估计一下,男生中有百分之几的人体重在55kg一65kg之间?

(4)粗略地估计一下,女生中有百分之几的人体重在40kg~60kg之间?

解:

(1)因为你男女生的体重标准差相同,而男生体重的离散系数为

女生的变异系数=5/50=0.1

所以女生的变异系数大

(2)x代表男生,y代表女生。

D代表方差。

E代表数学期望,也就是均值。

E(x)=60kgD(x)=5kg;E(y)=50kgD(y)=5kg

又因为每个男生的体重X=x*2.21(b);每个女生的体重Y=x*2.21(b);

所以E(M)=E(m/2.2)=E(m)/2.2=60/2.2=27.272727272727

D(M)=D(m/2.2)=D(m)/2.2²=D(m)/4.84=1.0330578512397

同理E(W)=22.727272727273

D(W)=1.0330578512397

附注:

如果需要标准差,就把方差开根号。

(3)

这里要用正态分布概率模型。

m~N(60,5²)

则(m-60)/5~N(0,1)

因为55≤m≤65

所以-1≤(m-60)/5≤1

概率为p(m)=Φ

(1)-Φ(-1)=2Φ

(1)-1=0.6286

(4)同理(3)的做法

p(w)=2Φ

(2)-1=0.9544

(十二)随机抽取25个网络用户,得到他们的年龄数据如下:

单位:

周岁

19

15

29

25

24

23

21

38

22

18

30

20

19

19

16

23

27

22

34

24

41

20

31

17

23

要求;

(1)计算众数、中位数:

19和23、23

(2)排序形成单变量分值的频数分布和累计频数分布:

 

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 高等教育 > 艺术

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1