统计学实验.docx

上传人:b****7 文档编号:23955638 上传时间:2023-05-22 格式:DOCX 页数:26 大小:245.07KB
下载 相关 举报
统计学实验.docx_第1页
第1页 / 共26页
统计学实验.docx_第2页
第2页 / 共26页
统计学实验.docx_第3页
第3页 / 共26页
统计学实验.docx_第4页
第4页 / 共26页
统计学实验.docx_第5页
第5页 / 共26页
点击查看更多>>
下载资源
资源描述

统计学实验.docx

《统计学实验.docx》由会员分享,可在线阅读,更多相关《统计学实验.docx(26页珍藏版)》请在冰豆网上搜索。

统计学实验.docx

统计学实验

统计学实验内容

一、频数统计

1.A公司在招聘时采用了综合能力测试(满分为100分),由于应聘的人数较多,现随机抽取了157名应聘者的测试成绩,其测试分数的数据如book1所示。

(1)根据上面的资料,进行分组,并确定组数和组距。

根据资料判断,进行分组,分为六组,组距为10。

(2)编制频率分布表

上限

成绩

频数

频率

19

10~20

16

0.101911

29

20~30

27

0.171975

39

30~40

56

0.356688

49

40~50

39

0.248408

58

50~60

14

0.089172

68

60~70

5

0.031847

合计

157

接收

频率

累积%

19

16

10.19%

29

27

27.39%

39

56

63.06%

49

39

87.90%

59

14

96.82%

69

5

100.00%

其他

0

100.00%

(3)画出直方图

2.为评价家电行业售后服务的质量,随机抽取了由100家庭构成的一个样本。

服务质量的等级分别表示为:

A.好;B.较好;C.一般;D.差;E.较差。

调查结果见book2。

(1)指出表中的数据属于什么类型?

定序型

(2)制作一张频数分布表;

服务质量等级

频数

频率

1

A

14

0.14

2

B

21

0.21

3

C

32

0.32

4

D

18

0.18

5

E

15

0.15

合计

100

(3)绘制一张条形图,反映服务质量的分布。

计数项:

服务质量等级

 

服务质量等级

汇总

A

14

B

21

C

32

D

18

E

15

总计

100

二、参数估计

1.已知灯管使用寿命服从正态分布,其标准差为50小时。

现从一批产品中抽取25个作为样本,测得其平均使用寿命为1600小时,要求在95%的概率保证下估计该批产品平均使用寿命的置信区间。

(运用CONFIDENCE函数)

标准差

50

置信度

0.95

样本容量

25

平均值

1600

极限误差

19.59964

置信区间

1580.4

1619.6

抽样平均误差19.59964,置信区间即(1580.4003~1619.59964)

2.在一篇关于“通货紧缩”的文章中,作者考察了各种各样投资的收益情况。

这些投资包括股票、债券以及房地产等。

这篇文章抽取的是样本容量为200的样本,计算的房地产投资收益(单位:

%)如book3所示。

同时根据经验假定,房地产投资收益的总体标准差为2.3%。

请你用区间估计的方法,采用95%的置信度估计房地产投资的平均收益率。

解:

用函数AVERAGE求得,样本均值=12.08

运用CONFIDENCE函数求得,CONFIDENCE(0.05,2.3,200)=0.318758,取房地产投资收益的△x=0.32

房地产投资收益的置信区间为(11.76,12.40)

3.MetropolitanResearch有限公司是一家消费者研究组织,它设计调查,对消费者所使用的大量的产品和服务进行评估。

在某一项研究中,Metropolitan调查消费者对底特律某一个主要制造商所生产的汽车的性能的满意程度。

分发给该制造商所生产的一种最大型号小汽车用户的调查表表明,许多人抱怨该车刚开始传动系统不佳。

为了更好地了解传动系统的问题,Metropolitan采用由底特律地区一个修理企业所提供的实际传动系统的维修记录为样本。

Book4数据是50辆汽车传动系统出现故障时所行驶的实际里程的数据。

(1)对样本数据进行描述性统计分析。

(2)求曾经出现过传动系统问题的汽车总体中在出现传动系统问题时所行驶里程的均值的95%置信区间。

运用CONFIDENCE函数求得,CONFIDENCE(0.05,24898.8,50)=6901.468428,取房地产投资收益的△x=6901.47,房地产投资收益的置信区间为(73342.3-6901.47,73342.3+6901.47)即(66440.83,80243.77)。

(3)如果研究公司想在5000英里的允许误差下,估计出现传动系统问题时所行驶里程的均值,则置信度为95%时应选取多大的样本容量?

运用公式样本容量

有知z=1.96,

24898.8,

5000,所以n=95.26故在置信度为95%时应选取样本容量为96。

三、方差分析(选做)

1.一家产品制造公司管理者想比较A、B、C三种不同的培训方式对产品组装时间的多少是否有显著影响,将26名新员工随机分配给每种培训方式。

在培训结束后,参加培训的员工组装一件产品所花的时间如book5所示(单位:

分钟)。

取显著性水平α=0.05,确定不同培训方式对产品组装的时间是否有显著影响?

2.一家食品制造商推出了一种新的产品,为了使新产品迅速占领市场,公司的市场营销部经理提出了三种营销方式,并且在三个地区分别采用这三种营销方式,然后观察营销方式所产生的产品销售额情况。

这三种营销方式在市场上推出之后,公司的统计分析人员随机抽查了20周的销售额数据(单位:

千元),如book6所示。

试问:

市场营销部经理提出的三种营销方式所产生的销售额是否存在显著性差异?

(取显著性水平α=0.05)

 

四、相关与回归分析

1.根据教材第207页表9-4的资料及补充的几个问题,进行相关与回归分析。

(1)根据表中数据绘制散点图,观察其相关类型。

(2)计算相关系数,判断相关密切程度。

计算得到相关系数为0.944。

故其相关关系密切程度为高度相关。

相关程度是显著的,说明年收入与寿险保额整体呈现正的线性关系。

(3)建立寿险保额对人均年收入的回归方程,并解释回归方程的相关含义。

(4)计算所建模型拟合优度并解释其意义。

R^2=0.8917,表明总平方和中的89.17%能够被估计的估计的回归方程y=2.2326x-2.8033所解释,换句话说,单位成本差异性的89.17%能够被产量与单位成本之间的线性关系所解释。

(5)在显著性水平

的情况下,检验总体回归方程和总体回归系数的显著性。

SUMMARYOUTPUT

回归统计

MultipleR

0.944285

RSquare

0.891675

AdjustedRSquare

0.878134

标准误差

4.669242

观测值

10

方差分析

 

df

SS

MS

F

SignificanceF

回归分析

1

1435.685

1435.685

65.85164

3.94E-05

残差

8

174.4145

21.80182

总计

9

1610.1

 

 

 

 

Coefficients

标准误差

tStat

P-value

Lower95%

Upper95%

下限95.0%

上限95.0%

Intercept

-2.80332

4.734442

-0.59211

0.570128

-13.721

8.114327

-13.721

8.114327

XVariable1

2.232619

0.275126

8.114902

3.94E-05

1.598178

2.86706

1.598178

2.86706

对总体回归方程显著性检验

提出假设:

Ho:

βo=0;H1:

β1≠0

根据回归分析知:

F=65.85164

F~F(1,n-2),n=10,α=0.05

查表得临界值F0.05=5.32

因为F>F0.05,所以拒绝Ho,接受H1。

所以总体回归方程存在且有意义。

对总体回归系数的显著性检验

假设Ho:

βo=0;H1:

β1≠0

根据回归分析知t=8.114902

α=0.05,t~(n-2),t0.05=1.8125

因为t>t0.05,所以拒绝Ho,接受H1。

所以总体回归系数存在显著性。

2.金融机构发放房屋抵押贷款必须了解市场上购买房屋的支付能力和支付状况,购房者的支付能力作为因变量y(用家庭平均月收入的百分比代表每月抵押贷款的平均支付能力),抵押贷款的成本费用作为自变量x(用抵押贷款的平均利率代表)。

统计分析人员随机收集了如book7所示的样本数据。

(1)采用最小二乘法求线性回归直线方程;

(2)计算可决系数,并解释其意义;

可决系数为0.9801,接近于1,表明估计的回归方程对样本数据的拟合效果较好。

(3)显著性水平设为α=0.05,采用t检验统计量进行检验:

购房者的支付能力与抵押贷款利率之间是否存在显著性的线性关系?

(4)显著性水平设为α=0.05,采用方差分析检验方法进行检验:

购房者的支付能力与抵押贷款利率之间是否存在显著性的线性关系?

SUMMARYOUTPUT

回归统计

MultipleR

0.99002042

RSquare

0.980140432

AdjustedRSquare

0.977657986

标准误差

0.219955429

观测值

10

方差分析

 

df

SS

MS

F

SignificanceF

回归分析

1

19.10196

19.10196

394.8285

4.29E-08

残差

8

0.387043

0.04838

总计

9

19.489

 

 

 

观测值

预测Y

残差

标准残差

1

22.24047

-0.24047

-1.15961

2

21.11866

0.281342

1.356677

3

19.31466

-0.01466

-0.07067

4

17.87449

0.225514

1.087465

5

18.34444

0.155564

0.750154

6

18.9205

-0.0205

-0.09887

7

18.70827

0.091732

0.442344

8

18.66279

0.037211

0.179435

9

17.78353

-0.38353

-1.84943

10

18.1322

-0.1322

-0.63749

 

Coefficients

标准误差

tStat

P-value

Lower95%

Upper95%

下限95.0%

上限95.0%

Intercept

7.020153877

0.612401

11.46333

3.04E-06

5.607954

8.432353

5.607954

8.432353

XVariable1

1.515968166

0.076293

19.87029

4.29E-08

1.340036

1.691901

1.340036

1.691901

(3)

假设Ho:

βo=0;H1:

β1≠0

根据回归分析知t=19.87029

α=0.05,n=10,t~(n-2),t0.05=1.8125

因为t>t0.05,所以拒绝Ho,接受H1。

所以购房者的支付能力与抵押贷款利率之间存在显著性的线性关系。

(4)

提出假设:

Ho:

βo=0;H1:

β1≠0

根据回归分析知:

F=394.8285

F~F(1,n-2),n=10,α=0.05

查表得临界值F0.05=5.32

因为F>F0.05,所以拒绝Ho,接受H1。

所以购房者的支付能力与抵押贷款利率之间存在显著性的线性关系。

五、时间序列分析

1.从国家统计局网站上搜集2000-2012年各年按不变价计算的GDP资料。

要求:

(1)计算这段时间的经济增长率(即按不变价计算的GDP的平均增长速度);

(2)用3期移动平均法预测2013年的GDP。

预计2013年GDP=464519.65

(3)建立一个趋势直线方程,预测2014年的GDP。

年份

GDP(亿元)

增长速度

三期移动平均

2000

99214.55

2001

109655.2

0.105232751

109734.1367

2002

120332.7

0.097373612

121936.8733

2003

135822.8

0.128727032

138677.93

2004

159878.3

0.177110081

160212.8233

2005

184937.4

0.156738117

187043.38

2006

216314.4

0.169663168

222354.0367

2007

265810.3

0.228814509

265390.0567

2008

314045.4

0.181464444

306919.5167

2009

340902.8

0.085520684

352153.68

2010

401512.8

0.17779258

405173.22

2011

473104.1

0.17830378

464519.65

2012

518942.1

0.096887883

2013年预测GDP=464519.65

2.教材第122页,第5题。

年份

人口数

1999

8763

2000

8861

2001

8946

2002

9027

2003

9100

2004

9172

2005

9243

2006

9315

根据图表预测可知,2007年人口数为9400万人

3.某地区1992-2000年自行车的销售量数据见book8。

要求:

配合二次曲线(试用“回归”分析工具),算出各年的趋势值,画出二次曲线趋势图。

年份

销售量(万辆)

t

t*t

1992

34

1

1

1993

42

2

4

1994

58

3

9

1995

81

4

16

1996

93

5

25

1997

105

6

36

1998

109

7

49

1999

98

8

64

2000

96

9

81

SUMMARYOUTPUT

回归统计

MultipleR

0.97799

RSquare

0.956464

AdjustedRSquare

0.941952

标准误差

6.738659

观测值

9

方差分析

 

df

SS

MS

F

SignificanceF

回归分析

2

5985.765

2992.883

65.9087

8.25E-05

残差

6

272.4571

45.40952

总计

8

6258.222

 

 

 

 

Coefficients

标准误差

tStat

P-value

Lower95%

Upper95%

下限95.0%

上限95.0%

Intercept

-0.09524

8.574391

-0.01111

0.991498

-21.076

20.88554

-21.076

20.88554

t

27.84286

3.937026

7.072052

0.000401

18.2093

37.47641

18.2093

37.47641

t*t

-1.88095

0.383971

-4.89869

0.002714

-2.82049

-0.94141

-2.82049

-0.94141

RESIDUALOUTPUT

观测值

预测销售量(万辆)

残差

1

25.86667

8.133333

2

48.06667

-6.06667

3

66.50476

-8.50476

4

81.18095

-0.18095

5

92.09524

0.904762

6

99.24762

5.752381

7

102.6381

6.361905

8

102.2667

-4.26667

9

98.13333

-2.13333

Y=a+bt+ct*t

x1=t,x2=t*t,则由回归分析数据知a=-0.095238095,b=27.84285714,c=-1.880952381

Y=-0.095238095+27.84285714t-1.880952381t*t

4.某啤酒生产企业2000-2005年各季度销售量如book9所示。

要求:

(1)运用趋势剔除法测定各季度季节比率;

(2)建立恰当的趋势方程;

(3)考虑季节影响,预测2006年第一和第二季度的销售量。

某啤酒生产企业2000-2005年各季度的销售量如下:

时间

时间序号

销售量

四季度移动平均

趋势值T

Y/T(%)

2000.1

1

25

2

2

32

30

3

3

37

31.25

30.625

118.4

4

4

26

32.75

32

79.38931298

2001.1

5

30

34

33.375

88.23529412

2

6

38

35

34.5

108.5714286

3

7

42

34.75

34.875

120.8633094

4

8

30

35

34.875

85.71428571

2002.1

9

29

37

36

78.37837838

2

10

39

38.25

37.625

101.9607843

3

11

50

38.5

38.375

129.8701299

4

12

35

38.5

38.5

90.90909091

2003.1

13

30

38.75

38.625

77.41935484

2

14

39

39.25

39

99.36305732

3

15

51

39

39.125

130.7692308

4

16

37

39.75

39.375

93.08176101

2004.1

17

29

40.75

40.25

71.16564417

2

18

42

41

40.875

102.4390244

3

19

55

41.5

41.25

132.5301205

4

20

38

41.75

41.625

91.01796407

2005.1

21

31

41.5

41.625

74.69879518

2

22

43

42.25

41.875

101.7751479

3

23

54

4

24

41

季度

2000年

2001年

2002年

2003年

2004年

2005年

合计

同季平均

季节比率

1

88.23529412

78.37837838

77.41935484

71.16564417

74.69879518

389.89747

77.97949334

78.90456596

2

108.5714286

101.9607843

99.36305732

102.4390244

101.7751479

514.10944

102.8218885

104.0416671

3

118.4

120.8633094

129.8701299

130.7692308

132.5301205

632.43279

126.4865581

127.9870712

4

79.38931

85.71428571

90.90909091

93.08176101

91.01796407

440.11241

88.02248294

89.06669578

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > PPT模板 > 商务科技

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1