统计学原理课设.docx

上传人:b****5 文档编号:29474953 上传时间:2023-07-23 格式:DOCX 页数:12 大小:100.64KB
下载 相关 举报
统计学原理课设.docx_第1页
第1页 / 共12页
统计学原理课设.docx_第2页
第2页 / 共12页
统计学原理课设.docx_第3页
第3页 / 共12页
统计学原理课设.docx_第4页
第4页 / 共12页
统计学原理课设.docx_第5页
第5页 / 共12页
点击查看更多>>
下载资源
资源描述

统计学原理课设.docx

《统计学原理课设.docx》由会员分享,可在线阅读,更多相关《统计学原理课设.docx(12页珍藏版)》请在冰豆网上搜索。

统计学原理课设.docx

统计学原理课设

摘要

随着经济的发展和社会的进步,无论在国家宏观调控还是企业和个人的微观决策中,统计的作用日益重要。

作为一门介绍“数据处理技巧”的方法论的社会科学,统计学的重要意义在于为科学研究、经营决策等提供数据分析模型和数据分析方法。

统计学是应用数学的一个分支,主要通过利用概率论建立数学模型,收集所观察系统的数据,进行量化的分析、总结,并进而进行推断和预测,为相关决策提供依据和参考。

它被广泛的应用在各门学科之上,从物理和社会科学到人文科学,甚至被用来工商业及政府的情报决策之上。

统计学主要又分为描述统计学和推断统计学。

给定一组数据,统计学可以摘要并且描述这份数据,这个用法称作为描述统计学。

另外,观察者以数据的形态建立出一个用以解释其随机性和不确定性的数学模型,以之来推论研究中的步骤及母体,这种用法被称做推论统计学。

这两种用法都可以被称作为应用统计学。

另外也有一个叫做数理统计学的学科专门用来讨论这门科目背后的理论基础。

本文通过excel软件对六个工业部门的原料出厂价格指数进行分析。

关键词:

统计学、数学模型、excel、统计分析

 

目录

 

各工业部门原料出厂价格指数的统计分析

1.设计目的

为了更好地了解统计学原理的知识,熟练掌握其在实际问题上的应用,并将所学的知识结合Excel对数据的处理解决实际问题。

本设计是对各工业部门出厂价格指数建立数学模型,并用Excel软件对这些指数进行分析,得出综合指标和动态数列。

2.设计问题

工业生产是社会再生产的重要组成部分。

在我国,工业部门是国民经济中所占比重较高的物质生产部门,为了了解其原料出厂价格,现在中国统计年鉴上查得1990-2011年的六个工业部门的原料出厂价格指数,表格见附表。

3.设计原理

本文是分析我国六个工业部门原料出厂价格问题,首先做出该组数据的折线图,由图分析这些数据的变化趋势,可以利用Excel软件进行进一步分析。

通过对这些数据的相关分析、方差分析及时间序列分析,做出其散点图、时间序列的移动平均图,来得到有关这六个工业部门原料出厂价格的结论。

4.设计程序

4.1描述统计分析

(1)折线图:

折线统计图不仅可以表示数量的多少,而且可以反映不同工业在不同的时间里的发展变化情况。

石油工业的增长和减少较为明显,而其它工业的变化不太明显。

图1各工业部门原料出厂价格折线图

(2)数据描述:

各样本分布的大体描述,给出了各个工业的平均数、标准误差、中位数、众数、标准差、方差、峰度、偏度、最大值、最小值、总和以及置信区间,整体把握样本基本统计特征。

表1各工业部门原料出厂价格的数字特征

冶金工业

电力工业

纺织工业

平均值

106.8695

108.0459

103.7141

标准误差

2.927861

2.276522

1.993583

中位数

106.8

102.58

101.74

众数

114.2

100.9

96

标准差

13.73289

10.67783

9.350731

方差

188.5922

114.0161

87.43618

峰度

8.941729

4.361506

7.007432

偏度

2.364474

2.183488

2.329556

区域

71.9

38.75

42.7

最小值

85.8

100.75

94.1

最大值

157.7

139.5

136.8

求和

2351.13

2377.01

2281.71

观测数

22

22

22

最大

(1)

157.7

139.5

136.8

最小

(1)

85.8

100.75

94.1

置信度(95.0%)

6.088821

4.734286

4.145882

化学工业

建筑材料工业

纺织工业

平均

103.445

104.2336

103.7141

标准误差

1.617073

2.011321

1.993583

中位数

102.55

101.78

101.74

众数

106.78

99.6

96

标准差

7.584746

9.43393

9.350731

方差

57.52838

88.99903

87.43618

峰度

2.812806

14.3282

7.007432

偏度

1.195758

3.502302

2.329556

区域

34.1

46.2

42.7

最小值

92.1

96.6

94.1

最大值

126.2

142.8

136.8

求和

2275.79

2293.14

2281.71

观测数

22

22

22

最大

(1)

126.2

142.8

136.8

最小

(1)

92.1

96.6

94.1

置信度(95.0%)

3.362888

4.18277

4.145882

4.2时间序列分析

移动平均法是一种简单的时间序列处理和预测方法,它的基本思想是根据时间序列资料的排列方式,对时间序列逐项进行推移计算,依次计算包含在一定周期内的时间序列平均值,以该周期数据的平均值反映此阶段时间序列的数据变化趋势。

因此,由于周期变动和随机波动的影响会造成时间序列的数值波动,当数据起伏较大,不易直观地推测其发展趋势时,使用移动平均法就可以减弱或消除这些因素的影响,从而显示出数据的发展趋势,通过绘制数据移动的平均趋势线,可以直观地解释和预测数据的发展趋势。

要预测2012年的冶金工业的原料出厂价格,对其进行时间序列分析,移动平均为三年和五年。

表2冶金工业移动平均

三年移动平均

误差

五年移动平均

误差

#N/A

#N/A

#N/A

#N/A

#N/A

#N/A

#N/A

#N/A

112.9

#N/A

#N/A

#N/A

128.7

#N/A

#N/A

#N/A

126.2

20.16882

120.6

#N/A

123.3

22.63244

119.7

#N/A

103.3

15.57152

116.4

#N/A

100.2

10.92367

113.0

#N/A

96.0

4.023128

100.1

14.3998

95.4

2.379231

97.9

13.03497

97.4

3.811144

97.4

11.68605

99.2

3.433711

97.6

8.183359

99.8

3.664634

97.7

4.203751

101.0

3.616385

100.4

4.010442

107.1

6.709936

104.6

6.731219

110.2

6.86033

105.3

6.235817

109.0

6.841592

106.3

6.365329

106.2

4.049842

108.4

6.365179

107.9

4.258559

109.5

5.792576

102.0

9.745789

103.2

8.016596

102.4

10.47543

103.7

8.376764

101.7

11.24072

105.1

8.535057

以时间为水平轴,分别以实际的原料出厂价格、三年移动平均结果和五年移动平均结果为数据系列作折线图,得到两种移动平均结果的对比,如图2。

可见N=5时,移动平均曲线的拟合效果较好,模型比较适合此例,所以下一年的冶金工业的原料出厂价格是105.1。

图2两种移动平均结果的对比

4.3相关分析

(1)散点图:

在进行相关分析时,有时只需要定性地确定数据之间的相关关系,不要去具体地求解相关程度,这时可以利用相关分析的图示法来解决问题。

数值型变量一般采用散点图法,这是观察两个变量之前关系的一种非常直观的方法,以横轴表示年份变量,以纵轴表示石油工业原料出厂价格变量,将两个变量之间相对应的变量值以坐标点的形式逐一标在直角坐标系中,作出其散点图,是以周期为2的移动平均的趋势线发展的。

图3石油工业原料出厂价格与年份散点图

(2)相关系数:

为了描述定量的相关关系,在相关分析中引入了相关系数的概念,用以描述变量之间相关的程度,利用PEARSON函数求解各工业部门和年份的相关系数。

年份和冶金工业相关系数:

=PEARSON(A2:

A23,B2:

B23)=0.87356792

年份和电力工业相关系数:

=PEARSON(A2:

A23,C2:

C23)=-1

年份和石油工业相关系数:

=PEARSON(A2:

A23,D2:

D23)=0.786816135

年份和化学工业相关系数:

=PEARSON(A2:

A23,E2:

E23)=0.903099935

年份和建筑材料工业相关系数:

=PEARSON(A2:

A23,F2:

F23)=0.959588691

年份和纺织工业相关系数:

=PEARSON(A2:

A23,G2:

G23)=0.937719422

由上面的结果可以看出:

年份和冶金工业、石油工业、化学工业、建筑材料工业、纺织工业的相关系数接近于1,且为正数,说明两者之间存在正相关关系;年份和电力工业的相关系数为-1,说明两者之间的相关关系很弱,是负相关。

(3)相关矩阵:

如果需要同时求解出多个变量之间的相关系数,可以利用相关系数分析工具求解出相关矩阵,它是由矩阵各列间的相关系数构成的,即第i行第j列的元素是原数据第i行第j列的相关系数。

表3相关矩阵

 

冶金工业

电力工业

石油工业

化学工业

建筑材料工业

纺织工业

冶金工业

1

 

 

 

 

 

电力工业

0.531237

1

 

 

 

 

石油工业

0.762909

0.650678

1

 

 

 

化学工业

0.430882

0.372746

0.560814

1

 

 

建筑材料工业

0.895418

0.672075

0.716353

0.385494

1

 

纺织工业

0.220197

0.552651

0.552059

0.739134

0.20706553

1

4.4方差分析

根据控制变量的个数,方差分析可以分为单因素方差分析和多因素方差分析两类,单因素方差分析也称一维方差分析。

它检验由单一因素影响的一个或几个相互独立的因变量各个水平分组均值之间的差异显著水平是否达到指定的水平,还可以对该因素的若干水平分组中某一组与其他各组均值间是否具有显著性差异进行分析,即进行均值的多重比较。

表4方差分析结果表

SUMMARY

观测数

求和

平均

方差

冶金工业

22

2351.13

106.8695

188.5922

电力工业

22

2377.01

108.0459

114.0161

石油工业

22

2556.26

116.1936

377.4399

化学工业

22

2275.79

103.445

57.52838

建筑材料工业

22

2293.14

104.2336

88.99903

纺织工业

22

2281.71

103.7141

87.43618

方差分析

差异源

SS

df

MS

F

P-value

Fcrit

组间

2566.958

5

513.3916

3.370142

0.006842

2.286184

组内

19194.25

126

152.3353

总计

21761.21

131

 

 

 

 

由上面的结果可以看出:

组间行的数据对应着各个控制变量水平间的统计量,是体现六个工业部门之间原料出厂价格的统计量;组内行的数据对应着各个控制变量水平内部的统计量,是体现六个工业部门原料出厂价格内部波动的统计量;SS列是组内与组间的离差平方和;对应df列组内与组间的自由度,此处组间自由度为5,组内自由度为126;对应MS列组间均方和组内均方,是SS列数值除以df列数值所得的结果;F列对应所求的检验统计量,是组间均方和组内均方比值;P-value列为检验统计量F在F分布中的概率值,此处小于设定的假设检验水平0.05;Fcrit列是进行方差分析的检验标准,是F分布中对应假设检验水平0.05的临界值;总计行对应着总体离差平方和的值和总自由度的值。

F=3.370142>Fcrit=2.286184,也就是各工业部门原料出厂价格差异水平在总的差异水平中贡献率较高,并且P-value=0.006842<0.05,所以,在检验水平为0.05时,可以认为各工业部门原料出厂价格不同。

5.设计总结

通过对统计学原理的这道实际问题的解决,不仅使我更加深刻的了解了统计学原理的基本知识,对相关分析、时间序列分析都有了了解,而且使我对这些知识在实际中的应用产生了浓厚的兴趣,同时对我学习好统计学原理这门课程有很大的帮助。

在实现这道题的过程中我应用了Excel软件,学会了这个软件的一些新的应用,更加熟练的操作该软件进行一些数据上的处理。

 

致谢

本论文是马建军老师指导下完成的。

他严肃的科学态度,严谨的治学精神,精益求精的工作作风,深深地感染和激励着我。

在此,我向马老师致以诚挚的谢意和崇高的敬意。

同时我还要感谢我的同学们,在论文设计中,他们给了我很多的建议和帮助。

 

参考文献

[1]马禄义.Excel统计分析典型实例.北京.科学出版社.

[2]李洁明.祁新娥.统计学原理.上海.复旦大学出版社.

[3]沈恒范.概率论与数理统计教程[M].第四版.北京高等教育出版社.

 

附表

年份

冶金工业

电力工业

石油工业

化学工业

建筑材料工业

纺织工业

1990

110.3

107.4

107.1

101.6

99.6

107.2

1991

114.2

116.9

118.8

102.4

106.1

104.1

1992

114.2

108.8

115.3

102.7

111.1

99.3

1993

157.7

135.9

171.3

108.3

142.8

103.8

1994

106.8

139.5

148.7

115.4

107.6

136.8

1995

105.5

109.5

121.2

126.2

106.4

117.3

1996

97.7

113.1

104.6

103.4

104.3

96.0

1997

97.3

114.0

107.4

95.5

99.6

98.0

1998

93.1

105.5

93.0

92.9

96.6

94.1

1999

95.8

100.9

109.6

96.5

97.7

96.0

2000

103.3

102.4

144.3

101.0

99.6

104.7

2001

98.6

102.3

99.1

97.1

99.0

98.7

2002

97.6

100.8

95.2

97.6

97.8

94.7

2003

106.8

100.9

115.6

102.3

99.6

102.2

2004

116.9

102.4

114.2

107.7

103.5

104.7

2005

106.8

104.2

122.4

106.8

100.7

100.3

2006

103.3

102.8

120.3

100.7

101.9

102.2

2007

108.4

102.2

103.4

103.2

101.7

100.7

2008

111.9

101.8

118.5

107.4

107.4

101.3

2009

85.8

102.3

83.1

92.1

100.8

97.8

2010

109.4

102.0

124.7

106.8

102.4

109.6

2011

109.8

101.6

118.4

108.2

107.1

112.2

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 经管营销 > 经济市场

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1