数理统计大作业Word文档格式.docx

上传人:b****6 文档编号:21041211 上传时间:2023-01-27 格式:DOCX 页数:15 大小:249.31KB
下载 相关 举报
数理统计大作业Word文档格式.docx_第1页
第1页 / 共15页
数理统计大作业Word文档格式.docx_第2页
第2页 / 共15页
数理统计大作业Word文档格式.docx_第3页
第3页 / 共15页
数理统计大作业Word文档格式.docx_第4页
第4页 / 共15页
数理统计大作业Word文档格式.docx_第5页
第5页 / 共15页
点击查看更多>>
下载资源
资源描述

数理统计大作业Word文档格式.docx

《数理统计大作业Word文档格式.docx》由会员分享,可在线阅读,更多相关《数理统计大作业Word文档格式.docx(15页珍藏版)》请在冰豆网上搜索。

数理统计大作业Word文档格式.docx

社会商品零售总额(亿元)

人口总数(万人)

受灾面积(万公顷)

1997

8651.14

14441.89

37543.00

26988.15

31252.90

123626.00

5342.70

1998

9875.95

14817.63

39004.19

30580.47

33378.10

124761.00

5014.50

1999

11444.08

14770.03

41033.58

33873.44

35647.90

125786.00

4998.00

2000

13395.23

14944.72

45555.88

38713.95

39105.70

126743.00

5468.80

2001

16386.04

15781.27

49512.29

44361.61

43055.40

127627.00

5221.50

2002

18903.64

16537.02

53896.77

49898.90

48135.90

128453.00

4694.60

2003

21715.25

17381.72

62436.31

56004.73

52516.30

129227.00

5450.60

2004

26396.47

21412.73

73904.31

64561.29

59501.00

129988.00

3710.60

2005

31649.29

22420.00

87598.09

74919.28

67176.60

130756.00

3881.80

2006

38760.20

24040.00

103719.54

88554.88

76410.00

131448.00

4109.10

2007

51321.78

28627.00

125831.36

111351.95

89210.00

132129.00

4899.20

2008

61330.35

33702.00

149003.44

131339.99

114830.10

132802.00

3999.00

2009

68518.30

35226.00

157638.78

148038.04

132678.40

133450.00

4721.40

2010

83101.51

40533.60

187383.21

173595.98

156998.40

134091.00

3742.60

2011

103874.43

47486.20

220412.80

204982.50

183918.60

134735.00

3247.10

2.2做散点图,设定理论模型

作数据散点图,并进行线性拟合,观察因变量与自变量之间关系是否有线性特点。

散点图和线性拟合结果如图1所示。

图1因变量与各自变量的散点图

从散点图1中可以初步看出,国家财政收入与第一、二、三产业国内生产总值、人口数、消费品零售总额这些因素都有较好的线性关系。

而财政收入与受灾面积之间没有线性关系,可在逐步回归之前将其去除。

建立线性回归分析模型如下:

Y=a+b1X1+b2X2+b3X3+b4X4+b5X5;

其中a为常数项,b1、b2、…、b5为偏回归系数。

3逐步回归分析概述

3.1回归分析

回归分析是一种非常实用的统计方法,研究变量与变量之间定量的相关关系,寻找变量之间的数学表达式,并且利用概率统计的知识,对此关系进行分析,来判别所建立关系表达式的有效性。

回归分析应用很广,可利用建立的经验公式进行预测或控制等等。

3.2线性回归分析

线性回归分析是描述一个因变量与一个或多个自变量之间的线性依存关系。

3.3多元回归分析方法比较与选择

应用多元线性回归方法对社会经济现象的数据进行统计分析或者预测具有实际的研究价值。

但是由于各个变量之间关系的复杂性,如何在为数众多的许多个影响因素中选择对所关心的因素具有显著影响的各个因素,并且不包含对因变量的影响不显著的因素是一个很有实际意义的问题。

具有这种优点的回归方程,被称为“最优”回归方程。

选择“最优”回归方程的方法有多种多样,具体包括:

(1)全部比较法:

从所有可能的因子组合的回归方程中选择最优方程。

这种方法固然可以找到一个最优者,然而当因子众多时,不仅计算繁冗,而且费用也大,在实际中是不宜采用的。

(2)向后剔除变量法(BackwardElimination):

从包含全部因子的回归方程中,逐次剔除不显著因子,也称为“只出不进法”。

这种方法在因子不多而且不显著因子也不多的情况下可以采用,但是因子众多时,特别是当不显著因子比较多时,其计算量也很大。

(3)向前挑选变量法(ForwardSelection):

从一个因子开始,逐个引入回归方程,因子在引入后概不剔除,也称为“只进不出法”。

这种方法对已经引进的因子在建立过程中变得不很重要的情况没有反映。

(4)逐步回归法(StepwiseRegression):

又称为“有进有出法”。

这种方法在逐个将因子选入回归方程的过程中,如果发现先前被引入的因子在其后由于某些因子的引入而失去其重要性时,可以从回归方程中随时予以剔除,直到最后被选入的因子对因变量都有显著影响为止。

3.4逐步回归分析法

先对全部自变量按其对Y影响程度的大小排队,从大到小逐个依次引入回归方程,并随时检验,及时将由于引入新自变量而变得作用不显著者剔除,剔除后再引入新变量,再检验,再剔除直至最后。

4线性回归的结果及分析

以国家财政收入为因变量,以第一、二、三产业国内生产总值、人口数、消费品零售总额为自变量,运用SPSS软件进行逐步回归法(stepwise)线性回归分析。

将数据导入SPSS软件的DataEditor表中,选择分析选项中的回归-线性命令,将国民总收入设置为因变量(Dependent),其余各影响因素设置为自变量(Independent(s)),选择统计方法(Method)为逐步回归法(Stepwise)。

4.1自变量的输入与移除

自变量的输入与移除的标准为:

F值小于等于0.05进入模型,大于等于0.1移出模型。

从表2中可以看出第三产业国内生产总值(亿元),人口数(万人),这两个自变量经过逐步回归过程被选择进入了回归方程。

选择的过程是:

最先引入了变量X3,建立了模型1;

接着引入变量X5,没有变量被剔除,建立了模型2(含有X3,X5);

没有新变量被引入,故最终的模型中含有变量X3,X5。

表2输入/移去的变量a

模型

输入的变量

移去的变量

方法

1

.

步进(准则:

F-to-enter的概率<

=.050,F-to-remove的概率>

=.100)。

2

a.因变量:

财政收入(亿元)

4.2模型概要

表3模型汇总c

R

R方

调整R方

标准估计的误差

更改统计量

R方更改

F更改

df1

df2

Sig.F更改

.999a

.998

1302.682

7212.060

13

.000

1.000b

.999

998.767

.001

10.115

12

.008

a.预测变量:

(常量),第三产业国内生产总值(亿元)。

b.预测变量:

(常量),第三产业国内生产总值(亿元),人口总数(万人)。

c.因变量:

表3给出了各模型的拟合情况。

其中,复相关系数(R)代表自变量或自变量的线性组合能多大程度上解释因变量,复相关系数平方值(R方)说明回归模型自变量的变异在因变量中所占比率,接近1最好。

修正的复相关系数平方值(调整R方),是为了消除变量数量的影响,给出修正的复相关系数平方值。

从表中看出两种模型的拟合度都很好,而模型2的复相关系数R=1.000,复相关系数平方值R2=0.999,调整R方为0.999,标准估计的误差为998.767。

可见模型2的拟合度较高,变量X3,X5的作用显著。

4.3回归方程的显著性检验

表4Anovac

平方和

df

均方

F

Sig.

回归

1.224E10

.000a

残差

22060733.806

1696979.524

总计

1.226E10

14

1.225E10

6.124E9

6139.533

.000b

11970430.455

997535.871

表4显示两种模型的方差分析结果。

方差分析结果表明,当回归方程为模型1、2时,其显著性概率值均小于0.000,即拒绝总体回归系数均为0的原假设。

因此,最终的回归方程应当包含X3、X5这2个自变量,且方程拟和效果很好。

表5已排除的变量c

BetaIn

t

偏相关

共线性统计量

容差

VIF

最小容差

.281a

2.125

.055

.523

.006

160.446

.083a

.348

.734

.100

.003

382.969

.178a

1.191

.257

.325

167.086

-.073a

-3.180

-.676

.154

6.510

.128b

.955

.360

.277

.005

218.259

.004

.105b

.577

.576

.171

383.541

-.101b

-.650

.529

-.192

283.927

a.模型中的预测变量:

b.模型中的预测变量:

表5显示方程外各模型变量的有关统计量,即标准化偏回归系数Beta、回归系数显著性检验的t值、P(Sig)值、偏相关系数PartialCorrelation、共线性统计的容差ColinearitystatisticTolerance。

可见,模型2方程外的各变量偏回归系数经检验,P值均大于0.05,故不能引入方程。

4.4回归系数的确定

表6系数a

非标准化系数

标准系数

相关性

B

标准误差

试用版

零阶

部分

(常量)

-7035.493

624.880

-11.259

.525

84.924

1.000

70605.587

24416.721

2.892

.014

.560

.012

1.066

46.337

.997

.418

-.622

.196

-.073

.908

-.029

表6显示各模型的偏回归系数B、标准差Std.、常数Constant、标准化偏回归系数Beta、回归系数显著性检验的t值和P(Sig)值。

按照线性回归模型建立的方程为:

Y=70605.587+0.560X3-0.662X5

方程中的常数项a=70605.587,偏回归系数b3=0.560、b5=-0.662,经t检验a、b3、b5的P值分别为0.014、0.000、0.008,按α=0.10水平,均有显著性意义。

4.5回归模型的残差分析

对回归模型的残差进行分析,残差的积累概率图(P-P图)(图2)基本围绕在假设直线(正态分布)周围,说明残差分布基本符合正态分布,说明财政收入这个因变量基本上可以用线性回归方法建立模型。

且回归标准化残差的柱状图(图3)中,标准化残差基本都分布在(-3,3)之间,没有超过默认值3,说明模型对数据的拟合效果较好。

图2回归标准化残差的标准P-P图

图3回归标准化残差柱状图

5讨论

5.1模型检验

Y=70605.587+0.560X3-0.662X5

利用此最优回归方程对2010年国民总收入进行预测并和实际值做比较。

表72010年财政收入预测

财政收入实际值(亿元)

Y'

财政收入预测值(亿元)

偏差

2010

173595.98

134091.00

83101.51

79051.09

4.8%

表7给出了运用已经建立的逐步回归模型对2010年财政收入的预测结果以及实际财政收入值。

通过对比我们可以发现,预测的结果与实际情况比较接近,但还是存在一定的偏差,这可能是我们对财政收入的影响因素考虑过少造成的,因此,这是我们以后对模型改进时所要考虑的方面。

5.2模型解释

从回归模型中看出,第三产业对财政收入的影响较为显著。

这正与国家积极调整产业结构,倡导服务业全面发展的经济政策相符合。

第三产业发展迅速,增加了国家收入弹性,特别是金融、期货交易、房地产业、仓储物流业、软件等现代服务业和高薪产业的发展及近年来奥运会、亚运会、世博会对旅游业的带动,极大提高了服务业对财政收入的贡献。

而人口数对财政收入的贡献为负线性关系。

这与近年来我国人口老龄化趋势,人口基数仍在上涨及社会福利提高有关。

众所周知,人口基数不变或稍微增大时,人口老龄化,必然导致就业人口相对比例减少,再加上近年来医保、社保等社会保障及福利支出的相对提高,使国家政府给予大量财政补贴,因而人口数对财政收入的贡献为负相关。

而第一产业和第二产业均被剔除回归模型,这可能与近几年我国的惠农政策及经济转型政策有关。

在第一产业(农业)方面,近几年为了实现小康型社会主义和建设社会主义新农村,国家政府坚持把支持“三农”作为预算安排和财政工作的重点,巩固、完善和强化了各项强农惠农财税政策,突出加强农业基础,促进农业发展和农民增收,扎实推进社会主义新农村建设。

实现传统农业的全面升级,从而保证了农业经济的持续稳定发展。

这样作为曾经的农业大国,惠农政策的财政补贴与其产业带来的财政贡献抵消,因而第一产业总产值X对财政收入y的影响不显著。

再看第二产业(工业和建筑业),对财政收入也不显著。

近几年奥运会、亚运会、世博会使国家投入不少成本,加上钢铁等传统行业的产能过剩使国家补贴外销,以及建设高新技术产业,投入大量研发生产成本而至今仍未盈利或盈利较少等等原因均使原本作为财政收入支撑的第二产业对财政收入的贡献很不显著。

总之,我们应该看到我国产业结构的不合理及发展方向:

第二产业的支撑地位不够,第三产业发展仍有余地。

因此,要提高财政收入水平,必须首先调整经济结构。

通过优化第一产业,提高第二产业,壮大第三产业,努力形成以高新技术产业为先导、基础产业和制造业为支撑、服务业全面发展的产业格局。

6参考文献

[1]孙海燕,周梦,李卫国,冯伟.应用数理统计.北京:

北京航空航天大学出版社,2012.

[2]中华人民共和国国家统计局.中国统计年鉴2012[M].北京:

中国统计出版社,2012.

[3]蒋昭侠.产业结构问题研究.中国经济出版社,2005.

[4]阮桂海.SPSS实用教程.北京:

电子工业出版社,2000.

[5]彭志刚等,财政收入的逐步回归分析[J].乌鲁木齐职业大学学报,2004.

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 经管营销 > 经济市场

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1