国家财政收入的多元线性回归模型.docx

资源描述

国家财政收入的多元线性回归模型.docx

《国家财政收入的多元线性回归模型.docx》由会员分享，可在线阅读，更多相关《国家财政收入的多元线性回归模型.docx（18页珍藏版）》请在冰豆网上搜索。

国家财政收入的多元线性回归模型.docx

国家财政收入的多元线性回归模型

应用数理统计

国家财政收入的回归分析

院（系）名称

专业名称

学生姓名

任课教师

2013年12月

2解决问题的方法和计算结果3

2.1样本数据的选取与整理3

2.2模型的建立与分析4

2.3分析结果9

国家财政收入的多元线性回归模型

摘要：

本文以多元线性回归为出发点，选取了我国自1990至2011年间的财政收入为因变量，并初步选取了6个影响因素,进一步利用统计软件SPSS对以上数据进行了筛选，采用多元逐步线性回归的方法，从而找到了能反映财政收入与各因素之间关系的“最优”回归方程：

进而得出结论，国家财政收入与建筑业、工业总产值和人口数具有显著地线性关系。

关键词：

多元逐步线性回归；财政收入；SPSS

0符号说明

变量

符号

财政收入（亿元）

工业总产值（亿元）

农业总产值（亿元）

受灾面积（万公顷）

建筑业总产值（亿元）

人口总数（万人）

社会商品销售总额（亿元）

1引言

改革开放以来，我国的国民经济取得了快速发展，经济上的飞速发展并带动了国家财政收入的飞速增加，国家财政的状况对整个社会的发展影响巨大。

政府根据国家的财政收入，通过预算安排，用于环境保护、社会保障以及政府行政管理等，从而不断提高人民的生活水平，早日实现中华民族的伟大复兴。

因此，为了更好地制订下一年的财政税收政策，研究影响国家财政收入的主要因素是十分必要的。

为了研究影响国家财政收入的因素，我们就很有必要对其财政收入和影响财政收入的因素作必要的认识，进而对他们之间的关系作一下回归，从而通过已有的数据建立最优的线性回归模型。

建立最优的线性回归模型，一方面要求该模型包含所有对因变量财政收入有显著影响的自变量，另一方面要求该模型中所包含的自变量个数尽可能的少，不含无意义的变量。

选择最优模型的方法很多，但各有利弊。

全部比较法是把所有可能的自变量的各种组合方式回归方程都求出来，然后比较，选出最优的。

对于变量数较少时，该方法比较有优势，但当随着变量数的增加，该方法的计算量也变得越来越大，使得该方法不太实用。

向后法，也称为只出不进法，在不显著的变量比较少时常常采用该方法，但在开始建立方程可能自变量过多，计算繁琐，现在也不太常用。

向前法，也称只进不出法，由于其本身的特点，使得变量一旦引入方程，就不会剔除。

这样得到的模型，由于变量间可能存在相关关系，故不能保证所有的变量都是显著。

本文采用的是逐步回归法，也成为有进有出法，它是向前法和向后法的一种结合，克服了前两种方法的缺点，将变量一一引入，每引入一个变量后都要对老变量进行逐个检验，将变得不显著的变量从回归模型中剔除，保证了模型含有的都是有显著影响的自变量。

本文首先分析了可能影响财政收入的因素，找到最有可能的因素，包括工业总产值，农业总产值，建筑业总产值，社会商品销售总额，人口数，受灾面积等。

然后从国家统计数据网上查取了1990-2011年这22年间的年度财政收入及主要影响因素的数据，利用逐步回归的统计方法，对数据进行分析处理，最终得出能够反映各个因素对财政收入影响的最“优”模型。

在寻找最优回归方程过程中，首先以国家财政收入为因变量，以工业总产值，农业总产值，建筑业总产值，社会商品销售总额，人口数，受灾面积分别为自变量，绘制散点图，初步判断财政收入与各因素之间是否具有线性关系。

为了更加直观的分析财政收入与各因素的关系，利用SPSS软件计算了各个变量之间的相关系数，定量的分析了财政收入与各因素之间的相关性大小。

最后，为了得到最佳回归模型以及最优回归方程，利用SPSS软件对该数据进行深层次的分析，利用逐步回归分析原理，求得了最优回归方程，并对其残差进行分析，来进一步检验回归模型的拟合性。

2解决问题的方法和计算结果

2.1样本数据的选取与整理

本文在进行统计时，查阅国家统计数据网—中国统计年鉴2012中收录的1990年至2011年连续22年的全国财政收入为因变量，考虑一些与能源消耗关系密切并且直观上有线性关系的因素，初步选取这20年的工业总产值，农业总产值，建筑业总产值，社会商品销售总额，人口数和受灾面积等因素为自变量，分析它们之间的联系。

根据选择的指标，从国家统计数据网查选数据，整理如表2-1所示。

表2-11990-2011年财政收入及其影响因素统计表

工业

（亿元）

农业

（亿元）

受灾面积（千公顷）

建筑业

（亿元）

人口

（万人）

社会商品零售总额（亿元）

财政收入

（亿元）

1990

18689.22

7662.1

38474

1345

114333

8300.1

2937.1

1991

22088.68

8157

55472

1564.3

115823

9415.6

3149.48

1992

27724.21

9084.7

51332

2174.4

117171

10993.7

3483.37

1993

39693

10995.5

48827

3253.5

118517

14270.4

4348.95

1994

51353.03

15750.5

55046

4653.3

119850

18622.9

5218.1

1995

54946.86

20340.9

45824

5793.8

121121

23613.8

6242.2

1996

62740.16

22353.7

46991

8282.2

122389

28360.2

7407.99

1997

68352.68

23788.4

53427

9126.5

123626

31252.9

8651.14

1998

67737.14

24541.9

50145

10062

124761

33378.1

9875.95

1999

72707.04

24519.1

49980

11152.9

125786

35647.9

11444.08

2000

85673.66

24915.8

54688

12497.6

126743

39105.7

13395.23

2001

95449.0

26179.6

52215

15361.5

127627

43055.4

16386.04

2002

110776.5

27390.8

46946

18527.1

128453

48135.9

18903.64

2003

142271.2

29691.8

54506

23083.8

129227

52516.3

21715.25

2004

187220.7

36239

37106

29021.45

129988

59501

26396.47

2005

251619.5

39450.9

38818

34552.0

130756

68352.6

31649.29

2006

316588.9

40810.8

41091

41557.1

131448

79145.2

38760.2

2007

405177.1

48892.9

48992

51043.7

132129

93571.6

51321.78

2008

507448

58002.1

39990

62036.81

132802

114830.1

61330.35

2009

548311

60361.0

47214

76807.74

133450

132678.4

68518.30

2010

698591

69319.8

37426

96031.13

134091

156998.4

83101.51

2011

844269

81303.9

32471

116463.32

134735

183918.6

103874.43

2.2模型的建立与分析

2.2.1散点图

为了直观地观察各因素与财政收入之间是否具有线性关系。

根据表2-1的数据画出各个因素与国家财政收入的散点图如图2-1所示。

（a）（b）

（c）（d）

（e）（f）

图2-1各因素与国家财政收入的散点图

由图2-1各因素与国家财政收入的散点图可以得到，工业总产值、农业总产值、建筑业以及社会商品零售总额与国家财政收入基本上具有良好的线性关系，国家财政收入与人口总数具有正比关系，由于人口总数成指数增长模型，初步认为人口总数与国家财政收入不具有明确的线性关系。

另外，由图c，国家财政收入与受灾面积也不具有明确线性关系。

2.2.2相关性研究

为了进一步的确定国家财政收入与工业总产值、农业总产值、受灾面积、建筑业、人口总数及社会商品零售总额之间是否具有显著的相关性，下面通过SPSS软件来计算各因素间的相关系数大小，定量的研究各因素与财政收入的相关性。

表2-2各因素与国家财政收入的相关性检验

财政收入

工业总产值

农业总产值

受灾面积

建筑业

财政收入

Pearson相关性

.998**

.981**

-.636**

.998**

显著性（双侧）

.000

.001

.000

工业总产值

Pearson相关性

.998**

.974**

-.644**

.997**

显著性（双侧）

.000

.001

.000

农业总产值

Pearson相关性

.981**

.974**

-.622**

.979**

显著性（双侧）

.000

.002

.000

受灾面积

Pearson相关性

-.636**

-.644**

-.622**

-.643**

显著性（双侧）

.001

.002

.001

建筑业

Pearson相关性

.998**

.997**

.979**

-.643**

显著性（双侧）

.000

.001

人口总数

Pearson相关性

.820**

.794**

.898**

-.456*

.812**

显著性（双侧）

.000

.033

.000

社会零售商品总额

Pearson相关性

.996**

.991**

.992**

-.623**

.996**

显著性（双侧）

.000

.002

.000