河北省GDP影响因素分析Word文档格式.docx
《河北省GDP影响因素分析Word文档格式.docx》由会员分享,可在线阅读,更多相关《河北省GDP影响因素分析Word文档格式.docx(16页珍藏版)》请在冰豆网上搜索。
指常住住户在一定时期内对于货物和服务的全部最终消费支出。
居民消费支出除了直接以货币形式购买的货物和服务的消费支出外,还包括以其他方式获得的货物和服务的消费支出,即所谓的虚拟消费支出。
居民虚拟消费支出包括如下几种类型:
单位以实物报酬及实物转移的形式提供给劳动者的货物和服务;
住户生产并由本住户消费了的货物和服务,其中的服务仅指住户的自有住房服务和付酬的家庭雇员提供的家庭和个人服务;
金融机构提供的金融媒介服务。
经营单位所在地进出口总额:
是指商品经营单位所在地进出口额指在所在地海关注册登记的有进出口经营权的企业实际出口额。
全社会固定资产投资:
指以货币形式表现的在一定时期内全社会建造和购置固定资产的工作量以及与此有关的费用的总称。
该指标是反映固定资产投资规模、结构和发展速度的综合性指标,又是观察工程进度和考核投资效果的重要依据。
年末人口数:
指每年12月31日24时的人口数。
被解释变量:
Y河北省生产总值GDP(亿元)
解释变量一:
X1居民消费(亿元)
解释变量二:
X2经营单位所在地出口总额(亿美元)
解释变量三:
X3全社会固定资产投资(亿元)
解释变量四:
X4年末常住人口(万人)
将变量的数学形式确定为:
一共有四个解释变量,
是常数,
(i=1、2、3、4)是解释变量的偏回归系数,
为随机误差项,用来表示解释变量以外的其他因素的干扰。
3、数据来源与分析
数据来源:
中华人民共和国国家统计局数据库
(
由于国家统计局注明:
2004年及以后年份地区生产总值数据执行《国民经济行业分类》(GB/T4754-2002),2004年以前地区生产总值数据执行《国民经济行业分类》(GB/T4754-1994),本文选取19944年至2013年间数据进行分析。
数据表如下:
表3.1数据图
年
份
河北省GDP(亿元)
Y
居民消费(亿元)
X1
出口总额
(亿美元)
X2
固定资本投资(亿元)
X3
年末常住人口(万人)
X4
1994
2,187.49
839.97
23
709.19
6388
1995
2,849.52
1,081.09
29
939.32
6437
1996
3,452.97
1,243.31
31
1,187.70
6484
1997
3,953.78
1,399.02
32
1,469.99
6525
1998
4,256.01
1,415.78
1,591.76
6569
1999
4,514.19
1,523.64
1,770.47
6614
2000
5,043.96
1,682.76
37
1,816.79
6674
2001
5,516.76
1,838.17
40
1,912.53
6699
2002
6,018.28
2,069.65
46
2,020.38
6735
2003
6,921.29
2,208.73
59
2,477.98
6769
2004
8,477.63
2,551.44
93
3,218.76
6,809
2005
10,012.11
2,916.00
109
4,139.69
6,851
2006
11,467.60
3,385.05
128
5,470.24
6,898
2007
13,607.32
3,921.63
170
6,884.68
6,943
2008
16,011.97
4,526.79
240
8,866.56
6,989
2009
17,235.48
5,043.35
157
12,269.80
7,034
2010
20,394.26
5,731.44
226
15,083.40
7,194
2011
24,515.76
6,892.66
286
16,389.33
7,241
2012
26,575.01
7,808.39
296
19,661.28
7,288
2013
28,301.41
8,448.06
310
23,194.23
7,333
绘制各自变量与因变量散点图,如下
GDP与居民消费GDP与经营单位所在地出口总额
GDP与固定资本投资GDP与年末常住人口
Y与各变量的线性图
根据数据利用eviews得出回归结果,如下图:
表3.2OLS回归结果
DependentVariable:
Y
Method:
LeastSquares
Date:
12/31/14Time:
13:
18
Sample:
19942013
Includedobservations:
20
Variable
Coefficient
Std.Error
t-Statistic
Prob.
C
-24180.18
7730.898
-3.127732
0.0069
1.959468
0.491799
3.984289
0.0012
15.92716
3.377647
4.715461
0.0003
0.166882
0.099687
1.674056
0.1148
3.772690
1.240177
3.042057
0.0082
R-squared
0.999089
Meandependentvar
11065.64
AdjustedR-squared
0.998847
S.D.dependentvar
8386.568
S.E.ofregression
284.8140
Akaikeinfocriterion
14.35387
Sumsquaredresid
1216786.
Schwarzcriterion
14.60280
Loglikelihood
-138.5387
F-statistic
4114.753
Durbin-Watsonstat
1.692372
Prob(F-statistic)
0.000000
由此可见,该模型的R2=0.999089,
2=0.998847,可决系数很高,F检验值4114.753明显显著。
4、多重共线性检验
(1)当
时,
(n-k)=
(20-5)=2.131,可见X3的系数t检验不显著,这表明可能存在多重共线性。
计算各解释变量的相关系数,选择X1、X2、X3、X4数据,得相关细数矩阵
表4.1各变量间相关系数图
变量
1.000000
0.975973
0.989501
0.966636
0.952537
0.948661
0.931679
由相关系数矩阵可以看出,各解释变量相互之间的相关系数较高,证实确实存在严重多重共线性。
(2)修正多重共线性
采用逐步回归的办法,去检验和解决多重共线性的问题。
分别做Y对X1、X2、X3、X4的一元回归,如下:
表4.2一元回归估计结果
变量
参数估计值
3.575033
80.99118
1.185204
28.24782
t统计量
79.32108
22.44854
24.40161
17.33809
R2
0.997147
0.965513
0.970657
0.943505
0.996989
0.963597
0.969027
0.940366
其中,加入X1的方程R2最大,以X1为基础,顺次加入其他变量逐步回归。
结果如下表所示。
表4.3加入新变量的回归结果
R2
X1,X2
2.984384
13.93318
0.998328
X1,X3
4.061686
-0.165258
0.997252
X1,X4
3.254088
2.696994
0.997442
经比较,加入X2的方程R2=0.998328,改进最大,且各参数的t检验显著,选择保留X2,再加入其他新变量逐步回归,结果如下表:
表4.4又加入新变量的回归结果
X1,X2,X3
3.152058
(8.621597)
13.08249
(3.273859)
-0.044693
(-0.508285)
0.998252
X1,X2,X4
2.738681
(16.35234)
13.20472
(4.228662)
2.324214
(2.480002)
0.998717
在X1,X2的基础加入X3后的方程R2有所下降,且X3的参数的t检验变得不显著。
加入X4后,R2有所上升,且参数的t检验显著。
保留X4,去掉X3。
得到最后修正多重共线性影响后的回归结果为:
表4.5修正后的模型回归结果
-15471.30
6032.197
-2.564787
0.0208
0.167479
16.35234
0.0000
3.122671
4.228662
0.0006
0.937182
2.480002
0.0246
0.998919
300.4287
14.42515
1444119.
14.62430
-140.2515
4930.017
1.147084
则得到模型公式如下:
^Y=-15471.30+2.738681X1+13.20472X2+2.324214X4
t=(-2.564787)(16.35234)(4.228662)(2.480002)
R2=0.998919R2=0.998717F=4930.017DW=1.147084
5、检验自相关
对样本量为20、三个解释变量的模型、1%显著水平,查DW统计表克制,DL=0.773,DU=1.411。
模型中4-DU>
DW>
DU,说明模型选择较好,无自相关性,无需进行自相关处理。
6、检验模型的异方差
要检验模型中是否有异方差,需要了解随机误差项
的概率分布,由于随机误差很难直接观测,只能对随机误差的分布特征进行某种推测,本文采用戈德菲尔德-夸特检验方法,此检验的基本思想是将样本分为两部分,然后分别对两个样本进行回归,并计算比较两个回归的剩余平方和是否明显显著,以此来判断是否存在异方差。
1.排序:
将解释变量的取值按从小到大排序。
2.数据分组:
将排列在中间的约1/4的观察值删除掉,记为c,再将剩余的分为两个部分,每部分观察值的个数为(n-c)/2=8。
3.提出假设:
4.构造F统计量:
分别对上述两个部分的观察值求回归模型,由此得到的两个部分的残差平方为
和
。
为前一部分样本回归产生的残差平方和见图6.1,
为后一部分样本回归产生的残差平方和见图6.2。
表6.1前一部分样本回归结果
-15340.37
8870.391
-1.729390
0.1588
2.945144
0.667628
4.411359
0.0116
-21.89740
17.96973
-1.218572
0.2900
2.435447
1.442664
1.688160
0.1667
0.997970
3971.835
0.996447
1109.966
66.16267
11.52896
17510.00
11.56868
-42.11585
655.3715
2.973703
0.000008
表6.2后一部分样本回归结果
-64805.49
24844.70
-2.608423
0.0595
2.193870
0.363954
6.027880
0.0038
8.284626
4.467066
1.854601
0.1373
9.858520
3.763996
2.619163
0.0589
19763.60
0.996942
6204.374
343.1117
14.82084
470902.5
14.86056
-55.28337
761.6266
2.274250
0.000006
它们的自由度均为
,k为参数的个数。
在原假设成立的条件下,因
和
自由度均为
,
分布,可导出:
4.判断:
给定显著性水平
,查F分布表得临界值
计算统计量
则接受原假设,即模型中的随机误差不存在异方差。
7、模型的最终确立
由以上分析检验最终确定的解释变量为:
X1居民消费(亿元)、X2经营单位所在地出口总额(亿美元)、X4年末常住人口(万人)。
舍掉的解释变量并不是对河北省国内生产总值没有影响,而是在此模型中并没有显著性影响。
得到最终确立的模型如下:
Y=-15471.30+2.738681X1+13.20472X2+2.324214X4
经过处理,此时的模型已不存在自相关和异方差,T检验和F检验均合格(即不存在多重共线性),经济意义也合理,预测结果也比较合理。
得出以下结论:
河北省的国内生产总值受居民消费、经营单位所在地出口总额、年末常住人口影响较为显著,受全社会固定资产投资的影响不显著。
参考文献
[1]庞皓.计量经济学(第二版)[M].科学出版社,2012.
[2]石贤光.河南省能源消费对经济增长影响的实证研究[J].濮阳职业技术学院学报,2011年04期
[3]李国平.陈安平.中国地区经济增长的动态关系研究[J].当代经济科学,2004年02期
[4]卢二坡.张焕明.基于稳健主成分回归的统计数据可靠性评估方法[J].统计研究,2011年05期
[5]朱姗.我国国内生产总值的模型建立与分析[J].现代经济信息,2009年10期
[6]林治柑.福建能源消费与GDP增长关系研究[A].福建省科协第七届学术年会能源分会专刊[C],2007.
[7]郭海明.国民经济核算的统计思想探讨[J].新余学院学报,2014.
[8]张强.金融与GDP增长[D].吉林大学,2011.
[9]闫莉莉.国内生产总值与消费需求关系的计量分析[J].大众科技,2014.
[10]李晓嘉.刘鹏.中国经济增长与能源消费关系的实证研究——基于协整分析和状态空间模型的估计[J].软科学,2009年08期
多重共线性相关性系数矩阵
多重共线性修正图
回归结果图
异方差上半部分回归结果图
异方差下半部分回归结果图
线形图