我国GDP部分影响因素的回归分析文档格式.docx
《我国GDP部分影响因素的回归分析文档格式.docx》由会员分享,可在线阅读,更多相关《我国GDP部分影响因素的回归分析文档格式.docx(12页珍藏版)》请在冰豆网上搜索。
3710.2
2006
216314.4
3003.1
2005
184937.4
2449.97
2004
159878.3
1966.33
2003
135822.8
1539.63
2002
120332.7
1287.64
2001
109655.2
1042.49
2000
99214.6
895.66
1999
89677.1
678.91
1998
84402.3
551.12
1997
78973
509.16
1996
71176.6
404.48
1995
60793.7
348.69
1994
48197.9
306.26
1993
35333.9
248.01
1992
26923.5
198.03
1991
21781.5
159.46
1990
18667.8
125.43
1989
16992.3
112.31
表2.模型汇总
模型
R
R方
调整R方
标准估计的误差
1
.987a
.974
.973
18266.46258
a.预测变量:
(常量),R&
D(亿元)。
在SPSS中录入数据,在线性分析选框中,输入相应的自变量和因变量,点击确定后出现如下结果。
(见表2-表4)
表2是关于一元线性回归模型的总体参数表,给出了复相关系数、复相关系数的平方、调整后的复相关系数平方,以及回归的标准误差(即未解释的标准差)。
复相关系数平方,又称决定性系数,是指被解释的方差(回归平方和)占总方差(总平方和)的百分比,是对回归模型拟合程度的综合度量。
决定系数越大,则模型拟合度越高,回归方程的解释能力越强;
决定性系数越小,则模型对样本的拟合程度越差,其解释能力越差。
根据上表课的,决定性系数为0.973,该一元线性回归方程对总平方和的解释能力达到了97.3%。
表3Anovab
平方和
df
均方
F
Sig.
回归
254161275188.274
761.729
.000a
残差
6673273100.981
20
333663655.049
总计
260834548289.255
21
b.因变量:
GDP(亿元)
表3是关于一元线性回归模型的方差分析表,给出了回归平方和、残差平方和、总平方和、相对应的自由度,以及F统计量值及其显著性水平。
F检验是对回归总体线性关系是否显著的一种假设检验。
根据上表输出结果可得到,F=761.729,p=0.000<
0.05,所以拒绝零假设,回归方程的线性关系是显著的。
表4系数a
非标准化系数
标准系数
t
B
标准误差
试用版
(常量)
38581.822
5156.576
7.482
.000
D(亿元)
55.440
2.009
.987
27.599
a.因变量:
上表是关于一元线性回归模型的回归系数及其显著性检验表,给出了常数项和解释变量(R&
D)的非标准化的回归系数和标准化的回归系数,以及T统计量值及其显著性水平。
有上述可知,回归模型的常数项和解释变量的非标准化系数分别为38581.822和55.440,这与手工计算结果一致。
根据表中的T值和显著性水平可以看出,T=27.599,P=0.000<
0.05,所以拒绝零假设,解释变量R&
D投入(x)对被解释变量GDP(y)具有显著性影响。
由此可得,以GDP为被解释变量和R&
D为解释变量的一元线性回归模型:
Y=38581.822+55.440x
3.科技投入对GDP影响的曲线估计
对于一元回归,若函数散点图不呈线性分布,我们就不能直接采用线性回归方法对回归模型进行参数估计。
曲线估计就是根据所给变量的样本数据,寻求一种最合适的回归模型对样本数据进行拟合,估计回归模型的未知参数,并根据相关的回归模型,预测因变量的变动趋势。
我们以1953~2010年中国科技投入与GDP相关数据为依据(表5),试对GDP(y)与科技投入(x)回归模型进行曲线估计。
表51953~2010年中国科技投入与GDP原始数据(部分显示,单位:
科技投入
1953
0.56
824
1954
1.22
859
1955
2.13
910
1956
5.23
1028
1957
1068
1958
11.24
1307
1959
19.15
1439
……
438.6
543.85
575.62
703.26
816.22
975.54
1095.34
1334.91
183084.8
1688.5
1783.04
2129.21
2744.52
3250.18
在SPSS录入相应数据,在曲线估计选框中,输入相应的自变量和因变量,点击确定后出现如下结果。
(见表6-表8)
表6模型汇总和参数估计值
因变量:
方程
模型汇总
参数估计值
df1
df2
常数
b1
b2
b3
对数
.596
82.741
56
-112707.39
37217.668
倒数
.027
1.583
.214
56754.209
-58900.682
二次
.993
4060.912
2
55
-2153.791
167.255
-.014
三次
2731.750
3
54
-2898.649
177.242
-.024
复合
.602
84.530
4334.839
1.002
幂
.905
535.127
137.099
.964
S
.118
7.507
.008
9.392
-2.568
增长
8.374
.002
指数
自变量为科技投入。
可以看出,当选择二次和三次函数模型时,回归方程的决定性系数皆为99.3%,比其他函数模型的决定性系数高出很多。
所以选择这两个函数模型构建的回归方程将具有较高的解释能力,在此基础上,我们还需要对这两个函数模型的回归系数进行显著性检验。
表7二次系数(见下页)
未标准化系数
标准化系数
标准误
Beta
4.434
1.250
37.724
科技投入**2
-.273
-8.247
(常数)
1279.620
-1.683
.098
表8三次系数
9.304
1.325
19.051
.009
-.484
-2.753
科技投入**3
.143
1.219
.228
1412.841
-2.052
.045
从回归系数的显著性检验结果克制,三次函数模型中的
的回归系数没有达到显著性水平,即解释变量
对被解释变量y的影响是不显著的。
而二次函数模型中的所有参数均具有统计显著意义,所以选用二次函数模型拟合科技投入和GDP较为合适,GDP(y)对科技投入(X)二次函数回归模型如下:
DGP对科技投入区县回归如下图所示。
4.GDP影响因素的多元回归分析
在实际问题中,影响因变量的因素往往有多个。
例如,商品的需求除了受自身价格的影响外,还要受到消费者收入、其他商品的价格、消费者偏好等因素的影响;
影响水果产量的外界因素有平均气温、平均日照时数、平均湿度等。
因此,在许多场合,仅仅考虑单个变量是不够的,还需要就一个因变量与多个自变量的联系来进行考察,才能获得比较满意的结果。
这就产生了测定多因素之间相关关系的问题。
研究在线性相关条件下,两个或两个以上自变量对一个因变量的数量变化关系,称为多元线性回归分析,表现这一数量关系的数学公式,称为多元线性回归模型。
多元线性回归模型是一元线性回归模型的扩展,其基本原理与一元线性回归模型类似。
我们以1989~2010年的统计数据为依据(表9),估计GDP(y)对R&
D投入(
)、教育投入(
)和实际利用外资(
)的线性回归模型。
表9多元回归分析原始数据
GDP/亿元
D/亿元
教育投入/亿元
实际利用外资/亿美元
19561.85
1088.21
16502.71
918.04
14500.74
952.53
12148.07
783.49
9343.23
670.76
8418.84
638.05
7242.6
640.72
6208.27
561.4
5480.03
550.11
4637.66
496.72
3849.08
593.56
3349.04
526.59
551.1
2949.06
585.57
2531.73
644.08
2262.34
548.05
1877.95
481.33
1488.78
432.13
1059.94
389.6
867.05
192.02
731.5
115.54
659.3
102.89
594.07
100.6
建立SPSS数据文件,定义变量
录入相应数据,在线性分析选框中,输入相应的自变量和因变量,点击确定后出现如下结果。
(见表10-表12)
表10模型汇总
.999a
.998
4800.95895
(常量),实际利用外资,R&
D投入,教育投入。
表11Anovab
260419662566.086
86806554188.695
3766.141
414885723.169
18
23049206.843
GDP
表10中,决定性系数为0.998,该三元线性回归方程对总平方的解释能力达到了99.8%。
表11中,F=3766.141,p=0.000<
表12系数a
1399.519
3000.320
.466
.646
D投入
-2.876
5.174
-.051
-.556
.585
教育投入
19.164
2.077
.952
9.227
实际利用外资
46.366
9.630
.109
4.815
除了常数项外,教育投入、实际利用外资两个解释变量的T值较大,在
=0.05条件下拒绝零假设,说明这两个变量对GDP的影响是显著的;
D投入的T值较小,p=0.585>
0.05,在
=0.05条件下不能拒绝零假设,说明此变量对GDP的影响是不显著的。
所以,在此我们不考虑R&
D投入,把教育投入(
)作为变量进行二元回归分析,步骤同前,得到新的系数表如下:
表13系?
a
非?
准化系?
?
准系?
准?
差
用版
1628.932
2917.260
.558
.583
18.031
.391
.896
46.138
利用外?
48.993
8.235
.116
5.949
a.因?
量:
由此可得,以GDP(y)为被解释变量和教育投入(
)、实际利用外资(
)为解释变量的二元线性回归模型为:
从这三项因素的对比中可以发现,实际利用外资量对GDP的影响更大一些。
5.结语
通过对GDP的影响因素使用SPSS软件进行一元线性、曲线回归分析和多元回归分析,得到回归模型,使我们更清晰直观的认识各变量之间的相关关系,而且其具有方便、快捷、准确的特点。
由于数据有限,我们并没有完全分析影响GDP的所有因素,但是这种方法是值得我们学习的,当然,回归分析只是SPSS统计软件的功能之一,我们可以利用其更多的功能帮助我们对GDP做进一步分析,为国家和政府做出宏观政策指明方向。
参考文献
[1]罗凤明,邱劲飚,李明华,肖炳坤.如何使用统计软件SPSS进行回归分[J].电脑知识与技术,2008,02:
293-294.
[2]徐群.非线性回归分析的方法研究[D].合肥工业大学,2009.
[3]李玉红,彭晓峰,陈慧青.统计软件SPSS在应用统计学教学中的应用[J].金融教学与研究,2009,03:
71-72.
[4]李国春.SPSS统计软件简介[J].循证医学,2003,04:
249-251.
[5]符啟勋.实用统计学[D].国防工业出版社.2008.