多元回归分析案例Word文档格式.docx
《多元回归分析案例Word文档格式.docx》由会员分享,可在线阅读,更多相关《多元回归分析案例Word文档格式.docx(11页珍藏版)》请在冰豆网上搜索。
i表示随机误差项。
通过上式,我们可以了解到,每个解释变量增长1亿元,粮食总产值会如何变化,从而进行财政收入预测。
相关数据:
表1
年份
人口自然增长率(%。
)Y
国民总收入(亿元)X1
居民消费价格指数增长率(CPI)%X2
人均GDP(元)X3
1988
15.73
15037
18.8
1366
1989
15.04
17001
18
1519
1990
14.39
18718
3.1
1644
1991
12.98
21826
3.4
1893
1992
11.6
26937
6.4
2311
1993
11.45
35260
14.7
2998
1994
11.21
48108
24.1
4044
1995
10.55
59811
17.1
5046
1996
10.42
70142
8.3
5846
1997
10.06
78061
2.8
6420
1998
9.14
83024
-0.8
6796
1999
8.18
88479
-1.4
7159
2000
7.58
98000
0.4
7858
2001
6.95
108068
0.7
8622
2002
6.45
119096
9398
2003
6.01
135174
1.2
10542
2004
5.87
159587
3.9
12336
2005
5.89
184089
1.8
14040
2006
5.38
213132
1.5
16024
2007
5.24
235367
1.7
17535
2008
5.45
277654
1.9
19264
二、参数估计
利用上表中的数据,运用eview软件,采用最小二乘法,对表中的数据进行线性回归,对所建模型进行估计,估计结果见下图。
从估计结果可得模型:
Y关于X1的散点图:
可以看出Y和X1成线性相关关系
Y关于X2的散点图:
可以看出Y和X2成线性相关关系
Y关于X3的散点图:
可以看出Y和X3成线性相关关系
回归结果
三、模型检验:
1、经济意义检验
模型估计结果说明,在假定其它变量不变的情况下,当年国民总收入每增长1亿元,人口增长率增长0.000392%;
在假定其它变量不变的情况下,当年居民消费价格指数增长率每增长1%,人口增长率增长0.050364%;
在假定其它变量不变的情况下,当年人均GDP没增加一元,人口增长率就会降低0.005881%。
这与理论分析和经验判断相一致。
2、统计检验
(1)、拟合优度检验
由于,
所以=0.941625,=0.930680,
可见模型在整体上拟合得非常好。
(2)、F检验
由于
所以=86.02977,
针对,给定显著性水平,在F分布表中查出自由度为k-1=3和n-k-1=16的临界值。
由表3.4中得到F=86.02977,由于F=86.02977>
应拒绝原假设,说明回归方程显著,即“国民总收入”、“居民消费价格指数增长率”、“人均GDP”等变量联合起来确实对“人口自然增长率”有显著影响。
(3)、t检验
由于0.780038
且0.830371,8.89415E-05,0.03196669,0.00121009,
当,
18.99364
在时,(16)=2.120因为t=18.99364>
2.120,所以在95%的置信度下拒绝原假设,说明截距项对回归方程影响显著。
当
4.407392
在时,(16)=2.120因为t=4.407392>
2.120所以在95%的置信度下拒绝原假设,说明X1变量对Y影响显著。
1.575515
在时,(16)=2.120因为t=1.575515<
2.120,所以在95%的置信度下接受原假设,说明X2变量对Y影响不显著。
-4.859971
在时,(16)=2.120因为t=-4.859971<
2.120,所以在95%的置信度下接受原假设,说明X3变量对Y影响不显著。
(4)、的置信区间
的置信区间为:
,计算得:
(14.01138,17.53216);
(0.000203,0.000581);
(-0.01741,0.118133);
;
(-0.00845,-0.00332)
综上所述,模型通过各种检验,符合要求。
四、方差分析(新增解释变量对被解释变量边际贡献显著性的分析)
引入不同解释变量的ESS,RSS,
首先做Y对的回归,得到样本回归方程为
13.65401-0.0000457
(24.45422)(-9.131990)
=175.8443,37.95517,=0.822473;
由t检验可知,对Y有显著影响。
=0.822473表明,对于各种人口自然增长率Y来说,国民总收入(亿元)只解释了Y的总离差的82%,还有18%没有解释。
引入第二个解释变量后,样本回归方程为:
=-12.55023-0.0000399+0.092504
=182.8952,30.90454,=0.855451;
新引入的方差分析表
变差来源
平方和
自由度
F统计量
对回归
=175.8443
1
对和回归
=182.8952
2
对和回归,新增的部分对和回归的残差
-=7.050958
=974550.4
20-3=17
F=50.30362
对于给定的显著性水平=0.05,查F分布表可得临界值,由于F=50.30362>
4.45,所以新引入的解释变量是显著的,的引入可以显著的提高对Y的解释程度,即的边际贡献较大,因此,RSS从=37.95517降低到30.90454
再引入第三个解释变量:
=15.77177+0.000392+0.050364-0.005881
=201.3198,12.48060,=0.941625;
30.90454,
对,和回归
=201.3198
3
对,和回归,由新增的部分对,和回归的残差
-=470399
12.48060
20-4=16
F=86.02977
查F分布表可得临界值=4.49,F=86.02977>
4.49,所以新引入的解释变量显著,即的边际贡献较大,因此。
只引入一个解释变量,或;
引入两个解释变量和,和或和;
以及引入三个变量的ESS,RSS和的结果如表
引入不同解释变量时的ESS,RSS,
引入解释变量
回归平方和ESS
残差平方和RSS
判定系数
=175.8443
37.95517,
=0.822473
=87.21383
RSS=126.5859
=0.407923
=180.1995
=33.60087
=0.842840
,
30.90454
=0.855451
=199.3845
14.41684
=0.932569
=186.1663
=27.63290
=0.870753
=0.941625
由Eviews可得,只引入一个解释变量,,时的F统计量分别为=83.39325,=12.40147,=96.53269,由,和都大于临界值,所以如果单独用,或作解释变量都显著,如果引入两个解释变量,显然引入,的结果最好,如果引入三个解释变量无论最后引入哪个解释变量结果都显著,因此最后确定引入三个解释变量,相应的回顾方程为:
=15.77177+0.000392+0.050364-0.005881
=0.941625=0.930680
模型预测
设2009年国民总收入为295267亿元,居民消费价格指数增长率为2.1%,人均GDP为21427元,将值代入样本回归方程,得到1998年的各项税收总量预测值的点估计值:
15.77177+0.000392*295267+21427
(亿元),实际人口自然增长率为5.51%。
五、模型总结
(18.99364)(4.407392)(1.575515)(-4.859971)
0.9416250..930680F=86.02977DW=0.568510
上述回归结果基本上消除了多重共线性,拟合优度较高,整体效果的F检验通过,其解释变量X的t检验均较为显著。