计量经济学实验报告材料多元线性回归自相关.docx
《计量经济学实验报告材料多元线性回归自相关.docx》由会员分享,可在线阅读,更多相关《计量经济学实验报告材料多元线性回归自相关.docx(22页珍藏版)》请在冰豆网上搜索。
计量经济学实验报告材料多元线性回归自相关
实验报告
课程名称计量经济学
实验项目名称多元线性回归自相关
异方差多重共线性
班级与班级代码08国际商务1班
实验室名称(或课室)实验楼910
专业国际商务
任课教师刘照德
学号:
08250603143
姓名:
张柳文
实验日期:
2011年06月23日
广东商学院教务处制
姓名张柳文实验报告成绩
评语:
指导教师(签名)
年月日
说明:
指导教师评分后,实验报告交院(系)办公室保存。
计量经济学实验报告
实验项目:
多元线性回归、自相关、异方差、多重共线性
实验目的:
掌握多元线性回归模型、自相关模型、异方差模型、多重共线性模型的估计和检验方法和处理方法
实验要求:
选择方程进行多元线性回归;熟悉图形法检验和掌握D-W检验,理解广义差分法变换和掌握迭代法;掌握Park或Glejser检验,理解同方差性变换;
实验原理:
普通最小二乘法图形检验法D-W检验广义差分变换加权最小二乘法Park检验等
实验步骤:
首先:
选择数据
为了研究影响中国税收收入增长的主要原因,选择国内生产总值(GDP)、财政支出(ED)、商品零售价格指数(RPI)做为解释变量,对税收收入(Y)做多元线性回归。
从《中国统计年鉴》2011中收集1978—2009年各项影响因素的数据。
如下表所示:
中国税收收入及相关数据
年份(T)
商品零售价格指数(RPI)/%
财政支出(ED)/亿元
国内生产总值(GDP)/亿元
税收收入(Y)/亿元
1978
100.7
1122.09
3645.217
519.28
1979
102.0
1281.79
4062.579
537.82
1980
106.0
1228.83
4545.624
571.7
1981
102.4
1138.41
4891.561
629.89
1982
101.9
1229.98
5323.351
700.02
1983
101.5
1409.52
5962.652
775.59
1984
102.8
1701.02
7208.052
947.35
1985
108.8
2004.25
9016.037
2040.79
1986
106.0
2204.91
10275.18
2090.73
1987
107.3
2262.18
12058.62
2140.36
1988
118.5
2491.21
15042.82
2390.47
1989
117.8
2823.78
16992.32
2727.4
1990
102.1
3083.59
18667.82
2821.86
1991
102.9
3386.62
21781.5
2990.17
1992
105.4
3742.2
26923.48
3296.91
1993
113.2
4642.3
35333.92
4255.3
1994
121.7
5792.62
48197.86
5126.88
1995
114.8
6823.72
60793.73
6038.04
1996
106.1
7937.55
71176.59
6909.82
1997
100.8
9233.56
78973.03
8234.04
1998
97.4
10798.18
84402.28
9262.8
1999
97.0
13187.67
89677.05
10682.58
2000
98.5
15886.5
99214.55
12581.51
2001
99.2
18902.58
109655.2
15301.38
2002
98.7
22053.15
120332.7
17636.45
2003
99.9
24649.95
135822.8
20017.31
2004
102.8
28486.89
159878.3
24165.68
2005
100.8
33930.28
184937.4
28778.54
2006
101.0
40422.73
216314.4
34804.35
2007
103.8
49781.35
265810.3
45621.97
2008
105.9
62592.66
314045.4
54223.79
2009
98.8
76299.93
340506.9
59521.59
实验一:
多元线性回归
1、将数据导入eviews5.0后,分别对三个解释变量与被解释变量做散点图,选择两个变量作为group打开,在数据表“group”中点击view/graph/scatter/simplescatter,出现数据的散点图,分别如下图所示:
从散点图看,变量间不一定呈现线性关系,可以试着作线性回归。
2、进行因果关系检验
在“workfile”中按住“ctrl”键,点击所要选择的变量,作为组打开后,在“View”下拉列表中选择“GrangeCausality”,滞后期为2,得出如下结果:
PairwiseGrangerCausalityTests
Date:
06/23/11Time:
16:
14
Sample:
19782009
Lags:
2
NullHypothesis:
Obs
F-Statistic
Probability
EDdoesnotGrangerCauseY
30
8.90261
0.00120
YdoesnotGrangerCauseED
18.8091
1.0E-05
PairwiseGrangerCausalityTests
Date:
06/23/11Time:
16:
15
Sample:
19782009
Lags:
2
NullHypothesis:
Obs
F-Statistic
Probability
GDPdoesnotGrangerCauseY
30
1.01199
0.37790
YdoesnotGrangerCauseGDP
0.91874
0.41208
PairwiseGrangerCausalityTests
Date:
06/23/11Time:
16:
19
Sample:
19782009
Lags:
2
NullHypothesis:
Obs
F-Statistic
Probability
RPIdoesnotGrangerCauseY
30
0.66167
0.52479
YdoesnotGrangerCauseRPI
1.60624
0.22067
从因果关系检验看,ED明显影响财政收入Y,其他两个因素影响不显著。
3、做多元线性回归
选中变量作为组打开,在下拉列表“Proc”中选择“MakeEquation”
按“确定”,得到多元回归模型:
根据图中数据,模型估计的结果为:
(29.44784)(0.012839)(0.062849)(3135.746)
t=(1.915151)(3.609459)(9.805713)(-2.043646)
F=2714.480df=27
模型估计结果说明,在假定其他变量不变的情况下,当年RPI每增长1%,平均来说税收收入会增长29.44784亿元;当年GDP每增长1亿元,平均来说税收收入会增长0.012839亿元;当年财政支出每增长1亿元,平均来说税收收入会增长0.062849亿元。
可决系数
,修正后的可决系数
,说明模型的样本的拟合很好。
F检验的数值很大,可以判定,在给定显著性水平α=0.05的情况下,拒绝原假设。
说明回归方程显著,既“国内生产总值”、“财政支出”、“商品零售价格指数”等变量联合起来确实对“税收收入”有显著影响。
从t检验的值可以看出,GDP、ED均对税收收入有显著影响,但是RPI指数的t检验值为1.915151,不通过检验。
实验二:
自相关
1、根据前面的数据把GDP作为解释变量,税收收入作为被解释变量进行一元回归。
结果如下:
DependentVariable:
Y
Method:
LeastSquares
Date:
06/23/11Time:
19:
01
Sample:
19782009
Includedobservations:
32
Variable
Coefficient
Std.Error
t-Statistic
Prob.
GDP
0.169682
0.003899
43.51742
0.0000
C
-1552.721
478.9886
-3.241666
0.0029
R-squared
0.984406
Meandependentvar
12135.70
AdjustedR-squared
0.983886
S.D.dependentvar
16097.40
S.E.ofregression
2043.434
Akaikeinfocriterion
18.14311
Sumsquaredresid
1.25E+08
Schwarzcriterion
18.23472
Loglikelihood
-288.2898
F-statistic
1893.765
Durbin-Watsonstat
0.115021
Prob(F-statistic)
0.000000
把回归分析结果报告出来如下:
(0.003899)(478.9886)
t=(43.51742)(-3.241666)
SE=2043.434DW=0.115021F=1893.765
从报告可以一目了然地看出,D-W值近似为0,存在自相关。
2、用图形检验法检查是否存在自相关
做残差趋势图:
在进行一元回归的界面上,
点击“resid”,生成残差趋势图:
在“workfile”窗口找到“show”,点击
在弹出的“show”对话框中输入“resid(-1)resid”,单击“OK”
点击“view/graph/scatter/simplescatter”,生成残差散点图:
从以上残差趋势图和残差散点图可以看出,方程存在正自相关。
3、回归自相关的处理
在Y对GDP远回归中添入AR
(1)项,如图:
点击“确定”,回归结果如下:
此时D-W值由原来的0.115021提高到1.125604,还没有消除自相关,继续处理,再加入AR
(2)项,结果如下:
DependentVariable:
Y
Method:
LeastSquares
Date:
06/23/11Time:
20:
01
Sample(adjusted):
19802009
Includedobservations:
30afteradjustments
Convergenceachievedafter9iterations
Variable
Coefficient
Std.Error
t-Statistic
Prob.
GDP
0.188524
0.012513
15.06663
0.0000
C
-4664.037
4712.907
-0.989631
0.3315
AR
(1)
1.414221
0.177508
7.967088
0.0000
AR
(2)
-0.462035
0.185079
-2.496418
0.0192
R-squared
0.998941
Meandependentvar
12909.51
AdjustedR-squared
0.998819
S.D.dependentvar
16342.77
S.E.ofregression
561.7293
Akaikeinfocriterion
15.62348
Sumsquaredresid
8204036.
Schwarzcriterion
15.81031
Loglikelihood
-230.3522
F-statistic
8173.607
Durbin-Watsonstat
2.154231
Prob(F-statistic)
0.000000
InvertedARRoots
.90
.51
此时D-W检验值达到2.154231,消除了自相关。
没有消除和消除了自相关的回归方程分别为:
实验三、异方差
1、图形检验法
首先,Y对GDP回归的残差趋势图在前面自相关的实验中已经出现为:
接着,用SORT命令对变量进行排序:
然后,进行残差散点图,在“show”窗口输入指令“gdpresid^2”,点击“OK”,按照路径“view/graph/scatter/simplescatter”,生成残差散点图如下:
从残差散点图上可以直观地看出,方程不存在异方差。
2、Park检验
对Y与GDP回归的Park检验,实际上就是做形如如下的回归观察其显著性
进行回归,的结果为:
DependentVariable:
LOG(RESID^2)
Method:
LeastSquares
Date:
06/23/11Time:
21:
53
Sample:
132
Includedobservations:
32
Variable
Coefficient
Std.Error
t-Statistic
Prob.
LOG(GDP)
0.161370
0.170146
0.948422
0.3505
C
12.89986
1.798054
7.174346
0.0000
R-squared
0.029111
Meandependentvar
14.58963
AdjustedR-squared
-0.003252
S.D.dependentvar
1.367971
S.E.ofregression
1.370194
Akaikeinfocriterion
3.528243
Sumsquaredresid
56.32295
Schwarzcriterion
3.619852
Loglikelihood
-54.45189
F-statistic
0.899503
Durbin-Watsonstat
0.815372
Prob(F-statistic)
0.350493
从结果可以看出,方程是不显著的,既不存在异方差
3、White检验
由一元回归估计结果,按照路径“view/residualtests/Whiteheteroskedasticity(nocrosstermsorcrossterms)”,进入White检验,根据White检验中附注函数的构造,最后一项为变量的交叉乘积项,因为检验一元函数,故无交叉乘积项,因此应选nocross。
经估计出现White检验结果如下:
WhiteHeteroskedasticityTest:
F-statistic
1.596084
Probability
0.219985
Obs*R-squared
3.173112
Probability
0.204629
TestEquation:
DependentVariable:
RESID^2
Method:
LeastSquares
Date:
06/23/11Time:
22:
05
Sample:
132
Includedobservations:
32
Variable
Coefficient
Std.Error
t-Statistic
Prob.
C
2593976.
1086913.
2.386554
0.0238
GDP
23.52750
22.83921
1.030136
0.3115
GDP^2
-3.83E-05
7.44E-05
-0.514197
0.6110
R-squared
0.099160
Meandependentvar
3914645.
AdjustedR-squared
0.037033
S.D.dependentvar
3866921.
S.E.ofregression
3794644.
Akaikeinfocriterion
33.22514
Sumsquaredresid
4.18E+14
Schwarzcriterion
33.36255
Loglikelihood
-528.6022
F-statistic
1.596084
Durbin-Watsonstat
0.360789
Prob(F-statistic)
0.219985
从表中可以看出,n
=3.173112,由White检验知,在α=0.05下,查
分布表,得临界值
(2)=5.9915同时,GDP和GDP^2的t值也不显著,n
=3.173112小于
(2)=5.9915,表明模型不存在异方差。
实验四:
多重共线性
1、在前面所做的多元线性回归模型中,回归结果如下:
由此可见,该模型可决系数很高,F值明显显著,但是当α=0.05时,RPI的t检验不通过,有可能存在多重共线性。
2、计算各解释变量的相关系数,点“view/correlation”得相关系数矩阵
由相关系数矩阵可以看出,各解释变量之间某些相关系数较高,证实存在一定程度的多重共线性。
3、对多重共线性的处理
才用逐步回归法,去检验和解决多重共线性问题,分别作Y对RPI、GDP、ED、
的一元回归,结果如下:
变量RPIGDPED
参数估计值-688.96980.1696820.835385
T统计量-1.53979443.5174274.23802
0.0732440.9844060.994586
0.0423520.9838860.994406
其中,ED的方程
最大,以ED为基础,顺次加入其它变量逐步回归,结果加入GDP后,
=0.996125,加入RPI后,
=0.994979,因此,保留GDP这个影响因素,剔除RPI这个变量。
修正后的回归结果为:
DependentVariable:
Y
Method:
LeastSquares
Date:
06/23/11Time:
23:
24
Sample:
132
Includedobservations:
32
Variable
Coefficient
Std.Error
t-Statistic
Prob.
GDP
0.045494
0.013408
3.393015
0.0020
ED
0.614992
0.065673
9.364498
0.0000
C
-423.5219
271.1510
-1.561941
0.1291
R-squared
0.996125
Meandependentvar
12135.70
AdjustedR-squared
0.995857
S.D.dependentvar
16097.40
S.E.ofregression
1036.089
Akaikeinfocriterion
16.81335
Sumsquaredresid
31130958
Schwarzcriterion
16.95077
Loglikelihood
-266.0137
F-statistic
3727.026
Durbin-Watsonstat
1.003046
Prob(F-statistic)
0.000000
方程为:
Y=0.45494*GDP+0.614992*ED-423.5219
t=(3.393015)(9.364498)(-1.561941)
=0.996125
=0.995857F