计量经济学 上机实验手册汇总.docx
《计量经济学 上机实验手册汇总.docx》由会员分享,可在线阅读,更多相关《计量经济学 上机实验手册汇总.docx(33页珍藏版)》请在冰豆网上搜索。
计量经济学上机实验手册汇总
实验三异方差性
实验目的:
在理解异方差性概念和异方差对OLS回归结果影响的基础上,掌握进行异方差检验和处理的方法。
熟练掌握和运用Eviews软件的图示检验、G-Q检验、怀特(White)检验等异方差检验方法和处理异方差的方法——加权最小二乘法。
实验内容:
书P116例4.1.4:
中国农村居民人均消费函数
中国农村居民民人均消费支出主要由人均纯收入来决定。
农村人均纯收入除从事农业经营的收入外,还包括从事其他产业的经营性收入以及工资性收入、财产收入和转移支付收入等。
为了考察从事农业经营的收入和其他收入对中国农村居民消费支出增长的影响,建立双对数模型:
其中,Y表示农村家庭人均消费支出,X1表示从事农业经营的纯收入,X2表示其他来源的纯收入。
表4.1.1列出了中国内地2006年各地区农村居民家庭人均纯收入及消费支出的相关数据。
表4.1.1中国2006年各地区农村居民家庭人均纯收入与消费支出(单位:
元)
地区
人均消费
支出Y
从事农业经营
的纯收入X1
其他来源纯收入X2
地区
人均消费
支出Y
从事农业经营
的纯收入X1
其他来源纯收入X2
北京
5724.5
958.3
7317.2
湖北
2732.5
1934.6
1484.8
天津
3341.1
1738.9
4489.0
湖南
3013.3
1342.6
2047.0
河北
2495.3
1607.1
2194.7
广东
3886.0
1313.9
3765.9
山西
2253.3
1188.2
1992.7
广西
2413.9
1596.9
1173.6
内蒙古
2772.0
2560.8
781.1
海南
2232.2
2213.2
1042.3
辽宁
3066.9
2026.1
2064.3
重庆
2205.2
1234.1
1639.7
吉林
2700.7
2623.2
1017.9
四川
2395.0
1405
1597.4
黑龙江
2618.2
2622.9
929.5
贵州
1627.1
961.4
1023.2
上海
8006.0
532
8606.7
云南
2195.6
1570.3
680.2
江苏
4135.2
1497.9
4315.3
西藏
2002.2
1399.1
1035.9
浙江
6057.2
1403.1
5931.7
陕西
2181.0
1070.4
1189.8
安徽
2420.9
1472.8
1496.3
甘肃
1855.5
1167.9
966.2
福建
3591.4
1691.4
3143.4
青海
2179.0
1274.3
1084.1
江西
2676.6
1609.2
1850.3
宁夏
2247.0
1535.7
1224.4
山东
3143.8
1948.2
2420.1
新疆
2032.4
2267.4
469.9
河南
2229.3
1844.6
1416.4
注:
从事农业经营的纯收入由从事第一产业的经营总收入与从事第一产业的经营支出之差计算,其他来源的纯收入由总纯收入减去从事农业经营的纯收入后得到。
资料来源:
《中国农村住户调查年鉴(2007)》、《中国统计年鉴(2007)》。
实验步骤:
一、创建文件
1.建立工作文件
CREATEU131【其中的“U”表示非时序数据】
2.录入与编辑数据
DataYX1X2【意思是:
同时录入Y、X1和X2的数据】
3.保存文件
单击主菜单栏中File→Save或Saveas→输入文件名、路径→保存。
二、数据分析
1.散点图
①ScatX1Y
从散点图可看出,农民农业经营的纯收入与农民人均消费支出呈现一定程度的正相关。
②ScatX2Y
从散点图可看出,农民其他来源纯收入与农民人均消费支出呈现较高程度的正相关。
2.数据取对数处理
GenrLY=LOG(Y)
GenrLX1=LOG(X1)
GenrLX2=LOG(X2)
三、模型OLS参数估计与统计检验
LSLYCLX1LX2
得到模型OLS参数估计和统计检验结果:
DependentVariable:
LY
Method:
LeastSquares
Sample:
131
Includedobservations:
31
Variable
Coefficient
Std.Error
t-Statistic
Prob.
C
3.266068
1.041591
3.135653
0.0040
LX1
0.150214
0.108538
1.383975
0.1773
LX2
0.477453
0.051595
9.253853
0.0000
R-squared
0.779878
Meandependentvar
7.928613
AdjustedR-squared
0.764155
S.D.dependentvar
0.355750
S.E.ofregression
0.172766
Akaikeinfocriterion
-0.581995
Sumsquaredresid
0.835744
Schwarzcriterion
-0.443222
Loglikelihood
12.02092
F-statistic
49.60117
Durbin-Watsonstat
1.780981
Prob(F-statistic)
0.000000
【注意:
在学术文献中一般以这种形式给出回归方程的输出结果,而不是把上面的软件输出结果直接粘贴到文章中】
可决系数0.779878,调整可决系数0.764155,显示模型拟合程度较高;同时,F检验统计量49.60117,在5%的显著性水平下通过方程总体显著性检验。
可认为农民农业经营的收入和其他收入整体与农村居民消费支出的线性关系显著成立。
变量X2和截距项均在5%的显著性水平下通过变量显著性检验,但X1在10%的显著水平下仍不能通过检验。
四、异方差检验
对于双对数模型,由于
【二者均为弹性系数】,可认为其他来源的纯收入而不是从事农业经营的纯收入的增长,对农户人均消费的增长更有刺激作用。
也就是说,不同地区农村人均消费支出的差别主要来源于非农经营收入及工资收入、财产收入等其他来源收入的差别,因此,如果模型存在异方差性,则可能是X2引起的。
1.图示检验法
观察残差的平方与LX2的散点图。
①残差(resid)
残差(resid)变量数据是模型参数估计命令完成后由Eviews软件自动生成(在Workfile框里可找到),无需人工操作获得。
注意,resid保留的是最近一次估计模型的残差数据。
②残差的平方与LX2的散点图
ScatLX2resid^2
从上图可大体判断出模型存在递增型异方差性。
2.G-Q法检验异方差
补充:
先定义一个变量T,取值为1、2、…、31【分别代表各省市】,用于在做完G-Q检验之后,再按T排序,使数据顺序还原。
DataT【提示:
输入1、2、…、31】
①将所有原始数据按照X2升序排列。
SortX2
ShowYX1X2LYLX1LX2
显示各个变量数据的目的是查看一下,所有变量数据是否按X2升序排列好了。
②将31对样本数据,去掉中间的7对,形成两个容量均为12的子样本,即1-12和20-31。
③对1-12的子样本做普通最小二乘估计,并记录残差平方和
。
Smpl112【意思是:
将样本区间由1-31,改为1-12】
LsLYCLX1LX2
DependentVariable:
LY
Method:
LeastSquares
Sample:
112
Includedobservations:
12
Variable
Coefficient
Std.Error
t-Statistic
Prob.
C
3.141208
1.122358
2.798757
0.0208
LX1
0.398385
0.078791
5.056234
0.0007
LX2
0.234751
0.109747
2.139009
0.0611
R-squared
0.739693
Meandependentvar
7.700532
AdjustedR-squared
0.681847
S.D.dependentvar
0.156574
S.E.ofregression
0.088316
Akaikeinfocriterion
-1.803481
Sumsquaredresid
0.070197
Schwarzcriterion
-1.682255
Loglikelihood
13.82089
F-statistic
12.78726
Durbin-Watsonstat
1.298449
Prob(F-statistic)
0.002343
子样本1:
=0.070197
④对20-31的子样本做普通最小二乘估计,并记录残差平方和
。
Smpl2031【意思是:
将样本区间由1-12,改为20-31】
LsLYCLX1LX2
DependentVariable:
LY
Method:
LeastSquares
Sample:
2031
Includedobservations:
12
Variable
Coefficient
Std.Error
t-Statistic
Prob.
C
3.993644
1.884054
2.119708
0.0631
LX1
-0.113766
0.159962
-0.711205
0.4950
LX2
0.620168
0.111654
5.554380
0.0004
R-squared
0.876931
Meandependentvar
8.239746
AdjustedR-squared
0.849582
S.D.dependentvar
0.375812
S.E.ofregression
0.145754
Akaikeinfocriterion
-0.801478
Sumsquaredresid
0.191197
Schwarzcriterion
-0.680251
Loglikelihood
7.808868
F-statistic
32.06485
Durbin-Watsonstat
2.565362
Prob(F-statistic)
0.000080
子样本2:
=0.191197
⑤异方差检验
在5%与10%的显著性水平下,自由度为(9,9)的F分布临界值分别为
与
。
因此5%显著性水平下不能拒绝同方差假设,但在10%的显著性水平下拒绝。
补充:
怀特检验
软件操作:
在原始模型的OLS方程对象窗口中,选择view/Residualtest/WhiteHeteroskedasticity。
Eviews提供了包含交叉项的怀特检验“WhiteHeteroskedasticity(crossterms)”和没有交叉项的怀特检验“WhiteHeteroskedasticity(nocrossterms)”这样两个选择。
【问题:
如果是刚做完上面的G-Q检验,如何得到原始模型?
答案:
先恢复成全样本,再按T排序,然后做OLS回归。
】
SMPL131【意思是:
将样本区间恢复到1-31】
补充:
将样本数据按T升序排列,使数据顺序还原。
SortT【意思是:
将数据顺序还原】
LsLYCLX1LX2
下面是在原始模型的OLS方程对象窗口中,选择view/Residualtest/WhiteHeteroskedasticity,然后进行包含交叉项的怀特检验“WhiteHeteroskedasticity(crossterms)”所得到的输出结果【最上方显示了两个检验统计量:
F统计量和White统计量nR2;下方显示的是以OLS的残差平方为被解释变量的辅助回归方程的回归结果】:
WhiteHeteroskedasticityTest:
F-statistic
9.833740
Probability
0.000027
Obs*R-squared
20.55085
Probability
0.000985
TestEquation:
DependentVariable:
RESID^2
Method:
LeastSquares
Date:
05/03/11Time:
17:
21
Sample:
131
Includedobservations:
31
Variable
Coefficient
Std.Error
t-Statistic
Prob.
C
10.24328
5.474522
1.871082
0.0731
LNX1
-2.329070
1.116442
-2.086153
0.0473
LNX1^2
0.149114
0.058107
2.566195
0.0167
LNX1*LNX2
0.019333
0.041265
0.468507
0.6435
LNX2
-0.457307
0.454020
-1.007238
0.3235
LNX2^2
0.021101
0.013357
1.579694
0.1267
R-squared
0.662931
Meandependentvar
0.026959
AdjustedR-squared
0.595517
S.D.dependentvar
0.042129
S.E.ofregression
0.026794
Akaikeinfocriterion
-4.229312
Sumsquaredresid
0.017948
Schwarzcriterion
-3.951766
Loglikelihood
71.55434
F-statistic
9.833740
Durbin-Watsonstat
1.462377
Prob(F-statistic)
0.000027
可见,怀特统计量nR2=20.55085【=31×0.662931】,大于自由度【也即辅助回归方程中解释变量的个数】为5的2分布临界值
,因此,在5%的显著性水平下拒绝同方差的原假设。
五、采用加权最小二乘法处理异方差【以下内容和教材P118-120不一样,但是我们必须掌握的重点——以原始模型的OLS回归残差的绝对值的倒数为权数,手工完成加权最小二乘估计】
LSLYCLX1LX2
GenrE=resid【意思是:
记录双对数模型OLS估计的残差】
用残差的绝对值的倒数对LY、LX1、LX2做加权:
GenrLYE=LY/abs(E)
GenrLX1E=LX1/abs(E)
GenrLX2E=LX2/abs(E)
GenrCE=1/abs(E)
LSLYECELX1ELX2E
DependentVariable:
LYE
Method:
LeastSquares
Sample:
131
Includedobservations:
31
Variable
Coefficient
Std.Error
t-Statistic
Prob.
CE
3.326576
0.173572
19.16543
0.0000
LX1E
0.150945
0.024819
6.081832
0.0000
LX2E
0.467864
0.009782
47.83095
0.0000
R-squared
0.999984
Meandependentvar
188.5956
AdjustedR-squared
0.999983
S.D.dependentvar
245.8904
S.E.ofregression
1.014851
Akaikeinfocriterion
2.959126
Sumsquaredresid
28.83782
Schwarzcriterion
3.097899
Loglikelihood
-42.86646
Durbin-Watsonstat
1.522872
可以看出,lnX1参数的t统计量有了显著改进,这表明在1%显著性水平下,都不能拒绝从事农业生产带来的纯收入对农户人均消费支出有着显著影响的假设。
六、检验加权的回归模型是否还存在异方差
1.检验是否由LX1E引起异方差
SortLX1E【意思是:
将原始数据按LX1E升序排列】
①子样本1的回归:
Smpl112
LSLYECELX1ELX2E
DependentVariable:
LYE
Method:
LeastSquares
Sample:
112
Includedobservations:
12
Variable
Coefficient
Std.Error
t-Statistic
Prob.
CE
1.831689
2.087729
0.877360
0.4031
LX1E
0.357479
0.218092
1.639121
0.1356
LX2E
0.462127
0.106042
4.357942
0.0018
R-squared
0.989665
Meandependentvar
35.95002
AdjustedR-squared
0.987369
S.D.dependentvar
9.562672
S.E.ofregression
1.074733
Akaikeinfocriterion
3.194340
Sumsquaredresid
10.39546
Schwarzcriterion
3.315566
Loglikelihood
-16.16604
Durbin-Watsonstat
2.429720
子样本1:
=10.39546
②子样本2的回归:
Smpl2031
LSLYECELX1ELX2E
DependentVariable:
LYE
Method:
LeastSquares
Date:
05/01/11Time:
23:
23
Sample:
2031
Includedobservations:
12
Variable
Coefficient
Std.Error
t-Statistic
Prob.
CE
3.322535
0.186723
17.79394
0.0000
LX1E
0.152994
0.027038
5.658417
0.0003
LX2E
0.466559
0.010483
44.50623
0.0000
R-squared
0.999989
Meandependentvar
397.9217
AdjustedR-squared
0.999987
S.D.dependentvar
292.1047
S.E.ofregression
1.057514
Akaikeinfocriterion
3.162037
Sumsquaredresid
10.06502
Schwarzcriterion
3.283264
Loglikelihood
-15.97222
Durbin-Watsonstat
1.471565
子样本2:
=10.06502
③异方差检验【注意做题的步骤】
提出假设
计算检验统计量:
在5%的显著性水平下,自由度为(9,9)的F分布临界值分别为
。
因此5%显著性水平下不能拒绝同方差假设。
2.检验是否由LX2E引起异方差
Smpl131【意思是:
将样本区间复原】
Sortlx2e【意思是:
将原始数据按LX2E升序排列】
①子样本1的回归:
Smpl112
LSLYECELX1ELX2E
DependentVariable:
LYE
Method:
LeastSquares
Sample:
112
Includedobservations:
12
Variable
Coefficient
Std.Error
t-Statistic
Prob.
CE
1.474650
1.815563
0.812227
0.4376
LX1E
0.403271
0.181466
2.222299
0.0534
LX2E
0.469307
0.098307
4.773907
0.0010
R-squared
0.991889
Meandependentvar
36.19042
AdjustedR-squared
0.990086
S.D.dependentvar
10.00683
S.E.ofregression
0.996372
Akaikeinfocriterion
3.042927
Sumsquaredresid
8.934823
Schwarzcriterion
3.164153
Loglikelihood
-15.25756
Durbin-Watsonstat
2.031453
子样本1:
=8.934823
②子样本2的回归:
Smpl2031
LSLYECELX1ELX2E
DependentVariable:
LYE
Method:
LeastSquares
Sample:
2031
Includedobservations:
12
Variable
Coefficient
Std.Error
t-Statistic
Prob.
CE
3.322535
0.186723
17.79394
0.00