计量经济学实验指导.docx
《计量经济学实验指导.docx》由会员分享,可在线阅读,更多相关《计量经济学实验指导.docx(87页珍藏版)》请在冰豆网上搜索。
计量经济学实验指导
计量经济学实验指导
实验一多元线性回归模型
【实验目的】
通过本实验,了解Eviews软件,熟悉软件建立工作文件,文件窗口操作,数据输入与处理等基本操作。
掌握多元线性回归模型的估计方法,学会用Eiews软件进行多元回归分析。
通过本实验使得学生能够根据所学知识,对实际经济问题进行分析,建立计量模型,利用Eiews软件进行数据分析,并能够对输出结果进行解释说明。
【实验内容及步骤】
本实验选用美国金属行业主要的27家企业相关数据,如下表,其中被解释变量Y表示产出,解释变量L表示劳动力投入,K表示资本投入。
试建立三者之间的回归关系。
观测值
Y
L
K
观测值
Y
L
K
1
657.31
162
279.99
15
1917.55
536
2109.34
2
935.93
214
542.5
16
9849.17
1564
13989.55
3
1110.65
186
721.51
17
1088.27
214
884.24
4
1200.89
245
1167.68
18
8095.63
1083
9119.7
5
1052.68
211
811.77
19
3175.39
521
5686.99
6
3406.02
690
4558.02
20
1653.38
304
1701.06
7
2427.89
452
3069.91
21
5159.31
835
5206.36
8
4257.46
714
5585.01
22
3378.4
284
3288.72
9
1625.19
320
1618.75
23
592.85
150
357.32
10
1272.05
253
1562.08
24
1601.98
259
2031.93
11
1004.45
236
662.04
25
2065.85
497
2492.98
12
598.87
140
875.37
26
2293.87
275
1711.74
13
853.1
154
1696.98
27
745.67
134
768.59
14
1165.63
240
1078.79
【实验内容及步骤】
1.数据的输入
STEP1:
双击桌面上Eviews快捷图标,打开Eviews,如图1.
图1
STEP2:
点击Eviews主画面顶部按钮file/new/Workfile,如图2,弹出workfilecreate对话框如图3。
在frequency中选择integerdata,在startdate和enddate中分别输入1和27,点击OK,出现图如4画面,Workfile定义完毕。
在新建的workfile中已经存在两个objects,即c和residual。
c是系数向量、residual是残差序列,当估计完一个模型后,该模型的系数、残差就分别保存在c和residual中。
图2
图3
图4
STEP3:
在workfile空白部分单击右键,选择Newobject,在Typeofobject中选择Series,将该对象命名为Y,如图5.单击ok,得到图6。
图5
图6
STEP4:
双击图6中的图标“y”,得到如下图7,是关于序列“y”的工作表。
点击表示命令栏中的“Edit+/-”即可进入数据输入状态,利用给定的数据逐步输入27个数值。
图7
STEP5:
重复上面的数据输入步骤,依次输入序列“L”和“K”.如下图8所示.
图8
2数据描述
(1).数据的查看方式。
Eviews可以有多种不同数据的查看方式,在数据输入时用的表格形式,即Spreadsheet。
双击“y”,得到Spreadsheet形式,点击表格命令栏中的view,选择Graph可以用图的形式显示数据。
如选择Line,得到图10的线性图。
图9
图10
(2).数据的统计性质。
双击“y”,得到Spreadsheet形式,点击表格命令栏中的“view”,选择“DescriptiveStatistics”、“HistogramandState”,如图11,得到图12,其中给出了序列“y”的均值、方差等统计量以及用以判断该序列是否服从正态分布的JB概率等。
图11
图12
3.多个序列的走势图。
有些时候为了方便找出多个变量之间的关系,需要观察多个变量的走势,Eviews处理这个问题的方法也很简单。
在workfile中按住control键依次选中“y”“l”“k”,单击右键,选择“open”“asgroup”如图13,得到图14。
此时3个序列被显示在一张表格中。
单击图13中的“View”“Graph”“Line”得到图15。
图13
图14
图15
4.生成新的序列。
有时为了研究的需要要在原有序列的基础上进行处理生产新的序列。
比如我们需要对序列“y”“l”“k”取对数的步骤如下:
在命令栏中点击“Genr”得到如图15的对话框,在空白部分输入“lny=log(y)”表示新建的序列lny是由原有序列y取对数得到的。
点击“ok”后,lny序列被保存。
相同的方法可建立新序列lnl与lnk,如图17。
图16
图17
4.多元回归分析。
利用序列“lny”“lnl”“lnk”进行多元回归分析的方法有两种。
按住control键,依次选中三个序列,右键选择“open”“asEquation”如图18得到图19。
或者在窗口上方的命令栏中点击选择“Quick”“EstimateEquation”如图19得到图20。
在图20中输入lny、lnc、lnl、lnk,中间用空格键隔开,点击“确定”得到最终的回归分析结果,如图21。
图18
图19
图20
图21
5.结果分析。
从图20可以看出,回归方程为LNY=0.6078151931*LNL+0.371887487*LNK+1.171524819,并且通过了F检验和t检验,并且可决系数为0.9424,调整后的可决系数为0.9377,表明建立的回归方程的统计性质是是比较好的。
点击命令栏中的“Resids”得到图21,可以看出实际值和拟合值是非常的接近的。
图22
从图22中可以看出残差在0的上下摆动,可以对其进行正态性检验。
点击“resid”
序列,选择“View”“DescriptiveStatistics”,“HistogramandState”得到图23,通过正态性检验。
图23
作业:
利用中国统计年鉴2011,建立我国税收收入、国内生产总值、财政支出、商品零售价格指数的回归模型。
课堂练习
据相关数据以税收收入为被解释变量,国民生产总值和财政支出及商品零售价格指数为解释变量建立我国税收收入的多元模型。
实验二异方差的检验与处理
【实验目的】
了解异方差的概念及产生的原因,学会异方差的检验方法(图示法、帕克检验法、格里瑟检验法、GQ检验法等)和修正的方法-加权最小二乘法。
【实验内容及步骤】
Y消费性支出
X可支配支出
Y消费性支出
X可支配支出
8493.49
10349.69
7020.22
9279.16
6121.04
8140.5
5022
6489.97
4348.47
5661.16
3830.71
4766.26
3941.87
4724.11
4644.5
5524.54
3927.75
5129.05
5218.79
6218.73
4356.06
5357.79
8016.91
9761.57
4020.87
4810
4276.67
5124.24
3824.44
4912.88
4126.47
4916.25
8868.19
11718.01
4185.73
5169.96
5323.18
6800.23
4422.93
5644.86
(1)采用OLS估计结果如图1:
图1
(2)观察e2—X图。
首先生成e2序列。
点击“genr”输入“e2=resid*resid”得到残差的平方e2。
点击窗口上方的“Quick”“Graph”“Scatter”如图2,得到图3,在空白部分输入“x,e2”,点击“ok”得到图4。
从中不看出随着X的增大e2有变大的趋势,可以初步判断存在递增型的异方差。
图2
图3
图4
(3)G-Q检验首先对序列“x”进行排序,然后选择前8个样本进行最小二乘回归,结果如下图5,选择后8个样本回归的结果如图6。
图5
图6
由图5和图6知道两组样本的残差平方和即SSR分别是126528.3、615472.0。
构造F统计量
,又因为
,于是拒绝无异方差的假设,表明模型存在异方差。
(4)怀特检验。
在对原模型进行OLS估计后的窗口中,选择“View”“ResidualTests”
“WhiteHetero…”,如图7,得到如图8的检验结果。
图7
图8
从图8中可以看出nR2统计量的伴随概率为0.001789,即在5%的显著性水平下,原模型存在异方差。
(5)异方差的修正。
首先用log(e2)关于x的OLS回归,如下图9
图9
结果显示,变量的线性关系在5%的显著性水平下成立。
可生成权序列
。
具体的方法为点击“genr”在对话框中输入w=1/@sqrt(exp(6.8251+0.00046))如下图10。
点击“ok”即可生成序列“w”
图10
下面用加权最小二乘法进行估计。
首先选中序列“x”“y”,右键选择“open”“asequation”,在出现的对话框中输入“ycx”,如图11。
然后选择“option”,选中“WeightedLS/TSLS”,输入“w”,如图12。
点击“确定”,得到加权最小二乘的估计表达式,如图13。
图11
图12
图13
可以看出与不加权的最小二乘小比较,加权的最小二乘估计使得参数估计值有所下降,但是标准差却增大了。
表明最小二乘低估了x对应参数的标准差。
可以验证加权最小二乘估计的模型已经不存在异方差,怀特检验的结果如图14。
图14
注:
在实际建立模型时候,可以对原有的序列取对数,这种方法有时可以消除异方差或者有效降低异方差。
课堂练习
选择某省份,查找该省城镇居民家庭人均消费和收入的相关数据,建立回归模型后在进行异方差的检验与处理。
实验三序列相关的检验与处理
【实验目的】
在理解自相关的基本概念及其导致的后果的基础上,掌握诊断自相关存在的方法和修正自相关的方法。
能够熟练使用Eviews对实际经济问题独立进行自相关的诊断与处理。
【实验内容及步骤】
下表是我国1980-2007年社会固定资产总额X和工业增加值的统计结果,如果采用对数形式的模型:
,试对该模型进行序列相关的检验,若存在序列相关的问题,请采用相关方法处理。
obs
Y
X
obs
Y
X
1980
1996.5
910.9
1994
19480.7
17042.1
1981
2048.4
961
1995
24950.6
20019.3
1982
2162.3
1230.4
1996
29447.6
22913.5
1983
2375.6
1430.1
1997
32921.4
24941.1
1984
2789
1832.9
1998
34018.4
28406.2
1985
3448.7
2543.2
1999
35861.5
29854.7
1986
3967
3120.6
2000
40033.6
32917.7
1987
4585.8
3791.7
2001
43580.6
37213.5
1988
5777.2
4753.8
2002
47431.3
43499.9
1989
6484
4410.4
2003
54945.5
55566.6
1990
6858
4517
2004
65210
70477.4
1991
8087.1
5594.5
2005
77230.8
88773.6
1992
10284.5
8080.1
2006
91310.9
109998.2
1993
14188
13072.3
2007
107367.2
137323.9
(1)首先对取对数后的lny与lnx进行回归分析,结果如图1。
点击“Resids”得到残差序列图2。
(2)从残差图观察,此时似乎不太好像结论,下面用其他的检验方法检验相关性。
(3)D.W检验。
从图1中发现D.W.的值为0.379323。
又因为5%的显著性水平下,样本容量为28的D.W.分布的下限临界值为dL为1.33,因此模型存在1阶序列相关。
(4)LM检验。
在估计窗口中依次选中“View”“ResidualTests”“SerialCorrelationLMTest”如图3。
在得到的窗口中输入滞后阶数“1”如图4所示。
点击“ok”后得到图5。
图1
图2
图3
图4
图5
从图5中发现nR2统计量的伴随概率小于显著性水平5%,从而可知模型存在1阶的序列自相关。
同样的方法输入滞后阶数“2”“3”得到图6和图7。
图6
从图6和图7我们可以发现,本模型存在2阶自相关,但是不存在3阶自相关。
图7
(5)模型的估计。
选择“Quick”“EstimateEquation”,在出现的对话框中输入“lnyclnxAR
(1)AR
(2)”,得到图8的估计结果。
图8
由图8可以知道原估计的模型可写为:
LNY=1.462411093+0.8657254045*LNX+1.153099738AR
(1)-0.5166722259AR
(2)。
其中AR
(1)和AR
(2)前面的系数即为随机扰动项的相关系数。
我们还可以发现经广义最小二乘估计的模型已经不存在1阶序列相关性。
LM的检验结果如图9。
图9
(6)在Eviews中,回到OLS估计的窗口,点击“Estimate”在出现的对话框中点击“Option”,在出现的窗口中选择“Heteroskedastic”选项,并选中“New-West”选项。
如图10所示。
图10
点击“确定”,得到图11。
从该图结果中可以发现变量X的对数修正后的标准差比OLS估计的结果有所增大,表明原模型的OLS的估计结果低估了X的标准差。
图11
课堂练习
查找中国统计年鉴得到我国GDP与进出口的相关数据,建立回归模型,并进行自相关检验与修正。
实验四多重共线性的检验与处理
【实验目的】
通过本实验,要求学生在理解计量经济模型能够中出现的多重共线性的不良后果的基础上,掌握诊断多重共线性和修正多重共线性的方法。
【实验内容及步骤】
建立我国农业生产相关计量模型。
原始数据表:
年份
粮食产量(万吨)/Y
农业化肥施用量(万公斤)/X
粮食播种面积(千公顷)/X
成灾面积(公顷)/X
农业机械总动力(万千瓦)/X
农业劳动力(万人)/X
1983
38728
1660
114047
16209
18022
31151
1984
40731
1740
112884
15264
19497
30868
1985
37911
1776
108845
22705
20913
31130
1986
39151
1931
110933
23656
22950
31254
1987
40208
1999
111268
20393
24836
31663
1988
39408
2142
110123
23945
26575
32249
1989
40755
2357
112205
24449
28067
33225
1990
44624
2590
113466
17819
28708
38914
1991
43529
2806
112314
27814
29389
39098
1992
44264
2930
110560
25895
30308
38699
1993
45649
3152
110509
23133
31817
37680
1994
44510
3318
109544
31383
33802
36628
1995
46662
3594
110060
22267
36118
35530
1996
50454
3828
112548
21233
38547
34820
1997
49417
3981
112912
30309
42016
34840
1998
51230
4084
113787
25181
45208
35177
1999
50839
4124
113161
26731
48996
35768
2000
46218
4146
108463
34374
52574
36043
2001
45264
4254
106080
31793
55172
36513
2002
45706
4339
103891
27319
57930
36870
2003
43070
4412
99410
32516
60387
36546
2004
46947
4637
101606
16297
64028
35269
2005
48402
4766
104278
19966
68398
33970
2006
49804
4928
104958
24632
72522
32561
2007
50160
5108
105638
25064
76590
31444
中国粮食生产与相关投入资料,来源《中国统计年鉴》
下面建立Y与Xi之间的计量模型。
(1)输入原始数据,按照以前的方法再生成去对数后的序列,如下图1。
图1
对对数序列做多元回归分析,结果如图2。
从该图中可以发现,回归方程有较高的可决系数,并且F统计量的值较大,伴随概率为零,这都说明方程有着较好的拟合优度。
但是,我们可以发现,某些参数没能通过t检验,并且符号的经济意义也不合理,故认为模型存在多重共线性。
图2
(3)检验5个解释变量之间的相关系数。
将lny与lnxi展开成组,点击“View”
选择“Correlations”“CommonSample”如图2,可以得到图3。
图2
图3
从图3中发现,lny与lnx1的相关性较高,相关系数为0.277596。
lnx1与lnx4的相关性也较高,为0.776276。
(4)逐步回归。
第一步将lny和lnx1做回归分析,结果如下图4。
可以看出,方程的拟合优度较高,变量也通过了t检验。
D.W.检验表明模型不存在1阶序列相关。
图4
第二步在模型中加入lnx2,进行回归分析结果如图5。
图5
通过图4和图5的比较分析可以看出引入lnx2后,模型的拟合优度得到了提高,变量通过t检验,不存在序列相关性。
第三步再在模型中引入lnx3,进行回归分析,结果如下如图6。
与图5比较发现模型的拟合优度再次得到了提高,变量也通过t检验,且由LM检验结果发现不存在序列相关性,图7所示。
图6
图7
第四步在模型中引入lnx4,如图8。
发现引入后的修正的可决系数较上一步有所降低,并且lnx4也未能通过t检验。
第五部去掉lnx4,引入lnx5的回归结果见图9。
从图9中可以发现,引入lnx5后虽然拟合优度有所提高,单数参数未能通过t检验。
第四步和第五步的结果表明模型中的lnx4和lnx5两个变量是多余的。
同样还可以验证若首先让lnx4进入模型,最终发现模型的拟合效果都没有以lnx1、lnx2、lnx3的效果好。
最终通过上述分析可以得到最终的回归形式为:
LNY=0.32338*LNX1+1.29073*LNX2–0.08675*LNX3-5.9996
图8
图9
课堂练习
根据相关数据,建立我国旅游年收入和旅游人数、城镇居民人均旅游支出、农村居民旅游支出、公里里程、铁路里程之间的计量关系,并进行多重共线性的检验与处理。
实验五虚拟变量模型
【实验目的】
通过本实验,要求学生能够在理解虚拟变量的意义和实际中的存在必要性的基础上,熟练使用Eviews软件对虚拟被解释变量模型进行估计。
【实验内容及步骤】
改革开放以来,随着经济的发展中国城乡居民的收入快速增长,同时城乡居民的储蓄存款也迅速增长。
经济学界的一种观点认为,20世纪90年代以后由于经济体制、住房、医疗、养老等社会保障体制的变化,使居民的储蓄行为发生了明显改变。
为了考察改革开放以来中国居民的储蓄存款与收入的关系是否已发生变化,以城乡居民人民币储蓄存款年底余额代表居民储蓄(Y),以国民总收入GNI代表城乡居民收入,分析居民收入对储蓄存款影响的数量关系。
表8.1为1978-2003年中国的国民总收入和城乡居民人民币储蓄存款年底余额及增加额的数据。
国民总收入(GNI),城乡居民人民币储蓄存款年底余额(Y),城乡居民人民币储蓄存款增加额(YY)
表8.1国民总收入与居民储蓄存款单位:
亿元
年份
(GNI)
(Y)
(YY)
年份
(GNI)
(Y)
(YY)
1978
3624.1
210.6
NA
1991
21662.5
9241.6
2121.800
1979
4038.2
281.0
70.4
1992
26651.9
11759.4
2517.800
1980
4517.8
399.5
118.5
1993
34560.5
15203.5
3444.100
1981
4860.3
532.7
124.2
1994
46670.0
21518.8
6315.300
1982
5301.8
675.4
151.7
1995
57494.9
29662.3
8143.500
1983
5957.4
892.5
217.1
1996
66850.5
38520.8
8858.500
1984
7206.7
1214.7
322.2
1997
73142.7
46279.8
7759.000
1985
8989.1
1622.6
407.9
1998
76967.2
53407.5
7615.400
1986
10201.4
2237.6
615.0
1999
80579.4
59621.8
6253.000
1987
11954.5
3073.3
835.7
2000
88254.0
64332.4
4976.700
1988
14922.3
3801.