实验 异方差的检验与修正文档格式.docx
《实验 异方差的检验与修正文档格式.docx》由会员分享,可在线阅读,更多相关《实验 异方差的检验与修正文档格式.docx(11页珍藏版)》请在冰豆网上搜索。
烟草加工业
183.87
1328.59
塑料制品业
144.34
1345
纺织业
316.79
3862.9
非金属矿制品
339.26
2866.14
服装制品业
157.7
1779.1
黑色金属冶炼
367.47
3868.28
皮革羽绒制品
81.7
1081.77
有色金属冶炼
144.29
1535.16
木材加工业
35.67
443.74
金属制品业
201.42
1948.12
家具制造业
31.06
226.78
普通机械制造
354.69
2351.68
造纸及纸品业
134.4
1124.94
专用设备制造
238.16
1714.73
印刷业
90.12
499.83
交通运输设备
511.94
4011.53
文教体育用品
54.4
504.44
电子机械制造
409.83
3286.15
石油加工业
194.45
2363.8
电子通讯设备
508.15
4499.19
化学原料纸品
502.61
4195.22
仪器仪表设备
72.46
663.68
二、异方差的检验
1、图形分析检验
⑴观察销售利润(Y)与销售收入(X)的相关图(图3-1):
SCATXY
图3-1我国制造工业销售利润与销售收入相关图
从图中可以看出,随着销售收入的增加,销售利润的平均水平不断提高,但离散程度也逐步扩大。
这说明变量之间可能存在递增的异方差性。
⑵残差分析
首先将数据排序(命令格式为:
SORT解释变量),然后建立回归方程。
在方程窗口中点击Resids按钮就可以得到模型的残差分布图(或建立方程后在Eviews工作文件窗口中点击resid对象来观察)。
图3-2我国制造业销售利润回归模型残差分布
图3-2显示回归方程的残差分布有明显的扩大趋势,即表明存在异方差性。
2、Goldfeld-Quant检验
⑴将样本安解释变量排序(SORTX)并分成两部分(分别有1到10共11个样本合19到28共10个样本)
⑵利用样本1建立回归模型1(回归结果如图3-3),其残差平方和为2579.587。
SMPL110
LSYCX
图3-3样本1回归结果
⑶利用样本2建立回归模型2(回归结果如图3-4),其残差平方和为63769.67。
SMPL1928
图3-4样本2回归结果
⑷计算F统计量:
=63769.67/2579.59=24.72,
分别是模型1和模型2的残差平方和。
取
时,查F分布表得
,而
,所以存在异方差性
3、White检验
⑴建立回归模型:
LSYCX,回归结果如图3-5。
图3-5我国制造业销售利润回归模型
⑵在方程窗口上点击View\Residual\Test\WhiteHeteroskedastcity,检验结果如图3-6。
图3-6White检验结果
其中F值为辅助回归模型的F统计量值。
取显著水平
,由于
所以存在异方差性。
实际应用中可以直接观察相伴概率p值的大小,若p值较小,则认为存在异方差性。
反之,则认为不存在异方差性。
4、斯皮尔曼等级相关系数检验
其操作步骤为:
A.对X排序:
命令行输入SORTX
B.输入X的等级:
datad1(依次输入1-n的自然数);
C.对残差绝对值排序:
命令行输入SORTabs(resid);
D.输入残差绝对值的等级:
datad2(依次输入1-n的自然数);
E.依据公式计算等级相关系数检验统计量,并查表得出结论。
5、异方差的消除—加权最小二乘法
加权最小二乘法中,最重要的是确定权重的确定,一般而言,采用残差绝对值的倒数作为权重,也可以采用其他形式。
A.首先,用SMPL命令设定样本的区间(包括所有观测值),如:
SMPL131
B.进行最小二乘回归,得到残差序列,LSYCX
C.根据残差确定权重,GENRW1=1/ABS(RESID)
D.进行加权最小二乘估计,LS(W=W1)YCX;
或在方程窗口中点击Estimate\Option按钮,并在权数变量栏里依次输入W1
回归结果如下图3-7所示:
图3-7
E.对回归方程在进行White检验,观察异方差的调整情况
对所估计的模型再进行White检验,其结果如下图3-8所示:
图3-8
图3-8对应的White检验没有显示F值和
的值,这表示异方差性已经得到很好的解决。
实验四序列相关的检验与修正
1、理解序列相关的含义后果、
2、学会序列相关的检验与消除方法
利用下表资料,试建立我国城乡居民储蓄存款模型,并检验模型的自相关性。
表3我国城乡居民储蓄存款与GDP统计资料(1978年=100)
年份
存款余额Y
GDP指数X
1978
210.60
100.0
1989
5146.90
271.3
1979
281.00
107.6
1990
7034.20
281.7
1980
399.50
116.0
1991
9107.00
307.6
1981
523.70
122.1
1992
11545.40
351.4
1982
675.40
133.1
1993
14762.39
398.8
1983
892.50
147.6
1994
21518.80
449.3
1984
1214.70
170.0
1995
29662.25
496.5
1985
1622.60
192.9
1996
38520.84
544.1
1986
2237.60
210.0
1997
46279.80
592.0
1987
3073.30
234.0
1998
53407.47
638.2
1988
3801.50
260.7
一、模型的估计
0、准备工作。
建立工作文件,并输入数据。
1、相关图分析
相关图表明,GDP指数与居民储蓄存款二者的曲线相关关系较为明显。
现将函数初步设定为线性、双对数等不同形式,进而加以比较分析。
2、估计模型,利用LS命令分别建立以下模型
⑴线性模型:
LSYCX
(-6.706)(13.862)
=0.9100F=192.145S.E=5030.809
⑵双对数模型:
GENRLNY=LOG(Y)
GENRLNX=LOG(X)
LSLNYCLNX
(-31.604)(64.189)
=0.9954F=4120.223S.E=0.1221
3、选择模型
比较以上模型,可见各模型回归系数的符号及数值较为合理。
各解释变量及常数项都通过了
检验,模型都较为显著。
比较各模型的残差分布表。
线性模型的残差在较长时期内呈连续递减趋势而后又转为连续递增趋势,残差先呈连续递增趋势而后又转为连续递减趋势,因此,可以初步判断这种函数形式设置是不当的。
而且,这个模型的拟合优度也较双对数模型低,所以又可舍弃线性模型。
双对数模型具有很高的拟合优度,因而初步选定回归模型为双对数回归模型。
二、模型自相关的检验
1.图示法
其一,残差序列et的变动趋势图。
菜单:
Quick→Graph→line,在对话框中输入resid;
或者用命令操作,直接在命令行输入:
lineX。
其二,作et-1和et之间的散点图。
Quick→Graph→Scatter,在对话框中输入resid(-1)resid;
scatresid(-1)resid。
2.DW检验
因为n=21,k=1,取显著性水平
=0.05时,查表得
=1.22,
=1.42,而0<
0.7062=DW<
,所以存在(正)自相关。
3.LM(BG)检验
在方程窗口中点击View/ResidualTest/SeriesCorrelationLMTest,并选择滞后期为2,则会得到如图4-1所示的信息。
图4-1双对数模型的BG检验
图中,
=11.31531,临界概率P=0.0034,因此辅助回归模型是显著的,即存在自相关性。
又因为
,
的回归系数均显著地不为0,说明双对数模型存在一阶和二阶自相关性。
三、自相关的修正
(1)自相关系数ρ的估计
主要的方法有:
A.根据ρ和DW统计量之间的近似关系,取ρ的估计为:
1-DW/2
B.直接取ρ=1
C.采用杜宾两步法估计。
LSYCY(-1)XX(-1),Y(-1)的系数估计即为ρ的估计
D.科克伦-奥科特迭代法。
首先产生残差序列,命名为e,然后e对其滞后1阶回归(无常数项),LSee(-1),e(-1)的系数估计作为ρ的估计
(2)加入AR项
在LS命令中加上AR
(1)和AR
(2),使用迭代估计法估计模型。
键入命令:
LSLNYCLNXAR
(1)AR
(2)
则估计结果如图4-2所示。
图4-2加入AR项的双对数模型估计结果
图4-2表明,调整后模型的DW=1.6445,n=19,k=1,取显著性水平
=1.18,
=1.40,而
<
1.6445=DW<
4-
,说明模型不存在一阶自相关性;
再BG检验(图4-3),也表明不存在高阶自相关性,因此,中国城乡居民储蓄存款的双对数模型为:
(-25.263)(52.683)
=0.9982F=2709.985S.E=0.0744DW=1.6445
图4-3
(范文素材和资料部分来自网络,供参考。
可复制、编制,期待你的好评与关注)