eviews上机第六章.ppt
《eviews上机第六章.ppt》由会员分享,可在线阅读,更多相关《eviews上机第六章.ppt(65页珍藏版)》请在冰豆网上搜索。
1,第六章:
异方差,检验及其修正,2,线性回归模型的基本假设,i=1,2,N,在普通最小二乘法中,为保证参数估计量具有良好的性质,通常对模型提出若干基本假设:
1解释变量之间互不相关;2随机误差项具有0均值和同方差。
即,i=1,2,N,即随机误差项的方差是与观测时点t无关的常数;3不同时点的随机误差项互不相关(序列不相关),即,s0,i=1,2,N,3,当随机误差项满足假定14时,将回归模型”称为“标准回归模型”当随机误差项满足假定15时,将回归模型称为“标准正态回归模型”。
如果实际模型满足不了这些假定,普通最小二乘法就不再适用,而要发展其他方法来估计模型。
5随机误差项服从0均值、同方差的正态分布。
即,i=1,2,N,4随机误差项与解释变量之间互不相关。
即,j=1,2,k,i=1,2,N,4,6.1异方差,古典线性回归模型的一个重要假设:
同方差总体回归方程的随机扰动项ui同方差,即他们具有相同的方差2实际现象常常不符合严格的假设条件:
如果随机扰动项的方差随观测值不同而异,即ui的方差为i2,就是异方差。
用符号表示异方差为E(ui2)=i2异方差现象:
在许多应用中都存在,主要出现在截面数据分析中,5,实际经济问题与异方差性几个例子:
6,收入与储蓄,7,收入与消费,8,产出与投入,9,表1中国1998年各地区城镇居民平均每人全年家庭可支配收入及交通和通讯支出(单位:
元),10,例6.1:
研究人均家庭交通及通讯支出(cum)和可支配收入(in)的关系,考虑如下方程:
cumi=0+1ini+ui利用普通最小二乘法,得到如下回归模型:
cumi=-56.917+0.05807ini(6.1.4)(-1.57)(8.96)R2=0.74D.W.=2.008,11,从图形上可以看出:
1.平均而言,城镇居民家庭交通和通讯支出随可支配收入的增加而增加。
2.但是,值得注意的是:
随着可支配收入的增加,交通和通讯支出的变动幅度也增大了,可能存在异方差。
3.把回归方程中得到的残差对各个观测值作图,则可以清楚地看到这一点。
12,练习1:
打开工作文件4-1对in与cum做回归,画出in与cum之间的回归线,并观察两者之间的关系再分别利用in与cum对方程残差画出散点图,观察其特点,13,无偏性与有效性:
异方差的存在并不破坏普通最小二乘法的无偏性但估计量却不是有效的,即使对大样本也是如此,因为缺乏有效性,所以通常的假设检验值不可靠。
当怀疑存在异方差,或者已经检测到异方差的存在,需要采取补救措施。
存在异方差,14,6.2异方差检验,1.图示检验法
(1)X-Y的散点图观察是否存在明显的散点扩大、缩小或复杂型趋势(即不在一个固定的带型域中),15,
(2)X-i2的散点图先采用OLS方法估计模型,以求得随机误差项u的方差i2的估计量(注意,该估计量是不严格的),我们称之为“近似估计量”,用ei2表示。
于是有:
即用ei2来表示随机误差项的方差。
用解释变量x和ei2的散点图进行观察:
随着x增加,方差是否出现逐渐增加、下降或者不规则变化。
16,练习2:
打开工作文件4-1,4-3分别用两种图示演示法(x-y以及X-i2)观察工作文件中的方程是否存在异方差性请根据图形判断随着x增加,方差出现增加、下降还是不规则变化将截图保存至word文档,并辅以自己的分析解释最后将word文档取名为学号+姓名,提交。
17,2.White检验法,White(1980)提出了对最小二乘回归中残差的异方差性的检验。
两种检验:
包括有交叉项和无交叉项(取默认值即可)。
普通最小二乘估计虽然在存在异方差性时是一致的,但是通常计算的标准差不再有效。
如果发现存在异方差性,利用加权最小二乘法可以获得更有效的估计(修正异方差)。
18,检验统计量是通过利用解释变量所有可能的交叉乘积对残差进行回归来计算的。
例如:
假设估计如下方程(6.1.6)式中:
b是估计系数,i是残差。
检验统计量基于辅助回归:
(6.1.7)EViews显示两个检验统计量:
F统计量和Obs*R2统计量。
White检验的原假设:
不存在异方差性(即式(6.1.7)中除0以外的所有系数都为0成立),19,White证明出:
(6.1.8)其中:
N是样本容量,k为自由度,等于式(6.1.7)中解释变量个数(不包含截距项)。
如果计算的2值大于给定显著性水平对应的临界值,则可以拒绝原假设,得出存在异方差的结论。
也就是说,回归方程(6.1.7)的R2越大,说明残差平方受到解释变量影响越显著,也就越倾向于认为存在异方差。
如果原模型中包含的解释变量较多,那么辅助回归中将包含太多的变量,这会迅速降低自由度。
因此,在引入变量太多时,必须谨慎一些。
White检验的另外一种形式,就是辅助回归中不包含交叉项。
因此White检验有两个选项:
交叉项和无交叉项。
20,例6.2:
人均家庭交通及通讯支出(CUM)和可支配收入(IN)的回归方程的White异方差检验的结果:
该结果F统计量和Obs*R2统计量的P值均很小,表明拒绝原假设,即残差存在异方差性。
21,由于假设的异方差形式不同,使用的辅助回归也不同,导致了不同的检验方法。
各不同方法的异方差形式和辅助回归方程:
Breusch-Pagan-Godfrey(BPG)异方差检验方法,Harvey异方差检验,Glejser异方差检验,,22,练习3-1:
打开工作文件4-1建立被解释变量人均家庭交通及通信支出(cum),解释变量可支配收入(in)的回归方程利用White检验法检验此回归方程是否存在异方差。
23,练习3-2:
打开工作文件4-3建立被解释变量住房支出(y),解释变量年收入(x)的OLS回归方程利用White检验法检验此回归方程是否存在异方差。
24,3.Goldfeld-Quant检验法,25,G-Q检验具体步骤:
将样本按解释变量中可能出现异方差的序列进行排序(SORTX)并分成两部分利用样本1建立回归模型1利用样本2建立回归模型2计算F统计量,分别是模型1和模型2的残差平方和(5)查F分布表得F值,进行观察得出是否存在异方差的结论,26,操作中的具体问题:
1.如何将样本分为两部分?
2.如何观察F值得出结论?
27,如何将样本分为两部分,1.首先要将样本按X从小到大的顺序进行排列(SORTX)2.去除中间的一部分样本3.将剩余的样本两等分,成为后续操作中的“样本1建立模型1”和“样本2建立模型2”,28,到底去除多少样本为合适?
哈维和菲利普(1974年)的证据表明,放弃的观测值数不应多于总样本数的1/3.通过将样本分成具有n1和n2个观测值的两组来进行此检验。
为取得统计上独立的方差估计量,回归是采用两组观测值分布进行估计的。
该检验统计量为:
其中我们假设第一个样本中的扰动方差大于第二组(反之则可对换下标)。
在同方差零假设情况下,此统计量为自由度为n1-K和n2-K的F分布。
29,例如:
假设存在一个30个观测值的样本,首先将解释变量按从小到大进行排序然后减去一个不超过1/3量的中间样本(不超过10个),为保持剩下的可以平均分为2组,所以本例中应该去除8个中间样本。
因此,样本1为1-11,样本2为20-30,30,练习4:
假设存在一个观测值为40的样本,需要进行G-Q异方差检验,请问如何进行样本分组?
31,如何观察F值得出结论?
计算F统计量:
A,其中分别是模型1和模型2的残差平方和确定一个临界值(如1%,5%,10%),查F分布表得:
F(n1-k,n2-k)=B如果AB,即F值大于临界值,则存在异方差如果AB,即F值小于临界值,则不存在异方差,32,练习5:
打开工作文件4-1,和4-3用G-Q法判定方程是否存在异方差性?
(其中:
F0.05(8,8)=3.44,F0.05(5,5)=5.05),33,4.Park检验法(帕克检验与戈里瑟检验),34,35,帕克检验的不足:
需要选择不同的解释变量,尝试各种不同的函数形式,进行多次反复试验在进行试验的回归模型中,其随机干扰项本身就可能不满足普通最小二乘的经典假设G-Q检验法可以同时克服这两大困难。
因此,G-Q检验法更为常用。
36,帕克检验具体步骤:
建立回归模型,得到原方程残差序列生成新变量序列(其中一种常见形式):
GENRlnE2=log(RESID2)GENRlnx=log(x)建立新残差序列对解释变量的回归模型:
LSlnE2Clnx观察lnx的系数及P值:
系数不为0,且显著,则表示存在异方差性反之,则表示不存在异方差性,37,练习6-1:
打开工作文件4-1对原方程进行帕克检验(GENRlnE2=log(RESID2)以及GENRlnx=log(x))检验是否存在异方差?
38,练习6-2:
打开工作文件4-3对原方程进行帕克检验(GENRlnE2=log(RESID2)以及GENRlnx=log(x))检验是否存在异方差?
39,6.3异方差修正,6.3.1加权最小二乘法6.3.2存在异方差时的一致协方差(异方差稳健标准误),40,6.3.1加权最小二乘估计1方差已知的情形考虑一个一元回归线性方程:
(4.1.11)假设已知随机误差项的真实的方差,var(ui)=i2,则令wi=1/i,将模型两端同乘wi,变换为(4.1.12)令ui*=wiui,则(4.1.13)因此,变换后的模型(4.1.12)不再存在异方差的问题,可以用OLS估计。
加权最小化残差平方和为:
(4.1.14)由此获得的估计量就是权重序列为wi的加权最小二乘估计量。
41,假设有已知形式的异方差性,并且有序列w,其值与误差标准差的倒数成比例。
这时可以采用权数序列为w的加权最小二乘估计来修正异方差性。
对加权最小化残差平方和得到估计结果:
其中是k1维向量。
在矩阵概念下,令权数序列w在权数矩阵W的对角线上,其他地方是零,即W矩阵是对角矩阵,y和X是因变量和自变量矩阵。
则加权最小二乘估计量为:
(4.1.18),估计协方差矩阵为:
(4.1.19),42,例6.3加权最小二乘估计,考虑对由四组家庭住房支出和年收入组成的截面数据进行研究(工作文件4-3)假设住房支出模型为其中:
yi是住房支出,xi是收入。
普通最小二乘估计得出如下回归结果:
t=(4.4)(15.9)R2=0.93F=252.7对数据图形的研究及以前有关支出的研究结果都说明此模型具有异方差现象,43,44,对住房支出模型进行异方差修正(权重为1/X),然后进行估计。
变换后的模型为其结果为:
t=(21.3)(7.7)R2=0.76F=58.7注意:
修正后关于收入的回归系数的估计值为0.249,比原来普通最小二乘估计有所增加。
R2下降,但是,并不能直接比较R2,因为因变量已经发生了变化。
45,使用加权最小二乘法得到:
46,2方差未知的情形,现实情况:
异方差形式难以确认通常采用的经验方法是:
不对原模型进行异方差检验,而是直接选择加权最小二乘法,尤其是采用截面数据作样本时。
如果确实存在异方差性,则被有效地消除了;如果不存在异方差性,则加权最小二乘法等价于普通最小二乘法。
47,具体步骤:
1选择OLS估计原模型,得到随机误差项的近似估计量t;2建立权数序列(通过试验);3选择加权最小二乘法(WLS),以权重序列作为权,进行估计得到参数估计量。
得到一个新模型,采用普通最小二乘法估计新模型。
48,权重序列如何确定?
A:
根据图示法先观察,并进行初步的假设:
1.误差方差与xi成比例,令权重为1/xi0.52.误差方差与xi2成比例,令权重为1/xiB:
利用随机误差项的近似估计量ui,令权重为1/abs(resid),1/resid2C:
利用park检验中,lnx的系数,令权重为1/X(lnx的系数),49,使用加权最小二乘法估计方程首先到主菜单中选Quick/EstimateEquation,然后选择LS-LeastSquares(NLSandARMA)在对话框中输入方程说明和样本,然后按Options钮,出