ImageVerifierCode 换一换
格式:DOCX , 页数:26 ,大小:183.13KB ,
资源ID:7297783      下载积分:3 金币
快捷下载
登录下载
邮箱/手机:
温馨提示:
快捷下载时,用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)。 如填写123,账号就是123,密码也是123。
特别说明:
请自助下载,系统不会自动发送文件的哦; 如果您已付费,想二次下载,请登录后访问:我的下载记录
支付方式: 支付宝    微信支付   
验证码:   换一换

加入VIP,免费下载
 

温馨提示:由于个人手机设置不同,如果发现不能下载,请复制以下地址【https://www.bdocx.com/down/7297783.html】到电脑端继续下载(重复下载不扣费)。

已注册用户请登录:
账号:
密码:
验证码:   换一换
  忘记密码?
三方登录: 微信登录   QQ登录  

下载须知

1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。
2: 试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。
3: 文件的所有权益归上传用户所有。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 本站仅提供交流平台,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

版权提示 | 免责声明

本文(chap4 异方差.docx)为本站会员(b****5)主动上传,冰豆网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知冰豆网(发送邮件至service@bdocx.com或直接QQ联系客服),我们立即给予删除!

chap4 异方差.docx

1、chap4 异方差4 异方差用OLS法得到的估计模型通过统计检验后,还要检验模型是否满足假定条件。只有模型的假定条件都满足时,用OLS法得到的回归系数估计量才具有最佳线性无偏特性。当一个或多个假定条件不成立时,OLS估计量将丧失上述特性。第5-7章讨论当假定条件不成立时,对参数估计带来的影响以及相应的补救措施。以下讨论都是在某一个假定条件被违反,而其他假定条件都成立的情况下进行。分为5个步骤。(1) 回顾假定条件。(2) 假定条件不成立时对模型参数估计带来的影响。(3) 定性分析假定条件是否成立。(4) 检验(定量分析)假定条件是否成立。(5) 假定条件不成立时的补救措施。 本章介绍异方差的检

2、验和修正方法。4.1 异方差的概念在随机误差项u满足同方差和没有序列自相关的假定下,u的方差协方差矩阵Var(u) 是一个对角矩阵,Var(u) = 2I = 2= 4.1即Var(u)主对角线上的元素都是常数且相等,每一误差项的方差都是有限的相同值(同方差假定);且非主对角线上的元素为零(非自相关假定)。当这两个假定不成立时,Var(u) 不再是一个纯量对角矩阵,表示如下。Var(u) = 2 = 2 2 I 4.2 当误差向量u的方差协方差矩阵主对角线上的元素不相等时,这意味着对应不同的随机变量,方差不同。此时,称该随机误差系列存在异方差,即误差向量u中的元素ut 取自不同的分布总体。非主

3、对角线上的元素表示误差项之间的协方差值。比如 中的 i j ,(i j)表示与第i组和第j组观测值相对应的ui与 uj的协方差。若 非主对角线上的部分或全部元素都不为零,误差项就是自相关的。本章讨论异方差。第6章讨论自相关。第7章讨论多重共线性及其他一些违反假定条件的情形。以两个变量为例,同方差假定如图4.1和4.2所示。对于每一个xt值,相应ut的分布方差都是相同的。 图 4.1 同方差情形 图 4.2 同方差情形4.2 异方差表现、来源及后果4.2.1 异方差的表现与来源异方差通常有三种表现形式,(1)递增型,(2)递减型,(3)条件自回归型。递增型异方差见图5.3和5.4。随着解释变量的

4、增加,随机误差项的方差越来越大。图5.5为递减型异方差,即随着解释变量的增加,随机误差项的方差越来越小。图5.6为条件自回归型异方差。经济时间序列中的异方差常表现为递增型异方差。金融时间序列中的异方差常表现为自回归条件异方差。时间序列数据和截面数据中都有可能存在异方差。无论是时间序列数据还是截面数据。递增型异方差的来源主要是因为随着解释变量值的增大,被解释变量取值的差异性增大。 图 4.3 递增型异方差 图 4.4 递增型异方差 图 4.5 递减型异方差 图 4.6 条件自回归型异方差4.2.2 异方差的后果下面以简单线性回归模型为例讨论异方差对参数估计的影响。对模型yt = 0 + 1 xt

5、 + ut 4.3当Var(ut) = t 2为异方差时( t 2是一个随时间或序数变化的量),回归参数估计量仍具有无偏性和一致性。以为例 = 1 + kt ut 其中, kt = 4.4E(| xt)= E 1 +| xt = 1 + = 1 但是回归参数估计量不再具有有效性。以为例,由一元线性回归模型的内容可知Var (| xt) = E(- 1| xt)2 = E= = 4.5(在上式的推导中)。上式不等号左侧项分子中的 t 2不是一个常量,不能从累加式中提出,所以不等号左侧项不等于不等号右侧项。而不等号右侧项是同方差条件下 1的最小二乘估计量的方差。因此,异方差条件下的失去有效性。这时

6、,OLS估计量不再具有BLUE性质。回归参数估计量的t统计量不再服从t分布,而且即使是在大样本的情况下也是如此。回归参数估计量的方差估计量是真实方差的有偏估计量。F统计量也不再是F分布。下面用矩阵形式讨论异方差。因为OLS估计量无偏性的证明只依赖于模型的一阶矩,所以当Var(u) 如(5.2)式所示时,OLS估计量仍具有无偏性和一致性。 E() = E (X X )-1 X Y = E (X X )-1 X (X + u) = + (X X)-1 X E(u) = 4.6但不具有有效性和渐近有效性。而且的分布将受到影响。 Var(|X) = E (- ) (- ) |X = E (X X )-

7、1 X u u X (X X)-1|X = (X X)-1 X E (u u |X) X (X X )-1= s 2 (X X )-1 X X (X X )-1 4.7不等于s (X X )-1,所以异方差条件下的是非有效估计量。4.3 异方差稳健推断4.3.1 异方差稳健标准差White(1980)提出,对于一元线性回归模型yt = 0 + 1x1t + ut 当存在异方差时(不论异方差是什么形式),可以通过如下公式得到参数估计量的有效方差估计量。 4.8对于多元线性回归模型yt = 0 + 1x1t + 2x2t + kx k t + ut ,可以通过如下公式计算参数估计量的有效方差估计量

8、 4.9其中,表示用第i个解释变量xi对所有其他解释变量进行回归得到的残差,SSTi为其残差平方和。(4.9)式的平方根被称作的异方差稳健标准差(heteroskedasticity-robust standard error),也经常被称作Huber/White/sandwich标准差。有时,先用自由度对(4.9)式进行修正,之后再求其平方根作为的异方差稳健标准差。即,。 4.10这时,我们便可以利用异方差稳健标准差构建异方差稳健t统计量思考题:既然在很多情况下异方差稳健标准差比OLS估计量的普通标准差更有效,那么为什么不直接用异方差稳健估计量呢?还需要检验模型中是否存在异方差吗?Key:1

9、. 如果模型中不存在异方差,那么OLS估计量的普通标准差具有确切的t分布,与样本水平没有关系。而通过异方差稳健标准差构建的异方差稳健t统计量只是渐进服从t分布,即只是在大样本下才成立。2.如果存在异方差,那么OLS估计量不再具有BLUE性质,但是如果知道异方差的具体形式,那么可以得到比OLS估计量更好的估计量。例:OLS估计:结果为:异方差稳健标准差为:4.3.2 异方差稳健LM检验如果模型中存在异方差,则参数线性约束的F检验也不再有效。这时可以利用异方差稳健LM检验。步骤如下。Step1:回归受约束模型,提取残差项;Step2:用X2中每个变量对X2回归,提取残差项,记为;Step3:用与相

10、乘,得到;Step4:利用OLS方法回归方程,残差平方和记为SSE0;Step5:构建LM统计量。例:对约束的异方差稳健LM检验:. stata 结果为:4.4 异方差的检验方法异方差的基本假定形式H0: E(ui2|x1, x2, , xk) = E(ui2|x1, x2, , xk) = 2 即,ui的条件方差是相同的,或者说当ui与x1, x2, , xk不相关时,ui的方差是相同的。如果ui存在异方差,那么说明ui与x1, x2, , xk存在相关性。因此,检验异方差的基本思路是考察ui与x1, x2, , xk是否存在相关性,以及什么形式的相关性。对实际问题的分析,有时可以初步判别是

11、否存在异方差。主要有三种方式。(1) 当经济变量取值的差别随时间或解释变量的增大而变大时,容易出现异方差。如在个人支出与收入的关系中,投入与产出的关系中,常会存在异方差。(2) 利用散点图也可以初步判断是否存在异方差。如果两个变量的散点图与图4.4相类似时,说明存在异方差。(3) 也可以利用模型的残差图做初步判断。如果模型的残差图如图4.7相类似时,说明存在递增型异方差。注意:对于截面样本,当用残差图观测是否存在异方差时,必须先按解释变量给样本值排序。否则即使是有异方差,利用残差图也看不出来。4.4.1 Goldfeld-Quandt 检验Goldfeld-Quandt 检验由Goldfeld

12、和Quandt 1965年提出。这种检验的思想是以引起异方差的解释变量的大小为顺序,去掉中间若干个值,从而把整个样本分为两个子样本。用两个子样本分别进行回归,并计算残差平方和。用两个残差平方和构造检验异方差的统计量。具体步骤如下。设回归模型为:yt = 0 + 1x1t + 2x2t + kx k t + ut Goldfeld-Quandt 检验的零假设和备择假设是 H0: ut 具有同方差H1: ut 具有递增型异方差把原样本分成两个子样本。具体方法是把成对(组)的观测值按解释变量的从小到大顺序排列,略去m个处于中心位置的观测值(通常T 30时,取m T / 4,余下的T- m个观测值自然

13、分成容量相等的两个子样本,容量各为 (T- m) / 2。如下所示。 x1, x2, , xi-1, xi, xi+1, , x T-1, xT n1 = (T-m) / 2 m = T / 4 n2 = (T-m) / 2 用两个子样本分别估计回归直线,并计算残差平方和。相对于n2 和n1 的残差平方和分别用SSE2(对应于xt值比较大的子样本)和SSE1(对应于xt值比较小的子样本)表示。构造F统计量,F = 4.11其中n2 = n1 为子样本容量,k为原模型中被估参数个数。在H0成立条件下,F F( n2 k-1, n1 - k-1) 根据实际情况分析,若不存在异方差,两个子样本对应的

14、残差平方和应该近似相等,即F值接近1。若存在递增型异方差,则SSE2要远远大于SSE1,即F值很大。判别规则如下,若 F F ( n2 k-1, n1 - k-1) , 接受H0 (ut 具有同方差)若 F F ( n2 k-1, n1 - k-1),拒绝H0 (具有递增型异方差)对于Goldfeld-Quandt 检验应该注意如下四点: 对于截面样本,计算F统计量之前,必须先把数据按解释变量的值从小到大排序。 此法只适用于递增型异方差。 Goldfeld-Quandt 检验依赖于随机误差项服从正态分布。 当模型含有多个解释变量时,应以每一个解释变量为基准检验异方差。例:农作物种植面积与农作物

15、产出. sort x, stable . regress y x in 1/11. scalar s1=e(rss). regress y x in 19/29. scalar s2=e(rss). scalar F=s2/s1. scalar Fprob=Ftail(11,11,F). scalar list 4.4.2 Glejser检验 Glejser检验由H. Glejser 1969年提出。检验原回归式的残差的绝对值 | 是否与解释变量xt的若干形式存在函数关系。若有,则说明存在该种形式的异方差;若无,则说明不存在异方差。通常给出的几种形式是 | = a0 + a1 xt | = a

16、0 + a1 xt2 | = a0 + a1 .如果哪一种形式的通过显著性检验,则说明存在该种形式的异方差。Glejser检验的特点是:既可检验递增型异方差,也可检验递减型异方差。 一旦发现异方差,同时也就发现了异方差的具体表现形式。 计算量相对较大。4 当原模型含有多个解释变量值时,可以把 | 拟合成多变量回归形式。例: . regress y x . predict res, residual . gen absres=abs(res) . regress absres x 得到结果如下。4.4.3 Breusch and Pagan /Cook-Weisberg 检验 根据异方差检验的基

17、本思路,可以考虑这样一种简单的检验方法。假设相关关系式为u2 = 0 +1x1 +2x2 +kxk + vt 如果原假设H0: E(ui2|x1, x2, , xk) = E(ui|x1, x2, , xk) = 2成立,那么上式中每个解释变量的回归系数都不应该具有显著性,即 0 =0, 1 = 0, , k = 0。实际检验步骤如下。Step1:首先估计方程:yt = 0 + 1x1t + 2x2t + kx k t + ut。提取其残差,表示为。Step2:估计方程: = 0 +1x1 +2x2 +kxk + vt。对整个方程的显著性进行检验。一般地,利用F统计量、Wald统计量或LM检验

18、来完成。注:在第二步中,经常采用另外一种形式,用被解释变量的拟合值作为解释变量。即 然后计算方程显著性的F统计量。例:. estat hettest, normal . estat hettest, iid . estat hettest, fstat 4.4.4 White检验 White检验由H. White 1980年提出。Goldfeld-Quandt 检验必须先把数据按解释变量的值从小到大排序。Glejser检验通常要试拟合多个回归式。White检验不需要对观测值排序,也不依赖于随机误差项服从正态分布,它是通过一个辅助回归式构造 2 统计量进行异方差检验。White检验的具体步骤如下

19、。以二元回归模型为例,yt = 0 + 1 x1t + 2 x2t + ut 4.121首先对上式进行OLS回归,求残差。2作如下辅助回归式 = 0 + 1 x1t + 2 x2t + 3 x1t2 + 4 x2t2 + 5 x1t x2t + vt 4.13或者= 0 + 1 x1t + 2 x2t + 3 x1t2 + 4 x2t2 + vt 4.14即用对原回归式中的各解释变量、解释变量的平方项、交叉积项进行OLS回归。注意,上式中要保留常数项。求辅助回归式(4.13)或(4.14)的可决系数R2。3White检验的零假设和备择假设是 H0: 模型中ut不存在异方差, H1: 模型中ut

20、存在异方差4在不存在异方差假设条件下统计量 T R 2 2(k) 4.15其中T表示样本容量,R2是辅助回归式(4.13)或(4.14)的OLS估计式的可决系数,自由度k表示辅助回归式中解释变量的个数(注意,不包括常数项)。如果采用(4.13),那么自由度k=5;如果采用(4.14),那么自由度k=4。5判别规则如果检验辅助回归式采用(4.13),若 T R 2 2 (5), 接受H0 (ut 具有同方差);若 TR2 2 (5), 拒绝H0 (ut 具有异方差)。如果检验辅助回归式采用(4.14),若 TR2 2 (4), 接受H0 (ut 具有同方差);若 T R 2 2 (4), 拒绝H

21、0 (ut 具有异方差)。例:. estat imtet, white4.4.5 自回归条件异方差检验 异方差的另一种检验方法称作自回归条件异方差 (ARCH) 检验。这种检验方法不是把原回归模型的随机误差项 t 2 看作是xt 的函数,而是把 t 2 看作随机误差平方项ut-12 及其滞后项, ut-22 , 的函数。ARCH是误差项二阶矩的自回归过程。恩格尔(Engle 1982)针对ARCH过程提出LM检验法。辅助回归式定义为= 0 + 1 + + n 4.16LM统计量定义为 LM = T R 2 2(n) 4.17其中R 2是辅助回归式(5.12)的可决系数。在H0: 1 = = n

22、 = 0 成立条件下,LM渐近服从 2(n) 分布。其中n表示的滞后项个数。ARCH检验的最常用形式是一阶自回归模型(n = 1), = 0 + 1 在这种情形下,ARCH渐近服从 2(1) 分布。4.5 广义最小二乘法4.5.1 广义最小二乘法下面以矩阵形式描述克服异方差。设模型为 Y = X + u 4.18其中E(u) = 0,Var(u) = E(u u) = 2 。 已知, 与 2未知。因为 I,违反了假定条件,所以应该对模型进行适当修正。 因为 是一个T 阶正定矩阵,所以必存在一个非退化TT 阶矩阵M使下式成立。 M M = I T T 4.19从上式得 M M = -1 4.20

23、用M左乘回归模型(4.18)两侧得 M Y = M X + M u 4.21取Y* = M Y, X * = M X, u* = M u , 上式变换为 Y* = X* + u* 4.22则 u* 的方差协方差矩阵为Var(u*) = E(u* u* ) = E (M u u M ) = M s 2 M = s 2 M M = s 2 I 4.23变换后模型中的Var(u*)是一个纯量对角矩阵。对变换后模型进行OLS估计,便可以得到 的最佳线性无偏估计量。这种估计方法称作广义最小二乘法。 的广义最小二乘 (GLS) 估计量定义为(GLS) = (X* X*)-1 X* Y* = (X M M

24、X ) -1 X M M Y = (X -1X) -1 X -1Y 4.24下面以异方差形式Var(ut) = 2 xt2为例,具体介绍广义最小二乘法变换结果。 2 = 2 4.25定义M = 4.26从而使Var(M u) = E (M u u M ) = M s 2 M = s 2 M M = 2= 2 I (T T) 4.27已消除了异方差。4.5.2 利用Glejser检验结果消除异方差 设回归模型为yt = 0 + 1 x1t + 2 x2t + ut 假设Glejser检验结果是 | = +x1t说明异方差形式是Var(ut) = (+x1t)2 2。用 (+x1t) 除原模型 (

25、5.9) 各项, = 0+ 1+ 2+ (5.25)则 Var() =Var(ut) = (+x1t)2 2 = 2 (5.26)说明消除了异方差。对 (5.25) 式做OLS估计,把回归参数的估计值代入原模型 (5.9)。4.5.3 可行的GLS方法用广义最小二乘法对异方差进行修正首先必须知道异方差的形式,经验应用中对于异方差的形式有很多不同的设定。这里我们介绍一种常见的设定形式。Var(u | x) = 2 exp(0 +1 x1 +2 x2 +k xk) 在应用GLS之前,首先要估计上式中的未知参数i。根据上式可以通过如下计量模型估计i u2 = 2 exp(0 +1 x1 +2 x2

26、+k xk) v 然后用OLS方法得到的残差平方序列作为u2的替代变量估计上述方程。首先将方程取自然对数,得到log() = log(2) + 0 +1x1 +2x2 +kxk + vt = 0* +1x1 +2x2 +kxk + vt,然后再利用OLS方法估计上述模型。具体操作步骤如下。1首先估计方程:yt = 0 + 1x1t + 2x2t + kx k t + ut。提取其残差平方序列,表示为。2估计方程:log() = 0* +1x1 +2x2 +kxk + vt,并计算的预测值。3以1/作为权重序列重新估计方程:yt = 0 + 1x1t + 2x2t + kx k t + ut。对

27、异方差的另外一种更一般的设定形式为,Var(u | x) = 2 exp(0 +1 x1 +2 x2 +k xk) + (0 +1 x1 +2 x2 +k xk)2对于这种形式的设定,其修正步骤为如下。 1首先估计方程:yt = 0 + 1x1t + 2x2t + kx k t + ut。提取其残差平方序列,表示为;提取yt的拟合值,表示为。2估计方程:log() = a0 +a1+a2+ vtt,并计算的预测值。3以1/作为权重序列重新估计方程:yt = 0 + 1x1t + 2x2t + kx k t + ut。4.5.4 通过对变量取对数消除异方差在实际应用中,通过对变量取对数的方法常常

28、能达到消除异方差的目的。详细请见本章后面的案例。4.6 案例分析 案例1 取1986年中国29个省市自治区农作物种植业产值yt(亿元)和农作物播种面积xt(万亩)数据(见表5.1)研究二者之间的关系。得估计的线性模型如下, yt = -5.6610 + 0.0123 xt (5.27) (12.4) R2 = 0.85, F = 155.0, T = 29表5.1 yt和xt数据序号yt农作物产值xt农作物播种面积序号yt农作物产值xt农作物播种面积116.31907.516183.6517729.2217.14873.217146.7911061.53125.2413159.218129.6311304.7442.245928.119154.289166.2540.286834.42061.246821.7684.475495.521206.517779.6770.76055.22244.374701.38101.6712694.62351.796036.1916.831018.5243.53316.510211.5112770.92559.457016.5111016542.72637.295252.512155.8712244.3276.33761.71349.723601.52810.071235.21469.78158.1

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1