异方差检验文档格式.docx
《异方差检验文档格式.docx》由会员分享,可在线阅读,更多相关《异方差检验文档格式.docx(16页珍藏版)》请在冰豆网上搜索。
一般而言,异方差会引起真实方差的低估,从而夸大参数估计的显著性,即是参数估计的t统计量偏大,使得本应该被接受的原假设被错误的拒绝。
2、异方差的检验
(1)图示检验法
由于异方差通常被认为是由于残差的大小随自变量的大小而变化,因此,可以通过散点图的方式来简单的判断是否存在异方差。
具体的做法是,以回归的残差的平方
为纵坐标,回归式中的某个解释变量
为横坐标,画散点图。
如果散点图表现出一定的趋势,则可以判断存在异方差。
(2)Goldfeld-Quandt检验
Goldfeld-Quandt检验又称为样本分段法、集团法,由Goldfeld和Quandt1965年提出。
这种检验的思想是以引起异方差的解释变量的大小为顺序,去掉中间若干个值,从而把整个样本分为两个子样本。
用两个子样本分别进行回归,并计算残差平方和。
用两个残差平方和构造检验异方差的统计量。
Goldfeld-Quandt检验有两个前提条件,一是该检验只应用于大样本(n>
30),并且要求满足条件:
观测值的数目至少是参数的二倍;
二是除了同方差假定不成立以外,要求其他假设都成立,随机项没有自相关并且服从正态分布。
Goldfeld-Quandt检验假设检验设定为:
H0:
具有同方差,H1:
具有递增型异方差。
具体实施步骤为:
将观测值按照解释变量x的大小顺序排列。
将排在中间部分的c个(约n/4)观测值删去,再将剩余的观测值分成两个部分,每个部分的个数分别为n1、n2。
分别对上述两个部分的观测值进行回归,得到两个部分的回归残差平方和。
构造F统计量
,其中k为模型中被估参数个数。
在H0成立条件下,
判别规则如下,
若FF(n2-k,n1-k),接受H0(具有同方差)
若F>
F(n2-k,n1-k),拒绝H0(递增型异方差)
注意:
①当摸型含有多个解释变量时,应以每一个解释变量为基准检验异方差。
②此法只适用于递增型异方差。
(3)Breusch-Pagan/GodfreyLM检验
该方法的基本思想是构造残差平方序列与解释变量之间的辅助函数,得到回归平方和ESS,从而判断异方差性存在的显著性。
该检验假设异方差的形式为:
其中
是解释变量构成的向量,当
时,模型是同方差的。
具体设模型为:
表示是某个解释变量或全部。
同样,该检验也可以通过一个简单的回归来实现。
提出原假设为,
具体步骤如下:
①构造变量
:
用OLS方法估计方程中的未知参数,得
和(n为样本容量)
②以
为被解释变量,
为解释变量进行回归,并计算回归平方和ESS。
构造辅助回归函数
③构造LM统计量为:
LM=
当有同方差性,且n无限增大时有
对于给定显著性水平,如果
,则拒绝原假设,表明模型中存在异方差。
为了计算的简便,LM统计量的构造也可以采取如下形式:
其中,
是关于
的
观测值矩阵,g是观测值
排成的列向量。
由于上述统计量的构造过分依赖于残差的正态性假定,因此,Koenker和Bassett对该统计量进行了修正,令
则
(4)White检验
White检验由H.White1980年提出。
和Goldfeld-Quandt检验相比,White检验不需要对观测值排序,也不依赖于随机误差项服从正态分布,它是通过一个辅助回归式构造2统计量进行异方差检验。
White检验的提出避免了Breusch-Pagan检验一定要已知随机误差的方差产生的原因且要求随机误差服从正态分布。
White检验与Breusch-Pagan检验很相似,但它不需要关于异方差的任何先验知识,只要求在大样本的情况下。
White的检验的思想直接来源于其异方差一致估计。
当存在异方差时,传统的方差估计式
不再是估计量方差的一致估计,而应该使用White一致性估计:
。
通过检验
是不是参数估计方差的一致估计,可以检验是否存在异方差。
在实际的应用过程中,可以通过回归的步骤来简单的实现上述思想。
以二元回归模型yi=0+1xi1+2xi2+ui为例,White检验的具体步骤如下:
①首先对上式进行OLS回归,求残差平方
②做如下辅助回归式,
=0+1xi1+2xi2+3xi12+4xi22+5xi1xi2+vi
即用残差平方
对原回归式中的各解释变量、解释变量的平方项、交叉乘积项进行OLS回归。
注意,上式中要保留常数项。
求辅助回归式的可决系数R2。
③White检验的原假设和备择假设是
H0:
ui不存在异方差,H1:
ui存在异方差
④利用回归②得到的
,计算统计量
在同方差假设条件下,统计量
nR22(5)
其中n表示样本容量,R2是辅助回归式的OLS估计的可决系数。
自由度5表示辅助回归式中解释变量项数(注意,不计算常数项)。
nR2属于LM统计量。
统计量
渐进服从自由度为
的卡方分布,其中
是辅助回归中参数的个数(包括常数项)。
⑤判别规则是
若nR22(5),接受H0(ui具有同方差)
若nR2>
2(5),拒绝H0(ui具有异方差)
(5)ARCH检验
自回归条件异方差(ARCH)检验主要用于检验时间序列中存在的异方差。
ARCH检验的思想是,在时间序列数据中,可认为存在的异方差性为ARCH过程,并通过检验这一过程是否成立来判断时间序列是否存在异方差。
ARCH过程可以表述为:
是ARCH过程的阶数,并且
,
;
为随机误差。
ARCH检验的基本步骤如下:
①提出假设:
中至少一个不为零。
②对原模型做OLS估计,求出残差
,并计算残差平方序列
,分别作为对
的估计。
③作辅助回归
并计算上式的可决系数
,可以证明,在原假设成立的情况下,基于大样本,有
近似服从自由度为
的卡方分布。
如果
,则拒绝原假设,表明原模型的误差项存在异方差。
(6)Park检验法
Park检验法就是将残差图法公式化,提出是解释变量的某个函数,然后通过检验这个函数形式是否显著,来判定是否具有异方差性及其异方差性的函数结构。
(7)Glejser检验法
这种方法类似于Park检验。
首先从OLS回归取得残差
之后,用
的绝对值对被认为与方差密切相关的X变量作回归。
3、异方差的解决办法(详细见板书)
对异方差的传统解决办法是通过加权最小二乘WLS将残差向同方差转换。
一般认为,异方差的产生是由于残差项中包含了解释变量的相关信息,也就是说,可以将残差项
表达成解释变量
的函数:
是
的向量,
可以是关于
的线性函数,也可以是非线性的。
如果知道
的函数形式,那么可以通过加权最小二乘的方法对模型进行修正,在不存在自相关的假定下,在回归方程
两边同乘以
可以对残差进行修正,从而消除残差的异方差性使得OLS估计量仍然具有有效性。
但是,这样的方法却有两个方面的问题——首先,是
的形式难以确定(为了简便,我们往往假设
的线性函数,但实际上真实的函数形式很可能是非线性的),从而相应的WLS的权重设定也就往往是不正确的了;
其次,即使知道
的真实函数形式,通过加权得出的参数估计也已经不是原来的关注参数了;
最后,在强外生性条件
不满足的条件下,WLS估计量也往往是不一致的。
因此,从现代的观点来看,从模型设定的角度对异方差进行修正才是可行的方法。
引起自相关的原因主要可以归纳为三点:
经济数据的固有的惯性(inertia)带来的相关,比如经济系统自身的惯性,经济活动的滞后效应。
这主要出现在时间序列数据当中,经济变量在时间上的惯性往往是造成自相关的主要原因。
滞后效应指的是某一经济变量对另一经济变量的影响不仅影响于当期,而是延续若干期,由此带来变量的自相关。
模型的设定误差,主要仍然是遗漏变量的影响,将遗漏的变量归入了残差项,由于遗漏的变量在不同时间点上是相关的,这就造成了残差项的自相关。
对数据的处理造成了数据的内在联系,从而引起自相关现象。
自相关对参数估计的影响仍然是影响参数估计的有效性,自相关的存在使得OLS得到的参数估计不再具有最小方差性质。
一般而言,在存在自相关的情况下,如果仍然用满足古典假定的OLS去估计参数及其方差,会低估真实的
,更会低估参数估计的方差,从而是t统计量被高估,致使原来不显著的解释变量变得显著,夸大的参数的显著水平。
5、自相关的检验
(1)图示检验
图示检验是一种直观的检验自相关的方法。
与上述检验异方差的方法略有不同的是,该方法是通过做残差的当期值与其滞后期的值的散点图来判断是否存在自相关。
具体做法是,以OLS回归的残差当期值为纵坐标,以其滞后值为横坐标(可以是滞后一期,也可以是滞后一期以上)画散点图。
如果该图形有明显的趋势,则可以认为残差存在自相关。
(2)相关系数检验法
相关系数的方法是检验自相关的一个简单方法。
其基本思想就是通过计算OLS回归得到的残差之间的一阶自相关系数,来确认是否存在自相关的现象。
具体表示如下:
做辅助回归
显然,r是对相关系数的一个估计。
但是这个方法的问题是:
没有一个确定的标准来判断究竟多大的相关悉数才能认为存在自相关。
(3)Breusch-GodfreyLM检验
Breusch-GodfreyLM检验的原假设是不存在自相关,备择假设是存在自相关
基本步骤如下:
是阶数。
并得到上面回归的可决系数
拒绝原假设,则表明原模型的误差项存在自相关。
(4)Pierce—Box检验和Ljung-Box检验
Q统计量最早由Box和Pierce于1970年提出,其计算表达式为:
Q统计量服从自由度为P的卡方分布。
为了使该统计量具有更加优良的小样本性质,Ljung和Box于1979年对其进行了改进。
改进后的统计量其表达形式为:
(5)Durbin-Watson检验
DW统计量是用OLS回归的残差来构造检验自相关的统计量的。
可以表述如下:
其中,r是一阶自相关系数。
当样本量很大的时候,上式中的第二项可以忽略,此时统计量变成
D