第八讲异方差性.pptx
《第八讲异方差性.pptx》由会员分享,可在线阅读,更多相关《第八讲异方差性.pptx(50页珍藏版)》请在冰豆网上搜索。
第八讲第八讲异方差性异方差性(Heteroskedasticity)一、异方差性对于一、异方差性对于OLS估计的影响估计的影响二、稳健性检验二、稳健性检验三、对是否存在异三、对是否存在异方差的方差的检验检验四、加权最小二乘估计四、加权最小二乘估计第一节第一节异方差性对异方差性对OLS估计的影响估计的影响一、一、异方差性异方差性回忆:
经典线性模型回忆:
经典线性模型(CLM)的假定:
的假定:
u同方差性(同方差性(homoscedasticity):
误差项的条件方差相同):
误差项的条件方差相同u异方差性(异方差性(heteroscedasticity):
误差项的条件方差不相同):
误差项的条件方差不相同同方差性:
同方差性:
XY概概率率密密度度X:
受教育年限:
受教育年限Y:
工资:
工资异方差性:
异方差性:
XY概概率率密密度度X:
受教育年限:
受教育年限Y:
工资:
工资异方差性:
异方差性:
XY概概率率密密度度X:
时间:
时间Y:
打字正确率:
打字正确率XY0X0Y.XY0.XY0.u异方差在散点图中的反应异方差在散点图中的反应递增的异方差递增的异方差同方差同方差递减的异方差递减的异方差无规律的异方差无规律的异方差二、异方差的来源二、异方差的来源1.截面数据截面数据例如,例如,前面估计工资水平与受教育程度之间的关系时,较大的前面估计工资水平与受教育程度之间的关系时,较大的误差项可能存在于受教育程度较高的群体中,而小误差则与较误差项可能存在于受教育程度较高的群体中,而小误差则与较低的受教育程度有关。
低的受教育程度有关。
2.省略变量省略变量例如,在估计某种商品价格对该种商品需求量的影响时,省略例如,在估计某种商品价格对该种商品需求量的影响时,省略了消费者的收入水平了消费者的收入水平。
3.数据的分组处理数据的分组处理例如,在绝对收入消费理论中,将居民按照收入水平不同分为例如,在绝对收入消费理论中,将居民按照收入水平不同分为不同的组,不同组的观测值数目不相同不同的组,不同组的观测值数目不相同。
二、异方差性对二、异方差性对OLS估计的影响估计的影响1.回归系数的回归系数的OLS估计量仍然是无偏的、一致的,并且不影响估计量仍然是无偏的、一致的,并且不影响R2和调整的和调整的R2对多元回归模型:
对多元回归模型:
样本回归方程为:
样本回归方程为:
写成矩阵形式时,待估参数可以表示为写成矩阵形式时,待估参数可以表示为:
(见第(见第3讲课件)讲课件)因此有:
因此有:
将多元回归模型:
将多元回归模型:
写成矩阵形式时:
写成矩阵形式时:
其中:
其中:
在存在异方差的条件下:
在存在异方差的条件下:
其中,其中,为对角线上元素各不相同的对角矩阵。
为对角线上元素各不相同的对角矩阵。
2.OLS估计量不再是有效的和渐近有效的估计量不再是有效的和渐近有效的由此可见,在存在异方差的条件下,由此可见,在存在异方差的条件下,会夸大或会夸大或缩小真实的方差,使得缩小真实的方差,使得的有效性得不到保障。
的有效性得不到保障。
3.t统计量不服从统计量不服从t分布,分布,F统计量也不服从统计量也不服从F分布,从而无法进分布,从而无法进行假设检验和区间估计,也无法进行区间预测行假设检验和区间估计,也无法进行区间预测t统计量:
统计量:
当误差项同方差时,当误差项同方差时,的标准误的标准误是一个确定是一个确定的值,但当误差项异方差时,的值,但当误差项异方差时,随随xi的变化不断变的变化不断变化,化,不再确定,所以,不再确定,所以,的的t统计量和置信区间统计量和置信区间都是变动的,预测值难以稳定。
因此,无法进行都是变动的,预测值难以稳定。
因此,无法进行t检验或者检验或者F检验,检验,也无法进行区间预测。
也无法进行区间预测。
两种方法:
两种方法:
u其一,异方差性不影响其一,异方差性不影响OLS估计量的无偏性和一致性,只影响估计量的无偏性和一致性,只影响OLS估计量的方差估计,因此,如果能找到一种方法(不同于估计量的方差估计,因此,如果能找到一种方法(不同于OLS估计)正确地估计出估计)正确地估计出OLS估计量的方差,那么同样可以进行估计量的方差,那么同样可以进行假设检验。
这种方法称为稳健性检验假设检验。
这种方法称为稳健性检验u其二,首先检验是否存在异方差,如果不存在,可以使用其二,首先检验是否存在异方差,如果不存在,可以使用OLS估计;如果存在异方差,使用另外一种估计方法(即加权最小估计;如果存在异方差,使用另外一种估计方法(即加权最小二乘估计,二乘估计,WLS)三、如何解决可能存在的异方差三、如何解决可能存在的异方差第二节第二节稳健性检验稳健性检验一、稳健性一、稳健性t检验检验异方差性不影响异方差性不影响OLS估计量的无偏性和一致性,只是影响估计量的无偏性和一致性,只是影响OLS估计量的方差估计,从而影响估计量的方差估计,从而影响t检验和检验和F检验。
因此,如果能检验。
因此,如果能找到一种方法正确地估计出找到一种方法正确地估计出OLS估计量的方差,那么同样可以进估计量的方差,那么同样可以进行行t检验和检验和F检验。
检验。
对于大样本数据,在假定对于大样本数据,在假定MLR.1-4下,可以通过一定的方法下,可以通过一定的方法得到得到OLS估计量的方差的正确估计量,并进而得到估计量的方差的正确估计量,并进而得到OLS估计量的估计量的标准误。
通过这种方法得到的标准误称为标准误。
通过这种方法得到的标准误称为异方差异方差-稳健性标准误稳健性标准误(heteroskedasticity-robuststandarderror),或简称,或简称稳健性标准稳健性标准误误(robuststandarderror)。
一旦得到了稳健性标准误,就可以在此基础上构造一旦得到了稳健性标准误,就可以在此基础上构造稳健性稳健性t统计量统计量(robusttstatistics),进而进行稳健性,进而进行稳健性t检验。
检验。
也就是说,在大样本条件下,可以通过某种方法得到也就是说,在大样本条件下,可以通过某种方法得到OLS估估计量的标准误,无论误差项是否同方差,这种方法都可以得到有计量的标准误,无论误差项是否同方差,这种方法都可以得到有效的估计量。
值得注意的是,这种方法并不能检测出是否存在异效的估计量。
值得注意的是,这种方法并不能检测出是否存在异方差,更无法知道存在何种形式的异方差。
方差,更无法知道存在何种形式的异方差。
例:
工资方程(例:
工资方程(P264,例,例8.1)lwageCoef.SEtrobustSEt(robust)married_male0.21270.05543.840.05713.72married_female-0.19830.0578-3.430.0588-3.37single_female-0.11040.0557-1.980.0571-1.93educ0.07890.006711.790.007410.64exper0.02680.00525.110.00515.22expersq-0.00050.0001-4.850.0001-5.03tenure0.02910.00684.300.00694.19tenursq-0.00050.0002-2.310.0002-2.19_cons0.32140.10003.210.10952.94从结果来看,稳健标准误通常比常规标准误更大,但有时候从结果来看,稳健标准误通常比常规标准误更大,但有时候也可能比常规标准误小;而且在稳健标准误的条件下,各变量的也可能比常规标准误小;而且在稳健标准误的条件下,各变量的统计显著性并没有显著地变化。
统计显著性并没有显著地变化。
u当两种标准误差异较大时,统计推断的结论可能出现较大差异当两种标准误差异较大时,统计推断的结论可能出现较大差异(例(例8.4,P270,HPRICE.RAW)OLS回归的结果:
回归的结果:
稳健性检验的结果:
稳健性检验的结果:
u为何要考虑常规标准误差?
为何要考虑常规标准误差?
如果稳健标准误差无论异方差存在与否都是适用的,如果稳健标准误差无论异方差存在与否都是适用的,为什么我们还需要常规标准误差?
为什么我们还需要常规标准误差?
我们应当注意到,稳健标准误差的适用性依赖于大样本我们应当注意到,稳健标准误差的适用性依赖于大样本(Robuststandarderrorsarejustifiedonlywhenthesamplesizeislarge)。
如果是小样本同方差情形,那么常规的如果是小样本同方差情形,那么常规的t统计量统计量精确地精确地服服从从t分布,在这种情况下使用稳健标准误差就可能导致推断错误。
分布,在这种情况下使用稳健标准误差就可能导致推断错误。
在大样本情形下,特别是应用截面数据的时候,在大样本情形下,特别是应用截面数据的时候,我们我们推荐报告稳健标准误差(或同时报告常规的标准误差)。
推荐报告稳健标准误差(或同时报告常规的标准误差)。
二、稳健性二、稳健性F检验检验稳健稳健F统计量也称为统计量也称为Wald统计量统计量例:
学习成绩的决定(例:
学习成绩的决定(P265,例,例8.2)例:
新生儿体重的决定(例:
新生儿体重的决定(BWGHT.DAT)u常规回归(无约束的回归):
常规回归(无约束的回归):
由于由于“母亲的受教育程度母亲的受教育程度”和和“家庭收入的对数家庭收入的对数”的系数都的系数都不显著,有必要考察他们是否联合显著。
不显著,有必要考察他们是否联合显著。
u常规回归(约束的回归):
常规回归(约束的回归):
根据无约束条件的回归和带约束条件的回归结果,可以计算根据无约束条件的回归和带约束条件的回归结果,可以计算得到得到F统计量为统计量为F=1.31,相应的,相应的p值为值为0.2703,据此我们无法拒绝,据此我们无法拒绝原假设,也就是说,原假设,也就是说,“母亲的受教育程度母亲的受教育程度”和和“家庭收入的对数家庭收入的对数”两个变量的系数可能同时为零。
两个变量的系数可能同时为零。
但如果误差项存在异方差,这样的检验便不合理。
但如果误差项存在异方差,这样的检验便不合理。
u稳健回归:
稳健回归:
在稳健回归条件下,关于在稳健回归条件下,关于“母亲的受教育程度母亲的受教育程度”和和“家庭收家庭收入的对数入的对数”两个变量的系数可能同时为零的稳健性两个变量的系数可能同时为零的稳健性F统计量的值统计量的值为为1.39,相应的,相应的p值为值为0.2496,与常规回归条件下的,与常规回归条件下的F统计量相差统计量相差不大,同样无法拒绝原假设。
不大,同样无法拒绝原假设。
因此,无论在什么情况下,都无法拒绝原假设。
因此,无论在什么情况下,都无法拒绝原假设。
三、稳健性三、稳健性LM检验检验有的软件无法计算稳健的有的软件无法计算稳健的F统计量,我们可以采用另一种相统计量,我们可以采用另一种相对简单的方法对多重排除性约束进行联合显著性的稳健性检验。
对简单的方法对多重排除性约束进行联合显著性的稳健性检验。
稳健性稳健性LM检验的检验步骤:
检验的检验步骤:
u在约束模型下进行在约束模型下进行OLS,保存残差,保存残差u将每一个排除变量对全部未排除变量进行回归(将每一个排除变量对全部未排除变量进行回归(q个回归),个回归),并将每一组残差并将每一组残差1,2,q保存保存u将将1向量对向量对1,2,q进行无截矩回归。
进行无截矩回归。
LM定义为定义为nSSR1,其中,其中SSR1为最后一步回归的残差平方和为最后一步回归的残差平方和例例8.3:
拘捕次数的决定:
拘捕次数的决定(CRIME1.DAT)P178narr86=0+1pcnv+2avgsen+3tottime+4ptime86+5qemp86+uupcnv:
以前被拘捕后被定罪的次数;:
以前被拘捕后被定罪的次数;uavgsen:
过去定罪后被判刑的平均时间长度;:
过去定罪后被判刑的平均时间长度;uptime86:
1986年以前此人年满年以前此人年满18岁之后被送进监狱的总时间;