用OLS法得到的估计模型通过统计检验后.docx

上传人:b****9 文档编号:23392215 上传时间:2023-05-16 格式:DOCX 页数:22 大小:381.99KB
下载 相关 举报
用OLS法得到的估计模型通过统计检验后.docx_第1页
第1页 / 共22页
用OLS法得到的估计模型通过统计检验后.docx_第2页
第2页 / 共22页
用OLS法得到的估计模型通过统计检验后.docx_第3页
第3页 / 共22页
用OLS法得到的估计模型通过统计检验后.docx_第4页
第4页 / 共22页
用OLS法得到的估计模型通过统计检验后.docx_第5页
第5页 / 共22页
点击查看更多>>
下载资源
资源描述

用OLS法得到的估计模型通过统计检验后.docx

《用OLS法得到的估计模型通过统计检验后.docx》由会员分享,可在线阅读,更多相关《用OLS法得到的估计模型通过统计检验后.docx(22页珍藏版)》请在冰豆网上搜索。

用OLS法得到的估计模型通过统计检验后.docx

用OLS法得到的估计模型通过统计检验后

异方差

用OLS法得到的估计模型通过统计检验后,还要检验摸型是否满足假定条件。

由1.3节知,只有模型的4个假定条件都满足时,用OLS法得到的估计量才具有最佳线性无偏特性。

当一个或多个假定条件不成立时,OLS估计量将丧失上述特性。

本节讨论当假定条件不成立时,对参数估计带来的影响以及相应的补救措施。

以下讨论都是在某一个假定条件被违反,而其他假定条件都成立的情况下进行。

分为5个步骤。

(1)回顾假定条件。

(2)假定条件不成立对模型参数估计带来的影响。

(3)定性分析假定条件是否成立。

(4)假定条件是否成立的检验(定量判断)。

(5)假定条件不成立时的补救措施。

1.5.1同方差假定

模型的假定条件⑴给出Var(u)是一个对角矩阵,

Var(u)=σ2I=σ2

(5.1)

且u的方差协方差矩阵主对角线上的元素都是常数且相等,即每一误差项的方差都是有限的相同值(同方差假定);且非主对角线上的元素为零(非自相关假定),当这个假定不成立时,Var(u)不再是一个纯量对角矩阵。

   Var(u)=σ2Ω=σ2

≠σ2I.(5.2)

当误差向量u的方差协方差矩阵主对角线上的元素不相等时,称该随机误差系列存在异方差,即误差向量u中的元素ut取自不同的分布总体。

非主对角线上的元素表示误差项之间的协方差值。

比如Ω中的σij与σ2的乘积,(i≠j)表示与第i组和第j组观测值相对应的ui与uj的协方差。

若Ω非主对角线上的部分或全部元素都不为零,误差项就是自相关的。

本节讨论异方差。

下一节讨论自相关问题。

以两个变量为例,同方差假定如图5.1和5.2所示。

对于每一个xt值,相应ut的分布方差都是相同的。

图5.1同方差情形图5.2同方差情形

1.5.2异方差表现与来源

异方差通常有三种表现形式,

(1)递增型,

(2)递减型,(3)条件自回归型。

递增型异方差见图5.3和5.4。

图5.5为递减型异方差。

图5.6为条件自回归型异方差。

图5.3递增型异方差情形图5.4递增型异方差

图5.5递减型异方差图5.6复杂型异方差

(1)时间序列数据和截面数据中都有可能存在异方差。

(2)经济时间序列中的异方差常为递增型异方差。

金融时间序列中的异方差常表现为自回归条件异方差。

无论是时间序列数据还是截面数据。

递增型异方差的来源主要是因为随着解释变量值的增大,被解释变量取值的差异性增大。

1.5.3异方差的后果

下面以简单线性回归模型为例讨论异方差对参数估计的影响。

对模型

yt=β0+β1xt+ut

当Var(ut)=σt2,为异方差时(σt2是一个随时间或序数变化的量),回归参数估计量仍具有无偏性和一致性。

为例

E(

)=β1

但是回归参数估计量不再具有有效性。

仍以

为例,

Var(

)=

因此异方差条件下的

失去有效性。

另外回归参数估计量方差的估计是真实方差的有偏估计量。

例如

E(

))≠Var(

1.5.4异方差检验

1.5.4.1定性分析异方差

(1)经济变量规模差别很大时容易出现异方差。

如个人收入与支出关系,投入与产出关系。

(2)利用散点图做初步判断。

(3)利用残差图做初步判断。

1.5.4.2异方差检验

(1)White检验

White检验由H.White1980年提出(下面要解释的Goldfeld-Quandt检验必须先把数据按解释变量的值从小到大排序,Glejser检验通常要试拟合多个回归式)。

White检验不需要对观测值排序,也不依赖于随机误差项服从正态分布,它是通过一个辅助回归式构造χ2统计量进行异方差检验。

White检验的具体步骤如下。

以二元回归模型为例:

yt=β0+β1xt1+β2xt2+ut(5.9)

①首先对上式进行OLS回归,求残差

②做如下辅助回归式,

=α0+α1xt1+α2xt2+α3xt12+α4xt22+α5xt1xt2+vt(5.10)

即用

对原回归式中的各解释变量、解释变量的平方项、交叉积项进行OLS回归。

注意,上式中要保留常数项。

求辅助回归式(5.10)的可决系数R2。

③White检验的零假设和备择假设是

H0:

(5.9)式中的ut不存在异方差,

H1:

(5.9)式中的ut存在异方差

④在不存在异方差假设条件下统计量

TR2~χ2(5)(5.11)

其中T表示样本容量,R2是辅助回归式(5.10)的OLS估计式的可决系数。

自由度5表示辅助回归式(5.10)中解释变量项数(注意,不计算常数项)。

TR2属于LM统计量。

⑤判别规则是

若TR2≤χ2α(5),接受H0(ut具有同方差)

若TR2>χ2α(5),拒绝H0(ut具有异方差)

(2)Goldfeld-Quandt检验

H0:

ut具有同方差,H1:

ut具有递增型异方差。

构造F统计量。

① 把原样本分成两个子样本。

具体方法是把成对(组)的观测值按解释变量的大小顺序排列,略去m个处于中心位置的观测值(通常T>30时,取m≈T/4,余下的T-m个观测值自然分成容量相等,(T-m)/2,的两个子样本。

{x1,x2,…,xi-1,xi,xi+1,…,xT-1,xT}

n1=(T-m)/2m=T/4n2=(T-m)/2

②用两个子样本分别估计回归直线,并计算残差平方和。

相对于n2和n1分别用SSE2和SSE1表式。

③F统计量是

F=

=

,(k为模型中被估参数个数)

在H0成立条件下,F~F(n2-k,n1-k)

④判别规则如下,

若F≤Fα(n2-k,n1-k),接受H0(ut具有同方差)

若F>Fα(n2-k,n1-k),拒绝H0(递增型异方差)

注意:

①当摸型含有多个解释变量时,应以每一个解释变量为基准检验异方差。

②此法只适用于递增型异方差。

③对于截面样本,计算F统计量之前,必须先把数据按解释变量的值从小到大排序。

(3)Glejser检验

检验|

|是否与解释变量xt存在函数关系。

若有,则说明存在异方差;若无,则说明不存在异方差。

通常应检验的几种形式是

|

|=a0+a1xt

|

|=a0+a1xt2

|

|=a0+a1

….

Glejser检验的特点是:

① 既可检验递增型异方差,也可检验递减型异方差。

②一旦发现异方差,同时也就发现了异方差的具体表现形式。

③计算量相对较大。

④ 当原模型含有多个解释变量值时,可以把|

|拟合成多变量回归形式。

(4)自回归条件异方差(ARCH)检验

异方差的另一种检验方法称作自回归条件异方差(ARCH)检验。

这种检验方法不是把原回归模型的随机误差项σt2看作是xt的函数,而是把σt2看作误差滞后项ut-12,ut-22,…的函数。

ARCH是误差项二阶矩的自回归过程。

恩格尔(Engle1982)针对ARCH过程提出LM检验法。

辅助回归式定义为

=α0+α1

+…+αn

(5.12)

LM统计量定义为

ARCH=TR2~χ2(n)

其中R2是辅助回归式(5.12)的可决系数。

在H0:

α1=…=αn=0成立条件下,ARCH渐近服从χ2(n)分布。

ARCH检验的最常用形式是一阶自回归模型(n=1),

=α0+α1

在这种情形下,ARCH渐近服从χ2

(1)分布。

1.5.5.克服异方差的方法

克服异方差的矩阵描述。

设模型为

Y=Xβ+u

其中E(u)=0,Var(u)=E(uu')=σ2Ω。

Ω已知,β与k未知。

因为Ω≠I,违反了假定条件,所以应该对模型进行适当修正。

因为Ω是一个T阶正定矩阵,所以必存在一个非退化T⨯T阶矩阵M使下式成立。

MΩM'=IT⨯T

从上式得

M'M=Ω-1

用M左乘上述回归模型两侧得

MY=MXβ+Mu

取Y*=MY,X*=MX,u*=Mu,上式变换为

Y*=X*β+u*

则u*的方差协方差矩阵为

Var(u*)=E(u*u*')=E(Muu'M')=Mσ2ΩM'=σ2MΩM'=σ2I

变换后模型的Var(u*)是一个纯量对角矩阵。

对变换后模型进行OLS估计,得到的是β的最佳线性无偏估计量。

这种估计方法称作广义最小二乘法。

β的广义最小二乘(GLS)估计量定义为

(GLS)=(X*'X*)-1X*'Y*=(X'M'MX)-1X'M'MY=(X'Ω-1X)-1X'Ω-1Y

(1)对模型

yt=β0+β1xt1+β2xt2+ut(5.15)

假定异方差形式是Var(ut)=(σxt1)2。

(因为Var(ut)=E(ut)2,相当于认为|

|=σxt)用xt1同除上式两侧得

yt/xt1=

/xt1+

+β2xt2/xt1+ut/xt1,(5.16)

因为Var(ut/xt1)=(1/xt12)Var(ut)=(1/xt12)σ2xt12=σ2,(5.16)式中的随机项(ut/xt)是同方差的。

对(5.16)式做OLS估计后,把回归参数的估计值代入原模型(5.15)。

对(5.16)式应用OLS法估计参数,求∑(ut/xt1)2最小。

其实际意义是在求∑(ut/xt1)2最小的过程中给相应误差项分布方差小的观测值以更大的权数。

所以此法亦称为加权最小二乘法,是GLS估计法的一个特例。

以异方差形式Var(ut)=σ2xt2为例,用矩阵形式介绍克服异方差。

σ2Ω=σ2

定义M=

从而使Var(Mu)=E(Muu'M')=Mσ2ΩM'=σ2MΩM'

=σ2

=σ2IT⨯T

即对于(5.16)式来说误差项已消除了异方差。

(2)利用Glejser检验结果消除异方差

假设Glejser检验结果是

|

|=

+

xt

说明异方差形式是Var(ut)=(

+

xt)2σ2。

用(

+

xt)除原模型(5.15)各项,

=β0

+β1

+

(5.17)

则Var(

)=

Var(ut)=

+

xt)2σ2=σ2

说明消除了异方差。

对(5.17)式做OLS估计,把回归参数的估计值代入原模型(5.15)。

(3)通过对数据取对数消除异方差。

中国进出口贸易额差(1953-1998),文件名:

pap1对数的中国进出口贸易额之差

(4)当模型中存在自回归条件异方差时,可以采用极大似然估计法,通过建立自回归条件异方差辅助方程的形式估计原回归模型。

(超出课程范围)

案例1取1986年中国29个省市自治区农作物种植业产值yt(亿元)和农作物播种面积xt(万亩)数据(file:

hete01,hete02)研究二者之间的关系。

得估计的线性模型如下,

yt=-5.6610+0.0123xt(5.18)

(12.4)R2=0.85,F=155.0,T=29

图5.7农作物产值yt和播种面积xt(file:

hete01)图5.8残差图(file:

hete02)

无论是从yt和xt观测值的散点图(见图5.7)还是模型的残差图(见图5.8)都可以发现数据中存在异方差。

(1)用White方法检验是否存在异方差。

在上式回归的基础上,做White检验。

得,

注意:

输出结果中的概率是指χ2

(2)统计量取值大于8.02的概率为0.018。

示意如下图。

因为TR2=8.02>χ2α

(2)=6,所以存在异方差。

(2)用Goldfeld-Quandt方法检验是否存在异方差。

①首先以xt为基准对成对样本数据(yt,xt)按取值大小排序。

②去掉中间7个数据,按xt取值大小分成样本容量各为11的两个子样本。

③用两个子样本各自回归得结果如下,

yt=2.7202+0.0106xt,(t=1,…,11)(5.19)

(5.8)R2=0.80,F=33.8,SSE=1266,

yt=5.8892+0.0118xt,(t=19,…,29)(5.20)

(3.0)R2=0.50,F=9.1,SSE=14174

F=

=11.2,

因为F=11.2>F0..05(9,9)=3.18,所以存在异方差。

下面克服异方差。

(1)对yt和xt同取对数。

得两个新变量Lnyt和Lnxt(见图5.9)。

用Lnyt对Lnxt回归,得

Lnyt=-4.1801+0.9625Lnxt.(5.21)

(16.9)R2=0.91,F=285.6,(t=1,…,29)

图5.9Lnyt和Lnxt图5.10残差图

经White检验不存在异方差。

因为TR2=2.58<χ20.05

(2)=6.0,所以不存在异方差。

(文件:

Statis)

⑵Goldfeld-Quandt检验异方差。

去掉中间7个观测值,仍按xt大小分成两个T=7的子样本,并回归(结果略)得SSE1=1.17,SSE2=0.65,经Goldfeld-Quandt检验,有

F=

=0.56,

因为0.56小于F0..05(9,9)=3.18,所以取对数后,模型中不存在递增型异方差(残差见图5.10)。

⑶用Glejser法检验异方差

用(5.18)式,yt=-5.6610+0.0123xt,的残差的绝对值对xt回归

|

|=0.0024xt

(8.0)R2=0.22

可见误差项的异方差形式是Var(ut)=E(ut)2=5.76⨯10-6xt2。

克服异方差的方法是用xt分别除(5.18)式两侧,得变换变量yt*=yt/xt,xt*=1/xt。

用yt*对xt*回归(见图5.11),得

yt*=0.0113+0.8239xt*(5.22)

(13.8)(0.8)R2=0.63,F=46.1

图5.11yt*和xt*图5.12残差图

注意,回归系数0.8239没有显著性,截距项0.0113却有很强的显著性,而0.0113正是还原后模型的回归系数,所以模型通过检验。

把yt*=yt/xt,xt*=1/xt代入上式并整理得广义最小二乘估计结果如下:

yt=0.8239+0.0113xt(5.23)

(0.8)(13.8)R2=0.63,F=46.1

由式(5.22)得到的残差见图5.12。

经检验已不存在异方差。

(5.22)式,即(5.23)式中的回归参数具有最佳线性无偏特性。

(5.18)式是最小二乘估计结果。

比较(5.18)和(5.23)式,

yt=-5.6610+0.0123xt(5.18)

虽然0.0113和0.0123相差不多,但从估计原理分析,0.0113有比0.0123更大的可能性接近回归参数真值。

经济含义是平均每一万亩耕地的农业产出值是113万元人民币。

通过这个例子说明,在实际中直接用解释变量除原变量的变换方法克服异方差是可行的。

用EViews给序列中的数据排序。

在Workfile窗口点击Procs键并选择SortSeries功能,将出现一个要求填写以哪一个序列为标准(基准序列)排序的对话框。

填写基准序列名,并在下侧的另一个选择框中说明是按从小到大排列(Ascending),还是从大到小排列(Descending)。

缺省的选择是从小到大排列。

注意,这种操作是把工作文件中所有的变量都以选定的变量为标准排序。

所以若希望保留原序列数据时,应先备份一个工作文件。

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 自然科学 > 物理

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1