第5章 动态回归与误差修正模型讲稿.docx
《第5章 动态回归与误差修正模型讲稿.docx》由会员分享,可在线阅读,更多相关《第5章 动态回归与误差修正模型讲稿.docx(19页珍藏版)》请在冰豆网上搜索。
第5章动态回归与误差修正模型讲稿
第5章动态回归与误差修正模型
本章假定变量具有平稳性,第6章将把误差修正模型的应用向非平稳变量扩展。
5.1均衡与误差修正机制
1.均衡
均衡指一种状态。
达到均衡时将不存在破坏均衡的内在机制。
这里只考虑平稳的均衡状态,即当系统受到干扰后会偏离均衡点,而内在均衡机制将努力使系统重新回到均衡状态。
1)实例
下面通过一个例子说明系统均衡概念。
以两个地区某种商品的价格为例,假设地区A中该商品物价由于某种原因上升时,该商品就会通过批发商从价格低的B地区向价格高的A地区流动。
从而使批发商从中获利。
这种活动将直接导致该商品在B地区的需求增加,从而使该商品在B地区的价格上涨。
从A地区看,由于增加了该商品的供给,则导致价格下降,反过来的情形也是一样,从而使两各地区的该商品价格越来越接近。
用该两个地区的价格数据绘制一张平面图,价格A=价格B的直线表示此问题的均衡状态。
如上所述,当价格离开这条直线后,市场机制这只无形的“手”就会把偏离均衡点的状态重新拉回到均衡状态。
随着时间推移,无论价格怎样变化,两个地区的价格都保持一致。
yt表示A地区价格,xt表示B地区价格,均衡状态下:
yt=xt
2)均衡的表示
当然这种均衡不意味着一定是1比1的关系。
当二者之间存在一个固定的常数差
yt-xt=α0
或yt=α0+xt
当xt,yt之间存在一个固定的常数差和比例关系
yt-β1xt=α0
yt=α0+β1xt
均衡表达式表示的是长期关系,即t的取值要大。
3)非均衡误差
若两个变量xt,yt永远处于均衡状态,则偏差为零。
然而由于各种因素的影响,xt,yt并不是永远处于均衡位置上,从而使
ut=yt-xt≠0,
称ut为非均衡误差。
当系统偏离均衡点时,平均来说,系统将在下一期移向均衡点。
这是一个动态均衡过程。
本期非均衡误差ut是yt下一期取值的重要解释变量。
当ut>0时,说明yt相对于xt取值高出均衡位置。
平均来说,变量yt在T+1期的取值yt+1将有所回落。
所以说ut=f(yt,xt)具有一种误差修正机制。
非均衡状态下,yt与xt的关系表示
yt=xt+ut
yt=α0+xt+ut
yt=α0+β1xt+ut
5.2“一般到特殊”建模法
1)分布滞后模型:
如果回归模型中不仅包括解释变量的本期值,而且包括解释变量的滞后(过去)值,则这种回归模型称为分布滞后模型。
例
ut~IID(0,σ2)(5.1)
上述模型的一个明显问题是xt与xt-1,xt-2,…,xt-n高度相关,从而使βj的OLS估计值很不准确。
实际上对于分布滞后模型,这并不是一个严重问题,因为人们的注意力并不在单个回归系数上,而是在这些回归系数的和式,
上。
通过这个和式可以了解当xt变化时,对yt产生的长期影响。
尽管对每个βj估计得不很准确,但这些估计值的和却是相当精确的。
看下式
Var(
)=
+2
(5.2)
若xt-i与xt-k,(i≠k)是正相关的(实际中常常如此),则(5.2)式中的协方差项通常是负的。
当这些项的值很大(绝对值)且为负时,Var(
)比
小,甚至比每个Var(
)还小。
2)动态模型(自回归模型):
如果在回归模型的解释变量中包括被解释变量的一个或几个滞后值,则称这种回归模型为动态模型(或自回归模型)。
例
yt=α0+α1yt-1+β0xt+ut
3)动态分布滞后模型:
如果在分布滞后模型中包括被解释变量的若干个滞后值作解释变量,则称之为动态分布滞后模型或自回归分布滞后模型。
例
ut~IID(0,σ2)(5.3)
用ADL(m,n,p)表示,其中m是自回归阶数,n是分布滞后阶数,p是外生变量个数。
对ADL(m,n,p)模型可采用OLS法估计,参数估计量是有偏的,但具有一致性。
最常见的是ADL(1,1)模型,
yt=α0+α1yt-1+β0xt+β1xt-1+ut,
ut~IID(0,σ2),(5.9)
和ADL(2,2)
yt=α0+α1yt-1+α2yt-2+β0xt+β1xt-1+β2xt-2+ut,
ut~IID(0,σ2)
4)长期关系
对于ADL(1,1)模型(5.9),xt和yt的长期关系是:
yt-α1yt-1=α0+β0xt+β1xt-1+ut,
就长期而言
(1-α1)yt=α0+(β0+β1)xt-1+ut
(5.10)
上式称作静态模型,参数k0、k1称作静态参数或长期参数。
长期参数描述变量之间的均衡关系。
动态模型(5.9)中的参数称作动态参数或短期参数。
短期参数描述变量通向均衡状态过程中的非均衡关系。
通过对α0,β0和β1施加约束条件,从ADL模型(5.9)可以得到许多特殊的经济模型。
下面以9种约束条件为例,给出特定模型如下:
(1)当α1=β1=0成立,摸型(5.9)变为
yt=α0+β0xt+ut.(5.11)
这是一个静态回归模型。
(2)当β0=β1=0时,由模型(5.9)得
yt=α0+α1yt-1+ut.(5.12)
这是一阶自回归模型。
(3)当α1=β0=0时,则有
yt=α0+β1xt-1+ut.(5.13)
xt-1是yt的超前指示变量。
此模型称为前导模型。
(4)当约束条件是α1=1,β1=-β0时,(5.9)式变为
∆yt=α0+β0∆xt+ut.(5.14)
这是一个一阶差分模型。
当xt与yt为对数形式时,上述模型为增长率模型。
(5)若α1=0成立,模型(5.9)则变为一阶分布滞后模型。
yt=α0+β0xt+β1xt-1+ut.(5.15)
(6)取β1=0,则模型(5.9)变为标准的局部调整模型(偏调整模型)。
yt=α0+α1yt-1+β0xt+ut.(5.16)
(7)当β0=0时,由模型(5.9)得
yt=α0+α1yt-1+β1xt-1+ut.(5.17)
模型中只有变量的滞后值作解释变量,yt的值仅依靠滞后信息。
这种模型称为“盲始”模型。
(8)给定β1=-α1,模型(5.9)化简为
yt=α0+α1(yt-1-xt-1)+β0xt+ut(5.18)
此模型称为比例响应模型。
解释变量为xt与(yt-1-xt-1)。
5)一般到特殊建模法
以上所列举的例子说明实际上许多有特殊经济意义的模型都是由一个一般的ADL模型化简得到的。
这种建立模型的方法是首先从一个包括了尽可能多解释变量的“一般”ADL模型开始,通过检验回归系数的约束条件逐步剔除那些无显著性变量,压缩模型规模,(在这个过程中要始终保持模型随机误差项的非自相关性。
)最终得到一个简化(或“特殊”)的模型。
这种方法称为“一般到特殊”建模法。
也称作亨德里(Hendry)建模法。
关于检验约束条件是否成立的方法将在5.4节讨论。
在1.5节中曾讨论,模型若丢失重要解释变量将导致回归系数的OLS估计量丧失无偏性和一致性。
“一般到特殊”建模法的主要优点是能够把由于选择变量所带来的设定误差减到最小。
因为在初始模型中包括了许多变量,所以不会使回归系数的OLS估计量存在丢失变量误差。
虽然因为在初始模型中包括了许多非重要解释变量,从而使回归参数估计量缺乏有效性,但随着检验约束条件的继续,那些非重要的解释变量被逐步剔除掉,从而使估计量缺乏有效性的问题得到解决。
5.3误差修正模型(ECM)
误差修正模型由Sargan1964年提出,最初用于存储模型。
1977年由Hendry-Anderson和Davidson完善。
(1)模型的表达式
ECM模型由ADL(m,n,p)模型变换而来。
下面通过ADL(1,1)模型推导简单的ECM模型。
有
yt=α0+α1yt-1+β0xt+β1xt-1+ut,|α1|<1,
ut~IID(0,σ2),(5.25)
其中ut应不存在自相关和异方差。
如果这个条件不能满足,可通过增加xt和yt的滞后项或加入新的变量从而使ut满足要求。
从上式两侧同时减yt-1,在右侧同时加减β0xt-1得
∆yt=α0+β0∆xt+(α1-1)yt-1+(β0+β1)xt-1+ut(5.26)
上式右侧第三、四项合并,
∆yt=α0+β0∆xt+(α1-1)(yt-1-k1xt-1)+ut
(5.28)
其中k1=(β0+β1)/(1-α1)。
在上述变换中没有破坏恒等关系,所以不会影响模型对样本数据的解释能力,也不会改变OLS估计量的性质。
进一步变换(5.28)式
∆yt=β0∆xt+(α1-1)(yt-1-k0-k1xt-1)+ut(5.29)
其中k0=α0/(1-α1),k1=(β0+β1)/(1-α1)。
yt-1=k0+k1xt–1
是xt和yt的长期关系,
∆yt=β0∆xt+(α1-1)(•)
是xt和yt的短期关系。
上式称为ECM模型,
(α1-1)(yt-1-k1xt-1)或(α1-1)(yt-1-k0-k1xt-1)称为误差修正项。
(yt-1-k1xt-1)或(yt-1-k0-k1xt-1)表示前一期的非均衡误差,
由(5.25)式知,若yt平稳,必有|α|<1,所以非均衡误差项的系数(α1-1)必为负。
说明误差修正项对∆yt有一个反向修正作用。
当前一期yt,即yt-1相对于均衡点取值过高(低)时,通过误差修正项的反向修正作用,使本期∆yt减小(增加),yt向均衡位置移动。
(α1-1)表示误差修正项对∆yt的调节速度。
(2)ECM模型有如下特点:
①上述模型中的∆yt,∆xt和非均衡误差项都是平稳的。
应用最小二乘法估计模型时,参数估计量都具有优良的渐进特性。
在第6章可以看到,即使变量是非平稳的,只要存在协整关系,误差修正模型也不会存在虚假回归问题。
②误差修正模型中既有描述变量长期关系的参数,又有描述变量短期关系的参数;既可研究经济问题的静态(长期)特征又可研究其动态(短期)特征。
③误差修正模型中的变量不存在多重共线性问题。
④ut是非自相关的。
如果ut是自相关的,可在模型中加入∆yt和∆xt的足够多滞后项,从而消除ut的自相关。
同时相应加大误差修正项的滞后期。
⑤建模过程中允许根据t检验和F检验剔除ECM模型中的差分变量。
在ECM模型中剔除差分变量,相当于在原ADL模型中施加一个约束条件。
例如剔除差分变量∆xt,相当于在原ADL(1,1)模型中施加约束条件,β0=0。
⑥在非均衡误差项中剔除任何滞后变量都是危险的,这将影响长期关系的表达。
⑺ECM模型中的k0,k1未知,ECM模型不能直接被估计。
估计方法是:
①若变量为平稳变量或者为非平稳变量但存在长期均衡关系,可以把误差修正项的括号打开,对模型直接用OLS法估计。
②先估计长期均衡关系,然后把估计的非均衡误差作为误差修正项代入ECM模型,并估计该模型。
5.4动态模型的若干检验方法
在用“一般到特殊”方法建立模型时的,首先应对初始模型(即对回归参数不加任何约束的动态分布滞后模型)的随机误差项进行异方差和自相关检验。
对模型的其他检验都应建立在随机误差项是一个白噪声序列的基础之上。
在检验约束条件是否成立的过程中逐步剔除不显著变量,化简模型,同时还要保持模型随机误差项的非自相关性和同方差性不被破坏。
在这个过程中要用到许多统计量。
下面介绍一些常用的检验方法。
1F检验
把样本数据取对数后建立回归模型,随机误差项一般不会存在异方差。
对于随机误差项的一阶自相关检验可用DW统计量完成。
对于ADL模型(5.9),约束条件(5),(6),(7)和(10),即α1=0,β1=0,β0=0和α1+β0+β1-1=0(见5.2和5.3节)的是否成立可用t检验完成。
对于联合线性约束条件
(1),
(2),(3)和(4)(见5.2节)可用F检验完成。
假定模型误差项服从正态分布,共有m个线性约束条件,则所用统计量是
(5.45)
其中SSEr表示施加约束条件后估计模型的残差平方和,SSEu表示未施加约束条件的估计模型的残差平方和,m表示约束条件个数,T表示样本容量,k表示未加约束的模型中被估参数的个数。
在零假设“约束条件真实”条件下,
F~F(m,T–k)
因为两个模型都是用OLS法估计的,所以可把被解释变量的总平方和(SST)分解为回归平方和(SSR)与误差平方和(SSE)两部分。
对于不加约束的模型有
SST=SSRu+SSEu.
对于施加约束条件的模型有,
SST=SSRr+SSEr.
如果约束条件成立,那么在施加约束条件下求到的SSEr不会比不加约束条件的SSEu大很多,用样本计算的F值不会很大。
若F值小于临界值,则约束条件是可接受的(真实的)。
否则应该拒绝零假设。
注意,F检验的零假设是m个约束条件同时为零,备择假设是m个约束条件不同时为零。
所以拒绝零假设并不排除有部分约束条件为零。
应利用t检验进一步对每一个参数进行显著性判别。
比如对ADL模型(5.9)检验联合约束条件α1=β1=0,则(5.9)式为无约束模型,(5.11)式为约束模型。
yt=α0+α1yt-1+β0xt+β1xt-1+ut,
ut~IID(0,σ2),(无约束模型)(5.9)
yt=α0+β0xt+ut.(约束模型)(5.11)
用SSEu和SSEr分别表示对(5.9)和(5.11)式进行OLS估计得到的SSE,F统计量按下式计算
其中2表示约束条件个数,T表示样本容量,4表示无约束模型(5.9)中被估参数个数。
判别规则是,
若F若F>Fα(2,T-4),则拒绝两个约束条件同时成立。
2似然比(LR)检验
以上介绍的t检验和F检验只适用于对线性约束条件的检验。
对于5.2节中的约束条件(9),α1β0+β1=0,则无法用t或F检验完成。
可以用似然比(LR)检验。
LR检验由内曼—皮尔逊(Neyman-Pearson1928)提出,只适用于对线性约束的检验。
首先介绍LR检验。
LR检验的基本思路是如果约束条件成立则相应约束模型与非约束模型的极大似然函数值应该是近似相等的。
用
(5.53)
表示非约束模型的极大似然函数。
其中
和
分别是对β(参数集合),σ2的极大似然估计。
用
(5.54)
表示约束模型的极大似然函数。
其中
和
分别是对β和σ2的极大似然估计。
定义似然比(LR)统计量为
(5.55)
中括号内是两个似然函数之比(似然比检验由此而得名)。
在零假设约束条件成立条件下
LR~χ2(m)(5.56)
其中m表示约束条件个数。
用样本计算LR统计量。
判别规则是,
若LR<χ2α(m),则接受零假设,约束条件成立。
若LR>χ2α(m),则拒绝零假设,约束条件不成立。
再看前面的例子,(5.9)式为无约束模型。
(5.11)式为约束模型。
yt=α0+α1yt-1+β0xt+β1xt-1+ut,
ut~IID(0,σ2),(无约束模型)(5.9)
yt=α0+β0xt+ut.(约束模型)(5.11)
约束条件为α1=β1=0。
在零假设成立条件下,
LR~χ2
(2).
LR统计量只适用于对线性约束条件的检验。
对非线性约束条件应该采用如下两种检验方法。
5.自相关的LM检验(见书,EViews中有)
DW统计量只适用于一阶自相关检验,而对于高阶自相关检验并不适用。
利用LM统计量可建立一个适用性更强的自相关检验方法,既可检验一阶自相关,也可检验高阶自相关。
考虑两种误差过程的模型。
AR(n)模型
ut=ρ1ut-1+…+ρnut-n+wt(5.74)
和MA(n)模型。
ut=vt+ρ1vt-1+…+ρnvt-n(5.75)
其中wt和vt为白噪声过程,ut是如下模型
yt=βXt+ut,(5.76)
中的随机误差项。
模型(5.76)的解释变量Xt中也可包含yt的滞后项。
零假设定义为
ρ1=ρ2=…=ρn=0
这表明ut不存在自相关。
建立LM辅助回归式
(5.77)
上式中的
是(5.76)式中ut的估计值。
定义
LM=TR2~χ2(n)
其中T表示样本容量,R2是(5.77)式中的确定系数。
在零假设成立条件下,LM统计量近似服从χ2(n)分布。
其中n表示(5.77)式中
的最大滞后期。
如果零假设成立,(5.77)式中的γi,i=1,2,…,n近似等于零。
R2的值应很小。
从而导致LM统计量的值很小,小于临界值。
6.异方差的HT检验(EViews中无)
此方法由伯伦奇—帕甘(Brensch-Pagan1979)提出。
在经济时间序列中常见的异方差形式有如下几种
σu2=σ2α'Xt=σ2(α0+α1x1t+α2x2t+…)(5.78)
σu2=σ2(α'Xt)2=σ2(α02+α12x1t2+α22x2t2+…+
),
和
σu2=σ2exp(α'Xt)2=σ2exp(α02+α12x1t2+α22x2t2+…+
),
其中σu2是误差项ut的方差,α是系数向量,xt是与ut方差变化有关的变量向量。
通常xt是由模型yt=βxt+ut中的解释变量的子集所构成。
xt中也可包含yt的滞后变量。
误差项的同方差性等于零假设
H0:
α1=α2=…=αn=0
如果H0成立,σu2=kσ2(k是常量),ut具有同方差性。
对于(5.78)形式的异方差可通过如下辅助回归做LM检验
=α0+α1x1t+α2x2t+…+αnxnt,(5.79)
其中
是原回归模型yt=βxt+ut的标准误差。
LM统计量定义如下,
HT=TR2~χ2(n)
其中R2是(5.79)式的可决系数。
在零假设成立条件下,HT统计量渐近服从χ2(n)分布。
其中n表示(5.79)式中解释变量个数。
由回归函数(5.79)分析,如果零假设成立,可决系数R2的值应很小。
当R2的值很大时,说明ut2中存在有规律的变化成分。
8.White检验(EViews中有)
White检验由H.White1980年提出。
Goldfeld-Quandt检验必须先把数据按解释变量的值从小到大排序。
Glejser检验通常要试拟合多个回归式。
White检验不需要对观测值排序,也不依赖于随机误差项服从正态分布,它是通过一个辅助回归式构造χ2统计量进行异方差检验。
White检验的具体步骤如下。
以二元回归模型为例,
yt=β0+β1xt1+β2xt2+ut(5.9)
①首先对上式进行OLS回归,求残差
。
②做如下辅助回归式,
=α0+α1xt1+α2xt2+α3xt12+α4xt22+α5xt1xt2+vt(5.10)
即用
对原回归式中的各解释变量、解释变量的平方项、交叉积项进行OLS回归。
注意,上式中要保留常数项。
求辅助回归式(5.10)的可决系数R2。
③White检验的零假设和备择假设是
H0:
(5.9)式中的ut不存在异方差,
H1:
(5.9)式中的ut存在异方差
④在不存在异方差假设条件下统计量
TR2~χ2(5)(5.11)
其中T表示样本容量,R2是辅助回归式(5.10)的OLS估计式的可决系数。
自由度5表示辅助回归式(5.10)中解释变量项数(注意,不包括常数项)。
⑤判别规则是
若TR2≤χ2α(5),接受H0(ut具有同方差)
若TR2>χ2α(5),拒绝H0(ut具有异方差)
9.正态分布的JB检验(见书,Eviews中有)。
在实际分析中,可用JB统计量检验一组数据的正态分布性。
在给出JB统计量定义之前先给出偏度和峭度的定义。
偏度(S)是描述变量分布对称性的一个统计量。
定义如下
(5.81)
其中T表示样本容量,
表示yt的均值,s表示yt的标准差。
由公式知若分布是以
为对称的,则S=0。
当分布为右偏倚时,S>0;反之,S<0。
对于正态分布,S=0。
峰度(K),亦称峭度,是描述分布的两侧尾部“薄”、“厚”的一个统计量。
定义为,
(5.82)
其中T,
和s的定义如前。
正态分布的峭度等于3。
如果一个分布的两侧尾部比正态分布的两侧尾部“厚”,则该分布的峭度K>3;反之,K<3。
检验正态分布性的JB(Jarque-Bera)统计量定义如下,
~χ2
(2),(5.83)
若用一般时间序列数据计算上式,取n=0。
若用回归式的残差序列计算上式,则n表示回归式中解释变量个数。
S表示偏度,K表示峭度。
假设是
H0:
变量服从正态分布;
H1:
变量不服从正态分布。
根据计算结果,
若JB<χ2α
(2),接受该分布服从正态分布,
若JB>χ2α
(2),拒绝该分布服从正态分布,
其中α表示检验水平。
正态分布JB检验的EViews输出结果(零假设是随机变量服从正态分布,file:
stochas1)
因为JB=3.88<χ20.95
(2)=5.99,所以上述分布为正态分布。
因为JB=60.16>χ20.95
(2)=5.99,所以上述分布不是正态分布。
茨
10.赤池信息准则和施瓦茨准则(见书,EViews中有)
确定动态分布滞后(ADL)模型最大滞后期的方法除了用前面介绍的F统计量外,也可采用赤池(Akaike)信息准则和施瓦茨(Schwartz)准则。
赤池信息准则(AIC)定义如下。
(5.84)
其中
是ADL估计模型的残