Chapter13VARMA模型.docx

资源描述

Chapter13VARMA模型.docx

《Chapter13VARMA模型.docx》由会员分享，可在线阅读，更多相关《Chapter13VARMA模型.docx（36页珍藏版）》请在冰豆网上搜索。

Chapter13VARMA模型.docx

Chapter13VARMA模型

Chapter13-VARMA模型

19VARMA模型

1980年Sims提出向量自回归模型（vectorautoregressivemodel）。

这种模型采用多方程联立的形式，它不以经济理论为基础，在模型的每一个方程中，内生变量对模型的全部内生变量的滞后值进行回归，从而估计全部内生变量的动态关系。

8.1基本概念

8.1.1向量平稳过程

设Xt=（x1t,x2t,…,xNt）由N个随机过程构成的多维随机过程。

如果Xt的一阶矩（均值）和二阶矩（协方差）

为时不变的，即

与t没有关系，则称Xt为弱平稳过程。

当k=0时，

表示Xt的同期协方差矩阵，对角线元素ii（0）表示过程{xit}的方差，非对角线元素ij（0）表示过程{xit}与{xjt}的协方差。

当k≠0时，对角线元素ii（k）表示{xit}与{xi,t-k}的协方差，非对角线元素ij（k）表示{xit}与{xj,t-k}的协方差。

8.1.2跨相关矩阵

令D表示Xt=（x1t,x2t,…,xNt）标准差构成的对角矩阵，则Xt与Xt-k的相关系数矩阵为：

其中，第i行第j列的元素具体为：

当k=0时，ρ0=D-1Γ0D-1表示Xt的同期相关系数矩阵。

对角线元素ii（0）表示过程{xit}的同期相关系数1，非对角线元素ij（0）表示过程{xit}与{xjt}的同期跨相关系数。

当k≠0时，对角线元素ii（k）表示{xit}与{xit-k}的自相关系数，非对角线元素ij（k）表示{xit}与{xjt-k}的跨相关系数。

显然，ij（k）与ji（k）表示不同的线性依存关系，一般情况下，ij（k）≠ji（k）。

因此，ij（k）和ρij（k）不是对称矩阵。

由

以及平稳条件可得：

即：

ij（k）=ji（-k），ij（k）表示矩阵（k）的第i行第j列元素，ji（-k）表示矩阵（-k）的第j行第i列元素。

因此，（k）≠（-k），而是（k）=（-k）'。

同样地，ρij（k）≠ρ（-k），而是ρ（k）=ρ（-k）'。

将多维相关矩阵总结如下。

ij（k）（k=0,1,…）表示{xit}的自相关函数。

ij（k）（k=0,1,…）表示{xit}与{xjt}的同期相关系数。

ij（k）（k=0,1,…）表示{xit}与{xj,t-k}的跨期相关系数。

样本相关系数矩阵估计公式为：

8.1.3多维变量滤子

设A（L）和B（L）表示两个滤子。

{Aj}和{Bj}表示mr和rs矩阵。

滤子的积为

D（L）=A（L）B（L）

如果A（L）B（L）=I，则称B（L）为A（L）的逆，或者A（L）为B（L）的逆。

从卷积公式可以看出，只要A00，A（L）的逆就存在。

比如，求一阶多项式（L）=I-1L的逆。

A0I，A1=-1。

B0I

B1+A1=0B1=-A1=1

B2+A1B1+A2=0B2=-A1B1=12

...

Bj=1j

8.2向量自回归模型设定

VAR模型是自回归模型的联立形式，所以称向量自回归模型。

假设y1t，y2t之间存在关系，如果分别建立两个自回归模型

y1,t=f（y1,t-1,y1,t-2,…）

y2,t=f（y2,t-1,y2,t-2,…）

则无法捕捉两个变量之间的关系。

如果采用联立的形式，就可以建立起两个变量之间的关系。

VAR模型的结构与两个参数有关。

一个是所含变量个数N，一个是最大滞后阶数k。

含有N个变量滞后k期的VAR模型表示如下：

Yt=c+1Yt-1+2Yt-2+…+kYt-k+ut,ut~IID（0,Ω）（8.4）

其中，

Yt为N⨯1阶时间序列列向量。

c为N⨯1阶常数项列向量。

1,…,k均为N⨯N阶参数矩阵，ut~IID（0,Ω）是N⨯1阶随机误差列向量，其中每一个元素都是非自相关的，但这些元素，即不同方程对应的随机误差项之间可能存在相关。

用滞后算子的表述为：

（I-1L-2L2-…-pLp）Yt=（L）Yt=c+ut

此处，c表示的不是Yt的均值。

对于平稳过程来讲，Yt的均值为：

E（Yt）==

（1）-1c，其中

（1）=I-1-2-…-p

以两个变量y1t，y2t滞后1期的VAR

（1）模型为例，

y1,t=c1+11y1,t-1+12y2,t-1+u1t

y2,t=c2+21y1,t-1+22y2,t-1+u2t（8.1）

其中u1t,u2t为独立白噪声过程，但u1t与u2t存在相关关系。

11体现了y1的滞后项对其当期项的影响，12体现了y2的滞后项对y1当期项的影响；21体现了y1的滞后项对y2当期项的影响，22体现了y2的滞后项对y2当期项的影响。

如果12=0，21≠0，说明从y1到y2存在单向影响关系；如果21=0，12≠0，说明从y2到y1存在单向影响关系。

如果21=0，12=0，说明y2与y1不存在反馈关系。

如果21≠0，12≠0，说明y2与y1存在双向反馈关系。

y2与y1的当期相关关系通过12体现。

如果12=0，说明y2与y1不存在当期相关。

其矩阵形式是，

（8.2）

设，Yt=

ut=

则，Yt=c+1Yt-1+ut（8.3）

因VAR模型中每个方程的右侧只含有内生变量的滞后项，他们与ut是渐近不相关的，所以可以用OLS法依次估计每一个方程，得到的参数估计量都具有一致性。

VAR模型的特点是：

（1）不以严格的经济理论为依据。

在建模过程中只需明确两件事：

①共有哪些变量是相互有关系的，把有关系的变量包括在VAR模型中；②确定滞后期k。

使模型能反映出变量间相互影响的绝大部分。

（2）VAR模型对参数不施加零约束。

（对无显着性的参数估计值并不从模型中剔除，不分析回归参数的经济意义。

）

（3）VAR模型的解释变量中不包括任何当期变量，所有与联立方程模型有关的问题在VAR模型中都不存在（主要是参数估计量的非一致性问题）。

（4）VAR模型的另一个特点是有相当多的参数需要估计。

比如一个VAR模型含有三个变量，最大滞后期k=3，则有kN2=3⨯32=27个参数需要估计。

当样本容量较小时，多数参数的估计量误差较大。

（5）无约束VAR模型的应用之一是预测。

由于在VAR模型中每个方程的右侧都不含有当期变量，这种模型用于样本外一期预测的优点是不必对解释变量在预测期内的取值做任何预测。

（6）用VAR模型做样本外近期预测非常准确。

做样本外长期预测时，则只能预测出变动的趋势，而对短期波动预测不理想。

西姆斯（Sims）认为VAR模型中的全部变量都是内生变量。

近年来也有学者认为具有单向因果关系的变量，也可以作为外生变量加入VAR模型。

附录：

（file:

B8c1）

8.3VAR模型的平稳条件

根据齐次差分方程理论，VAR（p）模型平稳性的充分必要条件为：

如下特征方程的特征根落在单位圆之外。

|I-1L-1L2-…-pLp|=0

或者等价地表述为：

如下特征方程的特征根落在单位圆之内。

|ILp-1Lp-1-1Lp-2-…-p|=0

显然，这两个特征方程的特征根互为倒数。

以VAR

（1）模型Yt=c+1Yt-1+ut，为例。

将其用滞后算子表述为

（I-1L）Yt=c+ut（8.13）

保持VAR模型稳定的条件是|I-1L|=0的根都在单位圆以外，或者|1-LI|=0的根都落在单位圆以内。

而|1-LI|=0的根即是矩阵1的特征根。

例8.1对于二变量（N=2），k=1的VAR模型：

（8.14）

其中，1=

。

其特征方程是

|I-1L|=

=（1-（5/8）L）2-1/8L2=（1-0.978L）（1-0.27L）=0（8.15）

求解得

L1=1/0.978=1.022,L2=1/0.27=3.690

因为L1，L2都大于1，所以对应的VAR模型是稳定的。

例8.2对于2个变量、2阶VAR模型：

Yt=c+1Yt-1+2Yt-2+ut

其中，1=

其特征方程为：

|I-1L-2L2|=0

|I-1L-2L2|=

=[1-（5/8）L-1/8L2][1-（5/8）L-3/4L2]-[-（1/2）L+1/4L2][-（1/4）L+1/4L2]

=（1-0.978L）（1-0.27L）=0（8.15）

求解得4个根如下表所示。

根

模

L1=1.000

1.000

L2=0.947

0.947

L3=0.380-0.144i

0.406

L4=0.380-0.144i

0.406

其中，3个根在单位圆内，一个根落在单位圆上，所以平稳性条件未能得到满足。

练习：

模拟上述两个模型的随机数据，观察其变化趋势。

注：

对于高阶自回归方程，可以通过友矩阵变换（companionform）的方法将其转换为VAR

（1）模型，然后根据VAR

（1）模型的平稳条件判断其平稳性。

具体变换过程如下。

给出k阶VAR模型，

Yt=c+1Yt-1+2Yt-2+…+kYt-k+ut（8.17）

再配上如下等式，

Yt-1=Yt-1

Yt-2=Yt-2

…

Yt-k+1=Yt-k+1

把以上k个等式写成分块矩阵形式，

（8.18）

其中每一个元素都表示一个向量或矩阵。

令

Yt=（Yt-1Yt-2…Yt-k+1）'NK⨯1

C=（c00…0）'NK⨯1

Ut=（ut00…0）'NK⨯1

上式可写为

Yt=C+AYt-1+Ut（8.19）

这样，k阶VAR模型用友矩阵表示成了1阶分块矩阵的VAR模型。

VAR模型的稳定性要求A的全部特征值，即特征方程|I-AL|=0的全部根必须在单位圆以外，或者特征方程|A-λI|=0的全部根落在单位圆以内。

注意，特征方程中的A是Nk⨯Nk阶的。

特征方程中的I也是Nk⨯Nk阶的。

对于k阶VAR模型的友矩阵变换形式，特征方程是，

|A-λI|=

即：

|I-1L-2L2-…-kLk|=0

的特征根落在单位圆之外。

例：

2变量2阶VAR模型的友矩阵变换形式是

（8.20）

其中等式的每一个元素（项）都表示一个4⨯1阶向量或4⨯4阶矩阵。

平稳性条件要求其特征方程为：

|I-AL|=

=|I-1L-2L2|=0（8.22）

的全部根必须在单位圆以外。

例：

2变量3阶VAR模型的友矩阵变换形式是

（8.21）

其中等式的每一个元素（项）都表示一个6⨯1阶向量或6⨯6阶矩阵。

平稳性条件要求其特征方程为：

|I-AL|=

=|I-1L-2L2-3L3|=0（8.23）

的全部根必须在单位圆以外。

例：

以例8.1为例，其友矩阵变换形式是

（8.25）

或

（8.26）

或Yt=C+AYt-1+Ut（8.27）

因为A的阶数为4⨯4（注意，因为N=2，k=2，所以A的阶数为4⨯4），所以有4个特征根。

特征方程是

|A-λI|=

=0（8.28）

得到与前文分析完全相同的特征根和同样的结论。

8.4VAR模型的估计

对于平稳VAR模型，每个方程中的解释变量均与随机误差项不相关，因此可采用OLS单独估计每个方程。

如果假定随机误差项服从联合正态分布，则可以采用ML方法进行估计。

对数似然函数为：

8.4.1VAR模型滞后期k的选择

建立VAR模型除了要满足平稳性条件外，还应该正确确定滞后期k。

如果滞后期太少，误差项的自相关会很严重，并导致参数的非一致性估计。

正如在第4章介绍ADF检验的原理一样，在VAR模型中适当加大k值（增加滞后变量个数），可以消除误差项中存在的自相关。

但从另一方面看，k值又不宜过大。

k值过大会导致自由度减小，直接影响模型参数估计量的有效性。

下面介绍几种选择k值的方法。

1．用LR统计量选择k值。

LR（似然比）统计量定义为，

LR=-2（logL（k）-logL（k+1））~

（8.34）

其中logL（k）和logL（k+1）分别是VAR（k）和VAR（k+1）模型的极大似然估计值。

k表示VAR模型中滞后变量的最大滞后期。

LR统计量渐近服从

分布。

显然当VAR模型滞后期的增加不会给极大似然函数值带来显着性增大时，即LR统计量的值小于临界值时，新增加的滞后变量对VAR模型毫无意义。

应该注意，当样本容量与被估参数个数相比不够充分大时，LR的有限样本分布与LR渐近分布存在很大差异。

2．根据信息准则选择k值。

实践中常用的几种信息准则包括赤池（Akaike）准则AIC、施瓦茨（Schwartz）准则SC以及Hannan-Quinn准则HN。

系统方程中的信息准则计算公式为：

AIC令C（T）=2，SC令C（T）=Log（T），HN令C（T）=2Log[Log（T）]。

一般地，给出最高的kmax，在k=1,2,…,kmax中选择使IC取最小值的k作为最优选择。

但需要注意的是，信息准则受被解释变量y的测度单位的影响，因此信息准则不能用于选择被解释变量不同的模型（比如y和log（y））。

例8.3以第8章案例为例，k=1、2、3、4时的LogL、AkaikeAIC和SchwarzSC的值见下表。

VAR

（1）

VAR

（2）

VAR（3）

VAR（4）

LogL

184.6

198.9

200.0

207.8

-2（logL（k）-logL（k+1））

28.6

2.2

15.6

←χ2（9）=16.9

AkaikeAIC

-7.84

-8.27

-8.09

-8.23

SchwarzSC

-7.36

-7.41

-6.85

-6.6

建立滞后2期的VAR模型是可以的。

8.4.2Granger因果关系

在标准的VAR模型中，所有变量的滞后项出现在每个方程中。

检验部分变量的滞后项是否对其他变量的当期项存在显著的解释作用，这种检验称为Granger因果关系检验。

如果解释作用显著，则称之为存在Granger因果关系。

比如，在VAR

（2）模型中，

y2的滞后项对于y1没有解释作用，称作y2不会格兰杰导致y1。

Granger检验方法可以直接通过回归方程的参数显著性进行。

更一般地，检验部分变量y2与y1的格兰杰因果关系可以通过VAR（k）进行。

设数据为（x,y,z），其中（x,y,z）分别包含N1、N2和N3个变量。

令

，

。

将分解为：

x不会格兰杰导致y，当且仅当A1=0。

y不会格兰杰导致x，当且仅当E1=0。

对A1=0或E1=0的检验可以通过似然比统计量进行，

其中，

和

分别表示受约束模型和无约束模型的协方差矩阵。

注意：

（1）滞后期k的选取是任意的。

实质上是一个判断性问题。

以xt和yt为例，如果xt-1对yt存在显著性影响，则不必再做滞后期更长的检验。

如果xt-1对yt不存在显著性影响，则应该再做滞后期更长的检验。

一般来说要试检验若干个不同滞后期k的格兰杰因果关系检验，且结论相同时，才可以最终下结论。

（2）当做xt是否为导致yt变化的格兰杰原因检验时，如果zt也是yt变化的格兰杰原因，且zt又与xt相关，这时在xt是否为导致yt变化的格兰杰因果关系检验式的右端应加入zt的滞后项（实际上是3个变量VAR模型中的一个方程）。

（3）EViews4.1在VAR模型的框架内，可做一对一变量的格兰杰非因果性检验，也可以做一对多个变量的格兰杰非因果性检验。

（4）不存在协整关系的非平稳变量之间不能进行格兰杰因果关系检验。

8.5VAR模型的脉冲响应函数和方差分解

由于VAR模型参数的OLS估计量只具有一致性，单个参数估计值的经济解释是很困难的。

要想对一个VAR模型做出分析，通常是观察系统的脉冲响应函数和方差分解。

8.5.1脉冲响应函数

脉冲响应函数描述一个内生变量对误差冲击的反应。

具体地说，它描述的是在随机误差项上施加一个标准差大小的冲击后对内生变量的当期值和未来值所带来的影响。

对于平稳的VAR过程，总可以将其转换为VMA（∞）过程。

即

其中，

相应地，

ψs中第i行第j列元素表示的是第i个变量对第j个变量的误差冲击项产生的响应，即：

令其它条件不变的情况下，当第j个变量yjt对应的误差项ujt在t期受到一个单位的冲击后，对第i个内生变量yt在（t+s）期造成的影响。

把ψs中第i行第j列元素ij看作是滞后期s的函数

s=1,2,3,…

称作脉冲响应函数（impulse-responsefunction），脉冲响应函数描述了各个变量在t期以及以前各期保持不变的前提下，yi,t+s（s=1,2,…）对uj,t的一次冲击的响应过程。

以VAR

（1）模型为例：

Yt=c+1Yt-1+ut（8.29）

前文已经得出（I-1L）的逆矩阵，B0=I，B1=1，B2=12，...，Bj=1j。

因此，上述VAR

（1）模型可以表示为VMA的形式：

Yt=（I-1）-1c+

（8.33）

其中，10=I。

由（8.33）式可得：

考虑如下VAR

（1）模型：

假设y0=0。

在第1期给u1一个标准差的冲击，u2为0新息。

即

设第2、3期u1、u2均为0新息。

那么y2、y3分别为：

类似地，假设y0=0。

在第1期给u2一个标准差的冲击，u1为0新息。

即

设第2、3期u1、u2均为0新息。

那么y2、y3分别为：

每个变量在不同期的响应如下表和下图所示。

表脉冲响应表脉冲响应图

如上例所示，如果不同方程的新息不相关，则可以考察变量对每个不同信息的脉冲的响应，即某个方程的新息出现波动而其他方程的新息不变时，各个变量的响应。

实践中，不同方程的新息是相关的。

当误差项相关时，它们有一个共同的组成部分，不能被任何特定的变量所识别。

因此，不可能做到只有某个方程的新息变化而其他方程的新息不变。

因此，对脉冲响应函数的解释就比较困难。

为解决这一问题，考虑Cholesky分解。

引入一个变换矩阵M与ut相乘，MM'=ΩM-1ΩM-1'=I。

vt=M-1ut。

则vt的协方差矩阵为：

cov（vtvt'）=cov（M-1utut'M-1'）=M-1ΩM-1'=I。

vt=M-1ut~（0,I），或者ut=Mvt

从而把ut的方差协方差矩阵Ω变换为一个单位矩阵I。

转换后的误差项vt是正交的。

如上例中，Ω的Cholesky分解矩阵为：

第1期的y1的1个标准差冲击，即

设第2、3期v1、v2均为0新息（u1、u2也为0）。

那么y2、y3分别为：

类似地，第1期的y2方程的1个标准差冲击，即

设第2、3期v1、v2均为0新息（u1、u2也为0）。

那么y2、y3分别为：

虽然乔利斯基分解被广泛应用，但是对于共同部分的归属来说，它还是一种很随意的方法。

方程顺序的改变将会影响到脉冲响应函数。

因此在解释脉冲响应函数时应小心。

比如，在上例中，将方程的顺序更改为，

Ω的Cholesky分解矩阵为：

第1期的y1的1个标准差冲击，即

设第2、3期v1、v2均为0新息（u1、u2也为0）。

那么y2、y3分别为：

类似地，第1期的y1的1个标准差冲击，即

设第2、3期v1、v2均为0新息（u1、u2也为0）。

那么y2、y3分别为：

每个变量在不同期的响应如下表和下图所示。

注意：

对于ut中的每一个误差项，内生变量都对应着一个脉冲响应函数。

这样，一个含有4个内生变量的VAR将有16个脉冲响应函数。

8.5.2预测误差方差分解

VAR模型的另一种分析方法是方差分解，既分析未来t+s期的yj,t+s的预测误差的方差由不同新息的冲击影响的比例。

与脉冲响应函数（impulseresponsefunction）相对应，方差分解提供了另一种描述系统动态变化的方法。

脉冲响应函数是追踪系统对一个内生变量的冲击效果，反映一个变量的冲击对所有内生变量当期及未来各期的影响，而方差分解将VAR系统中任意一个内生变量的预测均方误差分解成系统中各变量的随机冲击所做的贡献，然后计算出每一个变量冲击的相对重要性，即各变量冲击的贡献占总贡献的比例。

比较这个相对重要性信息随时间的变化，就可以估计出该变量的作用时滞，还可估计出各变量效应的相对大小。

因此，方差分解揭示了一个变量的运动轨迹在多大程度上是由于自己的冲击，多大程度上是由于系统中其它变量的冲击。

另外，在VAR模型中，如果对一个方程的冲击在任何预测区间都不能解释所关注变量的预测误差方差，那么称所关注的这些变量为外生的，其运动独立于其它方程的冲击。

另一方面，如果一个方程的冲击在任何区间完全解释了所关注变量的预测误差方差，那么称所关注的这些变量为完全内生的，其运动完全取决于其他方程的冲击。

在这一方面，预测误差方差分解也为我们提供了非常有用信息。

以VAR

（1）模型为例（假设均值为0）。

yt=Ayt-1+ut

对（t+1）期的预测值为：

对（t+2）期的预测值为：

依此类推，可得到对（t+s）期的预测值

预测误差为：

预测误差的方差为：

对于VAR（k）过程的预测误差，可以通过其友矩阵变换的形式来计算。

假设下式是由任一VAR（k）模型转换而得到的关于Yt的一阶向量自回归模型。

Yt=AYt-1+Ut（8.38）

E（UtUs'）=

其中

QNk⨯Nk=

。

Q中的每一个元素都是N⨯N阶的。

注意，（8.38）式中的前N行就是原VAR（k）模型。

对（8.38）进行迭代运算，

上式中的前N行（原VAR中的方程）可用向量表示为，

Yt+s=A11（s）Yt+A12（s）Yt-1+…+A1k（s）Yt-k+1+ut+s+A11ut+s-1+A11

（2）ut+s-2+…+A11（s-1）ut+1

（8.40）

其中（A11（s）Yt+A12（s）

展开阅读全文