eviews讲义时间序列截面数据模型Word格式.docx
《eviews讲义时间序列截面数据模型Word格式.docx》由会员分享,可在线阅读,更多相关《eviews讲义时间序列截面数据模型Word格式.docx(64页珍藏版)》请在冰豆网上搜索。
,的差别来说明,即在该模型中各截面方程的截距项,不同,而系数向量相同。
我们称该模
型为变截距模型。
从估计方法角度,有时也称该模型为个体均值修正回归模型(indnadiKd-meancorrectedregressionmodel)o
变系数模型的单方程回归形式可以写成:
儿=e+x:
Q+“"
(10丄5)
在该模型中,假设在横截面上既存在个体影响,又存在结构变化,即在允许个体影响由跨截面变化的截距项i来说明的同时还允许系数向量跨截面变化,用以说明横截面上的结构变化。
我们称该模型为变系数模型或无约束模型(umestrictedmodel)o
10.2模型形式的设定
在对时间序列/截面数据模型进行估计时,使用的样本数据包含了时间序列和横截面这两个方向上的信息,如果模型形式设定的不正确,估计结呆将与所要模拟的经济现实偏离甚远。
因此,建立时间序列/截面数据模型的第一步便是检验刻画被解释变量y的参数,和:
是否在所有横截面样本点和时间上都是常数,即检验样本数据究竟符合上面哪种时间序列/截面数据模型形式,从而避免模型设定的偏差,改进参数估计的有效性。
经常使用的检验是协方差分析检验,主要检验如下两个假设:
Hi:
A=A=-=A,
小:
aL=a2=-=atl
A=02=■•=A
可见如果接受假设日2则可以认为样本数据符合模型(10.1.3),无需进行进一步的检验。
如果拒绝假设日2,则需检验假设日1。
如果拒绝假设H1,则认为样本数据符合模型(10.1.5),反之,则认为样本数据符合模型(10.1.4)。
对应假设H1和H2,在检验的过程中构造的检验统计量分别为:
=~尸[(—1)(K+1),n(T-K-I)]SJ5T-MK+1))
(10.2.2)
其中,S1、
S2、S3分别为模型(10.1.5)、(10.1.4)和(10.1.3)的残差平方和。
如果记
Wg=工(冷一和(兀7-X)wxyi=工Cq-瓦)'
(儿一齐)
/=1f=l
Wg=£
(儿-Z)/=!
其中
工严,y,=XyJT
f=l//=1/
则
S严工:
比片-忆,肌;
(10.2.3)
记
归=£
%•IV,=±
wxy.wyy=±
wyy.
1=1f=l/=!
S2=%_叱,叱%
(10.2.4)
r
匚=丈£
(心-元)'
(£
-元)Txy=丈£
(兀-X)\yit-y)f=lf=l1=1/=1
”T2
:
=±
工(儿-$)~
f=l/=1
元=丈工兀丿圧y=丈工儿沧
1=1/=!
/r=lf=l/
q_t丁―]丁
=yy~1xyixx上q
(10.2.5)
由于
若计算所得到的统计量F2的值不小于给定置信度卜•的相应临近值,则拒绝假设日2,继续检验假设H1。
反之,则认为样本数据符合模型(10.1.3)。
类似地,由于
1、在下,S2/2〜(「1)_口和(S2-S1)/2〜2[5_1)K]:
2、(Si-S1)/2与S1/2独立。
所以,在假设下检验统计量F1也服从相应自由度下的F分布,即
F]〜F[(〃一l)K,n(T一K一1)](10.2.14)
若计算所得到的统计量F1的值不小于给定置信度卞的相应临近值,则拒绝假设7/1,用模型(10.1.5)拟合样本,反之,则用模型(10.1.4)拟合。
10.3变截距模型
变截距模型是时间序列/截面数据模型中最常见的一种形式。
该模型允许横截面上存在个体影响,并用截距项的差别来说明。
模型的基本形式由如下:
儿““,/=1,2,n;
/=1,2T(10.3.1)
其中,各截面方程间不同的截距项i为个体时期恒量,用来说明个体影响,即反映模型中忽略的反映个体差异的变屋的影响;
随机误差项“〃反映模型中忽略的随横截面和时间变化的因素的影响。
个体影响分为固定影响和随机影响两种情形,根据个体影响的不同形式,变截距模型又分为固定影响变截距模型和随机影响变截距模型两种。
固定影响变截距模型
1.模型形式及參数估计
固定影响变截距模型假定各截面单位的个体影响可以由常数项的不同来说明,即在(10.3.1)式
所表示的模型中,各截面方程中的截距项
i为跨截面变化的常数。
模型对应的向量形式如下:
■
e
■■
X\
x2
Y=
—
4+
£
+••・+
Q“+
0+
(10.3.2)
_K_
Un_
儿
…XKil
%
9
X严
7X1
X2Cf
XKiT_
=(1,1,…,1),li>
=(A/1,…,Mr)
并且,Ew=0,帥1(;
=叩“Eiu/.=0(心刀,其中儿为TT维单位矩阵。
利用普通最小二乘法可以得到参数i和的最优线性无偏估计(ELUE)为:
Bev=f£
(占--忑)£
工(入-K儿-X)
_i=l/=1」Li"
/=1.
氏=弘-Bev%(10.3.3)
在模型(10.3.2)中,我们把参数,写为可观测的虚拟变量的系数的形式,因此,(10.3.3)式所表示的OLS估计也称为最小二乘虚拟变量(LSDV)估计。
该方法也可以推广到包含时期个体恒量的模型,即将(10.3.1)的模型形式推广为:
儿=乞+城0+人+“”
其中,f为时期个体恒量,反映时期特有的影响。
类似地,通过引进相应的截面个体和时期虚拟变量,利用普通最小二乘法可以得到该形式下的各参数的OLS估计,即
「nTF「//T■
Av=工工(兀-xixt+x)\xit-xixt+x)工工也一和+砂(儿一X-为+刃
_/=1/=i」L/=1日-
2=(为一-无)
力=(开_刃_必(呂一无)
其中,%=£
儿%
f=l/r=l/h=1/i=l/
从(10.3.3)式给出的参数估计表达式中可以看出,在解释变量矩阵中并没有包含引进的虚拟变量,因此,将各截面方程中的变量观测值减去其在该截面个体上的平均值,并用转换后的数据,利用普通最小二乘法便可计算出(10.3.3)式的估计量。
若将转换矩阵记为:
Q=IT-^eef(10.3.4)
则由(10.3.3)式所表示的估计结果可以记为:
(10.3.5)
Pev=fXQX,
1=1
模型(10.3.2)也被称为协方差分析模型,因此参数的LSDV估计有时也被称为协方差估计。
参数的协方差估计是无偏的,且当〃或T趋于无穷大时,其为一致估计。
对应的协方差矩阵为:
--1-1
(10.3.6)
Wr(血)=町土X;
QX,
f=l
相应地,由(10.3.3)式给出的截距j的估计也是无偏估计,但仅当T趋于无穷大时为一致估计。
对应的协方差矩阵为:
如位)=bj/T+XVm^X;
方差bj对应的估计量为:
*=£
£
(儿-必~xJcv)2knT-n-K)
/=!
f=l/
(10.3.7)
如果引进总体均值截距项(加人我们可以将模型(10・3・1)写成如下的等价形式:
儿=加+儿0+Q:
+〃”
在该形式下,模型(10.3.1)中的反映个体影响的跨截面变化的截距项彼分解成在各截面方程中都相等的总体均值截距项(〃7)和跨截面变化的表示个体对总体均值偏离的个体截距项(;
*)o个
体截距项
「表示的是截面个体j对总体平均状态的偏离,所有偏离之和应该为零,即
在该约束下,我们町以得到(10.3.7)式中的各参数的最优线性无偏估计
at=y,-m-06召(10.3.8)
值得注意的是,在计算变截距模型中的个体影响时,不同的软件给出的个体影响形式不同。
本书所介绍的EViews软件,给出的是不含总体均值的个体影响,即EViews给出的个体影响反映的是各截面个体对总体平均状态的偏离。
2.非平衡数据的固定影响模型
在前面的讨论中,我们都是假设在所使用的时间序列/截面数据中,各截面成员的观测数据个数相同,然而在实际分析中,经常会遇到各截面成员观测数据个数不等的情况,即在所获得的时间序列/截面数据中,一些截面成员的数据较多而另一些截面成员的数据较少。
我们称这种情况下的时间序列/截面数据为非平衡数据。
对于非平衡数据的固定影响模型,只需将上面所介绍的估计方法进行简单修正,便可得到参数相应的协方差估计。
如呆设第/个截面成员的观测数据个数为乃,则观测数据总数为立7;
变量的总体平均为
天=/*.=£
叭y=亍£
儿/£
耳述®
%ma»
=1/=!
//=1/=1j=1/=1//=1/=1
/=1
模型参数对应的估计量为:
_«
=1」L«
=1_
其中,QTt厂討
3.固定影响模型的广义最小二乘估计
在固定影响模型中,如果随机误差项不满足等方差或相互独立的假设,则需要使用广义最小二乘法(GLS)对模型进行估计。
关于广义最小二乘法在前面章节已有详细介绍,本节只介绍各种情形下的GLS估计的基本思想。
固定影响模型的广义最小二乘法主要考虑四种基本的方差结构:
截面异方差、时期异方差、同期相关协方差和时期间相关协方差。
对应于各种方差结构的GLS估计过程的主要步骤均为:
先估计系数,然后计算GLS的转换权重,之后在加权数据的基础上重新估计,或者利用迭代的方法,重复上面的步骤直至系数和权重收敛为止。
由于我们假定参数满足时间一致性,即参数值不随时间的不同而变化,因此,在此我们只介绍截面异方差和同期相关协方差两种情形。
(1)截面异方差
截面异方差是指各截面方程的随机误差项之间存在异方差,但截面之间以及时期之间的协方差为零,对应的假设为:
(10.3.11)
其中/和sHf。
该情形下用广义最小二乘法进行估计非常简单,即先对方程进行普通的初步估计,然后计算各截面成员的残差向量,并用其来估计截面成员的方差。
然后,用得到的方差估计作为各截面成员的权重,利用加权最小二乘方法得到相应的GLS估计。
类似地,可以得到时期异方差情形卞的GLS估计。
(2)同期相关协方差(Cross-sectionSUR)
同期相关协方差是指不同的截面成员i和j的同一时期的随机误差项是相关的,但其在不同时期之间是不相关的,相应的假设为:
(10.3.12)
其中需要指出的是同期相关协方差是允许同一时期即f不变时,不同截面成员之间存在协方差。
如果把假设中的第一个表达式写成向量的形式:
(10.3.13)
E(iitu\)=CLn
对于任意的『有:
■B■
61^12…
0”=%(10.3.14)
6%_
这种截面成员之间存在协方差的方差结构有些类似于截面方程框架下的近似不相关回归,因此,将这种结构称为截面SURo
截面SUR加权最小二乘(有时称为Parks估计)简单地说,就是对由各截面方程所构成的系统进行GLS估计,系统中允许存在截面异方差和同期相关。
估计过程为:
先利用第一阶段的普通估计获得的估计,然后在第二阶段获得相应的GLS估计。
类似地,可以得到时期近似不相关(PeriodSUR)(时期方程框架下的近似不相关)情形下的GLS估计。
例10・1城镇居民消费的固定影响变截距模型
我们根据Keynes的绝对收入假说,利用29个省市的居民收入、消费数据建立城镇居民的消费模型,对各省市的居民消费结构进行对比分析。
模型中的被解释变量cs为城镇居民人均全年消费,解釋变量为城镇居民人均全年可支配收入yd(单位:
元),变量均为年度数据,样本区间为1991年至2003年。
利用上节所介绍的模型形式设定检验方法,计算得到的两个F统计量分别为:
F2=4.634Fi=1.293
查F分布表,在给定5%的显善性水平下,得到相应的临界值为:
F(56,319)=1.51F(28,319)=1.37
由于F2>
1.51,所以拒绝H:
;
又由于Fi<
1.37,所以接受H“因此,模型采用变截距形式。
因为主要是做省市之间的对比分,所以在本例中建立的是城镇居民消费的固定影响变系数模型。
模型形式为:
cs„=a+a]+pxydit+uit,i=1,2,…,29t=1,2,--,7
其中d为29个省市的平均自发消费水平,a;
为i地区自发消费对平均自发消费的偏离,用来反映省市间的消费结构差异。
地区标识数字从1到29,分别对应安徽、北京、福建、广东、甘肃、广西、贵州、河北、河南、黑龙江、海南、湖北、湖南、吉林、江苏、江西、辽宁、内蒙古、宁夏、青海、四川、山东、上海、陕西、山西、天津、新疆、云南和浙江29个省市。
由于各省市的城镇居民消费结构存在一定程度上的差异,所以我们使用GLS法(cross-section
weights)又推型进行估计,估计结果如下:
a*=45.536;
=62.6
无=-1036;
=132.28
=116.626;
=—105.72
心=-7.52忑=136.56
&
=—35.15&
=230.386;
=—84.76&
=214.78
=-10.41&
=—125.2=-96.596;
。
=—100.1
=70.54无=8.27&
=—84.6a\6=-228.2&
9=97.8心=87.77咼=148.47=-182.16
苑=一88.8玄6=—37.236;
=—110.21心=60.54a29=-12.31
简便起见,在此仅给出了各参数的估计结果,而未列出各估计所对应的统计量。
从估计结果我们可以看出,对于本例中的29个省市来说,虽然它们的城镇居民消费倾向相同,但是其城镇居民的自发消费存在显著的差异,其中北京的城镇居民自发消费最高,其次为广东,而城镇居民自发消费最低的是江西,其次是山东。
随机影响变截距模型
当横截面的单位是总体的所有单位时,即横截面单位之间的差异可以被看作回归系数的参数变动时,固定影响模型是一个合理的时间序列/截面数据模型。
例如,在进行各省比较分析时,数据包扌舌了所有的省份,此时我们使用固定影响模型进行分析是合理的。
然而,当横截面单位是随机地抽自一个大的总体时,固定影响模型便仅适用于所抽到的横截面单位,而不适用于样本之外的其他单位。
在这种情况卞,如呆仅仅对样本自身进行分析,选用固定影响模型仍然是合适的,但如果想以样本结呆对总体进行分析,则应该选用随机影响模型,即把反映个体差异的特定常数项看作是跨横截面单位的随机分布。
例如,在企业投资需求研究中,如呆我们只关心所选取企业的投资需求状况,便可以选用固定影响模型来进行分析,而如果我们关心的是所有同等规模企业的投资需求状况,把选取的企业当作所有同等规模企业的随机抽样时,便应该选用随机影响模型来进行分析。
变截距模型中的这种固定影响模型和随机影响模型的选择原则,对下节所介绍的变系数模型也同样适用。
1.随机影响模型的形式
与固定影响模型不同,随机影响变截距模型把变截距模型中用来反映个体差异的截距项分为常数项和随机变量项两部分,并用其中的随机变量项来表示模型中被忽略的反映个体差异的变量的影响。
模型的基本形式为:
=c+Xjt+a:
+i=1,2,…,"
:
/=1,2,…,T(10.3.15)
其中,C为截距中的常数项部分,,-为截距中的随机变量部分,代表个体的随机影响。
对于(10.3.15)式所表示的模型,一般有如下的进一步假定:
(1)f•与X〃不相关;
(2)E(/命)=E(r)=0:
(3)E“/)=0:
(4)E(/Ms)=0(ij,tS);
(5)E(ij)=0(/J):
(6)E(//~)=cr~,E(a~)=(j~。
(10.3.16)
为了分析方便,可以将模型(10.3.15)写成如卞形式:
儿=^,P+£
it(10.3.17)
其中,X;
=(1,<
),Q=(c,0),it=o如果令£
=(£
加订,…,务),则有:
(1)"
与X"
不相关;
(2)E(”)=0;
(3)E(覺+‘E(各佥)=尤(心$);
(4))=er^/r+o^ee/=Q;
(5)E(◎可)血如=/®
G=U。
(10.3.18)
可见,随机影响变截距模型的误差项为两种随机误差之和,方差为各随机误差的方差之和。
由于各随机误差的方差(0"
和/:
)被称为成分方差,因此有时也称该模型为方差成分模型(errorcomponentmodel)o
从(10.3.18)式给出结果我们可以看出,在由(10.3.17)式所表示的随机影响变截距模型中,随机误差项与解释变量不相关,但同一横截面个体、不同时期的随机误差项之间存在一定的相关性,普通OLS估计虽然仍是无偏和一致估计,但其不再是最有效估计,因此,一般用广义最小二乘法(GLS)对随机影响模型进行估计。
2、随机影响模型的估计
对于广义最小二乘法,主要是求转换矩阵。
在(10.3.18)式中可以看出nT个观测值的扰动协
方差距阵为V=I
因此.转换矩阵为V1/2=/®
Q-1/2o
Q=
元…或・或+b:
…b;
=b”7+丈出
或…或+丈
对应的协方差阵为:
-1
(10.3.20)
畑叽)=尤工兄。
■比
可见,当成分方差(<7:
和"
)已知时,可以很容易地计算出参数的GLS估计量。
然而,在实际分析中,成分方差几乎都是未知的,因此需要采用可行广义最小二乘估计法(FGLS)对模型进行估计,即先利用数据求出未知成分方差的无偏估计,然后再进行广义最小二乘估计。
在计算成分方差的估计值时,经常使用的是Swamy-Aiora方法,即利用内部回归和均值回归的残差计算成分方差的估计值。
虽然该方法在估计的过程中有一些多余模型的计算,但其成分方差估计量的表达式却相对地简单些,各成分方差的无偏估计分别为:
[(儿-开)-(心-耳)必]2
nT-n-K
在本书所介绍的EViews软件中,除Swamy-Aioni方法外,还有其它两种可以选择的方法,即只利用内部回归残差的Waiisbeek-Kaptevn方法和使用最小二乘估计(OLS)残差的Wallace-Hussain方法。
一般来说,特别是在大样本情况下,这三种方法的计算结果是相近的。
有了成分方差的无偏估计后,便可以得到未知矩阵。
一小的相应估计
(10.3.22)
得到矩阵的估计量后,利用GLS方法便可以很容易地求出参数的FGLS估计。
3.非平衡数据的随机影响模型
在随机影响模型中,如果使用的数据是非平衡数据,则需要对GLS估计过程中的转换矩阵和FGLS估计过程中的成分方差估计做相应的修正。
如果设第i个截面成员的观测数据个数为则转换矩阵V"
1/2的第i个对角分块为:
其中成分方差的相应估计分别为:
土工[(儿一X)-(£
-&
)瓦V]'
时间序列/截面数据模型中的动态模型是指将滞后被解释变量包含在解释变量中的模型,此种模型既考虑到当期解释变量的作用,也考虑到因变量之间的动态相关性,即前期变量对当期因变量的滞后影响。
在动态时间序列/截面数据模型中常用的是动态变截距模型。
10.4.1动态变截距模型的基