ImageVerifierCode 换一换
格式:DOCX , 页数:31 ,大小:81.96KB ,
资源ID:30851280      下载积分:3 金币
快捷下载
登录下载
邮箱/手机:
温馨提示:
快捷下载时,用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)。 如填写123,账号就是123,密码也是123。
特别说明:
请自助下载,系统不会自动发送文件的哦; 如果您已付费,想二次下载,请登录后访问:我的下载记录
支付方式: 支付宝    微信支付   
验证码:   换一换

加入VIP,免费下载
 

温馨提示:由于个人手机设置不同,如果发现不能下载,请复制以下地址【https://www.bdocx.com/down/30851280.html】到电脑端继续下载(重复下载不扣费)。

已注册用户请登录:
账号:
密码:
验证码:   换一换
  忘记密码?
三方登录: 微信登录   QQ登录  

下载须知

1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。
2: 试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。
3: 文件的所有权益归上传用户所有。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 本站仅提供交流平台,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

版权提示 | 免责声明

本文(第15章-短面板.docx)为本站会员(zf)主动上传,冰豆网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知冰豆网(发送邮件至service@bdocx.com或直接QQ联系客服),我们立即给予删除!

第15章-短面板.docx

1、 陈强,高级计量经济学及 Stata 应用课件,第二版,2014 年,高等教育出版社。第 15 章短面板15.1 面板数据的特点面板数据(panel data 或 longitudinal data),指的是在一段时间内跟踪同一组个体(individual)的数据。它既有横截面的维度(n 个个体),又有时间维度(T 个时期)。一个T = 3的面板数据结构如表 15.1。表 15.1面板数据的结构yx1x2x3Individual 1:t = 1Individual 1:t = 2Individual 1:t = 3LLIndividual n:t = 1Individual n:t = 2In

2、dividual n:t = 331如果面板数据 T 较小,而 n 较大,在使用大样本理论时让 n 趋于无穷大。这种面板数据被称为“短面板”(short panel)。反之,如果 T 较大,而 n 较小,则被称为“长面板”(long panel)。在面板模型中,如果解释变量包含被解释变量的滞后值,则称为“动态面板”(dynamic panel);反之,则称为“静态面板”(staticpanel)。如果在面板数据中,每个时期在样本中的个体完全一样,则称为“平衡面板数据”(balanced panel);反之,则称为“非平衡面板数据”(unbalanced panel)。面板数据的优点:(1) 解

3、决遗漏变量问题:遗漏变量常由不可观测的个体差异或“异质性”(heterogeneity)造成。如果个体差异“不随时间而改变”(time invariant),则面板数据可解决遗漏变量问题。(2) 提供个体动态行为的信息:例:考虑区分规模效应与技术进步对企业生产效率的影响。对于截面数据,没有时间维度,无法观测到技术进步。对于时间序列,无法区分生产效率的提高究竟有多少由于规模扩大,有多少由于技术进步。例:对于失业问题,截面数据能告诉在某个时点上哪些人失业,时间序列数据能告诉某个人就业与失业的历史,但这两种数据均无法告诉是否失业的总是同一批人(低流转率),还是失业的人群总在变动(高流转率)。(3)

4、样本容量较大:同时有截面维度与时间维度,面板数据的样本容量更大,可提高估计精度。面板数据也会带来问题,比如,数据通常不满足独立同分布的假定,因为同一个体在不同期的扰动项一般存在自相关。面板数据的收集成本通常较高,不易获得。15.2 面板数据的估计策略一个极端策略是将其看成是截面数据而进行混合回归(pooled regression),要求样本中每位个体拥有相同的回归方程。此策略忽略个体间不可观测或被遗漏的异质性(heterogeneity),而该异质性可能与解释变量相关,导致估计不一致。另一极端策略则是,为每位个体估计一个单独的回归方程。此策略忽略了个体的共性,可能没有足够大的样本容量。实践中

5、常采用折衷的估计策略,即假定个体的回归方程拥有相同的斜率,但可有不同的截距项,以此来捕捉异质性。个体效应模型 (individual-specific effects model)yit= xit b+ zid+ ui+ eit(i = 1,L, n; t= 1,L,T )zi 为不随时间而变(time invariant)的个体特征,比如性别;xit 可随个体及时间而变(time-varying);扰动项由(ui+ eit ) 两部分构成,称为“复合扰动项”(composite errorterm);不可观测的随机变量ui 是代表个体异质性的截距项。eit 为随个体与时间而改变的扰动项。假设

6、eit为 iid,且与ui 不相关。如果ui 与某个解释变量相关,则称为“固定效应模型”(Fixed Effects Model,简记 FE)。此时,OLS 不一致。如果ui 与所有解释变量( xit , zi ) 均不相关,则称为“随机效应模型”(Random Effects Model,简记 RE)。15.3 混 合 回 归如果所有个体拥有一样的回归方程,则方程可写为yit= a +xit b+ zid+ eitxit 不包括常数项。把所有数据放在一起,像对待横截面数据那样进行 OLS 回归,称为“混合回归”(pooled regression)。应使用聚类稳健的标准误(cluster-r

7、obust standard errors),聚类(cluster)由每位个体不同期的所有观测值所组成。15.4 个体固定效应模型对于固定效应模型,给定个体 i,将方程两边对时间平均:yi =xib+ zid+ ui+ ei将原方程减去平均后的方程可得:yit- yi= ( xit- xi )b+ (eit- ei )定义y%it yit- yi , x%it xit- xi ,e%it eit- ei ,则y%it= x%it b+ e%it上式已将ui 消去,只要e%it 与x%it 不相关,可用 OLS 一致地估计b ,称为“固定效应估计量”(Fixed Effects Estimato

8、r),记为bFE 。bFE 主要使用了每个位体的组内离差信息,也称“组内估计量”(within estimator)。即使个体特征ui 与解释变量xit 相关,组内估计量也一致。在作离差转换时,zid 也被消掉,无法估计d ,故 FE 无法估计不随时间而变的变量之影响。为保证(eit- ei )与( xit- xi )不相关,要求第 i 个观测值满足严格外生性,即E(eitxi1, L,xiT ) = 0,因为xi 中包含了所有( xi1, L,xiT )的信息。扰动项须与各期解释变量均不相关(不仅仅是当期解释变量)。在原方程中引入(n -1) 个虚拟变量(如果没有截距项,则引入 n个虚拟变量

9、)来代表不同的个体,可得到同样结果。FE 也称为“最小二乘虚拟变量模型”(Least Square Dummy Variable Model,简记 LSDV)。正如线性回归与离差形式的回归在某种意义上是等价的。比如,yi = a+ b xi+ eiyi - y= b (xi- x ) + (ei- e )使用 LSDV 的好处是可以得到个体异质性ui 的估计。LSDV 法的缺点是,如果 n 很大,须在回归方程中引入很多虚拟变量,可能超出计量软件所允许的解释变量个数。15.5 时间固定效应引入时间固定效应,可解决不随个体而变(individual invariant)但随时间而变(time va

10、rying)的遗漏变量问题。假设模型为yit= xit b+ zid+ g St+ ui+ eitSt 不可观测。定义lt g St ,则yit= xit b+ zid+ lt+ ui+ eit将lt 视为第 t 期独有的截距项,并将其解释为“第 t 期”对 y 的效应,故l1, L, lT 称为“时间固定效应”(time fixed effects)。使用 LSDV 法来,对每个时期定义一个虚拟变量,把(T -1)个时间虚拟变量包括在回归方程中:yit= xit b+ zid+ g 2D2t+L+ gT DTt+ ui+ eit其中,时间虚拟变量D2t以此类推。= 1,如果t =2; D2t

11、= 0 ,如果t 2 ;此方程既考虑个体固定效应,又考虑时间固定效应,称为“双向固定效应”(Two-way FE)。为节省参数,可引入时间趋势项,替代(T -1)个时间虚拟变量:yit= xit b+ zid+ g t + ui+ eit上式隐含较强假定,即每个时期的时间效应相等,每期均增加g 。15.6 一阶差分法对于固定效应模型,可对原方程两边进行一阶差分,以消去个体效应ui (同时把zid 消掉了),yit- yi, t -1= ( xit- xi, t -1 )b+ (eit- ei, t -1 )对此方程使用 OLS,即得到“一阶差分估计量”(First Differencing E

12、stimator),记为bFD 。只要(eit- ei, t -1 )与( xit- xi, t -1 )不相关,则bFD 一致。此一致性条件比严格外生性假定更弱,这是bFD 的主要优点。可以证明(参见习题),如果T = 2,则bFD = bFE 。对于T 2,如果eit 为 iid,则bFE 比bFD 更有效率,故实践中主要使用bFE 。对于动态面板(第 16 章),严格外生性假定无法满足,用差分法。15.7 随机效应模型对于方程yit = xit b + zid + ui + eit ,随机效应模型假设ui 与解释变量xit , zi 均不相关,故 OLS 一致。但扰动项由(ui+ eit

13、 ) 组成,不是球型扰动项,故 OLS 不是最有效率的,应进行 FGLS 估计。假设不同个体之间的扰动项互不相关。由于ui 的存在,同一个体不同时期的扰动项之间仍存在自相关, s 2 ,若 t sCov(ui+ eit , ui+ eis ) = us 2 + s 2 ,若 t = sues 2为u 的方差,s 2为e 的方差。uieit当t s时,其自相关系数为r Co rr(ui+ eit ,2ssiisu + e ) = ueu2 + s 2自相关系数 不随时间距离(t - s)而改变。越大,则复合扰动项(ui+ eit ) 中个体效应的部分(ui ) 越重要。同一个体扰动项的协方差阵为

14、s 2+ s 2s 2.s 2ueuus 2s 2+ s 2.s 2 = uueuMMOMs 2s 2.s 2 + s 2 uuue T T整个样本的协方差阵为块对角矩阵(block diagonal matrix), S0 W = O 0S nT nT由于 OLS 是一致的,且其扰动项为(ui + eit ),故可用 OLS 的残差来估计(s 2 + s 2 )。ue另一方面,FE 也一致,且其扰动项为(eite来估计s 2。- ei ),故可用 FE 的残差然后,用 FGLS 估计原模型,得到“随机效应估计量”(Random Effects Estimator),记为bRE 。具体来说,用

15、 OLS 来估计以下“广义离差”(quasi-demeaned)模型:yit- qyi= ( xit- qxi )b+ (1 - q)zid+ (1 - q)ui + (eit - qei )144424443误差项其中,q是q 1 -se的一致估计量。(Ts 2 + s 2 )1 2ue可以证明,此扰动项不再有自相关。对于随机效应模型,如果进一步假设扰动项服从正态分布,可进行 MLE 估计。15.8 组间估计量对于随机效应模型,还可使用“组间估计量”。如果个体数据较不准确,可对每位个体取时间平均值,然后用平均值来回归:yi =xib+ zid+ ui+ ei(i = 1,L, n)对上式用

16、OLS,可得“组间估计量”(Between Estimator),记bBE 。由于xi ,zi 中包含了xit ,zi 的信息,如果ui 与解释变量xit ,zi 相关,则bBE 不一致。故不能在固定效应模型下使用组间估计法。15.9 拟合优度的度量在有常数项的情况下,线性模型的R2 等于被解释变量 y 与预测值y 之间相关系数的平方,即R2= corr( y,y)2 。对于面板模型,如使用混合回归,可直接用混合回归的R2 。如使用固定效应、随机效应或组间回归,拟合优度略复杂。给定估计量(b, d) ,Stata 提供了以下三种R2 。首先,对应于原模型,称Corr( y , x b + zd

17、)2 为“整体 R2 ”ititi( R2 overall),衡量估计量(b, d) 对原模型的拟合优度。其次,对应于组内模型,称Corr( y% , x% b)2 为“组内 R2 ”itit( R2 within),衡量估计量(b, d) 对组内模型的拟合优度。再次,对应于组间模型,称Corr( y , xb + zd)2 为“组间R2 ”iii( R2 between),衡量估计量(b, d) 对组间模型的拟合优度。对于固定效应模型,建议使用组内R2 ,即组内方程的R2 。对于组间回归模型,建议使用组间R2 ,即组间方程的R2 。对于随机效应模型,这三种R2 都只是相应的相关系数平方,而非

18、随机效应方程的R2 。15.10 非平衡面板非平衡面板数据并不影响计算离差形式的组内估计量(within estimator),固定效应模型的估计可照样进行。对于随机效应模型而言,非平衡面板数据也没有实质性影响,只要在做广义离差变换时让(Ts 2 + s 2 )1 2iuesqi 1 -e其中,Ti 为个体 i 的时间维度,就可照常进行 FGLS 估计。非平衡面板的最大问题是,那些原来在样本中但后来丢掉的个体,如果“丢掉”的原因是内生的(即与扰动项相关),则会导致样本不具有代表性(不再是随机样本),从而导致估计量不一致。比如,低收入的人群更易从面板数据中丢掉。15.11 究竟该用固定效应还是随

19、机效应模型检验原假设“ H0 :ui 与xit , zi 不相关”(即随机效应模型为正确模型)。无论原假设成立与否,FE 都是一致的。如果原假设不成立,则 RE 不一致。如果H0成立,则 FE 与 RE 估计量将共同收敛于真实的参数值,故(bFE- b) p0。如果二者的差距过大,则倾向于拒绝原假设。RE豪斯曼检验(Hausman, 1978)的统计量为 -1d2(bFE- bRE )Var(bFE ) - Var(bRE )(bFE- bRE ) c(K )其中,K 为bFE 的维度。上述检验假设在H0 成立的情况下,bRE 最有效率。如果存在异方差,则bRE 并非最有效率的估计量,故不适用

20、异方差的情形。解决方法之一,通过自助法计算Var(bFE - bRE ),参见第 19 章。解决方法之二,进行以下辅助回归(Wooldridge, 2010),yit- qyi= ( xit- qxi )b+ (1 - q)zid+ ( xit- xi )g+ (1 - q)ui+ (eit- qei )使用聚类稳健标准误检验原假设“ H0 : g的情况下也适用。= 0”,此检验在异方差由于总可以把原模型变换为随机效应的方程:yit- qyi= ( xit- qxi )b+ (1 - q)zid+ (1 - q)ui + (eit - qei )144424443误差项故在上面的辅助回归中,g

21、 = 0 。如果随机效应模型成立,则 OLS 一致,故p limg = gn= 0。如果固定效应模型成立,扰动项(1 - q)ui + (eit - qei ) 与( xit- xi )相关(因为u 与x 相关),OLS 不一致,即 p limg= g * g= 0。iitn拒绝“ H0 : g= 0”,则意味着拒绝随机效应,接受固定效应。i对于非平衡面板,则以q 替代方程中的q即可。15.12 个体时间趋势个体异质性还可能表现为个体的不同时间趋势。比如,在跨国面板中,各国的经济增长率可能不同。考虑以下模型:yit= xit b+ zid+ g it + ui+ eitg it 为个体时间趋势

22、。一般将g i 视为来自某分布的随机变量(从该分布随机抽出一个观测值后,就不再随时间而变)。此模型称为“随机趋势模型”(random trend model)。如果yit 取对数形式(比如ln GDPit ),则g i 可解释为在给定( xit ,zi ) 条件下的平均增长率(即 E(ln GDPit ) / t ),故也称“随机增长模型” (random growth model)。首先对方程两边做差分,去掉ui :Dyit= Dxit b+ g i+ Deit在形式上,此方程与标准的个体效应模型一样。如果g i 与解释变量Dxit 不相关,可用 RE 估计此方程。如果g i 与解释变量Dxit 相关,可用 FE 或 FD 估计此方程。

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1