白仲林老师的面板数据讲义六讲全部内容文件(全).pdf

资源描述

白仲林老师的面板数据讲义六讲全部内容文件(全).pdf

《白仲林老师的面板数据讲义六讲全部内容文件(全).pdf》由会员分享，可在线阅读，更多相关《白仲林老师的面板数据讲义六讲全部内容文件(全).pdf（62页珍藏版）》请在冰豆网上搜索。

白仲林老师的面板数据讲义六讲全部内容文件(全).pdf

面板数据计量分析讲义白仲林第一讲第一讲面板数据面板数据因家庭调查得到的面板数据越来越多，面板数据的计量分析可以说是过去三十年社会应用研究领域所取得的最重要的进展。

Fitzgerald,Gottschalk和Moffitt（1998,P252）第一讲介绍的内容第一讲介绍的内容面板数据面板数据的优点与缺陷扩展的面板数据面板数据面板数据“面板数据”一词指的是一部分家庭、国家或企业等在一段时期内的观测值所构成的集合。

这样的数据可以通过在一段时期内对一些家庭或个体进行跟踪调查来获得。

从横截面看，面板数据是由若干个体在某一时点构成的截面观测值，并且，从纵剖面看每个个体都是一个时间序列。

1978-2005中国各省级地区消费性支出占可支配收入比例走势图（张晓峒老师绘制）面板数据通常分为两类：

由个体调查数据得到的面板数据通常被称为微观面板（微观面板（micropanels）。

）。

微观面板数据的特点是个体数N较大（通常是几百或几千个），而时期数T较短（最少是2年，最长不超过10年或20年）。

由一段时期内不同国家的数据得到的面板数据通常被称为宏观面板（宏观面板（macropanels）。

面板数据计量分析讲义白仲林这类数据一般具有适度规模的个体N（从7到100或200不等，如七国集团，OECD，欧盟，发达国家或发展中国家），时期数T一般在20年到60年之间。

因数据结构上的区别，微观面板和宏观面板要求使用不同的计量方法。

微观面板和宏观面板要求使用不同的计量方法。

样本容量的区别样本容量的区别微观面板必须研究T固定而N较大时的渐近特性，而宏观面板的渐近特性则是指T和N都较大时的情况。

平稳性平稳性对于宏观面板，当时间序列较长时需要考虑数据的非平稳问题，如单位根、结构突变以及协整等；而微观面板不需要处理非平稳问题，特别是每个家庭或个体的时期数T较短时。

个体相关性个体相关性在处理宏观面板时必须考虑国家之间的相关性，而在微观面板中，如果个体是随机抽样产生，则个体之间不大可能存在相关性，因此不需要考虑此问题。

为什么使用面板数据？

它们的优点和局限性为什么使用面板数据？

它们的优点和局限性1面板数据的优点面板数据的优点使用面板数据具有下列一些好处：

（）可以控制个体异质性（）可以控制个体异质性面板数据能反映个体、企业、州或国家之间存在的异质性，即时间上和空间上的异质效应。

而时间序列数据和横截面分析没有控制这种异质性，因而其结果很可能是有偏的。

例如，Baltagi和Levin（1992）研究1963-88年美国46个州的香烟需求问题时，设定需求模型（）,1ititititiitDfDpIrelieduadv=?

则模型中解释变量包括四类。

第一类是随个体（州）和时间的变化而变化的变量，如香烟消费量的滞后项、价格和收入等可观测的变量；?

第二类是随个体（州）变化而不随时间变化的可观测变量，如宗教（religion）和教育等变量；?

第三类是不随个体（州）变化而随时间变化的可观测变量，如电视和广播中的广告等变量；?

最后一类是一些不可观测变量，它们包括三种?

非时变异质性不可观测因素（iu）个体效应?

时变同质性不可观测因素（tv）时间效应?

时变异质性不可观测因素（itw）剩余效应面板数据计量分析讲义白仲林这样，模型可设定为（）,1ititititiitititDfDpIrelieduadvuvw=+事实上，对于宗教变量，人们不可能得到每年每个州某一宗教人数占总人口的百分比，所以一般认为不同年份的百分比也不会有太大变化。

同样，完成高中或大学学业的人数占总人口的百分比也是如此。

电视和广播中的广告是全国性的，不会随着州的不同而变化。

显然，遗漏第四类中任何一种不可观测因素就会导致估计结果的偏倚，面板数据模型能够基于这四类中的所有变量建模，而纯时间序列和横截面分析就无法做到。

另外，Hajivassiliou（1987）给出了一个宏观经济的例子，他使用1970-82年79个发展中国家的面板数据研究了外债偿付问题。

这些发展中国家在殖民历史、金融机构、宗教信仰和政治体制等方面存在差异，所有这些反映国家特征的特定变量都会影响它们在借债或拖欠方面的态度，同时也会影响债权国对待它们的方式。

如果不考虑这些国家之间的异质性就会出现严重的设定错误。

（2）面板数据模型容易避免多重共线性问题）面板数据模型容易避免多重共线性问题?

面板数据具有更多的信息；?

面板数据具有更大的变异；?

面板数据的变量间更弱的共线性；?

面板数据模型具有更大的自由度以及更高的效率。

时间序列研究中令人苦恼的就是多重共线性；比如在上述香烟需求的研究中，如果从总量的角度看价格和收入就具有很强的共线性，而使用美国各州的面板数据，存在共线性的可能就很小了，因为增加截面个体维度的同时也增加了数据的变异，也增加了更多有关价格和收入的信息。

事实上，数据中的变异可以分为两个部分，一是州与州之间由于规模和特征的不同所表现出的变异性；二是各州内部不同时间上表现出的变异性，前者的变异程度往往更大。

使用更多、更有信息的数据就可以得到更可靠的参数估计值。

当然，这要求不同州的变量间应具有相同的关系式，换句话说，这要求数据是可混合的（poolable）。

（3）面板数据更适合于研究动态调整过程）面板数据更适合于研究动态调整过程面板数据适用于研究失业、贫困等经济状态的持续性问题的研究。

如果这些面板数据的时期数足够长，它们就能够清楚地反映对经济政策变化的调整速度。

比如，在衡量失业问题时，横截面数据可以估计出人口中多大一部分比例在给定的时间处于失业状态，多个截面可以表明这一比例如何随时间而变化。

但是，只有面板数据才能估计出在某个时期失业人中有多大一部分在另一个时期仍处于失业状态。

Deaton（1995）指出，与横截面调查不同，面板调查可以获得家庭或个体变化的数据。

它可以使我们观测到个体生活标准在社会发展过程中如何变化；可以使我们确定谁从社会发展中受益；而且还可以使我们观测到“在收入动态变化中，贫困到底是暂时性的还是长期的状态。

”面板数据计量分析讲义白仲林由于面板数据可以将个体在某个时点的经历和行为与另一个时点的其他经历和行为联系起来，因此，面板数据在估计短期关系、生命周期模型和代际模型时也是必需的。

（4）面板数据还可以识别、测量单纯使用横截面或时间序列数据无法估计的影响。

）面板数据还可以识别、测量单纯使用横截面或时间序列数据无法估计的影响。

对于由妇女组成的横截面样本，其中年平均就业率是50%.这可能是由于下面两种原因导致的：

（a）每个妇女在任一给定年份有50%的概率就业；（b）样本中有50%的人一直有工作，50%的人根本不工作。

情况（a）中的工作转换频率很高，而情况（b）中没有工作转换，只有使用面板数据才能区分这两种情况。

（5）与纯横截面数据或时间序列数据相比，面板数据模型允许构建并检验更复杂的行为模型。

）与纯横截面数据或时间序列数据相比，面板数据模型允许构建并检验更复杂的行为模型。

比如，对技术效率问题使用面板数据建模研究效果更好（Baltagi和Griffin，1988；Baltagi，Griffin和Rich，1995；Koop和Steel，2001）。

另外，在分布滞后模型中使用面板数据比使用纯时间序列数据需要的约束条件更少（Hsiao，2003），因为通常使用GMM估计。

（6）基于个体、企业或家庭所搜集的微观面板数据与在宏观层次上所搜集的类似变量相比更加准确，而且还可能消除企业或个体数据汇总所导致的偏倚。

）基于个体、企业或家庭所搜集的微观面板数据与在宏观层次上所搜集的类似变量相比更加准确，而且还可能消除企业或个体数据汇总所导致的偏倚。

（7）例如，与时间序列分析中进行单位根检验遇到的非标准分布问题不同，面板单位根检验通常具有标准的渐近分布。

）例如，与时间序列分析中进行单位根检验遇到的非标准分布问题不同，面板单位根检验通常具有标准的渐近分布。

2面板数据的局限性面板数据的局限性面板数据的局限性包括：

（1）微观调查面板数据极少Kasprzyk等（1989）详细讨论了有关设计面板调查、数据收集和数据管理的问题。

这些问题包括：

覆盖面问题（样本没覆盖研究总体）、不响应问题（由于回答者不合作或提问者的失误）、回忆问题（回答者的记忆不准确）、采访的频率问题、采访的时间间隔问题、询问的时间问题和样本期内偏倚问题。

（2）测量误差的扭曲（distortions）严重在面板数据调查中，问题不清晰，记忆错误，故意歪曲回答（例如威望偏倚），不合适的被调查者，错误记录回答者的应答以及采访者的影响等导致出现严重的测量误差。

（3）面板数据调查的样本选择问题?

自选择例如，由于个人保留工资高于工作工资，人们通常选择不去工作。

在这种情况下，观测到的只是这些人的特征，而观测不到他们的保留工资。

由于他们的工资数据缺失，产生删失样本。

但是，如果这些人的所有数据都不可观测，这就成为一个截断样本。

因此，面板数据调查容易产生样本的选择有偏性。

未回答面板数据调查容易产生单项（或部分）未回答或完全未回答。

这时，除了由于数据缺失导致的效率损失之外，面板数据调查中的未回答还可以导致严重的总体参数识别问面板数据计量分析讲义白仲林题。

非随机样本流失在面板数据的随后调查，由于调查对象的非随机流动（如，低收入区域向高收入区域的流动）或发现回答的成本过高等原因，会产生调查对象的严重流失。

Fitzgerald等（1998）指出，面板数据使用价值的最大潜在威胁是有偏性流失。

Lillard和Panis（1998）研究发现，PSID的样本流失有很强的选择性。

例如，受教育程度较低的个体以及年龄较大的个体最容易从样本中剔除，而已婚的人继续留在样本内的可能性较大。

被调查者在样本内的时期越长，继续参与调查的倾向就越小。

在欧洲，（第一次和第二次调查之间的）样本流失率从意大利的6%到英国的40%不等。

平均的样本流失率大约是10%.为了解决样本非随机流失的影响，人们逐渐使用轮换面板（rotatingpanel）和伪面板（pseudo-panel）。

（4）时间维度短微观面板通常是年度数据，每个个体的时期数较短。

因此，主要依赖个体数趋于无穷进行渐近统计分析。

（5）截面相关性国家或地区的宏观面板数据，如果时间序列较长而且没有考虑到国家之间的相关性就会导致错误的推断结论。

事实上，考虑截面相关非常重要，而且会影响到统计推断的结论。

为此，人们也提出了考虑这种相关性的面板单位根检验方法。

扩展的面板数据扩展的面板数据1伪面板数据伪面板数据1985年，Deaton（1985）指出“由于统计调查的样本轮换和样本非随机流失问题，绝大多数国家并不存在较长时间跨度的真正面板数据，或者这样的真正面板数据是难以获得的，对于发展中国家的微观经济变量尤其如此。

”并且，Deaton发现“虽然某变量的统计抽样不能连续调查到各个体的观测数据，但是，如果按照某种属性（例如，年龄、职业和身份等）将各期调查对象分成不同的群（Cohort）；对于各个观测期，选择各群内观测数据的均值（中位数或分位数），即可构造以群为个体单位的面板数据”。

于是，对于截面时间序列的统计调查数据，基于某种属性分群，称以群为个体而构造的人工面板数据为伪面板数据伪面板数据（PseudoPanelData）。

众所周知，面板数据的本质是在观测期内的每期都能观测到相同个体的相关数据，然而，伪面板显然并非如此。

在观测期内，它允许每期观测的个体不同，并且重点关注的是个体群的统计特征，即通过群均值和群方差的发展变化，来揭示相关变量的总体分布特征。

例如，为了基于城市住户抽样调查数据研究城市居民收入的动态行为，常见的分群标准是户主年龄段、户主出生年的区间和户主职业类别。

面板数据计量分析讲义白仲林户主按出生年的区间分群，在各观测期，同群中的不同家庭都是户主在同一出生年区间的家庭，不同群的家庭是户主在不同出生年区间的家庭。

如

展开阅读全文