TC数据模型.docx

资源描述

TC数据模型.docx

《TC数据模型.docx》由会员分享，可在线阅读，更多相关《TC数据模型.docx（21页珍藏版）》请在冰豆网上搜索。

TC数据模型.docx

TC数据模型

面板数据模型

一、面板数据的概念

面板数据是时间序列数据和截面数据相结合的二维数据，为方面起见，暂且将之统称为TC数据（即时间截面二维数据的意思），以我国31个省份1991-1999年的GDP数据为例，则每一个年度称为一个截面，每个省份称为一个个体，每一个年度的31个省份的GDP数据（31个）就是截面数据，每一个省份的9年的GDP数据（9个）就是时间序列数据，即GDP这个变量在时间维度有9个取值，在截面维度有31个取值，这些数据合在一起就是TC数据，共31*9=279个。

如果每个截面包含相同数量的个体，则称之为平衡TC数据，否则为非平衡TC数据。

面板数据的主要优点有：

1.有利于降低多重共线性程度。

增加数据纬度的同时也增加了样本容量，样本容量增加可以增加变量之间的差异，降低变量间的相关程度，从而降低共线性程度。

2.可以进行模型效应分析，更准确地理解统计结果的实际含义。

二、面板数据模型的种类

面板数据模型分为PooledData模型和PanelData模型二类，PooledData模型适用于研究时期较多个体较少的TC数据，须为每个个体命名，研究目的侧重于个体差异或时期趋势；PanelData模型适用于研究个体较多、时期较少的TC数据，不须为每个个体命名，研究目的侧重于由时期差异或个体推断总体。

另外，PooledData模型允许各时期的个体不相同，PanelData模型要求各时期的个体相同。

例如：

pooleddata

t=1:

ABCDF

t=2:

ABDE

paneldata

t=1:

ABCDE

t=2:

ABCDE

三、模型的基本形式

1.PooledData模型

，…………①

2.PanelData模型

，…………①

其中，可以是非线性的。

比较分析：

由于研究目的不同，所以前者允许系数可变，后者假定系数不变。

四、模型形式的分类

根据模型是否存在个体效应（即不同的个体是否有不同的模型），可分为效应模型和无效应

模型两类，其中，PooledData模型的效应模型又分为变系数模型和变截距模型两种；PanelData模型的效应模型只有变截距模型一种。

所以，PooledData模型有3种，PanelData模型只有2种。

1.效应模型

（1）变系数模型

如果对不同的（），和都不相同，则称为个体（时期）效应变系数模型，可表示为：

…………②

或：

变系数模型等价于在模型中纳入“单独的个体哑变量项”和“个体哑变量与自变量的交叉项”来体现个体差异。

该模型用于描述：

x和y的关系不仅在个体之间存在显著差异，而且x对这种差异有显著影响，或者说，x是产生这种差异的影响因素。

这种结论是普通回归模型难以得到的（因为代表个体的哑变量须设置很多“二分变量”）。

（2）变截距模型

如果对不同的（），只是不相同，但相同，则称为个体（时期）效应变截距模型，可表示为：

…………③

或：

变截距模型等价于在模型中纳入“单独的个体哑变量项”来体现个体差异。

该模型用于描述：

x和y的关系在不同个体存在显著差异。

2.无效应模型

如果对不同的（），和都相同，则称为混合模型，可表示为：

…………④

该模型用于描述：

x和y的关系与个体或时期均无关。

模型效应包括固定效应和随机效应2种，当个体就是总体时，则称之为固定效应模型（FE）；当个体是来自总体的随机样本时，则称之为随机效应模型（RE）。

对于平衡数据，Eviews可以估计“双向FE”或“双向RE”，非平衡数据则不能。

五、模型选择

1.模型形式选择

（1）PooledData模型形式选择-F检验

1）假设：

：

假设模型为变截距模型

：

假设模型为混合模型

2）统计量

其中，S1、S2、S3分别表示变系数模型、变截距模型和混合模型的残差平方和，N是样本个数，K是外生变量个数，T是时期总数。

（注：

S1和S2均采用FE模型计算，可从回归结果中取得，然后手工计算F1和F1）

3）检验规则

（A）如果F2小于临界值（p值大于0.05），则不否定H02，应选择混合模型；

（B）如果F2、F1均大于临界值（两个p值均小于0.05），则否定H02和H01，应选择FE变系数模型；

（C）如果F2大于临界值但F1小于临界值（F2的p值小于0.05，但F1的p值大于0.05），则否定H02但不否定H01，应选择FE变截距模型。

[参考]F检验的Eviews操作：

◊估计变系数模型（无约束模型），做F检验（View/Fixed/RandomEffectsTesting/RedundantFixedEffects-LikelihoodRatio下同），P值记为p1；估计变截距模型（相对混合模型而言，也是无约束模型），做F检验，P值记为p2。

◊当p1<临界值时，则否定“约束”，故采用变系数模型

◊当p1>临界值，但p2<临界值时，则否定“截距”约束，但不否定“斜率”约束，故采用变截距模型

◊当p1、p2都>临界值时，则不否定“截距”约束，也不否定“斜率”约束，故采用混合模型

（2）PanelData模型形式选择-LikelihoodRatio检验

PanelData模型形式包括变截距模型（效应模型）和混合模型（无效应模型）两种。

1）假设

：

模型为混合模型（约束模型），

：

模型为FE变截距模型（未约束模型）

2）统计量

式中，S1、S2分别表示FE变截距模型和混合模型的残差平方和。

如果p值小于0.05，则拒绝原假设，选择FE变截距模型，反之则选择混合模型。

Eviews操作：

先估计FE变截距模型，然后做LikelihoodRatio检验（View/Fixed/RandomEffectsTesting/RedundantFixedEffects–LikelihoodRatio.）。

如果P值<0.05，则拒绝混合模型，接受FE变截距模型。

注：

（1）Paneldata模型的混合模型是在PanelOptions页的效应定义菜单中选择“None”选项来设置。

（2）该检验也适合于PooledData模型中的混合模型和FE变截距模型之间的选择。

由于变系数模型太复杂，实际应用很少采用，因此一般只考虑是采用混合模型还是FE变截距模型。

该检验也称为“F检验”、“FE显著性检验”等。

2.模型效应选择

前面在选择模型种类时都是按照FE计算的，而RE模型的含义更具有普遍性，所以如果可能的话，应尽量采用RE模型的结果。

由于软件的局限，模型效应的选择目前只适合于变截距模型，不适合于变系数模型，变系数模型就不用选择了，一律采用FE。

变截距模型效应可按照下列步骤选择：

（1）根据研究对象和目的不同作定性选择

如果研究对象就是样本/个体本身，目的也是比较样本之间的特点，或样本量和时期数都较小时，则应选择FE；如果研究对象是总体，目的是通过样本推断总体，则应选用RE。

（2）Hausman检验（RE合理性检验）

Eviews操作：

先估计RE模型，然后做Hausman检验（View/Fixed/RandomEffectsTesting/CorrelatedRandomEffects-HausmanTest.）。

如果P值<0.05，则拒绝原假设“RE与解释变量不相关”，即拒绝采用RE模型。

参考：

不相关的假设下，固定效应和随机效应模型是一致的，但固定效应不具有效性；反之，则随机效应模型不具一致性，而应采用固定效应模型。

六、模型估计

1.异方差

如果存在个体/时期异方差（例如，个体/时期个数大于时期/个体个数时），在Eviews中可选用“个体/时期加权回归法”（cross-section/periodweight）估计模型。

2.自相关

如果同时存在个体/时期异方差和自相关，在Eviews中可选用“个体/时期近似不相关加权回归法”（cross-section/periodSUR）估计模型。

七、单位根检验和协整检验

1.单位根检验

共6种检验方法，按照原假设不同可分为三类：

（1）假设存在相同单位根。

LLC（Levin,Lin&Chu），Breitung

（2）假设存在不同的单位根。

IPS（Im,Pesaran,Shin），ADF-Fisher，PP-Fisher

（3）假设不存在相同的单位根。

Hadri

参考：

只要有两种不同的单位根检验方法（相同根与不同根检验）检验结果不存在单位根就可以接受“序列平稳”，不要求所有检验都通过。

Eviews操作：

在pool对象窗口中，View\UnitRootTest

2.协整检验

如果基于单位根检验的结果发现变量之间是同阶单整的，即可进行协整检验。

通过了协整检验，说明变量之间存在着长期稳定的均衡关系，其方程回归残差是平稳的。

因此可以在此基础上直接对原方程进行回归，此时的回归结果是较精确的。

Pedroni、Kao、Johansen的方法。

零假设是没有协整关系

Eviews操作：

在pool对象窗口中，View\CointegrationTest

八、Eviews操作举例

[例1]建立我国城镇居民消费函数的面板数据模型（数据文件：

\zy\统计学\时间序列\pooldata.wf1或paneldata.wf1）。

在excel中按如下格式输入数据，并保存为paneldata.xls。

地区

Region

Year

CONS

CONS1

INC

安徽

1994

2551

3048

安徽

1995

2728

2551

3275

安徽

1996

2827

2728

3536

安徽

1997

2841

2827

3537

安徽

1998

2896

2841

3658

安徽

1999

3065

2896

3979

北京

1994

4134

5085

北京

1995

4279

4134

5315

北京

1996

4377

4279

5601

北京

1997

4739

4377

5668

北京

1998

4938

4739

6002

（一）PanelData模型

1.数据文件建立

方法一：

（1）新建工作文件：

file/new/workfile

（2）将paneldata.xls读入到Eviews中。

Proc\Import\ReadText-Lotus-Excel

方法二：

（1）新建工作文件：

file/new/workfile

（2）将paneldata.xls读入到Eviews中。

Proc\Import\ReadText-Lotus-Excel

（3）修改数据格式

Proc\Structure\ResizeCurrentPage，或双击"Range:

174

2.模型形式选择

估计个体FE变截距模型

DependentVariable:

CONS

Method:

PanelLeastSquares

Date:

03/24/10Time:

23:

Sample（adjusted）:

19951999

Cross-sectionsincluded:

Totalpanel（unbalanced）observations:

142

Variable

Coefficient

Std.Error

t-Statistic

Prob.

展开阅读全文