TC数据模型.docx

上传人:b****3 文档编号:1933202 上传时间:2022-10-25 格式:DOCX 页数:21 大小:419.11KB
下载 相关 举报
TC数据模型.docx_第1页
第1页 / 共21页
TC数据模型.docx_第2页
第2页 / 共21页
TC数据模型.docx_第3页
第3页 / 共21页
TC数据模型.docx_第4页
第4页 / 共21页
TC数据模型.docx_第5页
第5页 / 共21页
点击查看更多>>
下载资源
资源描述

TC数据模型.docx

《TC数据模型.docx》由会员分享,可在线阅读,更多相关《TC数据模型.docx(21页珍藏版)》请在冰豆网上搜索。

TC数据模型.docx

TC数据模型

面板数据模型

一、面板数据的概念

面板数据是时间序列数据和截面数据相结合的二维数据,为方面起见,暂且将之统称为TC数据(即时间截面二维数据的意思),以我国31个省份1991-1999年的GDP数据为例,则每一个年度称为一个截面,每个省份称为一个个体,每一个年度的31个省份的GDP数据(31个)就是截面数据,每一个省份的9年的GDP数据(9个)就是时间序列数据,即GDP这个变量在时间维度有9个取值,在截面维度有31个取值,这些数据合在一起就是TC数据,共31*9=279个。

如果每个截面包含相同数量的个体,则称之为平衡TC数据,否则为非平衡TC数据。

面板数据的主要优点有:

1.有利于降低多重共线性程度。

增加数据纬度的同时也增加了样本容量,样本容量增加可以增加变量之间的差异,降低变量间的相关程度,从而降低共线性程度。

2.可以进行模型效应分析,更准确地理解统计结果的实际含义。

二、面板数据模型的种类

面板数据模型分为PooledData模型和PanelData模型二类,PooledData模型适用于研究时期较多个体较少的TC数据,须为每个个体命名,研究目的侧重于个体差异或时期趋势;PanelData模型适用于研究个体较多、时期较少的TC数据,不须为每个个体命名,研究目的侧重于由时期差异或个体推断总体。

另外,PooledData模型允许各时期的个体不相同,PanelData模型要求各时期的个体相同。

例如:

pooleddata

t=1:

ABCDF

t=2:

ABDE

paneldata

t=1:

ABCDE

t=2:

ABCDE

三、模型的基本形式

1.PooledData模型

,…………①

2.PanelData模型

,…………①

其中,可以是非线性的。

比较分析:

由于研究目的不同,所以前者允许系数可变,后者假定系数不变。

四、模型形式的分类

根据模型是否存在个体效应(即不同的个体是否有不同的模型),可分为效应模型和无效应

模型两类,其中,PooledData模型的效应模型又分为变系数模型和变截距模型两种;PanelData模型的效应模型只有变截距模型一种。

所以,PooledData模型有3种,PanelData模型只有2种。

1.效应模型

(1)变系数模型

如果对不同的(),和都不相同,则称为个体(时期)效应变系数模型,可表示为:

…………②

或:

变系数模型等价于在模型中纳入“单独的个体哑变量项”和“个体哑变量与自变量的交叉项”来体现个体差异。

该模型用于描述:

x和y的关系不仅在个体之间存在显著差异,而且x对这种差异有显著影响,或者说,x是产生这种差异的影响因素。

这种结论是普通回归模型难以得到的(因为代表个体的哑变量须设置很多“二分变量”)。

(2)变截距模型

如果对不同的(),只是不相同,但相同,则称为个体(时期)效应变截距模型,可表示为:

…………③

或:

变截距模型等价于在模型中纳入“单独的个体哑变量项”来体现个体差异。

该模型用于描述:

x和y的关系在不同个体存在显著差异。

2.无效应模型

如果对不同的(),和都相同,则称为混合模型,可表示为:

…………④

该模型用于描述:

x和y的关系与个体或时期均无关。

模型效应包括固定效应和随机效应2种,当个体就是总体时,则称之为固定效应模型(FE);当个体是来自总体的随机样本时,则称之为随机效应模型(RE)。

对于平衡数据,Eviews可以估计“双向FE”或“双向RE”,非平衡数据则不能。

五、模型选择

1.模型形式选择

(1)PooledData模型形式选择-F检验

1)假设:

假设模型为变截距模型

假设模型为混合模型

2)统计量

~

~

其中,S1、S2、S3分别表示变系数模型、变截距模型和混合模型的残差平方和,N是样本个数,K是外生变量个数,T是时期总数。

(注:

S1和S2均采用FE模型计算,可从回归结果中取得,然后手工计算F1和F1)

3)检验规则

(A)如果F2小于临界值(p值大于0.05),则不否定H02,应选择混合模型;

(B)如果F2、F1均大于临界值(两个p值均小于0.05),则否定H02和H01,应选择FE变系数模型;

(C)如果F2大于临界值但F1小于临界值(F2的p值小于0.05,但F1的p值大于0.05),则否定H02但不否定H01,应选择FE变截距模型。

.

[参考]F检验的Eviews操作:

◊估计变系数模型(无约束模型),做F检验(View/Fixed/RandomEffectsTesting/RedundantFixedEffects-LikelihoodRatio下同),P值记为p1;估计变截距模型(相对混合模型而言,也是无约束模型),做F检验,P值记为p2。

◊当p1<临界值时,则否定“约束”,故采用变系数模型

◊当p1>临界值,但p2<临界值时,则否定“截距”约束,但不否定“斜率”约束,故采用变截距模型

◊当p1、p2都>临界值时,则不否定“截距”约束,也不否定“斜率”约束,故采用混合模型

(2)PanelData模型形式选择-LikelihoodRatio检验

PanelData模型形式包括变截距模型(效应模型)和混合模型(无效应模型)两种。

1)假设

模型为混合模型(约束模型),

模型为FE变截距模型(未约束模型)

2)统计量

式中,S1、S2分别表示FE变截距模型和混合模型的残差平方和。

如果p值小于0.05,则拒绝原假设,选择FE变截距模型,反之则选择混合模型。

Eviews操作:

先估计FE变截距模型,然后做LikelihoodRatio检验(View/Fixed/RandomEffectsTesting/RedundantFixedEffects–LikelihoodRatio.)。

如果P值<0.05,则拒绝混合模型,接受FE变截距模型。

注:

(1)Paneldata模型的混合模型是在PanelOptions页的效应定义菜单中选择“None”选项来设置。

(2)该检验也适合于PooledData模型中的混合模型和FE变截距模型之间的选择。

由于变系数模型太复杂,实际应用很少采用,因此一般只考虑是采用混合模型还是FE变截距模型。

该检验也称为“F检验”、“FE显著性检验”等。

2.模型效应选择

前面在选择模型种类时都是按照FE计算的,而RE模型的含义更具有普遍性,所以如果可能的话,应尽量采用RE模型的结果。

由于软件的局限,模型效应的选择目前只适合于变截距模型,不适合于变系数模型,变系数模型就不用选择了,一律采用FE。

变截距模型效应可按照下列步骤选择:

(1)根据研究对象和目的不同作定性选择

如果研究对象就是样本/个体本身,目的也是比较样本之间的特点,或样本量和时期数都较小时,则应选择FE;如果研究对象是总体,目的是通过样本推断总体,则应选用RE。

(2)Hausman检验(RE合理性检验)

Eviews操作:

先估计RE模型,然后做Hausman检验(View/Fixed/RandomEffectsTesting/CorrelatedRandomEffects-HausmanTest.)。

如果P值<0.05,则拒绝原假设“RE与解释变量不相关”,即拒绝采用RE模型。

参考:

不相关的假设下,固定效应和随机效应模型是一致的,但固定效应不具有效性;反之,则随机效应模型不具一致性,而应采用固定效应模型。

六、模型估计

1.异方差

如果存在个体/时期异方差(例如,个体/时期个数大于时期/个体个数时),在Eviews中可选用“个体/时期加权回归法”(cross-section/periodweight)估计模型。

2.自相关

如果同时存在个体/时期异方差和自相关,在Eviews中可选用“个体/时期近似不相关加权回归法”(cross-section/periodSUR)估计模型。

七、单位根检验和协整检验

1.单位根检验

共6种检验方法,按照原假设不同可分为三类:

(1)假设存在相同单位根。

LLC(Levin,Lin&Chu),Breitung

(2)假设存在不同的单位根。

IPS(Im,Pesaran,Shin),ADF-Fisher,PP-Fisher

(3)假设不存在相同的单位根。

Hadri

参考:

只要有两种不同的单位根检验方法(相同根与不同根检验)检验结果不存在单位根就可以接受“序列平稳”,不要求所有检验都通过。

Eviews操作:

在pool对象窗口中,View\UnitRootTest

2.协整检验

如果基于单位根检验的结果发现变量之间是同阶单整的,即可进行协整检验。

通过了协整检验,说明变量之间存在着长期稳定的均衡关系,其方程回归残差是平稳的。

因此可以在此基础上直接对原方程进行回归,此时的回归结果是较精确的。

Pedroni、Kao、Johansen的方法。

零假设是没有协整关系

Eviews操作:

在pool对象窗口中,View\CointegrationTest

八、Eviews操作举例

[例1]建立我国城镇居民消费函数的面板数据模型(数据文件:

E:

\zy\统计学\时间序列\pooldata.wf1或paneldata.wf1)。

在excel中按如下格式输入数据,并保存为paneldata.xls。

地区

Region

Year

CONS

CONS1

INC

安徽

1

1994

2551

3048

安徽

1

1995

2728

2551

3275

安徽

1

1996

2827

2728

3536

安徽

1

1997

2841

2827

3537

安徽

1

1998

2896

2841

3658

安徽

1

1999

3065

2896

3979

北京

2

1994

4134

5085

北京

2

1995

4279

4134

5315

北京

2

1996

4377

4279

5601

北京

2

1997

4739

4377

5668

北京

2

1998

4938

4739

6002

(一)PanelData模型

1.数据文件建立

方法一:

(1)新建工作文件:

file/new/workfile

(2)将paneldata.xls读入到Eviews中。

Proc\Import\ReadText-Lotus-Excel

方法二:

(1)新建工作文件:

file/new/workfile

(2)将paneldata.xls读入到Eviews中。

Proc\Import\ReadText-Lotus-Excel

(3)修改数据格式

Proc\Structure\ResizeCurrentPage,或双击"Range:

"

174

 

2.模型形式选择

估计个体FE变截距模型

DependentVariable:

CONS

Method:

PanelLeastSquares

Date:

03/24/10Time:

23:

40

Sample(adjusted):

19951999

Cross-sectionsincluded:

29

Totalpanel(unbalanced)observations:

142

Variable

Coefficient

Std.Error

t-Statistic

Prob.  

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > PPT模板 > 商务科技

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1