STATA面板数据模型操作命令剖析.docx

上传人:b****8 文档编号:27665895 上传时间:2023-07-03 格式:DOCX 页数:25 大小:870.51KB
下载 相关 举报
STATA面板数据模型操作命令剖析.docx_第1页
第1页 / 共25页
STATA面板数据模型操作命令剖析.docx_第2页
第2页 / 共25页
STATA面板数据模型操作命令剖析.docx_第3页
第3页 / 共25页
STATA面板数据模型操作命令剖析.docx_第4页
第4页 / 共25页
STATA面板数据模型操作命令剖析.docx_第5页
第5页 / 共25页
点击查看更多>>
下载资源
资源描述

STATA面板数据模型操作命令剖析.docx

《STATA面板数据模型操作命令剖析.docx》由会员分享,可在线阅读,更多相关《STATA面板数据模型操作命令剖析.docx(25页珍藏版)》请在冰豆网上搜索。

STATA面板数据模型操作命令剖析.docx

STATA面板数据模型操作命令剖析

STATA 面板数据模型估计命令一览表

 

一、静态面板数据的 STATA 处理命令

yit = α i + xit

β + ε it

固定效应模型

yit = xit

β + μit

μit = α it + ε

it

随机效应模型

(一)数据处理

输入数据

●tsset code year该命令是将数据定义为“面板”形式

●xtdes该命令是了解面板数据结构

 

●summarize sq cpi unem g se5 ln各变量的描述性统计(统计分析)

 

●gen lag_y=L.y ///////产生一个滞后一期的新变量

gen F_y=F.y ///////产生一个超前项的新变量

gen D_y=D.y ///////产生一个一阶差分的新变量

gen D2_y=D2.y ///////产生一个二阶差分的新变量

 

(二)模型的筛选和检验

 

●1、检验个体效应(混合效应还是固定效应)(原假设:

使用 OLS 混合模型)

●xtreg sq cpi unem g se5 ln,fe

 

对于固定效应模型而言,回归结果中最后一行汇报的 F 统计量便在于检验

所有的个体效应整体上显著。

在我们这个例子中发现 F 统计量的概率为

0.0000,检验结果表明固定效应模型优于混合 OLS 模型。

 

●2、检验时间效应(混合效应还是随机效应)(检验方法:

LM 统计量)

(原假设:

使用 OLS 混合模型)

●qui xtreg sq cpi unem g se5 ln,re(加上“qui”之后第一幅图将不会呈现)

xttest0

 

可以看出,LM 检验得到的 P 值为 0.0000,表明随机效应非常显著。

可见,

随机效应模型也优于混合 OLS 模型。

 

●3、检验固定效应模型 or 随机效应模型 (检验方法:

Hausman 检验)

原假设:

使用随机效应模型(个体效应与解释变量无关)

通过上面分析,可以发现当模型加入了个体效应的时候,将显著优于截距

项为常数假设条件下的混合 OLS 模型。

但是无法明确区分 FE or RE 的优劣,这

需要进行接下来的检验,如下:

Step1:

估计固定效应模型,存储估计结果

Step2:

估计随机效应模型,存储估计结果

Step3:

进行 Hausman 检验

●qui xtreg sq cpi unem g se5 ln,fe

est store fe

qui xtreg sq cpi unem g se5 ln,re

est store re

hausman fe(或者更优的是 hausman fe,sigmamore/ sigmaless)

 

可以看出,hausman 检验的 P 值为 0.0000,拒绝了原假设,认为随机效应

模型的基本假设得不到满足。

此时,需要采用工具变量法和是使用固定效应模

型。

(三)静态面板数据模型估计

 

●1、固定效应模型估计

●xtreg sq cpi unem g se5 ln,fe(如下图所示)

 

其中选项 fe 表明我们采用的是固定效应模型,表头部分的前两行呈现了模

型的估计方法、界面变量的名称(id)、以及估计中使用的样本数目和个体的数

目。

第 3 行到第 5 行列示了模型的拟合优度、分为组内、组间和样本总体三个

层面,通常情况下,关注的是组内(within),第 6 行和第 7 行分别列示了针对

模型中所有非常数变量执行联合检验得到的 F 统计量和相应的 P 值,可以看出,

参数整体上相当显著。

需要注意的是,表中最后一行列示了检验固定效应是否显著的 F 统计量和

相应的 P 值。

显然,本例中固定效应非常显著。

●2、随机效应模型估计

若假设本例的样本是从一个很大的母体中随机抽取的,且α i 与解释变量均

不相关,则我们可以将α i 视为随机干扰项的一部分。

此时,设定随机效应模型

更为合适。

●xtreg sq cpi unem g se5 ln,re(如下图所示)

 

●3、时间固定效应(以上分析主要针对的是个体效应)

如果希望进一步在上述模型中加入时间效应,可以采用时间虚拟变量来实现。

首先,我们需要定义一下 T-1 个时间虚拟变量。

●tab year ,gen(dumt)

(tab 命令用于列示变量 year 的组类别,选项 gen(dumt)用于生产一个以 dumt 开头的年度虚拟变量)

drop dumt1(作用在于去掉第一个虚拟变量以避免完全共线性)

 

若在固定效应模型中加入时间虚拟变量,则估计模型的命令为:

●xtreg sq cpi unem g se5 ln dumt*,fe

 

(四)异方差和自相关检验

 

●1、异方差检验 (组间异方差)本节主要针对的是固定效应模型进行处理

(1)检验

原假设:

同方差需要检验模型中是否存在组间异方差,需要使用 xttest3 命令。

 

●qui xtreg sq cpi unem g se5 ln,fe

xttest3

显然,原假设被拒绝。

此时,需要进一步以获得参数的 GLS 估计量,命令为

xtgls:

●xtgls sq cpi unem g se5 ln,panels(heteroskedastic)

 

其中,组间异方差通过 panels()选项来设定。

上述结果是采用两步获得,

即,先采用 OLS 估计不考虑异方差的模型,进而利用其残差计算。

,并最终得

到 FGLS 估计量。

●2、序列相关检验

对于 T 较大的面板而言,α i 往往无法完全反映时序相关性,此时ε it 便可

能存在序列相关,在多数情况下被设定为 AR

(1)过程。

原假设:

序列不存在相关性。

(1) FE 模型的序列相关检验

对于固定效应模型,可以采用 Wooldridge 检验法,命令为 xtserial:

●xtserial sq cpi unem g se5 ln

 

可以发现,这里的 P=0.0000,我们可以在 1%的显著性水平下爱拒绝不存在序列

相关的原假设。

考虑到样本,该检验的最后一步是用

~

eit

~

ei,t-1

进行 OLS 回归,

因此,输入以下命令得到

~

θ

= 0.8858 。

检验该值是否显著异于-0.5,因为在原

假设下(不相关)

 

相关。

●mat list e(b)

~

θ

= -0.5 ,可见本例中不相等,拒绝原假设,说明存在序列

 

(2) RE 模型的序列相关检验

对于 RE 模型,可以采用 xttest1 命令来执行检验:

●qui xtreg sq cpi unem g se5 ln dumt*,re

xttest1

 

这里汇报了 4 个统计量,分别用于检验 RE 模型中随机效应(单尾和双尾)、

序列相关以及二者的联合显著性,检验结果表明存在随机效应和序列相关,而

且对随机效应和序列相关的联合检验也非常显著。

(3) 稳健型估计

上述结果表明,无论是 FE 还是 RE 模型,干扰项中都存在显著的序列相关。

为此,我们进一步采用 xtregar 命令来估计模型,首先考虑固定效应模型:

●xtregar sq cpi unem g se5 ln dumt*,fe lbi

 

●3、“异方差—序列相关”稳健型标准误

虽然上述估计方法在估计方差-协方差矩阵时考虑了异方差和序列相关的影

响,但都未将两者联立在一起考虑,要获得“异方差-序列相关”稳健型标准误,

只需在 xtreg 命令中附加 vce(robust)或者 vce(cluster)选项即可。

例如,对

于 FE 模型,我们可以执行如下命令:

●xtreg sq cpi unem g se5 ln,fe vce(robust)

 

与之前未经处理的估计结果相比,附加命令 vce(robust)选项时的结果,

虽然系数的估计值未发生变化,但此时得到的标准误明显增大了,致使得到的

估计结果更加保守。

对于面板数据模型而言,STATA 在计算所谓的“robust”

标准误时,是以个体为单位调整标准误的。

因此,我们得到的“robust”标准

误其实是同时调整了异方差和序列相关后的标准误。

换言之,上述结果与设定

vce(cluster)选项的结果完全相同。

●4、截面相关检验原假设:

截面之间不存在着相关性

(1)FE 模型检验

对于 FE 模型,可以利用 xttest2 命令来检验截面相关性:

●qui xtreg sq cpi unem g se5 ln,fe

xttest2(该命令主要针对的是大 T 小 N 类型的面板数据,在本例中无法使用,故图标略去。

(2)RE 模型检验

对于 RE 模型,可以利用 xtcsd 命令来检验截面相关性:

●qui xtreg sq cpi unem g se5 ln,re

xtcsd,pesaran(下面命令是另一个检验指标)

xtcsd,frees

 

可以看出,两种不同的检验方法均显示面板数据存在着截面相关性。

●5、“异方差—序列相关—截面相关”稳健型标准误

(1)FE 模型估计

对于 FE 模型,在确认上述存在着截面相关的情况下,我们可以采用

Hoechle(2007)编写的 xtscc 命令获取 DriscollandKraay(1998)提出的“异

方差—序列相关—截面相关”稳健型标准误:

●xtscc sq cpi unem g se5 ln,fe

 

这里,xtscc 命令会自动选择的滞后阶数为 2,系数估计值和 Within-R2

与 xtreg,fe 的结果完全相同,但标准误存在着较大差异。

可见,在本例中,截

面相关对统计推断有较大的影响。

若读者有跟高的方法来确定自相关的滞后阶数,则可以通过 lag( )选项设

定。

当然,在多数情况下,这很难做到。

不过我们可以通过附加 lag(0)来估计

仅考虑异方差和截面相关的稳健型标准误,命令如下:

●xtscc sq cpi unem g se5 ln,fe lag(0)

 

(2)RE 模型估计(略,待补充)

二、动态面板数据的 STATA 处理命令

 

(一)差分 GMM

xtabond lnwi cd lngdp land doc fir lnroad lnpop fina

xtabond lnwi cd lngdp land doc fir lnroad lnpop fina,lag

(2) twostep

(二)系统 GMM

xtdpdsys lnwi cd lngdp land doc fir lnroad lnpop fina

xtdpdsys lnwi cd lngdp land doc fir lnroad lnpop fina, twostep

(三)内生性检验

●estat sargan

(四)序列相关检验

●estat abond

三、门槛(门限回归)面板模型的 STATA 处理命令

xtthres y, thres(q) dthres(x) bs1(30) bs2(30) bs3(20)

各个门槛的置信区间图:

xttr_graph第一轮搜索第一个门槛

xttr_graph,m(22)第二轮搜索第二个门槛

xttr_graph,m(21)第二轮搜索第一个门槛

xttr_graph,m(3)

呈现估计结果:

local q1=e(rhat21)取出门槛值

local q2=e(rhat22)

gen d1=(q<=’q1’)生成虚拟变量

gen d2=(q>’q2’)

gen xd1=x*d1

gen xd2=x*d2

xtreg y x xd1 xd2,fe常规标准误

est store fe

xtreg y x xd1 xd2,fe robust稳健型估计

est store fe_ robust

local m”fe fe_ robust”

esttab ‘m’,mtitle(‘m’) nogap s(r2 r2_w N F)///star(*0.1 **0.05 ***0.01)

1.检验:

是否存在门槛效应

混合面板:

reg is lfr lfr2hc openpsratpgr,vce(cluster sf)

 

固定效应、随机效应模型

xtreg is lfr lfr2hc openpsratpgr,fe

est store fe

xtreg is lfr lfr2hc openpsratpgr,re

est store re

hausman fe

 

两步系统 GMM 模型

xtdpdsys rlt plf1 nai efd op ewig ,lags

(1) maxldep

(2) twostepartests

(2)

注:

rlt 为被解释变量,“plf1 nai efd op ewig”为解释变量和控制变量;

maxldep

(2)表示使用被解释变量的两个滞后值为工具变量;pre()表示以某一

个变量为前定解释变量;endogenous()表示以某一个变量为内生解释变量。

 

自相关检验:

estat abond

萨甘检验:

estat sargan

 

差分 GMM 模型

Xtabond rlt plf1 nai efd op ewig ,lags

(1)twostepartests

(2)

 

内生:

该解释变量的取值是(一定程度上)由模型决定的。

内生变量将违背解释变量与误

差项不相关的经典假设,因而内生性问题是计量模型的大敌,可能造成系数估计值的非一

致性和偏误;

外生:

该解释变量的取值是(完全)由模型以外的因素决定的。

外生解释变量与误差项完

全无关,不论是当期,还是滞后期。

前定:

该解释变量的取值与当期误差项无关,但可能与滞后期误差项相关。

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 工程科技 > 交通运输

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1