Tobit模型估计方法与应用二.docx

上传人:b****7 文档编号:9896020 上传时间:2023-02-07 格式:DOCX 页数:18 大小:52.58KB
下载 相关 举报
Tobit模型估计方法与应用二.docx_第1页
第1页 / 共18页
Tobit模型估计方法与应用二.docx_第2页
第2页 / 共18页
Tobit模型估计方法与应用二.docx_第3页
第3页 / 共18页
Tobit模型估计方法与应用二.docx_第4页
第4页 / 共18页
Tobit模型估计方法与应用二.docx_第5页
第5页 / 共18页
点击查看更多>>
下载资源
资源描述

Tobit模型估计方法与应用二.docx

《Tobit模型估计方法与应用二.docx》由会员分享,可在线阅读,更多相关《Tobit模型估计方法与应用二.docx(18页珍藏版)》请在冰豆网上搜索。

Tobit模型估计方法与应用二.docx

Tobit模型估计方法与应用二

Tobit模型估计方法与应用

(二)

周华林李雪松

2012-10-2510:

12:

04来源:

《经济学动态》(京)2012年5期第105〜119页

三、Tobit模型的估计I:

非联立方程模型

1.Tobit模型的MLE1974年之前的文献对Tobit模型的估计都是采用了MLE这种方法的特点是估计过程比较复杂,计算相当繁琐,而且需要选择一个合理的初始值,但是用这种方法估计出来的结果具有较好的性质,估计值的有效

性较好。

Tobin(1958)采用MLE并给出选择初始值的方法,Heckman(1974将Tobit模型扩展成联立(simultaneous)系统方程,沿袭了Tobin(1958)及Gronau(1974)的MLE

Tobin(1958)关注了被解释变量有下限、上限或者存在极限值这类问题的研究,后来人们把具有这种特征的问题研究的模型称为Tobit模型。

Tobin认为受

限因变量的重点主要有两个方面,一是受限因变量和别的变量之间的关系,另一是这种关系的假设检验问题。

在这样的问题的研究中,解释变量不仅影响受限变量的概率,也影响非受限因变量的规模大小。

对于这类问题,如果不考虑非受限因变量的解释,而是只考虑受限因变量或是非受限因变量的概率问题,那么Probit分析就能提供一个合适的统计模型;如果不关注观测值的限制性,只是要解释某些变量,多元回归分析也是一种合适的统计技术。

不过,当因变量的信

息是有用的时候,丢失这些信息显然会使得研究丧失效率。

Tobin以不同家庭的

不同行为选择问题为例,建立了如下受限因变量模型。

假设W是受限因变量,具有下限L:

Y=p0+plX1+(JA十・・+2L[LY-€

Iy-lyyml

相应的概率分布函数为*

L

Y-L

1

aIaJ

其中Z&)足标准正态密度函数&何是标准iF态分布函数。

对该模型Tobin提出用MLE估计似然

函数•并用牛顿调七祇附)迭代法求解似然函数最大值时的欧拉方程.得到受限因变厳模型的估计值口过程如下。

设(御理n…畑闾是(皿*肛*虹严r色~,L)

(TCTCTCTCT

的估计值'咋Yg时$x23…+aJC""g时曲加掠(討…+崇曲•样本的似然函数是;

{>1i-i

小tlQQJ瑯诅】厂邮)

jH]j91

对似然函数取对数;

]时=£lnQ(I\^W,J+rina-~Ln2ir-

i■12

t

4"》Z(1厂即

j-i

一阶条件:

Ofk=Ot1>2/,Jtm

根据一阶条件公式,带入初始值运用牛顿迭代法计算,这就是著名的“得分法”,迭代直到△a的值的变化非常小时,得到的估计值就是受限因变量模型的估计值。

Tobin选择的初始值是函数-Z(x)/Q(x)的线性近似值,也可以说是InQ(x)的二次方程的近似值。

为了研究这类模型的特点,Tobin用1952年和1953年的

数据对耐用品的支出问题进行了分析,目的是探求耐用品支出与年龄及流动性资产持有之间的关系。

Hfrckman(1974)分析了女性是否选择工作「匸作时间檢豹、工资率的问题二通过允许不同的参数彫响女性选择工作的槪率、工作时间的方迭.Heckman

将Tchi叩95$)模型拓展成联立方程系统。

在T个已

婿妇女中有K个女性选择工作亠K个人不工作吋t

所有t个样本的概率似然函数为L=r["(hi+TO)'

iKI

(评这一模型与Tcbif!

型的不同之处在于:

①似然函数中已婚妇女工资函数”・}是多变凰正态概率密度函数.Tobin型中是单变凰概率密度函数*②参数乩只出现任工资函数n(hJ(W))中*没出现在巴婚妇女不王作的选择方程中。

H^kman假设选择方程与工资方程的谋差项都服从正态分布且具有相关性,当T=K时该模型可以用FIML估计,当K

2.Tobit模型的Heckmar两步法估计。

1974年以后对Tobit模型的估计方法不再以MLE为核心进行突破,而是对

Heckmar两步法不断扩充和改进,主要是因为Heckman两步法计算比较简单,而

且估计的结果是一致的,也无须考虑初值的问题。

但是两步法的估计效率不如MLE且这种估计方法要求两个方程的解释变量不能完全相同。

Heckman(1976)

介绍了两步法的推导过程,并证明了两步法的估计性质,以及应用两步法需要注意的问题。

Amemiya(1974)将Tobit模型扩展到多变量模型,推导了模型估计方法。

Heckman(1976对样本选择、截断、受限因变量等统计模型做了一个概括性的分析,扩展了Gronau(1974)和Lewis(1974)等的研究成果,证明了文中所提到的估计方法的应用环境、估计值的性质等。

Heckman指出审查(censored)数据模

型和截断(truncated)的区别在于截断数据不能使用有用的数据估计有完整数据的观测值的概率,但是审查数据可以。

受限因变量模型需要考虑选择性偏差的影响,样本选择性偏差问题的研究最初起源于Gronau(1974)和Lewis(1974)关于工

资选择偏差问题的研究,把未出现在工资方程中的额外的变量引起的工资率的变化称为选择性偏差。

如劳动工资方程中,婚姻状态、小孩数量等虽然不是工资率的直接解释变量,但这些因素影响了工作选择的决定,因而通过限制性条件的方式对受限变量产生了选择性偏差。

在实证部分Heckman用美国33-44岁女性的纵向(longitudinal)调查数据研究了女性工资率及工作时间的问题。

基本模型是2丫申弘呱Y沪心盼U和假设:

E(UA6E(U糾卜°:

[;:

*代当样本数据是

10j,j=1,2;i1

完整的样本数据时正(Y“IX4XhBE比…丄当研究所用的数据只是满足某些条件的部分数据时.EfYJXn样本选择规则)mX心+E(Uj样本选择规则)。

如果这两个方程的变韋是受限因变量,比如满足

YeOlit,可以观察到Yx否则YL取值(b两个方程

渓差项的均值为:

E(U“IY4>E(UdUAX畢卜盘旷入

E{UdY矗0)我(山Uq-X沖A简矿人其中"〒豔沖―严陽{和F分别是标

1-F(取)(如⑷

准正态分布的概率密度和分布函数入称为逆斤尔

斯比*它满足这样的性质:

JimKi=d

山体现了选择性偏差的大小。

所以基本模型可以写为:

丫拌草汁魯*入汁Vk•Y^X血+羞茁■心%该模型的协方羞结构为:

E(V吋r虱1+牡人-乂),

E(Vi(V=n11(1+ipjX;-X3J»E(V2iJ»(1-p^+p^l+*pA*"

k'J+其中p—-_矿*0W1+tp入厂疋W1口

(6Qn)

对这样的模型,如果知道爪%那么对受限因变鈕模型的估计就比较容易了.Heckman推荐了两步法估计该系统方程模型z第一步,估计选择方稗,

在审杳模型中可卜算滿足条件的可观测值的比率,

设为d,则Probit模熨的似然函数1申口[巩4)]心)

・土t

[i-F((pjrf可以得到入g的值;第二步将入带入基本模型中,用WLS法或GLS法誠者OLS法估计受限因变量模型。

a22的计算方法有两种,一是在上述笫二步估计中,对Y尹X妙+(°备’h汁仇进行冋1H■得到

(吃)

”耳的估计虽*二是将上述第二步中第二个方程写为YMs方(-4+2+V』,通过解二次方程+V品今壓二"得到孔的估汁就©

;■l(UtpArVi)

Heckniuti指出,对%+%不施

(ff22)r

加约束条件进行估计的结杲很可能是不准确的•因为入及其估计值是以回归因子X.的非线性函数的形式出现在方程中,且半和X具右正相关性,容易导致模型估计出现共线性的问题,所以得到合理的估计值需要强加一些约束条件。

上述怙计方法中,是用入的估计值代替真实值参与佔计的.所以这种估计方法对小样本不适用二这种方法估计的结果满足渐进性,但该方法的估计效率不如MLE;不过,由于这种估计方法计算简便,因而在此后的研究中,该方法作为估计"hit模型的基本方法加以发展和推广。

Amemiya(1974)#截断(truncated)因变量的单方程回归模型扩展到多变量

方程模型和联立方程模型,提出了一个简单的可计算的一致估计法。

对这类模型

的研究主要集中于三个方面:

一是参数值及协方差的估计;二是考虑估计值的一

致性及有效性;三是渐进分布的推导用于对估计值进行假设检验。

对于多变量回归方程模型,假设n维随机变量:

*t=i2…/r

」A^+叫ifRHS>0

11()otherwise

Amemiya为了解决上述三个核心问题,对多变量回归模型作了如下假设:

假设1:

参数空间是紧致的并且是一个具有真实值的开邻域。

假设2亠有界,定义经验分布函数G仅冃/T收敛于分布函数GJ是点数g…的小于或者等于只的个数。

T

假设3山讷正定门

J快1tn1

设S|是在t时虹严叫>0的集合,乞是£集合中整数为11,2,…,T}的元素,则多变量截断回归模型的似然函数为:

nu-

 

 

其中川‘是A的第i行。

由于对数似然函数logL的二阶矩很长,除耶对参数施加一些简化的约束条件,否则,单变量截断模型的极大似然估计中

所用的迭代方法(NewLon-RaplwnjM多变量截断模型不再适用。

多变量截断正态随机变量的一阶、二阶矩之间的关系满足下面的定理:

定理1I设科二(州",…tWj*的概率分布为叫…咖坯心,其中f是“维正态

0elsewhere

3|

LEw.iv二1i-ajcfEwI(/是£_1的第i行口

多变量截断模型的选择方程可写为:

亠畑-吉~右卅人零丫庐尬八皂5.其中由尼£"的第i个对角JL,^(^)=0(5该选择方程可简写为:

此二亦加teSuA中•兔=[「丹(九讣附…*力讪叮口忙…厂恥*

页眉内容

行OLS.S样得到的估计值记为把办作为吒的工具变量,记为■则简化式方程的估计值为无二{X茁旷工A工】是对125准一定范围内求和。

11

Amemiy^对简化式的估计值增补了一个假设和定理:

假设4:

lp]imJ^X监叫非奇异P是%中元7-*®111

素的个数。

定理厶在满足假设1一暇设4时纟估计值&是&的一致估计值®

Amemiya指出要满足假设4审对毎个yj,关于儿及心的髙阶顼进行回归得到的回归值丹作为IV.求解&及概率密度和概率分布函数恥氐耳;其中F妁表示概率密度中除掉第q个变量时t剩下的nJ个变量的概率分布函数・&尸-&舌;多变量截断模塑中连续变量方程的A及工估计可对九二(/仏+*

4

4eSi回归。

町-1

这样的方法得到的估计值是一致估计,但是为了检验对A的元素的假设,必须首先知道估计值的渐进分布.Amemiya介绍了两种方法解决这个问题L是用如上步骤A和£的一致估计值作为MLE中Newlon-Raphson迭代的初始值,冉用Heckman两步法估计模型;一是将如上步骤得到的A和工插人到连续变量方程中,再直接对九关于絢和n个变量#*\,q=l,2,・・・,口冋归。

四、Tobit模型的估计U:

联立方程模型

联立方程Tobit模型估计方法与非联立Tobit模型有较大的区别。

这种模型估计涉及到两个问题,一是如何判断所建立的方程是否是联立方程的问题。

Lee(1978)明确提出了检验的方法。

二是如何估计模型的问题,以往研究文献提出了不同的估计方法,总体上来说这些估计方法都是将联立方程估计方法与Heckmar两步法估计方法结合的结果,但是各文献中具体估计方法之间是存在差异的。

Amemiya(1978)建立了多变量联立方程模型,模型基本结构如下:

j"

¥』》丫跖+0农杓ifRHS>°

:

“0ifRHS^O

方邃矩阵服从n绒名变员正态分布叫(Ml)、该模型的结构式形式可表示为:

儿孩口“yt^o

(Ty訴二訴ify<>0

与以往的受限因变量联立方程模型不同,Amemiya的模型中考虑了只有部分因变量受限的联立方程模型的估计方法、估计性质以及识别条件的问题。

Amemiyaf旨出要识别结构式模型,需要作如下几点假设:

假设5:

r的每个主子式最小值是正的。

假设6吗满足假设IT3设4中

假设7(识别条件):

设g足每个截面:

的科系数值非零的个数尽是弘的系数值不为0的个数,则有电K・K^niD

Amemiya建议将结构式模型写成:

ifRHS>0,如果该模型満足假设銀则按照多変屍截断模型的估计方法估iX这样得到的估计值是一致估计值,当K-K^n;时可以得至lj唯一解亡Amemiya指出这样的估计过程虽然实现了可计算的问题川I是弱点在于估计值可能是无效的個为要求内生变量都足正值*旦这样的观测值很少时,估计值就会存在这样的问题:

,肖K-Kpm时■在计算选择方程时,可將按照这种程序得到的一致估讣值作为MLE迭代的初始值进行佔计°Amerniya指出除非有一些对参数的简化的约束条件,否则用这样的方式估计计算过程是不切实輻的,计算非常闲难。

Amemiya(1979)认为FMLE完全极大似然法)求解Tobit模型太耗成本而且估计结果往往是最不可行的。

Amemiya提出了求解联立方程Tobit模型的一致性估计值的广义最小二乘法(GLS)方法。

作者在文中主要比较了普通最小二乘值、Nelson&Olson(1977)估计值、广义最小二乘估计值、Heckmar估计值等几种估

计值的方法以及估计值的效率的问题。

Nelson&Olson(1977)的联立方程模型的基本结构如下:

yii=7iyVP\^n+jitr

y\ifyAO

0otheru'ise

该联龙方程的简化式方程可表示为:

y2=xn2+v2

其中X是所有的外生解释变址心八』的方差和协方黑分别是a^

项满足宀产踩巾+昭解结构式方親中的需要求解g

的参数为心(価)0(A(卅帛加

Ameniiya利用先计算简化武方程”再计算结构式方程的方式,比较了OLS估计值(&Z/GLS估if(li(a1:

i!

ia*2)vNelson&01沏】估计值(&】危d、He:

ck-m妙估卄值&点加估计结果的有效性比较表明:

(aCL»aci)tt(a15a^Si渐进有效;估计值(ot\■otL(有时比(几如更有效,有时不如有效■这两组值的比较主要依赖于参数值的真实性程度H占计值恳士比阳估计值更有效律估计结果的计算虽比较表明:

算c6叱站Gi的困难大得多,但是估计值更可行

些.相对来说卄算砧比仏要因难一些池2的计

比収2的计算扯大得多事

算要简单一些卡但是如果更注重有效性,则需要计

当审查或者截断的两方程模型含有内生变量时,这种模型就具备了一般联立方程模型的特征,文中计算估计值以及渐进方差、协方差很直接,但是渐进方差、协方差的计算难度随着方程个数的增加而增加。

对于联立方程Tobit模型,先计

算简化式再计算结构式得到的参数估计值,比间接最小二乘估计法得到的估计值

更有效。

Lee(1976)主要关注了受限因变量模型的两阶段估计的问题,论文主要围绕着两个问题展开分析:

一是寻找一致的初始估计值的问题;另一个问题是寻找估计模型的更简单一些的估计方法。

Lee提出用工具变量法估计模型,用全部样本代替子样本估计模型,这个方法在简单的受限因变量模型中一方面可以获得好的一致的初始值,计算也比较简单,但是如果是复杂模型,该方法的计算量将非常大。

包含内生变量的迭代模型与非市场均衡模型是转换回归模型的一种,Lee建

议对后四种模型采用两阶段估计法。

具有联立结构的转换回归模型假定转换取决于潜在条件:

可以实现样本分割。

因变量是截断数据的多变量联立方程模型的估计方法,与Amemiya(1974)的间接最小二乘估计法不同,对每种类型模型采用两阶段最小二乘法进行估计,计算比较方便,也容易解决模型的过度识别问题,模型的识别条件沿用了Amemiya(1974)中的结论。

Lee将这一方法用于分析工资率的问题,比较了两阶段最小二乘法与间接最小二乘法,发现用修正后的OLS古计

简化式方程的两阶段最小二乘法得到的估计值,比较恰当地反映了各影响因素对

受限因变量的作用。

Lee(1978)研究了受限变量模型估计在住房需求中的应用问题,这篇文章的主要目的有两个:

一是推荐一个获得某类受限变量模型的较好的初始估计值的方法,另一个是证明这种模型和估计技术如何被用于研究住房需求问题。

Lee(1978)给出了求解一般的受限因变量模型:

Y庐X皿卄轨,ifZ/ym弗YpX品j+%if出3的方法。

模型假设咽)样本可以分撤即存在立邙孑氐或者砧<殆⑵总『%、时UDN(O,

“芒认为如果可以提供样

本分割信息,对这种模型的估计可以采用ML估计;如果没有样本份割信息,那么ML估计就受

到限制了。

这种模型的似然函数关于参数值是髙

度非线性的,所以最有效地应用MLJ1程就是开

始时就找一个好的初始估计值。

Lee介绍了估计这

种模MP9芮种h'送,一种是Heckman两阶段法*第

•阶段按照Heckman两步法得出模型的一致怙

计量*第一步先用Mh扶怙计离散选择模型,第

二步利用OLS法估计连续变凰模型;另一种是两

步极大似然法(2SML),第一步先用OLS法估计非样本选择模型.样本选择模型,根据这些残差项的关系计算旳’并分别计算两个非样本选择模型的极尢似然'值,第二步利用Ngwton-R吕ph呂on迭代法,用ML估计参数值典,这样得到的估计值是有效的勺

在实证部分,Lee(1978)将需求面的参与主体分成租房者和买房者两大类,分析中低收入者住房需求问题。

政府对公共住房的政策分两个方面,公共住房及

FHA补贴的贷款是对供给面的调控,住房补贴及转移支付是对需求面调控。

中低收入者住房需求问题的分析要研究的实际上是两个问题,第一个问题是购买或是

租住的选择问题,第二个问题是支出多少的问题,对这类问题分析的关键在于确定模型是联立方程还是非联立方程,并选择恰当的估计方法。

Lee(1978)用购房

族、

、家庭背景

、家庭持久收入、

支出量、租房支出量、选择买房还是租房作为因变量,以家庭支柱者(年龄、种距离中心城区的距离)、房屋的相对价格作为解释变量。

Lee(1978)指出检验模型是否是联立方程的统计量是似然比率

-弘(韻”迅(P)丄他)是对选择方程用Pmbit模型中的ML和支出方程用CIS估计得到的似然值,L(讪是用2SML法估计出来的似然比值卫是解释变蜃个数“

Lee(1978)认为在一般情况下,受限因变量使用Heckman两步法在一般情况下可以得到一致估计量,在这个估计量的基础上,得到的两步法极大似然估计(2SML)值是渐进有效的。

买方或者租房的问题不同于以往样本选择模型,因为要

考虑模型是否存在联立性的问题。

理论证明和实践结果都表明,2SML法在标准

误以及解释波动方面的效果很好,经验结论与经济理论也很吻合。

Lee(1979)介绍了具有离散和连续内生变量的一般联立方程的统计模型,这种模型可以被看成是转换联立方程模型的新形式,建议使用一些简单的二阶段方法估计模型,并证明了这些估计值的一致性问题。

Lee(1979)的联立方程不同于Tobin(1958)、Heckman(1974)、Nelson(1976)的受限因变量模型,主要区别在于Lee(1979)的方程中考虑了选择方程中含有内生变量的情况。

模型基本结构为:

YjjsXitPi+BiifZt^y+Y

丫庐乂出卄£方If乙十+¥血+丫必<^

该系统方程中的误差项序列相互独立,具有0均值和协方差矩阵刀

该系统方程模型的转换模型为:

心+卧if乙斗+丫“磚+Y」牟孑心

cto-a

YE4坤if乙古+丫季L+兀怜畑

其中r£6二厶(VL&吋滋M,O*^EW厂加L®齐

两阶段极大似然法〔2SML)估计方法的步骤是:

第一阶段先利用修正的最小二乘法估计,第二阶段利用Pwbit血估计(如果召包括外生变量汕此的所有变量,则联立方程不可识别)□

2SML过程如下□选择函数的简化式可写成Probil模型的形式:

为了将选择方程XxXh中包含的zt的外生变量从乙中排除•定义只产弘眄很效司乙矶川尸(Pm*3u)»P2=(P®»P?

l)o

该问题的联立方程可表示为:

YI严乙內卄W0|计占h

Y产邙"W屈汁阳

「产出右+*0加*陶+肌卄寻

令什ZQ计WQ”其中妇+%+鸟Be

(T(T(T

£产0畫Q

时步4糾呎彳糾%

'(糾心糾晓

Var(亦俘阳$fff2.-(矢f必-2(仝|

第一步•先对选择方程聪bit模型I:

对7眄逬行MLE估计,估计系数GG,根据估计值计算“忖卡仲卜带入联立方程中的两个连续变就方程中'再对连续变扯方程进行OLS回归,估计系数际际6吋。

知j

第二步■将0存册带人Probit选择方程r之(斗)+cr鴻啓)+X血*)-乱中,其中氐服从渐进标准正态分布*对r关于变最ZNBjgB?

进行MLE怙计用计系数斗季隈据估计值计算叭A

F(机)•带人联立方程中的两个连续变竄方程中.再对

连续变盘方程进行OLS回归,估计系数

2SML得到的估计值是一致的,协方差矩阵刀也可通过方程之间的关系式估计出来。

Lee(1999)分析了动态Tobit模型、具有自回归条件异方差(ARCH或者广义条件异方差(GARCH的扰动项的Tobit模型在时间序列中的仿真(simulation)估计问题。

激励Lee研究这类问题的经济活动,如政府对商品、金融股票、外币市场的干预活动,防止价格跌得低于某个水平,或者涨得高于某个水平,变量的动态行为也可能受限。

对这类模型的估计,Lerman&Manski(1981)建议使用仿真(simulation)极大似然估计(SML),McFadden(1989)建议使用仿真矩估计法(MSM)Hajivassiliou&McFadden(1990)建议用仿真得分法(simulationscores)、Gourieroux&Monfort(1993)建议采用仿真伪极大似然法(pseudo-maximumlikelihood),

基本模型如下;

y^maxIy\•cj订:

=如侃“■y\i山)+&J(y:

3珀=1*

I(y*i

Tobit衣RCH(p偻型;

(创缶小%"…・&』=

i■I

TobitCARC»(p,q)^型:

¥航$幌小代£吟甘屮£叫】*

>>ik-1

TobitARCH或GARCH模型的估计的困难之处在于,在审奁时,无法计算审査观测值的残差。

避免这种闲难»Calzolari&Fiorentini(I996)用过去的M期的条件期望值

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 高中教育 > 高考

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1