ImageVerifierCode 换一换
格式:DOCX , 页数:17 ,大小:67.83KB ,
资源ID:12191719      下载积分:3 金币
快捷下载
登录下载
邮箱/手机:
温馨提示:
快捷下载时,用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)。 如填写123,账号就是123,密码也是123。
特别说明:
请自助下载,系统不会自动发送文件的哦; 如果您已付费,想二次下载,请登录后访问:我的下载记录
支付方式: 支付宝    微信支付   
验证码:   换一换

加入VIP,免费下载
 

温馨提示:由于个人手机设置不同,如果发现不能下载,请复制以下地址【https://www.bdocx.com/down/12191719.html】到电脑端继续下载(重复下载不扣费)。

已注册用户请登录:
账号:
密码:
验证码:   换一换
  忘记密码?
三方登录: 微信登录   QQ登录  

下载须知

1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。
2: 试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。
3: 文件的所有权益归上传用户所有。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 本站仅提供交流平台,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

版权提示 | 免责声明

本文(离散选择模型举例122.docx)为本站会员(b****5)主动上传,冰豆网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知冰豆网(发送邮件至service@bdocx.com或直接QQ联系客服),我们立即给予删除!

离散选择模型举例122.docx

1、离散选择模型举例122一二元离散选择模型1二元响应模型 (Binary response model) 我们往往关心响应概率y 1x yx G 0 1x1 . k xk G z ,其中 x 表示各种影响因素(各种解释变量,包括虚拟变量) 。根据不同的函数形 式可以分为下面三类模型:线性概率模型( Linear probability model , LPM)、对 数单位模型( logit )、概率单位模型 (probit):三种模型估计的系数大约有以下的关系:2偏效应(1)如果解释变量是一个连续型变量,那么他对 p(x)=p(y=1|x) 的偏效应可以通过求下面的偏导数得出来: p x g 0

2、 x j,g z dG z ,偏效应的符xj dz号和该解释变量对应的系数的符号一致; 两个解释变量偏效应之比等于它们各自 的估计系数之比。(2)如果解释变量是一个离散性变量,则 xk 从ck 变化到 ck +1 时对概率的影响大小为:wald 检验、似然上面的其他解释变量的取值往往取其平均值。 3估计方法与约束检验 极大似然估计;三种常见的大样本检验:拉格朗日乘数检验、 比检验。4Stata 程序语法(以 Probit 为例)probit depvar indepvars weight if exp in range , level(#) nocoef noconstant robust c

3、luster(varname) score(newvar) asis offset(varname) maximize_options predict type newvarname if exp in range , statistic rules asif nooffset where statistic isp predicted probability of a positive outcome; the defaultxb linear predictionstdp standard error of the prediction具体的例子1数据:美国 1988年的 CPS数据 2模

4、型:估计成为工会成员的可能性,模型形式如下: 参加工会的概率 =F(潜在经验 potexp、经验的平方项 potexp2、受教育年限 grade、 婚否 married、工会化程度 high);解释变量 :Potexp=年龄 -受教育年限 -5; grade=完成的受教育年限;married: 1 表示婚, 0 未婚; high:1 表示高度工会化的行业,否则为 0。3估计的结果 3.1 probit union potexp potexp2 grade married highunionCoef.Std. Err.zPz95% Conf.Intervalpotexp.0835091.0156

5、0875.350.000.0529166.1141016potexp2-.0015308.0003179-4.820.000-.0021538-.0009078grade-.042078.0189089-2.230.026-.0791388-.0050171married.0622516.11258360.550.580-.1584083.2829115high.5612953.0996625.630.000.3659613.7566292cons-1.468412.2958112-4.960.000-2.048192-.88863323.2dprobit union potexp potex

6、p2 grade married high给出了 g?0 x ? ,如果要求偏效应还需要对其乘以估计的系数beta;uniondF/dxStd. Err.zPzx-bar 95% C.I. potexp.0226964.00415295.350.00018.884.014557. 030836potexp2-.000416.000085-4.820.000519.882 -.000583- .00025grade-.0114361.0051379-2.230.02613.014 -.021506 -.001366married*.0167881.03011370.550.580.641 -.0

7、42234 .07581high*.1470987.02470055.630.000.568 .098687 .195511obs. P.216pred. P.1904762(at x-bar)(*) dF/dx is for discrete change of dummy variable from 0 to 1 ,对离散变量。 此外,如果想针对某些解释变量的特定取值进行计算,可以用下面的语句: matrix myx= (8,64,10, 1,1)dprobit , at( myx)uniondF/dxStd. Err.zPzx 95%C.I. potexp.0261573.0044308

8、5.350.0008.017473.034841potexp2-.0004795.0000978-4.820.00064-.000671-.000288grade-.0131799.0065759-2.230.02610-.026068-.000291married*.0190706.03458370.550.5801-.048712.086853high*.1389514.02660335.630.0001.08681.191093obs. P .216pred. P .1904762 (at x-bar)pred. P .2433575 (at x)3.3 logit( 1) logist

9、ic union potexp potexp2 grade married high, coef (给出回归系数)等价于 logit union potexp potexp2 grade married highunionCoef.Std. Err.zPz95% Conf.Intervalpotexp.1474021.0280975.250.000.0923329.2024712potexp2-.0026869.0005654-4.750.000-.0037951-.0015787grade-.0703209.032142-2.190.029-.1333181-.0073236married.

10、115463.1967790.590.557-.2702167.5011427high.9801411.1800495.440.000.62725151.333031cons-2.581436.5186859-4.980.000-3.598041-1.564832)给出发生比率( odds ratio )logistic union potexp potexp2 grade married high等价于 logit union potexp potexp2 grade married high, orunionOddsRatioStd. Err.zPz95% Conf.Intervalpot

11、exp1.15882.03255945.250.0001.096731.224425potexp2.9973167.0005639-4.750.000.9962121.9984225grade.9320947.0299594-2.190.029.8751866.9927031married1.122393.22086330.590.557.76321411.650606high2.664832.47980055.440.0001.8724573.79252如果存在异方差,可采用稳健估计,在上面命令后面加上 robust其他命令:1 有序模型ologit , oprobit2 多重选择模型mlo

12、git, rrr 给出发生比率; 多重 probit 模型设计复杂计算, 目前尚无对应的命令。 3 工具变量如果在 probit 模型中有内生变量,就要采用工具变量方法予以克服, ivprob 命 令给出了结果。4 面板数据的离散选择模型xtlogit,xtprobit ,xttobitsas 相关过程: logistic ,logit,probit; 多重 logit 模型: proc catmod 三托宾模型( Tobit )和赫克曼修正模型 (Heckit)一. tobit 模型( censored model截取回归模型)实际上 tobit 模型是 probit 模型的推广,(tobi

13、t 意即 Tobin 的 probit);在严格 为正值的时候大致连续,但是有相当部分取值为 0。模型: y* 0 x u,u| x 0, 2 ,y max 0,y*隐变量 y* 满足经典的线性假定,服从具有线性条件均值的正态同方差分布。由于 y*正态分布,所以 y 在严格正值上连续分布2估计和检验极大似然估计,检验同上面的三种检验3偏效应我们估计出的系数y |x ,是隐变量(效用)的偏效应,而我们关 xj心的是对 y(工作时间)的偏效应yx p y 0x y y 0,x p(y 0|x)?0zzccc ,if z 0,11cyy0,xxuu x xxx/xxxccc称为逆米尔斯比率mills

14、 ratio )可能导致估计结果的 非一致 性。 从上面推导可以得出:yx x x x因此,当 y 服从一个 tobit 模型时,难以直接得出偏效应 (1)如果 xj 是一个连续变量,可以通过微分求出偏效应:过代入 , 的估计值,而且必须带入解释变量的有意义的值,一般用均值。yx p y 0x x j xjp y 0x x偏效应 p y 0xx j jxyx j xxjTobit 模型估计的结果并不能直接给出偏效应,但是估计系数的符号和偏效应 的符号是一致的, 而且统计显著性也一致。 如果要求具体的偏效应大小, 需要将 估计的参数值和解释变量的相应取值代入进行计算而得。Stata 程序语法to

15、bit depvar indepvar weightif exp in range,l1(#) u1(#)level(#) offset(varname) maximize_optionspredict type newvarname if exp in range,statistics nooffsetl1 表示左截断,那些小于 l1 的 y 值被截断;那些大于 u1 的 y 值被右截断。Tobit 命令默认为他们分别为因变量的最小和最大值。其中 statistics:xb 拟合值pr(a,b) Pr(ayj b)e(a,b) E(yj|a yjt95% Conf.Intervalnwife

16、inc-8.815554.470889-1.970.049-17.59257-0.0385257educ80.7085321.640413.73038.22519123.1919exper131.93117.330087.61097.90948165.9525expersq-1.87070.53915-3.470.001-2.929127-0.8122632age-54.57217.440187-7.330-69.17827-39.96588kidslt6-896.038112.1955-7.990-1116.294-675.7811kidsge6-16.0338.74414-0.410.67

17、9-92.090560.03055_cons968.154447.62822.160.03189.393151846.915_se | 1124.914 41.77934(Ancillary parameter)Obs. summary: 325 left-censored observations at hours=4950Obs. summary:3 25 left-censored observations at hours=4950其他回归模型1泊松回归模型 poisson(又称为计数回归, count regression) 主要针对的因变量是计数变量,可以取 非负整数值 0,1,2

18、,,例如某人在 某年被捕的次数、 一个企业在某年申请的专利个数、 妇女生育子女人数等等。 对 这些变量采用普通的线性模型往往不能给出很好的拟合。模型: Y X1,X2,.Xk exp 0 1X1 . k Xk exp(X ) 0,取对数 后是线性的;以 X 为条件, Y=h 的概率是:pY hX exp exp X exp X h / h!,h 0,1.2 ,利用极大似然估计估计出参数值, 然后带入上式就可以求出每一个条件概率值, 无论泊松分布假定成 立与否,仍然可以得到参数的一致和渐进正态的估计量。Stata中的语句是: Poisson;2截取正态回归模型 (censored Normal

19、regression mode)l模型: yi 0 xi ui,ui |xi,ci 0, 2 , i min( yi ,ci ) ,不观测 yi,只有在 yi 小于 ci 时才观测到它,上式还包括了 ui 独立于 ci 的假定右端截取或从上截取的一个例子是顶端编码( top coding)。当一个变量超 过顶端编码时,我们只知道他达到了某个临界值,对高于这个临界值的回答, 我们只知道他和临界值至少一样大。例如调查家庭财富时,我们可以观测到那 些财富不足 50 万美元的受访者的实际财富, 但不能观测到那些财富高于 50万 美元的受访者的实际财富。此时,截取值 ci 对所有个体 i 都一样。Sta

20、ta程序: cnreg3持续期模型( duration model) 持续期间是一个度量某事件发生之前持续时间的度量。 例如一个下岗工人再度 失业前的失业时间;一个从监狱释放的罪犯下次被捕前持续的天数。Stata程序 streg。4断尾回归( truncated regression) 与截取模型类似,有一点不同:断尾模型中,不能观测到总体某一段的所 有信息包括解释变量和被解释变量;截取模型只是观测不到被解释变量。Stata程序: trunreg附录: sas过程 (1)截取模型包括 tobit 模型: proc lifereg; (2)持续期间模型: cox 比例风险模型; proc phr

21、eg5开关模型( switch model) 上面分析的选择模型有这样的特点: 有关的观测之要么观测得到, 要么观测 不到。这里兼具可观测两种的情形,在这种条件下的选择模型称为开关模型 ( switch model)。表示两种体制仍然利用极大似然估计方法估计 (分两种情况:一种 d 已知;另一种 d 未知。) 二赫克曼两步修正模型 理性的经济人往往从效用极大化出发而做出有意识的决策, 比如选择不同的 教育水平、接受培训、参加工作、移民、进入不同所有制的企业等等。由于研究 所用的样本中只包括这些已经做出了决策的个体而不包括那些没有作出这些选 择的个体, 因此样本就不是随机的, 基于这样的样本作出

22、的任何结论只能代表这 部分作出相应决策的个体行为, 而不是整个总体的行为, 这就是样本的选择性误 差( Sample selection bias) (Heckman,1979)。模型在总体回归方程中加入行为选择方程 (selection equation):y x u, ux 0,其中 u 0, ,v 0,1 , corr u,v , 0 直接采s 1z v 0用回归方程估计是有偏的;而 heckman模型提供了一致和渐进有效的估计。如果观测到 y,则 s=1,否则 s=0; 样本选择校正步骤:(1) 利用所有的观测值, 估计一个 si 对 zi 的 probit 模型,并得到估计值 ?,

23、并计算逆米尔斯比率 ?i zi ? 。从 lamda 的显著性可以判断样本选择性偏误的严重程度。(2) 利用选择样本,即 si=1 的观测,作如下的回归Yi 对 xi, ?i ,则得到的参数估计 ?i是一致的,并近似服从正态分布。注意: x 应该是 z 的一个严格子集。Stata程序: heckman语法:(1)基本语法heckman depvar varlist, select(varlist_s) twostep或 heckman depvar varlist, select(depvar_s=varlist_s) twosteppredict type newvarname if exp

24、 in range,statistics nooffset ,其中 statistics是:xb 拟合值(默认项)ycond E(yj|yj observed)yexpected E(yj*),观测不到的 yj 取零。nshazard or mills nonselection hazard( 又称为米尔斯比率)psel p yj observed p(z v 0)xbsel 选择方程的线性估计stdpsel 选择方程线性估计值的标准差pr(a,b) p a xj b u be(a,b) E(yj|a yjb)ystar(a,b) E(yj*), y j*=maxa,min(y j,b)std

25、p standard error of the predictiona=. means负无穷; b=. 正无穷(2)两步一致估计heckman depvar varlist if exp in range, twostep select(depvar_s = varlist_s ,noconstant) nshazard(newvarname)m ills(newvarname) noconstant first level(#) rhosigma| rhotrunc | rholimited | rhoforce select 确定哪些进入选择方程的变量, two 采用 heckman(19

26、79)两步有效估 计方法。 robust 给出文件的标准差; nshazard 或 mills 给出逆米尔斯指标; first 给出选择方程的 probit 估计结果。rhosigma| rhotrunc | rholimited | rhoforce 给出哪些相关系数落在 -1 ,1之外的 情形的处理,默认选项为 rhosigma。举例:已婚妇女的劳动力市场参与对已婚妇女的数据进行样本的选择性纠正。工资方程的因变量 log(wage),解释变量为 educ, exper,expersq。为了检验和纠正(因为观测不到哪些为工作 妇女的工资而导致了) 样本选择性偏误,就需要估计一个劳动力市场参与

27、的 probit 模型。选择方程除了上述的受教育水平、工作经验外,还包括:其他家庭收入、 年龄、幼年子女个数、 年龄较大的子女个数 (暗含的假定是这些变量不影响工资 而影响选择是否进入劳动力市场 )。纠正办法是利用 Heckman(1979)的两步修正模型。 首先利用一个概率单位模 型 (Probit model),估算出个体选择进入劳动力市场的概率, 利用估算结果计算逆 Mills 比率得到变量 ;然后将其代入到工资方程中,来纠正样本的选择性偏差, 矫正后会降低人力资本的收益率(尤其是女性的) (Harmon,1998)。估计的结果: (1)两步估计(还可以处理哪些相关系数落在 -1 ,1 之外情形) heckman lwage educ exper expersq,sele

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1