多元选择模型.ppt
《多元选择模型.ppt》由会员分享,可在线阅读,更多相关《多元选择模型.ppt(36页珍藏版)》请在冰豆网上搜索。
4.3离散被解释变量数据计量经济学模型多元选择模型ModelswithDiscreteDependentVariablesMultipleChoiceModel,一、社会经济生活中的多元选择问题二、一般多元离散选择Logit模型三、嵌套Logit模型四、排序多元离散选择模型,一、社会经济生活中的多元选择问题,可以将社会经济生活中的多元选择问题分为三类:
一般多元选择问题排序选择问题(OrderedMultivariateChoice)嵌套选择问题(NestedMultipleChoices),一般多元选择问题决策者按照效用最大原则在多个可供选择的方案中进行选择。
一类问题是决策者面临多项选择一类问题是决策者对同一个选择对象的偏好程度,排序选择问题决策者作出某种选择并不意味实现了效用最大,而是在条件制约下的无奈选择。
一个典型的例子是商品的满意度调查。
将对商品的满意度分为5等:
十分满意、一般满意、无所谓、一般不满意、十分不满意,对已经购买了该商品的居民进行调查,会有不同的满意程度,该调查结果就是一个排序选择问题。
嵌套选择问题选择对象是分层次的,决策者必须逐层进行选择。
二、一般多元离散选择Logit模型,说明,在多元离散选择模型中,应用最多的是Logit模型。
不同的教科书从不同的角度对此有不同的解释。
在多元离散选择模型中,因为Probit模型需要对多元正态分布的整体进行评价,所以它的应用受到限制。
逻辑分布更适合于效用最大化时的分布选择,所以应用最多的多元离散选择模型是Logit模型。
Logit模型的似然函数能够快速可靠地收敛,当方案或者决策个体数量较大时,计算比较简便。
1、一般多元选择Logit模型的思路,如果决策者i在(J+1)项可供选择方案中选择了第j项,那么其效用模型为:
当且仅当(J+1)个随机误差项互不相关,并且服从类极值分布,选择j的概率,效用模型的解释变量中包括所有影响选择的因素,既包括决策者所具有的属性,也包括备选方案所具有的属性。
备选方案所具有的属性是随着方案的变化而变化的。
决策者所具有的属性中一部分是随着方案的变化而变化的,而一部分是不随着方案的变化而变化的。
用Zij表示随着方案的变化而变化的那部分解释变量,Wi表示不随着方案的变化而变化的那部分解释变量。
实用的一般多元Logit选择模型又分3种情况。
一是研究选择某种方案的概率与决策者的特征变量之间的关系;二是研究选择某种方案的概率与决策者的特征变量以及方案的特征变量之间的关系;三是考虑到不同方案之间的相关性的情况。
MultinomialLogitModel多项Logit模型名义Logit模型,ConditionalLogitModel条件Logit模型,NestedLogit模型嵌套模型,2、多项Logit离散选择模型及其参数估计,X中未包含备选方案所具有的属性变量,而参数向量B对不同的选择方案(即不同的方程)是不同的。
令B0=0,j=1,2,J,由对数似然函数最大化的一阶条件,利用Newton迭代方法可以迅速地得到方程组的解,得到模型的参数估计量。
另一种估计方法,可以计算相对于基准方案的“对数成败比”为:
两点注意:
假设了原模型中(J+1)个随机误差项互不相关。
对估计结果的解释不同。
如果对每个决策者进行重复观测,可以得到被解释变量的观测值。
如果对每个决策者只进行一次观测,如何得到被解释变量的观测值?
3、例题,将4.1例中某商业银行从历史贷款客户中随机抽取的78个样本进一步细分,贷款结果2表示贷款成功,1表示延滞还款,0表示呆坏账。
目的是研究贷款结果(JG)与“商业信用支持度”(XY)和“市场竞争地位等级”(SC)之间的关系。
为此建立三元选择多项Logit模型。
采用Stata估计模型,估计结果,以JG=0为基准,对于JG=1和JG=2,“商业信用支持度”的系数为负,即当客户的财务状况越差(该变量观测值越大)时,获得贷款成功的概率越小,而且对JG=2的影响远大于对JG=1的影响。
类似地,“市场竞争地位等级”的系数为正,即当客户的市场状况越好(该变量观测值越大)时,获得贷款成功的概率越大;而且对JG=2的影响远大于对JG=1的影响。
模型有较高的拟合优度和总体显著性;解释变量在5%的显著性水平下显著。
利用估计结果对样本客户贷款结果分别取0、1和2的概率进行预测,除了个别样本客户外,预测结果和实际结果具有一致性。
对于多元选择模型,需要检验选择结果之间的独立性,以及是否可以将某些选择结果合并。
独立检验显示,选择结果1与选择结果0、2之间是独立的;选择结果2与选择结果0、1之间也是独立的。
选择结果合并检验显示,选择结果1和2、1和0、2和0是不能合并的,即0、1、2选项均不可合并,也验证了IIA假设成立。
4、条件Logit离散选择模型及其参数估计,选择某种方案的概率不仅与决策者的特征变量有关,而且也与方案的特征变量有关,模型为:
区别在于X的下标,由对数似然函数最大化的一阶条件,利用Newton迭代方法可以迅速地得到方程组的解,得到模型的参数估计量。
三、嵌套Logit模型,1、问题的提出,(J+1)个不同的选择方案之间具有相关性,而且必须考虑这种相关性,表现为模型随机误差项相关。
可行的思路是将(J+1)个选择方案分为L组,在每组内部的选择方案之间不具有相关性,而组间则具有相关性。
就是将条件Logit模型中隐含的齐次方差性条件放松,允许方差在组间可以不同,但在组内仍然是同方差的。
这样的模型被称为NestedLogit模型。
2、NestedLogit模型,表示对选择第l组产生影响的变量,表示在第l组内对选择第j种方案产生影响的变量,定义第l组的“内值”(InclusiveValue),3、估计方法,两阶段最大似然法,是一种有限信息估计方法。
其具体步骤是:
在组内,作为一个简单的条件Logit模型,估计参数;计算每组的“内值”;将每组看成是一种选择方案,再进行简单的条件Logit模型的估计,得到参数和T的估计量。
此时用到的贡献变量是Zl和Il。
完全信息最大似然法。
将对数似然函数写为:
比两阶段最大似然法更有效,四、排序多元离散选择模型,1、问题的提出,作为被解释变量的(J+1)个选择结果本身是排序的,J优于(J1),2优于1,1优于0。
决策者选择不同的方案所得到的效用也是排序的。
一般多元离散选择模型中的效用关系不再适用。
2、效用关系,选择不同方案的效用关系:
3、模型,为了保证所有的概率都是正的,必须有:
假定服从正态分布,并且标准化为服从期望为0、方差为1的正态分布。
那么可以得到选择各个方案的概率,为正态分布的概率函数,4、估计,可以看作二元Probit模型的推广;采用最大似然法估计;得到参数估计值;计算每个样本选择各个方案的概率。
5、排序模型问题举例,为了研究各种不同的养老模式对老年人健康水平和幸福感的影响,利用2002年、2005年中国老年人口健康状况调查数据,建立多元排序选择模型。
将客观健康状况分为5个等级:
非常健康、较健康、较不健康、很不健康、死亡,显然这是一个排序多元选择问题。
将主观幸福感分为6个等级:
非常好、好、一般、差、非常差、死亡,显然这也是一个排序多元选择问题。
影响因素包括居住模式(即养老模式,包含独居、只与配偶居住、多代合住、住养老院4种)以及其它因素,包含主要生活来源、医疗状况、初始健康水平、社会经济地位、健康行为,以及人口统计信息等,所有这些因素都属于决策者属性。
因为本例重点考察养老模式对老年人健康水平和幸福感的影响,考虑到养老模式和经济来源的二维性,进一步将养老模式细分,即每种模式下又分为经济独立、子女供养、政府补助3种,共12种养老模式。
模型估计结果显示,不同养老模式对老年人客观健康水平的影响,以子女供养的独居老人为参照组,经济独立或子女供养情况下生活独立的老年夫妻保持健康(即非常健康或较健康)的概率要比参照组分别高13%-15%,死亡概率要低13%-15%,属于最优的养老模式;其次是经济独立但选择多代合住的模式;子女供养的养老院老人、依靠补助的独居老人和子女供养的独居老人(参照组)具有最差的客观健康水平。
模型估计结果显示,不同养老模式对老年人主观幸福感的影响,与子女供养的独居老人相比,经济与生活均独立的老年夫妻和依靠补助的养老院老人对生活最满意,感到非常幸福和幸福的概率要高出14%;其次是子女供养但生活独立的老年夫妻和经济独立的养老院老人;子女供养的养老院老人、依靠补助的独居老人和子女供养的独居老人(参照组)仍然具有最差的主观幸福感。