中国1985至的收入分配.docx

资源描述

中国1985至的收入分配.docx

《中国1985至的收入分配.docx》由会员分享，可在线阅读，更多相关《中国1985至的收入分配.docx（24页珍藏版）》请在冰豆网上搜索。

中国1985至的收入分配.docx

中国1985至的收入分配

中国1985至2021年的收入分配

XimingWuandJeffreyM.Perloff*

译者个人信息：

工商治理学院，产业经济学，马志雄

摘要：

我们通过利用公布可得的区间汇总统计数据，采纳一种新方法来估量中国的收入分配。

我们检验了从1985年到2001年农村、都市和全部的收入分配。

我们直截了当显示了分配如何改变，同时检验不平稳的趋势。

通过使用总体非平稳的跨期分解方法，我们认为农村和都市部门不平稳性的增加，以及不断拉大的城乡收入差距是过去二十年总体不平稳的重要缘故。

尽管如此，城乡差距在近年来愈演愈烈。

我们同时显示，都市消费的不平稳性也应重视。

一、前言

依照分组的汇总性统计数据，并采纳新方法估算收入分配，我们展现由于城乡地区增长不平稳以及日益扩大的城乡收入差距，中国从1985年到2001年收入不平稳性连续上升。

我们发觉中国快速的经济增长—自从20世纪80年代开始5倍的经济增长和4倍的人均收入增长—格外的偏好都市地区和富裕地区。

我们同样显示，农村和都市收入分配沿着不同的路径演化，而这种差别显著阻碍不平稳性的总体水平。

尽管一些文章差不多指出在过去二十年中国收入不平稳性快速扩大，但由于缺乏连续可靠的跨期收入分配数据，它们都没有精确指出这种不平稳性有多大。

中国政府只提供随机几个年份的基尼系数，采纳不明确的数据来源、收入定义和方法，因此它的不平稳性运算不能随时刻直截了当比较（Bramall，2001）。

而且基尼系数只是反映了潜在收入分配的某些方面，大量的信息被丢弃。

因为具有同样基尼系数值的两条洛伦兹曲线可能具有不同的形状，因此对比基尼系数（或其它汇总统计）的福利阻碍可能是模糊的。

因此，我们不仅仅对整个收入分配进行可靠估算，而且报告了几个汇总统计指标。

这篇文章有4个奉献。

第一，当只能获得区间的而非整个分配过程的汇总统计数据，我们使用Wu和Perloff的新方法（立即出版）估算弹性收入分配函数。

基于中国年度的全国住户调查，采纳收入汇总统计数据，我们估算农村、都市以及全国范畴1985-2001年每年的收入分配。

基于这些估算的收入分配数据，应用单一相容的数据来源、方法和定义集，我们最先提供了中国跨期可比较的收入不平稳性序列。

其次，我们展现了农村、都市以及全国收入分配如何在不同时期的演化，而非仅仅展现一个任意选取的汇总统计如何变化，比如基尼系数。

我们展现了农村和都市的收入分配沿着不同的路径演化。

我们采纳两条分配曲线交叠的简单新方法，交叠部分都属于两个密度函数的区域。

第三，我们分解了中国城乡部门总体的不平稳性，探究随着时刻收入增长、城乡收入差距和都市化的分配效应。

我们说明在农村和都市内部不断增加的不平稳性、不断扩大的城乡收入差距以及城乡人口流淌是总体不平稳性的缘故。

我们说明，不断拉大的城乡收入差距扮演着重要角色。

在我们的样本期，都市化对城乡内部不平稳和城乡部门之间不平稳阻碍显著，然而这些阻碍是相互抵消的。

第四，我们检验了都市地区消费的不平稳性。

消费不平稳性是经济福利的一个可选指标。

我们发觉消费的不平稳性在中国同样急剧上升。

第二部分讨论中国总体不平稳性增加的可能缘故。

第三部分描述可获得的数据。

第四部分使用分组数据，介绍估算最大熵密度的方法。

第五部分估算中国1985-2001年的收入分配和不平稳性。

第六部分介绍总体不平稳性与城乡不平稳性的关系。

第七部分介绍都市地区消费不平稳性测量。

最后一部分总结研究、得出结论。

二、不平稳性增长的缘故

已有文献（Khan&Riskin，1998；Gustafsson&Li，2001；Yang，1999；Li，2000；Meng，2003）认为收入不平稳在中国最近年份显著增加。

KhanandRiskin（1998）和Li（2000）同样提供证据说明中国城乡收入存在差异和不同增长率。

我们将提供证据说明中国整体不平稳的扩大是由于内部不平稳的加大，农村部门和都市部门内部的不平稳，以及这两者之间的不平稳，这些不平稳是由城乡部门之间平均收入水平差异引起的。

库兹涅茨曲线假设和结构理论对比了今后不平稳的阻碍，而我们的说明是这两种流行说明的一样化。

Kuznets（1953）强调了不同时期城乡之间不平稳在说明总体不平稳性演变的问题。

他假设假如城乡之间不平稳大于每个部门内部不平稳性，那么最初总体不平稳将随着人们从低收入（农村）部门移向高收入（都市）部门加大。

接着，当大部分人口稳固于高收入的都市部门，不平稳性将下降。

这种在不平稳与收入水平之间转化的倒U型关系被称为库兹涅茨曲线。

假如这种假设是正确的，进展中国家在都市化进程中不平稳性增加可能是一个过程，同时不平稳性将在都市化进程终止时减少。

Chang（2002）认为“……那个问题的治疗方法是在短期内加速都市化进程，在长期内促进都市部门增长。

然而，这种政策在短期内可能会进一步扩大可运算的收入差距。

”尽管如此，中国都市部门不可能够吸取大量剩余的农村劳动力[依照Chang（2002）达1.5亿]，因此中国可能将在一个长期内坚持收入不平稳。

基于同样前提的相似说明，认为城乡收入差距是总体不平稳性增加的动力，但由于长期人口结构和制度结构导致科兹涅茨所描述的调整可不能在中国发生。

依照这种说明，中国人口分属于农村和都市两个独立的经济体。

某种程度上，来自农村地区的迁徙者可能在都市里找到工作，但中国严格的户籍制度常常阻止他们获得都市居民地位（同时获得都市居民所享有的社会福利、津贴和较高工资）。

比如Yang（1999）利用1986年、1992年和1994年静态的内外部分析，认为城乡收入差异是引起中国总体不平稳增加的要紧缘故。

他认为都市偏向的政策和制度是长期城乡分割和近年来不平稳拉大的缘故。

假如迁徙障碍不变，不平稳性在以后不可能减少。

这两个假设都强调了城乡差距是不断拉大的总体不平稳性的首要缘故。

那个因素因此部分说明了不断增加的不平稳性，但总体情形远为复杂。

我们将展现证据说明，过去20年城乡之间和内部的不平稳性实际上增加了总体不平稳性。

而且我们认为假如把都市化考虑进来，城乡之间和内部的不平稳性同等重要的阻碍了总体不平稳性（对比静态分析的传统结论，它认为城乡之间不平稳性是要紧缘故的）。

三、数据

我们依靠大量具有代表性的中国住户调查样本。

中国国家统计局（NSB-正式为SSB）（实际应为NBS—译者注）每年在农村和都市地区开展大规模住户调查，该调查覆盖了30个省份，包括30000-40000个都市家庭和60000-70000个农村家庭。

国家统计局采纳分为两层的样本框，选取具有代表性的人口随机样本。

每个家庭样本连续三年参与调查，记录收入和支出的记录。

由于我们不能猎取国家统计局所有地区和所有年份每个样本调查数据，我们只能采取公布可获得的汇总统计来估算农村和都市的收入分配。

不幸的是，国家统计局并没有提供整个样本的汇总统计，而只是提供了各种收入区间。

这种都市和农村地区的区间汇总统计公布于《中国统计年鉴》（以下简称年鉴）。

年鉴将家庭收入定义为年度家庭人均可支配收入。

我们的样本覆盖1985-2001年，那个时期的年鉴提供了一致数据。

年鉴有区别的汇总农村和都市地区收入分配。

农村收入分配被划分为固定几个区间，收入区间上下限及其家庭分配差不多上明确的，它是总体分配的平均收入。

年鉴1985-1994年间报告12个收入区间，而1996年是11个，1995年、1997-2001年是20个。

而对都市地区来说，年鉴只报告了第0-5，第5-10，第10-20，第20-40，第40-60，第60-80，第80-90和第90-100等收入分配百分位点的条件均值，但没有收入区间的上下限。

我们利用公布可获得的分组数据估算潜在的收入分配，并依照估算的收入分配进行不平稳估量。

农村和都市收入都依照年鉴的相关消费价格指数（CPI）排除通货膨胀阻碍。

四、分组数据的最大熵密度估算

专门多先前研究（比如Gastwirth&Glauberman，1976；Kakwani&Podder，1976；Chen，Ravallion，&Datt，1991）采纳了分组数据估算不平稳性和贫困。

这些文章集中估算洛伦兹曲线和相关的不平稳指数。

相比之下，我们采纳由Wu和Perloff（立即发表）进展了的传统最大熵密度方法，通过分组数据估算一样收入密度函数。

在此情形下我们估量洛伦兹曲线和各种福利指数，并能够检验整个收入分配及其随时刻变化的形状。

最大熵密度（Jaynes，1957）原理是依照部分信息给概率分布赋值的一样方法。

这种方法表述为，人们应该选择与给定约束一致的概率分布，并最大化Shannon的熵。

传统上这种最大熵密度来自最大化的Shannon信息熵。

整个分布范畴服从于已知的K矩条件

我们能够利用拉格拉日方法解决最优化问题，从而得出唯独的总体最大熵值（Zellner&Highfield，1988；Wu，2003）。

这种方法的形式是

那个地点λi是第i个力矩约束的拉格朗日乘数。

这种最大化熵的方法等价于似然方程被定义为一致有效指数分布的最大似然法。

从Golan，Judge和Miller（1996）的文章可明白这两种方法是对偶的。

所有有名的分布都能描述为服从于简单矩约束的最大熵密度，我们下面将统称为特点矩。

这些特点距足以统计指数化家庭，而整个分布能够汇总为特点距。

当只公布分组汇总统计，我们能够通过联合分组信息作为部分距估算最大熵密度。

假设一个确定的分布，我们只明白分组的M个区间汇总统计，并明白区间范畴[l0，l1，…lM]和每个区间的J条件距

其中vm，1是第m个区间的比重，同时

。

定义分布p（x）的第m个区间的第j个部分距为

假如潜在的密度函数为

，我们利用部分距条件运算p（x）。

将p（x）代进部分距条件，我们获得一个M×J方程组，每个方程构成矩阵matrix

（1）的一个条目，我们能够通过迭代更新解决拉格朗日乘数问题

其中

。

J矩阵（M×J）与M子矩阵G（m）（J×J）一致被置于另一个的顶部。

如下

当区间范畴不明白，估量过程就越复杂，因为我们不明白条件均值该在哪个范畴被估量。

比如，在年鉴里由于都市地区不同于农村地区，它只包含每个收入区间的比重和条件均值。

距约束的形式就为

那个地点区间范畴lm（）确实是未知密度函数的方程p（x）。

关于那个方法的更多细节可见Wu和Perloff（立即发表）的文章，在该文中我们采纳quasi-Newton的方法结合密度函数，展现如何样去估算范畴的区域。

新方法使我们能够估算整个分布，然后运算任何感爱好的分布特点。

这种方法还有两个优点，第一它承诺估量分组区间范畴未知的分布，其次传统方法只考虑每个区间的人口比重和条件均值，相反，新方法能够容易的结合其它信息形式，比如每个区间基尼系数的变化。

因此，尽管最大化熵的方法为信息缺乏而设计，但它能够适应各种形式的信息输入。

因为我们不能得到与报告有关的中国分组信息的个别数据，不能够利用中国数据直截了当检验所提出新方法的成效。

然而我们使用2000年美国人口调查（CPS）原始收入数据，证明所提出新方法的成效，那个补充可看附录以及Wu和Perloff（2003）的文章。

使用模型选择描述的连续更新方法，依照自助的Kullback-Leible信息，我们发觉具体形式p（x）=

提供最好的总体适应。

这种方法对美国的数据产生极好成效：

这种适应实际上与能够获得整个样本的距条件十分接近。

比如，给定8个区间但没有区间范畴的人口比重和均值，估算分布得出0.413的基尼系数，而基于全部数据的基尼系数为0.414。

五、农村和都市随时刻的不平稳性

使用这种方法，我们估罢了来自公布可得的汇总统计的中国农村和都市收入分布。

进而使用这些估算分布去确定传统非平稳方法如何样随时刻而变化，我们能够直截了当比较估算分配值。

A.传统非平稳运算方法

我们从检验农村和都市3种各自独立的运算方法开始：

基尼系数，收入的对数离差和分位数范畴比较。

我们使用这些运算方法检验非平稳性如何随时刻而变化。

我们运算已知每个区间的家庭比例的农村收入分配。

由于都市收入区间边界未知，我们结合使用密度函数进行估算。

依照自助Kullback-Leible信息标准，我们再次发觉

的形式更好的总体适应两个地区。

基于估算的密度，我们运算多种非平稳测量。

表1前两列数字包含了农村和都市样本期间估算的基尼系数。

接着两列显示了农村和都市平均对数离差，[

，其中n表示人口数]。

依照两种测量，农村地区比都市地区在全部时期具有更不平稳特点。

平均的说，农村基尼系数是都市的1.4倍，农村MLD是都市的2.2倍。

农村地区基尼系数和MLD之间的相关系数为0.76，都市地区的相关系数为0.73。

农村和都市两种测量在样本期间非平稳性差不多上稳步上升。

农村基尼系数从0.272增加到0.343，增幅为26%。

我们有理由相信基尼系数上升趋势的一个缘故，是我们对比了通过估算的密度和通过运算的洛伦兹曲线。

比如，1985年农村和都市的洛伦兹曲线分布处处高于2001年的，说明1985年的分配洛伦兹超过2001年。

收入分布的最低端设置了较大权重的农村MLD，从0.127增加到0.213，增幅为67.7%。

而都市MLD尽管地域农村，但增长较快。

都市的基尼系数从0.191增加到0.269，增幅为40.8%，而MLD却从0.060增加到0.119，增加了几乎1倍。

另一个估算非平稳的传统方法是对比分位数范畴。

因为我们的数据是区间汇总统计，由于分组可能少于整体范畴的非平稳指数，这损害了累计的最高和最低分位数，从而分位数估算信息缺失。

表1最后4列显示出90/50和50/10分位比率。

假如Q（p）是第p个百分点，因此90/50的分位数比率是Q（90）/Q（50）。

90/50比率反映富裕组相关于平均租的相关份额。

相似的，50/10分位比率反映了平均组相关于贫困组的相关份额。

关于农村和都市地区，两种方法都显示在样本期内增加了20%-25%。

尽管表中没有显示，90/10比率大约增加50%，相关于基尼系数和MLD，那个分位比率的相同变化反映不同的非平稳增加率，这专门可能是由于分布左右两端的进展的不同。

给定中国记录农村人口如何流向都市的数据，基于中国数据的任何有关农村与都市非均衡研究比其他国家的运算方法设置都存在差异。

因为在都市工作的农村迁入者常常不能获得都市居民地位，他们被排除在都市住户调查之外。

因为大部分迁入者只能获得比都市工人更少的工资，同时在样本期内迁入者数量可观，因此假如都市非平稳性只是运算都市居民的话，非平稳性将较低。

另一方面，假如迁移者比农村标准收入更多，将他们包括进农村住户调查将增加农村的收入不平稳。

而且Schultz（2003）指出连续迁移的限制减少了那些农村年青年本该流向更高收入劳动力市场的酬劳。

最终户籍制度增加了农村和都市家庭教育投资的差异，并在长期增加了城乡差距。

B．文献比较

我们能够将我们的估量与之前的4个研究作比较。

因为其它研究只是报告了几年期的基尼系数，表2只是比较了这些年份农村和都市基尼系数。

Li（2000）利用国家统计局1988-1995年数据报告了农村和都市基尼系数。

我们1988年0.300和1995年0.338的农村基尼系数接近Li（2000）基于国家统计局的数据：

0.301和0.332。

而我们1988年0.201和1995年0.221的都市基尼系数不太接近Li0.23和0.28的估算。

因为国家统计局的住户调查数据不能公布获得，KhanandRiskin（1998），Gustafsson和Li（2001），以及Meng（2003）的另外3个研究使用的是来自中国社科院（CASS）经济研究所1988年和1995年样本量更小、代表性较差的调查数据。

中国社科院使用比国家统计局更宽泛的收入定义。

尽管这三个研究差不多上用的是中国社科院的书库，但它们所估算的基尼系数存在差异，因为它们对差不多数据的假设不同（Bramall，2001）。

KhanandRiskin（1998）基于中国社科院数据的研究比我们和Li（2000）基于国家统计局数据的研究具有更高的农村非平稳。

所有基于中国社科院数据的研究估算1988年都市基尼系数为0.23（这比我们的估算值0.20高），但它们1995年的估算值分布于0.28到0.33（都高于我们的估算值0.22）。

因此，我们的都市估算值低于往常的研究。

这种不同可能是由于差不多数据来源的不同，收入定义的不同，或者方法不同。

只是所有研究都认为农村和都市的非平稳性1988年比1995年增加了。

而且Meng（2003）基于中国社科院覆盖6个省的数据也认为都市基尼系数从1995年的0.282增加到1999年的0.313。

世界银行（1997）的报告《分享增加的收入》估罢了1981年到1995年中国的基尼系数。

如报告的作者所言，我们发觉（i）1990年农村非平稳降低，（ii）1989年和1991到1995年期间都市的非平稳降低，以及（iii）两个研究都认为在研究期间都市的非平稳性低于农村。

C.直截了当检验分布

尽管它们提供了直截了当方法检验非平稳性随时刻的趋势，非平稳系数仅仅反映了演进过程的某个方面。

比如，这些汇总性统计并没有显示收入分配随时刻改变的一样形状。

是否通过基尼系数或MLD运算的扩大的非平稳性时由密集度右移引起，后尾所致，依旧更复杂的改变？

分布呈双峰状是由于掏空了中产阶级？

为深入明白得那个过程，我们检验了我们的弹性密度函数估算形式，它承诺显现多峰分布。

FIGURE1.-RURALINCOMEDISTRIBUTION，1985-2001

FIGURE2.-URBANINCOMEDISTRIBUTIONS，1985-2001

图1显示1985年到2001年期间农村分配如何变化，图2显示都市分配的移动。

那个样本期内，每种分布都只有一个密集度。

然而离差随时刻增加明显，专门大程度上是由于右尾变长。

而且收入分布逐步连续向右移（相应的密集度权重减少），反映了收入普遍增加。

FIGURE3.-ESTEMATEDRURALANDURBANDISTRIBUTIONSINTHOUSANDSOF1985YUAN

分布的右移通过成对比较年份就更为明显。

图3左边显示2001年农村收入分布比1985年的分布更加分散。

分布从1985年292元到2001年490元（在1985年）的密集度增加了68%。

尽管密集度右移，但偏度从1.28增加为1.39。

2001年分布的众数高度只是1985年最高点的40%，这使峰度从4.95下降到4.86。

都市收入水平和离差（图3右边）比农村的收入水平和离差（左边）增长更快。

而且最低收入水平的住户部分实质下降。

都市分配的众数从1985年的681元，增加为2001年的1634元，同时众数的密度相比于1985年降低25%。

它的分布更加对称—偏度从1.82减少为1.47—反映穷人比重减少而富人比重上升。

峰度从8.28减少为6.05，反映了最高点确实扁平化了。

相比农村的分布，都市最低绝对收入的人口比重（左边尾端的高度）专门大程度减少，这有助于说明为何我们所估算的都市地区非平稳更低，专门对MLD方法来说，它给收入贫困人口更大权重。

分布移动的程度有多大？

我们能直截了当估算两种分布的总体距离与接近程度。

我们在两个分部之间采纳一种新的交叠方法，交叉部分是密度函数的共同部分。

这种两个密度函数p（x）和q（x）在实线或子集内的统计定义为：

它的值等于图3的B区域。

它严格属于[0，1]。

假如Ω=0，那么p（x）和q（x）是不相交的。

假如Ω=1，那么p（x）和q（x）相等。

我们标记区域B的面积等于1减去两边的Kolmogorov-Smirnov统计值。

因此，基于交叠部分的检验渐近等于Kolmogorov-Smirnov检验。

在整个期间，农村和都市地区密度交叠Ω在每对相邻年份均值各自为0.944和0.922。

相比1985年和2001年的分布，农村地区的Ω（0.544）高于都市地区的Ω（0.236），反映在此期间都市地区变化的累积性阻碍更大。

六、总体非平稳的分解

农村和都市这种不平等移动对总体非平稳性有什么阻碍？

为了回答那个问题，我们在农村和都市之间分解了中国总体非平稳。

我们的结果说明在部门内部和在部门之间增加的非平稳对总体不平稳的增加都有奉献。

A．总体分布和非平稳

我们将中国的累计收入分配运算为农村和都市分配的人口权重混合。

我们使用结果分配去运算累计分配的非平稳指数。

用pr（x）和pu（x）表示农村和都市的收入分配，我们通过权重加总获得累计的分配：

那个地点sr和su是农村和都市人口的比重。

在样本期间，都市人口比重从24%稳固增加到38%。

图4描述了1985年和2001年累计分配（实线）与改变比例的农村（点线）和都市（点划线）分配的关系。

通过相应的人口权重农村和都市密度改变了，因此在这两条曲线下面的区域加总等于1。

通过比较1985年和2001年的图表，我们能够看到，在样本期内累计分配的总体形状几乎没变，但后者的右尾变得更厚。

在2001年，右尾的累计密度几乎全部由都市密度造成。

表3报告了基尼系数（第2栏）和MLD（第3栏），它们通过估算累计的p（x）获得。

在样本期间，基尼系数增加了34%（从0.310增加到0.415），而MLD几乎增加了1倍（从0.164增加到0.317）。

由于实质的城乡收入差距，总体非平稳比起单独的农村或都市非平稳高得多。

如方程（3）和图4所示，增加的总体非平稳是由于农村和都市分配、两者相互作用以及人口权重的改变。

尽管我们使用了比1997年世界银行报告更少的信息，但这两组估确实是专门接近的。

比如，我们对总体基尼系数的估算，1985年为0.310，1995年为0.382（两个研究都覆盖了第一年和最后一年的时期），这实际上与世界银行的估算（1985年为0.31，1995年为0.388）是一样的。

在样本期内，中国的基尼系数平均以每年增加0.66个点，也即是说每年2%的增长率。

这种急剧上升非同平常。

Li，Squire和Zou（1998）指出收入的不平稳性在一个国家内部相对稳固（尽管它在国家间变化相当大）。

他们指出中国的基尼系数从1980年到1992年每年增速3%是一个特例。

从1980年代中国作为一个中度非平稳的国家，它现在是进展中国家不平稳性最大的之一。

实际上中国目前的基尼非平稳性欲美国的水平是一样的，美国是OECD国家中基尼系数最高的国家。

B．总体非平稳的分解

假如一个非平稳系数能够被分解为部门内的非平稳和部门间的非平稳而不存在部门交叠的相互作用，那么我们就能从人口子群体的系数里推导出总体非平稳系数。

普遍使用的非平稳基尼系数，在这种意义上不能分解，因此我们不能从子群体中运算总体的基尼系数。

尽管如此，MLD是可分解的，因此我们能依照农村和都市的MLDs导出总体的MLD，并显示那种因素对总体MLD随时刻的增长有奉献。

MLD系数的分解公式为

那个地点MLDk是第k个子群体的非平稳性（那个地点k=农村或都市），μk是第k个子群体的平均收入，sk是第k个子群体的人口比重。

第一项MLDk是内部非平稳，即农村或都市部门内部的不平稳性。

第二项MLDb是两者之间非平稳，即由于农村和都市地区之间平均收入不同的非平稳。

部门内部和部门之间在样本期的运算都相当大的增加（表3第2栏）。

相关值和绝对值的部门之间不平稳增加都比内部不平稳大。

部门之间的非平稳从0.053到0.139增长163%，而部门内部从0.111到0.178增长61%。

两种增长的结果是，总的MLD非平稳扩大不只一倍。

为了幸免年间波动，我们在表4显示了整个时期和3个子时期的非平稳性，即从1985年到1990年，从1990年到1996年，从1996年到2001年。

表4前3栏指

展开阅读全文