中国1985至的收入分配.docx

资源描述

中国1985至的收入分配.docx

《中国1985至的收入分配.docx》由会员分享，可在线阅读，更多相关《中国1985至的收入分配.docx（23页珍藏版）》请在冰点文库上搜索。

中国1985至的收入分配.docx

中国1985至的收入分配

中国1985至2001年的收入分配

XimingWuandJeffreyM.Perloff*

译者个人信息：

工商管理学院，产业经济学，马志雄

摘要：

我们通过利用公开可得的区间汇总统计数据，采用一种新方法来估计中国的收入分配。

我们检验了从1985年到2001年农村、城市和全部的收入分配。

我们直接显示了分配如何改变，同时检验不平衡的趋势。

通过使用总体非平衡的跨期分解方法，我们认为农村和城市部门不平衡性的增加，以及不断拉大的城乡收入差距是过去二十年总体不平衡的重要原因。

尽管如此，城乡差距在近年来愈演愈烈。

我们同时显示，城市消费的不平衡性也应重视。

一、前言

根据分组的汇总性统计数据，并采用新方法估算收入分配，我们展示由于城乡地区增长不平衡以及日益扩大的城乡收入差距，中国从1985年到2001年收入不平衡性持续上升。

我们发现中国快速的经济增长—自从20世纪80年代开始5倍的经济增长和4倍的人均收入增长—格外的偏好城市地区和富裕地区。

我们同样显示，农村和城市收入分配沿着不同的路径演化，而这种差别显著影响不平衡性的总体水平。

虽然一些文章已经指出在过去二十年中国收入不平衡性快速扩大，但由于缺乏持续可靠的跨期收入分配数据，它们都没有精确指出这种不平衡性有多大。

中国政府只提供随机几个年份的基尼系数，采用不明确的数据来源、收入定义和方法，因此它的不平衡性计算不能随时间直接比较（Bramall，2001）。

而且基尼系数只是反映了潜在收入分配的某些方面，大量的信息被丢弃。

因为具有同样基尼系数值的两条洛伦兹曲线可能具有不同的形状，所以对比基尼系数（或其它汇总统计）的福利影响可能是模糊的。

因此，我们不仅仅对整个收入分配进行可靠估算，而且报告了几个汇总统计指标。

这篇文章有4个贡献。

首先，当只能获得区间的而非整个分配过程的汇总统计数据，我们使用Wu和Perloff的新方法（即将出版）估算弹性收入分配函数。

基于中国年度的全国住户调查，采用收入汇总统计数据，我们估算农村、城市以及全国围1985-2001年每年的收入分配。

基于这些估算的收入分配数据，应用单一相容的数据来源、方法和定义集，我们最先提供了中国跨期可比较的收入不平衡性序列。

其次，我们展示了农村、城市以及全国收入分配如何在不同时期的演化，而非仅仅展示一个任意选取的汇总统计如何变化，比如基尼系数。

我们展示了农村和城市的收入分配沿着不同的路径演化。

我们采用两条分配曲线交叠的简单新方法，交叠部分都属于两个密度函数的区域。

第三，我们分解了中国城乡部门总体的不平衡性，探究随着时间收入增长、城乡收入差距和城市化的分配效应。

我们说明在农村和城市部不断增加的不平衡性、不断扩大的城乡收入差距以及城乡人口流动是总体不平衡性的原因。

我们说明，不断拉大的城乡收入差距扮演着重要角色。

在我们的样本期，城市化对城乡部不平衡和城乡部门之间不平衡影响显著，但是这些影响是相互抵消的。

第四，我们检验了城市地区消费的不平衡性。

消费不平衡性是经济福利的一个可选指标。

我们发现消费的不平衡性在中国同样急剧上升。

第二部分讨论中国总体不平衡性增加的可能原因。

第三部分描述可获得的数据。

第四部分使用分组数据，介绍估算最大熵密度的方法。

第五部分估算中国1985-2001年的收入分配和不平衡性。

第六部分介绍总体不平衡性与城乡不平衡性的关系。

第七部分介绍城市地区消费不平衡性测量。

最后一部分总结研究、得出结论。

二、不平衡性增长的原因

已有文献（Khan&Riskin，1998；Gustafsson&Li，2001；Yang，1999；Li，2000；Meng，2003）认为收入不平衡在中国最近年份显著增加。

KhanandRiskin（1998）和Li（2000）同样提供证据说明中国城乡收入存在差异和不同增长率。

我们将提供证据说明中国整体不平衡的扩大是由于部不平衡的加大，农村部门和城市部门部的不平衡，以及这两者之间的不平衡，这些不平衡是由城乡部门之间平均收入水平差异引起的。

库兹涅茨曲线假设和结构理论对比了将来不平衡的影响，而我们的解释是这两种流行解释的一般化。

Kuznets（1953）强调了不同时期城乡之间不平衡在解释总体不平衡性演变的问题。

他假设如果城乡之间不平衡大于每个部门部不平衡性，那么最初总体不平衡将随着人们从低收入（农村）部门移向高收入（城市）部门加大。

接着，当大部分人口稳定于高收入的城市部门，不平衡性将下降。

这种在不平衡与收入水平之间转化的倒U型关系被称为库兹涅茨曲线。

如果这种假设是正确的，发展中国家在城市化进程中不平衡性增加可能是一个过程，同时不平衡性将在城市化进程结束时减少。

Chang（2002）认为“……这个问题的治疗方法是在短期加速城市化进程，在长期促进城市部门增长。

但是，这种政策在短期可能会进一步扩大可计算的收入差距。

”尽管如此，中国城市部门不可能够吸收大量剩余的农村劳动力[根据Chang（2002）达1.5亿]，所以中国可能将在一个长期维持收入不平衡。

基于同样前提的相似解释，认为城乡收入差距是总体不平衡性增加的动力，但由于长期人口结构和制度结构导致科兹涅茨所描述的调整不会在中国发生。

根据这种解释，中国人口分属于农村和城市两个独立的经济体。

某种程度上，来自农村地区的迁徙者可能在城市里找到工作，但中国严格的户籍制度常常阻止他们获得城市居民地位（同时获得城市居民所享有的社会福利、津贴和较高工资）。

比如Yang（1999）利用1986年、1992年和1994年静态的外部分析，认为城乡收入差异是引起中国总体不平衡增加的主要原因。

他认为城市偏向的政策和制度是长期城乡分割和近年来不平衡拉大的原因。

如果迁徙障碍不变，不平衡性在未来不可能减少。

这两个假设都强调了城乡差距是不断拉大的总体不平衡性的首要原因。

这个因素当然部分解释了不断增加的不平衡性，但总体情况远为复杂。

我们将展示证据说明，过去20年城乡之间和部的不平衡性实际上增加了总体不平衡性。

而且我们认为如果把城市化考虑进来，城乡之间和部的不平衡性同等重要的影响了总体不平衡性（对比静态分析的传统结论，它认为城乡之间不平衡性是主要原因的）。

三、数据

我们依靠大量具有代表性的中国住户调查样本。

中国国家统计局（NSB-正式为SSB）（实际应为NBS—译者注）每年在农村和城市地区开展大规模住户调查，该调查覆盖了30个省份，包括30000-40000个城市家庭和60000-70000个农村家庭。

国家统计局采用分为两层的样本框，选取具有代表性的人口随机样本。

每个家庭样本连续三年参与调查，记录收入和支出的记录。

由于我们不能获取国家统计局所有地区和所有年份每个样本调查数据，我们只能采取公开可获得的汇总统计来估算农村和城市的收入分配。

不幸的是，国家统计局并没有提供整个样本的汇总统计，而只是提供了各种收入区间。

这种城市和农村地区的区间汇总统计公布于《中国统计年鉴》（以下简称年鉴）。

年鉴将家庭收入定义为年度家庭人均可支配收入。

我们的样本覆盖1985-2001年，这个时期的年鉴提供了一致数据。

年鉴有区别的汇总农村和城市地区收入分配。

农村收入分配被划分为固定几个区间，收入区间上下限及其家庭分配都是明确的，它是总体分配的平均收入。

年鉴1985-1994年间报告12个收入区间，而1996年是11个，1995年、1997-2001年是20个。

而对城市地区来说，年鉴只报告了第0-5，第5-10，第10-20，第20-40，第40-60，第60-80，第80-90和第90-100等收入分配百分位点的条件均值，但没有收入区间的上下限。

我们利用公开可获得的分组数据估算潜在的收入分配，并根据估算的收入分配进行不平衡推测。

农村和城市收入都根据年鉴的相关消费价格指数（CPI）消除通货膨胀影响。

四、分组数据的最大熵密度估算

很多先前研究（比如Gastwirth&Glauberman，1976；Kakwani&Podder，1976；Chen，Ravallion，&Datt，1991）采用了分组数据估算不平衡性和贫困。

这些文章集中估算洛伦兹曲线和相关的不平衡指数。

相比之下，我们采用由Wu和Perloff（即将发表）发展了的传统最大熵密度方法，通过分组数据估算一般收入密度函数。

在此情况下我们推测洛伦兹曲线和各种福利指数，并能够检验整个收入分配及其随时间变化的形状。

最大熵密度（Jaynes，1957）原理是根据部分信息给概率分布赋值的一般方法。

这种方法表述为，人们应该选择与给定约束一致的概率分布，并最大化Shannon的熵。

传统上这种最大熵密度来自最大化的Shannon信息熵。

整个分布围服从于已知的K矩条件

我们能够利用拉格拉日方法解决最优化问题，从而得出唯一的总体最大熵值（Zellner&Highfield，1988；Wu，2003）。

这种方法的形式是

这里λi是第i个力矩约束的拉格朗日乘数。

这种最大化熵的方法等价于似然方程被定义为一致有效指数分布的最大似然法。

从Golan，Judge和Miller（1996）的文章可明白这两种方法是对偶的。

所有有名的分布都能描述为服从于简单矩约束的最大熵密度，我们下面将统称为特征矩。

这些特征距足以统计指数化家庭，而整个分布可以汇总为特征距。

当只公布分组汇总统计，我们可以通过联合分组信息作为部分距估算最大熵密度。

假设一个确定的分布，我们只知道分组的M个区间汇总统计，并知道区间围[l0，l1，…lM]和每个区间的J条件距

其中vm，1是第m个区间的比重，并且

。

定义分布p（x）的第m个区间的第j个部分距为

假如潜在的密度函数为，我们利用部分距条件计算p（x）。

将p（x）代进部分距条件，我们获得一个M×J方程组，每个方程构成矩阵matrix

（1）的一个条目，我们能够通过迭代更新解决拉格朗日乘数问题

其中。

J矩阵（M×J）与M子矩阵G（m）（J×J）一致被置于另一个的顶部。

如下

当区间围不知道，估计过程就越复杂，因为我们不知道条件均值该在哪个围被估计。

比如，在年鉴里由于城市地区不同于农村地区，它只包含每个收入区间的比重和条件均值。

距约束的形式就为

这里区间围lm（）就是未知密度函数的方程p（x）。

关于这个方法的更多细节可见Wu和Perloff（即将发表）的文章，在该文中我们采用quasi-Newton的方法结合密度函数，展示怎样去估算围的区域。

新方法使我们能够估算整个分布，然后计算任何感兴趣的分布特征。

这种方法还有两个优点，首先它允许估计分组区间围未知的分布，其次传统方法只考虑每个区间的人口比重和条件均值，相反，新方法能够容易的结合其它信息形式，比如每个区间基尼系数的变化。

所以，尽管最大化熵的方法为信息缺乏而设计，但它能够适应各种形式的信息输入。

因为我们不能得到与报告有关的中国分组信息的个别数据，不能够利用中国数据直接检验所提出新方法的效果。

但是我们使用2000年美国人口调查（CPS）原始收入数据，证明所提出新方法的效果，这个补充可看附录以及Wu和Perloff（2003）的文章。

使用模型选择描述的连续更新方法，根据自助的Kullback-Leible信息，我们发现具体形式p（x）=提供最好的总体适应。

这种方法对美国的数据产生极好效果：

这种适应实际上与能够获得整个样本的距条件十分接近。

比如，给定8个区间但没有区间围的人口比重和均值，估算分布得出0.413的基尼系数，而基于全部数据的基尼系数为0.414。

五、农村和城市随时间的不平衡性

使用这种方法，我们估算了来自公开可得的汇总统计的中国农村和城市收入分布。

进而使用这些估算分布去确定传统非平衡方法怎样随时间而变化，我们能够直接比较估算分配值。

A.传统非平衡计算方法

我们从检验农村和城市3种各自独立的计算方法开始：

基尼系数，收入的对数离差和分位数围比较。

我们使用这些计算方法检验非平衡性如何随时间而变化。

我们计算已知每个区间的家庭比例的农村收入分配。

由于城市收入区间边界未知，我们结合使用密度函数进行估算。

根据自助Kullback-Leible信息标准，我们再次发现的形式更好的总体适应两个地区。

基于估算的密度，我们计算多种非平衡测量。

表1前两列数字包含了农村和城市样本期间估算的基尼系数。

接着两列显示了农村和城市平均对数离差，[，其中n表示人口数]。

根据两种测量，农村地区比城市地区在全部时期具有更不平衡特点。

平均的说，农村基尼系数是城市的1.4倍，农村MLD是城市的2.2倍。

农村地区基尼系数和MLD之间的相关系数为0.76，城市地区的相关系数为0.73。

农村和城市两种测量在样本期间非平衡性都是稳步上升。

农村基尼系数从0.272增加到0.343，增幅为26%。

我们有理由相信基尼系数上升趋势的一个原因，是我们对比了通过估算的密度和经过计算的洛伦兹曲线。

比如，1985年农村和城市的洛伦兹曲线分布处处高于2001年的，表明1985年的分配洛伦兹超过2001年。

收入分布的最低端设置了较大权重的农村MLD，从0.127增加到0.213，增幅为67.7%。

而城市MLD尽管地域农村，但增长较快。

城市的基尼系数从0.191增加到0.269，增幅为40.8%，而MLD却从0.060增加到0.119，增加了几乎1倍。

另一个估算非平衡的传统方法是对比分位数围。

因为我们的数据是区间汇总统计，由于分组可能少于整体围的非平衡指数，这损害了累计的最高和最低分位数，从而分位数估算信息缺失。

表1最后4列显示出90/50和50/10分位比率。

如果Q（p）是第p个百分点，所以90/50的分位数比率是Q（90）/Q（50）。

90/50比率反映富裕组相对于平均租的相关份额。

相似的，50/10分位比率反映了平均组相对于贫困组的相关份额。

对于农村和城市地区，两种方法都显示在样本期增加了20%-25%。

虽然表中没有显示，90/10比率大约增加50%，相对于基尼系数和MLD，这个分位比率的相同变化反映不同的非平衡增加率，这很可能是由于分布左右两端的发展的不同。

给定中国记录农村人口如何流向城市的数据，基于中国数据的任何有关农村与城市非均衡研究比其他国家的计算方法设置都存在差异。

因为在城市工作的农村迁入者常常不能获得城市居民地位，他们被排除在城市住户调查之外。

因为大部分迁入者只能获得比城市工人更少的工资，同时在样本期迁入者数量可观，所以如果城市非平衡性只是计算城市居民的话，非平衡性将较低。

另一方面，如果迁移者比农村标准收入更多，将他们包括进农村住户调查将增加农村的收入不平衡。

而且Schultz（2003）指出持续迁移的限制减少了那些农村年青年本该流向更高收入劳动力市场的报酬。

最终户籍制度增加了农村和城市家庭教育投资的差异，并在长期增加了城乡差距。

B．文献比较

我们可以将我们的估计与之前的4个研究作比较。

因为其它研究只是报告了几年期的基尼系数，表2只是比较了这些年份农村和城市基尼系数。

Li（2000）利用国家统计局1988-1995年数据报告了农村和城市基尼系数。

我们1988年0.300和1995年0.338的农村基尼系数接近Li（2000）基于国家统计局的数据：

0.301和0.332。

而我们1988年0.201和1995年0.221的城市基尼系数不太接近Li0.23和0.28的估算。

因为国家统计局的住户调查数据不能公开获得，KhanandRiskin（1998），Gustafsson和Li（2001），以及Meng（2003）的另外3个研究使用的是来自中国社科院（CASS）经济研究所1988年和1995年样本量更小、代表性较差的调查数据。

中国社科院使用比国家统计局更宽泛的收入定义。

虽然这三个研究都是用的是中国社科院的书库，但它们所估算的基尼系数存在差异，因为它们对基本数据的假设不同（Bramall，2001）。

KhanandRiskin（1998）基于中国社科院数据的研究比我们和Li（2000）基于国家统计局数据的研究具有更高的农村非平衡。

所有基于中国社科院数据的研究估算1988年城市基尼系数为0.23（这比我们的估算值0.20高），但它们1995年的估算值分布于0.28到0.33（都高于我们的估算值0.22）。

因此，我们的城市估算值低于以前的研究。

这种不同可能是由于基本数据来源的不同，收入定义的不同，或者方法不同。

不过所有研究都认为农村和城市的非平衡性1988年比1995年增加了。

而且Meng（2003）基于中国社科院覆盖6个省的数据也认为城市基尼系数从1995年的0.282增加到1999年的0.313。

世界银行（1997）的报告《分享增加的收入》估算了1981年到1995年中国的基尼系数。

如报告的作者所言，我们发现（i）1990年农村非平衡降低，（ii）1989年和1991到1995年期间城市的非平衡降低，以及（iii）两个研究都认为在研究期间城市的非平衡性低于农村。

C.直接检验分布

虽然它们提供了直接方法检验非平衡性随时间的趋势，非平衡系数仅仅反映了演进过程的某个方面。

比如，这些汇总性统计并没有显示收入分配随时间改变的一般形状。

是否通过基尼系数或MLD计算的扩大的非平衡性时由密集度右移引起，后尾所致，还是更复杂的改变？

分布呈双峰状是由于掏空了中产阶级？

为深入理解这个过程，我们检验了我们的弹性密度函数估算形式，它允许出现多峰分布。

FIGURE1.-RURALINCOMEDISTRIBUTION，1985-2001

FIGURE2.-URBANINCOMEDISTRIBUTIONS，1985-2001

图1显示1985年到2001年期间农村分配如何变化，图2显示城市分配的移动。

这个样本期，每种分布都只有一个密集度。

然而离差随时间增加明显，很大程度上是由于右尾变长。

而且收入分布逐渐持续向右移（相应的密集度权重减少），反映了收入普遍增加。

FIGURE3.-ESTEMATEDRURALANDURBANDISTRIBUTIONSINTHOUSANDSOF1985YUAN

分布的右移通过成对比较年份就更为明显。

图3左边显示2001年农村收入分布比1985年的分布更加分散。

分布从1985年292元到2001年490元（在1985年）的密集度增加了68%。

虽然密集度右移，但偏度从1.28增加为1.39。

2001年分布的众数高度只是1985年最高点的40%，这使峰度从4.95下降到4.86。

城市收入水平和离差（图3右边）比农村的收入水平和离差（左边）增长更快。

而且最低收入水平的住户部分实质下降。

城市分配的众数从1985年的681元，增加为2001年的1634元，同时众数的密度相比于1985年降低25%。

它的分布更加对称—偏度从1.82减少为1.47—反映穷人比重减少而富人比重上升。

峰度从8.28减少为6.05，反映了最高点确实扁平化了。

相比农村的分布，城市最低绝对收入的人口比重（左边尾端的高度）很大程度减少，这有助于解释为何我们所估算的城市地区非平衡更低，特别对MLD方法来说，它给收入贫困人口更大权重。

分布移动的程度有多大？

我们能直接估算两种分布的总体距离与接近程度。

我们在两个分部之间采用一种新的交叠方法，交叉部分是密度函数的共同部分。

这种两个密度函数p（x）和q（x）在实线或子集的统计定义为：

它的值等于图3的B区域。

它严格属于[0，1]。

如果Ω=0，那么p（x）和q（x）是不相交的。

如果Ω=1，那么p（x）和q（x）相等。

我们标记区域B的面积等于1减去两边的Kolmogorov-Smirnov统计值。

因此，基于交叠部分的检验渐近等于Kolmogorov-Smirnov检验。

在整个期间，农村和城市地区密度交叠Ω在每对相邻年份均值各自为0.944和0.922。

相比1985年和2001年的分布，农村地区的Ω（0.544）高于城市地区的Ω（0.236），反映在此期间城市地区变化的累积性影响更大。

六、总体非平衡的分解

农村和城市这种不平等移动对总体非平衡性有什么影响？

为了回答这个问题，我们在农村和城市之间分解了中国总体非平衡。

我们的结果表明在部门部和在部门之间增加的非平衡对总体不平衡的增加都有贡献。

A．总体分布和非平衡

我们将中国的累计收入分配计算为农村和城市分配的人口权重混合。

我们使用结果分配去计算累计分配的非平衡指数。

用pr（x）和pu（x）表示农村和城市的收入分配，我们通过权重加总获得累计的分配：

这里sr和su是农村和城市人口的比重。

在样本期间，城市人口比重从24%稳定增加到38%。

图4描述了1985年和2001年累计分配（实线）与改变比例的农村（点线）和城市（点划线）分配的关系。

通过相应的人口权重农村和城市密度改变了，所以在这两条曲线下面的区域加总等于1。

通过比较1985年和2001年的图表，我们可以看到，在样本期累计分配的总体形状几乎没变，但后者的右尾变得更厚。

在2001年，右尾的累计密度几乎全部由城市密度造成。

表3报告了基尼系数（第2栏）和MLD（第3栏），它们通过估算累计的p（x）获得。

在样本期间，基尼系数增加了34%（从0.310增加到0.415），而MLD几乎增加了1倍（从0.164增加到0.317）。

由于实质的城乡收入差距，总体非平衡比起单独的农村或城市非平衡高得多。

如方程（3）和图4所示，增加的总体非平衡是由于农村和城市分配、两者相互作用以及人口权重的改变。

虽然我们使用了比1997年世界银行报告更少的信息，但这两组估算是非常接近的。

比如，我们对总体基尼系数的估算，1985年为0.310，1995年为0.382（两个研究都覆盖了第一年和最后一年的时期），这实际上与世界银行的估算（1985年为0.31，1995年为0.388）是一样的。

在样本期，中国的基尼系数平均以每年增加0.66个点，也即是说每年2%的增长率。

这种急剧上升非同寻常。

Li，Squire和Zou（1998）指出收入的不平衡性在一个国家部相对稳定（虽然它在国家间变化相当大）。

他们指出中国的基尼系数从1980年到1992年每年增速3%是一个特例。

从1980年代中国作为一个中度非平衡的国家，它现在是发展中国家不平衡性最大的之一。

实际上中国目前的基尼非平衡性欲美国的水平是一样的，美国是OECD国家中基尼系数最高的国家。

B．总体非平衡的分解

如果一个非平衡系数能够被分解为部门的非平衡和部门间的非平衡而不存在部门交叠的相互作用，那么我们就能从人口子群体的系数里推导出总体非平衡系数。

普遍使用的非平衡基尼系数，在这种意义上不能分解，所以我们不能从子群体中计算总体的基尼系数。

尽管如此，MLD是可分解的，所以我们能根据农村和城市的MLDs导出总体的MLD，并显示那种因素对总体MLD随时间的增长有贡献。

MLD系数的分解公式为

这里MLDk是第k个子群体的非平衡性（这里k=农村或城市），μk是第k个子群体的平均收入，sk是第k个子群体的人口比重。

第一项MLDk是部非平衡，即农村或城市部门部的不平衡性。

第二项MLDb是两者之间非平衡，即由于农村和城市地区之间平均收入不同的非平衡。

部门部和部门之间在样本期的计算都相当大的增加（表3第2栏）。

相关值和绝对值的部门之间不平衡增加都比部不平衡大。

部门之间的非平衡从0.053到0.139增长163%，而部门部从0.111到0.178增长61%。

两种增长的结果是，总的MLD非平衡扩大不只一倍。

为了避免年间波动，我们在表4显示了整个时期和3个子时期的非平衡性，即从1985年到1990年，从1990年到1996年，从1996年到2001年。

表4前3栏指出了整个时期和3个子时期总体不平衡性的每年平均变化。

在样本期间，总体的MLD非平衡性从0.16增加到0.32。

虽然在这期间每年的平均增加是0.01，但每年的增长率随时间而变大，由此第3个子时期的平均增加值大于前两个子时期的3倍。

展开阅读全文