|
内容摘要:本文利用马尔可夫转移概率矩阵对我国城乡居民收入的状况展开分析。不同以往研究,本文在分析中侧重对居民内部各个阶层演变情况进行分析。研究发现我国城镇居民高收入阶层要比低收入阶层的收入增加更快,而我国农村居民的内部各阶层的演变情况正相反,低收入阶层的收入改善情况要好于高收入阶层的收入改善情况。但是农村居民的收入演进比例要整体上低于城镇居民的收入演进比例。
关键词:居民收入 马尔可夫 转移概率
收入差距和收敛问题一直以来受到人们的广泛关注,在理论研究的过程中,Gini系数、Theil指数、Kernel密度估计、偏度、峰度等众多方法得到了广泛应用。在这些研究中,或对我国居民收入分布状况的纵向变化过程给予阐述,或分析了我国区域间的收入分布横向差异状况,并给出了大量的建议。而深度分析居民内部群体的收入动态演进过程的则少有涉及,本文拟利用马尔可夫转移概率矩阵来对我国城乡居民内部群体的演变过程进行分析,以期对我国有关方面进行相关决策提供帮助。
马尔可夫链
设{ξn,n =1,2…}是一个随机序列,状态空间E为有限或可列集,对于任意的正整数m、n,若i、j,i∈E(k=1,2,…,n-1),则有:
P{ξn+m= j│ξn-1= i,ξn-1= in-1,…,ξ1= i}=P{ξn+m= j│ξn= i}
则随机序列{ξn,n =1,2,…}就被称为马尔可夫链(Markov Chains)。
马尔可夫链(Markov Chains)因安德烈马尔可夫得名,是具有马尔可夫性质的离散时间随机过程,在该随机过程中,在给定当前信息的情况下,只有当前的状态用来预测将来, 过去(即当前以前的历史状态)对于预测将来(即当前以后的未来状态)是无关的。安德烈马尔可夫在1906年首先做出了这类过程。而将此一般化到可数无限状态空间是由柯尔莫果洛夫在1936年给出的。
在马尔可夫分析中,引入了“状态转移”这个概念。所谓状态是指客观事物可能出现或存在的状态;状态转移概率是指客观事物由一种状态转移到另一种状态的概率,如果用概率论的语言来描述的话,即概率论中的条件概率P(A│B)表达的状态B向状态A转移的概率。若完全表达所研究的对象的所有变化过程可以用状态转移概率矩阵描述。
该矩阵表示研究对象共存在n中状态,式中P11表示研究对象从状态1出发,下一步转移到状态1的概率;P1n表示研究对象从状态1出发,下一步转移到状态n的概率。
马尔可夫状态转移概率矩阵不仅可以描述研究对象的发展演变情况,而且还常被用于各种预测。本文将借助马尔可夫状态转移概率矩阵来描述我国城乡居民收入的内部转移情况。
马尔可夫链在收入分析中的应用
对于居民来讲,一般下一个年度的收入状况是取决于本年度的收入状况,与以往年度的收入状况关联性较小,因此可以将居民的收入变化过程视为“无后效性”的马尔可夫过程。基于这样的推断,本文利用马尔可夫链转移概率矩阵来观察居民收入状态的变化情况。
首先根据收入水平情况将我国城乡居民分成若干个收入阶层,每一个阶层对应的收入区间就是马尔可夫链中的各个状态,某种状态的转移对应的就是某个阶层的收入演变。状态的转移概率Pij可如下所示:
在上面公式中,Pij为从状态i转移到状态j的概率。Nij为在考察期间,从i状态向状态j转移出现的次数,Ni为从状态i转移的总次数。
通过对上面公式的进一步推导,可以得出各个收入阶层的状态转移概率矩阵,即分别计算我国城乡居民的各个收入阶层的收入转移概率。通过马尔可夫链转移矩阵可以了解各个收入阶层的转变情况,以掌握各个收入阶层在收入增长的过程中的增长差异。
城乡居民收入演变的实证分析
(一)指标选取
在对我国城乡居民的收入演变分析时,本文采用历年统计年鉴中的数据。由于我国城乡二元结构明显,因此在选取数据时将对城镇和农村居民分别分析。城镇居民收入确认的指标,选择城镇居民可支配收入指标,而农村居民则选择农村居民纯收入指标。
(二)城镇居民可支配收入指标分析
两个研究总体各自的分组也存在差异。对城镇居民可支配收入指标分析时,采用的分组标准是统计年鉴中的最低收入户(10%)、低收入户(10%)、中等偏下收入户(20%)、中等收入户(20%)、中等偏上收入户(20%)、高收入户(10%)、最高收入户(10%)的7分组方式。在统计年鉴中原统计数据分为7组,但为了更好地保持各个组别的等距性,即保证各个收入阶层有一个可比的收入差距。本文将中等偏下收入户(20%)、中等收入户(20%)、中等偏上收入户(20%)分别拆分成10%比例。这样把所有的城镇居民分成了10个组别,本文将每个组别视为一个转移阶层。然后按等差距的收入划分为4000以下,4000-6000,6000-8000,8000-10000,10000以上五种状态,本文分别用L1,L2,L3,L4,L5来代表上述五种状态。对于城镇居民收入的分布特征演变过程的描述,文中选择1995-2007年的数据来加以说明。则这10个阶层在五种状态中的转移概率矩阵如矩阵1所示。
从马尔可夫转移概率矩阵中显示:从低到高收入群体转移频率逐次为:0.2069,0.2667,0.3478,0.4286。这表示:在1995-2007年间,收入从L1状态变化至L2状态的转移概率(比例)为0.2069,而向更高收入阶层的转移概率(比例)则为0,即上一年度收入为4000以下的个体,在下一个年度中没有一个人收入变为6000以上,有20.69%的个体成为4000-6000的收入阶层的一员,其余的79.32%个体的收入仍在4000元以下。其他数据依此类推。从中可以发现,在L1收入阶层向L2转换比率为0.2069的同时,L2,L3,L4状态向更高收入阶层的转换比例却分别为0.2667,0.3478,0.4286,呈转换概率递次上升特征。
从以上分析可以看出,在我国城镇收入水平越高,其提升到更高一个收入级别的比例越高,换句话说高收入群体的收入增速更快,而低收入群体的收入提升则相对困难。据此数据,可以推断我国的城镇居民间的收入差距在逐渐扩大,并且滞留于相对低收入阶层的比例在逐渐变大。
(三)农村居民纯收入指标分析
农村居民收入的分组选择国家统计年鉴中的标准,在该分组中,将我国农村居民的年纯收入分为“1000以下”到“5000以上”共20个组别。将收入阶层的收入差距等距划分为1000以下,1000-2000、2000-3000、3000-4000、4000-5000、5000以上6个组别,每个组别代表一种状态,分别用L1,L2,L3,L4,L5,L6来表示。鉴于1996年的分组数据与其他年份存在差异,为了使分析的数据更加具有一致性,本文选择了1997-2007年间的统计数据来进行分析。由于年鉴中给出的农村居民统计数据是反映每种状态下个体的比例情况,因此不能直接明确每个阶层,也就无法直接观察阶层的转变情况,但是我们可以通过对比每种状态下个体的比例数据变化来推导。经处理后,农村居民在上述6种状态中转移的比率(概率)可以用矩阵2来表示。 |
|