汪晨 张彤进 万广华:中国收入差距中的机会不均等
2020年09月30日  |  来源:《财贸经济》2020年04期  |  阅读量:13412

(二)中国机会不均等的度量与分解

基于Roemer(1993,1998)提出的环境-努力框架,有关中国机会不均等的研究同样采用了非参数法(江求川等,2014;龚锋等,2017)和参数法(Zhang和Eriksson,2010;史新杰等,2018)。江求川等(2014)运用非参数法测度了我国城市居民面临的机会不均等,并探讨了年龄、性别与区域间的机会不均等差异。龚锋等(2017)采用基于随机参数Logit模型的倾向得分匹配方法,构造所有个体付出最大努力时的反事实收入分布,通过计算反事实收入分布与实际收入分布的机会不均等程度,检验努力的提高能否降低机会不均等。

由于非参数法需要大样本数据,且适用于环境变量较少的情况,因此更多学者采用参数法。Zhang和Eriksson(2010)借鉴Ferreira和Gignoux(2011)的方法,通过删除某个环境变量重新估计模型来估算各环境变量对收入不均等的贡献。使用该方法的还有宋扬(2017)、董丽霞(2018)、史新杰等(2018)。史新杰等(2018)、董丽霞(2018)分别使用CGSS和CHIP数据估算机会不均等,然后利用Shapley值法对机会不均等进行分解。然而,这些研究在收入函数中只引入了环境变量,忽略了努力这一影响个体收入的重要因素,显然会带来遗漏变量偏误。为此,史新杰等(2018)通过将努力方程中的残差作为“纯努力”,以及直接使用努力变量原值(个人受教育程度和移民)两种方法,在收入回归方程中引入努力因素,并运用方差分解方法计算环境和努力的贡献度。

还有一些学者借鉴了Bourguignon等(2007)的参数估计法。陈东、黄旭峰(2015)同样仅考虑了环境变量,使用CHNS数据对我国1989—2009年机会不均等进行了估计和分解。刘波等(2015)、罗良文和茹雪(2019)采用系统估计方法,对收入函数(同时有环境和努力变量)和努力函数(只有环境变量)组成的联立方程组进行了估计。李莹和吕光明(2018)通过设定仅有环境变量以及同时有环境和努力变量的两个收入回归方程,定量分析了环境因素对收入的直接影响与间接影响。雷欣等(2018)分别使用相对收入分位哑变量作为不可测努力变量的代理指标,使用努力决定方程中的残差作为“净努力”,修正了不可测努力变量导致的内生性偏误,以及环境和努力变量相关性造成的测度偏误问题。李莹和吕光明(2016)则将基于回归方程的不均等分解法运用到机会不均等的估算与分解中,但遗憾的是,他们没有很好地处理残差项,收入方程的设定也有待改进。

三、机会不均等的测度方法与数据

(一)收入模型设定

本文基于Roemer(1998)、Roemer和Trannoy(2016)以及Bourguignon等(2007)的分析,将收入的决定因素分为环境、努力以及运气和未知因素三个部分,具体收入决定方程为:

(三)数据与描述性统计

本文所采用的数据来自CGSS,该项目由中国人民大学中国调查与数据中心负责执行。项目采用多阶分层PPS随机抽样法,对中国大陆各省、自治区、直辖市10000多户家庭进行连续性横截面调查,旨在收集微观家户部门多个层面的数据,主要包括个人及家庭其他成员的教育、收入、就业、生活质量等信息。鉴于2010年之前数据不完整,2014年没有调查报告,2011年问卷中问题为“您父亲(母亲)目前的就业状况”,可能存在内生性问题,不符合环境变量的要求,本文最终使用CGSS2010年、2012年、2013年和2015年的数据,以刻画我国机会不均等的变化趋势。考虑到16岁之前个体没有收入来源,本文选择16岁以上人口作为样本。同时,为了避免收入异常值的干扰,本文对收入进行了截尾处理。最后,剔除缺失值得到个体有效样本数量如下:2010年7369个、2012年8718个、2013年8296个、2015年7072个。

本文的被解释变量为个体年收入的自然对数。解释变量包括环境变量和努力变量,变量的描述性统计见表1。基于现有文献(Bourguignon等,2007;Ferreira和Gignoux,2011;Marrero和Rodríguez,2012;史新杰等,2018),我们选取的环境变量如下。(1)父亲受教育程度、母亲受教育程度。借鉴雷欣等(2018)的做法,用父亲受教育年限、母亲受教育年限作为代理变量。没受过教育记为0,小学或私塾教育记为6,初中记为9,普通高中、中专及职业高中记为12,高等教育记为16。(2)父亲职业、母亲职业。职业选择模型通常将个体职业分为企业家、自雇劳动者及雇员(Banerjee和Newman,1993)。依据此分类,结合CGSS数据,我们将父亲职业、母亲职业分为企业家、自雇劳动者、雇员、务农及无业,无业为参照组。其中,自己是老板记为企业家,在自家企业工作、自由职业者、个体工商户记为自雇劳动者,受雇于他人、劳务工、零工记为雇员。(3)14岁时家庭地位。我们将CGSS中“您认为在您14岁时,您的家庭处在哪个等级上”这一问题的答案作为衡量家庭地位的代理变量,受访者在数值1~10中选择答案,取值越大地位越高。(4)年龄及年龄的平方。根据Mincer方程,年龄或者以年龄表征的工作经验是重要的收入影响变量,反映了个体工作资历。(5)性别。性别为二元虚拟变量。男性记为1,女性记为0。(6)出生时户籍。出生时为城镇户籍记为1,农业户籍记为0。(7)居住地。与现有文献仅将居住地划分为东、中、西部(雷欣等,2018;史新杰等,2018)不同,本文将进一步细分至居住地省份。需要说明的是,在2010年、2012年、2013年以及2015年4个年份中,CGSS仅2012年、2013年有出生地信息,我们对2012年和2013年的出生地与居住地指标分别进行回归后发现,两个结果没有显著差异,①并且《中国2010年人口普查资料》显示,在流动人口中,高达92%的人口属于省内流动,绝大多数人口的出生地和居住地属于同一省份。因此,我们最终使用居住地作为出生所在地的替代。

1 2 3 4 5 6
回到顶部