第10组实验经济学及其他分支学科
(12000字)
我国城乡家庭贫困脆弱性的影响因素分析 —基于CHNS微观数据的实证研究
李丽1 白雪梅2
摘要:本文使用CHNS四轮的家庭面板数据,对城乡共2638个家庭的脆弱性进行测度,逐层深入地分析脆弱性的影响因素,先用普通回归法筛选影响因素,然后利用标准回归系数和偏相关系数比较各因素的相关重要性,最后用分位数回归对各因素在不同脆弱性水平的影响。
关键词:贫困脆弱性;影响因素;分位数回归
一、导言
传统的贫困研究关注家庭当前的福利状况,用当前收入或消费与贫困线之差的某个函数来测度家庭的贫困状况,并且将其作为扶贫的依据。但是今天的贫困不等于明天的贫困,越来越多的研究者们已经认识到,一个家庭的福利状况不仅取决于其当前的收入和消费,还取决于其在未来的风险。世界银行在2000/2001年度《世界发展报告》中正式提出“贫困脆弱性(vulnerability)”,将其定义为“冲击造成未来福利下降的可能性”,恰恰体现了将风险纳入贫困研究框架、在贫困发生之前预测贫困的前瞻性思想。
扶贫政策不能局限于识别当前的贫困者,而要扩展到识别未来的可能贫困者,即脆弱者,从而将二者都纳入到扶贫政策的瞄准目标中去,采取有合适的措施,阻止那些当前不贫困但未来可能贫困的家庭陷入贫困,帮助那些当前贫困未来可能无法脱离贫困的家庭摆脱贫困。因此,识别脆弱家庭、筛选和比较家庭脆弱性的影响因素,就成为制定和成功实施扶贫政策的关键。 当前,这一领域的研究主要围绕贫困脆弱性测度进行,对贫困脆弱性的影响因素及其他相关问题的探讨还很少。
在贫困脆弱性测度方面,Ligon & Schechter(2003)、Calvo & Dercon(2003)主张计算未来消费的期望效用与确定地取得某种类似于贫困线的消费水平的效用差作为脆弱性测度值; Ravallion(1995)、Glewwe & Hall(1998)、Jalan & Ravallion(1999)用福利变动性测度与风险密切相关的脆弱性;Christiaensen & Boisvert(2000)、Pritchett (2000)、Chaudhuri(2001)、章元&万广华(2005、2009)主张用家庭FGT贫困指标的未来期望值EPα测度脆弱性,对EPα的估计方法因数据而不同,Chaudhuri(2000,2002)和McCulloch et al(2003)分别讨论了截面和面板数据条件下EPα的估计;Cafiero & Vakis(2006) 在传统贫困线中加入覆盖社会注定不能承受的风险所需的费用,得到风险型贫困线,据此计算贫困指标作为脆弱性测度值;Glewwe & Hall(1998)、Amin(1999)、Dercon & Krishnan(2000)用家庭消费支出对冲击的过度敏感性测度脆弱性。其基本思想是如果家庭消费支出与冲击共同变动,说明缺少平滑消费能力,对冲击过度敏感,因而是脆弱的。上述的每种贫困脆弱性测度都有一定的优势和劣势:基于期望效 12
李丽:女,1972年7月生,博士,副教授,山东工商学院统计学院。
白雪梅:女,1949年10月生,博士,教授,博士生导师,东北财经大学统计学院。
用的测度有明确的经济含义,但使用单一效用函数损失了家庭偏好的多样性;基于福利变动性的测度操作简单,但对正向和负向风险同等赋权,不能识别福利变化方向;基于风险型贫困线的测度,直接测度该贫线下的FGT指标,无需建立过多的假设,但测度所需的家庭风险方面的信息不易获得,限制了该测度的应用;基于过度敏感性的测度刻画对已实现风险的应对能力,本质上属于事后型测度;基于期望贫困的测度EPα将风险和风险的福利结果结合起来,具有前瞻性,符合贫困脆弱性的内涵,但需要做出严格的假设。Calvo & Dercon(2005)提出聚焦性、对称性、风险敏感性等脆弱性测度准则,发现虽然已有的脆弱性测度没有一种能够完全满足这些准则,但EPα对准则的满足度最高。特别地,当??0时,EPα简化为收入或消费低于贫困线的概率,因其含义的直观明确成为实证测度中用得最多的方法,本文也将使用这一方法。
在贫困脆弱性的影响因素方面,Dercon(2001)论述了政策、市场、改革、社保的影响;Chaudhuri(2003)从家庭规模、家庭构成、户主特征、职业特征、环境特征等方面筛选影响因素;Kühl(2003)强调户主年龄、户主性别、降雨量、成人数、得病率的影响;Takashi(2002,2006)识别出自营、户主年龄、教育程度、土地数、劳动力市场状况、信贷、家庭财产等因素; Abuka(2007)、Hossain(2007)筛选出家庭规模与结构、户主读写能力、健康状况、非农就业状况、市场状况、户主性别、居住地等因素。对贫困脆弱性影响因素的研究比较单一,除了某些理论上的定性阐述之外,大部分研究者运用回归分析、分组汇总、方差分析等方法筛选影响因素。值得注意的是,各种因素对贫困脆弱性的影响未必同等重要,同一个影响因素对脆弱性分布的顶端和底端的影响机制也可能存在巨大差异。当前的研究尚未对这两个方面进行深入探讨,本文将以此为研究的主要内容。
本文其余部分的结构安排如下:第二部分说明数据来源、变量选择及相关处理;第三部分对家庭脆弱性进行测度;第三部分用普通回归法筛选脆弱性影响因素,比较各因素的重要性;第四部分运用分位数回归法分析各因素对脆弱性分布不同位置上的影响;第五部分给出主要结论和相关的政策建议。
二、数据及变量选择
(一)数据及相关处理
本文数据来源于 “中国营养与健康调查(China Health and Nutrition Survey,CHNS),由北卡罗来纳人口研究中心和中国疾病预防与控制中心营养与食品安全研究所共同组织。迄今共进行了八轮(1989、1991、1993、1997、2000、2004、2006、2008)。调查采用多阶段抽样的方法:依据经济发展程度、地理位置、公共资源的丰裕程度和健康状况指数覆盖了东、中、西部地区的9个省份;每个省抽取两个城市调查点和四个农村调查点,分别是省城、一个较低收入的城市和依据收入分层和一定的权重随机抽取的4个县;城市的城区和郊区随机抽取,县内抽取县城镇和3个村,每村20户。每轮都调查了4000左右个家庭,但各轮都参与的家庭极少。
考虑到时效性和样本量,本文选取了1997、2000、2004、2006四轮都参与的家庭,剔除掉重要变量缺失的家庭,得到了一个容量为2638的样本,其中城镇家庭为671户,农村家庭为1967户。将1997、2000和2004年数据用于测度家庭脆弱性,而将2006年数据用于测度结果的对照。
测度脆弱性需要确定两条标准:一是脆弱性的定义和测量标准,即贫困线;二是脆弱性的评价标准,即家庭脆弱性达到多少才能判定为脆弱,即脆弱线。这两条标准十分重要,但不是本文研究的重点,我们将直接采2美元和观测贫困率作为贫困线和脆弱线3。另外, 3
万广华、章元(2009)研究发现,用2美元贫困线测度脆弱性更准确。Chaudhuri从理论上证明了贫困发
由于数据的复杂性,本文所有数据整理和分析均通过matlab实现。 (二)变量选择
收入和消费是测度贫困脆弱性最常用的维度,CHNS没有提供完整的消费数据,却提供了家庭总收入、家庭净收入和人均家庭净收入,而且这三种数据都分别用名义、按CPI平减到1988年、按CPI折算到2006年的三种形式报告。但是这里所谓的净收入是从总收入中减去了婚嫁、随礼、教育方面的支出,与传统的净收入不是一个概念,而且这样处理之后,许多家庭的净收入出现了负值,不利于进一步的计算和分析。因此,本文用CPI折算到2006年家庭总收入除上家庭规模得到的家庭人均总收入来测度脆弱性。
在脆弱性影响因素方面,借鉴已有的研究成果,从内因和外因两方面入手变量初选。内因方面,主要考虑劳动力、人力资本、物质资本、社会资本、工作状况等家庭特征。外因方面,主要考虑位置、城乡、社区等环境特征。
1.劳动力。以15-59岁的劳动年龄人口数来反映劳动力数量;以家庭规模来间接反映劳动力的负担情况。
2. 家庭人力资本。Schultz(1968) 最早明确地提出了人力资本理论,指出教育、健康、培训和经验都是人力资本的组成部分,其中教育和健康是人力资本的两大基石。这里选择户主受教育年限、劳动年龄人口平均受教育年限作为教育的代表变量;选择身体质量指数(BMI = 体重/身高2)、高血压状况作为健康的代表变量、选择职业技术特征和户主年龄作为技术经验的代表变量。
3.物质资本。CHNS提供了家庭住房、家用电器、交通工具、农业机械,耕地等方面的资产信息。其中,耕地和农业机械属于生产性资产;家电、交通工具虽然不属于生产性的,但也是家庭经济实力的间接佐证,而且某些家庭的交通工具可能用于生产经营;住房拥有自住和投资两种功能,但住房面积和房屋价值信息缺失较多。最终选择房屋出租价值及总资产来反映家庭物质资产水平。
4.社会资本。CHNS中并未专门设计衡量社会资本的问题,但是某些信息可以间接反映家庭社会联系的程度。对于寻常百姓人家,婚丧嫁娶是社会生活中最重要的事情,出席这种场合越是频繁,说明人际关系越好越融洽。另外,家庭拥有医疗保险,就拥有了一张巨大的安全网,可以分散患病风险,持有保险也体现家庭经济实力的高低和家庭所在地的商业或社会保险市场的健全程度。可以这样讲,由婚礼支出反映的人际交往是一种非正规的社会资本,通过持有保险构建的则是一种正规社会资本。因此,选择婚礼支出和医疗保险拥有情况做为社会资本的代表变量。
5.职业特征。工作单位的性质规模也会对家庭福利状况产生很大影响。邢春冰(2005)发现,不同所有制之间工资决定机制有很大差异。王一兵,张东辉(2008)发现,在国营单位工作可使男性收入增加11%。甘犁(2009)针对当前的考公务员热,分析了公共部门和非公共部门的工资差异,发现前者的工资显著高于后者,相当多的国外文献也证实了公共部门存在工资溢价。另外受雇者与自雇者的收入水平和决定机制也有很大差别。CHNS给出了工作地位、工作单位类型信息,分类都很细,如全部以虚拟变量的方式引入,将占用过多的自由度,过细的分类还可能掩盖原本的规律性。基于上述考虑,对原有分类进行整合。对工作单位类型,将政府机关、国有事业单位和研究所和国有企业划分为国有,其他为非国有。将政府机关、国有事业单位和研究所划分为公共部门,其他为非公共。对工作地位,将有雇工
生率脆弱线的科学性,我们所做的另一项研究中详细探讨了贫困线和脆弱线的选择问题,证实了上述选择的合理性。
的个体经营者和无雇工的个体经营者(包括农民)划分为自雇者,其他划分为非自雇者,进而计算相关的职业特征变量。
6. 环境特征。我国城乡之间、东中西部之间家庭的平均福利状况差异很大。在城乡方面CHNS提供地域和户籍两方面的信息,但是鉴于存在同一个家庭既有城镇户口又有农村户口的现象,而本文的研究以家庭为单位,所以选择按地域划分城乡。关于社区,重要的是社区的发达程度,包括交通、市场、医疗、休闲、娱乐、教育等多方面的设施与发展。借鉴已有文献的作法,以医疗服务的可及性来反映社区特征。选取居民一次感冒所需费用和前往就诊单位的时间两个变量,分别计算整个社区所有被调查者这两个变量的平均数作为该社区的代表值。
至此,初选了21个变量备用,如表1所示。可以看到,大部分都不是CHNS的原始变量,而是对原始变量进行加工和匹配得到的。
表1 变量选择表
变量代码 变量名 Inc 家庭人均收入 adultshu 成人数 adultedu 成人平均受教育年限 hedu 户主受教育年限 hbmi 户主BMI pblood 高血压比例 isjigong 有否技术人员 rent 房屋评估租金 asset L145 pins ispub pguzhu isguzhu hage hhsize Deast Dmid Urban illtime illcost 总资产 有否婚礼支出 医保比例 有否公共部门者 自雇者比例 有否自雇者 户主年龄 家庭规模 东部 中部 城市 看病在途时间 一次感冒费用 CHNS对应的变量名 Hhsize, hhincgross_cpi Age A11,age,U1 A11,A5 A5, U3, U2 U4,systol1,diastole B4 L11 L22,L26,L30,L34,L40,L44,L52,L56,L60,L93-133, L143a-i L145 M1 B6a B5 B5 A5,age hhsize T1 T1 urban M15 M21 变量说明 折算到2006年的家庭人均收入 15-59岁人口数 15-59岁人口平均受教育年限 户主受教育年限 BMI>=25或<18 家庭成员高血压者比例 家庭成员中是否有技术管理人员 房屋的租赁价值 农机电器交通资产总和 是否有婚嫁支出(本户的支出除外) 家庭成员有医保的比例 家庭成员中否有公共部门者 家庭成员中自雇者比例 家庭成员是否有自雇者 户主年龄 家庭人口数 =32/37,江苏/山东 =23/41/42/43,黑龙江/河南/湖北/湖南 城市的居委和县城 去医疗机构在途时间的社区平均值 治疗一次感冒的费用的社区平均值 三、家庭贫困脆弱性的测度
借鉴多数研究者的做法,本文将贫困脆弱性定义为家庭下期贫困的概率,并且假设未
lnch,t?1~N(?lnch,t?1,?lnch,t?1),来收入分布服从对数正态分布,用下列公式计算贫困脆弱性:
Vht??lnz??2P?(lnch,t?1)d(lnch,t?1) (1)
其中,ch,t?1下期收入,z为贫困线,p?(c,z)采用FGT贫困指标形式,仅考虑??0的
情况,且以跨期均值和方差为未来收入分布的均值和方差4。 ?lnch,t?11T??lnct (2) Tt?11T?(lncht??lnch,t?1)2 (3) ?T?1t?1 ?2lncht?1鉴于城乡家庭的显著差别,我们运用1997、2000、2004年的数据分别测度城镇和农村家庭的贫困脆弱性。本文以贫困脆弱性的影响因素为研究重点,对家庭脆弱性的测度只是后期分析的基础,因此这里仅以城镇家庭分子群整理的平均脆弱性和脆弱率为例来展示测度结果,不做过多的分析。
表2 分子群整理的贫困脆弱性测度结果
分组 依据 城 镇 组别 35岁以下 35-45 按年龄分组 45-55 55-65 65及以上 文盲 小学 按教育程度分组 初中 高中 大学及以上 脆弱率(%) 41.9 26.1 27.2 34.8 43.1 55.0 32.0 49.5 44.7 33.2 11.9 平均 脆弱性 0.239 按职业特征0.178 0.167 0.198 0.222 0.314 0.189 0.267 0.249 0.191 0.079 按省份分组 分组 部分自营 无自营 黑龙江 江苏 山东 河南 湖南 湖北 广西 贵州 38.5 25.7 15.2 20.0 50.8 51.9 58.8 35.3 50.7 51.1 0.236 0.149 0.102 0.119 0.292 0.307 0.352 0.191 0.262 0.288 分组 依据 组别 全自营 脆弱率(%) 50.6 平均 脆弱性 0.278 四、家庭贫困脆弱性影响因素的筛选和比较
上面的测度结果表明,家庭的教育程度、职业特征、户主年龄和居住地不同,其贫困脆弱性也存在明显差别,说明这些特征确实对家庭的贫困脆弱性有显著影响,除此之外还有一些因素值得关注。为了分析城乡的脆弱性决定机制,我们分别估计各自的脆弱性方程。
uuuVhu??1uX1u??2X2??h
rrVhr??1rX1r??2rX2??h (4)
其中,u和r分别代表城镇和农村,Vh 代表家庭贫困脆弱性测度值,X1代表各种家庭特征变量,包括人力、物质、社会资本等,X2代表各种控制变量,包括城乡、位置、职业等。
1.家庭贫困脆弱性影响因素的筛选 4
未来收入分布估计方法主要有基于跨期均值方差和基于回归结果两大类,万广华、章元(2009)运用CHNS所做的研究结果显示,前者优于后者。
相关推荐: