阵,当误差项存在异方差时。)
例4:GMM estimator with clustering
有关于年轻女性的1968年—1988年NLS(National Longitudinal Survey)工资调查数据,我们想要拟合一个工资模型,工资是年龄、年龄的平方、工作任期、出生年份和教育水平的函数。我们认为影响女性工资水平的随机冲击,也会影响她的工作任期,所以我们把tenure看作内生的。额外的工具变量包括,是否加入工会,在过去的一年工作周数,婚姻状况。因为每名女性都有多个观测值(对应于多年的跟踪调查),所以我们要为每个人进行聚类。
use nlswork,clear
ivregress gmm ln_wage age c.age#c.age birth_yr grade (tenure = union wks_work msp), wmatrix(cluster idcode)
工作任期和教育年限对工资有显著的正效应。
有关GMM估计更多的内容,参见Baum (2006);Baum,Schaffer和Stillman (2003, 2007);Cameron & Trivedi (2005);Davidson & MacKinnon (1993, 2004);Hayashi (2000);Wooldridge (2010)。参见Newey & West (1987),Wang & Wu (2012)对于HAC协方差矩阵估计的介绍。
例5:Mincer收入方程遗漏变量的处理
Mincer(1958)最早研究了工资与受教育年限的正相关关系,但遗漏了“能力”这个变量,导致遗漏变量偏差。使用美国面板调查数据(NLS)中的年轻男子组,采用工具变量法处理遗漏变量的问题。
该数据集包括以下变量:lw(工资对数),s(受教育年限),age(年龄),expr(工龄),tenure(在现单位的工作年数),iq(智商),med(母亲的受教育年限),kww(在“knowledge of the World of Work\测试中的成绩),mrt(婚姻虚拟变量,已婚=1),rns(美国南方虚拟变量,住在南方=1),smsa(大城市虚拟变量,住在大城市=1),year(有数据的最早年份,1966-1973年中的某一年)。这是一个两期面板数据。
use grilic,clear correlate iq s
5
(智商(在一定程度上可视为“能力”的代理变量)与受教育年限具有较强的正相关关系(相关系数为0.51))
regress lw s expr tenure rns smsa,r
(先用OLS回归作为一个参照系,并使用稳健标准差。)( 回归结果显示,教育投资的年回报率为10.26%,而且在1%的水平上显著地不为0。这意味着,多受一年教育,则未来的工资将高出10.26%,这个教育投资回报率似乎太高了。可能的原因是,由于遗漏变量“能力”与受教育年限正相关,故“能力”对工资的贡献也被纳入教育的贡献,因此高估了教育的回报率。)
regress lw s iq expr tenure rns smsa,r
(引入智商(iq)作为“能力”的代理变量,再进行OLS回归。)( 加入“能力”的代理变量iq后,教育投资的回报率下降为9.28%,变得更为合理些,但仍然显得过高。)
ivregress 2sls lw s expr tenure rns smsa (iq=med kww mrt age),r
(由于用iq来度量能力存在“测量误差”,故iq是内生变量,考虑使用变量(med, kww,mrt, age)作为iq的工具变量,进行2SLS回归,并使用稳健标准差。)( 在此2SLS回归中,教育回报率反而上升到13.73%,而智商(iq)对工资的贡献居然为负,似乎并不可信。使用工具变量法的前提是工具变量的有效性。为此,进行过度识别检验,考察是否所有工具变量均外生,即与扰动项不相关。)
estat overid
( 结果强烈拒绝“所有工具变量均外生”的原假设(p值为o.oooo),即认为某些(或某个)工具变量不合格(invalid),与扰动项相关。)
ivregress 2sls lw s expr tenure rns smsa (iq=med kww),r first
(考虑仅使用变量((med, kww)作为iq的工具变量,再次进行2SLS回归,同时显示第一阶段的回归结果。)( 上表显示,教育投资回报率降为6.08%,比较合理;而且iq的贡献也重新变为正。)
estat overid
(再次进行过度识别检验。)( 由于p值为0.7,故接受原假设,认为(med, kww)外生,与扰动项不相关。)
estat firststage ,all forcenonrobust
6
(进一步考察有效工具变量的第二个条件,即工具变量与内生变量的相关性。从第一阶段的回归结果可以看出,工具变量(med, kww)对内生变量iq均有较好的解释力,p值都小于0.01。)( 从以上结果可以看出,虽然Shea's partial R2,不到0.04,但F统计量为13.40(超过10),而且F统计量的p值为0.0000。我们知道,虽然2SLS是一致的,但却是有偏的,故使用2SLS会带来“显著性水平扭曲” (size distortion),而且这种扭曲随着弱工具变量而增大。上表的最后部分显示,如果在结构方程中对内生解释变量的显著性进行“名义显著性水平”(nominal size)为5%的沃尔德检验,假如可以接受“真实显著性水平’' (true size)不超过15%,则可以拒绝“弱工具变量”的原假设,因为最小特征值统计量为14.91,大于对应的临界值11.59)
ivregress liml lw s expr tenure rns smsa (iq=med kww),r
(总之,我们有理由认为不存在弱工具变量。但为了稳健起见,使用对弱工具变量更不敏感的有限信息最大似然法(LIML))( 结果发现,LIML的系数估计值与2SLS非常接近,这也从侧面印证了“不存在弱工具变量”。)
quietly reg lw iq s expr tenure rns smsa estimates store ols
quietly ivregress 2sls lw s expr tenure rns smsa (iq=med kww) estimates store iv
hausman iv ols,constant sigmamore
(使用工具变量法的前提是存在内生解释变量。为此须进行豪斯曼检验,其原假设为“所有解释变量均为外生”,即不存在内生变量。)( 上表显示,可以在5%的显著性水平上拒绝“所有解释变量均为外生”的原假设,即认为iq为内生变量。由于传统的豪斯曼检验建立在同方差的前提下,故在上述回归中均没有使用稳健标准差(没有用选择项“r”)。)
estat endogenous
(由于传统的豪斯曼检验在异方差的情形下不成立,所以进行异方差稳健的DWH检验)(DWH检验的p值小于0.05,故可认为iq为内生解释变量(在5%的显著性水平上)。)
ivregress gmm lw s expr tenure rns smsa (iq=med kww)
7
(如果存在异方差,则GMM比2SLS更有效率。为此,进行最优GMM估计。)(两步最优GMM的系数估计值与2SLS很接近。)
estat overid
(进行过度识别检验。由于p值为0.7,故认为所有工具变量均为外生。考虑迭代GMM)
ivregress gmm lw s expr tenure rns smsa (iq=med kww),igmm (容易看出,迭代GMM与两步GMM的系数估计值相差无几。)
如果希望将以上各种估计法的系数估计值及其标准差列在同一张表中(有时,在论文中也采用类似的表格,便于对各种估计法的结果进行比较。),可使用以下命令:
quietly reg lw s expr tenure rns smsa,r estimates store ols_no_iq
quietly reg lw iq s expr tenure rns smsa,r estimates store ols_with_iq
quietly ivregress 2sls lw s expr tenure rns smsa (iq=med kww),r estimates store tsls
quietly ivregress liml lw s expr tenure rns smsa (iq=med kww),r estimates store liml
quietly ivregress gmm lw s expr tenure rns smsa (iq=med kww) estimates store gmm
quietly ivregress gmm lw s expr tenure rns smsa (iq=med kww),igmm estimates store igmm
estimates table ols_no_iq ols_with_iq tsls liml gmm igmm
8
相关推荐: