西南财经大学2009级博士研究生高级计量经济学学习指南
某些非参数线性的模型,可以通过对解释变量和被解释变量进行一定的线性变形,可以转换为参数线性模型,比如对数线性模型、半对数线性模型、超对数线性模型等;另一是指有利于推导参数估计量的统计分布以及进行推断分析。
第二,满秩性条件,它是为了保证条件期望的唯一性,参数可求解,同时,此项假设在本课程的学习过程,将会在多处(特别是在某些推导过程中)涉及。
第三,外生性条件,表示随机扰动项中不包含有解释变量的任何信息。注意,外生性条件的不同表述方式和内涵。外生性条件的违反将影响到参数估计的一致性问题。
第四,球形扰动,是指随机扰动项的方差-协方差矩阵为同方差和无自相关同时成立时的情况。违反此假设条件,被称为非球形扰动,将会影响到参数估计的有效性问题。
第五,数据生成过程的外生性条件指变量数据的生成过程是独立的,不受其他变量和扰动项的影响。
第六,正态性条件,它主要与我们的统计检验和推断有关,但在大样本的条件下,根据中心极限定理这个条件是可以放宽的。
在后期的学习过程中,将逐渐放宽这些假设条件,从而对于这些假定的进行深入理解。
3、最小二乘法
以估计的残差平方和最小的原则确定样本回归函数,称为最小二乘准则。在古典假定下的最小二乘法,也称为普通最小二乘估计(简记为OLS)。
对于多元回归模型,
残差平方和S=e'e=(Y-Xβ)'(Y-Xβ) =Y'Y-β'X'Y-Y'Xβ+β'X'Xβ
?Y'Y-2β'X'Y+β'X'Xβ
我们的目标是使得回归的残差平方和达到最小,即:
S minβ则它的一阶条件为:
?S?β=-2X'Y+2X'Xβ
满秩化简得:X'Y=X'Xβ????β=(X'X)-1X'Y
- 9 -
西南财经大学2009级博士研究生高级计量经济学学习指南
以上是属于初中级计量中的做法。
而在本课程的学习中,,我们需要从矩条件对最小二乘进行理解。 关于矩将在后面部分中详细提到,这里只是应用该知识点。 由外生性条件E[ε|X]?0可得:
E[XTε]?0
从而: E[XTε]?EX[T(y-Xβ)?] 0用样本矩替代总体矩,则可以得到:
?11TX(y-Xb)?0。 n?1??1?所以有:β=b=?XTX??XTy?。
?n??n?1、注意XX的意义。 若记Ω为参数估计量的方差-协方差矩阵的估计,则有
(1)s2T?XTX??Ω
?1(2)s?(3)s221e?e n?kT?1?XX?为对称阵,对角线元素是b1,b2,bk的方差,非对角线元素为相应
的协方差;
2、应用。可以在多个场合应用。例如,检验某些回归系数是否满足某些约束,如?2??3?a。注意,这种情形是否可以采用Wald检验统计量? 通常情形采用t-检验统计量进行检验。 H0:?2??3?a
t??b2?b3????2??3??Var??b2?b3????2??3???b2?b3??a Var??b2?b3??a? ??b2?b3??a Var?b2??Var?b3??2Cov?b2,b3?2其中:Var?b2?,Var?b3?,Cov?b2,b3?分别为s当t-值大于2,拒绝H0,否则,接受H0。
?XTX?中相应位置上的元素。
?1
- 10 -
西南财经大学2009级博士研究生高级计量经济学学习指南
4、最小二乘估计的一些性质 代数性质
(1)残差平方和等于0,即?iei?0; (2)回归线经过均值点,即y?X'b;
(3)回归的预测值的平均值等于实际值的均值,即y?y。 但注意这些代数性质只有在回归方程中包含了常数项下才成立。 投影及投影定理
M矩阵的定义与作用;M0矩阵的定义与作用;两者的区别与联系
定理3.1-3.3以及推论3.3.1-3.3.2的理解与把握。 5、双残差回归
对于双残差回归,首先考察它的由来,然后进一步讨论由它引申出的一些性质。
(1)残差的定义
由e=Y-Xb,可以得到:e=Y-X(X'X)-1X'Y=(I-X(X'X)-1X')Y=MY 其中M=I-X(X'X)-1X',它是一个对称幂等矩阵,存在M=M',M2=M的性质。因此MY表示了Y对X回归得到的残差。
(2)双残差回归
我们记:Y=Xβ+ε=X1β1+X2β2+ε
?和X? 两边同时左乘X12,并用矩阵表示可以得到:
'?X1X1 ?'??X2X1''?1X1X2??b1?XY????=?'? 'X2X2???b2???X2Y?? 利用分块矩阵求逆的公式可以得到:
''''''b1=(X1X1)-1X1Y-(X1X1)-1X1X2b2=(X1X1)-1X1(Y-X2b2)
再带回到方程中,并整理可以得到:
b2=[X2'(I-X1(X1'X1)-1X1')X2']-1[X2'(I-X1(X1'X1)-1X1')Y]
- 11 -
西南财经大学2009级博士研究生高级计量经济学学习指南
**-1* ?(X2'M1X2)-1(X2'M1Y)=(X)2X Y2'X2*其中:M1=I-X1(X1'X1)-1X1',X*2=M1X2,Y=M1Y
Y*表示了Y对X1回归得到的残差e1,对上式进行理解: X*2表示了X2对X1回归得到的残差e2,即:b2=(e2'e2)-1e2'e1。它表示的是残差e1对残差e2回归的参数估计。进一步理解:残差e1中扣除了Y中包含的X1的信息;残差e2扣除了X2中包含的X1的信息。因此双残差(e1、e2)回归仅反应了,在扣除了X1的影响,
X2对Y的作用情况,同样说明了系数b2表示的是变量X2与Y的偏相关。
同样,b1的表示与b2一样,它们是一种对称的关系。 (3)经济解释与实际应用
双残差回归得到的偏回归系数与统计中的偏相关系数是密切联系的,但不是严格意义上的偏相关系数。所谓偏相关系数,就是扣除了中间变量影响后的相关系数。它与简单相关系数的一个主要区别在于,通常情况下,简单相关系数不仅包含了两个变量之间的直接相关关系,还包括了变量间的间接相关关系(通过中间变量的相关性传导)。一种极端的情况是:变量间的相关关系完全是由间接相关关系引起的。如果是这样,那么在控制了中间变量的影响之后,两个关注变量之间就表现为不相关。又或者说,两个变量之间的简单相关关系是一种负相关的关系,但是在控制了中间变量影响后就可能表现为正相关。
举例来说,假设回归方程为y?X??Z???,要计算y与Z之间的偏相关系数,具体的计算步骤如下:
(1)y对X进行回归,得到回归残差y*?My(M?I?X(X?X)?1X?) (2)Z对X进行回归,得到残差Z*?MZ
(3)y与Z之间的偏相关系数就是y*与Z*之间的简单相关系数。可以简单的写成平方形式为:
?*2yz(Z*?y*)2? (残差的均值为零,上下N消去,可证明) (Z*?Z*)(y*?y*)- 12 -
相关推荐: