圣才电子书 www.100xuexi.com 十万种考研考证电子书、题库视频学习平台 第10章 自相关:如果误差项相关会有什么结果
10.1 复习笔记
一、自相关的性质 1.自相关的概念 (1)自相关的定义
按时间(如时间序列数据)或者空间(如截面数据)排列的观察值之间的相关关系。 异方差的产生通常与截面数据有关,自相关通常与时间序列数据有关(即数据按照时间顺序排列)。但根据自相关的定义,截面数据中也可能产生自相关问题,这称为空间相关。
(2)自相关的表示形式
在古典线性回归模型中假定扰动项ui不存在自相关。用符号表示为:E(uiuj)=0,i≠j,即两个误差项ui和uj乘积的期望为零。这个假定意味着任一观察值的扰动项不受其他观察值扰动项的影响。但如果误差项之间存在依赖关系,就产生了自相关问题。用符号表示:E(uiuj)≠0,i≠j。
2.自相关的类型
图10-1给出了自相关和无自相关的几种类型。纵轴同时给出了ui(总体扰动项)及相应的ei(残差)。由于无法观察到ui,因而只能通过ei推断ui的变化。
图a~图d表明u中存在明显模式,而图e则表明u中不存在系统模式,这也是无自相关假定的几何解释。
1 / 28
圣才电子书 www.100xuexi.com 十万种考研考证电子书、题库视频学习平台
图10-1 自相关的模式
3.自相关产生的原因 (1)惯性
大多数经济时间序列的一个显著特征就是惯性或者说是迟滞性,即各经济变量的观测值在时间前后存在着关联性。因此,在涉及时间序列数据的回归方程中,连续的观察值之间很可能是互相依赖或是相关的。
(2)模型设定误差
不正确的模型设定是指本应纳入模型的重要变量未纳入模型或是模型选择了错误的函数形式,如果发生这样的模型设定误差,得到的残差则会呈现出系统模式。一个简单的检验方法是将遗漏变量纳入模型,判定残差是否仍然呈现系统模式。如果不存在系统模式,则序
2 / 28
圣才电子书 www.100xuexi.com 十万种考研考证电子书、题库视频学习平台 列相关可能是由于模型设定错误。
(3)蛛网现象
许多农产品的供给都表现出所谓的蛛网现象,即供给对价格的反应滞后一期,因为供给量是由上一期的价格决定,故存在滞后效应,这种滞后效应可能使得误差项前后有关联。
(4)数据处理
在实证分析中,原始数据通常需要加工,数据处理可能导致扰动项呈现某种系统模式,从而引入了自相关。
二、自相关的后果
在误差项不满足无序列相关假定的条件下,即存在序列相关时,普通最小二乘估计会产生如下后果:
1.最小二乘估计量仍然是线性的和无偏的。
2.最小二乘估计量不是有效的。即OLS估计量的方差不是最小的。简言之,普通最小二乘(OLS)估计量并不是最优线性无偏估计量(BLUE)。
3.OLS估计量的方差是有偏的。通常计算方差和OLS估计量标准误的公式会严重低估真实的方差和标准误,从而导致t值变大,因此回归系数表面上看显著不为零,但事实却并非如此。
4.通常所用的t检验和F检验是不可靠的。
5.计算得到的误差方差,σ2=RSS/df(残差平方和/自由度),是真实σ2的有偏估计量,并且很可能低估了真实的σ2。
6.通常计算的R2不能测度真实的拟和优度。 7.通常计算的预测方差和标准误也是无效的。
3 / 28
∧
圣才电子书 www.100xuexi.com 十万种考研考证电子书、题库视频学习平台 可见,自相关的后果与异方差相似,也是严重的。因此,与异方差情形相同,在实际应用中必须确定是否存在自相关问题。
三、自相关的诊断 1.图形法
与异方差情形相同,通过直接观察OLS残差e来判断误差项u中是否存在自相关。有多种不同的残差图形的检验方法。
(1)残差e对时间的散点图
可以用残差对时间作图,如果随着时间的变化,残差呈现出某种有规律的趋势,则可能存在着自相关。图10-2是回归的残差关于时间的时序图,从图可以看出:残差e并不是随机分布的,而是呈现出明显的变动模式——开始是正的,接着变成负的,然后是正的,再然后是负的,最后又是正的。图形展示了这样一种趋势:残差的递差之间正相关,表明序列存在着正的自相关。
图10-2 残差关于时间的时序图
4 / 28
圣才电子书 www.100xuexi.com(2)et对et-1的散点图
十万种考研考证电子书、题库视频学习平台 用残差et对其滞后一期的et-1作散点图,如果随着et-1的增加,et有不断递增的趋势,即大部分点都落在一、三象限,则误差项存在着正相关;如果大部分点都落在二、四象限,则误差项存在着负相关。
2.德宾-沃森d检验
(1)德宾-沃森d统计量的假设
①回归模型包括截距项。因此,d统计量无法判断过原点回归模型的自相关问题。 ②变量X是非随机变量,即在重复抽样中变量X取值是固定的。 ③扰动项ui的生成机制如下: ut=ρut-1+vt,-1≤ρ≤1(10-1)
表明t期的扰动项或误差项与t-1期值和一个纯随机项vt有关。ρ度量了对前期值的依赖程度,称为自相关系数,介于-1和1之间。式(10-1)称为马尔可夫一阶自回归过程,简称一阶自回归过程,通常记为AR(1)过程。
④解释变量中不包含因变量的滞后值。换言之,该检验对下面的模型是不适用的: Yt=B1+B2Xt+B3Yt-1+ut(10-2)
式中Yt-1是因变量Y的一期滞后。形如式(10-2)的回归方程称为自回归模型——变量对其滞后一期的回归。
(2)德宾-沃森d统计量的定义
d=?(et?et?1)t=22e?tt=1nn2 (10-3)
5 / 28
相关推荐: