§2.5 一元线性回归模型的置信区间与预测
多元线性回归模型的置信区间问题包括参数估计量的置信区间和被解释变量预测值的置信区间两个方面,在数理统计学中属于区间估计问题。所谓区间估计是研究用未知参数的点估计值(从一组样本观测值算得的)作为近似值的精确程度和误差范围,是一个必须回答的重要问题。
一、参数估计量的置信区间
在前面的课程中,我们已经知道,线性回归模型的参数估计量?是随机变量
^yi的函数,即:???ky,所以它也是随机变量。在多次重复抽样中,每次
?ii1的样本观测值不可能完全相同,所以得到的点估计值也不可能相同。现在我们用参数估计量的一个点估计值近似代表参数值,那么,二者的接近程度如何?以多大的概率达到该接近程度?这就要构造参数的一个区间,以点估计值为中心的一个区间(称为置信区间),该区间以一定的概率(称为置信水平)包含该参数。
??a,???a之中,以及如何求得a。 即回答?1以何种置信水平位于?11在变量的显著性检验中已经知道
??t??i??is^?i^~t(n?k?1) (2.5.1)
这就是说,如果给定置信水平1??,从t分布表中查得自由度为(n-k-1)的临界值t?,那么t值处在?t?2,t?2的概率是1??。表示为
2??P(?t??t?t?)?1??22
即
P(?t??2?i??is^?i^?t?)?1??2
P(?i?t??s^??i??i?t??s^)?1??2^^?i2?i
于是得到:在(1??)的置信水平下?i的置信区间是
(?i?t??s^,?i?t??s^)2^^?i2?ii=0,1 (2.5.3)
在某例子中,如果给定??0.01,查表得
t?(n?k?1)?t0.005(13)?3.0122
??102.3,???0.21,S?15,S?0.01 从回归计算中得到???01??01 根据(2.5.2)计算得到?0,?1的置信区间分别为?57.12,147.48?和(0.1799,0.2401)
显然,参数?1的置信区间要小。
在实际应用中,我们当然希望置信水平越高越好,置信区间越小越好。如何才能缩小置信区间?从(2.5.3)式中不难看出:(1)增大样本容量n。
在同样的置信水平下,n越大,从t分布表中查得自由度为(n-k-1)的临界值
t?2越小;同时,增大样本容量,在一般情况下可使估计值的标准差S??减小,因为式中分母的增大是肯定的,分子并不一定增大。(2)更主要的是提高模型的拟合度,以减小残差平方和?ei2。设想一种极端情况,如果模型完全拟合样本观测值,残差平方和为0,则置信区间也为0。(3)提高样本观测值的分散度。在一
般情况下,样本观测值越分散,标准差越小。置信水平与置信区间是矛盾的。置信水平越高,在其他情况不变时,临界值
t?2越大,置信区间越大。如果要求缩小
置信区间,在其他情况不变时,就必须降低对置信水平的要求。
二、预测值的置信区间
1、
点预测
计量经济学模型的一个重要应用是经济预测。对于模型
yi??0??1xi?ui,i?1,2,?,n
如果给定样本以外的解释变量的观测值xf,有
yf??0??1xf?uf
因xf是前述样本点以外的解释变量值,所以uf和ui?i?1,2,?,n?是不相关的。引用已有的OLS的估计值,可以得到被解释变量yf的点预测值:
????x (2.5.4) ?f??y01f但是,严格地说,这只是被解释变量的预测值的估计值,而不是预测值。原因在于两方面:一是模型中的参数估计量是不确定的,正如上面所说的;二是随机项的影响。所以,我们得到的仅是预测值的一个估计值,预测值仅以某一个置信水平处于以该估计值为中心的一个区间中。于是,又是一个区间估计问题。
2、
区间预测
如果已经知道实际的预测值yf,那么预测误差为
?f ef?yf?y显然,ef是一随机变量,可以证明
?fE?ef??E?yf?y?????x?E??0??1xf?uf??E?01f ??0??1xf???0??1xf??0而
??
?f??Cov?f,y?f?yf,yf??2Cov?yf,y?y?Cov2?f??2Cov?f?yf,y??u?D?y?f,yf?y?f?ef,ef??Cov?yf?yD?ef??Cov???
?f由原样本的OLS估计值求得,而yf与原样本不相关,故有: 因为y2?f??0,D?ef???u?f? Cov?yf,y?D?y可以计算出来:
??1?f????D?y?n??xf?x2??x?x?ii?1n????2 (2.5.5) ?u????1D?ef???1???n??xf?x??xi?1ni?x?2????2?u (2.5.6) ???f和ef均服从正态分布,可利用它们的性质构造统计量,求区间预测值。利因y?f构造统计量为: 用yNy?f??f?E?yf?y????x?xf?1???2un?n?2??x?x?i??i?1??~N?0,1?
22?u将?u用估计值?代入上式,有
相关推荐: