表3.3.1 一元线性回归模型计算表 单位;亿元
年 份 1986 1987 1988 1989 1990 1991 1992 1993 1994 1995 1996 1997 1998 1999 2000 2001 2002 2003 合计 固定资产投 资完成额x 241.23 317.12 371.87 320.23 356.3 439.98 711.7 1144.2 1331.13 1680.17 1949.53 2203.09 2535.5 2744.65 2995.43 3304.96 3849.24 5335.8 31828.13 国内生产总值y 744.94 924.33 1208.85 1321.85 1416.5 1601.38 2136.02 2998.16 4057.39 5155.25 6004.21 6680.34 7199.95 7697.82 8584.73 9511.91 10631.75 12451.8 90323.18 x2 58191.91 100565.1 138287.3 102547.3 126949.7 193584.4 506516.9 1309194 1771907 2822971 3800667 4853606 6428760 7522129 8972601 10909545 14816649 28470762 92905430 y2 554935.6 850694.6 1461318 1747287 2006472 2564418 4562581 8988963 16462414 26576603 36050538 44626943 51839280 59256433 73663254 90476432 113034108 155047323 689769996 xy 179701.9 292489.3 449535 423296 504699 704575.2 1520205 3430495 5400914 8661696 11705388 14717390 18255473 21112426 25708967 31417458 40924157 66440314 251849180.4 数据来源:《江苏统计年鉴》 试配合适当的回归模型并进行显著性检验;若2004年该省固定资产投资完成额为5922亿元,当显著性水平?=0.05时,试估计2004年其国内生产总值的预测区间。
解:
1.绘制散点图
设国内生产总值为y, 固定资产投资完成额为x,绘制散点图(图略),由散点图可以看出两者呈线性关系,可以建立一元线性回归模型。
2.设一元线性回归方程为
??a?bx y3.计算回归系数
列表计算有关数据(见表4.8.1),并计算出回归系数估计值:
n?xy??x?y18?251849180?31828?90323??2.51562 =b?22218?92905430?31828n?x?(?x)1818??569.76?2.51562所求回归预测方程为:yx
y??x9032331828????2.51562??569.76 a?b=
nn4.检验线性关系的显著性
由于在一元线性回归情形,相关系数检验、F检验、t检验的结果一致,此处仅给出相关系数检验。
13
R?n?xy??x?yn?x?(?x)22n?y?(?22y)2
18?251849180?31828?9032318?92905430?31828?18?689769995?903232?0.9899
当显著性水平?=0.05,自由度=n-m=18-2=16时,查相关系数临界值表,得
R0.05(16)?0.4683,因
R=0.9899>0.4683?R0.05(16)
故在??0.05的显著性水平上,检验通过,说明两变量之间线性相关关系显著。 5.预测
(1)计算估计值的标准误差
sy??y2?xy??y?b?a?n?2
689769995?569.76?90323?2.51562?251849180?544.9
18?2(2)当显著性水平??0.05,自由度=n-2=18-2=16时,查t分布表得:
t0.025(16)?2.1199
=
(3)当x0?5922亿元时,代入回归方程得y的点估计值为:
?0?569.76?2.51562yx?569.76?2.51562?5922?15469.1 (亿元)
预测区间为:
?0?t?2(n?2)?sy1?yn(x0?x)1?22nn?(?x)2?x
118?41542?15469.1?2.1199?544.9?1??21818?92905430?31828=15469.1?2.1199?544.9?1.52669 =15469.1?1763.5
即:当2004年全省固定资产投资完成额为5922亿元时,在??0.05的显著性水平上,国
内生产总值的预测区间为:13705.6~17234.6亿元之间。
? 一元线性回归模型研究的是某一因变量与一个自变量之间的关系问题。但是,客观现
象之间的联系是复杂的,许多现象的变动都涉及到多个变量之间的数量关系。
? 研究某一因变量与多个自变量之间的相互关系的理论和方法就是多元线性回归模型。 3.4 多元线性回归预测法
3.4.1 多元线性回归模型及其假设条件
设所研究的对象受多个因素x1,x2,?,xm的影响,假定各个影响因素与y的关系是线性的,
这时就需要建立多元线性回归模型: y??1x1??2x2????mxm?u
14
给定变量y,x1,x2,?,xm的一组观测值yi,x1i,x2i,?,xmi,对应地有
yi??1x1i??2x2i????mxmi?ui,i?1,2,?,n
若取x1的观测值恒等于1,即对任意i有xi1=1,则式变为:
yi??1??2x2i????mxmi?ui,i?1,2,?,n
即
?y1??1??2x21????mxm1?u1?y????x????x?u?21222mm22 ??????????????????yn??1??2x2n????mxmn?un用矩阵形式表示为
?y1??1x21?y??1x22?2?????????????yn??1x2n即
?xm1???1??u1?????u??xm2????2???2?
???????????????xmn???m??un? Y?XB?u
其中
?y??1??y? Y??2???????yn??1? ?1X?????1?xxx2122?2n?????u1???1??? ???m2??u2?2?u??B??????????????????xmn???un??m???m1xx多元线性回归模型的基本假设条件如下:
假设1:E(ui)?0,i?1,2,???,n ,即
?u1??E(u1)??0??u??E(u)??0?22???? E(u)=E???????????????????uE(u)n??0??n??
假设2:D(ui)?E(ui)??u,i?1,2,???,n
22Cov(ui,uj)?E(ui,uj)?0,i?j,i,j?1,2,???,n
用矩阵形式表示为
15
??u1????uE(uu')?E??2???????????un??u12?u2u1 =E??????unu1?u1u2???un??
????u1u22u2?unu2?u1un???u2un? ???2??un???E(u1un)???E(u2un)? ????2?E(un)???E(u12)E(u1u2)?2E(uu)E(u)212 =???????E(unu1)E(unu2)??u20?20?u =?????0??00??0? ???2???u????式称为高斯-马尔可夫(Gauss-Markov)假设。
假设3:Cov(ui,xj)?0,i?1,2,???,n;j?1,2,?,m 式要求随机扰动项u与自变量x1,x2,?xm不相关。
假设4:r(X)=m, m?n.
假设4限定矩阵X的秩等于参数个数,即要求自变量x1,x2,?xm不相关。
由于随机扰动项包含了“非主要因素”的影响、随机变化、观测误差和模型数学形式设定偏差等各种因素对y的影响的总和,根据中心极限定理,还可以进一步假设随机扰动向量u服从n维正态分布,即
2u~ N(0,?uIn)。
3.4.2 模型参数的估计
与一元线性回归模型类似,我们仍采用最小二乘法估计参数向量B,设观测值与回归方程估计值的残差向量为E,则
? E?Y?Y其中
??XB Y根据最小二乘法的要求,应有
16
相关推荐: