?0.105395?0.000033720.0009301??
(X?X)?1???0.000033720.00000020.00001711???0.000017110.0001513??0.0009301??1X?Y =??x21??x311xx2232??1??y1?????x2?10??y2?
????x3?10?????y10????y????i? =??=?5594? y?x2ii??????x3iy??202.2?i???67???0.8687????1?B?(X?X)X?Y=?0.061? ?0.9234???4.R检验
R?1??yi???y???xy???xy?yi?ny1i222ii33i22???i
472.8?0.868?67?0.061?5594?0.923?202.2=0.9508
472.8?67210 当?=0.05,n?m?10?3?7时,R0.05(7)?0.697说明相关关系显著。
=1?R2=1-(1-R2)
5.F检验
10?1n?1=1-(1-0.904)?=0.8766 n?m10?3n?m???25.67 F?R?1?Rm?11?0.882当??0.05时,F0.05(3?1,10?3)?4.74
220.887说明回归效果非常显著。
6.t检验
S??yi???y???xy???xy
1i22ii33ii2???n?m472.8?(?0.8687)?67?0.0611?5594?0.9234?202.2?0.5731
10?3根据(X?X)?1的计算有
?S??
=
1
C11?S=
0.105395?0.5731=0.3246?0.5731=0.1861 0.0000002?0.5731=0.000256 0.0001513?0.5731=0.00705
S?S?
?2==
3C22?S=
?C33?S=
25
tt1???1?S???0.8687=-4.664
0.18610.061=238.28
0.0002560.9234=130.92
0.0070512???2?S???2t3???3S??3当?=0.05时,因为1,t0.052(10?3)?2.365
tt,t23的绝对值均大于
t0.052(9)?2.365,故拒绝假设?1?0,?2?0和?3?0。
据此,可以断言:投递行程距离和投递业务次数对该公司雇员工作时间有显著影响。
7.DW检验
表3.4.3 DW检验计算表 编号 1 2 3 4 5 6 7 8 9 10 合计 ny iyi 8.9249 4.9515 8.9249 7.0781 4.0281 5.8581 6.4765 6.7899 7.3915 6.4681 66.8916 ?ei (ei?ei?1) 2e2i 9.3 4.8 8.9 6.5 4.2 6.2 7.4 6 7.6 6.1 67 20.3751 -0.1515 -0.0249 -0.5781 0.1719 0.3419 0.9235 -0.7899 0.2085 -0.3681 0.1084 - 0.277308 0.016028 0.30603 0.5625 0.0289 0.338259 2.93574 0.996803 0.332468 5.794034 0.1407 0.022952 0.00062 0.3342 0.02955 0.116896 0.852852 0.623942 0.043472 0.135498 2.300681 DW??(ei?ei?1)i?2=
?eii?1LUn25.794034?2.5191
2.30068当?=0.05,m?3,n?12时,查DW检验表,因DW检验表中,样本容量最低是15,故取:d?0.82,d?1.75,因DW统计量满足
dU?1.75 表明回归模型不存在自相关。 综合上述模型估计和各项检验结果可以认为: ???0.8687+0.061x+0.9234x3 y2(-4.664) (238.28) (130.92) R?0.904 R?0.876 5 n?10 F?25.67 S?0.5731 DW?2.5191 是一个较为优良的回归模型,可以用来预测。 8.预测区间 设预测点为X0?(1,60,2),则其预测值为: 22 26 ??0.8687???????XB?1,60,20.0611?y00???4.643(小时) ?0.9234???预测区间为 ??t?y02(n?m)S=4.643?2.365?0.5731=4.643?0.7238 即:当业务次数为2次,投递行程距离为60公里时,有95%的把握估计雇员平均工作时间 在5.9~5.3小时之间。 3.5 虚拟变量回归预测 1.虚拟变量 品质变量不像数量变量那样表现为具体的数值。它只能以品质、属性、种类等形式来表现。要在回归模型中引入此类品质变量,必须首先将具有属性性质的品质变量数量化。通常的做法是令某种属性出现对应于1,不出现对应于0。这种以出现为1,未出现为0形式表现的品质变量,就称为虚拟变量。 2.带虚拟变量的回归模型 常见的带虚拟变量的回归模型有以下三种形式: (1) 反映政府政策变化或某种因素发生重大变异的跳跃、间断式模型。其模型的形式为 y????x???u i122i3Dii式中y为因变量,x2i为自变量,Di为虚拟变量,设i0为观测值出现重大变异的年份,则Di的 i取值为: ?0,Di???1,式定义的多元线性回归模型可以写成分段形式: i?i0i?i0 yi?????2x2i?ui??1?)????(?1?3?2x2iuii?i0 i?i0其变化趋势如图所示。 YiYiXi02 X2 图3.4.1 图3.4.2 Xi02 X2 (2)具有转折点的系统趋势变化模型,其模型的形式为: y????x2i??(x2i?x2i0)Di?ui i123式中:Di为虚拟变量,Di的取值为: 27 i0为发生转折点的年份,x2i以写成分段形式: 0i?i0?0, Di??i?i0?1,为i0年份x2的观测值。式(5.5.2)定义的多元线性回归模型也可 i?i x?u??(???)x?ui?i??(??x由上式可见,在转折点i0之前,模型的斜率为?2;在转折点i0之后,模型的斜率变化为?2??3,但是在转折点i0处,曲线仍然是连续的。因为i?i0时,有 y???i????1122ii032i0232ii0yi?(???13x2i0)?(???)x2i0?ui 230 =(???x)?(???)x?u 2i2ii33120 =???x2i?ui 120对于包含多个自变量的线性回归模型,同样可以建立类似的模型来描述跳跃、间断的变化; 也可以建立类似的模型来描述可能存在的转折点的情形。并可以通过t检验判别虚拟变量的回归系数?t是否等于零来检验实际研究对象是否存在着结构变化或者转折点的变化。 (3)含有多个虚拟变量的线性回归模型。虚拟变量在回归预测中的应用非常广泛,根据品质变量的不同特征和建立回归模型的需要,还可以引入多个虚拟变量来描述出现多次转折、跳跃和间断的情况。含有多个虚拟变量的回归模型建模步骤如下: ①确定虚拟变量的个数。确定虚拟变量个数的一般原则是:当品质变量有K个分类时,引入的虚拟变量个数为K-1。例如,对个人医疗保健费年支出额进行预测时,已知个人医疗保健费年支出额的大小除了受年收入的影响外,还受文化程度的影响。这时,可将文化程度分为高中及高中以下、大专、本科及本科以上三类。根据确定虚拟变量个数的一般原则,应引入两个虚拟变量。值得注意的是,如果有K个分类就指定K个虚拟变量,回归模型就会出现完全共线性,将使最小二乘法估计失效,落入所谓的虚拟变量“陷阱”之中。 ②建立含有多个虚拟变量的回归模型,以个人医疗保健费年支出额为例,其模型为: ??? (5.5.3) y??????i12x2i3D1i4D?2ii式中:y为个人医疗保健费年支出额;x2i为年收入额;D1i和D2i为虚拟变量,D1i和D2i取 i值分别为 ?D1i???1?D2i??0?10文化程度为大专其他文化程度为本科及本科以上 其他在式(5.5.3)中,把高中及高中以下文化程度作为比较的基础,其对y的影响反映在回归模型的?1中,而?3和?4的大小分别反映大专和大专以上文化程度对y的影响程度。 ③估计参数,并进行各种检验。方法如前所述。 3.应用实例 例3.5.1 某省农业生产资料购买力和农民货币收入统计数据如表 28
相关推荐: