12.0 15.5 3.5 9.0 4.0 2.0 12.0 6.0 5.0 5.0 14.0 3.0 17.0 15.0 4.5 16.0 11.0 3.0 17.5 18.0 3.0 11.5 15.0 3.0 4.0 3.0 2.0 17.5 15.0 4.5 9.5 11.5 2.5 26.0 38.0 4.0 15.0 13.0 4.5 19.0 12.0 3.0
第二章 线性回归分析
(一)目的与要求:
掌握建立多元回归方程的方法,并能检验所建立回归方程的显著性与方程系数的显著性,能根据实际问题作预测与控制。 (二)重点与难点:
会对实际数据建立有效的多元回归模型,能对回归模型作残差分析;掌握SAS输出结果中用于判别回归方程优良性的不同统计量;能对回归模型进行运用,对实际问题进行预测或控制。
2.4 某公司管理人员为了了解某化妆品在一个城市的月销售量Y(单位:箱)与该城市中适合使用该化妆品的人数X1(单位:千人)以及他们人均月收入X2(单位:元)之间的关系,在某个月中对15个城市作了调查,得到的观测值如下:
(1) 求回归系数?0,?1,?2的最小二乘估计和误差方差?2的估计,写出回归方程并对回归系数作解释;
(2) 求出方差分析表,解释对线性回归关系显著性检验的结果,求复相关系数的平方R2的值并解释其意义;
(3) 分别求?1和?2的置信度为95%的置信区间; (4) 对??0.05,分别检验人数
X1及收入X2对销量Y的影响是否显著,利用与回归系数有
关的一般假设方法检验X1和X2的交互作用(即X1X2)对Y的影响是否显著; (5) 该公司欲在一个适宜使用该化妆品的人数X01=200,人均月收入X02=2500的新的城市中销售该化妆品,求其销量的预测值及其置信度为95%的置信区间;
(6) 求Y的拟合值,残差及学生化残差,根据对学生化残差,根据对学生化残差正态性的频率检验及正态QQ图检验说明模型误差项的正态性假定是否合理,有序学生化残差与相应标准正态分布的分位数的相关系数是多少?作出各种残差图,分析模型有关假定的合理性。 162 274 2450 120 180 3254 223 375 3802 131 205 2838
67 86 2347 169 265 3782 81 98 3008 192 330 2450 116 195 2137 55 53 2560 252 430 4020 232 372 4427 144 236 2660 103 157 2088
212 370 2605
2.5 下面的数据是由特定模型产生的20组模拟数据
(1) 首先拟合Y关于X的线性回归模型,结果如何?通过残差分析(尤其是残差图分析)并参考Y与X的散点图,选择你认为合理的回归函数形式,拟合你所选择的回归模型,再通过残差分析考察所设定的模型的合理性,最后,将你所拟合的回归方程与真实模型(Y?5?(X?1)??,?~N(0,0.625)2)比较,你是否给出了正确的模型形式。
(2) 如果对因变量作BOX-COX变换,求变换参数的值,拟合变换后的变量关于X的简单线性回归模型,结果如何?你对BOX-COX变换有何新的认识? 0.05 5.9421 0.15 5.4691
0.25 5.8724 0.35 5.1815 0.45 5.1955 0.55 5.2487
0.65 5.1356 0.75 5.2260 0.85 5.0813 0.95 5.2236 1.05 4.7349 1.15 4.5949 1.25 5.1543 1.35 5.2844 1.45 5.3448 1.55 5.1462 1.65 5.4091 1.75 5.6500
1.85 6.0256 1.95 5.5350
2.6 在林业工程中,研究树干的体积与离地面一定高度的树干直径和树干高度之间的关系具有重要的实用意义,下面给出了31棵树的相关数据:
(1) 首先拟合线性回归模型Y??0??1X1??2X2??,通过残差分析考察模型的合理性,是否需要对数据作变换?
(2)对因变量Y作BOX-COX变换,求变换参数的值。对变换后的因变量重新拟合与X1,X2
的线性回归模型并作残差分析, BOX-COX变换的效果如何?
8.3 70 10.3 8.6 65 10.3 8.8 63 10.2 10.5 72 16.4 10.7 81 18.8 10.8 83 19.7 11.0 66 15.6 11.0 75 18.2 11.1 80 22.6 11.2 75 19.9 11.3 79 24.2 11.4 76 21.0 11.4 76 21.4 11.7 69 21.3 12.0 75 19.1 12.9 74 22.2 12.9 85 33.8 13.3 86 27.4 13.7 71 25.7 13.8 64 24.9 14.0 78 34.5 14.2 80 31.7 14.5 74 36.3 16.0 72 38.3 16.3 77 42.6 17.3 81 55.4 17.5 82 55.7 17.9 80 58.3 18.0 80 51.5 18.0 80 51.0
20.6 87 77.0
2.9 某医院为了了解病人对医院工作的满意程度和病人的年龄、病情的严重程度和病人的忧虑程度之间的关系,随机调查了该医院的23位病人,得数据如下:
(1) 拟合线性回归模型Y??0??1X1??2X2??3X3??,通过残差分析考察模型及有关误差分布正态性假定的合理性;
(2) 若(1)中模型合理,分别在(i)Ra2(p)、(ii)Cp和(iii)PRESSp准则下选择最优回归方程,各准则下的选择结果是否一致?
(3) 对?E??D?0.10,用逐步回归法选择最优回归方程,其结果和(2)中的是否一致? (4) 对选择的最优回归方程作残差分析,与(1)中的相应结果比较,有何变化?
50 51 2.3 48
36 46 2.3 57
40 48 2.2 66 41 44 1.8 70 28 43 1.8 89 49 54 2.9 36
42 50 2.2 46 45 48 2.4 54 52 62 2.9 26 29 50 2.1 77 29 48 2.4 89 43 53 2.4 67 38 55 2.2 47 34 51 2.3 51 53 54 2.2 57 36 49 2.0 66 33 56 2.5 79 29 46 1.9 88 33 49 2.1 60 55 51 2.4 49 29 52 2.3 77 44 58 2.9 52 43 50 2.3 60
第三章 方差分析
(一)目的与要求:
能利用原始数据与误差分析作方差分析,并能理解各因素对观测的影响和作用;能根据SAS输出结果进行有无交互效应的分析。
(二)重点与难点:
理解观测数据在单因素和两因素下的总平方和分解表达式,两因素中无交互效应的分析,能利用方差分析的SAS过程解决有关实际应用问题。
3.4 考察四种不同催化剂对某一化工产品得率的影响,在四种不同催化剂下分别作了6次试验,得数据如下:
假定各种催化剂下产品的得率服从同方差的正态分布,试在下?剂对该化工产品的得率有无显著影响。
a1 0.88 a1 0.85 a1 0.79 a1 0.86 a1 0.85 a1 0.83 a2 0.87 a2 0.92 a2 0.85
?0.05,检验四种不同催化
相关推荐: