五、回归分析
1、某厂生产的一种产品的销售额Y与生产成本x1及销售成本x2有关。现有10个城市销售数据记录如下,
x1(元) x2(元) Y(个) x1(元) x2(元) Y(个) 120 140 190 130 120 100 110 90 150 100 102 100 120 77 102 155 175 125 145 180 210 150 250 270 300 46 93 26 69 65 (1)、建立销售量Y与生产成本x1及销售成本x2的回归关系式,说明回归方程在??0.05的水平上是否显著?并解释回归系数的含义。
data sale; input x1 x2 y; cards; run;
proc reg data=sale; model y=x1 x2 / r;
run;
13
因为0.0078小于0.05,所以模型达到显著水平。 回归关系式:y=79.88271+0.37176x1-0.31736x2
(2)、对回归模型进行初步诊断,并指出有无可疑点或异常点?
根据 Student Residual 或 星星判断,得观测1、8、9的残差较大,说明这三个模型的预测结果不是很理想。
(3)、写出模型的决定系数、均方误差、均方误差的根,并说明决定系数的含义。
决定系数: R-Square=0.7499>0.5,说明多元回归模型的拟合程度较好。
均方误差:Mean Square Error =270.21070 均方误差的根:Root MSE=16.43809
(4)、该回归模型回归系数是否显著?可以从哪些方面对模型进行改进?
X1的回归系数p值=0.1265>0.05,不显著。 X2的回归系数p值=0.0029<0.05,显著。
(5)、如果x1?170元及x2?160元,试预测该厂的销售量。
14
代进去。
2、某地区对某种电器的销售量Y进行调查,它与以下4个量有关:x1=居民可支配收入,x2=该电器平均价格指数,x3=该电器保有量,x4=其他电器平均价格指数。现有10个历史数据记录如下,
x1 x2 x3 x4 Y x1 x2 x3 x4 Y 82.9 92 17.1 94 8.4 131 101 40 101 14.2 88 93 21.3 96 9.6 148.2 105 44 104 15.8 99.9 96 25.1 97 10.4 161.8 112 49 109 17.9 105.3 94 117.7 100 29 97 11.4 174.2 112 51 111 19.6 34 100 12.2 184.7 112 53 111 20.8 (1)、建立销售量Y与x1x4的回归关系式,说明回归方程在
??0.05的水平上是否显著?
(2)、对回归模型进行初步诊断,并指出有无可疑点或异常点? (3)、写出模型的决定系数、均方误差、均方误差的根,并说明决定系数的含义。
(4)、该回归模型回归系数是否显著?可以从哪些方面对模型进行改进?
六、属性数据分析
1、下表是对195名顾客的购买手机意愿(分为品牌机、山寨机、无所谓)的调查数据,同时记录了每位顾客的年收入经济状况(分为贫穷、下、中、上四个等级)。
贫穷 下 中 上 15
山寨机 30 15 11 12 品牌机 无所谓 7 5 18 19 29 23 7 19 请问购买何种手机是否与顾客的经济状况有关(??0.01)?如果有关两者有何趋势?
data test; input a$ b$ x;
label a='购买手机意愿' b='经济状况'; cards;
品牌机 贫穷 30 品牌机 下 15 品牌机 中 11 品牌机 上 12 山寨机 贫穷 7 山寨机 下 18 山寨机 中 19 山寨机 上 29 无所谓 贫穷 5 无所谓 下 23 无所谓 中 7 无所谓 上 19 ; run;
proc freq data=test;
table a*b/expected chisq norow measures nopercent alpha=0.01; weight x; run;
16
相关推荐: