多元线性回归模型
一. 概述
当今农村农民人均纯收入与多个因素存在着紧密的联系,例如人均工资收入,人均农林牧渔产值人均生产费用支出,人均转移性和财产性收入等。本次将以安徽1995-2009年农村居民纯收入与人均工资收入,人均生产费用支出,人均转移性和财产性收入等因素的数据,通过建立计量经济模型来分析上述变量之间的关系,强调农村居民生活的重要性,从而促进全国经济的发展。 二、 模型构建过程
⒈变量的定义
被解释变量:农民人均纯收入y
解释变量:人均工资收入x1, 人均农林牧渔产值x2
人均生产费用支出x3 人均转移性和财产性收入x4。
建立计量经济模型:解释农民人均纯收入与人均工资收入,人均生产费用支出,人均转移性和财产性收入的关系 ⒉模型的数学形式
设定农民人均纯收入与五个解释变量相关关系模型,样本回归模型为:
Y??i?=
?+
?01X1i+
??2X2i+
??3X3i+
?X4?4i+ei
⒊数据的收集
该模型的构建过程中共有四个变量,分别是中国从1995-2009年人均工资收入,人均农林牧渔产值人均生产费用支出,人均转移性和财产性收入,因此为时间序列数据,最后一个即2009年的数据作为预测对比数据,收集的数据如下所示:
⒋用OLS法估计模型 回归结果,散点图分别如下:
Y?i=33.632+0.659X1+0.59X2-0.274X3+0.152X4d.f.=10 ,R2=0.997116 ,
Se=(186.261) (0.1815 (0.1245) (0.2037) (0.5699) t=(0.1805) (3.632) (4.741) (-1.347) (2.674)
三、模型的检验及结果的解释、评价 ⒉拟合优度检验及统计检验
R2=0.997,可以看到模型的拟合优度非常高,说明农民人均纯收入与上述四个解释变量之间总体线性关系显著。
? 模型总体性检验(F检验):给定显著水平?=0.05,查自由度为(4,10)的F
分布表,得F(4,10)=3.48,可见该模型的F值远大于临界值,因此该回归方程很明显是显著的。但由于X3系数不显著且符号为负,与经济意义不符,因此我们认为解释变量之间存在多重共线性。 ? 变量的显著性检验(t检验):给定显著水平?=0.05,查自由度为10的t分
布表,得t?/210=1.812,大于该临界值的的显著变量为x1,x2,x4; x3解释变量未通过检验,说明x3与被解释变量之间不存在显著的线性相关关系。 ⒊多重共线性的检验 ⑴相关系数检验法
上图是Eviews输出所有变量的相关系数矩阵,可发现Y与所有解释变量都是正相关的关系,所以进一步确定了上面的回归存在共线性问题。另外,我们发现X1和X2的相关系数很高,两变量很可能存在共线性。 ⑵多个解释变量的相关性检验
由上面的分析可知,X1和X2有很高的相关性,那么我们这里就用X1做被解释变量,X2和X3做解释变量,可得回归模型如下:
X?=-757.251+0.477X12+0.2454
X3
t=(-4.373) (3.662) (0.744)
?R=0.9675,
2R2=0.9621,F=178.78,DW=1.19。
可以看到,回归模型的拟合优度非常高,F值也远大于临界值。如果将显著水平扩大到?=10%的话,X2 系数显著,X3系数不显著。 因此x 1 ,x2 存在共线性。 四、模型的建立
这里我们用逐步回归法得到农民人均纯收入模型。
⒈分别用四个解释变量对Y进行回归,回归结果分别如下:
可以看出,Y与x2拟合优度R2最大,因此将这个方程作为基本方程,然后往里加入其他变量。 ⒉引入第二个变量 引
入
变
量
x1后,t值
3.
3.18,其系数通不过显著性检验。
17 < 临界值
引入变量x3后,t值 -0.22444< 临界值3.18,其系数通不过显著性检验。
引入变量x4后,t值 2.715< 临界值3.18,其系数通不过显著性检验。
相关推荐: