研究在线性关系相关性条件下,两个或者两个以上自变量对一个因变量,为多元线 性回归分析,表现这一数量关系的数学公式,称为多元线性回归模型。多元线性回归模 型是一元线性回归模型的扩展,其基本原理与一元线性回归模型类似,只是在计算上为 复杂需借助计算机来完成。
计算公式如下:
设随机y与一般变量X1,X2,L Xk的线性回归模型为:
其中°, 1,L k是k 1个未知参数,°称为回归常数, 「L k称为回归系 数;y称为被解释变量;x1, X2,L xk是k个可以精确可控制的一般变量,称为解释变 量。
当P 1时,上式即为一元线性回归模型,k 2时,上式就叫做多元形多元回归 模型。 是随机误差,与一元线性回归一样,通常假设
同样,多元线性总体回归方程为 y °
1
x1
2
x2 L kxk
系数1表示在其他自变量不变的情况下,自变量 乂[变动到一个单位时引起的因变 量y的平均单位。其他回归系数的含义相似,从集合意义上来说,多元回归是多维空间 上的一个平面。
多元线性样本回归方程为:? ?° ?1x1 ?2x2 L
?kxk
:
多元线性回归方程中回归系数的估计同样可以采用最小二乘法。由残差平方和
SSE (y ?) 0
根据微积分中求极小值得原理,可知残差平方和 SSE存在极小值。欲使SSE达到 最小,SSE对
丄
将SSE对 °1丄
, SSE
°1
,
k
的偏导数必须为零。
求偏导数,并令其等于零,加以整理后可得到 k 1各方程
k
式:
i
——
2 (y ?) °
°, 1,L k的估计值,彳,?…?k回归
通过求解这一方程组便可分别得到
系数的估计值,当自变量个数较多时,计算十分复杂,必须依靠计算机独立完成。现 在,利
用SPSS,只要将数据输入,并指定因变量和相应的自变量,立刻就能得到结 果。
对多元线性回归,也需要测定方程的拟合程度、检验回归方程和回归系数的显着 性。
测定多元线性回归的拟合度程度,与一元线性回归中的判定系数类似,使用多重判 定系数,其中定义为:
式中,SSR为回归平方和,SSE为残差平方和,SST为总离差平方和。
同一元线性回归相类似,0 R2
1,R2越接近1,回归平面拟合程度越高,反之,
R2越接近0,拟合程度越低。R2的平方根成为负相关系数(R),也成为多重相关系数。 它表示因变量y与所有自变量全体之间线性相关程度,实际反映的是样本数据与预测数 据间的相关
2
程度。判定系数R的大小受到自变量x的个数k的影响。在实际回归分析中 可以看到,随着自变量x个数的增加,回归平方和(SSR)增大,是R2增大。由于增加自 变量个数引起的R2增大与你和好坏无关,因此在自变量个数 k不同的回归方程之间比较 拟合程度时,R2不是一个合适的指标,必须加以修正或调整。
调整方法为:把残差平方和与总离差平方和纸币的分子分母分别除以各自的自由 度,变成均方差之比,以剔除自变量个数对拟合优度的影响。调整的
2
R为:
2
由上时可以看出,R考虑的是平均的残差平方和,而不是残差平方和,因此,一
2
般在线性回归分析中,R越大越好。
从F统计量看也可以反映出回归方程的拟合程度。将 F统计量的公式与R2的公式 作一结合转换,可得:
可见,如果回归方程的拟合度高,F统计量就越显着;F统计量两月显着,回归方 程的拟合优度也越高。
相关推荐: