§3 回归方程及回归系数的显著性检验
1、回归方程的显著性检验 (1) 回归平方和与剩余平方和
建立回归方程以后, 回归效果如何呢?因变量
与自变量
是否确实存在线性关系
取值的变化规律。的
呢?这是需要进行统计检验才能加以肯定或否定, 为此, 我们要进一步研究因变量每次取值
是有波动的, 这种波动常称为变差, 每次观测值
的变差大小, 常用该次观侧值
与次观测值的平均值的差(称为离差)来表示, 而全部次观测值的总变差可由总
的离差平方和
其中:
,
称为回归平方和, 是回归值
的变化所引起的
的波动, 其自由度
与均值(
之差的平方和, 它反映了自变量
为自变量的个数)。
称为剩余平方和(或称残差平方和), 是实测值与回归值之差的平方和,
。 小, 反之,
它是由试验误差及其它因素引起的, 其自由度
如果观测值给定, 则总的离差平方和小则
大, 所以
与
。总的离差平方和
是确定的, 即
的自由度为
大则
是确定的, 因此
都可用来衡量回归效果, 且回归平方和越大则线性回归效果越显著, 或者说
大, 则线性回归效果
剩余平方和不好。
越小回归效果越显著, 如果=0, 则回归超平面过所有观测点; 如果
(2) 复相关系数
为检验总的回归效果, 人们也常引用无量纲指标
, (3.1)
页脚内容
6
或
, (3.2)
实际上是反映回归方程中全部自变量的“方差贡献”, 因此
表示全部自变量与因变量
的相关程度。显然
就。与回
称为复相关系数。因为回归平方和
是这种贡献在总回归平方和中所占的比例, 因此
复相关系数越接近1, 回归效果就越好, 因此它可以作为检验总的回归效果的一个指标。但应注意, 归方程中自变量的个数中应注意
(3)
与
及观测组数
有关, 当
相对于
并不很大时, 常有较大的
值, 因此实际计算
的适当比例, 一般认为应取至少为
的5到10倍为宜。
检验
与
是否存在线性关系, 就是要检验假设
, (3.3)
成立时, 则
与
无线性关系, 否则认为线性关系显著。检验假设
应用统计量
要检验 当假设
, (3.4)
及
的
分布, 即
这是两个方差之比, 它服从自由度为
用此统计量
, (3.5)
可检验回归的总体效果。如果假设≤
, (3.6)
分布表可查得
, 即不能认为全部
的值, 如果根据统计量算得的为O, 即
值为
成立, 则当给定检验水平α下, 统计量
应有
对于给定的置信度α, 由
, 则拒绝假设
否则认为回归效果不显著。 利用
个自变量的总体回归效果是显著的,
检验对回归方程进行显著性检验的方法称为方差分析。上面对回归效果的讨论可归结于一
个方差分析表中, 如表3.1。
表3.1 方差分析表
来 源 平方和 自由度 方 差 方差比 页脚内容
6
回 归 剩 余 总 计 根据
与
的定义, 可以导出
与
的以下关系:
,
。
值多大时回归效果才算是显著的问题。因为对给定的检验水平α, 由
即可求出
的临界值
:
利用这两个关系式可以解决分布表可查出
的临界值
, 然后由
当
, (3.7)
时, 则认为回归效果显著。
例3.1 利用方差分析对例2.1的回归方程进行显著性检验。 方差分析结果见表3.2。
表3.2
来 源 平方和 自由度 方 差 方差比 回 归 剩 余 总 计 取检验水平α=0.05, 查
分布表得
, 而
, 所以例2.1的
回归方程回归效果是显著的。
2、回归系数的显著性检验
页脚内容
6
相关推荐: