第一范文网 - 专业文章范例文档资料分享平台

直线回归分析直线回归分析介绍的相关

来源:用户分享 时间:2025/7/11 16:37:59 本文由loading 分享 下载这篇文档手机版
说明:文章内容仅供预览,部分内容可能不全,需要完整文档或者需要复制内容,请下载word后使用。下载word有问题请添加微信号:xxxxxxx或QQ:xxxxxx 处理(尽可能给您提供完整文档),感谢您的支持与谅解。

第十四章 直线回归分析

第十四章 直线回归分析

第十三章介绍的相关系数可用来说明两变量之间相伴随而呈线性变化的趋势和关联强度,并不能用其中一个变量来预测另一个变量的值。在实际工作中,研究者常常需要通过易测的变量对另一难测的变量进行估测,如用腰围、臀围、体重指数(BMI)等简易体脂参数来估测腹腔内脂肪含量,此时可采用回归分析。本章仅介绍最简单的直线回归分析。

第一节 直线回归方程的建立

一、直线回归的概念

直线回归(linear regression)方法可用来研究两个连续型变量之间数量上的线性依存关系,也称简单回归(simple regression)。

在回归分析中估测的随机变量称为因变量(dependent variable)或反应变量(response variable),常用y表示;y所依存的变量称为自变量(independent variable)或解释变量(explanatory variable),常用x表示。

例14.1 某研究欲探讨男性腰围与腹腔内脂肪面积的关系,对20名男性志愿受试者测量其腰围(cm),并采用磁共振成像法测量其腹腔内脂肪面积(cm2),结果如表14.1所示。试建立腹腔内脂肪面积(y)和腰围(x)的直线回归方程。

表14.1 20名男性志愿受试者腰围和腹腔内脂肪面积的测量值 编号 1 2 3 4 5 6 7 8 9 10 11 腰围(cm) 81.3 85.6 85.9 87.8 79.0 82.5 95.2 96.1 94.4 90.6 93.5 腹腔内脂肪面积(cm2)

69.8 61.2 80.3 75.5 75.7 85.4 102.5 99.6 97.8 100.9 108.2 14-1

第十四章 直线回归分析

12 13 14 15 16 17 18 19 20

103.8 97.5 98.3 99.7 87.2 84.1 88.0 101.0 88.3

129.0 110.4 123.3 105.5 83.1 72.0 100.0 105.0 127.7

以腰围为横坐标,腹腔内脂肪面积为纵坐标绘制散点图,如图14.1所示,可见散点大致呈直线趋势。

130120腹腔内脂肪面积 (cm) 1102100908070607580859095100105

腰围 (cm)

图14.1 两变量直线回归关系散点图

即假设有一条潜在的直线可用来刻画两变量之间的关系,这样的直线称为回

?来表示回归直线上各点的纵坐标,其数值是当x取某一值时因归直线。通常用y变量y的平均估计值。与单变量问题类似,由于个体观察值不一定总等于其均数,所以散点图中各点不会恰好都在回归直线上,故两变量的直线关系并非是一一对

?随x的变化而变化的方程称为直线回归方程(linear 应的函数关系。描述yregression equation),也称为直线回归模型,可表示为

??a?bx (14.1) y式中,a为回归直线的截距(intercept)或常数项,表示x等于0时,y的平均估计值;b为回归直线的斜率(slope)或回归系数(regression coefficient),表示x改变一

14-2

第十四章 直线回归分析

个单位时y的平均改变量。b?0,表示回归直线从左下方走向右上方,即y随x增大而增大;b?0,表示回归直线从左上方走向右下方,即y随x增大而减小;

b?0,表示回归直线平行于x轴,即y与x无线性依存关系。由此可见,直线回归就是通过回归系数与自变量的线性组合来描述因变量的均数是如何随自变量的改变而变化。

二、回归方程的估计

(一) 回归方程估计的最小二乘法

从散点图来看,不同的a和b对应于不同的直线,求解a、b实际上就是如何能合理地找到一条能最好的代表数据点分布趋势的直线,使得每个实测值yi与

?i)有正有负,故?i最接近。由于各点的(yi?y这条“理想”的回归直线的估计值y?i)平方和最小,统计学上将各点距回归直线的纵向距离平方和最小通常取(yi?y这一原则称为最小二乘法(least square method)。

(二) 回归系数的估计方法

?i)2取得最小值时所对应a和b的计算公式如下:按照最小二乘法,当?(yi?y

b?lxylxx?(?y)?(x?x)y (14.2) 2(x?x)? a?y?bx (14.3)

式中lxy为x与y的离均差交叉乘积和,简称离均差积和,可按公式(14.4)计算:

lxy??(x?x)(y?y)??xy?(?x)(?y) (14.4) n下面以例14.1资料说明建立直线回归方程的具体步骤。

1.绘制两变量之间的散点图,如图14.1所示,观察到二者存在直线趋势,故可进行直线回归分析。

2.由样本数据计算如下统计量:

x=90.990,y=95.645

lxx??x2?(?x)2/n?950.778

lyy??y2?(?y)2/n?7293.650

lxy??xy?(?x?y)/n?2006.649

3.计算回归系数b及截距a

14-3

第十四章 直线回归分析

由式(14.2)可得,

b?lxylxx?2006.649?2.11053

950.778由式(14.3)可得,

a?y?bx?95.645?2.11053?90.990??96.39212

4.得回归方程为:

???96.39212?2.11053x y在x的实测值范围内,任取相距较远且易读数的两个x值,代入方程得到两

?值,连接两点即可绘制回归直线。本例x分别取值79和88,得到y?分别为个y70.340和89.335,连接点(79, 70.340)和(88, 89.335)即得回归直线。

第二节 直线回归的统计推断

一、总体回归系数?的假设检验

类似单变量问题中常需用样本均数对总体均数进行推断,在得到样本回归方程后,研究者还需推断相应总体中这种回归关系是否确实存在,也即推断y的总体条件均数是否随x的变化而呈线性变化。总体回归方程形式如下:

yi??y|x??i????xi??i (14.5)

式中,?和?是前述a和b所对应的总体参数;?y|x为对应于各x值的y的总体均数,即总体条件均数;?i为误差项或残差。

由式(14.5)可见,当总体回归系数??0时,y的总体均数为常数?,此时两变量无直线回归关系,但由于抽样误差的存在,样本回归系数不一定为零,故推断总体中两变量是否存在回归关系,还须对总体回归系数?是否等于0进行统计推断。

(一) 方差分析

理解回归中方差分析的基本思想,需要对应变量y的离均差平方和作分解,如图14.2所示。

14-4

直线回归分析直线回归分析介绍的相关.doc 将本文的Word文档下载到电脑,方便复制、编辑、收藏和打印
本文链接:https://www.diyifanwen.net/c8m4qb4u9uu17c19373fh7l7tx29yiq00g2o_1.html(转载请注明文章来源)
热门推荐
Copyright © 2012-2023 第一范文网 版权所有 免责声明 | 联系我们
声明 :本网站尊重并保护知识产权,根据《信息网络传播权保护条例》,如果我们转载的作品侵犯了您的权利,请在一个月内通知我们,我们会及时删除。
客服QQ:xxxxxx 邮箱:xxxxxx@qq.com
渝ICP备2023013149号
Top