1.2回归分析
教学目标:
通过对典型案例的探究,了解回归的基本思想、方法及其初步应用。 教学重点:
通过对典型案例的探究,了解回归的基本思想、方法及其初步应用。 教学过程
一、变量的相关关系中最为简单的是线性相关关系,设随机变量与变量之间存在线性相关关系,则由试验数据得到的点(
,)
将散布在某一直线周围,因此,可
,下面用最小二乘法估计参
以认为关于的回归函数的类型为线性函数,即
数、b,设服从正态分布,分别求
对、b的偏导数,并令它们等于零,得方程组
解得
其中 ,
且为观测值的样本方差.
称为关于的线性回归方程,称为回归系数,对应的直线称为回归直
线性方程
线.顺便指出,将来还需用到,其中为观测值的样本
方差.
二、现在讨论线性相关的显著性检验中最简便、最常用的一种方法,即相关系数的显著性检验法.
我们早在前面的学习中知道,变量与的相关系数
是表示与之间线性相关关系的
一个数字特征,因此,要检验随机变量与变量之间的线性相关关系是否显著,自然想到考察相关系数
的大小,若相关系数
的绝对值很小,则表明与之间的线性相关关系
的绝对值接近1时,
不显著,或者它们之间根本不存在线性相关关系;当且仅当相关系数
才表明与之间的线性相关关系显著,这时求关于的线性回归方程才有意义. 在相关系数
未知的情况下,可用样本相关系数r作为相关系数
的估计值,参照相关系
数的定义,并用样本均值与样本方差分别作为数学期望与方差的估计值,定义与的样本相关系数如下:
,
)
,得到
的值后可进一步算出样本
因此,根据试验数据(
相关系数r的值. 若使用的是具有线性回归计算功能的电子计算器时,把所有试验数据(
,
)
逐对存入计算器中,则可直接算出r的值.
的估计值,所以,r的绝对值越接近1,与之间的线
由于样本相关系数r是相关系数
性相关关系越显著. 当r>0时,称与正相关;当r<0时,称与负相关. 而当r的绝对值接近0时,则可认为与之间不存在线性相关关系.
三、例1.在7块并排、形状大小相同的试验田上进行施化肥量对水稻产量影响的试验,得数据如下(单位:kg)
施化肥量x 15 1)画出散点图如下: 20 25 30 35 40 45 水稻产量y 330 345 365 405 445 450 455 y5004504003503001015202530354045x
2)检验相关系数r的显著性水平: i xi yi xiyi 1 15 330 4950 2 20 345 6950 72i3 25 365 9125 74 30 [5 35 445 15575 76 40 450 18000 7 45 455 [405 12150 2i20475 x=30,y=399.3,?x=7000,?y=1132725,?xiyi=87175 i?1i?1i?17
r=
7i?1?xyii?1i?7xy=
7i?187175?7?30?399.3(7000?7?30)(1132725?7?399.3)22≈0.9733,
(?xi2?7x2)(?yi2?7y2)在“相关系数检验的临界值表”查出与显著性水平0.05及自由度7-2=5相应的相关数临界
值r0 05=0.754<0.9733,这说明水稻产量与施化肥量之间存在线性相关关系.
7?xiyi?7xy??i?1??b?7??bx?a,利用?3)设回归直线方程y22
x?7x?i?i?1???a?y?bx计算a,b, 得b=
87175?7?30?399.5?4.75
7000?7?302??4.75x?257 a=399.3-4.75×30≈257,则回归直线方程y
y5004504003503001015202530354045x
例2.一个工厂在某年里每月产品的总成本y(万元)与该月产量x(万件)之间由如下一组数据:
x 1.08 1.12 1.19 y 2.25 2.37 2.40 1.28 1.36 1.48 1.59 2.55 2.64 2.75 2.92 1.68 1.80 3.03 3.14 1.87 1.98 3.26 3.36 2.07 3.50 1)画出散点图;2)检验相关系数r的显著性水平;3)求月总成本y与月产量x之间的回归直线方程. 解: i xi yi 1 2 3 1.19 2.40 4 1.28 2.55 5 1.36 2.64 6 7 8 1.68 3.03 9 1.80 3.14 10 1.87 3.26 11 1.98 3.36 12 2.07 3.50 1.08 1.12 2.25 2.37 1.48 1.59 2.75 2.92 xiyi 2.43 2.264 2.856 3.264 3.590 4.07 4.643 5.090 5.652 6.096 6.653 7.245 77718.534.1722x=,y==2.8475,?xi=29.808,?yi=99.2081,?xiyi=54.243 1212i?1i?1i?11)画出散点图:
y3.532.521.511.2121.41.61.822.2x
2)r=
12i?1?xyii?1i?12xy
12i?1(?xi2?12x2)(?yi2?12y2)
54.243?12?=
18.534.17?121218.5234.172(29.808?12?())(99.2081?12?())1212?0.997891
在“相关系数检验的临界值表”查出与显著性水平0.05及自由度12-2=10相应的相关
数临界值r0 05=0.576<0.997891, 这说明每月产品的总成本y(万元)与该月产量x(万件)之间存在线性相关关系.
??bx?a, 3)设回归直线方程y12?xiyi?12xy??i?1??b?12利用?22,计算a,b,得b≈1.215, a=y?bx≈0.974,
x?12x?i?i?1???a?y?bx??1.215x?0.974 ∴回归直线方程为:yy3.532.521.511.21.41.61.822.2x
课堂小节:本节课学习了回归的基本思想、方法及其初步应用 课堂练习:略
课后作业:第7页习题A:1,2,3,4,5
相关推荐: