2019年
【2019最新】精选高考数学一轮复习第9章统计统计案例第3讲变量
相关关系与统计案例学案
板块一 知识梳理·自主学习
[必备知识]
考点1 变量间的相关关系
1.常见的两变量之间的关系有两类:一类是函数关系,另一类是相关关系;与
函数关系不同,相关关系是一种非确定性关系.
2.从散点图上看,点分布在从左下角到右上角的区域内,两个变量的这种相关关系称为正相关,点分布在左上角到右下角的区域内,两个变量的相关关系为负相
关.
考点2 回归方程与回归分析 1.线性相关关系与回归直线
如果散点图中点的分布从整体上看大致在一条直线附近,就称这两个变量之间
具有线性相关关系,这条直线叫做回归直线.
2.回归方程
(1)最小二乘法:求回归直线使得样本数据的点到回归直线的距离的平方和最小
的方法叫做最小二乘法.
(2)回归方程:方程=x+是两个具有线性相关关系的变量的一组数据(x1,y1),
(x2,y2),…,(xn,yn)的回归方程,其中,是待定数.
3.回归分析
(1)定义:对具有相关关系的两个变量进行统计分析的一种常用方法.
(2)样本点的中心:在具有线性相关关系的数据(x1,y1),(x2,y2),…,(xn,
yn)中,=(x1+…+xn),
=(y1+…+yn),=-,(,)称为样本点的中心.y(3)相关系数r=,当r>0时,两变量正相关,当r<0时,两变量负相关,当|r|≤1 且|r|越接近于1,相关程度越强,当|r|≤1且|r|越接近于0,相关程度越弱.
考点3 独立性检验 1.独立性检验的有关概念
(1)分类变量
可用变量的不同“值”表示个体所属的不同类别的变量称为分类变量.
(2)2×2列联表
2019年
假设有两个分类变量X和Y,它们的取值分别为{x1,x2}和{y1,y2},其样本频
数列联表(称为2×2列联表)为
x1 x2 总计 y1 a c a+c y2 b d b+d 总计 a+b c+d a+b+c+d 2.独立性检验
利用随机变量K2=(其中n=a+b+c+d为样本容量)来判断“两个变量有关系”的方法称为独立性检验.
步骤如下:
(1)计算随机变量K2的观测值k,查表确定临界值k0:
P(K≥20.5 .40 0.455 0.25 0.708 0.15 1.323 0.10 2.072 0.05 2.706 00.025 0.010 6.635 0.005 70.001 1k0) k03.841 5.024 .879 0.828 (2)如果k≥k0,就推断“X与Y有关系”,这种推断犯错误的概率不超过P(K2≥k0);否则,就认为在犯错误的概率不超过P(K2≥k0)的前提下不能推断“X与Y有关系”.
[必会结论]
1.相关关系与函数关系的异同
共同点:二者都是指两个变量间的关系;
不同点:函数关系是一种确定性关系,体现的是因果关系,而相关关系是一种非
确定性关系,体现的不一定是因果关系,也可能是伴随关系.
2.从散点图看相关性
正相关:样本点分布在从左下角到右上角的区域内; 负相关:样本点分布在从左上角到右下角的区域内.
3.回归直线=x+必过样本点的中心.[考点自测]
1.判断下列结论的正误.(正确的打“√”,错误的打“×”)
(1)相关关系与函数关系都是一种确定性的关系,也是一种因果关系.( )
(2)只有两个变量有相关关系,所得到的回归模型才有预测价值.( ) (3)事件X,Y关系越密切,则由观测数据计算得到的K2的观测值越大.( )
2019年
(4)由独立性检验可知,在犯错误的概率不超过1%的前提下认为物理成绩优秀与
数学成绩有关,某人数学成绩优秀,则他有99%的可能物理优秀.( )
答案 (1)× (2)√ (3)√ (4)×
2.下面是一个2×2列联表
x1 x2 合计 y1 a 22 y2 21 25 46 总计 73 47 120 b 其中a,b处填的值分别为( )
A.94 72 B.52 50 C.52 74 D.74 52 答案 C
解析 由a+21=73,得a=52,a+22=b,得b=74.故选C.
3.[课本改编]四名同学根据各自的样本数据研究变量x,y之间的相关关系,并求得回归直线方程,分别得到以下四个结论:
①y与x负相关且=2.347x-6.423; ②y与x负相关且=-3.476x+5.648; ③y与x正相关且=5.437x+8.493; ④y与x正相关且=-4.326x-4.578. 其中一定不正确的结论的序号是( ) A.①② B.②③ C.③④ D.①④ 答案 D
解析 正相关指的是y随x的增大而增大.负相关指的是y随x的增大而减小,故不正确的为①④,故选D.
4.从某高中随机选取5名高三男生,其身高和体重的数据如下表所示:
身高160 63 6 65 60 170 72 175 74 180 71x(cm) 体重y(kg) 根据上表可得回归直线方程:=0.56x+,据此模型预报身高为172 cm的高三男生的体重为( )
A.70.09 kg B.70.12 kg C.70.55 kg D.71.05 kg 答案 B
2019年
解析 ==170,
y==69.∵回归直线过点(,),
∴将点(170,69)代入回归直线方程得=0.56x-26.2,代入x=172 cm,则其体重为70.12 kg.
5.在一项打鼾与患心脏病的调查中,共调查了1671人,经过计算得K2=27.63,根据这一数据分析,我们有理由认为打鼾与患心脏病是________的(有关,无关).
答案 有关
解析 K2>10.828就有99.9%的理由认为两个量是有关的.
板块二 典例探究·考向突破
考向 线性回归分析
例 1 [2018·金华模拟]某百货公司1~6月份的销售量x与利润y的统计数据
如下表:
月份 销售量x(万件) 利润y(万元) 0 22 5 1 11 29 2 13 26 3 12 26 4 15 8 12 6 6 1(1)根据2至5月份的数据,求出y关于x的回归直线方程=x+;
(2)若由回归直线方程得到的估计数据与剩下的检验数据的误差均不超过2万元,则认为得到的回归直线方程是理想的,试问所得回归直线方程是否理想?
参考公式:=,=-.
解 (1)根据表中2至5月份的数据, 计算得=11,=24,
5∑i=2xiyi=11×25+13×29+12×26+8×16=1092, 5∑i=2x=112+132+122+82=498, 5--
∑xiyi-4xyi=2
则=5 -i-4x2i∑=2x2
==,
^
a=-=24-×11=-.
故y关于x的回归直线方程为=x-. (2)当x=10时,=×10-=,
相关推荐: