(1)求出m,n的值;
2和s2,并由此分析两组(2)求出甲、乙两组技工在单位时间内加工的合格零件的方差s甲乙
技工的加工水平.
11
解:(1)根据题意可知:x甲=(7+8+10+12+10+m)=10,x乙=(9+n+10+11+
5512)=10,
所以m=3,n=8.
122222
(2)s2甲=[(7-10)+(8-10)+(10-10)+(12-10)+(13-10)]=5.2, 5122222s2乙=[(8-10)+(9-10)+(10-10)+(11-10)+(12-10)]=2, 5
2因为x甲=x乙,s2甲>s乙,
所以甲、乙两组的整体水平相当,乙组更稳定一些.
2.某大学艺术专业的400名学生参加某次测评,根据男女学生人数比例,使用分层抽样的方法从中随机抽取了100名学生,记录他们的分数,将数据按[20,30),[30,40),…,[80,90]分成7组,并整理得到如图所示的频率分布直方图.
(1)估计总体的众数;
(2)已知样本中分数小于40的学生有5人,试估计总体中分数在区间[40,50)内的人数; (3)已知样本中有一半男生的分数不小于70,且样本中分数不小于70的男女学生人数相等.试估计总体中男生和女生人数的比例.
70+80解:(1)由频率分布直方图可估计总体的众数为=75.
2
(2)由频率分布直方图可知,样本中分数在区间[50,90]内的人数为(0.01+0.02+0.04+0.02)×10×100=90.
因为样本中分数小于40的学生有5人,
所以样本中分数在区间[40,50)内的人数为100-90-5=5.
5x
设总体中分数在区间[40,50)内的人数为x,则=,解得x=20,
100400故估计总体中分数在区间[40,50)内的人数为20.
(3)由频率分布直方图可知,样本中分数不小于70的人数为(0.04+0.02)×10×100=60. 因为样本中分数不小于70的男女学生人数相等, 所以样本中分数不小于70的男生人数为30. 因为样本中有一半男生的分数不小于70, 所以样本中男生的人数为60,女生的人数为40.
由样本估计总体,得总体中男生和女生人数的比例约为3∶2.
第三节 变量间的相关关系与统计案例
一、基础知识
1.变量间的相关关系
(1)常见的两变量之间的关系有两类:一类是函数关系,另一类是相关关系;与函数关系不同,相关关系是一种非确定性关系.
体现的不一定是因果关系.
(2)从散点图上看,点散布在从左下角到右上角的区域内,两个变量的这种相关关系称为正相关;点散布在左上角到右下角的区域内,两个变量的这种相关关系为负相关.
2.两个变量的线性相关
(1)从散点图上看,如果这些点从整体上看大致分布在通过散点图中心的一条直线附近,称两个变量之间具有线性相关关系,这条直线叫做回归直线.
^^^
(2)回归方程为y=bx+a,其中
(3)通过求Q=? ?yi-bxi-a?的最小值而得到回归直线的方法,即使得样本数据的点到
2
i=1n
回归直线的距离的平方和最小,这一方法叫做最小二乘法.
(4)相关系数:
当r>0时,表明两个变量正相关; 当r<0时,表明两个变量负相关.
r的绝对值越接近于1,表明两个变量的线性相关性越强.r的绝对值越接近于0,表明两个变量之间几乎不存在线性相关关系.通常|r|大于0.75时,认为两个变量有很强的线性相关性.
3.独立性检验 (1)2×2列联表
设X,Y为两个变量,它们的取值分别为{x1,x2}和{y1,y2},其样本频数列联表(2×2列联表)如下:
x1 x2 总计
(2)独立性检验
y1 a c a+c y2 b d b+d 总计 a+b c+d a+b+c+d n?ad-bc?2
利用随机变量K(也可表示为χ)的观测值k=(其中n=a+b+c
?a+b??c+d??a+c??b+d?
2
2
+d为样本容量)来判断“两个变量有关系”的方法称为独立性检验.
二、常用结论
^^
(1)求解回归方程的关键是确定回归系数a,b,应充分利用回归直线过样本中心点 (x,y).
(2)根据K2的值可以判断两个分类变量有关的可信程度,若K2越大,则两分类变量有关的把握越大.
^
(3)根据回归方程计算的y值,仅是一个预报值,不是真实发生的值.
考点一 回归分析
考法(一) 求线性回归方程
[典例] (2019·湘东五校联考)已知具有相关关系的两个变量x,y的几组数据如下表所示:
x y 2 3 4 6 6 7 8 10 10 12 (1)请根据上表数据在网格纸中绘制散点图; ^^^
(2)请根据上表数据,用最小二乘法求出y关于x的线性回归方程y=bx+a,并估计当x=20时y的值.
相关推荐: