第二讲 统计、统计案例
从近三年高考试题的统计分析来看,抽样方法、频率分布直方图、茎叶图、样本的数字特征等多以选择题、填空题的形式考查,一般为
容易题.考查回归分析与独立性检验是高考的新趋势. 预测2016年高考中,本讲内容仍为考查的热点之一,有关统计与概率、统计案例的解答题要引起足够的重视.
随机抽样
三种抽样方法的比较列表如下:
用样本估计总体 1.频率分布直方图.
(1)绘制频率分布直方图的步骤.
①求极差;②决定组距和组数;③将数据分组;④列频率分布表;⑤画频率分布直方图.
(2)由频率分布直方图估计平均数.
平均数等于频率分布直方图中每个小矩形的面积乘以小矩形底边中点的横坐标之和.
2.方差与标准差.
样本数据为x1,x2,…,xn,x表示这组数据的平均数,则方差s2
1
=[(x1-x)2+(x2-x)2+…+(xn-x)2], n
标准差s=1[(x1-x)2+(x2-x)2+…+(xn-x)2]. n 线性回归方程
线性回归方程为^y=^bx+^a,其中
回归分析及独立性检验
1.回归分析的基本思想及其初步应用. 对相关系数r:
(1)r>0,表明两个变量正相关; (2)r<0,表明两个变量负相关;
(3)r的绝对值越近1,表明两个变量的线性相关性越强; (4)r的绝对值越近0,表明两个变量的线性相关性越弱;
(5)当|r|大于0.75时,认为两个变量有很强的线性相关关系. 2.独立性检验.
假设有两个分类变量X和Y,它们的值域分别为{x1,x2}和{y1,y2},其样本频数列联表(称为2×2列联表)为:
x1 x2 y1 a c y2 b d 总计 a+b c+d a+b+c+d 总计 a+c b+d 2
2
(a+b+c+d)(ad-bc)2 则K(χ)=,
(a+b)(c+d)(a+c)(b+d)若K2(χ2)>3.841,则有95%的把握说两个事件有关; 若K2(χ2)>6.635,则有99%的把握说两个事件有关.
判断下面结论是否正确(请在括号中打“√”或“×”). (1)相关关系与函数关系都是一种确定性的关系,也是一种因果关系.(×)
(2)“名师出高徒”可以解释为教师的教学水平与学生的水平成正相关关系.(√)
(3)只有两个变量有相关关系,所得到的回归模型才有预测价值.(√)
(4)某同学研究卖出的热饮杯数y与气温x(℃)之间的关系,得回归方程^y=-2.352x+147.767,则气温为2 ℃时,一定可卖出143杯热饮(×)
(5)事件X,Y关系越密切,则由观测数据计算得到的K2的观测值
越大.(√)
(6)由独立性检验可知,有99%的把握认为物理成绩优秀与数学成绩有关,某人数学成绩优秀,则他有99%的可能物理优秀.(×)
1.(2015·北京卷)某校老年、中年和青年教师的人数见下表,采用分层抽样的方法调查教师的身体状况,在抽取的样本中,青年教师有320人,则该样本中的老年教师人数为(C)
类别 老年教师 中年教师 青年教师 合计 A.90 B.100 C.180 D.300 解析:设该样本中的老年教师人数为x,由题意及分层抽样的特点得
320x=,故x=180. 9001 600
2.(2014·山东卷)为了研究某药品的疗效,选取若干名志愿者进行临床试验,所有志愿者的舒张压数据(单位:kPa)的分组区间为[12,13),[13,14),[14,15),[15,16),[16,17],将其按从左到右的顺序分别编号为第一组,第二组,…,第五组,如图是根据试验数据制成的频率分布直方图,已知第一组与第二组共有20人,第三组中没有疗效的有6人,则第三组中有疗效的人数为(C)
人数 900 1 800 1 600 4 300
相关推荐: