解析 (1)由系统抽样的原理知,抽样的间隔为52÷4=13,故抽取的样本的编号分别为7,7+13,7+13×2,7+13×3,即7号,20号,33号,46号. ∴样本中还有一位同学的编号为20号.
(2)因为样本容量n=60,总体容量N=200+400+300+100=1 000,所以抽取比例为=3=. 50
3
因此应从丙种型号的产品中抽取300×=18(件).
50答案 (1)C (2)18 热点二 用样本估计总体 考法1 数字特征与茎叶图的应用
【例2-1】 (2018·北京东城区质检)某班男女生各10名同学最近一周平均每天的锻炼时间(单位:分钟)用茎叶图记录如下:
n60N1000
假设每名同学最近一周平均每天的锻炼时间是互相独立的. ①男生每天锻炼的时间差别小,女生每天锻炼的时间差别大; ②从平均值分析,男生每天锻炼的时间比女生多;
③男生平均每天锻炼时间的标准差大于女生平均每天锻炼时间的标准差;
④从10个男生中任选一人,平均每天的锻炼时间超过65分钟的概率比同样条件下女生锻炼时间超过65分钟的概率大.
其中符合茎叶图所给数据的结论是( ) A.①②③
B.②③④
C.①②④
D.①③④
解析 由茎叶图知,男生每天锻炼时间差别小,女生差别大,①正确.
51
男生平均每天锻炼时间超过65分钟的概率P1==,女生平均每天锻炼时间超过65分钟
10242
的概率P2==,P1>P2,因此④正确.
105
设男生、女生两组数据的平均数分别为x甲,x乙,标准差分别为s甲,s乙.
5
-
-
易求x甲=65.2,x乙=61.8,知x甲>x乙,②正确.
又根据茎叶图,男生锻炼时间较集中,女生锻炼时间较分散, ∴s甲
因此符合茎叶图所给数据的结论是①②④. 答案 C
考法2 用样本的频率分布估计总体分布
【例2-2】 (2017·北京卷)某大学艺术专业400名学生参加某次测评,根据男女学生人数比例,使用分层抽样的方法从中随机抽取了100名学生,记录他们的分数,将数据分成7组:[20,30),[30,40),…[80,90],并整理得到如下频率分布直方图:
----
(1)从总体的400名学生中随机抽取一人,估计其分数小于70的概率;
(2)已知样本中分数小于40的学生有5人,试估计总体中分数在区间[40,50)内的人数; (3)已知样本中有一半男生的分数不小于70,且样本中分数不小于70的男女生人数相等.试估计总体中男生和女生人数的比例.
解 (1)根据频率分布直方图可知,样本中分数不小于70的频率为(0.02+0.04)×10=0.6, 所以样本中分数小于70的频率为1-0.6=0.4.
所以从总体的400名学生中随机抽取一人,其分数小于70的概率估计为0.4. (2)根据题意,样本中分数不小于50的频率为 (0.01+0.02+0.04+0.02)×10=0.9,
分数在区间[40,50)内的人数为100-100×0.9-5=5. 所以总体中分数在区间[40,50)内的人数估计为400×(3)由题意可知,样本中分数不小于70的学生人数为 (0.02+0.04)×10×100=60,
1
所以样本中分数不小于70的男生人数为60×=30.
2
所以样本中的男生人数为30×2=60,女生人数为100-60=40,男生和女生人数的比例为60∶40=3∶2.
6
5
=20. 100
所以根据分层抽样原理,总体中男生和女生人数的比例估计为3∶2.
探究提高 1.平均数与方差都是重要的数字特征,是对数据的一种简明描述,它们所反映的情况有着重要的实际意义.平均数、中位数、众数描述数据的集中趋势,方差和标准差描述数据的波动大小.
2.在本例2-2中,抓住频率分布直方图各小长方形的面积之和为1,这是求解的关键;本题易混淆频率分布条形图和频率分布直方图,误把频率分布直方图纵轴的几何意义当成频率,导致样本数据的频率求错.
【训练2】 (1)如图所示的茎叶图记录了甲乙两组各5名工人某日的产量数据(单位:件).若这两组数据的中位数相等,且平均值也相等,则x和y的值分别为( ) A.3,5 C.3,7
B.5,5 D.5,7
解析 由茎叶图,可得甲组数据的中位数为65,从而乙组数据的中位数也是65,所以y=5.由乙组数据59,61,67,65,78,可得乙组数据的平均值为66,故甲组数据的平均值也56+62+65+74+70+x为66,从而有=66,解得x=3.
5答案 A
(2)我国是世界上严重缺水的国家,某市为了制定合理的节水方案,对居民用水情况进行了调查.通过抽样,获得了某年100位居民每人的月均用水量(单位:吨),将数据按照[0,0.5),[0.5,1),……,[4,4.5]分成9组,制成了如图所示的频率分布直方图.
①求直方图中a的值;
②设该市有30万居民,估计全市居民中月均用水量不低于3吨的人数,说明理由; ③估计居民月均用水量的中位数.
解 ①由频率分布直方图可知:月均用水量在[0,0.5)内的频率为0.08×0.5=0.04. 同理,在[0.5,1),[1.5,2),[2,2.5),[3,3.5),[3.5,4),[4,4.5]等组的频率分别为0.08,0.21,0.25,0.06,0.04,0.02.
7
由1-(0.04+0.08+0.21+0.25+0.06+0.04+0.02)=0.5×a+0.5×a, 解得a=0.30.
②由①知,该市100位居民中月均用水量不低于3吨的频率为0.06+0.04+0.02=0.12.由以上样本的频率分布,可以估计30万居民中月均用水量不低于3吨的人数为300 000×0.12=36 000. ③设中位数为x吨.
因为前5组的频率之和为0.04+0.08+0.15+0.21+0.25=0.73>0.5. 又前4组的频率之和为0.04+0.08+0.15+0.21=0.48<0.5. 所以2≤x<2.5.
由0.50×(x-2)=0.5-0.48,解得x=2.04. 故可估计居民月均用水量的中位数为2.04吨. 热点三 回归分析
【例3】 (2018·成都质检)某省的一个气象站观测点在连续4天里记录的AQI指数M与当天的空气水平可见度y(单位:cm)的情况如表1:
M y 900 0.5 700 3.5 300 6.5 100 9.5 该省某市2017年11月份AQI指数频数分布如表2:
M 频数(天) [0,200) 3 [200,400) 6 [400,600) 12 [600,800) 6 [800,1 000] 3 (1)设x=,若x与y之间是线性关系,试根据表1的数据求出y关于x的线性回归方程;
100(2)小李在该市开了一家洗车店,洗车店每天的平均收入与AQI指数存在相关关系如表3:
MM 日均收 [0,200) -2 000 [200,400) -1 000 [400,600) 2 000 [600,800) 6 000 [800,1 000] 8 000 入(元) 根据表3估计小李的洗车店2017年11月份每天的平均收入.
n∑xiyi-nx y附参考公式:y=bx+a,其中b=
^
^
^
^
--
^
-
^-
i=1
n2
∑xi-nxi=1
-
,a=y-bx
2
8
相关推荐: