练习五 数据的收集与处理
数据的收集
知识要点
◆要点1 总体、个体和样本及样本容量
总体、个体和样本:总体是指所要考察对象的全体;个体是指组成总体的每一个考察对象;其中从总体中抽取的部分个体叫做总体的一个样本。样本容量则是指样本中个体的数目,不用带单位。 ◆要点2 普查与抽样调查
普查:为了一定的目的而对考察对象进行的全面调查,称为普查。 抽样调查:从总体中抽取部分个体进行调查,这种调查称为抽样调查 其优点:调查量小,省时、省力; 缺点:准确性上有差距。 使抽取样本具有较强的广泛性和代表性,常用以下几种抽样方法:
※ 随机抽样法(使总体中的每个个体都有可能被抽到,当总体数目较少时使用此法);
※ 系统抽样法(将总体分成均衡的几部分,然后按预定的规则,从中抽取部分作样本,当总体中个体数目较多时,常用此法);
※ 分层抽样法(当总体是由明显差异的几个部分组成的,可按差异分成几个部分,然后按各部分所占比例进行抽样。) ★说明:(1)要判断一个调查是适合做普查还是适合做抽样调查,关键是要看调查的范围有多大,调查的目的如何,对调查结果的要求是否很高,同时还要兼顾人力、物力等因素。(2) 若要求全面了解数据且总体个数不多时用普查;若总体个数较多,且调查时具有破坏性、危险性或受条件限制时用抽样调查。, (3) 为了提高抽样调查结果的准确性,应注意被调查对象不得太少,即抽取样本尽可能大,被调查对象应是随机抽查的,调查数据应是真实的,即要注意抽样的随机性,样本的真实性、广泛性、代表性。 易错易混点
(1) 正确理解总体与个体(关键要看考察对象)、普查与抽样调查的概念;(2) 抽样调查时,使抽取的样本具有代表性及广泛性,从而保证结果较为准确。
1. 为调查我国老年人的健康情况,小明、小颖、小花三位同学分别作了如下调查: 小明:在公园中调查了100名老年人的健康情况; 小颖:在医院里调查了100名老年人的健康情况; 小花:调查了10名老年邻居的健康情况。
你认为这三位同学谁的调查方式相对好一些?为什么?你认为还有比这好的方法吗? 典型例题
例1. 某家电生产厂家在某市三家经销本厂产品的大商场进行调查,发现产品的销售量占这三家大
商场同类产品销量的40%,由此在广告中宣称:我们的产品在国内同类产品的销量占40%,请你用所学的统计知识,说明该宣传是否可靠,为什么?
1
例2. 某地区为了分析该地区9000名九年级学生的数学成绩,从中抽取了40本试卷,每本30份,
则下列说法中不正确的是( )
A. 总体是9000名九年级学生的数学成绩 B. 个体是每一名九年级学生的数学成绩 C. 样本是40名九年级学生的数学成绩 D. 样本是1200名九年级学生的数学成绩
例3 某火柴厂要检验一批火柴质量,应采用_________方式,原因是___________。
例4 《红楼梦》是我国最经典的名著之一,为了了解我国阅读过《红楼梦》的读者,你认为采用
什么方式调查更合适些?你认为对不同地区、不同年龄、不同文化背景的人所作的调查结果会一样吗?
例5 去年,苏州市政府的一项实事工程就是由政府投入1000万资金,对城区4万户家庭的老师
水龙头和13升抽水马桶进行免费改造,某社区为配合政府完成该项工作,对社区内1200户家庭中的120户进行了随机抽样调查,并汇总成下表: 改造情况 均不改造 户数
(1) 试估计该社区需要对水龙头、马桶进行改造的家庭共有________户;
(2) 改造后,一只水龙头一年大约可节省5吨水,一只马桶一年大约可节省15吨水。试估计该社区一年共可节约多少吨自来水?
(3) 在抽样的120户家庭中,既要改造水龙头又要改造抽水马桶的家庭共有多少户?
学习自评
1. 某商店在“五一”黄金周期间平均日营业额为26万元,由此估计该商店这个月的总营业额为806
万元,你认为这样估计合理吗?答:________。理由是_____________。
2. (1)2003年“非典”期间,我国每日公布的“非典”疫情,其中有关数据的收集所用的调查方式
是____________。(填:抽样调查或普查)
(2) 有关部门需要了解一批食品的质量情况,通常采用的调查方式是_________.(填:抽样调查或普查)
3. “在一次考试中,考生有2万多名,如果为了得到这些考生的数学平均成绩,而将他们的成绩全
部相加再除以所有考生总数,那将是十分麻烦的,那么怎样才能了解这些考生的数学平均成绩呢?”
“通常,在考生很多的情况下,我们抽取部分考生(比如说500名)的成绩,用他们的平均成绩去估计所有考生的平均成绩。”
2
改造水龙头 改造马桶 1个 2个 3个 4个 1个 2个 31 28 21 12 69 2 20
4.
5.
6.
7.
上述文字表述了用样本平均数估计总体平均数的统计思想,其中,总体指的是__________,个体指的是_____________。
下列调查最适合用普查方式的是( )
A. 夏季冷饮市场上冰淇淋的质量情况 B. 对中考学生的数学试卷答题情况进行分析 C. 你所在班级的同学的身高情况 D. 一个城市一月的流动人口情况 下列调查,比较适合用普查而不是和用抽样调查方式的是( ) A. 为了了解中央电视台春节联欢晚会的收视率
B. 为了了解九年级某班的每个学生周末(星期六)晚上的睡眠时间 C. 为了了解夏季服装市场上一批短袖衫的质量情况 D. 为了考察一片实验田某种水稻的穗长情况
为确定本市初中七、八、九年级学生校服的生产计划,有关部门准备对180名初中男生的身高作调查,现有三种调查方案,样本选取正确的是( ) A. 测量体校男子篮球、排球队中的180名队员的身高
B. 随机抽取本校5名学生的身高 C. 查阅有关外地180名男生的身高
D. 在本地的市区和郊县各任选一所完全中学,两所初级中学,在这六所学校有关年级的(1)班中用抽签的方法分别选出10名男生,然后测量他们的身高
某医院为了了解病人每分钟呼吸次数,对20名病人进行测量,结果纪录如下:12,20,16,18,20,28,23,16,15,18,20,24,18,21,18,19,18,31,18,13。
(1) 你能说出采用了什么样的调查方式吗?其中总体、个体、样本分别是什么? (2) 你能求出这组数据的平均数、中位数及众数吗?
8. 春节联欢晚会,往往对“最喜欢的节目”进行调查。下面表中是对小品类节目调查收集的数据:
名称 喜爱人数(万) A 1 872 B 828 C 14 205 D 87 E 725 (1) 调查收集的数据有用吗?
(2) 最受欢迎的小品是哪个?说明你的理由。 (3) 能说小品D不好吗?
9. 请你设计一个方案,调查全校女生喜欢舞蹈的情况。看一看不喜欢舞蹈的女生占多少?
10. 有人说,样本越大对总体的估计就越精确,你是如何看待这一说法的?请说说你的看法。
11. 在暑期社会实践活动中,小明所在小组的同学与一家玩具生产厂家联系,给该厂组装玩具,该厂
同意他们组装240套玩具,这些玩具分为A、B、C三种型号,它们的数量比例以及每人每小时组装各种型号玩具的数量如图SJ—01 甲、乙
3
SJ—01 甲 SJ—01 乙
所示:
若每人组装同一种型号玩具的速度都相同,根据以上信息,完成下列填空:
(1) 从上述统计图可知,A型玩具有_______套,B型玩具有_______套,C型玩具有_______套。 (2) 若每人组装A型玩具16套与组装C型玩具12套所花的时间相同,那么a的值为_______,每人每小时能组装C型玩具___________套。
频数与频率、数据的波动
知识要点
◆要点1 频数、频率的概念及其关系
频数:我们把每个对象出现的次数,叫做频数。各组频数之和等于数据总数。 频率:每个对象出现的次数与总次数的比叫做频率,所有数据的频率之和为1。 它们之间的关系:频率?频数频数,或频数?频率?数据总数,或数据总数?。
数据总数频率◆要点2 频数分布图表的作用及制作步骤
●频数分布图表的作用:使数据分布规律形象化、直观化。看清频数分布图表的组成,例如频数分布直方图横向指标反映对象的类别,纵向指标反映该类别考察对象的数量特征。在频数直方分布图中,若数据连续,则直方图中的长方形是紧密的,若数据不连续,则图中的长方形是分开的。另外频数分布折线图是在频数分布直方图的基础上取中点连线得到的,其目的是使数据的总体分布规律更为直观化。
●绘制频数分布直方图表和频数折线图的步骤
(1) 对一组数据计算最大值与最小值的差,确定统计量的范围;(2) 决定组距和组数,数据越多,分的组数也应越多,当数据在100个以内时,通常按照数据的多少分成5~12组,组距是指每个小组的两个端点之间的距离,作图中各个小组的组距相等;(3) 确定分点,方法很多,一般是分点比数据多一位小数,并把第1小组的起点稍微减小一点,最后1组的终点稍微增大一点,总之只要保证数据的不重不漏即可;(4) 列频数分布表,列表时可采用唱票法进行累计;(5) 画频数分布直方图或折线图(频数分布直方图中各频数比等于各小长方形高之比,若频数为1的小长方形的高为h,则频数为k的小长方形的高就是hk。)。
★说明:(1)频数分布直方图中求平均数时,取每组数据的中间值作为该组数据的平均数。(2) 小长方形的高=
频率1频率??频数,小长方形的面积=?组距。 组距组距?数据总数组距◆要点4 极差、方差、标准差的意义及计算
(1)极差:一组数据中最大数据与最小数据的差。一般情况下,极差越小,该组数据的波动越小;极差越大,该组数据的波动越大。
(2)方差:各个数据与平均数之差的平方的平均数。 即s?2221x1?x?x2?x???xn?xn????????,常简化为s22?21222x1?x2???xn?nx。 n??其中x是x1,x2,?,xn的平均数,s2为方差。若两组数据的平均数相同,则方差小的那组数据波动小;方差大的那组数据波动大。
4
相关推荐: