放回.我们在抽样调查中用的是不放回抽取. 简单随机抽样的特点:被抽取样本的总体个数有限.从总体中逐个进行抽取,使抽样便于在实践中操作.它是不放回抽取,这使其具有广泛应用性.每一次抽样时,每个个体等可能的被抽到,保证了抽样方法的公平性.
实施抽样的方法:抽签法:方法简单,易于理解.随机数表法:要理解好随机数表,即表中每个位置上等可能出现0,1,2,…,9这十个数字的数表.随机数表中各个位置上出现各个数字的等可能性,决定了利用随机数表进行抽样时抽取到总体中各个个体序号的等可能性. ②系统抽样
系统抽样适用于总体中的个体数较多的情况.
系统抽样与简单随机抽样之间存在着密切联系,即在将总体中的个体均分后的每一段中进行抽样时,采用的是简单随机抽样.
系统抽样的操作步骤:第一步,利用随机的方式将总体中的个体编号;第二步,将总体的编号分段,要确定分段间隔k,当N(N为总体中的nN个体数,n为样本容量)是整数时,k?N;当不nn
是整数时,通过从总体中剔除一些个体使剩下的
?个体个数N能被n整除,这时k?N;第三步,在n第一段用简单随机抽样确定起始个体编号l,再按事先确定的规则抽取样本.通常是将l加上间隔k得到第2个编号(l?k),将(l?k)加上k,得到第3个编号(l?2k),这样继续下去,直到获取整个样本.
③分层抽样
当总体由明显差别的几部分组成时,为了使抽样更好地反映总体情况,将总体中各个个体按某种特征分成若干个互不重叠的部分,每一部分叫层;在各层中按层在总体中所占比例进行简单随机抽样.
分层抽样的过程可分为四步:第一步,确定样本容量与总体个数的比;第二步,计算出各层需抽取的个体数;第三步,采用简单随机抽样或系统抽样在各层中抽取个体;第四步,将各层中抽取的个体合在一起,就是所要抽取的样本. (2)用样本估计总体
样本分布反映了样本在各个范围内取值的概率,我们常常使用频率分布直方图来表示相应样本的频率分布,有时也利用茎叶图来描述其分
布,然后用样本的频率分布去估计总体分布,总体一定时,样本容量越大,这种估计也就越精确. ①用样本频率分布估计总体频率分布时,通常要对给定一组数据进行列表、作图处理.作频率分布表与频率分布直方图时要注意方法步骤.画样本频率分布直方图的步骤:求全距→决定组距与组数→分组→列频率分布表→画频率分布直方图.
②茎叶图刻画数据有两个优点:一是所有的信息都可以从图中得到;二是茎叶图便于记录和表示,但数据位数较多时不够方便.
③平均数反映了样本数据的平均水平,而标准差反映了样本数据相对平均数的波动程度,其计算公式为
1ns?(xi?x)2?ni?1. 有时也用标准差的平方
———方差来代替标准差,两者实质上是一样的.
(3)两个变量之间的关系
变量与变量之间的关系,除了确定性的函数关系外,还存在大量因变量的取值带有一定随机性的相关关系.在本章中,我们学习了一元线性相关关系,通过建立回归直线方程就可以根据其
部分观测值,获得对这两个变量之间的整体关系的了解.分析两个变量的相关关系时,我们可根据样本数据散点图确定两个变量之间是否存在相关关系,还可利用最小二乘估计求出回归直线方程.通常我们使用散点图,首先把样本数据表示的点在直角坐标系中作出,形成散点图.然后从散点图上,我们可以分析出两个变量是否存在相关关系:如果这些点大致分布在通过散点图中心的一条直线附近,那么就说这两个变量之间具有线性相关关系,这条直线叫做回归直线,其对应的方程叫做回归直线方程.在本节要经常与数据打交道,计算量大,因此同学们要学会应用科学计算器.
(4)求回归直线方程的步骤:
第一步:先把数据制成表,从表中计算出
x,y,?xiyi,?xi2i?1i?1nn;
第二步:计算回归系数的a,b,公式为
nnn?n?xiyi?(?xi)(?yi)?i?1i?1i?1?,?b?nn22?n?xi?(?xi)?i?1i?1???a?y?bx;
y?bx?a. 第三步:写出回归直线方程$(4)独立性检验
相关推荐: