天行健 君子以自强不息
4:用样本的数字特征估计总体的数字特征
x?x1?x2???xnn
2(1)样本均值:
(x1?x)2?(x2?x)2???(xn?x)2s?s?n(2)样本标准差: (3)众数:在样本数据中,频率分布最大值所对应的样本数据(可以是多个)。
(4)中位数:在样本数据中,累计频率为1.5时所对应的样本数据值(只有一个)。
注意:
①如果把一组数据中的每一个数据都加上或减去同一个共同的常数,标准差不变
②如果把一组数据中的每一个数据乘以一个共同的常数k,标准差变为原来的k倍
③一组数据中的最大值和最小值对标准差的影响,区间(x?3s,x?3s)的应用;
“去掉一个最高分,去掉一个最低分”中的科学道理 5、用样本的频率分布估计总体分布 (1)频率分布表与频率分布直方图
频率分布表盒频率分布直方图,是从各个小组数据在样本容量中所占比例大小的角度,来表示数据分布规律,它可以使我们看到整个样本数据的频率分布情况。
具体步骤如下:
第一步:求极差,即计算最大值与最小值的差.
第二步:决定组距和组数:组距与组数的确定没有固定标准,需要尝试、选择,力求有合适的组数,以能把数据的规律较清楚地呈现为准.太多或太少都不好,不利对数据规律的发现.组数应与样本的容量有关,样本容量越大组数越多.
极差一般来说,容量不超过100的组数在5至12之间.组距应最好“取整”,它与组距天行健 君子以自强不息
有关.
极差极差注意:组数的“取舍”不依据四舍五入,而是当组距不是整数时,组数=[组距]
+1.
②频率分布折线图 :连接频率分布直方图中各个小长方形上端的重点,就得到频率分布折线图。
③总体密度曲线:总体密度曲线反映了总体在各个范围内取值的半分比,它能给我们提供更加精细的信息。
(2)茎叶图:茎是指中间的一列数,叶是指从茎旁边生长出来的数。 .
6:变量间的相关关系:自变量取值一定时因变量的取值带有一定随机性的两个变量之间的关系交相关关系。对具有相关关系的两个变量进行统计分析的方法叫做回归分析。
(1)回归直线:根据变量的数据作出散点图,如果各点大致分布在一条直线的附近,就称这两个变量之间具有线性相关的关系,这条直线叫做回归直线方程。如果这些点散布在从左下角到右上角的区域,我们就成这两个变量呈正相关;若从左上角到右下角的区域,则称这两个变量呈负相关。
相关推荐: