数量方法笔记
第一章 数据的整理和描述
通过本章的学习,考生应当理解和掌握如何对数据进行整理、分组、制表和画图,能够适当地选择和解释数据的各种综合指标,以便能够突出地显示数据的本技和统计含义,从而更有效地交流数据和使用数据。
第一节数据的类型
不同分类型数据描述的是事物的品质特征 度量 尺度 数量型
截面数据——不同单位同一时间 时间的关系 时间序列数据——同一单位不同时间 平行数据——不同单位不同时间
第二节 数据的整理与图表显示 一、数据的分组与频率直方图
分组的标志及方法 频数与布表 1.整理——分组 分几个组
单变量值分组——离散型的变量 (数出来的不能再分割)如人口数 2.分组的方法 数量表现比较小
组距分组——条件:离散型变量但数量比较多
所有连续变量只能用组距分组
组距c?b?a a?min,b?max组数m是根据实际情况而定的 m 组数 最小值 最大值 组中值=
上限?下限 2二、图形显示:饼形图、条形图、柱形图、散点图、折线图、曲线图、茎叶图。 1.饼图的作用:反映各个部分的构成各频率的总合是100%。 2.条形图和柱形图:信息的比较 条形图:不同单位,不同信息的比较 柱形图:同一单位不同时间信息的比较。
3.折线图:同柱形图作用相似,对同一的数据折线图具有唯一性(两点间有且只有一条直线)。
4.曲线图:同折线图作用相似也是表示不同时间信息的比较,但不具有唯一性。 5.散点图:表示两个变量之间的相互关系。(两个变量的任何一对取值都在平面直角坐标系上代表一个点)。
6.茎叶图:把每一个数据分解成两部分——茎与叶
它的优点在于它既保留了所有的原始数据又直观地显示出了数据的
分布情况 (与条形图有相似)
第三节 数据集中趋势的度量 一、平均数 平均数?x1??xn全体数据的总和
数据的个数?x(没有分组的数据) n1.简单平均=?2.加权算术平均:x? v是频数也叫权数
?xv(对于分组的数据) ?v例如:求下列平均数:
X 3 4 5 6 7 频数v 3 4 3 2 1 X.V 3×3 4×4 5×3 6×2 7×1
平均数x??xv59= ?v13利用距中数计算的平均数不是精确的而是近似的。
二、中位数——先排队——中间位置——数值 若n为奇数,则位于正中间的那个数据就是中位数,即
xn?xnxn?1 就是中位数。 2若n为偶数则中位数为例如:
22?12就是中值数。
1.2、4、5、7、8 中5是中位数,4、5、2、7、8要先排序:2、4、5、7、8,
n?15?1=?3那么数是5,n表示数的位置 22nn?15?72.4、5、7、8、10 ???6 n为5,n+1位是7
222中位数还是5。 套公式三、众数
众数是出现次数最多的不受极端值的影响。众数的主要缺点是一个数据集可能没有众数,或众数可能不唯一,而数据集的平均数和中位数都是存在且唯一的。 四、平均数,中位数和众数的关系:
1.数据分布是对称分部时:众数=中位数=平均数
2.数据分布不是对称分部时:左偏分布时:众数<中位数<平均数 右偏分布时:众数>中位数>平均数 第四节 数据离散趋势的度量
一、极差:所有数据的最大值减去最小值的差,极差R=最太值-最小值
极差容易受极端值的影响有时是无效的
二、四分位点和四分位极差
四分位极差先排队再等分为4份 ,见课本P26图1.19,其中位数为Q2,
n?1对应Q1,中43(n?1)的对应Q3,n为总个数。Q3-Q1=四分位级差,这两个点上的4数值叫四分位点。
如果四分位点不是一个整数则将前后两位数相加除以2便是。
三、方差和标准差(课本P26) 方差(?2)的计算公式为:?2?四、变异系数(课本P29)
变异系数是标准差与平均数的比值,即:V?第二章 随机事件及其概率
本章主要介绍随机试验和事件,事件间的关系及其运算,事件的概率与古典概型,最后是条件概率与事件的独立性。 第一节 随机试验与随机事件 一、随机试验 1.试验
2.随机试验 ①可以在相同条件下重复进行。
②每次试验的结果可能不止一个,但所有可能出现的结果事先知道。
③试验结束之前,无法确定该次试验的确切结果。 二、随机事件
随机试验中各种可能出现的结果,称随机事件。 随机事件分:
1、基本事件(只出现一个结果)。 2、复合事件(由若干个基本事件组成)。
3、必然事件(把所有可能出现的结果都放在一起形成一个集合)。 4、不可能事件(一定不会发现的事件)。
三、样本空间(课本P35)
1.所有基本事件的全体所组成的集合称为样本空间,它是必然事件,因此我们也常常用?表示。
1?(xi?x)2 n?x?100%
相关推荐: