第四章 正 态 分 布
如果将第二章中的(表2 — 1)中的数据绘制成直方图,把每个方条顶部中点联结起来,就得到一个图形,它称为频数多边形。(图4 — 1)当分组数很多,组距很小时,频数多边形就趋于类似(图4 — 2)所示的平滑的曲线。这种曲线呈现出两侧近似对称的钟形。随机变量的类似这种分布,在自然界是相当普遍的其中最有代表性的是正态分布。下面就来介绍正态分布及其在体育中的几个应用。
f10987654321x
图4 — 1 频数多边形图
第一节 正态分布曲线的形式
如果随机变量X的概率密度函数为
1?(x??)2 y =(???x???) (4 — 1) e22??2?则称随机变量X是服从正态分布的由上式绘出的图形叫做正态曲线。(图4 — 2)X的变动范围在 ?? 至 +? 间。
Y0μX
图4 — 2 正态分布曲线
正态分布曲线中有两个参数:均值 ? 及方差 ?2。为了应用方便,对式(4 — 1)中的随机变量经过一个称为标准化的变换,即令u
x??来代替原式中的 , 寻这时的随机变量u的概率密度函数成为:
? y =
1u2? (4 — 2) e22?按照(4 — 2)式绘出的图形,称作标准正态曲线。(图4 — 3)
Y0.40.30.20.1
-3-2-10123μ
图4 — 3 标准正态分布曲线
第二节 正态分布曲线的特征
正态分布曲线有许多特点,它们对实际工作有很大的帮助。它的主要特点有以下几个方面:
一,正态分布的形式是对称的(但对称的分布不一定是正态分布)。在正态分布中均值与中位数相重合。
二,从中央最高点逐渐向两侧降低,降低的速度是先慢后快,以后又再次减慢,最后接近横轴,但终究不能与横轴相交。
三,从中央向两侧逐渐下降,它的方向是先向内弯,达到离均值左右各一个标准差时又改向外弯,是以 ??1? 的点为曲线从内弯转向外弯的转折点,即正态曲线中标准差与曲线有固定的关系。
四,因为正态曲线是对称的,在曲线下不仅平均数的两侧面积相等,各相当距离间的面积相等,而且各相当距离间的曲线高度也相等,正态曲线下(与横轴间)的总面积为1. 00。
五,正态曲线可以有不同形式,它们的均值和标准差可以不相同,均值不同表明曲线在横轴上所处位置不同,标准差不同表明曲线的形态不同。标准差小则曲线高、且窄;标准差大则曲线低、且宽。(图4 — 4)由式(4 — 1)和(4 — 2)知,标准正态曲线的 ? = 0,? = 1,即标准正态曲线是关于纵轴对称;它在 ? = 0时,有最大值,它近似等于0. 4,如(图4 — 3)所示。
Yσ=0.5σ=1σ=20
图4 — 4 三种不同形式的正态分布曲线
第三节 正态分布表
从某市17岁男生中随机抽出205人测量身高,由这个样本计算得到 X= 168. 40厘米,S = 6. 13厘米。假定该市17岁男生身高服从正态分布,试估计身高在16. 40 — 172. 40厘米之间的人数。
求解这类问题的一般方法是:求从正态总体中随机选取一个个体的测量值落在区间(a, b)上的概率。这个概率在标准正态曲线下就是曲线、X轴、直线X = a 和X — b 所围成的面积。(图4 — 5)当概率P求得后,要求的人数约等于总人数乘以P值。
μX
Y0.40.30.20.1-3-2-10a1b23μ
图4 — 5 随机变量X在区间(a,b)内取值的概率示意图
表的左边第1 列这横轴上的位置,它是指横轴上某一点与平均值的距离,以标准差为单位来表示,通常记为u,即 u =
x?? (4 — 3) ?表上边的第1 行为u值的第2位小数。表的主体部分是各u值与均数(u = 0)之间所对应的单侧面积(或概率)。
一、知U值求对应的面积
例 4 — 1 求u 值为 -1 至 +2 之间对应的面积。 解:由于标准正态曲线是关于x = u对称的均数处的u值为零,所以u值在 -1至0这间对应的面积与它在 0 至 +1 之间的对应面积相等。查书后附表1得u值在-1至0的对应面积是34. 13%;u值在0至 +2 之间的面积是47. 72%。前者在均值的左边,后者在均值的右边,因此这两块面积之和便是所求面积。(图4 — 6)即:
34. 13% + 47. 72% = 81. 85%
81.854.13G.72%-102=-10图4—6
+02
例 4 — 2 本节开始提出的问题,即试估计身高在 160. 40 — 172. 40厘米之间的人数。
解:首先要求出身高为160. 40厘米和172. 40厘米的u值,按式(4 — 3)有(当 u 和 ? 未知时,可用 X 和S近似代替):
相关推荐: