第一范文网 - 专业文章范例文档资料分享平台

数据的描述性分析

来源:用户分享 时间:2025/5/25 8:01:38 本文由loading 分享 下载这篇文档手机版
说明:文章内容仅供预览,部分内容可能不全,需要完整文档或者需要复制内容,请下载word后使用。下载word有问题请添加微信号:xxxxxxx或QQ:xxxxxx 处理(尽可能给您提供完整文档),感谢您的支持与谅解。

式中:L—众数所在组的下限;U—众数所在组的上限;dm—众数所在组的组距;

fm—众数所在组的次数;fm?1—众数所在组前一组的次数;fm?1—众数所在组后一组

的次数。

【例4.10】现利用表4.1的资料,计算众数。

【解】将表4.5的资料代入计算众数的下限公式(4.13)和上限公式(4.14),所得结果一致。

按下限公式(4.13)计算:

Mo?60?按上限公式(4.14)计算:

80?40?10?65.71(个)

(80?40)?(80?50)Mo?70?80?50?10?65.71(个)

(80?40)?(80?50)从上面计算中可知,众数的数值要受到众数所在组相邻两组次数多少的影响。当众数组前一组次数大于众数所在组后一组次数时,众数接近众数组的下限;反之,当众数组前一组次数小于众数所在组后一组次数时,众数接近众数组的上限;而当众数所在组前后两组次数相等或当该数列次数呈对称分布时,众数所在组的组中值就是众数。

(三)众数、中位数和算术平均数比较 1.众数、中位数和算术平均数的关系

大部分数据都属于单峰分布,其众数、中位数和算术平均数之间具有以下关系:如果数据的分布是对称的,则x?Me?Mo;如果数据是左偏分布,说明数据中偏小的数较多,这就必然拉动算术平均数向小的一方靠,而众数和中位数由于是位置代表值,不受极值的影响,因此三者之间的关系表现为x?Me?Mo,又叫负偏;如果数据是右偏分布,说明数据中偏大的数较多,必然拉动算术平均数向大的一方靠,则x?Me?Mo,又叫正偏。

2.众数、中位数和算术平均数的特点与应用场合

(1)众数是一组数据分布的峰值,是位置代表值。其优点是易于理解,不受极端值的影响。当数据的分布具有明显的集中趋势时,尤其是对于偏态分布,众数的代表性比算术平均数要好。其特点是具有不唯一性,对于一组数据可能有一个众数,也可能有两个或多个众数,也可能没有众数。

(2)中位数是一组数据中间位置上的代表值,也都是位置代表值,其特点是不受极端值的影响。对于具有偏态分布的数据,中位数代表性要比算术平均数好。

(3)算术平均数由全部数据的计算所得,它具有优良的数学性质,是实际中应用最广泛的集中趋势测度值。其主要缺点是易受数据极端值的影响,对于偏态分布的数据,算术平均数的代表性较差。作为算术平均数变形的调和平均数和几何平均数是适用于特殊数据的代表值,调和平均数主要用于不能直接计算算术平均数的数据,几何平均数则主要用于计算比例数据的平均数,这两个测度值与算术平均数一样,易受极端值的影响。

§2离散程度的描述

集中趋势是一个说明同质总体各个体变量值的代表值,其代表性如何,决定于被平均变

量值之间的变异程度。在统计中,把反映现象总体中各个体的变量值之间差异程度的指标称为离散程度。反映离散程度的指标有绝对数的和相对数两类。

一、离散程度的绝对指标

(一)极差与四分位差

1.极差(Range)也叫全距,是一组数据的最大值与最小值之离差,即:

R?xmax?xmin (4.15)

式中:R为极差;xmax,

xmin分别为一组数据的最大值和最小值。

对于组距分组数据,极差也可近似表示为:

R≈最高组的上限值—最低度组的下限值 (4.16) 根据表4.4,极差为:R=21-17=4(岁);根据表4.5极差为:R≈90-40=50(个)。

极差是描述数据离散程度的最简单测度值,它计算简单,易于理解。但它只是说明两个极端变量值的差异范围,因而它不能反映各单位变量值变异程度,易受极端数值的影响。

2.四分位差(Interquartile range)是指第三四分位数与第一四分位数之差,也称为内距或四分间距,用表示。四分位差的计算公式为:

四分位差反映了中间50%数据的离散程度。其数值越小,说明中间的数据越集中;数值越大,说明中间的数据越分散。四分位差不受极值影响,因此,在某种程度上弥补了极差的一个缺陷。

(二)平均差

平均差(Mean deviation)也称平均离差,是各变量值与其平均数离差绝对值的平均数,通常用表示。由于各变量值与其平均数离差之和等于零,所以,在计算平均差时,是取绝对值形式的。平均差的计算根据掌握数据资料不同而采用两种不同形式。

1.简单式

对未经分组的数据资料,采用简单式,公式如下:

MDx?x? (4.17) ?n【例4.11】计算5、11、7、8、9的平均差。

【解】先计算其算术平均数,为8,则代入公式(4.17)得:

2.加权式

根据分组整理的数据计算平均差,应采用加权式,公式如下:

MDx?xf???f (4.18)

【例4.12】现利用表4.1的资料,计算平均差。

表4.6 平均差计算示例表 按零件数分组(个) 40~50 50~60 60~70 职工人数(人) f 20 40 80 组中值 x 45 55 65 x?x -19.5 -9.5 0.5 x?xf 390 380 40 70~80 80~90 合 计 50 10 200 75 85 — 10.5 20.5 — 525 205 1540 【解】将表4.6的资料代入公式(4.18)中计算得:

MDx?xf???f?1540?7.7(个) 200在可比的情况下,一般平均差的数值越大,则其平均数的代表性越小,说明该组变量值分布越分散;反之,平均差的数值越小,则其平均数的代表性越大,说明该组变量值分布越集中。

平均差由于采用绝对值的离差形式加以数学假定,在应用上有较大的局限性。

(三)标准差与方差

标准差(Standard deviation)又称均方差,它是各单位变量值与其平均数离差平方的平均数的方根,通常用表示。它是测度数据离散程度的最主要方法。标准差是具有量纲的,它与变量值的计量单位相同。

标准差的本质是求各变量值与其平均数的距离和,即先求出各变量值与其平均数离差的平方,再求其平均数,最后对其开方。之所以称其为标准差,是因为在正态分布条件下,它和平均数有明确的数量关系,是真正度量离中趋势的标准。

根据掌握的数据资料不同,有简单式和加权式两种。 1.简单式

对未经分组的数据资料,采用简单式,公式如下:

???(x?x)n2 (4.19)

【例4.13】计算5、11、7、8、9的标准差。

【解】先计算其算术平均数,为8,则代入公式(4.19)得:

???(x?x)n2?2

2.加权式

根据分组整理的数据计算标准差,应采用加权式,公式如下:

???(x?x)?f2f (4.20)

【例4.14】现利用表4.1的资料,计算标准差。

表4.7 标准差计算示例表 按零件数分组(个) 40~50 50~60 60~70 职工人数(人)f 20 40 80 组中值x 45 55 65 x?x -19.5 -9.5 0.5 (x?x)2 380.25 90.25 0.25 (x?x)2f 7605 3610 20 70~80 80~90 合 计 50 10 200 75 85 — 10.5 20.5 — 110.25 420.25 — 5512.5 4202.5 20950 【解】将表4.7的资料代入公式(4.20)中计算得:

??20950?10.73

5200标准差是根据全部数据计算的,它反映了每个数据与其平均数相比平均相差的数值,因此,它能准确地反映出数据的离散程度。与平均差相比,标准差在数学处理上是通过平方消去离差的正负号,更便于数学上的处理。因此,标准差是实际中应用最广泛的离散程度测度值。

二、离散程度的相对指标

前面介绍的极差、平均差和标准差都是反映数据分散程度的绝对值,其数据的大小一方面取决于原变量值本身水平高低的影响,也就是与变量的平均数大小有关,变量值绝对水平高的,离散程度的测度值自然也就大,绝对水平低的,离散程度的测度值自然也就小;另一方面,它们与原变量值的计量单位相同,采用不同计量单位计量的变量值,其离散程度的测度值也就不同。

因此,对于平均数不等或计量单位不同的不同组别的变量值,是不能直接用离散程度的绝对指标比较其离散程度的。为了消除变量平均数不等和计量单位不同对离散程度测度值的影响,需要计算离散程度的相对指标,即离散系数,其一般公式是:

离散系数?离散程度的绝对指标/对应的平均指标

离散程度(Coefficient of variation)通常是就标准差来计算的,因此,也称为标准差系

数,它是一组数据的标准差与其对应的平均数之比,是测度数据离散程度的相对指标,其计算公式如下:

(4.21)

【例4.15】某地两个不同类型的企业全年平均月产量资料如表4.8,计算标准差系数。

表4.8 离散系数比较分析表

离散系数(%) 企 业 计量单位 吨 锭 炼钢厂 纺纱厂 【解】炼钢厂的标准差比纺纱厂大,但我们却不能直接断定炼钢厂的平均月产量的代表性就比纺纱厂的小。因为,首先这两个厂的平均月产量相差悬殊,其次两个厂属于性质不同(计量单位不同)的两个企业。因此只能根据离散系数的大小来判断。表4.8中最后一栏的两个企业的离散系数表明,炼钢厂的平均月产量的代表性就比纺纱厂的大,生产比较稳定。其结果与用标准差判断的结果正好相反。

V??x500 200 10 5 2.0 2.5 月平均产量x 标准差? V????100% ?

搜索更多关于: 数据的描述性分析 的文档
数据的描述性分析.doc 将本文的Word文档下载到电脑,方便复制、编辑、收藏和打印
本文链接:https://www.diyifanwen.net/c0es137lz4y3h0qq03o8z_3.html(转载请注明文章来源)
热门推荐
Copyright © 2012-2023 第一范文网 版权所有 免责声明 | 联系我们
声明 :本网站尊重并保护知识产权,根据《信息网络传播权保护条例》,如果我们转载的作品侵犯了您的权利,请在一个月内通知我们,我们会及时删除。
客服QQ:xxxxxx 邮箱:xxxxxx@qq.com
渝ICP备2023013149号
Top