第一范文网 - 专业文章范例文档资料分享平台

数据的描述性分析

来源:用户分享 时间:2025/5/25 14:18:25 本文由loading 分享 下载这篇文档手机版
说明:文章内容仅供预览,部分内容可能不全,需要完整文档或者需要复制内容,请下载word后使用。下载word有问题请添加微信号:xxxxxxx或QQ:xxxxxx 处理(尽可能给您提供完整文档),感谢您的支持与谅解。

设m为加权调和平均数的权数,加权调和平均数公式即为:

m?m2????mnxH?1?mnm1m2?????x1x2xn?mi?1nnimi?i?1xi

【例4.5】仍用前面对蔬菜计算平均价格为例,如果现在早、中、晚市所花钱数不再是

一元钱,而是如表4.2的情形,求购进的该种蔬菜的平均价格。

表4.2 调和平均数计算表

时间 早市 中市 晚市 合计 — 单价(元/斤)x 0.5 0.4 0.2 所花钱数(元)m 4 3 2 9 购买量(斤)m/x 8 7.5 10 25.5 【解】 平均价格xH??m?xi?1i?1nnimii?9?0.35元 25.5 3.调和平均数是算术平均数的变形,推导如下:

xH??m?xi?1i?1nnimii??xf?i?1i?1nniixifixi??xfi?1nnii?x

?fi?1i

调和平均数与算术平均数在本质上是一致的,不同的原始资料形式在计算平均数时,可以选择不同的公式。

(三)几何平均数

几何平均数(Geometric mean)是n个变量值连乘积的n次方根。几何平均数是计算平均比率和平均速度最适用的一种方法。通常用表示。根据掌握的数据资料不同,几何平均数可分为简单几何平均数和加权几何平均数两种。

1.简单几何平均数

根据未经分组资料计算平均数。几何平均数的计算公式如下:

xG?nx1x2?xn?n?xi?1ni (4.9)

【例4.6】某产品生产需要经过六道工序,每道工序的合格率分别为98%、91%、93%、98%、98%、91%,求这六道工序的平均合格率。

【解】因为成品的合格率等于各道工序产品合格率的连乘积,所以要用几何平均数来计算这六道工序的平均合格率。

xG?698%?91%?93%?98%?98%?91%?94.78%

2.加权几何平均数

当掌握的数据资料为分组资料,且各个变量值出现的次数不相同时,要用加权方法计算几何平均数。加权几何平均数的公式为:

xG?f1?f2??fnxx?xf1f212fnn??ffix?i (4.10) i?1n【例4.7】某市从1990年以来的14年,各年的工业增加值的增长率资料如表4.3,计算这

14年的平均增长率。

表4.3 几何平均数计算表

时 间 1990-1993年 1994-1998年 1999-2003年 合 计 年数 4 5 5 14 工业增加值的增长率 10.2 8.7 9.6 — 【解】首先根据公式(4.10)计算平均发展速度:

xG?f1?f2??fnx1f1x2f2?xnfn?4?5?5110.2%4?108.7%5?109.6%5?109.45%

再还原成平均增长率。平均增长率 =平均发展速度—100% = 109.45% -100% = 9.45%

二、位置平均数

(一)中位数与分位数

中位数(Median)是一组数据按大小顺序排列后,处于中间位置的那个变量值,通常用Me表示。其定义表明,中位数就是将某变量的全部数据均等地分为两半的那个变量值。其中,一半数值小于中位数,另一半数值大于中位数。中位数是一个位置代表值,因此它不受极端变量值的影响。

1.由未分组数据确定中位数

对未分组数据资料,需先将各变量值按大小顺序排列,并按公式

n?1确定中位数的位2置。

当一个序列中的项数为奇数时,则处于序列中间位置的变量值就是中位数。例如:根据7、6、8、2、3这五个数据求中位数,先按大小顺序排成2、3、6、7、8。在这个序列中,选取中间一个数值6,小于6的数值有两个,大于6的数值也有两个,所以6就是这五个数值中的中位数。

当一个序列的项数是偶数时,则应取中间两个数的中点值作为中位数,即取中间两个变量值的平均数为中位数。例如一个按大小顺序排列的序列2、5、7、8、11、12,其中位数的位置在7与8之间,中位数就是7与8的平均数,即:Me?7?8?7.5。 22.由单项数列确定中位数

根据单项数列资料确定中位数与根据未分组资料确定中位数方法基本一致。它是先计

f?算各组的累计次数(或频数),再按公式

2位数。

确定中位数的位置,并对照累计次数确定中

【例4.8】某班同学按年龄分组资料如表4.4所示,求中位数。

表4.4 单项数列求中位数计算表

年龄(岁) 17 18 19 20 21 合 计 学生人数 5 8 26 9 2 50 较小制累计次数 5 13 39 48 50 — 较大制累计次数 50 45 37 11 2 — 【解】 年龄中位数的位置为位数为第三组的变量值19岁。

3.由组距数列确定中位数

50?25,说明位于第25位同学,根据累计次数可确定中2f?根据组距数列资料确定中位数,应先按的公式

2用内插法按比例推算出中位数的近似值。公式如下:

求出中位数所在组的位置,然后运

?f下限公式 Me?L?2?sm?1fm?dm (4.11)

?f上限公式 Me?U?2?sm?1fm?dm (4.12)

式中:L—中位数所在组的下限;U—中位数所在组的上限;

sm?1—较小制累计至中位数所在组前一组止的次数; sm?1—较大制累计至中位数所在组后一组止的次数; fm—中位数所在组的次数;dm—中位数所在组的组距。

上限公式和下限公式都是以中位数所在组内的次数均匀分布为前提的,在这种情况下

才可以按比例推算中位数的近似值。

【例4.9】现利用表4.1的资料,计算中位数。

表4.5 中位数计算示例表

按零件数分组(个) 40~50 50~60 60~70 70~80 80~90 职工人数(人) 20 40 80 50 10 向上累计 20 60 140 190 200 向下累计 200 180 140 60 10 合 计 200 — — 【解】将表4.5的资料代入计算中位数的上限公式和下限公式,所得结果一致,又是个异曲同工 。

按下限公式(4.11)计算:

200?602Me?60??10?65(个) 80按上限公式(4.12)计算:

200?60Me?70?2?10?65(个)

80从上面分析可知,中位数实际上就是位于累计次数达到的这一组组距中的某个数值。该数值就是这一组下限加上按一定几何比例分割组距所得的一段组距,或这一组上限减去按一定几何比例分割组距所得的一段组距。

4.分位数

中位数是将统计分布从中间分成相等的两部分,与中位数性质相似的还有四分位数、十分位数和百分位数。

三个数值可以将变量数列划分为项数相等的四部分,这三个数值就定义为四分位数(Quartiles),分别称为第一四分位数、第二四分位数和第三四分位数,记作Q1,Q2和Q3、。对于不分组数据而言,三个四分位数的位置分别是:在

n?12(n?1)n?1?;在;在

4423(n?1),可见Q2就是中位数。 4同理,十分位数(Dectile)和百分位数(Percentile)分别是将变量数列十等分和一百等分的数值。

(二)众数

众数(Mode)是一组数据中出现次数最多的那个变量值,通常用Mo表示。众数具有普遍性,在统计实践中,常利用众数来近似反映社会经济现象的一般水平。例如,说明某次考试学生成绩最集中的水平;说明城镇居民最普遍的生活水平等等。

众数的确定要根据掌握的资料而定。未分组资料或单项数列资料众数的确定比较容易,不需要计算,可直接观察确定。即在一组数列或单项数列中,次数出现最多的那个变量值就是众数。如表4.4中,19岁出现的人数最多,为26人,所以19岁就是众数。

根据组距数列确定众数比较复杂。首先要确定众数所在的组,若为等距数列,次数最多的那个组就是众数所在组;若为异距数列,需将其换算为次数密度(或标准组距次数),换算后次数密度最多的一组即为众数所在组。然后按公式近似求出众数。公式如下:

下限公式:Mo?L?fm?fm?1?dm

(fm?fm?1)?(fm?fm?1)(4.13)

上限公式: Mo?U?fm?fm?1?dm (4.14)

(fm?fm?1)?(fm?fm?1)

搜索更多关于: 数据的描述性分析 的文档
数据的描述性分析.doc 将本文的Word文档下载到电脑,方便复制、编辑、收藏和打印
本文链接:https://www.diyifanwen.net/c0es137lz4y3h0qq03o8z_2.html(转载请注明文章来源)
热门推荐
Copyright © 2012-2023 第一范文网 版权所有 免责声明 | 联系我们
声明 :本网站尊重并保护知识产权,根据《信息网络传播权保护条例》,如果我们转载的作品侵犯了您的权利,请在一个月内通知我们,我们会及时删除。
客服QQ:xxxxxx 邮箱:xxxxxx@qq.com
渝ICP备2023013149号
Top