第一范文网 - 专业文章范例文档资料分享平台

富士康统计培训 (2)

来源:用户分享 时间:2020-06-20 本文由CuteMm 分享 下载这篇文档 手机版
说明:文章内容仅供预览,部分内容可能不全,需要完整文档或者需要复制内容,请下载word后使用。下载word有问题请添加微信号:xxxxxx或QQ:xxxxxx 处理(尽可能给您提供完整文档),感谢您的支持与谅解。

有人选择NBA球员的薪俸作为中位数优点的又一个案例。它说:很高薪水的几位球员(如乔丹),对于平均值的影响将多于对中位数的影响,中位数将会更准确地描述专业球员薪水的典型状况,而均值则可能超过样本中的大多数观测值;使得集中趋势的测度引起误导。

联系到我们的收入分配状况,连总书记也承认,收入差距过大,基尼系数早已越过国际的警戒线,财富过度地向极少数人集中。因此,测定我们的富裕程度,请抛弃“人均”之说,而选用中位数吧!

(3)众数

数据集中出现最频繁的观测值。 评:可能没有、不止一个众数

例:对某种烧烤酱油由10个品尝师打分,得分是: 8,7,9,6,8,10,9,9,5,7 请找众数

用处:零售商对潜在客户的颈围和袖长尺寸的众数感兴趣,劳工部对劳动者收入类别的众数感兴趣。

(4)三指的比较及偏态、对称 二、数据离散趋势测度 (1)极差

(2)方差、标准差(注意n与n?1之别) (3)标准差的小应用——切比雪夫定理 三、切比雪夫法则——标准差的一个应用

这个法则有点神奇,其证明略去,现叙述其结果,这个结果可用于任何分布的数据上。

(1)至少有3/4的观测数据落在均值的2倍标准差之内; (2)至少8/9的观测数据落在均值的3倍标准差之内。 如果数据的分布呈钟型或略微偏态,则有下列经验法则。 (3)68%的观测值落在均值的1倍标准差之内。 (4)95%的观测值落在均值的2倍标准差之内。 (5)99.7%的观测值落在均值的3倍标准差之内。

6

这些小结论方便于我们提高统计上的认识。 附直方图的做法。

假设通过抽样,获得了100位居民某年的月均用水量

100位居民的月均用水量(单位:t)

3.1 3.4 3.2 3.3 3.2 3.0 2.5 2.6 2.5 2.8 2.5 2.6 2.7 2.8 2.9 2.9 2.8 2.7 2.6 2.5 2.0 2.2 2.3 2.3 2.4 2.4 2.3 2.4 2.3 2.2 2.2 2.2 2.1 2.2 2.3 2.4 2.3 2.1 2.1 2.0 1.5 1.5 1.6 1.7 1.8 1.9 1.8 1.7 1.6 1.5 1.0 1.2 1.2 1.3 1.4 1.3 1.3 1.4 1.0 1.0 1.6 0.2 3.7 3.6 3.5 1.4 1.3 1.2 1.0 1.2 1.8 0.4 1.5 1.7 1.9 1.8 1.6 1.5 1.7 1.8 1.9 0.3 0.5 0.6 0.8 0.7 0.9 0.5 0.8 0.6 1.6 0.4 3.8 4.1 4.3 2.0 2.3 2.4 2.4 2.2 直方图的做法是:

第一步:求极差(一组数据中最大值与最小值之差) 本题为4.3-0.2=4.1(t)

说明样本数据的最大变范围是4.1(t) 第二步:决定组距与组数

组距的确定没有固定的标准,大体上讲,组距越大,组数越少,规律也没有办法显示出来。反之,组距越小,组数越多,也显示不出其规律,大致的规律如下:

样本容量 50以下 50—100 100—250 250以上 分组个数 5—6 6—10 7—12 10—20 组距一般尽可能“取整”,方便计算组数,本例中取组距为0.5(t),那么

组数?级差4.1??8.2 组距0.57

本题取组数9 第三步 将数据分组

以0.5为组距,分原始数据为9组

?0,0.5?,?0.5,1?,??,?4,4.5?

第四步 列频率分布表

100位居民月均用水量的频率分布表

分组 ?0,0.5? ?0.5,1? ?1,1.5? ?1.5,2? ?2,2.5? ?2.5,3? ?3,3.5? ?3.5,4? ?4,4.5? 合计 第五步 画频率直方图

0.500.400.300.200.10频率 频数累计 正 正正 正正正 正正正正正 正正正正正 正正正 正正 正 正 频数 4 8 15 22 25 14 6 4 2 100 频率 0.04 0.08 0.15 0.22 0.25 0.14 0.06 0.04 0.02 1.00 组距 00.511.522.533.544.5月均用水量/ t

直方图的阅读,要注意以下几点

(1)它的纵坐标是频率/组距,每一个小矩形的面积,恰是样本数据落在对应横坐标区间内的频率。

(2)既然方形面积对应该为频率,因此所有方形面积为1,也就情理之中了。

8

(3)直方图很容易使我们获得“累计”的概念,如月均用水量在3 t以上的居民,大概占12%。前段时间,国家发改委公布的电价改革方案,使用的是同样的手段。

(4)如果取各矩形条顶边的中点,并将它们光滑的连接起来,便是统计上的折线图——密度函数。

四、标准差的又一应用——统计推断

下面的例子值得认真揣摩,它是以后假设检验的推断基础。 问题:

一个汽车电池制造商声称它的A级电池的平均寿命是60个月。假设寿命长度的标准差是知道的,为10个月,并且已知寿命长度数据的频数公布是钟型。

a. 假定该制造商的说法是真实的,那么它的A级电池寿命能维持超过50个月的百分比大约是多少?

b. 假定该制造商的说法是真实的,那么它的A级电池的寿命少于40个月的百分比大约是多少?

c. 假如你的电池能持续37个月。你能从制造商的说法中推断出什么? 解答:

本解答只提供了答案,没有提供答案的形成过程,你要想办法补上。

a. 电池寿命大于50个月的百分比大约是34%(50—60个月)再加上50%(超过60个月)。因此,大约有84%的电池使用寿命超过50个月。

b. 容易找出电池寿命少于40个月的比例。如果制造商的说法是真实的,那么大约2.5%的电池其使用寿命不到40个月。

c. 如果很不幸,你的电池使用寿命不到37个月,你能得到这样两个推论中的一个:要么你的电池属于使用寿命不到40个月的2.5%中的一个,要么制造商所声称的是不真实的。因为电池使用寿命不到40个月的机率是如此之小,所以你有足够的理由去怀疑制造商的声明。一个小于60个月的均值或者一个比10个月更大的标准差都会增加电池使用寿命不到40个月的可能性。

9

第三部分 正态分布

正态分布这个词如果您没有听到的话,但它的体现形式您一定碰到过,如:让一部分人选富起来,最终走共同富裕之路,某个老师的题目出得好,特高分不多,特低分也不多,比较均衡等。这些语言都是对正态分布的表述。

一、正态分布是一种什么样的分布类型?

说的通俗点,如果变量的取值呈现一种极端值偏少,中间值居多的形状,就可以大致认为该变量大致呈正态分布。

生活中有大量的现象,其分布呈正态分布形态,如一只特定股票的月回报率,一个公司的周销售量的分布等,实际上,概率论上有个中心极限定理,它从原理上证明了,只要样本容量充分大(n?30),样本均值就服从正态分布,今后,干脆将数据比较多的样本均值近似地认为服从正态分布,这也是为什么统计上的一些好结果都以正态分布为背景而获得。

附带说下,正态分布为高斯发现,应该说,这是一个伟大的发现,它概括了大量随机变量的分布规律。

下面的简图可对正态分布进行描述。

二、正态分布的概率分布

(x??)22?2x??f(x)?1?2?e?

??EX??DX

f(x)的用处是使我们能求出任意区间内的随机变量的概率:

p(a?x?b)??f(x)dx

ab 10

搜索“diyifanwen.net”或“第一范文网”即可找到本站免费阅读全部范文。收藏本站方便下次阅读,第一范文网,提供最新医药卫生富士康统计培训 (2)全文阅读和word下载服务。

富士康统计培训 (2).doc 将本文的Word文档下载到电脑,方便复制、编辑、收藏和打印
本文链接:https://www.diyifanwen.net/wenku/1088727.html(转载请注明文章来源)
热门推荐
Copyright © 2018-2022 第一范文网 版权所有 免责声明 | 联系我们
声明 :本网站尊重并保护知识产权,根据《信息网络传播权保护条例》,如果我们转载的作品侵犯了您的权利,请在一个月内通知我们,我们会及时删除。
客服QQ:xxxxxx 邮箱:xxxxxx@qq.com
渝ICP备2023013149号
Top