第一范文网 - 专业文章范例文档资料分享平台

统计有关知识点总结、经典例题解析

来源:用户分享 时间:2025/8/10 8:22:44 本文由loading 分享 下载这篇文档手机版
说明:文章内容仅供预览,部分内容可能不全,需要完整文档或者需要复制内容,请下载word后使用。下载word有问题请添加微信号:xxxxxxx或QQ:xxxxxx 处理(尽可能给您提供完整文档),感谢您的支持与谅解。

统计

【考纲说明】

1、了解条件概率和两个事件相互独立的概念,理解n次独立重复试验的模型及二项分布,能够利用实际问题的直方图了解正态分布曲线的特点及曲线所表示的意义。

2、理解随机抽样的必要性和重要性,了解分布、样本数据标准差的意义和作用,理解用样本估计总体的思想。 3、会画频率分布直方图、频率折线图、茎叶图,会用随机抽样的基本方法和样本估计总体的思想解决一些简单的实际问题

【知识梳理】

一、二项分布及正态分布 1、条件概率及其性质

(1)一般地,若有两个事件A和B,在已知事件B发生的条件下考虑事件A发生的概率,则称此事件为B已发生的条件下A的条件概率,记作:P(B|A)?P(AB).其中0?P(A|B)?1,如果B和C是两个互斥事件,则P(A)P(B?C|A)?P(B|A)?P(C|A).

(2)相互独立事件:对于事件A、B,若A的发生与B的发生互不影响,则称A、B是相互独立事件.P(B|A)?P(B),P(AB)?P(B|A)?P(A)?P(A)?P(B);若P(AB)?P(A)?P(B),则A与B相互独立. 2、二项分布:如果在一次试验中某事件发生的概率是P,那么在n次独立重复试验中这个事件恰好发生k次的概率是:

(其中k?0,1,?,n,q?1?p)于是得到随机变量ξ的概率分布如下:我们称这样的随机变量X服从二

kn?k项分布,记作X~B(n·p),其中n,p为参数,并记Ck?b(k;n?p). npq3、正态分布

x-μ21(1)正态曲线:函数φμ,σ(x)=e-2,x∈(-∞,+∞),其中实数μ和σ(σ>0)为参数,我们称φμ,σ(x)的图象

2σ2πσ

(如图)为正态分布密度曲线,简称正态曲线.正态曲线有以下性质: (a)曲线位于x轴上方,与x轴不相交; (b)曲线是单峰的,它关于直线x=μ对称;

1

(c)曲线在x=μ处达到峰值;

σ2π

(s)曲线与x轴围成的图形的面积为1;

(e)当σ一定时,曲线随着μ的变化而沿x轴平移;

(f)当μ一定时,曲线的形状由σ确定,σ越小,曲线越“瘦高”,表示总体的分布越集中;σ越大,曲线越“矮胖”,表示总体的分布越分散. (2)正态分布

如果对于任何实数a,b(a

1

b

X?N(?,?2).正态分布有三个常用数据:

P(????X????)?0.6826;P(??2??X???2?)?0.9544;P(??3??X???3?)?0.9974.

二、抽样方法与总体分布的估计 1、随机抽样

(1)总体:在统计学中 , 把研究对象的全体叫做总体,把每个研究对象叫做个体,把总体中个体的总数叫做总体容量.总体与个体之间的关系类似于集合与元素的关系.

(2)样本:从总体中随机抽取一部分个体叫做总体的一个样本,样本中个体的数目称为样本的容量,样本和总体之间的关系类似于子集和集合之间的关系.

(3)简单随机抽样:一般地,从元素个数为N的总体中不放回地抽取容量为的样本,如果每一次抽取时总体中的各个个体被抽到的可能性是相同的,那么这种抽样方法叫简单随机抽样,这样抽取的样本,叫做简单随机样本. 常用的方法有抽签法和随机数表法.

(4)系统抽样:当总体中的个体比较多时,将总体分成均衡的若干部分,然后按照预先制定的规则,从每一部分中抽取一个个体,得到所需要的样本,这样的抽样方法称为系统抽样,也称作等距抽样.

(5)分层抽样:当总体由有明显差别的几部分组成时,为了使抽取的样本更好地反映总体的情况,可将总体中各个个体按某种特征分成若干个互不重叠的几部分,每一部分叫做层,在各层中按层在总体中所占比例进行简单随机抽样或系统抽样,这种抽样方法叫做分层抽样. 2、频率分布直方图与茎叶图

(1)频率分布:样本中所有数据(或数据组)的频数和样本容量的比就是该数据的频率,所有数据(或数据组)的频率的分布变化规律叫做频率分布,可以用频率分布表、频率分布折线图、茎叶图、频率分布直方图来表示. (2)频率折线图:如果将频率分布直方图中各相邻的矩形的上底边的中点顺次连接起,就得到一条折线,称这条折线为本组数据的频率折线图。

(3)总体密度曲线:随着样本容量的增加,作图时所分的组数增加,组距减小,相应的频率折线图会越来越接近于一条光华曲线,即总体密度曲线。

(4)制作茎叶图的方法是:将所有两位数的十位数字作为“茎”,个位数字作为“叶”,茎相同者共用一个茎,茎按从小到大的顺序从上向下列出,共茎的叶一般按从大到小(或从小到大)的顺序同行列出.

茎叶图对于分布在0~99的容量较小的数据比较合适,此时,茎叶图比直方图更详尽地表示原始数据的信息. 在茎叶图中,茎也可以放两位,后面位数多可以四舍五入后再制图. 3、样本的数字特征

(1)众数:出现次数最多的数叫做众数.

(2)中位数:如果将一组数据按大小顺序依次排列,把处在最中间位置的一个数据或中间两个数据的平均是叫做这组数据的中位数. (3)平均数与加权平均数:如果有n个数x1,x2,x3??,xn,那么x?x1?x2?????xn叫做这n个数的平均数.

n如果在n个数中,x1出现次f1次, x2出现次f2次,……,xk出现次f2次,(这里f1?f2????fk?n),那么

x?1(x1f1?x2f2?????xkfk)叫做这n个数的加权平均数,其中f1,f2,??fk叫做权. n(4)标准差与方差:设一组数据x,x,x?,x,的平均数为x,则

123ns?s?2(x1?x)2?(x2?x)2???(xn?x)2,其中s2表示方差,s表示标准差.

n 2

【经典例题】

【例1】(2008广东).为了调查某厂工人生产某种产品的能力,随机抽 查了20位工人某天生产该产品的数量.产品数量的分组区间为

?45,55?,?55,65?,?65,75?,?75,85?,?85,95?由此得到频率分布直

方图如图3,则这20名工人中一天生产该产品数量在?55,75?的 人数是 . 【答案】13

【解析】20?(0.065?10)?13,故答案为13.

【例2】(2009山东)某工厂对一批产品进行了抽样检测.右图是根据抽样检测后的 产品净重(单位:克)数据绘制的频率分布直方图,其中产品

频率/组距 净重的范围是[96,106],样本数据分组为[96,98),[98,100),

0.150 [100,102),[102,104),[104,106],已知样本中产品净重小于

0.125 100克的个数是36,则样本中净重大于或等于98克并且

0.100 小于104克的产品的个数是( ).

0.075 A. 90 B.75 C. 60 D.45

0.050 【答案】A

【解析】产品净重小于100克的概率为(0.050+0.100)×2=0.300, 已知样本中产品净重小于100克的个数是36,设样本容量为n,

96 98 100 102 104 106 克

第8题图

36?0.300,所以n?120,净重大于或等于98克并且小于104克的产品的概率为(0.100+0.150+0.125)×2=0.75,则n所以样本中净重大于或等于98克并且小于104克的产品的个数是120×0.75=90.故选A.

【例3】(2009上海)在发生某公共卫生事件期间,有专业机构认为该事件在一段时间没有发生在规模群体感染的标志为“连续10天,每天新增疑似病例不超过7人”。根据过去10天甲、乙、丙、丁四地新增疑似病例数据,一定符合该标志的是( )

A. 甲地:总体均值为3,中位数为4 B. 乙地:总体均值为1,总体方差大于0 C. 丙地:中位数为2,众数为3 D. 丁地:总体均值为2,总体方差为3 【答案】D

【解析】根据信息可知,连续10天内,每天的新增疑似病例不能有超过7的数,选项A中,中位数为4,可能存在大于7的数;同理,在选项C中也有可能;选项B中的总体方差大于0,叙述不明确,如果数目太大,也有可能存在大于7的数;选项D中,根据方差公式,如果有大于7的数存在,那么方差不会为3,故答案选D.

【例4】(2009湖北)下图是样本容量为200的频率分布直方图。根据样本的频

3

率分布直方图估计,样本数据落在[6,10]内的频数为 ,数据落在(2,10)内的概率约为 。 【答案】64

【解析】观察直方图易得频数为200?0.08?4?64,频率为0.1?4?0.4

【例5】(2009福建)点A为周长等于3的圆周上的一个定点,若在该圆周上随机取一点B,则劣弧AB的长度小于1的概率为 。 【答案】

2 323

【解析】可设AB?1,则AB?1,根据几何概率可知其整体事件是其周长3,则其概率是

【例6】(2013江苏)抽样统计甲、乙两位射击运动员的5次训练成绩(单位:环),结果如下:

运动员 甲 乙 第1次 87 89 第2次 91 90 第3次 90 91 第4次 89 88 第5次 93 92 则成绩较为稳定(方差较小)的那位运动员成绩的方差为________. 【答案】2

111

【解析】由题知x甲=(87+91+90+89+93)=90,s2甲=(9+1+0+1+9)=4;x乙=(89+90+91+88+92)

5551

=90,s2乙=(1+0+1+4+4)=2,所以s2甲>s2乙,故答案为2.

5

【例7】(2011广东)在某次测验中,有6位同学的平均成绩为75分.用xn表示编号为n(n=1,2,…,6)的同学所得成绩,且前5位同学的成绩如下: 编号n 1 成绩xn 70 2 76 3 72 4 70 5 72 (1)求第6位同学的成绩x6,及这6位同学成绩的标准差s;

(2)从前5位同学中,随机地选2位同学,求恰有1位同学成绩在区间(68,75)中的概率. 【答案】7;0.4

【解析】(1)根据平均数的个数可得75=∴x6=90,

这六位同学的方差是(25+1+9+25+9+225)=49, ∴这六位同学的标准差是7

(2)由题意知本题是一个古典概型,

4

搜索更多关于: 统计有关知识点总结、经典例题解析 的文档
统计有关知识点总结、经典例题解析.doc 将本文的Word文档下载到电脑,方便复制、编辑、收藏和打印
本文链接:https://www.diyifanwen.net/c3lkeq3ojbj6b8ve014eo_1.html(转载请注明文章来源)
热门推荐
Copyright © 2012-2023 第一范文网 版权所有 免责声明 | 联系我们
声明 :本网站尊重并保护知识产权,根据《信息网络传播权保护条例》,如果我们转载的作品侵犯了您的权利,请在一个月内通知我们,我们会及时删除。
客服QQ:xxxxxx 邮箱:xxxxxx@qq.com
渝ICP备2023013149号
Top