(2019·西南名校联盟联考)某种产品的质量按照其质量指标值M进行等级划分,具体如下表:
质量指标值M 等级
现从某企业生产的这种产品中随机抽取了100件作为样本,对其质量指标值M进行统计分析,得到如图所示的频率分布直方图.
M<80 三等品 80≤M<110 二等品 M≥110 一等品
(1)记A表示事件“一件这种产品为二等品或一等品”,试估计事件A的概率; (2)已知该企业的这种产品每件一等品、二等品、三等品的利润分别为10元、6元、2元,试估计该企业销售10000件该产品的利润;
(3)根据该产品质量指标值M的频率分布直方图,求质量指标值M的中位数的估计值(精确到0.01).
解 (1)记B表示事件“一件这种产品为二等品”,C表示事件“一件这种产品为一等品”,则事件B,C互斥,
且由频率分布直方图估计P(B)=0.2+0.3+0.15=0.65,P(C)=0.1+0.09=0.19,又
P(A)=P(B+C)=P(B)+P(C)=0.84,
所以事件A的概率估计为0.84.
(2)由(1)知,任取一件产品是一等品、二等品的概率估计值分别为0.19,0.65,故任取一件产品是三等品的概率估计值为0.16,
从而10000件产品估计有一等品、二等品、三等品分别为1900,6500,1600件,故利润估计为1900×10+6500×6+1600×2=61200元.
(3)因为在产品质量指标值M的频率分布直方图中, 质量指标值M<90的频率为0.06+0.1+0.2=0.36<0.5,
- 5 -
质量指标值M<100的频率为0.06+0.1+0.2+0.3=0.66>0.5, 0.5-0.36
故质量指标值M的中位数估计值为90+≈94.67.
0.03热点3 线性回归分析与独立性检验
1.线性回归方程
^
^
^
^
方程y=b x+a称为线性回归方程,利用最小二乘法估计公式中的斜率和截距分别为b=--
∑xiyi-nxy-22
∑xi-nxi=1
nn^
^
i=1
----
,a=y-b x,其中(x,y)是样本点的中心,且回归直线恒过该点.
2.独立性检验
根据2×2列联表,计算随机变量K=
2
a+b+c+da+bc+dad-bc2222
(K也可以表示为χ),当K>3.841时,则有95%的
a+cb+d2
把握说两个事件有关;当K>6.635时,则有99%的把握说两个事件有关.具体参考数据如下表:
P(K20.50 ≥k0) 10.820.40 0.25 0.15 0.10 0.05 0.025 0.010 0.005 0.001 k0 0.455 0.708 1.323 2.072 2.706 3.841 5.024 6.635 7.879 8
1.某地随着经济的发展,居民收入逐年增长,下表是该地一建设银行连续五年的储蓄存款(年底余额),如下表1:
表1
年份x 储蓄存款y(千亿元)
为了研究计算的方便,工作人员将上表的数据进行了处理,t=x-2012,z=y-5得到下表2:
2013 5 2014 6 2015 7 2016 8 2017 10 - 6 -
表2
时间代号t 1 0 2 1 3 2 4 3 5 5 z (1)求z关于t的线性回归方程;
(2)通过(1)中的方程,求出y关于x的回归方程;
(3)用所求回归方程预测到2022年年底,该地储蓄存款额可达多少?
^
^
^
(附:对于线性回归方程y=b x+a, --
∑x^^iyi-nxyi=1--
其中b =n,a=y-b x)
- 2
∑xi-nx2i=1
^
n-2
解 (1)t=3,z=2.2,∑tizi=45,∑ti=55, i=1i=1
^
55
b=
^
45-5×3×2.2
=1.2,
55-5×9
^
-
a=z-b t=2.2-3×1.2=-1.4,
^
所以z=1.2t-1.4.
^
(2)将t=x-2012,z=y-5,代入z=1.2t-1.4,
^
得y-5=1.2(x-2012)-1.4,即y=1.2x-2410.8.
^
(3)因为y=1.2×2022-2410.8=15.6,
所以预测到2022年年底,该地储蓄存款额可达15.6千亿元.
2.(2019·全国卷Ⅰ)某商场为提高服务质量,随机调查了50名男顾客和50名女顾客,每位顾客对该商场的服务给出满意或不满意的评价,得到下面列联表:
男顾客 女顾客 满意 40 30 不满意 10 20 (1)分别估计男、女顾客对该商场服务满意的概率;
(2)能否有95%的把握认为男、女顾客对该商场服务的评价有差异? 附:K=2
a+bnad-bc2c+da+cb+d. - 7 -
40
解 (1)由调查数据,男顾客中对该商场服务满意的比率为=0.8,因此男顾客对该商
50场服务满意的概率的估计值为0.8.
30
女顾客中对该商场服务满意的比率为=0.6,因此女顾客对该商场服务满意的概率的估
50计值为0.6.
100×40×20-30×10
(2)K的观测值k=
50×50×70×30
2
2
≈4.762.
由于4.762>3.841,故有95%的把握认为男、女顾客对该商场服务的评价有差异.
1.线性回归模型是回归模型中的核心问题,判断两个变量是否线性相关及相关程度通常有两种方法:一是根据散点图直观判断;二是将相关数据代入相关系数公式求出r,然后根据
r的大小进行判断.
^
^
2.求线性回归直线的关键:一是根据公式准确计算出b,a的值;二是抓住样本点的中心--
(x,y)必在回归直线上.
3.求解独立性检验问题时要注意:一是2×2列联表中的数据与公式中各个字母的对应,不能混淆;二是注意计算得到K之后的结论,即K的观测值k越大,对应假设事件H0成立(两类变量相互独立)的概率越小,H0不成立的概率越大.
(2018·全国卷Ⅱ)下图是某地区2000年至2016年环境基础设施投资额y(单位:亿元)的折线图.为了预测该地区2018年的环境基础设施投资额,建立了y与时间变量t的两个线性回归模型.根据2000年至2016年的数据(时间变量t的值依次为1,2,…,17)建立模型①:
^
2
2
y=-30.4+13.5t;根据2010年至2016年的数据(时间变量t的值依次为1,2,…,7)建立
^
模型②:y=99+17.5t.
- 8 -
相关推荐: