a' D.3.(2020重庆,17,13分)从某居民区随机抽取10个家庭,获得第i个家庭的月收入xi(单位:千元)与月储蓄yi(单位:千元)的数据资料,算得xi=80,yi=20,xiyi=184,=720.
(1)求家庭的月储蓄y对月收入x的线性回归方程y=bx+a; (2)判断变量x与y之间是正相关还是负相关;
(3)若该居民区某家庭月收入为7千元,预测该家庭的月储蓄.
1 0
2 2
3 1
4 3
5 3
6 4
附:线性回归方程y=bx+a中,
其中,为样本平均值.线性回归方程也可写为=x+. 解析 (1)由题意知n=10,=xi==8,=yi==2, 又lxx=-n=720-10×82=80, lxy=xiyi-n =184-10×8×2=24, 由此得b===0.3,a=-b=2-0.3×8=-0.4, 故所求回归方程为y=0.3x-0.4.
(2)由于变量y的值随x的值增加而增加(b=0.3>0),故x与y之间是正相关. (3)将x=7代入回归方程可以预测该家庭的月储蓄为 y=0.3×7-0.4=1.7(千元). 考点二 独立性检验
4.(2020福建,19,12分)某工厂有25周岁以上(含25周岁)工人300名,25周岁以下工人200名.为研究工人的日平均生产量是否与年龄有关,现采用分层抽样的方法,从中抽取了100名工人,先统计了他们某月的日平均生产件数,然后按工人年龄在“25周岁以上(含25周岁)”和“25周岁以下”分为两组,再将两组工人的日平均生产件数分成5组:[50,60),[60,70),[70,80),[80,90),[90,100]分别加以统计,得到如图所示的频率分布直方图.
(1)从样本中日平均生产件数不足60件的工人中随机抽取2人,求至少抽到一名“25周岁以下组”工人的概率;
(2)规定日平均生产件数不少于80件者为“生产能手”,请你根据已知条件完成2×2列联表,并判断是否有90%的把握认为“生产能手与工人所在的年龄组有关”? 附:χ2=
P(χ2≥k) k
解析 (1)由已知得,样本中有25周岁以上组工人60名,25周岁以下组工人40名. 所以,样本中日平均生产件数不足60件的工人中,25周岁以上组工人有60×0.05=3(人),记为A1,A2,A3;25周岁以下组工人有40×0.05=2(人),记为B1,B2. 从中随机抽取2名工人,所有的可能结果共有10种,它们是(A1,A2),(A1,A3),(A2,A3),(A1,B1),(A1,B2),(A2,B1),(A2,B2),(A3,B1),(A3,B2),(B1,B2). 其中,至少有1名“25周岁以下组”工人的可能结果共有7种,它们是(A1,B1),(A1,B2),(A2,B1),(A2,B2),(A3,B1),(A3,B2),(B1,B2).故所求的概率P=. (2)由频率分布直方图可知,在抽取的100名工人中,“25周岁以上组”中的生产能手有60×0.25=15(人),“25周岁以下组”中的生产能手有40×0.375=15(人),据此可得2×2列联表如下:
25周岁以上组
生产能手 15
非生产能手 45
合计 60
0.100 2.706
0.050 3.841
0.010 6.635
0.001 10.828
25周岁以下组 合计
所以得K2= ==≈1.79. 因为1.79<2.706,
15 30
25 70
40 100
所以没有90%的把握认为“生产能手与工人所在的年龄组有关”.