[A 基础达标]
1.对两个变量y和x进行回归分析,得到一组样本数据:(x1,y1),(x2,y2),…,(xn,yn),则下列说法中不正确的是( )
^^^--A.由样本数据得到的回归方程y=bx+a必过样本点的中心(x,y) B.残差平方和越小的模型,拟合的效果越好
C.用相关指数R2来刻画回归效果,R2的值越小,说明模型的拟合效果越好
D.若变量y和x之间的相关系数r=-0.936 2,则变量y与x之间具有线性相关关系 解析:选C.R2的值越大,说明残差平方和越小,也就是说模型的拟合效果越好,故选C. 2.下列说法中正确的有:( ) ①若r>0,则x增大时,y也相应增大; ②若r<0,则x增大时,y也相应增大;
③若r=1或r=-1,则x与y的关系完全对应(有函数关系),在散点图上各个散点均在一条直线上. A.①② C.①③
B.②③ D.①②③
解析:选C.若r>0,表示两个相关变量正相关,x增大时,y也相应增大,故①正确,r<0,表示两个变量负相关,x增大时,y相应减小,故②错误.|r|越接近1,表示两个变量相关性越高,|r|=1表示两个变量有确定的关系(即函数关系),故③正确.
―2
3.若两个变量的残差平方和是325,? (yi-y)=923,则随机误差对预报变量的贡献率约
i=1n
为( ) A.64.8% C.35.2%
B.60% D.40%
325
解析:选C.由题意可知随机误差对预报变量的贡献率约为≈0.352.
9234.有下列数据
x y 1 3 2 5.99 3 12.01 下列四个函数中,模拟效果最好的为( ) A.y=3×2x1
-
B.y=log2x D.y=x2
C.y=3x
解析:选A.分别把x=1,2,3,代入求值,求最接近y的值,即为模拟效果最好,故选A. 5.通过随机询问100名性别不同的小学生是否爱吃零食,得到如下的列联表:
爱吃 不爱吃 合计
P(K2≥k) k 2
男 10 20 30 女 40 30 70 合计 50 50 100 0.10 2.706 0.05 3.841 0.025 5.024 2
n(ad-bc)22100(10×30-20×40)由K=,计算得K=≈4.762.
(a+b)(c+d)(a+c)(b+d)50×50×30×70
参照附表,得到的正确结论为( )
A.在犯错误的概率不超过5%的前提下,认为“是否爱吃零食与性别有关” B.在犯错误的概率不超过5%的前提下,认为“是否爱吃零食与性别无关” C.有97.5%以上的把握认为“是否爱吃零食与性别有关” D.有97.5%以上的把握认为“是否爱吃零食与性别无关”
解析:选A.因为K2≈4.762>3.841,P(K2>3.841)=0.05.所以在犯错误的概率不超过5%的前提下,认为“是否爱吃零食与性别有关”,故选A.
6.某种活性细胞的存活率y(%)与存放温度x(℃)之间有如下几组样本数据:
存放温度x(℃) 存活率y(%) 10 20 4 44 -2 56 -8 80 经测算,上述样本数据具有线性相关关系,且回归直线的斜率为-3.2.则当存放温度为6 ℃时,该种细胞的存活率的预报值为________%.
^^――^――^
解析:设回归直线方程为y=-3.2x+a,因为x=1,y=50,则a=y+3.2x=53.2.当x=6时,y=-3.2×6+53.2=34. 答案:34
7.已知具有相关关系的两个随机变量的一组观测数据的散点图分布在函数y=3e2x附近,则可通过转换得到的线性回归方程为________. 解析:由y=3e2x1,
+
+1
的图象
得ln y=ln(3e2x1),
+
即ln y=ln 3+2x+1,
令u=ln y,v=x,则线性回归方程为u=1+ln 3+2v. 答案:u=1+ln 3+2x(其中u=ln y)
8.为了调查患慢性气管炎是否与吸烟有关,调查了100名50岁以下的人,调查结果如下表:
吸烟 不吸烟 总计 患慢性气管炎 20 5 25 未患慢性气管炎 20 55 75 总计 40 60 100 根据列联表数据,求得K2=________(保留3位有效数字),根据下表,在犯错误的概率不超过________的前提下认为患慢性气管炎与吸烟有关. 附:
P(K2≥k0) k0 2
0.050 3.841 0.010 6.635 0.001 10.828 n(ad-bc)2K=. (a+b)(c+d)(a+c)(b+d)
100×(20×55-20×5)2
解析:K的观测值k=≈22.2>10.828.
40×60×25×75
2
所以在犯错误的概率不超过0.001的前提下认为患慢性气管炎与吸烟有关. 答案:22.2 0.001
9.某学校高三年级有学生1 000名,经调查,其中750名同学经常参加体育锻炼(称为A类同学),另外250名同学不经常参加体育锻炼(称为B类同学),现用分层抽样方法(按A类、B类分两层)从该年级的学生中共抽查100名同学,如果以身高达165 cm作为达标的标准,对抽取的100名学生,得到以下列联表:
经常参加体育锻炼 不经常参加体育锻炼 总计 (1)完成上表; (2)能否在犯错误的概率不超过0.05的前提下认为经常参加体育锻炼与身高达标有关系(K2的观测值精确到0.001)? 解:(1)填写列联表如下:
经常参加体育锻炼 不经常参加体育锻炼 总计 (2)由列联表中的数据,得K2的观测值为 身高达标 40 10 50 身高不达标 35 15 50 总计 75 25 100 身高达标 40 身高不达标 15 总计 100
相关推荐: