华南理工大学网络教育学院 《 统计学原理 》作业
1、某快餐店某天随机抽取49名顾客对其的平均花费进行抽样调查。调查结果为:平均花费8.6元,标准差2.8 元。试以95.45%的置信度估计:
(1)该快餐店顾客总体平均花费的置信区间及这天营业额的置信区间(假定当天顾客有2000人);
(2)若其他条件不变,要将置信度提高到99.73%,至少应该抽取多少顾客进行调查?
z?2z0.0027/2?3z0.0027?2.78,0.0455/2;,) 2.8?0.4,?x?2?0.4?0.8 解:(1)、?x?49z0.0455?1.69(提示:
总体均值的置信区间:(8.6-0.8,8.6+0.8)即(7.8,9.4)元 营业总额的置信区间:(2000*7.8,2000*9.4)即(15600,18800)元。
9*2.82?110.25?111 (2)必要的样本容量: n?0.82
2、一所大学准备采取一项学生在宿舍上网收费的措施,为了解男女学生对这一措施的看法,分别抽取了150名男学生和120名女学生进行调查,得到的结果如下: 赞成 反对 合计 男学生 45 105 150 女学生 42 78 120 合计 87 183 270 请检验男女学生对上网收费的看法是否相同。已知:显著性水平?=0.05, ?02.05(1)?3.842,?02.05(2)?5.992,?02.05(4)?9.487。
解:
H0: μ1 =μ2
H1: μ1μ2不相等
? = 0.05 Df=(2-1)(2-1)=1 决策:
在?= 0.05的水平上不能拒绝H0,
《 统计学原理 》 第 1 页 (共 页)
结论:
可以认为男女学生对上网收费的看法相同
3、一家管理咨询公司为不同的客户举办人力资源管理讲座。每次讲座的内容基本上是一样的,但讲座的听课者,有时是中级管理者,有时是低级管理者。该咨询公司认为,不同层次的管理者对讲座的满意度是不同的,对听完讲座后随机抽取的不同层次管理者的满意度评分如下(评分标准从1——10,10代表非常满意):
高级管理者 7 7 8 7 9
经计算得到下面的方差分析表: 差异源 组间 组内 总计
SS 18.9 48.5
df 17
MS 1.26
F
P-value 0.0008
F crit 3.68
中级管理者 8 9 8 10 9 10 8
低级管理者 5 6 5 7 4 8
(1) 请计算方差分析表中的F值。(10分)
(2) 请用? = 0.05的显著性水平进行方差分析。(15分)
(1) 解:设不同层次的管理者的平均满意度评分分别为3 提出假设:H0 :
1 =
2 =
3,H1 :
1,
2 ,
1,2
3 不相等
《 统计学原理 》 第 2 页 (共 页)
(2) 解:P=0.0008< = 0.05(或发F=11.76>F=3.68),拒绝原假设,
表明不同层次的管理者的平均满意度评分之间有显著差异。
4、某企业生产的袋装食品采用自动打包机包装,每袋标准重量为100克。现从某天生产的一批产品中按重复抽样随机抽取50包进行检查,测得样本均值为:x?101.32克,样本标准差为:s?1.634克。假定食品包重服从正态分布,
z0.05?成本美元6.0005.0004.0003.0002.0001.0000.00020406080100120z0.052?1.96,
1.64,成本(1000美元)预测成本(1000美元)(预测成本(1000美乘客数,要求:
(1) 确定该种食品平均重量95%的置信区间。(10分)
(2) 采用假设检验方法检验该批食品的重量是否符合标准要求?(写出检验的
具体步骤)。(15分)
解:(1)已知:n?50,z0.052?1.96。 样本均值为:x??Mi?1kifi?nki?15066?101.32克, 50i样本标准差为:s?sn?(M?x)2fi?n?11.63450130.88?1.634克。 49由于是大样本,所以食品平均重量95%的置信区间为:
x?z?2?101.32?1.96??101.32?0.453
即(100.867,101.773)。
(2)提出假设:H0:??100,H1:??100 计算检验的统计量:z?x??0sn?101.32?1001.63450?5.712
由于z?5.712?z0.052?1.96,所以拒绝原假设,该批食品的重量不符合标准要求。
5、一个汽车轮胎制造商声称,某一等级的轮胎的平均寿命在一定的汽车重量和正常行驶条件下大于40000公里,对一个由20个轮胎组成的随机样本作了试验,测得平均值为41000公里,标准差为5000公里。已知轮胎寿命的公里数服从正态分布,制造商能否根据这些数据作出验证,产品同他所说的标准相符?(? = 0.05,t ?(19)=1. 7291)
《 统计学原理 》 第 3 页 (共 页)
解:H0: m ? 40000 H1: m < 40000 a = 0.05 df = 20 - 1 = 19 临界值:
检验统计量:
t?x??0sn
41000?40000??0.894500020
决策: 在a = 0.05的水平上不能拒绝H0
结论:有证据表明轮胎使用寿命显著地大于40000公里
6、甲、乙两个班参加同一学科考试,甲班的平均考试成绩为86分,标准差为12分。乙班考试成绩的分布如下: 考试成绩(分) 学生人数(人) 2 60以下 7 60—70 9 70—80 7 80—90 5 90—100 30 合计 (1) 画出乙班考试成绩的直方图。(5分) (2) 计算乙班考试成绩的平均数及标准差。(5分) (3) 比较甲乙两个班哪个班考试成绩的离散程度大? (5分)
解:(1)乙班考试成绩的直方图如下:
《 统计学原理 》 第 4 页 (共 页)
1086420人数60以下90-10060-7070-8080-90考试成绩乙班考试成绩分布的直方图(2)x??Mi?1k
ifi?ns???55?2?65?7?75?9?85?7?95?52310??77分
3030ki?(Mi?1?x)2fin?1(55?77)2?2?(65?77)2?7?(75?77)2?9?(85?77)2?7?(95?77)2?5
30?14080?11.86分29s12??0.1395。 x86s11.86乙班考试分数的离散系数为:v乙???0.1540。
x77由于v甲?v乙,所以甲班考试成绩的离散程度小于乙班。
(3)甲班考试分数的离散系数为:v甲?
7、一家物业公司需要购买大一批灯泡,你接受了采购灯泡的任务。假如市场上有两种比较知名品牌的灯泡,你希望从中选择一种。为此,你从两个供应商处各随机抽取了60个灯泡的随机样本,进行“破坏性”试验,得到灯泡寿命数据经分组后如下:
灯泡寿命(小时) 700~900 900~1100 1100~1300 1300~1500 合计 供应商甲 12 14 24 10 60 供应商乙 4 34 19 3 60 (1) 请用直方图直观地比较这两个样本,你能得到什么结论?(3分)
(2) 你认为应当采用哪一种统计量来分别描述供应商甲和供应商乙灯泡寿命
的一般水平?请简要说明理由。(3分) (3) 哪个供应商的灯泡具有更长的寿命?(4分)
《 统计学原理 》 第 5 页 (共 页)
(4) 哪个供应商的灯泡寿命更稳定?(5分)
解:(1)两个供应商灯泡使用寿命的直方图如下:
304030频数20频数20100700~900900~11001100~1300101100~13001300~15001300~15000700~900900~1100使用寿命使用寿命供应商甲供应商乙 从集中程度来看,供应商甲的灯泡的使用寿命多数集中在1100小时~1300小时之间,供应商乙的灯泡的使用寿命多数集中在900小时~1100小时之间。从离散程度来看,供应商甲的灯泡的使用的离散程度大于供应商乙的离散程度。
(2)应该采用平均数来描述供应商甲和供应商乙灯泡寿命的一般水平,因为两个供应商灯泡使用寿命的分布基本上是对称分布的。
(3)计算两个供应商灯泡使用寿命的平均数如下:
x甲?
?Mi?1kifi?n800?12?1000?14?1200?24?1400?1066400??1106.676060小时。
x乙??Mi?1kifi?n800?4?1000?34?1200?19?1400?364200??10706060小
时。
甲供应商灯泡使用寿命更长。
(4)计算两个供应商灯泡使用寿命的标准差和离散系数如下:
s甲??(Mi?1ki?x)2fi?n?1s199.89v甲?甲??0.18
x甲1106.672357333.34?199.89小时。 59《 统计学原理 》 第 6 页 (共 页)
s甲?v乙??(Mi?1ki?x)2fi?s乙x乙n?1136.92??0.13 10701106000?136.92小时。 59由于v乙?v甲,说明供应商乙的灯泡寿命更稳定。
8、为估计每个网络用户每天上网的平均时间是多少,随机抽取了225个网络用户的简单随机样本,得样本均值为6.5小时,样本标准差为2.5小时。
(1)试以95%的置信水平,建立网络用户每天平均上网时间的区间估计。(8分) (2)在所调查的225个网络用户中,年龄在20岁以下的用户为90个。以95%的置信水平,建立年龄在20岁以下的网络用户比例的置信区间?(注:z0.025?1.96,
z0.05?1.645)(7分)
解:(1)、已知N=225, 1-α=95%, Zα/2=1.96, -x =6.5,ó=2.5 网络用户每天平均上网时间的95%的置信区间为:
x?za/2s2.5?6.5?1.96??6.5?0.33 n225=(6.17,6.83)
(2)、样本比例:P=90/225=0.4;年龄20岁以下的网络用户比例的置信区间为:
P?Za/2p(1?p)0.4?(1?0.4)?0.4?1.96?0.4?0.064 n225即(33.6%,46.4%)
9、雇员要进行两项能力测试。在A项测试中,所有雇员平均分为l00分,标准差为15分;在B项测试中,所有雇员平均分为400分,标准差为50分。李明在A项测试中得115分,在B项测试中得了425分。与平均数相比,李明的哪一项测试更为理想?请通过计算李明的每项测试的标准分数来寻求答案。
解:根据题意可知,该问题需要用标准分数。
A项测试,标准分数为(115-100)/15=1;B项测试,标准分数为(425-400)/50=0.5.
所以,与平均分数相比,李明A项测试较为理想。
《 统计学原理 》 第 7 页 (共 页)
10、用回归分析可以预测运行一条商业航空线的成本吗?如果可以,那么哪些变量与这一成本有关呢?在众多变量中,飞机类别、距离、乘客数、行李或货物量、天气状况和目的地方位,甚至还有飞行员的技能都可能与成本有关。为了减少自变量年数,假定采用波音737飞机,飞行距离500英里,航线可比而且是在每年的相同季节,这种条件下可以用乘客数来预测飞行成本吗?乘客越多,重量越大,行李也越多,这会使用权原油消耗量及其他成本上升,下表为每年相同季节波音737在12条500英里的不同航线不同乘客数时的成本 成本(1000美元) 乘客数 成本(1000美元) 乘客数 4.280 61 4.820 76 4.080 63 4.700 81 4.420 67 5.110 86 4.170 69 5.130 91 4.480 70 5.640 95 4.300 74 5.560 97 用excel中“数据分析”工具中的“回归”分析得到以下结果。
成本(1000美元)6.0005.0004.0003.0002.0001.0000.000020406080100120成本(1000美元)预测成本(1000美元)乘客数
回归统计
Multiple R 0.9482 R Square 0.899084 Adjusted R Square 0.888992 标准误差 0.177217 观测值 12
(预测成本(1000美方差分析:
df SS MS F Significance F 回归分析 1 2.798031 2.798031 89.09218 2.69164E-06 残差 10 0.31406 0.031406 总计 11 3.112092
Coefficients 标准误差 t Stat P-value Intercept 1.569793 0.338083 4.643218 0.000917
《 统计学原理 》 第 8 页 (共 页)
乘客数 0.040702 0.004312 9.438865 2.69E-06
请利用以上结果:
1、写出回归直线方程。(5分)
解:写出回归直线方程。(5分) 回归方程为:y = -0.8295 + 0.037895 x
2、对回归方程进行拟合优度检验。(10分) 方法一:判定系数r2
判定系数的实际意义是:在不良贷款取值的变差中,有71.16%可以由不良贷款与贷款余额之间的线性关系来解释,或者说,在不良贷款取值的变动中,有71.16%是由贷款余额所决定的。也就是说,不良贷款取值的差异有2/3以上是由贷款余额决定的。可见不良贷款与贷款余额之间有较强的线性
3、对方程进行显著性检验(总体模型线性关系检验及回归系数检验,?=0.05
总体模型检验:
步骤一,提出假设: H0: b1=0 H1:b1≠0 步骤二,确定合适的统计量和抽样分布。 因为对总体模型进行检验,所以用 F检验。
《 统计学原理 》 第 9 页 (共 页)
相关推荐: