用Excel解决数理统计问题
在微软Office的Excel中有许多函数用于数据处理,其中有些涉及数理统计,使用非常方便。
Excel在原安装中可能没有“数据分析”菜单,建立“数据分析”的步骤是:由“工具”菜单中选择“加载宏”,在弹出的加载宏对话框中选定“分析工具库”和“分析数据库——VBA函数”,确定后“工具”菜单中增加了“数据分析”子菜单。其中有“描述统计”,“协方差”,“相关系数”,“回归”,“方差分析”,“Z—检验”,“T—检验”,“F—检验”等工具。 一、
常用统计量
1.平均数
Excel计算平均数用AVERGE 函数,其格式如下:
=AVERGE (数据1,数据2,…,数据30) 例如输入
=AVERGE (1,2,3,4,5)
则得到平均数3,若要得到工作表中位于E3至E12这组数据的平均数,则输入 =AVERGE (E3:E12)
2、样本标准差 样本标准差的定义是
s??(xi?x)2n?1
Excel计算样本标准差的函数是STDEV,其格式如下: =STDEV (数据1,数据2,…,数据30) 例如输入
=STDEV (3,5,6,4,7,5) 则得到这组数据的样本标准差1.35.输入 =STDEV (E3:E12)
则得到工作表中位于E3至E12的这组数据的样本标准差。 3、样本方差 样本方差的定义是
s2?(x?i?x)2n?1
Excel计算样本方差使用VAR函数,格式为
=VAR (数据1,数据2,…,数据30) 例如输入
=VAR (3,5,6,4,7,5) 则得到这组数据的样本方差1.81.输入 =VAR (E3:E12)
则得到工作表中位于E3至E12的这组数据的样本方差。 二、
区间估计
1、 估计均值
已知方差,估计均值时,使用函数CONFIDENCE,它产格式是:
=CONFIDENCE (显著性水平α,总体标准差,样本容量) 计算结果是z??2n。再用样本均值加减这个值,即得总体均值的置信区间。
如果已知方差,则先用函数SQRT计算平方根,得标准差,再代入。
如果已知一组样本值。则还要用函数AVERGE计算样本均值,然后才能计算置信区间。 例1 已知样本容量n?25,总体的标准差??100,样本均值X?950,取??0.05. 解: 在Excel的一个单元(例如A1)内输入 =CONFIDENCE (0.05,100,25)
用鼠标点击其他任意单元,则公式所在单元显示39.19922。这就是z?在另一个单元 格中输入 =950-A1
则显示910.8008. 这是置信区间的左端点。同样方法可计算置信区间的右端点。即得均 值的置信区间。
例2 对某种钢材的抗剪强度进行了10次测试,测得结果如下(单位:MPa)
?2n的值。然后,
578, 572, 570, 568, 572, 570, 570, 596, 584, 572
2若已知抗剪强度服从正态分布N(?,?),且??25,求?的95%的置信区间。
2解 打开Excel的一个新工作表。在单元格B2,C2,…,K2内分别输入数据:578, 572,570,…,572。在单元格B3内输入 =AVERAGE (B2:K2) 得到输出x?575.2. 在单元格B4内输入 =STDEV (B2:K2) 得到输出s?8.702. 在单元格B5内输入
=CONFIDENCE (0.05,5,10) 得到输出z??2n?5.394. 在单元格B6内输入
?B3?B5
得到置信下限为572.101, 在单元格B7内输入 ?B3?B5
得到置信上限为578.299. 因此置信区间为 (572.101,578.299).
未知方差,估计均值时,没有这样的可以直接计算的函数,需要一步一步计算。
例3 设总体服从正态分布,已知样本容量n?16,样本均值x?503.75,样本标准差
s?6.2002取??0.05.求均值?的区间估计.
解 打开Excel的一个新工作表,先用函数TINV求T分布的分位点,它的格式是
(显著性水平?,自由度n?1) TINV在单元格B2内输入
=TLNV (0.05,15)
则这个单元将显示2.131451. 这就是t?(n?1)?t0.025(15)的值,再在单元格B3内输
2入
?B2*6.2022SQRT(16)
显示3.304921。这是t?(n?1)2sn的值,在单元格B4内输入
?503.75?B3
得到置信下限为500.4451,再在单元格B5内输入 ?503.75?B3
得到置信上限为507.0549. 因此置信区间为 (500.4451,507.0549). 例4 在例2中,设方差未知,求?的95%的置信区间。
解 在例2中已经算得x?575.2,s?8.702,而样本容量为10。沿用例2中的工作表,在单元格E4中输入
=TLNV (0.05,9)
得到t?(n?1)?t0.025(9)?2.26216,再在单元格E5中输入
2 =E4*B4/SQRT(10) 得到t?(n?1)2sn?6.22539,在单元格E6中输入
?B3?E5
得到置信下限为568.975,再在单元格E7中输入 ?B3?E5
得到置信上限为581.425. 因此置信区间为 (568.975,581.425)
注意 TINV (?,n)给出的是T分布的上?2.估计方差
估计方差时,要用到?分布或F分布。求?分布的上?分位点的函数为CHIINV,它的格式为
=CHIINV (?2或者1??2,自由度n?1)
例 设总体服从正态分布,已知样本容量n?9,样本标准差s?0.007。取??0.05,求总体方差的区间估计.
解 打开Excel的一个新工作表,在单元格B2中输入 =CHIINV (0.025,8)
222分位点。
显示17.53454(??20.025(8)),在单元格C2中输入
=CHIINV (0.975,8)
?(n?1)s2显示2.179725(??0.975(8))。然后用公式?2,???(n?1)2?2(n?1)s2??计算置信区
2?1??2(n?1)??间,在单元格B3中输入
?8*0.007^2/B2 显示0.00002236,在单元格C3中输入 ?8*0.007^2/C2
显示0.0001798,因此总体方差的置信区间为 (0.00002236,0.0001798).
此外,函数FINV可以计算F分布的上?分位点,从而求方差比的置信区间。
三、 假设检验
1. 单个正态总体方差未知时均值的t检验
由于没有一个函数一次完成单个正态总体方差未知时均值的检验,需要分几步计算,所用的检验统计量为 T?X??0S/n
可以用一般统计中介绍的方法计算统计量T和观察值,再用区间估计中介绍的方法得到T分布的上?/2分位点 (双边检验时),比较统计量T的观察值t和T分布的上?/2分位点 (拒绝域为:t?t?/2),便可得到检验结果。
例 设某一引擎制造商新生产某一种引擎,将生产的引擎装入汽车内进行速度测试,得到行驶速度如下:
250 238 265 242 248 258 255 236 245 261 254 256 246 242 247 256 258 259 262 263
该引擎制造商宣称引擎的平均速度高于250 km/h ,请问样本数据在显著性水平为 0.025 时是否和他的声明相抵触?
解 (1) 打开Excel的一个新工作表,单元格B3:F6输入样本数据,如下图
搜索“diyifanwen.net”或“第一范文网”即可找到本站免费阅读全部范文。收藏本站方便下次阅读,第一范文网,提供最新高中教育用Excel解决数理统计问题 全文阅读和word下载服务。
相关推荐: