《医学统计学》实习课
首次实验提示:
1. 实验室规则:白大褂、卫生值日、请假制度 2. 作业:作业分数作为平时成绩的主要依据。
实习一 统计描述
一、目的要求
1. 掌握描述定量资料集中趋势和离散趋势常用指标的意义、计算方法、特点与适用范
围;
2. 掌握正态分布的概念、特征、曲线下面积分布规律,参考值范围的制定; 3. 掌握统计表制作要求;常见统计图的正确选用;
4. 熟悉常用统计软件的基本操作方法,并能采用SPSS计算定量资料统计描述指标、
绘制常见统计图。
二、主要内容
(一)频数表的编制步骤和用途
(二)集中趋势的描述指标-平均数
常用平均数及其比较 平均数 均 数 几何均数 中位数
(三)离散趋势的描述指标:
1.极差range:R?Xmax?Xmin 2.四分位数间距: (1)计算:QU-QL
(2)适用情况:偏态分布资料等
3.标准差:是表示一组正态分布变量值离散情况最常用的指标。 (1)计算:
1
应 用 适用于对称分布,尤其是正态分布的资料 适用于原始数据呈倍数关系或对数正态分布的资料 适用于各种分布的资料。常用于偏态分布资料、开口资料以及分布不明确的资料 计 算 (略) (略) (略) 《医学统计学》实习课
S??X?Xn?1??2?(X)2?X??nn?1 2(2)意义:S越大,观察值的变异程度越大,样本均数的代表性就越差;反之,S越小,观察值的变异程度越小,样本均数的代表性就越好。
(3)应用:
①两组观察值变异程度比较:
两组单位相同、均数相近——S越大,观察值的变异程度越大; ②与均数结合,估计样本的频数分布、制定正常值范围等 4.变异系数:CV?S?100%
X两组单位不同、均数相差较大——CV越大,观察值的变异程度越大。
(四)统计表
1.标题:位于表的上方,概括表的主要内容,一般需注明时间与地点。
2.标目:有横、纵标目,分别说明横行和纵行数字的含义,应文字简明,层次清楚。 3.线条:多采用三条半线,即顶线、底线、纵标目下线及合计上的半线。忌斜线和竖线。
4.数字:一律采用阿拉伯数字。同一指标小数点位数要一致,位次要对齐。表内不应有空项,无数字用“—”表示,数字若为零则填“0”,暂缺项或未记录用“…”表示。
5.备注:不是表的必备内容,如有必要,可在表内用“*”号标记,然后在表的下方加以说明。
(五)统计图
1.制图的基本要求:
(1)图形的正确选择:根据资料性质和分析目的选用。
(2)标题:扼要说明图的主要内容,位于图的下方,必要时注明时间和地点 (3)纵横轴:某些统计图要求纵轴尺度从0开始(如直条图、直方图)。纵横轴应有标目,并注明单位。
(4)刻度:长宽比例(圆图除外)以5:7为宜。
(5)图例:比较不同事物时用不同的线条或颜色表示,并附图例说明,一般放在图的右上角或下方。
2.常用统计图:圆图、直条图、直方图、线图、散点图等。
(六)正态分布及其应用
2
《医学统计学》实习课
1.正态分布的特征:
(1)在横轴上方,均数处最高,为单峰分布 (2)以均数为中心,左右对称
(3)有两个参数,位置参数μ和形态参数σ 。X~N(μ,σ2) (4)正态曲线下面积分布有一定的规律
表2 正态曲线下面积
范 围
面积(%) 双侧 <(只有上限) >(只有下限) 95.00 ? ? 1.96? ? ?1.645 ? ??1.645? 99.00
? ? 2.58?
? ?2.326 ?
??2.326?
2. 正常值范围:是指绝大多数(如95%、99%等)正常人某项测定值的分布范围。(1)正态分布法:(若取95%界限) 双侧:X?1.96S
单侧:若高不正常,则 < X?1.645S 若低不正常,则 > X?1.645S (2)百分位数法:(若取95%界限) 双侧: P2.5 ~ P97.5
单侧:若高不正常,则 < P95 若低不正常,则 > P5
三、SPSS演示(或者计算器统计模型简介)
1.数据文件的建立 2.数据文件的编辑和管理 3.定量资料统计描述指标的计算 4.统计图表的绘制 5.正态性检验方法
四、课堂讨论
1. 均数﹑几何均数和中位数的适用范围有何异同? 2. 同一资料的标准差是否一定小于均数?
3
《医学统计学》实习课
3. 对于某项风险较高的新手术术后的生存时间进行跟踪,共调查了7人, 6人死亡之前
分别生存了5天、6天、10天、16天、25天、29天,还有一人术后30天随访时仍存活。请估计其平均生存天数。
五、练习题
1. 作业:某教授随机抽取某地110名7岁女童,测得其身高值。并用SPSS得到身高的分
布情况和计算相应的统计指标如下。
问:
(1) 该统计图称为什么统计图? (2) 身高的频数分布类型如何?
(3) 描述该指标的平均水平,适宜选择什么指标?离散趋势呢?为什么?列出其计算公
式和分析结果。
(4) 根据上述结果,制定该地7岁女童身高的正常值范围。
2.研究人员调查了某年某地区238名无严重肝肾疾病、无汞作业接触史的居民,头发中的汞含量(μmol/kg),检测结果如下表所示。
某地区某年238人的发汞含量(μmol/kg)
组 段 1.5~
3.5~ 5.5~ 7.5~ 9.5~ 11.5~
人 数 20 66 60 48 18 16
4
《医学统计学》实习课 13.5~ 15.5~ 17.5~ 19.5~ 合 计
6 1 0 3 238
请问:选用何种指标描述其集中位置和离散程度较好?说明理由,列出其计算公式,并在SPSS中计算其结果。
3.某研究人员调查了某年某地500名健康成年女性血红蛋白的含量,直方图显示其分布近似于正态分布,并且已知其均数为117.4g/L,标准差为10.2g/L,试计算该地健康成年女性血红蛋白的95%参考值范围。
4.某次研究中的被调查对象年龄如下, 53 37 38 35 36 34 29 36 37 41 28 29 32 31 34 33 35 52 54 65 58 53 33 32 36 37 38 44 43 29 20 63 38 42 43 32 36 37 38 34 32 40 37 38 44 43 40 47 30 26 21 56 47 46 39 24 21 56 49 46 (1)编制频数分布表或绘制频数分布图; (2)求其平均年龄(列出计算公式及分析结果);
(3)欲了解年龄的离散趋势,应该计算什么指标?为什么?
44
46 32 33 20 57
43 49 31 39 34 60
40 47 40 31 33 36
47 45 38 33 55 34
30 35 44 37 52 33
26 47 43 38 44 39
20 45 40 43 48 31
36 35 47 36 46 33
46 37 30 34 39 55
55 62 26 54 24 60
5
相关推荐: