第一章 绪论
总体:根据研究目的确定的同质的所有观察单位某种变量值的集合。 总体包括有限总体和无限总体。
样本:从总体中随机抽取的部分观察单位,其实测值的集合。
获取样本仅仅是手段,通过样本信息来推断总体特性才是研究的目的。 资料的类型计量资料、计数资料和等级资料。
误差包括随机误差、系统误差和非系统误差。 抽样误差:由抽样造成的样本统计量和总体参数之间的差异或者是各个样本统计量之间的差
异称为抽样误差。
概率:是描述随机事件发生可能性大小的一个度量。取值范围0≤P≤1。
小概率事件:表示在一次实验或观察中该事件发生的可能性很小,可以认为很可能不发生。P≤0.05或P≤0.01。
医学统计学的步骤:设计、收集资料、整理资料和分析资料。 统计分析包括:统计描述和统计推断。 统计推断包括:参数估计和假设检验。
第二章计量资料的统计描述
频数表和频数分布图的用途:
(1)描述频数分布的类型,以便选择相应的统计指标和分析方法。对称分布:集中位置在
中间,左右两侧頻数基本对称。偏态分布:正、负偏态分布正偏态集中位置偏向值小一侧,负偏态反之。 (2)描述頻数分布的特征;
(3)便于发现资料中的可疑值;
(4)便于进一步计算统计指标和进行统计分析。 计量资料集中趋势包括算术均数、几何均数和中位数。 算术均数:直接法(样本小):x??x;頻数表法(样本大)x=?nx);頻数表法G?lg?1fxn
几何均数:直接法:G?lg?1(?lgn(?flgx)?lg?f?1(?flgxn)(常
用于等比资料或对数正态分布资料)
中位数:直接法:n为奇数M?x(n?1)/2 ,n为偶数M?(xn/2?xn/2?1)/2;頻数表法:
ifMM?LM?(n?50%??fL)。
中位数的应用注意事项:可用于各种分布资料,不受极端值的影响,主要用于(1)偏态分
布资料(2)端点无确切值的资料(3)分布不明确的资料。
百分位数:頻数表法:Px?Lx?ifx(n?x%??fL)
均数的特性:(1)各观察值与均数之差(离均差)的总和等于零,即?(x?x)?0。
(2)各观察值得离均差平方和最小,即?(x?x)?2?(x?a)2(a?x)。
均数的应用:(1)均数反映一组同质观察值的平均水平,并可作为样本的代表值与其他样本
进行比较。(2)均数适用于描述单峰对称分布,特别是正态或近似正态分布资料的集中趋势。 离散趋势包括:极差、四分位数间距、方差、标准差和变异系数。 中位数和四分位数间距一起全面描述偏态分布资料的分布特征。
极差:R=MAX-MIN
四分位数间距:Q=P75-P25,Q越大,说明数据变异越大,反之,Q越小,变异越小。 离均差平方和(SS):SS=
?(X?X)?2?X2?(?X)n2
2方差(MA):总体?2?
?(X??)N22 ;样本S?2?(X?X)n?12
22标准差:总体???(X??)N;样本S?2?(X?X)n?1或S??X?(?X)n?1n
频数表法S?变异系数:CV?SX?fx?(?fx)/nn?12
?100%
正态分布特征:
(1)正态密度函数曲线在横轴上方均数处最高; (2)正态分布以均数为中心, 左右对称;
(3)正态分布中的X取值范围理论上没有边界;
(4)正态分布有两个参数,位置参数μ和变异参数σ;正态曲线下的面积分布有一定的规律。(μ-σ,μ+σ)约为68.27% ;在(μ-1.96σ,μ+1.96σ)约为95.00% ;在(μ-2.58σ,μ+2.58σ)内约为99.00% .。 标准正态分布两个参数为0和1。 标准正态分布:u?x?xs
医学参考值范围计算包括:正态分布法和百分位数法。 正态分布法:x?u?s 单侧1.64,2.32;双侧1.96,2.58。
第三章总体均数的估计与假设检验
标准差与标准误的区别和联系:
区别:意义:标差反应个体值得离散度,标误反应样本均数的离散度,即描述样本均数抽样
误差的大小。 应用:标差用于估计参考值范围(X范围),标误用于可信区间的估计(μ的范围)。 联系:SX?Sn。
t分布t?x??sn=
x??sx,自由度υ=n-1。
t分布特征:(1)单峰分布,以0为中心,左右两侧对称;(2)t分布曲线不是一条曲线,
是一簇曲线,其分布曲线的形态变化与自由度υ有关;(3)自由度υ越大,
t分布越近于正态分布,当自由度υ逼近∞,t分布趋向于标准正态分布。
可信区间:(X-t?(?).SX,X+t?(?).SX) 参数估计有点估计和区间估计。 可信区间优劣取决于可信度1-和宽度。 可信区间与参考值范围区别:
含义:可信区间:按预先给定的概率所确定的未知参数μ的可能范围。 参考值范围:“正常人”的解剖、生理、生化指标的波动范围。 计算公式:可信区间:X?t?(?).SX(标准误)
正态分布:x?u?s(标准差)
假设检验的基本思想小概率反证法。
假设检验旧称显著性检验。它是利用小概率反证法思想,从问题的对立面(H0)出
发间接判断要解决的问题(H1)是否成立。然后在H0成立的条件下检验统计量,最后获得P值来判断。
需注意所有检验统计量都是在H0成立的前提条件下计算出来的。 检验假设是针对总体而言的。
单个样本t检验:H0:???0,H1:?>?0 ,??0.05 t?X??SX?X??0SX?X??0Sn,自由度υ=n-1
配对样本t检验:H0:μd =0,H1:μd ≠0,??0.05
t?d??dSd?d?0Sd?dSdn,其中Sd??d2??d??nn?12
d为没对数据的差值,d为差值的样本均数,Sd为差值的标准差,Sd差值样本均数标准误,
n为对子数。
成组设计的两样本均数的t检验(完全随机设计):
1.若n1,n2较小,σ12=σ22,两独立样本的t检验
t?X1?X2SX1,其中SX1?X2?SC2?X2?11?(n1?1)S1?(n2?1)S22??,? S?C?n?nn1?n2?22??122 υ=n1+n2-2
2.若n1,n2较大,两独立样本的u检验
u?X1?X2S21n1?S22
n2假设检验中两类错误
I型错误:指拒绝了实际上成立的Ho,即“弃真”的错误。用α表示。研究者可根据不同
研究目的来确定α水平。α表示检验有意义的水准,故亦称检验水准。 II型错误:指接受了实际上不成立的Ho,即“存伪”的错误。用β表示。β只有与特定的
H1结合起来才有意义,但β的大小很难确切估计。 客观实际 拒绝Ho Ho成立 Ho不成立 统计推断 不拒绝Ho α=P(拒绝Ho︱Ho真) 1-α=P(不拒绝Ho︱Ho真) 1-β=P(拒绝Ho︱Ho假) β=P(不拒绝Ho︱Ho假) 1-β称为检验效能。 假设检验的注意事项:
(1)要有严密的抽样设计;
(2)不同的资料应选用不同检验方法; (3)正确理解“显著性”一词的含义; (4)结论不能绝对化;
(5)统计“显著性”与医学/临床/生物学“显著性”; (6)可信区间与假设检验的区别和联系。
第四章多个样本均数比较的方差分析
方差分析的基本思想:
基本思想就是实验设计的类型,将总变异分解为几个部分,除随机误差作用外,每个部
分的变异可由某个因素的作用(或某几个因素的交互作用)加以解释。 方差分析的应用条件:
(1)各个样本是相互独立的随机样本;(2)各样本来自正态总体;(3)各总体方差相等,及方差齐。
完全随机设计方差分析:
相关推荐: