学习必备 欢迎下载
直线回归方程的应用
描述两变量的依存数量关系 利用回归方程进行预测 利用回归方程进行控制
第二 直线相关 ( linear correlation )
简单相关(simple correlation),用于双变量正态分布资料。
进行直线相关分析的基本任务在于根据x、y的实际观测值计算表示两个相关变量x与y线性相关程度和性质的统计指标—相关系数r,并进行显著性检验。 1.直线相关的概念
直线相关是研究两变量 x、y 之间协同变化的线性关系 的分析方法。 2.对资料的要求
x、y 都是正态分布资料的随机变量。
3.相关系数 (correlation coefficient ,r )
* 表示方法: -1 ? r ? 1
意义:描述两个变量直线相关的方向与密切程度的指标。 4、直线回归与直线相关的联系与区别 区别: 1)意义
直线回归反映两变量的依存关系; 直线相关反映两变量的相互关系。 2)对资料的要求
直线回归:自变量是正态总体的随机变量或指定变量,y 一定是正态总体的随机变量;直线相关:两变量均为正态总体的随机变量。 联系:
1)同一组资料的 r 与 b 的正负符号是一致的;
2)同一组资料的 r 和 b 的假设检验结果是一致的,即 t r = t b。
3)两变量间有相关关系,不一定有因果关系;但两变量间有因果关系,一定有相关关系。 第三节 Spearman 秩相关
适用资料:⑴ 不服从双变量正态分布 ⑵ 总体分布类型未知 ⑶ 原始数据用等级表示
等级相关系数rs(即Spearman Correlation Coefficient)—反映两变量间相关的密切程度与方向 第八章 相对数
计数资料的统计描述
一、常用相对数(relative number) 1、比( ratio)
又称对比指标或相对比,表示两个有联系的同类指标之比,常用倍数或百分数表示。 2、比例(proportion)
又称构成指标,表示某一事物内部各组成部分所占的比重或分布,常用百分数表示。
学习必备 欢迎下载
3、率(rate):
又称频率指标,表示某现象发生的频率或强度,比例基数用k表示,据习惯定,一般至少保留1?2为整数。包括%、‰、1/万、1/10万 二、 医学中常用的相对数指标 1、医学人口统计指标 (1)人口总数 (2)人口构成 (3)人口生育
自然增长率=粗出生率-粗死亡率 (4)人口死亡
粗死亡率(总死亡率) mortality rate
2、反映疾病发生水平的频率指标(疾病统计指标) 发病率 ( incidence rate)
某病发病率=(一定时期某病新发生的病例数/同时期内可能发生某病的人口数)?K (1) 时期:指观察所包括的时间范围,通常为年或月;
(2)新发生的病例数:指第一次发生某种疾病,以第一次就诊为准。
(3)可能发生“某病”:指存在发生某病的危险性和条件(流行病学上为暴露人群)。 患病率(prevalence rate)
指在某时点接受医学检查时,可能发生某病的全体受检人群中被发现的某病病人现患新、旧病例数。
某病患病率=(检查时发现的某病现患病例数/ 该时点受检人口数)?K 适用于病程较长的疾病的统计,反映某种疾病在一定人群中流行的规模或水平 病死率(fatality)
某病死亡率=(观察期间内因某病死亡人数/同期某病病人总数)? K 三、应用相对数应注意的问题
? 1,计算率和构成比的分母不宜过小:否则样本率不稳定,易造成错觉; ? 2,不要将构成比作率分析;
? 3,求平均率时不能直接将几个率相加求其合并率或平均率,而应以总发生数除以
总可能发生例数。
? 4,应注意资料的可比性
资料是否存在偏性
当内部结构不同的相对数间进行比较时,若比较合计率,应计算标准化率。
率的抽样误差与标准误
? 率的抽样误差:
由抽样造成的样本率和总体率的差别称为率的抽样误差。
率的总体标准误用?p表示 ?p?? (1??)n ?p的样本估计值为率的样本标准误sp sp?p (1?p)n 总体率的区间估计
当n??5和n(1-?)?5时,样本率p近似服从均数为?、标准误为?P的正态分布,当总
学习必备 欢迎下载
u?n 体率未知时, ?p用估计值sp取代 总体率的假设检验(u检验)
? 适用条件:
1. 适用于一个样本率与一个总体率的比较,或两个样本率间的比较。而不能用于多个率或构成比资料的比较;
2. 要求样本量较大, 一般np与n(1-p)均大于5,率的分布近似于正态分布。 率的标准化
1. 标准化法(Standardization)的意义
当比较两个总率时,如果两组内部某种能影响指标水平的重要特征的构成上有差别,往往造成总率的升高或下降,影响两个总率的对比;因此要设法消除其内部构成的差异,使之能合理地进行比较,所用的方法称为标准化法。标准化法即在一个指定的标准构成条件下进行率的比对的方法。
目的:采用统一的标准构成以消除内部构成不同对总率的影响,使标准化后的标准化
总率具有可比性。
(1).选择标准人口:
a. 应选择有代表性、较稳定的、数量较大的人群
b. 将比较的两组(或多组)的人口数合并作为标准组 c. 选其中一组(选人口数较多组)作为标准组
1、直接法:以标准人口构成与实际的年龄组别死亡率求得一个调整死亡率。
2、间接法:采用标准年龄组别死亡率与相互比较的两组年龄组别人口数计算求得的死亡率。 第九章 卡方检验(一) 概念:
检验两组(或几组)率或构成比差异是否有统计意义(样本量不限)。行与列两个顺序变量之间是否相关。 卡方检验的基本思想
反映了实际频数和理论频数吻合的程度。如果检验假设成立,则实际频数与理论频数之差一般不会很大,出现大的卡方值的概率是很小的 基本公式:
2
X检验的专用公式法
2p???spp??p(1?p)?2??(A?T)2T ? =(R-1)(C-1)
(ad?bc)2n? ?(a?b)(c?d)(a?c)(b?d)??(2?1)(2?1)连续性较正公式:
条件:当四格表中有任一格子理论数1≦T<5,同时总例数n≧40, (A?T?0.5)2? ??T(ad?bc?n/2)2. n2? ?(a?b)(c?d)(a?c)(b?d) 2
配对四格表资料x检验
2 学习必备 欢迎下载
(b?c?1)2? ?(when b?c?40)b?c (b?c)22? ?(when b?c?40)b?c 2配对四格表资料的关联性分析
(ad?bc)2n? ?(a?b)(c?d)(a?c)(b?d)r ??(2?1)(2?1) 2???22?n 四格表精确检验法
条件:四格表资料中若 n<40,或有任一格子理论数T<1。
基本思想: 是在周边合计数不变的条件下,表格中实际频数各种组合的概率。 P值=所有小于等于样本点概率的各种组合的概率之和.
p? 2行× 列表资料的x检验 适用条件:
? 当 R>2 or C>2
? 两个以上的率的比较 ? 两个或多个构成比的比较
? 按两种属性分类的频数表资料的关联性分析 计算公式:
(a?b)!(c?d)!(a?c)!(b?d)!a!b!c!d!n! ? 2?n(?A2?1)nRnC ??(R?1)(C?1)行× 列表分类资料的关联性分析
r?Pearson列联系数r : ?2?2?n 列联表卡方检验的注意事项:
(1) R*C 表中4/5以上格子的理论数应该>5; 假设1/5以上格子理论数小于5, a. 增加实验样本含量 b. 相邻行或列数字合并; C.删除所在行或列的数据 D.直接计算概率 2
(2) x 检验的结果接受H1时仅提示所比较的各组总体来说有差别,但不能表示其间任一两者间有差别,也不表示差别的强度.
(3)对于顺序变量,用秩和检验更合适. 卡方检验(二)
多个样本率间的多重比较 Bonferroni法:
相关推荐: