第一范文网 - 专业文章范例文档资料分享平台

第二十章生存分析实习指导(定)

来源:用户分享 时间:2020-06-24 本文由轻烟薄雾 分享 下载这篇文档 手机版
说明:文章内容仅供预览,部分内容可能不全,需要完整文档或者需要复制内容,请下载word后使用。下载word有问题请添加微信号:xxxxxx或QQ:xxxxxx 处理(尽可能给您提供完整文档),感谢您的支持与谅解。

第二十章 生存分析

[教学要求]

了解:了解生存资料的特点和Cox模型的概念及应用。 熟悉:理解中位生存期的概念、生存曲线的特点及解释。

掌握:单因素生存曲线的K-M方法和中位生存期的计算;单因素生存曲线比较的log-rank检验及适用条件;Cox模型回归系数与RR的关系及模型适用条件。 [重点难点]

第一节 生存资料的特点

生存时间往往不服从正态分布,且资料收集过程中会出现删失值的问题,故需要一些特殊的统计分析方法。 一、起始事件与终点事件

终点事件(outcome event) 又称失效事件(failure event),它是指研究者所关心的特定结局,而起始事件是反映研究对象生存过程的起始特征的事件。这两者是相对而言的,它们都由研究目的决定,必须在设计时就明确规定,并在研究期间严格遵守而不能随意改变。 二、生存时间

生存时间(survival time)也称失效时间(failure time),它定义为终点事件与起始事件之间的时间间隔,常用符号t表示。 三、删失值

基本概念:在随访研究中,由于某种原因未能明确地观察到随访对象发生事先定义的终点事件,无法得知随访对象的确切生存时间,这种现象称为删失(censoring) 或终检,包含删失的数据称不完全数据(incomplete data)。本章着重讨论右删失(right censoring),即从时间轴上看,终点事件发生在最后一次随访观察时刻的右方。虽然删失数据的信息可以利用,但过多的删失很可能会带来分析结果的偏倚。

产生右删失的原因:1.随访对象失访或中途退出(withdraw)。2.随访结束

时对象仍存活。3.治疗措施改变等。 第二节 生存率的估计

估计生存率有两种非参数方法:用于大样本分组资料的寿命表法(life table method)和本节介绍的乘积极限法(product-limit method),也称K-M法,它既可用于小样本资料,也可用于大样本资料。 一、生存率的点估计

如数据中无删失,生存率可用下式计算:S(t)?t时刻仍存活的观察例数 ;

总观察例数如数据中有删失,则需分时段计算不同单位时间的生存概率pi(i=1,2,…,t),然后利用概率乘法原理将pi相乘得到t时刻生存率,即:S(t)?p1?p2???pt。 二、总体生存率的区间估计

总体生存率的1-?置信区间为:S(ti)?Z?/2SE[S(ti)],其中生存率的标准误为:SE[S(ti)]?S(ti)?n(nj?1jidjj?dj)

三、生存曲线及中位生存期

生存曲线:将随访时间作横坐标,不同时点生存率作纵坐标绘制生存曲线(survival curve)。随时间的增加,该曲线一般呈下降趋势,下降速度快在图形上表现为坡度大、曲线陡峭,意味着生存率较低或生存期较短;下降速度慢在图形上表现为坡度小、曲线平缓,意味着生存率较高或生存期较长。

中位生存期:中位生存期(median survival time)也称半数生存期,表示恰好有50%个体活过此时间。生存时间通常并不服从正态分布,故常用中位生存期作为某个人群生存过程的概括性描述指标。中位生存期越长,表示疾病预后越好;中位生存期越短,表示疾病预后越差。其数值可借助生存曲线进行图表法估计或用线性内插法求解。 第三节 生存曲线的比较

应用条件:该法不指定生存时间服从特定的某种分布,属于非参数方法。所

比较的是单因素设计不同组间整个生存时间的分布,而不是仅仅比较某个特定时间点的生存率。对比组的生存曲线不应有明显的交叉。常用于随机化分组后处理因素的比较,如果有重要的非处理因素在对比组间不均衡或属于未实施随机化的观察性研究,应考虑后述的多因素分析方法。

(Ak?Tk)2检验统计量: ???,??2?1。

Tkk?122第四节 Cox回归

模型形式:h(t,x)?h0(t)exp(?1x1??2x2????pxp),其中x1,x2,?,xp表示研究者认为可能影响死亡率的危险因素,也称协变量(covariates),这些变量在随访期间的取值不随时间的变化而变化;t表示生存时间;h(t,x)称为具有协变量

x1,x2,?,xp的个体在t时刻的风险函数(hazard function),表示这些个体在t时刻的瞬时危险率或死亡率;h0(t)称为基线风险函数(baseline hazard function),表示所有x1,x2,?,xp都取值为0时的个体在t时刻的瞬时危险率或死亡率,h0(t)不要求特定的形式,具有非参数的特点;参数?i(i?1,2,?,p)为总体回归系数,其估计值bi可以根据样本计算得出。

回归系数的意义:回归系数?i表示xi每增加一个单位时, 相对危险度或风险比(risk ratio)的自然对数。当回归系数大于0时,风险比大于1,相应协变量的增加将增大所研究事件发生的可能性;当回归系数小于0时,风险比小于1,相应协变量的增加将减小所研究事件发生的可能性;当回归系数等于0时,风险比等于1,相应协变量与所研究事件的发生无关。

自变量筛选:按照Cox模型的参数估计原则,当模型中增加自变量时,现有模型的部分似然函数值L将增大,而-2ln(L)将减小;在自变量个数即模型的自由度一定时,-2ln(L)取值最小的模型较好。需要强调,逐步方法只是一个计算策略,并不能保证总是得到最好的模型。必要时可以更换筛选变量的方法并调整检验水准,多数情况下总是出现在方程中的变量可能是有意义的,最终备选的模型一定要结合专业知识来判断。

PH假定条件:Cox模型中假定风险比h(t,x)/h0(t)的大小与时间t无关,称为比例风险(proportional hazards)假设,简称PH假设。如果某个协变量不同水平的风险函数曲线有明显交叉,或者协变量与时间的交互作用项在模型中有统计学意义,则不能使用本章介绍的比例风险模型。

[案例讨论参考答案]

案例20-1 首先,结果变量的选取应充分考虑专业上的要求。对于白血病等一些难以完全治愈的较为凶险的疾患,延长患者的生存时间在临床上是有现实意义的,故而结果变量应选取结局(病情是否缓解)以及出现结局的时间(缓解时间)。这样,仅以病情是否缓解为结果变量的单因素Fisher精确概率结果以及多因素logistic模型结果就不很恰当。其次,在使用生存分析方法时,应考虑到影响缓解时间的因素, 除了研究者所关心的是否存在不良染色体以外,还有其它影响因素无法通过实施随机化达到组间非研究因素的均衡性,那么单因素log-rank检验的结果就无法控制非研究因素的影响,所以应该使用多因素Cox回归分析方法并检查PH假设条件,得出正确研究结论。

[电脑实验及结果解释]

实验20-1 生存过程的统计描述

程序20-1 生存过程的统计描述实验SAS程序及说明

行号 01 02 03 04 05 06 07 08

程 序 说 明 建立SAS数据集survnoce; 设定随机数种子;

设立循环,循环变量i从1增加到100,每次加1;

产生均匀分布的随机数;

产生参数为1的指数分布生存时间t; 用指示变量cen表示此数据中无删失; 将数据写入数据集; 结束循环;

调用UNIVARIATE过程对生存时间进行单变量描述并打印出分布图;

10 12

VAR t; TIME t*CEN(0); DATA survnoce; seed=20021109; DO i=1 TO 100;

s=UNIFORM(seed); t=-LOG(s); cen=1; OUTPUT;

END;

09 PROC UNIVARIATE PLOT;

指定分析变量为t;

指定时间变量为t,cen=0表示删失值; 运行上述语句;

11 PROC LIFETEST METHOD=PL; 调用LIFETEST过程用乘积限法描述生存过程; 13 RUN;

运行结果:

Output窗口:

对生存时间t的UNIVARIATE过程分析结果:

The UNIVARIATE Procedure

Variable: t Moments

N 100 Sum Weights 100 Mean 1.03571168 Sum Observations 103.571168 Deviation 1.09864257 Variance 1.2070155 Skewness 1.90814932 Kurtosis 4.02632453 Uncorrected SS 226.764403 Corrected SS 119.494535 Coeff Variation 106.076101 Std Error Mean 0.10986426

Basic Statistical Measures

Location Variability

Mean 1.035712 Std Deviation 1.09864 Median 0.693335 Variance 1.20702 Mode . Range 5.62217 Interquartile Range 1.12603 Tests for Location: Mu0=0

Test -Statistic- -----p Value------ Student's t t 9.427194 Pr > |t| <.0001 Sign M 50 Pr >= |M| <.0001 Signed Rank S 2525 Pr >= |S| <.0001 Quantiles (Definition 5) Quantile Estimate 100% Max 5.63121347 99% 5.09585858 95% 3.49681788 90% 2.58697652 75% Q3 1.38466393 50% Median 0.69333519 25% Q1 0.25863772 10% 0.09728424 5% 0.06338161 1% 0.02039616 0% Min 0.00904492 Extreme Observations

-------Lowest------- -----Highest----- Value Obs Value Obs 0.00904492 21 3.92317 38 0.03174740 15 4.12442 47 0.05022296 86 4.33788 3 0.05054521 83 4.56050 51 0.06165469 89 5.63121 36

搜索“diyifanwen.net”或“第一范文网”即可找到本站免费阅读全部范文。收藏本站方便下次阅读,第一范文网,提供最新高中教育第二十章生存分析实习指导(定) 全文阅读和word下载服务。

第二十章生存分析实习指导(定) .doc 将本文的Word文档下载到电脑,方便复制、编辑、收藏和打印
本文链接:https://www.diyifanwen.net/wenku/1101098.html(转载请注明文章来源)
热门推荐
Copyright © 2018-2022 第一范文网 版权所有 免责声明 | 联系我们
声明 :本网站尊重并保护知识产权,根据《信息网络传播权保护条例》,如果我们转载的作品侵犯了您的权利,请在一个月内通知我们,我们会及时删除。
客服QQ:xxxxxx 邮箱:xxxxxx@qq.com
渝ICP备2023013149号
Top