的发生率。总共1998-2001年之间四个研究入选,清扫组总共481例,采样组总共496例。综合结果表明OR=0.67(95%CI,0.51-0.86)>0,菱形完全位于垂直线的左侧,得出清扫组更有效的结论。
我们还可以比较两种或多种不同设计对相同问题进行的Meta分析是否会得出不同的结果,也就是敏感性分析(sensitivity analyses)。这里留给读者一个问题:如剔除Steven M .Keller2000这篇非前瞻性随机对照研究后得出的分析结果是否不同?
我们再看图16上面的菜单栏,这里提供了很多个性化的功能,可以使您用不同的方式显示“Meta分析森林图”,这需要调整上述“Dichotomous outcome/category”对话框中的各种选项。现在逐一把最常用的介绍如下:
z File:通过文本、网页、各种格式的图片(PNG、JPG、BMP)、word等的形式保存
或者打印“Meta分析森林图”。 z Edit:把结果通过剪贴板的形式输出。
z Display:通过“scale”调整森林图的显示比例;通过“confidence interval”选择置
信区间的范围;除了图16中显示最常用的study ID、Raw data(原始数据)、Graph(这里指森林图)、Weight(权重)、Effect estimate and CI(效应估计量和置信区间范围)以外,还可以显示各纳入研究的Year(年份)、Quality(研究质量)、User defined order(使用者定义的显示顺序)、O-E and variance(观察-期望数及变异)。 点击该栏最下方的“Funnel plot…”将会显示“倒漏斗图”以了解文献潜在的发表偏倚(publication bias),“倒漏斗图”显示不对称,提示存在发表偏倚,发表偏倚的最主要原因是阴性结果的文章发表困难。此外方法学质量低下、试验组和对照组基线资料的差异、机遇和弄虚作假等因素也会导致倒漏斗图的不对称分布。
Funnel plot是指从单个研究估计得来的治疗效果(x轴)与每项研究的样本大小(y轴)所作出的散点图形。因为治疗效果估计值的准确性是随着研究样本量的增加而增加的,所以小样本研究的效应值应散在、宽广地分布在图形底部,而大样本研究的效应值相对集中地分布在图形中部或顶部,由于大样本研究的效应值分布随着样本量的增加而逐渐集中变窄。图形形状类似于一个倒置的漏斗。在没有偏倚的情况下,呈现对称的倒漏斗状;如果存在偏倚,比如阴性结果的研究未能发表,就会出现图形缺角。RevMan4.2采用1/SE代替样本量对应效应值作图。
根据图17可以猜测入选的四篇文献的发表偏倚不大,但根据仅有的四个研究作出判断仍然是依据不够充足的,因为通过“倒漏斗图”下结论的前提是在入选研究数量
13
足够多。Funnel的对称与否没有正式的定义,RevMan4.2中也没有提供任何检验的方法。只是通过视觉的观察,判断结果在不同的观察者之间往往存在差异。入选研究越少,结论就越难以统一。Egger和他的同事开发了一种简便的funnel plot图形检验方法正在越来越为Cochrane系统评价广泛应用。[13][14]
图17
z Sort:可以通过study,weight,effect estimate,year,quality,User defined order等
多种方式排列各研究的显示顺序。
z Statistical:最实质性的一项。效应指标选择一般包括计数资料或计量资料;资料合
成方法包括固定效应模型或随机效应模型
a.对于计数资料有Peto odds ratio、Odds ratio 、Relative risk、Risk difference 四种衡量效应尺度的选择。
计数资料如暴露与否、生存和死亡、有效和无效、治愈和未治愈等这些非此即彼的二分类数据用优势比(odds ratio, OR)、相对危险度(relative risk,RR)、风险差异(risk difference, RD)、风险比(hazard ratio, HR)表示干预的结果,计算中要求列出各组发生该结局或事件的人数和总人数。Peto法的OR是传统方法(Mantel-Haenszel)的一种改进,对小概率事件结局的结果进行汇总时是最有效而且偏倚最小的方法。理清他们之间的异同非常重要,事实上不少系统评价者在一些随机对照试验中不恰当地应用了这些效应指标。HR和RR意义相近,一般可以换用,各计数指标的比较见表3(表3中公式的字母参照表2)[15,16]。
14
表2 四格表
结局 干预组 对照组
是 A C
否 B D
表3 计数资料各指标的比较
OR(odds ratio) 名称 定义
优势比
病例组与对照组暴露率之比
RR (relative risk) 相对危险度 干预组与对照组结局发生率之比
公式 (A/B)/(C/D) [A/(A+B)]/[C/(C+D)]指标类型
相对(比值)
相对(比值)
1
RD (risk difference)
风险差异
干预组与对照组的结局发生率之差
A/(A+B)-C/(C+D) 绝对(差值)
0 随机对照试验 (前瞻性) 如果两率较大,检验两率的差值用RD值较好;如
Meta-分析图的垂线 1 适用范围
病例对照研究(回顾性的病因学分析)
备注
目前最常用于Meta分析中尤其是病因学探讨中,但优越性仍有待评估。如果A
队列研究,随机对照试验(前瞻性) Meta-分析中尤其在非小概率事件中使用RR是最安全的,果两率差值较小,则用而且容易为大多数人理解。对于罕见事件,用OR来估计RR是完全可行的,甚至可以说,某结局的发生率越低,用OR估计RR的可靠性越强。一般来说OR OR、RR、HR这些相对性指标较好。由于是两组之差,RD的变异性最大。 15 我们可以尝试在Peto odds ratio、Odds ratio 、Relative risk、Risk difference四种模式之间切换,事实上对于本研究,四种模式虽然具体的结果有所差异,却可以得出一致的结论。 b.对于计量资料,有Weighted mean difference 、Standardised mean difference的选择 z weighted mean difference:每一试验中采用同一种标准方法测量连续变量结局时使 用。正态分布的计量资料如身高、血压、生化指标等大多数适用于这种情况,用加权均数差(weighted mean difference, WMD)作为效应尺度,数据提取时需要各组的例数、结局指标的均数以及标准差(standard deviation,SD)。注意这里指的是标准差而不是标准误(standard error,SE),如果某原始文献中该值和其他研究的差异太大,尤其对于国外文献,要注意鉴别和转换,转换公式是SE=SD n 。一般来说, SD重在描述变量值的分布,如参考值范围;SE重在反映抽样误差的大小,表明用样本均数估计总体均数的可靠程度,如置信区间。具体的例子可以通过File/Import/Reviews…/Exercise/Remgs 找到,是一个RevMan4.2自带的一个关于“Fitness programme versus junk food”的系统评价。与计数资料的“红心和蓝十字”图标有所不同,计量资料的图标是一个“温度计”(图18) z Standardised mean difference:当各试验采用不同的测量工具用不同的测量单位时使用。多见于同一种疾病多种设计不同的评分量表的情况。如评价功能状态的KPS百分法和ZPS的五分法,评价抑郁症的多种评分法等。 图18 偏态分布的计量资料如中位生存期有截尾数据,不能用均数加减标准差(mean±SD)来 16
相关推荐: