需要基于系统评价类型和可用数据选择统计方法。当系统评价研究某外科干预而没有对照组时,可以采用描述性统计方法报道连续性变量的均数、标准差及范围。如果研究间的人群特点或纳入/排除标准足够相似,则可以进行加权率的meta分析,即采用随机效应模型合并单臂队列研究。此类meta分析的一个例子就是采用加权合并分析无缝合主动脉瓣置换术(SU-AVR)(8)后随访12个月的瓣周漏发生率(图1)。
对于基于对照研究的系统评价和meta分析,概要统计量的最佳表达形式就是森林图(38)。森林图包括每个纳入研究效应量的加权合并,也能够提示研究间的异质性。图2是微创主动脉瓣置换时采用胸骨小切口还是胸廓小切口对比的meta分析森林图(39)。在森林图中,以方块表示其每个研究的效应量均数,以水平线表示每个研究的效应量95%置信区间。方块大小代表着该研究在meta分析中所占的权重比例。黑色菱形代表meta分析的合成效应量,其宽度是整体置信区间。如果此菱形方块全部在中心垂直实线的一侧,则说明两干预方式对比的效应量差异具有统计学意义(38)。
点估计的典型概括统计量为描述二分类变量的相对危险度(RR)或优势比(OR)和描述连续数据的加权均数差(WMD)。Meta分析的统计模型可以为固定效应模型或随机效应模型。前者假设纳入研究间的真实效应相似,而后者则假设纳入研究描绘的是效应量的随机样本。随机效应模型最适用于当效应量存在异质性时。
为了评估纳入研究间的效应量是否存在一致性,需要对异质性进行量化评估(40)。常用的评估异质性的检验有两种。考克兰Q检验可以判断该效应量异质性的有或无(41)。而I2统计量表示变异的量级,0%说明任何变异都源于机遇(chance),I2值越高则说明无法解释的变异越大。通常来讲,I2值大于50%说明该效应量存在显著的异质性。
当存在显著异质性时,需要解释异质性的来源(40)。一些方法可以用来识别异质性的潜在来源。首先就是亚组分析(42)。对不同亚组的结局进行相同的统计分析,并在亚组间作交互式检验来识别亚组间是否存在显著性差异。如果P值是显著性,则很大可能会在特别亚组和目标结局之间存在相关性。另一个可以评估异质性的方法是下面要说的meta回归。Meta回归分析Meta回归分析是另一个评估异质性的方法。Meta回归分析判断自变量与因变量间是否存在显著的关联性。自变量为研究或者干预的特点(例如年龄、研究时间点、手术时间),因变量为结局指标(43)。构建回归模型时可以采用P值和回归系数(r)评估相关性的强度。显著关系表明研究变量可能是观察到的变异性的来源(8,43-45)。例如图3的meta回归分析表明,采用PercevalS内植物时,研究时期中点与瓣周漏率呈显著负相关(8)。这说明,对于瓣周漏的合并结局而言,SU-AVR学习曲线可能是异质性的来源。网络meta分析网络meta分析可能适合于评估多个干预方式(2)治疗同一种疾病或获得同一种结局的情况。众所周知,网络meta分析是一种多种干预方式比较的meta分析,其目的是合并所有可能的含有多个干预方式的直接或间接对照结果,并进行整体比较(46-48)。相对于传统的两两对比meta分析,网络meta分析的优点是采用了间接证据,合成所有可获得的数据,可以为目前还没有头对头直接比较试验的干预方式间的对照计算效应估计值。
尽管本文范围不包括网络meta分析的统计学细节,但是仍需指出:可用的直接证据(A比B)和间接证据(A比C,C比B)可以采用贝叶斯统计模型运行蒙特卡罗模拟(49)。此模型会收敛似然估计效应量,并提供一个A比B比C模式的对照。此方法的前提假设是干预方式的对照组(比如C)在间接对比试验间是相似的(50)。
网络meta分析特有软件包包括WinBUGS和GeMTC包。网络meta分析的制作过程与传统meta分析相似,包括(I)从直接和间接对照研究中提取数据;(II)将数据输入软件例如WinBUGS或GeMTC;(III)运行贝叶斯模型和蒙特卡罗模拟。在这个首次对比中位胸骨切开、微创胸骨切开、微创胸廓切开进行微创主动脉瓣置换的系统评价中,采用了基于直接和间接证据的贝叶斯网络meta分析(39)。因为既往很少有研究针对微创胸骨切开和微创胸廓切开进行了头对头对比,所以这种情况特别适于做网状meta分析。此网络meta分析整合直接对照和间接对照证据,得出了微创胸骨切开与微创胸廓切开术对比的效应量。
网络meta分析的注意事项是,其比两种干预方式对照meta分析更容易受异质性的影响(51,52)。在进行网络meta分析时,可以用几个不同的模型来评估异质性。这些统计模型包括一致性模型、不一致性模型和节点拆分模型(node-splittingmodel)。如果发现了显著的异质性,则需要说明不一致性模型和节点拆分模型的结果,并且要慎重得出文章结论(53)。
时间事件数据分析在系统评价和meta分析中,时间事件结局如生存数据等一般用风险比(HR)来进行合并。但是,很多研究并没有报道HR,而且也无法获得个体患者数据(IPD)。某些系统评价和meta分析简单的从Kaplan-Meier图中视觉上估计实际生存结局。但是,这个方法没有考虑到删失和失访,而且无法估计HR。为了解决这个问题,已发表文献推荐了几个统计方法,这些方法能够基于其他发表的概要统计量来估计HR(54-57)。这样,就可以从已发表文献中提取估计HR并进行meta分析。
Tierney等在年提出并验证了一个常用的HR估计方法(58)。此方法是采取Digitizelt软件数字化提取KaplanMeier曲线的数据,并且从文章中提取风险患者数。因此,可以准确地估计出数字化提取的实际生存率和随访期间的风险患者数目。Tierney等也制作了Excel电子表格(58),当在表格中输入这些数据并且假设删失数据不变,就可推导出此特定研究原始IPD的估计值。对所有纳入研究采用相似的提取和推导重建数据IPD过程,重建的数据可以用于进行时间事件结局的meta分析。
Guyot和他的同事们在年提出了另一个新方法也可以重新估计IPD数据(59)。这个团队设计出一种迭代算法,其可以解开根据原始研究数据绘制图形的Kaplan-Meier方程。与Tierney等的方法相似,他们采用Digitizelt软件来数字化提取Kaplan-Meier曲线数据,然后将这些数据输入迭代算法运算得出理想的Kaplan-Meier方程解。同样,此算法假定删失数据不变,而且可以在R统计软件上运行。重新得出的患者生存软件能够整合形成组合生存曲线。最近一篇文章采用这个方法来提取开放手术修复慢性B型主动脉夹层的长期时间事件生存数据,其产生的整合Kaplan-Meier曲线见图4(60)。最近,心胸外科系统评价(61)也已经开始采用这种方法。希望在不远的将来,随着时间事件数据的合成需求增加,此方法也能得到推广。6发表偏倚系统评价的另外一个先天不足是发表偏倚(62,63)。相对于得出阳性结论的研究,那些得出阴性结论的研究文章常常更难被发表。常常导致是阴性结果研究更容易“丢失”,这常常会使得meta分析结果偏移,并得出误导的结论。
因此,在系统评价或meta分析中,评估发表偏倚的潜在影响是非常重要的。评估发表偏倚最常用的方法是漏斗图法(64)。漏斗图标明了处理效应的精确度和大小,其形似倒漏斗。水平轴表示干预效果,垂直轴表示标准误差。理想情况下,当发表偏倚很小时,漏斗图的点围绕平均效应值对称分布。非对称分布表明可能存在潜在的发表偏倚,而发表偏倚会破坏结论的真实性(validity)。Begg和Egger检验可以被一起用来在统计学上判定是否存在漏斗图不对称(65)。
为了评估计算某效应量发表偏倚的“丢失的研究”效应,可以采用剪补分析法(66)。这是一种漏斗图方法的拓展,即在对称的漏斗图上识别和估计“丢失的研究”。将推理出的丢失研究填入漏斗图,此时判断效应量的结果改变是否显著,以此来帮助评价发表偏倚。例如最近心胸外科领域的meta分析采用此方法评估发表偏倚的效应及“丢失的研究”,例子如图5(60,67,68)。此方法的注意事项是,其完全基于前提假设:当漏斗图完美对称时,不存在发表偏倚。然而此假设或许成立也或许不成立。而且,发表偏倚的来源和机制并没有充分阐明,因此需要谨慎解释漏斗图和剪补分析法的结果。7结果解释当对系统评价和meta分析的结果进行解释时,需要考虑一下几个因素。第一,评价者应该评估结果的临床意义。例如,如果两种干预方式的手术时间具有统计学差异,相差5分钟,那么这会显著影响患者的结局吗?既往研究曾建议,在临床试验的计划和结果解释中应该包含治疗或者干预方式的最小临床意义变化值(MCID)(69)。第二,评价者应该在讨论部分讨论和解释异质性的潜在来源。这可能包括亚组分析或meta回归来判定那些因素影响目标结果。第三,系统评价应该讨论其相对于既往系统评价(如果有的话)的优点以及此评价的不足。不足之处可能包括但不限于如下:纳入非随机研究(可能会导致偏倚风险)、较小的患者样本量、比较队列间人群基线的显著差异,随访时间短、纳入研究间采用外科干预的异质性等。
结局指标的GRADE评估科学证据和结局指标的质量可以采用GRADE工具进行评估(70,71)。这是针对某特定结局的一种透明、结构化的证据评级方法。GRADE方法采用证据升级和降级的方法来为某结局进行证据评级。证据升级的指标包括大效应量和剂量反应关系。证据降级的指标包括严重的偏倚风险、研究严重的不一致性、严重的间接性、严重的不准确性和可能的发表偏倚。GRADE工具可能会使评价者对系统评价的效应量增加或减少信心,也就是说,对真实的关联性有较高的信心(71,72)。结果撰写图6是系统评价和meta分析的整体过程。为了辅助外科医生严格制作系统评价和meta分析,我们推荐结构化的结果撰写(表2)。8结论系统评价和meta分析可以合成研究数据和评估现有证据质量,因此在外科领域越来越重要。但是,外科医生应该注意系统评价的质量。较差的系统评价质量可能会严重破环结果和结论的真实性。为了获得高质量系统评价及可靠的结论,必须严格执行标准化的制作过程。本文中我们对系统评价制作过程进行了概述,以确保优化系统评价和meta分析的质量和结果。9致谢声明:作者宣布无利益冲突。
作者KevinPhan,DavidH.Tian,ChristopherCao,DeborahBlack,TristanD.YanTheCollaborativeResearch(CORE)Group,MacquarieUniversity,Sydney,AustraliaCorrespondenceto:TristanD.Yan.ProfessorofCardiovascularandThoracicSurgery,TheCollaborativeResearch(CORE)Group,MacquarieUniversity,Sydney,Australia.Email:tristanyanannalscts.白癜风症状都有哪些白癜风症状图