随机对照试验(RCT)是循证医学的基石,在生殖医学临床研究中意义重大,本文对RCT的不同研究方法进行了探讨。介绍了生殖医学临床试验中的优效性(superiority)、非劣效性(non-inferiority)和等效性(equivalence)检验,以及频率论(Frequentist)方法和贝叶斯方法(Bayesian),指出了非劣效性试验中的生物爬行现象缺点。文章还讨论了决策环境对RCT的影响,RCT在个性化医疗时代的应用,以及RCT解决诊断和预后问题。最后文章讨论了大数据的使用与RCT的比较,即使在大数据时代,RCT仍然被认为是确定干预措施与疗效之间因果关系的有力工具。RCT不同的研究方法各有其优劣,理解这些对辅助生殖领域RCT的设计及解读有重要意义。
男男女女
本期的生殖专家文献解读邀请中国科学医院(医院)生殖与遗传分院、产前诊断中心研究员、副主任吴丽敏解读《Methodologicconsiderationsinrandomizedclinicaltrialsinreproductivemedicine》,该篇文献由ChristosVenetis,Ph.D.,a,b,cThomasd’Hooghe,Ph.D.,d,e,f等发表在年6月的FertilityandSterility中。
吴丽敏
中国科学技术大学博士、博士后
中国科学医院(医院)生殖与遗传分院、产前诊断中心研究员、副主任
安徽省医学会妇产科学分会委员
安徽省中西医结合学会妇产科学专委会常委
中国医师协会医学遗传医师分会临床生化遗传委员会委员
中国医药教育协会生殖内分泌专业委员会委员
中国康复医学会生殖健康专委会委员
世中联生殖医学专委会常务理事
美国cityofhope国家医学中心访学1年余
致力于不孕不育、复发性流产、多囊卵巢综合征、卵巢储备功能下降、优生遗传咨询、产前筛查和诊断等的临床和科研
随机对照试验(RCT)是循证医学的基石,在临床研究中意义重大,本文对RCT的研究方法进行探讨。
临床试验中的优效性(superiority)、非劣效性(non-inferiority)和等效性(equivalence)检验
优效性试验是检验一种治疗是否优于另一种治疗的试验,一般对于以安慰剂作为对照的试验常用优效性试验。优效性试验的原假设为试验方案总体疗效等于对照方案的总体疗效,或试验方案劣于对照方案;而备择假设为试验方案总体疗效优于对照方案。拒绝了原假设即可得出试验方案比对照方案优效的结论。在生殖医学领域中,可用于检验某方案能否带来更好的妊娠结局(如更高的活产率LBR)。优效性检验在RCT中最为常见。
等效性试验是检验一种治疗是否与另一种治疗方案疗效“相等”的试验(实际为相差不超过一个指定的界值)。
非劣效性试验是检验一种治疗是否不劣于另一种治疗方案的试验,多用于有客观疗效指标的临床研究中。由于安慰剂对照试验受到伦理学方面的限制,使得非劣效试验设计在临床上有广泛的应用。
非劣效性RCT
非劣效性RCT在辅助生殖领域中有重要应用价值。例如,某新治疗方案能显著缩短达到妊娠需要的时间,或降低流产率,或降低治疗费用,但是在获卵率方面并不劣于原治疗方案。再举例说,冻胚移植方案与新鲜移植方案相比,其妊娠率方面并没有显著区别,但能显著降低OHSS的发生率,这也是非劣效性RCT。
生物爬行现象(BIOCREEP)
非劣效性试验的缺点是出现生物爬行现象。例如经非劣效性试验检验后,方案B并不劣于方案A,而另一项研究中方案C并不劣于方案B,但是方案C与方案A其实存在差异。这意味着重复开展非劣效试验有出现生物爬行现象的风险。
频率论(Frequentist)方法和贝叶斯方法(Bayesian)
对于不确定性的度量有两种不同的考虑方式,这导致了两种不同类型的推理方法称之为频率论(frequentist)和贝叶斯方法(Bayesian)。频率论方法通过大量独立实验将概率解释为统计均值;贝叶斯方法则将概率解释为信念度。当考虑的试验次数非常少的时候,贝叶斯方法的解释非常有用。此外,贝叶斯理论将我们对于随机过程的先验知识纳入考虑,当我们获得的数据越来越多的时候,这个先验的概率分布就会被更新到后验分布中。频率论和贝叶斯方法都各有其优劣的地方。
决策环境
可以先从小规模的探索性的RCT开始启动,如可以先开始单中心的小规模的RCT,发现趋势后再开始实施大规模的验证性的RCT。RCT的决策环境很重要。例如,在研究活产率LBR的RCT中,观察指标还可包括达到活产之前的多个妊娠相关的指标,如受精率、胚胎数、临床和持续妊娠率。在未达到活产之前,如果这些妊娠相关指标显著提高,则活产率指标很有可能有统计学差异。
重要的是要考虑RCT的决策背景。例如,在活产过程中,应考虑多个终点的治疗效果。如果治疗对每个终点都有积极作用,这就增加了治疗真正起作用的可能性。例如,如果ICSI比体外受精(IVF)好,那么从更高的受精率、更多的胚胎、更多的临床和持续妊娠中,这一点应该已经很明显了,最终会导致更多的活产。因此,对所有这些终点均无影响的随机对照试验应与ICSI产生更高受精率、更多胚胎、更多妊娠和活产的RCT进行不同的解释,即使并非所有的差异都具有统计学意义。
个体化医疗与RCT
在过去数十年间,随着个体化医疗,精准医疗的发展,RCT也发生了变化。传统的RCT强调统计学意义,只要统计学上有差异(P<0.05),则得出试验组有差异的结论,由此产生的新的治疗方案将会运用于每一位符合入组的患者。有观点认为,有些微小差异(即使P<0.05),仅仅是统计学上产生的,说明不了什么问题,不能据此就否定原有的治疗方案。还有的观点认为,有些RCT有多个亚组,体现出总体优势的治疗方案也许对某个亚组来说就不适用,甚至是有害的,而个体化医疗则强调应该根据每一个患者的具体情况选择治疗方案,但这一观点亦存在争议。
诊断性与预后性指标与RCT
虽然RCT也经常被用来研究诊断和预后,但是某些已知的和诊断和预后相关的指标如果运用得到,可以更好的来设计RCT。例如在一项研究卵巢储备功能相关指标与IVF超促排Gn用量的RCT中,方案A是对所有患者人群随机,方案B是根据卵巢储备功能,分类成低反应/正常反应/高反应组,再对异常组的Gn用量进行随机,而对正常反应组不随机,使用标准Gn用量(IU)(见图1),方案B效率更高。
图1RCT设计中,A方案是对所有患者人群随机,B方案是先分类为低反应/正常反应/高反应组,对异常组进行随机,而对正常反应组不随机
大数据能取代RCT吗?
RCT在临床转化方面受人诟病,RCT常常耗资耗时,因样本量受限,往往还要多中心合作。再者,RCT的随机化有时甚至是违背伦理的,常常会遭到患者的拒绝。而在大数据时代,政府、卫生机构、移动平台等等都掌握了巨大的数据量,近年来出现的真实世界研究就是在大样本量的基础上,根据患者的实际病情和意愿非随机的选择干预措施,并开展长期评价,
推荐文章
热点文章