总结系列
Python
一文解析临床研究的基本套路
-04·30-
宜分享
在临床研究中,我们常常可以看到三表一图的相关性研究。
临床研究有三大基本要素:
①因素;②对象;③指标
根据三大基本要素,可将临床研究分为:
①影响因素研究;②预测研究;③干预/疗效研究;④诊断学研究;
其中,诊断学研究是按照金标准诊断结果进行分组,比如,根据肺部CT诊断结果将两组患者分为社区获得性肺炎组和非肺炎组。
然后,比较拟研究的诊断方法与金标准的诊断结果,通过一系列诊断学指标(敏感性、特异性等)来评价拟研究的诊断方法的效能。
在上一篇的《一文搞清临床预测模型》中,已对该类型的研究进行了详细阐述。可参看:总结系列
一文理清临床预测模型
而,干预/疗效类研究则略有不同,此类研究在确定研究对象后,进行随机/非随机分组,然后观察记录干预组以及对照组的各项检测指标,通过统计学分析,对比两组间的差异,最后分析干预措施的影响。
呐,今天先从干预/疗效类研究入手,为大家带来这样一套:
《临床研究的基本套路》
赞赏本文,即可解锁资源哦~
干预/疗效类研究套路的概述
BriefIntroduction
一般来说,各种类型的干预/疗效类研究根据其设计类型不同,其统计分析思路与方法也会有所不同。
但,总体而言,干预/疗效类研究具有一定的范式特点。多数干预/疗效类研究项目的统计分析思路基本上可归纳为三步:
(1)描述基线信息;
(2)估计效应大小;
(3)补充敏感性分析;
下面,我们将对这三个步骤进行逐步讲解。
1-描述基线信息
BriefIntroduction
干预/疗效类研究论文的结果部分首先需呈现的是研究人群的基本信息。
基线(baseline)的概念:
基线是研究人群在前瞻性研究中最开始时的健康状况,是研究对象在接受试验组或对照组干预措施前的“0”时刻。药物的安全性和有效性可从基线数据的变化中评估,基线数据组间分布的差异或对结果评估造成偏倚。
通常所谓的“基线”,实则相对“随访”而言,专用于前瞻性研究设计,不过其它研究设计类型也可用“基线“泛指研究人群的基本情况。
基线信息回答如下几个部分:
多少人参与筛选?
经过入选排除标准筛选后,多少人纳入研究?
经过数据清理后,多少人纳入统计分析?
研究人群基线特征信息如何?
纳入统计分析的人群与排除的人群特征差异如何?
基线信息需包括两方面内容:
(1)研究人群的入选排除过程;
先用入选标准粗略圈定分析人群,再用排除标准修正分析人群;
(2)研究人群基线特征的描述与比较;
基线特征常包括社会人口学特征、临床特征、实验室检查指标及疾病史和用药史等;
基线信息的展示形式:
(1)图1-研究流程图
提供从最初筛选到最终纳入统计分析各阶段人数,用于展示研究人群的入选排除情况。
不同研究设计类型在具体的入排流程上有所不同。
A)临床试验:
从筛选、随机化、随访、方案遵循情况等阶段进行例数统计;
B)抽样调查研究:
从各阶段的抽样人数、应答情况等方面进行描述;
C)基于已有登记注册库的研究:
从研究的亚人群、变量的缺失情况等方面筛选;
D)Meta分析:
是对检索的文献进行剔除;
(2)表1-基线信息表
研究人群基线特征的描述与比较常用基线表格展示,即文中的“表1”。
基线信息表需包括如下信息:
分组变量、描述变量和统计量、P值
A)分组变量:
依据研究情形的不同,有不同形式:
干预性研究→按实验组和对照组分组;
观察性研究→按不同的暴露因素分组;
观察性研究→按暴露因素的不同水平分组;
回顾性研究→分“病例”和“对照”组;
B)描述变量和统计量:
基线特征的描述与比较,需依据描述变量的不同特性+组别数选择相应的描述形式和检验方法。
不同特性:连续变量、分类变量,正态、非正态;
组别数:两组、三组及以上;
以上两者的不同组合构成了不同的检验方法。
a)连续变量:
描述:“均数±标准差”或“中位数(四分位数间距)”
检验:两组时采用t检验或Wilcoxon秩和检验;
三组时采用方差分析或Kruskal-Wallis检验;
b)分类变量:
描述:“频数(百分比)”
检验:卡方检验评估组间均衡性
C)P值:
传统的假设检验采用P值评估协变量的组间均衡性,但P值评价组间差异,有两个缺陷:
a)P值只给出定性结论,无法给量化差异大小;
b)大样本时,P值过于敏感,假阳性过高;
因此大样本的随机对照临床试验直接看描述性统计量(均数和百分比),并不报告组间比较的P值。
大样本的观察性研究则常采用标化的组间差值或Hodges-Lehmann估计数评估两组间均数或中位数的差异,具体计算方法如下:
基线信息表的分析工具:
R语言提供多个包可以用于生成基线信息表:
arsenal、qwraps2、amisc、table1、tangram、furniture、tableone、