{SiteName}
医学概念
医学核心
医学条件
医学类别
医学创始
国内机构

meta分析笔记

Meta分析,其实就是对已发表的文献做大规模的数据整合,我们提出一定的课题,通过资料的收集即文献调研,提出一定的假设,不是通过实验的证实而是人家已经做好的实验结果为证据,通过一定的数据分析(有成熟的软件如R和操作流程),得到一些结果,有其是细化的知识,能够对临床应用有很好的指导意义。

1标题:细化的课题

2摘要:结构化,包括背景,目的,资料来源,研究人群,干预措施,质量评价标准,合并方法,限制,结论和主要结果。

3引言:原理,目的PICOS,即研究对象,干预措施,对照措施,结果,实验设计

4方法:方案和注册,纳入标准,信息来源

分析步骤:提出问题(选题)—查找数据(文献检索)—数据提取—汇总分析

一,提出好的问题是好的科研的第一步:需要有意义(使用价值),有对比(将开放性问题收缩到细化的领域进行比较,得出确定的结果),有争议(未确定),有创新(闯出一条新路),有文献(数据是研究的基础)。科研从临床出发,从导师的课题出发,从学术会议得到启发,或者看文献,对领域的知识有全面了解之后自然产生的一些想法,这是一种学习,学习别人提出高质量课题的底层模式。现代科研就是需要在从底到顶地学习各种细化的文献,形成整体的感觉之后(升维,微积分基本定理),从顶到底地选择某个细化的课题,从而能够分而治之地解决,这其实是一种人肉搜索策略,找到有意义的关系。

因此一个简单的策略就是紧跟学术热点或者大牛,有更大的概率找到有意义的模式,但有风险,如已被发表,有定论的,数据量太少或者太多甚至不统一。因而需要确定好的课题,需要满足很多条件:无人发表过,没有定论,有恰当的数据。可以提出问题再查找数据(公理化体系的演绎),也可以通过大规模的数据挖掘提取出特定的模式,从而指导我们提出有意义的问题(这种方式是我欣赏的,在大数据时代的科研方式),可以根据已有的大方向如CAR-T的研究,筛选出更加细化的研究方向如免疫转化,细胞培养,细胞重输等等,然后确定最后的课题。我们认为,不同对象的组合可能能够发挥非线性的作用,如山中伸弥四个转录因子能够逆分化成纤维细胞。

去google学术限定时间搜索,一般认为引用越多的文献越有影响力;或者去有影响力的期刊去搜索相关研究如nature,science之类的。

二,文献检索,查全查准是重点,需要将关键词提取出来,并且按照一定的逻辑组织起来去搜索。选择正确的搜索策略是关键。我们知道,英文有很多同义词,所以一个使用OR来综合起来。

主题词和自由词,MeSH医学主题词表[mh],是定义好的专有名词的体系,是数据库官方指定的检索词,便于检索;自由词就是同义词。由于主题词在最新的文献没有标注,或者有错误,甚至没有对应的主题词,所以需要结合自由词来完善检索

研究设计,有随机双盲,等等。

将这些关键词结合起来,以一定的逻辑组合,与或非,如同编程一样实现复杂的功能,找到我们需要的文献,即搜索找到最优解。如同深度优先搜索或者广度优先搜索一样对搜索的优化,我们需要对搜索范围进行收缩,如使用过滤器filter。同时善于使用搜索工具以及求助。

需要到google学术或者其他数据库EMBASE,Cochrane搜索。还有webofscience和clinicaltrials.gov。当然这些工具需要我们真正地使用才能熟悉,并且最后是需求为导向,珍惜时间做出有用的成果来。

Cochrane数据库中的CENTRAL临床对照试验注册资料库,能够找到年以后大部分的随机对照研究和临床对照研究。CDSR系统评价资料库,有基于循证医学的meta分析论文

搜索文献之后就是文献管理,可以使用文献管理软件如endnote和expressnote等等。可以从数据库的搜索的结果中导入,而且需要对文献进行一定的处理如根据一定标准进行筛选文献(从重复文献删除到从标题阅读来删除到阅读全文删除,不断找到相关性最高的文献,最后纳入分析。注意,最高过程中要注明抛弃的理由),最后整理到一个个文件夹中。

在这个过程中就应该注意工作量,同时开始文章的构思和写作。根据自己选题的大小来筛选文献,快速阅读文献。

在写作的过程中,注意分配,可以新建几个文件夹分组,把文章各个部分可能需要引用的文献导入。可以同时开始不同部分的写作,最后再集成起来。有很多小技巧:评级来标记文献的重要性,对重要的话做加粗高亮标记,阅读的时候做一些备注等等。

三,提取数据,这是我们在收集数据制作数据集,这和李飞飞的imaginet数据库一样,以一定的格式来存储数据如excel(可以使用模板,然后将研究的数据纳入),是接下来各种算法分析的基础,能够通过这些数据的输入训练算法,产生我们期望的输出。

首先需要考虑的是数据类型,有布尔型、整数型等等(计算机存储的基础),需要分别提取进行组织。有1二分类变量(非此即彼的结果如有效无效,可以汇总发生率死亡率等等数据);2连续型变量,有具体数值的数据如身高体重等等(需要均值,标准差和样本量);3计数变量,某事件的发生次数(离散变化的);4等级变量如轻中重(目前很难合并);5时间事件变量,有事件发生时间如死亡时间,可以用logHR及其标准误,合并效应量来计算。多数情况不同类型的数据都需要转换为二分类变量或者连续性变量进行分析,因为分析需要相同的数据组织形式,所以需要提取这些数据进行一定的转换,最后汇总分析。

二分类变量分析所需要的指标:

1比值比(oddsratio,OR),是实验组事件的比值和对照组事件数比值的比,类似于导数,可以在RCT和队列研究中计算发病比值比ad/bc,在案例对照研究中计算暴露比值比.OR=1则无差异,0则实验组发生少,0则实验组发生多。

2相对危险度(riskratio,RR),是实验组事件率和对照组事件率的比,仅用于RCT和队列研究。RR=1则无差异,0则实验组发生少,0则实验组发生多。

3危险差,实验组事件率和对照组事件率的差值。RD=0则无差异,1则实验组发生少,1则实验组发生多。

连续性变量分析所需要的指标:

1均数差(meandifference,MD),实验组和对照组均值的差值。MD=0则无差异,0则实验组发生少,0则实验组发生多。

2标准化均数差(standardizedmeandifference,SMD),是实验组和对照组均值的差值除以平均标准差,是一种规则化regulazition,能够合并不同量纲的数据。SMD=0则无差异,0则实验组发生少,0则实验组发生多。

四,数据分析的数据处理流程,从研究的输入到结论的输出,中间的处理过程就是分析

1研究质量评价:根据纳入研究的类型来决定使用评价方法,随机对照试验就适应cochrane风险偏倚评估工具,非随机对照研究(包括病例对照研究和队列研究)用纽卡斯尔-渥太华量表NOS。

2数据提取,将文献的数据转移到表格(需要提前设计好表格的形式)

3数据综合,软件的不同算法来计算得出不同的结论。

4异质性评价,不同研究的差异是客观存在的,需要进行量化(图示法:森林图,漏斗图,拉贝图,galbraith星状图;和数值法:Q,H,I2统计量),然后处理如亚组分析,meta回归和敏感性分析得到。

5偏倚的识别:由于阳性结果更易发表可能带来的偏倚,因此需要全面收集资料,发表偏倚的识别可以评价漏斗图的对称性,使用begg和egger法,trim法和失安全数法也可以。

6敏感性分析:分析每个步骤的决策的可靠性,如改变条件(改变文献选择标准,效应量,效应模型等等),减补法(识别和校正发表偏倚),单项研究的影响(如删除某一研究重新分析,看是否影响结果,如基因敲除),失安全系数法(最少效应多少为发表的文献才能改变结论),选择模型分析法(针对发表偏倚和小样本研究效应)

使用revman软件进行分析,而且还有论文的结构,辅助我们的论文写作。数据处理流程:1添加研究2添加比较和结果(数据的容器)3将数据填入,自动生成合并的数据,得出结论。我们很中间的数据处理过程,其实就是各种算法的实现,知识封装好了,方便用户直接通过修改不同的设置按钮来实现参数的设置,从而使得软件计算各种指标,允许人们在这些指标的基础上得出不同的结论。

不同的变量选择不同的效应模型和效应指标。

五,论文写作以及投稿

对统计的数据进行解读,得出我们人类能够理解的结论。

森林图和漏斗图的解读

异质性的检验,研究最好是同质的才能够得出很好的可靠结论,但现实条件的限制使得研究之间的异质性是绝对存在的。因此,我们只能对异质性进行评价,并尽可能地合并异质性比较小的研究,排除异质性比较大的研究来进行综合分析。异质性的处理又亚组分析,能够细化到足够小的层次,从而能够得到更为准确的结果。

敏感性分析,评价统计模型是否稳定。

偏倚评价:1选择偏倚(随机序列生成,分配隐藏)2实施偏倚(对研究者和患者实施盲法)3随访偏倚(数据的完整性)4测量偏倚(研究结果盲法评价,对评价者实施盲法)5报告偏倚(是否完整报道所有结果)。每一个步骤都可能出现问题,从而影响整体的研究质量。

在meta做出结果后需评价结果的证据质量,使用GRADE系统来分级(可以知道临床指南的制定)。

论文写作技巧:1学习大牛的方法论,模仿学习,快速提高2在前人的基础上有一定的创新,使用不同的方法思考同一物体或者使用相同方法去思考不同问题3找到前人工作的缺陷不足,并尝试改正4以自己的语言来表述工作5尊重前人工作,写作注意合理引用,正统的方法是闲发现新的内容,发现前人工作的步骤,然后产生新的想法。我们人类就是这样站在巨人的肩膀上,不断地将人类认知的边界推广开来。

由于不同研究在合并结果的权重不同,可以理解为神经网络的构建,从而允许我们自动生成可能的研究结果,即收敛的参数能够与这些研究结果有明显的对应。

本质上就是研究不同措施对不同实验平台的影响,这个影响通过相应的指标来评价,从而能够得到结论。我们认为文章的不同处理措施其实是一种输入,能够对机体这个复杂的系统产生特定的影响,。我们可以以神经网络来建模,如药物的联用对病人各个指标的影响就是输出。我们可以收集不同的影响因素作为输入,病人产生的指标变化作为输出/标记,从而组织起一定的数据集,然后使用一定的神经网络算法如CNN,RNN来训练,我们认为当参数收敛时的隐藏层能够对应于一定的生物学机制。从而我们最后能够以一定的准确率来预测新的药物对病人的影响,大大减少所需要的临床试验,就能够找到对特定病人最后的治疗手段。这种方法,和meta分析将不同他临床研究结果合并起来是一致的,同样需要质量控制和数据分析,偏倚检测就对应于统计误差。

我认为,这种想法是综述的综述,是一种方法论的突破,能够指导更多有意义的文章的发表。当然,我首先需要证明自己,需要有实际的成果出来,比如说解决某些科学难题,有争议的课题之类的。不然就只是空谈。

赞赏

长按向我转账

受苹果公司新规定影响,iOS版的赞赏功能被关闭,可通过转账支持。









































北京白癜风医院哪些好
中科白癜风抗复发治疗


转载请注明:http://www.lingshanl.com/gnjg/2099.html

推荐文章

  • 没有推荐文章

热点文章

  • 没有热点文章