{SiteName}
医学概念
医学核心
医学条件
医学类别
医学创始
国内机构

深度肿瘤大数据创业,应避免专业偏见和关注

国家癌症中心/中国医学科学院北医院胸外科高亦博

国家癌症中心依托中医院,是全国肿瘤防治研究和信息交流的中心,承担着采集和发布全国肿瘤登记数据、建立全国癌症防治协作网络、开展全国癌症防控科学研究的职责,牵头组织实施城市、农村、淮河流域癌症早诊早治项目以及肿瘤高发现场工作,也是国家肿瘤规范化诊治质控中心、国家肿瘤临床医学研究中心等,是全国肿瘤临床大数据汇集、分析、研究、上报、发布的中心。在参与国家癌症中心/中医院承担的肿瘤临床大数据相关研究项目过程中,也曾反复遇到一些难点和问题,在处理过程中得出了一些经验和体会,由此对未来的肿瘤大数据研究重点和难点有了更深认识。

肿瘤临床大数据系列研究主要内容和进展

当前肿瘤大数据研究的具体内容可以简要概括为以下几个方面:①确定采集数据的内容及规范:包括患者人口学基本信息、发病及诊断信息、治疗信息、随访信息、科研信息等;②构建全国癌症监测网络:搭建网络基础架构、数据交换、数据中心、业务应用、综合管理等;③构建肿瘤单病种数据库:确定各专业数据库字段,将结构化字段自动导入系统,采用数据挖掘工具将非结构化数据纳入等;④综合数据分析:预定报表模型深入挖掘分析肿瘤分型,诊疗,癌症死亡分析,癌症控制统计分析,治疗费用等;⑤数据上报质量控制:设计信息系统标准数据接口,规范数据字典;医院的接口数据,校验上报数据,对整体性、种类完整性、数据项完整性等进行检查;数据清洗,处理问题数据,收集原始资料,保障数据溯源;组织医疗专业人员进行业务逻辑核查和数据修正,并对数据字典和采集规范进行补充、完善等;⑥癌症规范化诊治研究:制定或更新适合中国国情的癌症诊治规范,修改完善符合我国患者特点的癌症分期标准,获得符合循证医学的高级别证据用以指导临床。

截至年,项目已经由行业专家协商制定拟采集的数据内容及规范,编制统一的数据字典,结合我国广泛采用的医疗信息化系统特点,确定了包括电子病历、检验检查、处方医嘱、治疗计划、随访信息等在内的20个大项、余个小项的采集规范;完成国家癌症中心与14医院的加密VPN网络接入,完成服务器、防火墙、网关等基本硬件的部署,实现了数据推送和抓取;建立了自主知识产权的集成开发环境,支持各种结构化、半结构化、非结构化数据的处理。参考大数据项目的数据规范和工作经验,制定了多种常见肿瘤的单病种规范化诊治的医疗质控指标,已上报国家卫生计生委医政医管局。

肿瘤临床大数据研究中的常见问题与解决

通常认为,可以视为大数据的数据资源一般具有:数据总量大、数据结构和类型复杂、单位数据价值密度较低、生成速度快等几个共同特征。因此其数据特征与常规的基础和临床医学研究、循证医学临床试验等均有比较显著的区别,对开展和从事大数据研究的医疗机构和相关专业人员提出了独特的需求和挑战。在此仅举三个典型话题进行初步的探讨。

1.医院信息化系统运营安全是开展临床大数据研究的前提

医院信息医院临床业务正常运转的必备条件,其持续医院信息部门的工作重点。另一方面由于工作职责优先级的不同,医疗机构开展的公共卫生、基因组学研究对大数据存储、管理和分析的需求往往不能从院级医疗信息平台得到充分保障,时常造成资源的重复建设,提高了研究的时间、人力和经费成本。两方面的矛医院业务系统相对独立建立大数据研究专用数据仓库,并且在运行压力较小时与集成平台或临床数据仓库通信的方式获取数据来解决,直至开发成具有比较完整独立的业务逻辑的产品后,再反哺业务系统。

2.临床大数据内涵和外延的延伸模糊了数据规范性、规则完备性、参照完整性的边界

除了临床诊疗中被动积累的业务系统运行数据、电子病历和影像检查数据以外,医疗机构主动开展的肿瘤相关基础和临床研究也产生了具有庞大数据量或涉及大规模人群的基因组学、人群或队列筛查体检数据等,已成为肿瘤大数据的重要来源。但由于各自数据类型和结构特征的巨大差异,很少有成熟的医疗信息化平台或工具可以将之整合,导致付出很高成本获得的数据资源难以充分发挥其作用和价值。此外,尽管临床大数据的采集不再设置很高门槛,然而循证医学临床研究范式中的选择性偏倚、幸存者偏倚、测量偏倚等混杂偏倚和数据间的交互作用仍是设计数据分析策略、报表、发布研究结论等过程中需要充分考虑的问题,即肿瘤临床大数据研究本质上仍然属于医学研究,其结论的得出不应因为采用大数据技术而对方法的合理性或结论的可信度降低要求。

3.需要着力注意避免专业偏见和







































鏃╂湡鐧界櫆椋庢槸鍚﹁兘娌绘剤
涓鐧界櫆椋庡尰闄㈠井淇?


转载请注明:http://www.lingshanl.com/yxtj/329.html

推荐文章

  • 没有推荐文章

热点文章

  • 没有热点文章