精准医学是以个体化医疗为基础、随着基因组测序技术快速进步以及生物信息与大数据科学的交叉应用而发展起来的新型医学概念与医疗模式。精准医学通过更深刻地剖析胃癌的疾病特征、病因机制等核心问题为提高胃癌的诊断和治疗提供更多的便利。肿瘤临床数据库是推动精准医学发展的重要保障,因此,必须重视数据库的建设和管理。中山大学肿瘤防治中心胃癌临床数据库由病例数据库、血标本库、组织库以及影像资料库组成,为保证数据库的质量,其设计和管理需要遵循严格的标准化操作(即SOP)模式。在医疗大数据年代,数据共享是提高医学研究水平的重要途径,临床数据库的建设和管理也必须围绕这个宗旨进行不断的强化和创新。
近年来,精准医学的迅猛发展获得了医学界的广泛。年1月,美国总统奥巴马发表的关于启动精准医学计划的讲话更将其推向现代医学发展的最前沿。所谓精准医学(precisionmedicine)是以个体化医疗为基础,随着基因组测序技术快速进步以及生物信息与大数据科学的交叉应用而发展起来的新型医学概念与医疗模式。其本质是通过基因组、蛋白质组等组学技术和医学前沿技术,对大样本人群与特定疾病类型进行生物标记物的分析与鉴定、验证与应用,从而精确寻找到疾病的原因和治疗的靶点,并对一种疾病不同状态和过程进行精确分类,最终实现对疾病和特定患者进行个性化精准治疗的目的,提高疾病预防与诊治的效益。
一、临床数据库在胃癌精准医学中的意义
胃肠间质瘤(GIST)可以被认为是精准医学发展中的一座里程碑,通过检测外显子突变位点的差异,指导靶向药物的使用及手术时机的把握,为GIST患者带来了显著的生存获益。当然,GIST作为比较典型的基因突变位点较明确、且与疾病发生发展密切相关、可以进行治疗干预的疾病,突变位点检测为其的诊治带来的优势是十分明显的,但这类疾病也是相对少见的。反观胃癌,作为一种致病机制复杂、异质性明显的疾病,尽管多年来研究成果不断涌现,治疗水平不断提高,但是胃癌的治疗效果并未获得质的提升,期待精准医学为胃癌的临床诊治带来突破性的进展仍需要更多的积累和实践。
众所周知,精准医疗的实施是基于对某种疾病的大样本人群进行遗传学本质特征的分析与探索,其主要技术手段是基因组及(或)蛋白组学的研究方法,以获得病因的证据及最佳的诊断和(或)治疗靶点,其中实现了从生物学特征分析数据向临床现实数据转化验证的过程。目前,胃癌精准医学研究领域的主要问题集中在寻找胃癌发生发展的驱动基因,并以此作为靶点进行干预治疗;另一方面,充分了解突变位点差异与胃癌异质性及临床病理特征和预后的关系,也是精准医学的重要研究内容。
年在《Nature》上发表的研究结果显示,基于对例胃癌样本的分析结果,可以把胃癌分为4种主要的分子分型,包括微卫星不稳定型、染色体不稳定型、基因稳定型以及EB病毒相关型,并归纳了不同分子分型与性别、年龄、部位、恶性程度、治疗效果等临床特征的关系,初步总结了不同分子特征的胃癌其临床特征与预后的差异,对胃癌异质性的研究与探索获得了较大的进步。目前基于多个研究的结果,FDA已经批准包括HER2、PIK3CA、ALK、PDGFRB、BRCA1、BRCA2、TSC1等10余个通路的包括曲妥珠单抗、依维莫司、索拉非尼、拉帕替尼、厄洛替尼、伊马替尼、克唑替尼、奥拉帕尼等10种靶向药物应用于胃癌的治疗。其中,为大家所熟知的ToGA研究使人们认识到,HER2阳性胃癌可以作为一种独特的疾病群体存在,以及其特殊的临床病理特征对曲妥珠单抗良好的治疗反应。而后对于HER2的检测方法进行了大量的探索,并对组织留取的时间、样本的规格、固定的方法以至免疫组织化学检测及FISH检测的具体标准化操作步骤进行了不断的更新和规范,这也从另一个角度反映,现代医学研究的发展趋势不仅体现在研究手段的精准,同时也对研究对象提出了更高的要求。上面两个例子仅为胃癌精准医学最初始阶段的探索,由此可见,未来精准医学对研究对象将有更大的依赖和更高的要求。
此外,对于目前胃癌的治疗,精准医学的内涵不应该仅仅是针对基因序列或者蛋白质分子的检测分析,而是应该有更广泛的延伸和发展。就胃癌的治疗现状来看,在未来不短的时间内,手术治疗仍将是、尤其有希望获得治愈的胃癌病例最重要的治疗手段。因此,手术治疗的精准程度其价值并不亚于对基因、蛋白检测及后续的干预措施。目前的研究证据已经充分证实了包括淋巴结清扫方式的差异对胃癌预后的影响,而是否存在针对疾病个体最合适的淋巴结清扫方式即个体化淋巴结清扫策略的问题,则需要在未来的研究中进行更多的探索。此外,结合个体化因素的胃切除方式、消化道重建方式等外科治疗手段,若能进一步精准化,亦极有可能为这些患者带来更多生存和生活质量的获益。而这些研究是否能够获得客观的结论,对研究对象的规范性和准确性亦有着很高的要求。
回顾医学研究的发展历程可以发现,最早的经验医学时代,是以个体的诊治经验去指导其他个体的诊治;而随后的循证医学时代,则是以样本推导总体,再指导个体的诊治。其中存在的缺陷是不言而喻的。而未来的精准医学时代也可以认为是大数据医学的时代,则是以无限接近总体的超大样本指导个体的诊治,其优越性同样是无需赘述的。目前,胃癌精准医学发展最大的障碍就是疾病的异质性、也就是分子机制的复杂性。小样本的基因测序、或蛋白质组学研究方法,难以涵盖这个复杂的疾病群体,也无法将疾病特征与遗传学改变紧密地联系起来,并从本质上认识疾病。因而,完整的病例数据资料,对于样本的数据分析至最终的结论推导,将起着决定性的作用。总而言之,目前胃癌精准医学的发展尚处于起步阶段,想在短时间内依靠检测几个样本或分析几个组织的方法获得突破,无异于痴人说梦!必须从全面认识疾病特征着手,其中最重要的一环就是积累更多研究性强的研究资料。因此,临床数据库作为推动精准医学发展的基础条件,必须引起研究单位和研究者的高度重视。
二、胃癌临床数据库的组成及应具备的特性
(一)临床数据库的组成
从研究对象的角度出发,病例资料的可研究性体现在可以全面、准确地反应疾病与个体特征之间的联系,包含了反映个体基本特征、疾病特点、治疗方法以及疾病转归等多个因素,涵盖了病例记录数据、标本数据和影像数据等多种数据源的合集,我们称之为临床数据库。中山大学肿瘤防治中心胃肿瘤临床数据库于年建立,经过多年的建设与完善,目前数据库涵盖4个主要的数据或资源子库,可以完全满足目前本中心胃肿瘤临床及转化研究的需求。为满足精准医学进行基因测序、蛋白组学检测的需求,以及对外科和其他诊疗技术的分析和评价需求,胃肿瘤的临床数据库应涵盖以下4个部分。
1.病例数据库:
主要包含患者基本信息、病程特征、诊断及分期、MDT及临床试验管理信息、具体的治疗措施、不良事件及转归、连续的随访信息及终点事件发生的时间及具体原因等内容。
2.组织库:
主要包含新鲜冻存的肿瘤组织(包括原发病灶、转移淋巴结及其他转移灶)及其配对的正常组织(癌旁正常胃组织、正常淋巴结及腹膜等组织)和这些标本的蜡块;腹水标本及配对的细胞学涂片标本。其中淋巴结组织的留取过程相对复杂,由于术中无法判定其转移状态,因此需要配对留取,即半个留取半个送检病理诊断,诊断明确后再行归类保存。随着术前治疗及晚期胃癌化疗及靶向治疗的临床研究的不断发展,组织库应重视对治疗前后配对组织标本的留存工作。
3.血标本库:
主要收集、存储患者血清标本。患者在初治、治疗中、治疗后以及复发后等不同疾病阶段的血标本均有相当高的研究价值,因此,在留存血清标本时应重视其连续性。由于检测白细胞抗原对照组织标本的方法是鉴别疾病驱动基因的重要途径,因此,对精准医学研究其血液标本的质量将有更高的要求。
4.影像资料库:
主要收集、存储手术视频资料、特殊检查视频及影像资料。目前,手术治疗仍然是胃癌临床研究的热点,留存手术视频资料实现了对手术的研究从单纯文字描述到可视性分析的转化,进一步提高了研究数据的可信性。另一方面,完善的影像资料对学术推广与交流也有积极的推动作用。
(二)临床数据库应具备的特性
从上述临床数据库的组成和内容可以发现,临床数据库所提供的信息应为对个体特征、疾病特征和干预因素等方面的综合反映。精准医学的发展有赖于高质量的研究对象,因此,这些研究对象提供的数据信息应具备以下特征。
1.准确性:
对于数据的观察、判别、记录、输入、计算、转化和分析以及对标本和样本采集、加工、留存、提取等过程应遵守严格的标准化操作(SOP)规范,以保证数据是对客观事实全面且正确的反映。如参加临床试验的病例,临床监察员就需要对原始病历记录与EDC(临床电子数据采集系统)数据进行严格的比对和审核,其目的就是要确保进入数据库的信息的准确性。
2.通用性:
即对数据的描述及记录方法应该遵循规范的方法和格式,应简明易懂。随着精准医学时代的来临,医学大数据的区域乃至国际范围内的交流与整合已成为发展的趋势,因此,在设计及建立数据库的时候,需注重在原始数据的描述、归类、判别标准等问题上以及在对标本和样本的采集、留存、提取等过程中遵循国际医学规范的标准和要求。而对于判别标准常发生改变的原始数据,宜采用相对固定的描述方法进行记录,如分期中淋巴结分期的情况,直接记录转移淋巴结枚数将优于仅记录N1、N2的方式。
3.同时性及连续性:
即应及时记录所观察或产生的数据,而对于终点事件或特殊研究事件,如不良反应等问题的观察和记录,也应尽可能地及时发现、及时记录。此外,肿瘤从发生、发展至转归是一个连续变化的过程,因而,对病例的连续记录和随访观察以及必要的标本采集非常重要。
4.完整性:
作为高质量的研究数据,应尽可能全面地反映个体与疾病特征的联系,并尽可能为进一步研究提供更多的信息和资料。所以,对每一个病例应尽可能地在保障患者利益的前提下,按照数据库的组成规范,记录数据并留存标本和影像视频等研究资料。
5.临床数据库的伦理问题:
这也是医学数据库的特殊需求。目前,多数高等级期刊在投稿以及科研基金申请时均要求提供患者知情同意文件,这也包括使用了患者标本或患者病例资料的转化研究。因此,进入临床数据库拟成为研究对象的病例,必须书面征得患者的知情同意。
三、胃癌临床数据库的规范化管理
胃癌临床数据库的质量高低取决于每一条数据收录过程的高质量管理。因此,在数据量急剧增长的今天,必须建立一套完整的临床数据库管理规范。
如何保证数据库的质量,在临床研究中已经进行了很多探索,有部分经验完全可以复制和借鉴。但精准医学的发展与单个临床研究的实施,还是有很多不一样的地方。进行临床研究时,数据库的建设和管理是围绕特定的研究目的来开展,因此,某些在研究目的中不会涉及的内容可能会被忽视或者省略,导致这些病例对象在用于更深入的研究时会体现出不够全面的问题。特别是在精准医学研究中,某些可能目前被认为是无关轻重的因素,可能会成为区分疾病特征的关键,因此,临床数据库在设计之始就应该兼顾准确与全面两个原则。
临床数据库建设的基本要素包括硬件及软件两部分。硬件即包括工作环境、数据信息管理设备、标本存贮及相关实验设备等设施和器材。软件方面则为技术因素和人力因素,其中技术因素包括数据库信息管理平台系统,各项数据及标本、研究资料(如视频、影像资料)的采集、加工及存储的标准化操作流程等;而人力因素则是接受过专业培训的工作人员,其岗位职能划分应包括信息系统操作人员、实验室工作人员、质控人员和系统维护人员等,其基本要求是职责明确、责任到人。
(一)硬件的设置与管理
工作环境、数据信息管理设备、标本存贮及相关实验设备等设施和器材是比较容易达到的指标。一般来说,只要研究单位重视,都能较好地满足数据库建设的基本要求,如独立的实验室或资料室、专用的计算机及区域网络、低温冰箱、标本处置设备及器材等。而其管理与维护则是主要的工作内容,如这些设施的维护与检测、实验人员及管理人员的培训考核、日常的监察等工作,都需要制定明确的标准化规程进行指导和管理。
(二)软件的设置与管理
软件是整个数据库的核心,是保证临床数据质量的关键,其主要的组成环节为数据库信息管理平台以及规范化运行管理两大部分。
作为整个数据库核心的信息管理平台,是建设高质量数据库、特别是病例数据库的关键因素,目前常用的信息管理平台依据其数据分享模式可以分为两大类。
第一类,是单个研究中心自己建立的数据库。利用现有的计算机软件如EXCEL、ACCESS、SPSS等程序,由使用者根据自己的需求进行细节和功能的设置,而后成为数据库的主体,这类软件的优点为投入少、花费低,可以满足一般病例研究的需求。但由于数据库本身的设计明显受到研究者使用习惯或研究领域的影响,项目设置、事件判别和描述方式以及评价标准可能各有不同,因此,在进行数据共享时容易出现数据汇总和分析上的困难。
第二类,是多个研究中心可以共享的数据库。这是一类多中心临床试验项目经常会采用的数据库系统,这类数据库由同一研发者开发并交由不同研究中心使用,因此,在整体设计理念及项目设置上实现了规范统一,对于数据的描述、判别标准也非常一致,可以充分发挥其在研究中的优势,也是目前临床数据库发展的趋势。目前,精准医学发展的方向——大数据库,其本质上是多中心共享数据库的延伸和发展,但多中心数据库是由数个研究中心自发组建,多通过协议的合作形式进行数据交换,是目前区域合作最常见的方式。大数据库则更多地由官方协会、学术团体以及其他商业中介平台组织并负责管理,如国内的AME公司就在积极推动大数据在中国的发展。大数据库之所以可以成为精准医学发展的重要依靠,最主要的原因就是其无限接近总体的巨大样本量,而且,对于大数据的发展,其数据信息的广泛性也为医学研究的发展提供了更多的有力条件。美国癌症研究所于年建立的SEER数据库,收集了全美近40年来肿瘤的发病率、病死率等数据,就是基于SEERSTAT软件的基础上研发的肿瘤登记信息平台,该信息系统信息量大,瘤种多样,并可以通过网页进行开放式检索,尽管其在数据质量上仍存在很多问题,但不可否认的是,它为肿瘤的研究工作开拓了非常广阔的平台。
(三)规范化管理内容
肿瘤临床数据库的规范化管理对于数据库的质量与发展的价值是不言而喻的。规范化管理主要包括3个方面,即标准化操作(standardoperationprocedure,SOP)、质量控制与权限管理。
1.标准化操作:
是针对临床数据库人为主观行为制定的规范性指引。包括操作标准化以及管理程序标准化两个部分。操作标准化是指进入数据库的信息在其观察、判别、描述、记录及标本等研究资料在采集、加工、分类、储存和提取等环节中须由固定人员严格按照固定流程进行操作。管理程序标准化则是指在数据库使用、维护、质量控制和监察等方面的规范程序及职责要求。
2.质量管理:
即对数据库各方面内容包括数据质量、标准化操作执行情况以及监察和权限使用情况的综合管理。主要由数据库负责人组织专家组或专职的临床研究监察人员对数据库运行情况的细节进行监察,包括原始记录、信息判别与描述标准、专人专职标准化操作的执行、研究设备的工作状况和数据使用情况等问题进行全面的检查,检查情况应以书面报告的形式公布,并通知具体责任人进行修正或整改。本中心胃癌临床数据库每月由数据库负责人进行质量监察,每季度由专家组进行检查。
3.权限管理:
是数据库安全的核心保障。数据库作为珍贵的研究资源,是全体研究团队成员共有的财富。然而,缺乏安全措施的数据库系统既无法保障团队的研究利益、也不能保障数据库的整体质量。因此,作为系统设置的安全规则,权限管理就十分重要了。权限管理依据成员的级别、职责及对数据库的贡献大小,给每位成员设置明确的权限范围,规定其可以使用的系统功能及资源,而使用流程同样是按照标准化操作执行。如本中心需使用胃癌临床数据库开展研究时,需先提交研究方案使用计划,依据所使用的数据级别的不同,由不同的权限授予人或专家组讨论通过后方能使用。由于不同病例的数据质量及完整性不同,导致其研究价值差异明显,如参加临床试验的病例,特别是其中四库资料完善者,其细节明确、随访及时、资料齐全的优势均为研究工作奠定了良好的基础。因此,我们对数据库的数据资料进行级别划分,不但避免了研究资源的浪费,也极大地促进了团队成员建设发展数据库的积极性,在实践中取得了良好的效果。
数据库的建设及管理是医学研究成败的关键,需要根据自身的实际情况进行规划和调整。从当前的研究项目着手建设,再向更宽广的领域延伸,不但可以获得较高的起点,还能大大地缩短数据库发展的时间,并获得更多的研究成果。
四、精准医学大数据时代临床数据库的发展
高质量的肿瘤临床数据库为肿瘤研究奠定了坚实的基础,但一个团队乃至一个研究中心的能力和资源都是有限的,而自肿瘤研究进入精准医学时代之后,医学研究的整体方向也从粗放型向集约型转化,即在更窄的范围内解决更深入的问题。因此,这种细致的划分方法将对个体研究者手中研究资源的使用价值产生影响,出现种类多了、数量反而少了的情况,而目前肿瘤研究的整体模式仍然对病例的数量有很大的依赖性。因此,区域乃至国际多中心数据共享乃至大数据化,就成为肿瘤研究发展的重要方向。
多中心临床试验已为人所熟悉,这种由不同研究者依据同一标准开展合作研究的方法得到现代循证医学的充分认同,其研究成果也成为深刻影响肿瘤诊治理念和标准的各种指南和规范。就本质而言,多中心临床试验是数据共享的具体形式之一,也为肿瘤研究的大数据时代开启了探索之路。不同的是,临床试验多围绕特定的研究目的进行设计和规划,其数据资料主要为该研究服务。因此,在数据的全面性上可能存在一定的狭隘性。但其数据的真实性、准确性、连续性以及在数据库建设和管理等方面的模式却值得借鉴。在此基础上,实现区域及国际性多中心数据库共享,其优势是显而易见的。
相对于数据库共享,大数据化所面临的问题更加复杂。由于大数据自身的特点,大数据化的数据存储、分析、转换、集成等方式均与目前传统的数据处理模式有所不同,其中包括节点分割数据存贮和分析以及平台构建方法等复杂的技术问题。本文在此不作深入探讨。而大数据时代对于医疗及医学研究工作的影响是深刻的,其对疾病的早期发现和控制、医学研究的开展和患者的招募、基因组分析、流行性疾病的检测和控制、循证医学的发展以及患者个人资料的管理和各种疾病模型的建立和给予治疗指导等,都有极大的价值,这些都是推动精准医学发展的重要条件。
作为个体研究者,应始终坚持高质量的数据库建设标准和严格的规范化管理流程,保证数据的准确性、通用性、连续性、完整性以及完全符合伦理学的要求,这样才能更好地为肿瘤临床数据库共享乃至大数据化奠定良好的基础。此外,数据库共享至大数据化还应有完善的合作协议及管理实施规范,才能最大程度地保障数据的质量与安全以及研究者的利益。
本研究中心在胃癌领域的区域及国际数据库共享的工作正处于起步阶段,目前已与美国哈佛大学医学院、香港科技大学、福建医院、中国医院、医院等5所研究单位达成协议,并逐步开展数据库共享与合作研究等工作。临床数据库的发展也需要更多的思考与探索,期待国内同道携手为推动胃癌精准医学的发展进行更多的交流与合作。
参考文献(略)
赞赏
长按向我转账
受苹果公司新规定影响,iOS版的赞赏功能被关闭,可通过转账支持。
2018治疗白癜风最好的药哪里有卖北京专治白癜风的医院