中欧预见论坛:用数据和人工智能辅助癌症诊疗

2017-09-20 23:14 来源:丁香园
字体大小
- | +

我们探寻的是生命的长度,「我能活多久?」可以说这是我们从儿童时代就开始非常好奇的一个问题。

2.png

跨越物种,看生命的长度

从这张图来看,把视野拓展到整个地球的生物,从最左上角朝生夕死的果蝇,到只有一年生命的蜻蜓,一直往下在 80 岁的预期寿命中终于找到了人类。再往后,能真正活到 150 岁的生物是陆地巨龟。那么除了投胎当陆地巨龟以外,是否还办法在有生之年,通过努力让人类拥有更长的预期寿命?

为延长预期寿命,第一关考虑攻克癌症。有数据显示,如果能够彻底征服癌症,人类的预期寿命将突破 100 岁。

在过去的几十年时间里,人类分别尝试手术、放疗、化疗三大治疗方案来攻克癌症,但依然收效甚微,反而在治疗过程中给患者带来了超过癌症本身的巨大伤害。那么进入信息技术如此发达的今天,有没有新的技术和能力去攻克癌症呢?

攻克癌症最有力的武器:数据与人工智能

当医疗大数据和人工智能结合的时候,我们发现真的有机会从三个角度来攻克癌症。

角度一:提升癌症诊疗质量,让每一位患者享有普惠、精准的医疗资源

WechatIMG17.jpeg

肿瘤就诊患者迁移图

2016 年,零氪科技发布了「中国首例肿瘤患者迁徙图」,这是通过肿瘤大数据,第一次在中国地图上俯瞰我国几十万肿瘤患者的就诊迁徙路线——几十万、上百万的肿瘤病人,从生活的家乡到他们所在的省城,甚至北上广去寻求治疗的就诊路线图。

患者不远千里,只为了寻得一个更好的治疗方案。由于区域间医疗资源的不均衡,导致同一种疾病在不同医院、不同医生那里得到的诊疗结果会有「天壤之别」。

如果把这个场景拆开来看,当一个患者找到一个医生时,医生往往会根据自己从业经验所积累的案例帮他做出诊断,而治疗的时候,只能局限于这个医院所拥有的诊疗设备和治疗能力。所以这种基于经验的医学和诊疗,患者的最佳选择是什么?

这种经验积累远远赶不上患者的需求。设想一下,如果全国上千个专科医生所产生的几万甚至几十万患者病历,和最后患者的治疗结局都能够聚集在一起,来帮助一个专科医生做出更准确的决策,医生的能力和经验都会更快速地提升,最终获益的是患者,将得到更准确的诊断结果和更适合的治疗方案。

期望通过广泛、海量的医疗数据和先进的人工智能技术来提升癌症的诊疗。

 角度二:撬动海量数据提升药物研发/评价效率,挽救更多患者的生命

2016 年,全球癌症用药之王——某肿瘤制药企业公布的一份研究报告显示:一种药品从上市前研究到上市后的成长期,再到药品成熟期的整个过程,企业都需要大量的数据来支撑其对药品的研发和评价。

WechatIMG18.jpeg

真实世界数据研究报告

但是面对药企如此「饥渴」的数据需求,北美肿瘤协会(ASCO)公布的一项研究结果却令人唏嘘不已:在北美这个全球范围内肿瘤患者和临床试验最多的地区,每 170 万新发肿瘤患者的临床病例数据,却只有 3% 被纳入到了临床试验,也就是被用于药品研发中,其余 97% 的数据都埋在了医院的 HIS 系统和病历档案室里,也许终身都得不到使用。

所以,如果能撬动海量的「沉睡」的医疗数据,来加速新药研发和上市后药品的再评价,就可以使更多的患者及早用上抗肿瘤新药,从而挽救更多的生命。

角度三:融合医疗数据与基因数据,彻底破解癌症的致病机理,攻克癌症。

癌症是基因导致的疾病,以最常见、最高发的肺癌为代表,其中有一种肺癌叫做非小细胞肺癌,它有一种分支的致病基因是 EGFR 基因,与这个基因交相呼应的还有几十种、上百种辅助基因。就是对肺癌分型中某一分支的基因突变的研究,人类就花费了 40 年的时间,但目前为止研究出来的靶向药也只是对占全球百分之十几的肺癌患者人群有效,有效控制也只能维持在 1-2 年,因为两年之后,如果 EGFR 基因再发生变异而产生耐药,那时或许又将无所适从。

如果能获得患者所有的基因数据,再加上临床诊疗数据、院外随访数据,就有机会彻底破解癌症机制,解读「基因密码」,让肿瘤从根本上得到解决和治疗。

解决医疗数据的稀缺:激活且链接数据

既然人人都关注医疗数据,为什么到现在为止医疗数据还那么稀缺呢?

首先是患者多,一个医生团队一年有可能治疗 6000-8000 位病人,已经没有时间再去处理这 6000-8000 例厚厚的病历,并且把它们变成可用的数据。

其次医院系统里写的病历,写的是人字、说的是人话,在没有进行有效的结构化之前,机器是无法处理其中的数据的。病历在没有进行有效的结构化之前,机器是无法处理其中的数据的。

第三是患者治疗之后就像断了线的风筝不知所踪,医生再不知道患者的治疗情况怎么样。失去结局,又如何评价这些治疗方案呢?

第四是行业数据不标准。协和、北医……毕业院校不同,从接受临床教育和进入临床实践之初,写病历的方式存在差异,不同医院的数据协作非常困难。

第五,医疗数据不同于其他交通数据、金融数据等,涉及到患者的隐私,在有效调动使用这些医疗数据的同时,不能侵害到任何一位患者个体的隐私。

数据「智」理:每年使近 2 万病人的生命延长 8-10 个月

在零氪科技成立之初希望能够从病历录入和数据结构化处理入手。每一个患者在进行诊疗时,通常会有门诊和住院这两种病历,其实这些病历中包含了十几个标准的模块,而每个模块中又含有几十个到上百个不同点位,因此每一个患者的每一份完整的病历都可以通过处理,形成一份科研级的数据。

WechatIMG19.jpeg

为了达成这个非常有挑战的使命,2014 年底开始零氪研发出一套人与机器协作的结构化引擎——Dress 系统,并和北美的肿瘤医学院 Fred Hutchinson 合作,把它的核心算法投递到了北美的医学信息学期刊《BioMed Central》。

基于这个研究成果,截止 2016 年底累计处理近百万份的病历数据。应用人工智能技术,用几十万份经过医生标注和质量审核的病历数据,并训练人工智能机器人——Fellow-X,在「吃」进去几十万份病例之后,「它」能够读懂湘雅、华西、北医、协和等不同医院的肿瘤医生所写的病历。

借助这两项核心技术,从 2015 年只能有限地帮助两家医院一天处理 200 页病历,到 2017 年 1 月,能够帮助 400 家三甲医院,每天处理 45 万页病历。在 26 个月内,业务量增长了 2000 多倍。 并和 30 个省市的 400 家医院建立了合作,另外托管和服务了 20 多项国家重点专项课题。随访中心正在管理超过 40 万的真实生存的肿瘤病人,收集他们的生存数据。此外,「肺癌辅助诊断模块」,可以避免由于误判而导致肺癌病人提前 8-10 个月复发,每年能让近 2 万病人的生命延长 8-10 个月。

WechatIMG20.jpeg


汇聚 160 万患者的数据 丈量生命的长度

最后,回到做这件事的初衷。我父亲是一位资深的国内肺癌手术专家,他科室的电脑,记录着这个科室 20 年时间里治疗的 8000 个肺癌、食管癌患者的数据资料。所有的记录仅仅是一张 Excel 表格。如果让珍贵的诊疗数据最后以这样的形式留存,且一直躺在电脑里不去发掘利用,无疑是让人痛心的。

零氪科技用两年多时间汇聚了 160 万份肿瘤病人的医疗数据,规模达到全球第一。把 160 万例患者的治疗经验汇聚到一起,帮助中国每一个新的癌症患者和医生找到最适合的治疗方案。

本文整理自中欧北京(CEIBSBeijing)零氪科技 CEO 张天泽演讲。



编辑: 徐上

版权声明

本网站所有注明“来源:丁香园”的文字、图片和音视频资料,版权均属于丁香园所有,非经授权,任何媒体、网站或个人不得转载,授权转载时须注明“来源:丁香园”。本网所有转载文章系出于传递更多信息之目的,且明确注明来源和作者,不希望被转载的媒体或个人可与我们联系,我们将立即进行删除处理。

网友评论