当今时代,大数据已成为引领各行各业变革的关键引擎,智慧医疗将是医疗领域、医学工程与计算机信息技术等学科的跨界融合。
医疗大数据的发展不仅是医疗行业的转型升级,更是国家重要的基础性战略资源,正在加速成为新一代新型技术和新型健康医疗服务业态。
然而,大数据进军医疗领域建立“根据地”还需打破诸多壁垒。近日,众多全球医药健康和大数据专家汇聚2020中关村论坛全球医药健康大数据平行论坛,共探大数据应如何“突围”医疗健康蓝海,助力我国重大疾病防控。
中国工程院院士、清华大学信息科学技术学院院长戴琼海表示:“2016年- 2018年,医疗健康数据增长率超过800%,增长速度快于其他任何行业数据,这也导致医学数据总量大、种类繁多、规模庞大,对爆炸式增长的医疗数据进行分析是当下最重要的研究课题。”
夯实“标准”基座 确保源头精准
东华医为科技有限公司董事长韩士斌表示:“通过近25年从事医疗大数据行业的经历来看,当前医疗大数据主要存在两类问题,一是源头数据没有标准化,诊断信息在医疗过程中没有被精准地录入系统,二是医疗过程中众多数据丢失。”
韩士斌通过现场分析一例脱敏病例指出,该病患的最后一次诊断信息丢失了心律失常和乙肝两个重要信息,通过分析病例发现医生在填写病例时存在随意填写数据的行为,“乙肝作为一种长期的慢性病,如果在漫长的治疗过程中没有被精准表达,基于这样的大数据研究质量肯定会大打折扣,还会产生医疗风险。”
很多医院管理者为此抱怨信息化建设“投入很多,见效甚微”。韩士斌解释道:“虽然医院在信息化方面投入很多,但整个医疗服务过程中有很多生产要素,有关医疗数据方面的投入较少是造成成果不佳的重要原因。”
为此,韩士斌团队从“感知与记忆、学习与思维、决策与应变”三个维度构建智慧医院的IT系统,该系统标注了30多类医疗用语,能自动提醒医院补录患者诊断信息,使用知识图谱来驱动全闭环临床用药的安全监控,并围绕诊断信息提供患者精准画像等。
“医疗大数据行业不像‘AlphaGo下围棋’那么简单,是非常复杂的系统,没有人力的投入和底层数据的表达标识,再好的技术也无法实现医疗大数据的真正落地。” 韩士斌感言。
传统的中医和现代化的大数据能否结合?北京泰济堂中医医院总院长张克镇的答案是肯定的,“中医发展至今,中药的总量已经达到了8400多种。实际上,中医的发展从未离开数据,可以说是大数据的积累过程。“
但是,在张克镇看来,大数据在中医领域的应用还存在很多问题,“一是中医的文字记载没有数字化,也没有进入信息化平台;二是中医数据化还面临理论屏障,因为现代医学和传统中医是两套理论体系,而大数据多是基于现代化的西医系统所建立。”
对此,张克镇认为:“首先要解决数据理论问题,打通平台障碍,制定相应标准。此外,中医的因果思维和预防思维等逻辑关系应一并纳入现代大数据平台,中医大数据将为医疗健康数据平台提供重要服务,并对人类大健康起到质的提升的作用。”
“互联网真正落地医院实际上是比较困难的,思考如何从顶层设计大数据,到运用大数据提高临床诊疗规范,再到回归客观疾病诊治本身是非常重要的。” 中国工程院院士、北京大学第三医院院长乔杰表示,“对于海量数据,要将管理与大数据相结合,建立从利用层到服务应用层,以及集成交叉、业务数据操作层的标准化体系,同时进行大数据存储,并加强数据的安全性。”
完善分享机制 严守隐私“领土”
大数据支撑医药健康领域发展的同时,还涉及大量数据隐私保护方面的问题,如何做好数据隐私的“守门人”成为一大挑战。
中电长城网际系统应用公司副经理张兴表示:“医疗健康数据不仅涉及个人隐私,还涉及国家秘密、国家安全,这些数据应该给予保护,但也面临巨大的挑战。加密、区块链等技术可以应用于医疗信息个人隐私保护及大规模医疗健康大数据的保护。”
为此,张兴团队开发了数据保险仓技术,通过数据保险仓采集各种各样的数据后,再对数据进行分析,对分析之后且通过隐私保护策略和安全策略审计的数据才能发送出去。
张兴举例道:“以所开展的疫情数据分析为例,可以在网上公布的有30多个数据模型,对于不适合公布的40多个模型,通过决策分析,既可以挖掘利用数据,又可以保护数据隐私。”
翼方健数联合创始人罗震认为:“医疗健康大数据拥有巨大价值的同时还需要保护数据安全。但是,传统的医疗数据共享和开放往往是原始数据的共享和开放,也就是说其中一个人把他的数据复制给另一个人。这种数据分享方式存在安全合规、隐私保护等诸多问题。”
对此,罗震指出:“数据在分享或者应用开放的过程中,应该是数据价值的分享,而不是原始数据的拷贝。”
“具体而言,可以采用隐私计算的理念,这个计算包含两层含义:一是底层安全计算的协议,根据不同的假设可以采用多方安全计算、同台加密、联邦学习等不同的安全计算方式;二是具体应用,分享前预判建立AI模型还是开展医学统计,最后将两者相结合来计算数据价值,而不是直接分享原始数据。”罗震解释道。
第四范式技术有限公司副总裁涂威威表示:“新冠疫情期间,在协助政府部门对整个疾病进行传播溯源和路径分析外,还结合相关部门的大数据,利用隐私保护的一些计算方式,把传统密切接触者的一些模型,从原来5.8%的准确率提升至93%,对疫情防控起到了很大作用。”‘
打通数据孤岛 助力精准抗疫
“医疗卫生行业的核心就是为患者提供产品或者服务,医工结合不仅是经费导向,也是重要的科研机遇,有重大科技创新导向。”国家健康保障重大工程专家组专家黄安鹏表示。
回顾大数据助力抗击新冠疫情的过程,罗震思考道:“如果再次面临突发传染病等公共卫生事件,能否通过大数据等方式,打通数据孤岛,实现更早更准确地预报疫情。”
对此,罗震团队正与相关部门共同研发“多点触发疫情报警系统”,通过利用城市区域数据、线上药店数据、百度搜索数据、气象数据等,把不同模态数据和不同来源数据相结合,根据历史数据进行拟合,“当再次面临类似疫情时,我们或许能更早地发现。”
对于疫情常态化的发展,涂威威认为打通数据孤岛尤为重要,“要进行跨部门数据融合,结合人工智能预测疫情趋势,辅助医疗决策和药物研发。其中,更重要的是要进一步扩大医疗资源供给侧,更好地进行医疗资源配置和辅助医疗研究及药物生产。”
实际上,在清华大学教授尹浩看来,“数据交易过程的本身就是各种数据孤岛打通和数据真实性溯源的过程。”
对此,张克镇表示:“要实现大数据对中医的应用也需要打通数据孤岛。在古代,中医以个体行医为主,每个医生将自己的经验记载下来,或者传授给后代,甚至有些医生会保守不外传。此外,中医发展至今形成了诸多流派,各个流派之间的交流相对较少,这也形成一些数据孤岛。因此,将珍贵的中医经验为现代医学所用则非常困难。”
此外,张克镇还指出:“垃圾数据、错误数据、无用数据、数据垄断等问题也需要在医疗大数据平台中解决。”
“人工智能等信息技术将引领医疗变革,对海量数据的处理可以运用云计算、5G通信、物联网、区块链、人工智能算法,大数据清洗、影像数据分析等硬件、软件、算法等方面的技术,从人力、效率、规模等方面实现更便捷、更精准、更多元的功能。”戴琼海说。
版权声明:凡本网注明“来源:中国科学报、科学网、科学新闻杂志”的所有作品,网站转载,请在正文上方注明来源和作者,且不得对内容作实质性改动;微信公众号、头条号等新媒体平台,转载请联系授权。邮箱:shouquan@stimes.cn。