作者:李惠钰 来源: 中国科学报 发布时间:2020-10-26
选择字号:
深挖医药健康大数据“宝藏”

 

■本报记者 李惠钰

人类历史的每一次挫折都孕育着进步的可能。SARS催生了电子商务等数字产业的发展,新冠肺炎疫情则推动新一轮数字化变革。

在医药健康领域,数据如同金子一样宝贵,但受限于“信息孤岛”,这些“散落的宝藏”很难被挖掘和共享。

不久前,中关村医药健康大数据交易平台在京成立,通过这个平台,“信息孤岛”有望被打通,从而进一步实现医院、药厂、科研机构等的数据有效流通。作为该平台共建方之一,中关村生命科学园还将为其提供典型应用的落地场所。

今年是中关村生命科学园成立20周年。近日,在其联合北京市大数据中心主办的“2020全球医药健康大数据峰会”上,如何依托大数据、人工智能以及区块链等新技术基础设施对传统医药健康行业进行“全要素”和“全流程”改造,成为与会专家热议的焦点。

井喷的数据

今年的新冠肺炎疫情是我国近年来面临的最严重公共卫生事件。在应对疫情的过程中,大数据成为一种有力的技术手段。专家也挖掘出大数据和大数据分析平台的各种用途,如智能城市的监测、接触者追踪和疫苗开发等。

在应对疫情的整个过程中,接触者追踪已经成为一种被普遍接受的数字解决方案。一旦有人核酸检测结果呈阳性,其每个接触者就会收到提醒信息。这些数据不仅可以识别潜在的病毒携带者,还可识别高感染率地区,从而帮助各国政府采取针对特定地区的措施。

中国疾病预防控制中心全球公共卫生中心副主任戚晓鹏表示,通过收集各个领域重要的真实数据,再通过一些机器学习的方法对危险因素进行综合分析,就能改进整个SEIR(S代表易感者、E代表潜伏者、I代表感染者、R代表康复人群)传播动力学模型。

实际上,除了疫情期间收集的大数据,医药健康领域收集的医院内外数据早已呈井喷态势。以生物医药大数据为例,包括生物医药研发数据、临床医学服务数据、健康医疗相关产业数据三大方面。比如电子病历、基因数据、影像数据以及可穿戴设备产生的日常行为数据等。

据了解,一张X光片的数据量就达几十MB,一个CT可达100MB,一个标准病理图接近5GB,以国内医院数量约3万家计算,每年增长的数据总量将达到60PB~1EB。各影像数据不仅需要保存至少30年,而且还需要具有冗余保护机制和数据备份机制,从而对抗计算机病毒等攻击。

而在疫苗开发领域,人工智能和大数据平台的结合,也明显提高了数据挖掘的能力,从而识别已经获得官方批准、用于治疗类似病毒的药物,同时还可以帮助识别新的药物分子,利用数据库帮助科学家更快地开发疫苗。

此外,以数字化技术为基础的真实世界研究,还可以从大数据中挖掘有价值的生物标志物,帮助药品进一步锁定有效目标人群,从而提高药品治疗有效率。

面临的障碍

实际上,医药健康大数据是一个跨领域、高增长的新型产业,涉及的领域十分复杂,数据极难标准化,这也是该产业面临的主要障碍之一。

“中国的信息化厂商至少有1000家,各自的规范千差万别。仅从命名来看,一堆字母就像天书,如果没有规范,根本不知道它是什么。医生的写法也是千差万别,光糖尿病的诊断名称写法至少就有200种左右。”阿里健康集团智慧医疗大数据运营总监裴云飞说。

个体差异大、医疗疾病种类繁多,复合疾病常见,关系复杂,医学检查、治疗、诊断不断发展,新的疾病不断产生和变化,个人信息缺乏、信息不对称等,这些因素都导致医药健康大数据很难标准化,进而产生了“信息孤岛”。

在上海有孚网络股份有限公司执行副总裁吕鑫看来,这些快速增长且庞大的数据背后,数据管理、计算分析、数据传输、安全合规都存在很大问题。例如,数据存储成本过高、查找效率较低,计算需求峰谷明显、流程迁移难,传输效率低、数据共享难,安全加固系统部署复杂、数据可控性差、数据加密难等。

更需关注的是,由于公共卫生投入不一定有直接效益,导致该领域并不受重视。对此,戚晓鹏指出,公共卫生领域实际上可以产生一些间接效益。她呼吁大数据公司和学者能够更关注这一领域大数据的应用,尤其是预防医学,一些大的预测监测分析都能够向该领域倾斜。

此外,用户隐私也是医药健康大数据绕不开的话题,如何通过一些新的技术手段,在保证用户隐私与充分释放数据红利达到一个平衡,也是业内必须面对的问题。

平台的构建

为了让医药健康大数据更好地下沉落地、展开应用,中关村医药健康大数据交易平台将以大数据、医疗健康两大战略性新兴产业突破为核心,探索延伸医疗健康智能化应用场景。

“平台交易打通了数据孤岛,构建了开放的技术架构,基于区块链的智能合约为多方协作带来便利,并使得交易技术服务化。”清华大学北京信息科学与技术国家研究中心研究员尹浩介绍说。未来,该交易平台还将汇聚医疗、软件系统开发、硬件设备研发制造、科研机构等全链条产业要素,推动全国乃至全球医药健康行业的新发展。

在该平台的运营机制中,北京市大数据中心主导数据管理与交易监管;中关村科学城管委会进行特色引领创新平台;中国技术交易所负责交易系统与流程的管理;清华大学信息科学与技术国家研究中心负责核心技术与区块链平台的维护;中关村生命科学园则提供典型应用的落地场所。此外,北京市经济和信息化局对平台进行政策和产业引导。

北京市大数据中心副主任石志国表示,北京大数据中心提供了大量“新基建”下的数据资产,同时在这一基础上构建同政务大数据应用和医药健康相关的应用,为企业提供各种各样的服务。

“我们想构建基于主流大企业的一个生态项目,以阿里健康、腾讯医疗和百度健康等医疗集团,拉动整个北京地区医疗健康大数据相关生态方面的建设。在大企业基础上,构建中小企业的创新层,打造一种中小企业百花齐放的创新局面。”石志国说。

《中国科学报》 (2020-10-26 第3版 医药健康)
 
 打印  发E-mail给: 
    
 
相关新闻 相关论文

图片新闻
银河系发现巨大黑洞 史上最亮伽马射线暴来自一颗坍缩的恒星
中国天眼揭秘宇宙“随机烟花” 导师:年年审毕业论文,总有这些问题!
>>更多
 
一周新闻排行 一周新闻评论排行
 
编辑部推荐博文