“AI大模型显著增强了复杂数据处理、多模态数据融合和疾病风险预测能力,并展示了其在传染病预警和慢性病风险评估和精准干预中的实际应用。”
在2025中国整合肿瘤学大会上,中国工程院院士、中国抗癌协会副理事长沈洪兵发表了《人工智能大模型与流行病学研究》主旨报告。
报告探讨了AI大模型技术为流行病学研究带来的机遇,阐述了其在健康医疗大数据整合、疾病病因探索及风险预测中的应用前景与挑战。
沈洪兵强调,在AI大模型应用于流行病学研究时需关注数据质量、数据共享、模型可解释性和伦理等问题,并呼吁制定相关指南规范,推动成果转化。
应用突破:多场景解锁流行病学研究新范式
沈洪兵指出,AI大模型凭借复杂数据处理、多模态数据融合及高精度风险预测三大核心能力,已在传染病防控与慢性病管理领域实现关键突破。
在传染病预警方面,传统监测依赖卫生系统上报数据存在滞后性,而AI大模型通过多源数据智能化采集和分析可显著提升预警效率,实现实时抓取关键数据、及时分析预警的效能提升,同时追踪并预警病原体变异和免疫逃逸、致病力等关键信息。
在慢性病研究领域,AI大模型的多模态数据整合能力展现显著优势。沈洪兵强调,基于电子健康档案等多源数据训练的AI模型,在疾病风险评估中已展现精准性优势。
例如在肿瘤研究中,多模态视觉大语言模型通过CT影像分析,可实现肺结节良恶性分类、非小细胞肺癌预后预测等任务,且能动态监测结节变化趋势,性能优于传统算法。
核心挑战:数据、可解释性与伦理的三重考验
尽管应用前景广阔,沈洪兵明确指出AI大模型在流行病学应用中仍面临三大核心挑战。
数据质量与代表性首当其冲,我国健康医疗大数据分散在不同机构,存在“数据孤岛”问题,且各机构数据标准不一,多源数据在格式、质量等方面存在差异,导致模型训练数据质量和代表性不足,进一步影响模型效能。
模型可解释性不足,成为临床转化的关键瓶颈。沈洪兵强调,当前多数大模型的构建仍属于“黑箱”系统,即便通过可视化方法解析,其内部决策机制和过程仍难以完全阐明,这与流行病学研究对因果推断的严谨性要求存在差距。
伦理风险同样不容忽视,个体健康数据隐私保护、风险预测结果可能引发的数据安全、就业或保险歧视,以及算法公平性等问题,均需建立完善的监管框架。
发展路径:指南规范与技术创新双轮驱动
针对上述挑战,沈洪兵提出“数据筑基、规范引领、技术突破”的三维发展策略。
数据层面,需推动高质量健康医疗大数据整合共享,通过建立统一标准实现电子健康档案、影像数据、组学数据的多维数据整合和跨机构互通共享,同时强化数据脱敏技术应用以平衡利用与数据安全和隐私保护。
规范建设方面,沈洪兵呼吁加快制定AI流行病学应用指南,参考《中国肿瘤整合诊治指南》(CACA指南)等的推广经验,明确数据采集标准、模型验证流程及转化应用规范和标准。
技术创新层面,应重点攻关流行病学因果推断算法与可解释性模型技术,开发疾控领域垂直大模型体系,同时加强“AI+流行病学”复合型人才培养,构建医研协同创新平台。
沈洪兵强调,AI大模型为流行病学研究带来的不仅是技术革新,更是从“被动响应”向“主动防控”的范式转变。通过规范引导与技术突破,有望推动传染病预警和慢性病防控等公共卫生领域实现精准化、智能化升级,为健康中国建设提供核心技术支撑。
版权声明:凡本网注明“来源:中国科学报、科学网、科学新闻杂志”的所有作品,网站转载,请在正文上方注明来源和作者,且不得对内容作实质性改动;微信公众号、头条号等新媒体平台,转载请联系授权。邮箱:shouquan@stimes.cn。