“为什么(AI医疗产品或模型)一直在发布,临床却总是不应用?这是一个非常重要的问题。”
日前,在2025瑞金医院RuiPath病理模型开源及成果发布会上,中国工程院院士、上海交通大学医学院附属瑞金医院(以下简称“瑞金医院”)院长宁光一开场,就直指AI+医疗落地的“病灶”。
这也就有了此次发布会的主题:将模型成果开源。
不久前,瑞金医院携手华为,打造了瑞金RuiPath病理大模型。医生在RuiPath的帮助下,能够在几秒钟内完成一张全视野病理切片的诊断,效率大大提升,可诊断癌症类型覆盖中国每年癌症发病人数90%的19个常见癌种。
这样的能力,他们希望能全国推广——我国注册病理医生不足两万人,面临着至少14万的缺口;且大多数病理医生集中于大城市(80%)和三甲医院(70%),基层医院病理诊断能力缺失。
瑞金医院与华为决定开源RuiPath病理模型。他们希望通过开源共享共建,让RuiPath病理模型在中国实现真正的临床可及。
“AI走到今天,走向真正临床应用,这是我们要跨出的非常重要的一步。”宁光说。
用华为医疗卫生军团总裁张伟力的话说,这是长期主义和实用主义的成果。他告诉记者,在跨出开源这一步前,华为和瑞金医院已经通过务实合作,携手走过了3年。
RuiPath视觉基础模型开源启动仪式。瑞金医院供图
?
一次“精心策划的技术革命”
文章开头宁光院士的发问,直指行业痛点——AI在医疗领域的应用喊了很多年,很多厂家也做了大大小小的许多模型,动辄是“超越人类水平”的标题,甚至顶刊论文也层出不穷,但在真实的医院场景中,真正能大规模、全流程地用到临床的AI仍旧凤毛麟角。
对于上述“宁光之问”,张伟力有切身的体会。
“AI时代三要素:数据、算法、算力,但是要真正将AI应用于医疗,光有这些是不够的。”张伟力说,AI要真正从实验室走向临床、在医疗等领域实现行业化落地,首先要打破“认知鸿沟”。
“就拿华为和瑞金医院来讲,华为公司有大量的AI科学家,但是他们不懂临床的真实痛点和复杂流程;瑞金医院大量的医学专家,不了解AI的能力边界和实现路径。如果没有了解和磨合,双方就是‘鸡同鸭讲’,医院需求和技术方案无法匹配。”张伟力说。
为了打破认知鸿沟,华为和瑞金医院“双向奔赴”。
“我们的AI专家深入科室,理解病理医生从切片制作、阅片、诊断到报告的全流程;医学专家也将几十年的临床知识、诊断逻辑和病理诊断全流程告诉AI专家,从而将宝贵经验沉淀为AI可以理解的语言。”张伟力介绍说,两股力量的团队“天天泡在一起”,不断创新技术、改进方案,最终设计出数据方案和算法模型。
双方团队展开交流。 华为存储 供图
?
瑞金医院病理科主任王朝夫分享说,RuiPath病理大模型结合了AI、大数据和计算病理学的最新成果,覆盖了疾病诊断的全生命周期,贯穿病理诊断全流程。在该模型的辅助下,病理科医生不必在显微镜头下逐个寻找病灶,只需以互动方式审核AI诊断结果,几秒钟内就能精准识别出病理切片中的病灶区域、完成解读,显著提升了诊断效率和质量。
据介绍,RuiPath病理大模型在业界12个主流公开数据集的14个下游任务测试中,有7个达到业界领先水平,并已具备临床验证能力。
“这样的方案和模型,是真正‘从临床中来,到临床中去’的。”张伟力对记者说道,从3年前协助瑞金医院开展数字化病理相关工作,到今天开源RuiPath病理模型,过程中双方踏平了模型从开发到落地应用最难走的一段路,“可以说这是一次精心策划的技术革命”。
数据准备,一步一个脚印
3年来,双方在“数据准备”工作上下的工夫最大。
RuiPath病理大模型的诞生,离不开高质量数字化病理数据的“滋养”。然而,在数据准备阶段,即便是病理切片图像数据有着丰厚“家底”的瑞金医院,也面临着图像数据量大、格式不统一、数据标注耗时长等问题,数据预处理工作无从下手。
“数字化是智慧化的基础,”瑞金医院病理科副主任医师笪倩分享说,“数字切片(WSI)图像格式不统一却极大地阻碍了计算病理学的发展。”
2023年起,在中华医学会病理学分会指导下,华为团队开始在瑞金医院应用统一的数字病理格式(CSP)格式,将繁杂的病理切片图像格式统一,为数据标注和模型训练做好准备。
不过,他们还面临一个棘手难题:一张全视野数字切片(WSI)图像的大小跟一部高清电影差不多(GB级)。瑞金医院拥有上百万张数字切片,他们面对的是PB级数据的快速访问、标注处理。
难题抛给了由华为“天才少年”、软件工程师王帅带领的平均年龄不足29岁的技术团队。
王帅说,在PB级的数字病理切片面前,传统的人工标注如同“用吸管来疏通堰塞湖”,效率太低;但如果不做好标注和优化,后续的训练和推理,就意味着巨大的算力消耗。
“这样的AI注定只是一个奢侈品,没有办法普惠大众。”王帅带领团队决定革新数据工程手段,从高性能数据归集开始做起。
基于华为积累的一批专项行业数据算子,技术团队通过灵活编排组装这些算子,对数据进行去重、特征提取和分级;为了深度优化对病理图像的处理,他们还研制了专用的神经网络,实现对病理图像的免切分算法,将整个病理学图像处理时间从月级压缩到了天级。
在与病理科医生的通力合作下,RuiPath病理大模型前后共训练了103万张数字病理切片。从统一格式、数据清洗,到数据标注、模型训练、再到最后的模型精调、应用编排,华为团队一步一个脚印,完成了对海量数字切片数据的“萃取”与“价值提炼”。
“这是一条从未有人走过的路,所以这其间对数据格式统一、对数据压缩算法的优化、对数据管理工程化的系统调优等过程,都是极其复杂且艰辛的。”张伟力告诉记者,数据是训练病理大模型最核心的一环,华为和瑞金医院始终坚持着“长期主义”,不计成本、不计时间“死磕”数据,只为得到更高质量的训练数据集。
开源,让更多人在“最后一公里”上车
如今,瑞金医院的病理医生在RuiPath的协助下,阅片效率大大提升,每天能完成400张切片的诊断。
病理医生使用RuiPath病理模型阅片。华为存储 供图
模型在手,瑞金医院没有孤芳自赏。甚至在宁光看来,RuiPath还没有达到“百分之百”。为了让模型更广泛应用,也为了模型能够更加完善,瑞金医院与华为决定开源。
这在AI医疗行业内不多见的——他们不仅开源RuiPath病理模型中核心的视觉基础模型,还开源覆盖肺癌、结直肠癌、甲状腺癌、胃癌、乳腺癌、前列腺癌、胰腺癌等7个常见癌种配套的测试数据集;同时,华为还对AI全流程工具链ModelEngine、行业落地实践指南、相应的辅助诊断任务进行开源开放。这意味着,其他医院或机构下载获得视觉基础模型和测评数据集后,就能“按图索骥”复现RuiPath病理模型,还能使用自有数据进行模型增训。
“我很赞叹华为的勇气,他们说服了我们,把模型、工具、数据集等全部开源,这其实形成了一个病理模型的应用生态。”宁光说,这将使得RuiPath病理大模型真正达到临床可及、可用的程度,假以时日“水平可以超过任何一个病理科医生”。
华为与瑞金医院从合作之初就不是把这次创新当做一次科学实验来做,他们始终在“实用主义”这条道路上坚定前行。
“华为在与瑞金医院合作开始的第一天,就锚定做出能落地应用的模型、基层医院用得起、能省时省力部署的模型。”张伟力说,只有降低了AI应用的门槛,才会有更多后来者“上车”。
他举例说,在数据优化和模型训练过程中,华为做了许多工程化的开发和改造,如开发病理学图像的免切分算法,将病理学图像的处理时间大大缩短;对模型参数进行蒸馏和优化,使得最终仅用16张算力卡就完成了模型的训练等等。
发布会当天现场一位某二级医院负责人表示,大多数医疗机构缺少专业AI人才,因此即便拥有病理数据,也难以跨越从数据处理到AI应用的技术鸿沟。此次瑞金医院和华为开源的临床级模型和工程化工具,基层医院可以跳过数据准备、模型训练、应用开发等繁琐复杂的工作,直接在临床应用的“最后一公里”上车,将促进病理AI辅助诊断的广泛应用。
根深才能叶茂
当瑞金RuiPath病理大模型让人们看到了AI的巨大潜力,同时也让人们意识到,要使AI进入到行业生产、真正发挥价值,表面上看是需要积累和时间沉淀,但其中更重要的是,需要技术与专业知识的双向奔赴。
“以医疗行业为例,医疗数据量大,但医疗行业的数字化并不适配AI大模型训练的数字化,医疗机构又普遍缺乏IT和AI人才,如何将AI与医疗应用连接在一起,需要一个桥梁。”张伟力表示,华为在今年年初专门成立“华为医疗卫生军团”,正是出于这方面的考虑。
华为成立医疗卫生军团,本质上就是希望有一支研发力量,能帮助医生们将他们的知识和经验与先进的AI技术结合,沉淀为即插即用的工具、模型和应用。而这背后,源于华为一贯的长期主义和实用主义。
张伟力说,干好这件事可能需要“三年磨一剑”,也许在放射影像、慢病管理等其他场景的落地上也需要“数年磨一剑”,但只要方向正确、有价值,就值得长期坚持,“根深才能叶茂,我们会一步一个脚印,坚定不移地走下去。”
版权声明:凡本网注明“来源:中国科学报、科学网、科学新闻杂志”的所有作品,网站转载,请在正文上方注明来源和作者,且不得对内容作实质性改动;微信公众号、头条号等新媒体平台,转载请联系授权。邮箱:shouquan@stimes.cn。