他们攻克医学AI难题，病理分析进入“秒时代”—新闻

作者：李媛来源：中国科学报发布时间：2025/12/10 15:31:31

选择字号：小中大

他们攻克医学AI难题，病理分析进入“秒时代”

将原本耗时约20分钟的复杂病理切片分析缩短至一秒钟，且完全无需医生进行繁琐的逐一切片标注。这一场景因为一项最新的AI医学突破正在成为现实。

近日，西安交通大学计算机科学与技术学院、国家医学攻关产教融合创新平台教授李辰团队与剑桥大学合作，在国际上首次攻克了弱监督学习下数字病理全玻片难以实现精准空间量化的技术瓶颈。该技术被形象地喻为病理诊断的“声纳系统”，让AI病理诊断正式从“粗略分类”迈入“精准量化”的新阶段。

相关成果已于近日发表在《自然·癌症》上。

新型人工智能框架“SMMILe”

在癌症精准诊疗中，千兆像素级的数字病理切片是“金标准”。然而，长期以来计算病理学面临着一个巨大的“黑盒”难题：现有的主流AI方法虽然能以较低成本判断切片“是否有癌症”，但无法回答“病灶具体在哪里”“恶性程度如何分布”以及“各类亚型占多大比例”。要想获得这些关键信息，往往需要病理医生投入大量精力进行逐像素的“手动描绘”，这在临床上几乎是不可能完成的任务。

“在全球专业病理医生短缺的情况下，我们迫切需要计算机辅助高效地进行诊断。只有实现了高效诊断，才能把诊断点往前推进，让癌症实现量化诊断。”李辰介绍道。

团队长期调研了解到，国内的医生一天最多看两三百张片子，在这样高负荷的强度下，医生没有更多精力在每张片子上做精细化计算。

“但我们计算机可以实现。”李辰说。

研究团队提出了名为SMMILe的新型人工智能框架。该框架是首个能在仅使用简化“病人级诊断标签”的情况下，实现对全玻片病灶进行精确空间量化的AI系统。SMMILe打破了传统弱监督算法“重分类、轻定位”的局限，在无需昂贵人工标注的条件下，能够像绘制地图一样，自动推断出肿瘤在组织中的具体位置、边界范围及不同亚型的空间分布。

通俗来讲，这项技术可以让癌症这种重大疾病诊断的“金标准”，从原来耗时数分钟或者是几十分钟降低到秒级，甚至更快。“目前常规的计算机环境，甚至可以达到毫秒级的速度。”李辰补充说。

为何SMMILe能做到其他AI做不到的事？李辰介绍，该技术的创新之处在于其独特的设计理念——它类似于一套用于图像的“声纳”系统，本质上赋予了计算机“在黑暗中视物”的能力。

传统方法往往因为缺乏详细坐标信息而“抓瞎”，或者只能捕捉到最明显的特征。而SMMILe通过融合特征压缩、参数自适应处理及马尔可夫随机场约束等前沿数学模型，能够敏锐捕捉到微弱的病理信号。即便是在没有任何位置标注信息的情况下，它也能像声纳探测海底地形一样，精准锁定并还原出具有生物学意义的肿瘤空间图谱。

一张复杂的组织切片，人工分析可能耗时20分钟，而SMMILe最快仅需约1秒钟即可生成详尽的量化报告。

涵盖六种癌症的3850张全切片

在具体评估中，研究团队基于涵盖乳腺、肺、卵巢、肾、胃和前列腺等六种癌症的3850张全切片，对SMMILe与九种当前主流计算病理学方法进行了系统比较。“我们的数据用的比较多的是公共领域的数据，目前美国的数据比较多，后续将根据国内数据库的开放情况进行更新迭代。”李辰介绍，尽管个体差异不是很大，但随着技术的发展，数据需要越来越精细。

在切片级分类任务中，SMMILe在各数据集上的整体表现达到或优于现有方法；在更具挑战性的病灶空间量化任务中，其在多个数据集上的空间AUC接近或超过90%，空间F1相较最佳对比方法最高可提升20个百分点以上。即便在采用病理基础模型等更强特征编码器、整体性能普遍抬升的条件下，SMMILe仍在多项空间指标上保持明显优势，尤其在多标签等复杂任务中表现突出。

SMMILe不仅让诊断性能提升，还可以生成可靠的空间量化图谱。该方法为病理医生提供了更直观的组织结构信息，有助于在复杂病例中更快速、准确地锁定关键区域，确保患者能尽早获得最佳治疗方案，同时也为科研人员系统研究肿瘤异质性、探索不同组织亚型与预后、免疫反应及药物敏感性之间的关系提供了有力工具。

目前，该框架已在国内多家医院临床测试，能够有效辅助肿瘤科医生诊断，团队也得到了很好的反馈。

西安交通大学计算机科学与技术学院教授李辰团队合影。西安交通大学供图

“笨方法”反复试验

在病理切片分析中，通常存在两种技术路线：一种是将切片划分为小块，提取局部特征后再进行整体研判；另一种则先对切片区块进行聚类，再针对特定区域进行特征提取与量化。

这项研究提出的框架兼具两者优势：既能提取全片层面的特征，也能在局部聚类后提取区域特征，并将二者有效融合。

李辰坦言，团队在研发过程中主要面临两大技术难点：一是如何将全局特征与区域特征有效融合；二是在模型训练中，无需依赖人工进行大量标注，而是直接从临床病历中提取标签用于训练。

“这种创新训练方式使模型区别于传统人工智能，能够持续优化，重要性日益凸显。”李辰举例说，肺癌存在不同亚型，治疗方案因亚型而异，因此亚型确诊尤为关键。“我们的模型不仅能识别亚型，还能计算各亚型的占比，这种量化能力甚至超越人眼判断。”

在前期方法创新阶段，团队遇到了诸多困难，他们尝试了多种方案，包括领域内较新的方法，历经两年多才最终突破。

“我认为我们的突破实际上靠的是‘笨功夫’。虽然不是穷举式尝试，但我们会根据结果反复比对，及时调整训练方向。”李辰坦言，团队最初仅专注于局部量化，但在训练中发现切片间存在结构关联，因此后续融入了全局信息。

然而，全局与局部信息融合初期效果并不理想，一度让团队考虑退回原方案。令李辰印象深刻地是，团队每周都会通过线上线下方式进行复盘，针对难点展开深入讨论，并反复验证测试。“我们的论文第一作者高泽宇从西安交大博士毕业后，目前在剑桥大学从事人工智能研究工作，大家都没有因为距离等原因耽误进程，在线上沟通频繁，在技术遇到困难的每个节点大家都能共同推进。”李辰表示。最终，通过持续试验与测试，才得到稳定的量化结果。

未来，该框架有望进一步拓展至肿瘤分子特征的推断，实现组织形态学与多组学数据的深度融合，推动综合癌症医学与精准医疗的发展。“随着国内测序技术日益普及，未来我们能够获取纳米级的变化信息，使量化结果更加精准，甚至有望替代一部分成本高昂的分子检测”李辰表示。

编辑部推荐博文
基金申请季，这里有2份攻略请查收！科学网2026年1月十佳博文榜单公布！植物标本馆：从可携带花园到科学革命的基础设施可吸收环境水分子能量的吸湿性新材料担任教学副系主任，“破事”多、难度大人类智能中依然存在还未被发现的新机制更多>>