■本报记者 李媛
将原本耗时约20分钟的复杂病理切片分析缩短至1秒钟,且全程无需医生进行烦琐的逐一切片标注。这一场景正因一项最新人工智能(AI)医学突破而成为现实。
西安交通大学国家医学攻关产教融合创新平台教授李辰团队与英国剑桥大学科研人员合作,在国际上首次攻克了弱监督学习下数字病理全玻片难以实现精准空间量化的技术瓶颈。该技术被形象地喻为病理诊断的“声呐系统”,让AI病理诊断正式从“粗略分类”迈入“精准量化”的新阶段。相关研究成果近日发表于《自然-癌症》。
新型AI框架SMMILe
在癌症精准诊疗中,千兆像素级的数字病理切片是“金标准”。然而,长期以来计算病理学面临着一个巨大的“黑盒”难题:现有的主流AI方法虽然能以较低成本判断切片“是否有癌症”,但无法回答“病灶具体在哪里”“恶性程度如何分布”以及“各类亚型占多大比例”这些问题。要想获得这些关键信息,往往需要病理医生投入大量精力进行逐像素的手动描绘,这在临床上几乎是不可能完成的任务。
“在全球专业病理医生短缺的情况下,我们迫切需要计算机辅助进行高效诊断。只有实现了高效诊断,才能把诊断点往前推进,实现癌症量化诊断。”李辰介绍道。
团队调研发现,国内医生一天最多看两三百张片子,在这样高负荷的强度下,没有更多精力对每张片子做精细化计算。“但计算机可以实现。”李辰说。
研究团队提出了名为SMMILe的新型AI框架。该框架是首个能在仅使用简化“病人级诊断标签”的情况下,对全玻片病灶进行精确空间量化的AI系统。SMMILe打破了传统弱监督算法“重分类、轻定位”的局限,在无需昂贵人工标注的条件下,像绘制地图一样,自动推断出肿瘤在组织中的具体位置、边界范围及不同亚型的空间分布。
通俗来讲,这项技术可以让癌症诊断的“金标准”从原来耗时数分钟或者几十分钟缩短到秒级,甚至更快。“使用目前常规计算机,甚至可以使诊断速度达到毫秒级。”李辰补充说。
李辰介绍,该技术的创新之处在于设计理念,它类似于一套用于图像的“声呐系统”,本质上赋予了计算机“在黑暗中视物”的能力。
传统方法往往因缺乏详细坐标信息而“抓瞎”,或者只能捕捉最明显的特征。而SMMILe通过融合特征压缩、参数自适应处理及马尔可夫随机场约束等前沿数学模型,能够敏锐捕捉微弱的病理信号。即便是在没有任何位置标注信息的情况下,它也能像声呐探测海底地形一样,精准锁定并还原具有生物学意义的肿瘤空间图谱。
人工分析一张复杂的组织切片可能耗时20分钟,而SMMILe最快仅需1秒钟即可生成详尽的量化报告。
涵盖6种癌症的3850张全切片
在具体评估中,研究团队基于涵盖乳腺癌、肺癌、卵巢癌、肾癌、胃癌和前列腺癌等6种癌症的3850张全切片,对SMMILe与9种当前主流计算病理学方法进行了系统比较。“我们用得比较多的是公共领域数据,目前美国数据比较多,后续将根据国内数据库的开放情况进行更新迭代。”李辰介绍,尽管个体差异不是很大,但随着技术发展,数据需要越来越精细。
在切片级分类任务和更具挑战性的病灶空间量化任务中,SMMILe在多个数据集上的整体表现媲美或优于现有方法。即便在采用病理基础模型等更强特征编码器、整体性能普遍抬升的条件下,SMMILe仍在多项空间指标上保持明显优势,尤其在多标签等复杂任务中表现突出。
SMMILe不仅让诊断性能提升,还可以生成可靠的空间量化图谱。该方法为病理医生提供了更直观的组织结构信息,有助于在复杂病例中更快速、准确地锁定关键区域,确保患者尽早获得最佳治疗方案,同时也为科研人员系统研究肿瘤异质性,探索不同组织亚型与预后、免疫反应及药物敏感性之间的关系提供了有力工具。
目前,该框架已在国内多家医院进行临床测试,反馈很好,能有效辅助肿瘤科医生进行诊断。
“笨方法”反复试验
病理切片分析通常有两种技术路线,一种是将切片划分为小块,提取局部特征后再进行整体研判;另一种则先对切片区块进行聚类,再针对特定区域进行特征提取与量化。
研究团队提出的框架兼具两者优势,既能提取全片层面的特征,又能在局部聚类后提取区域特征,并将二者有效融合。
李辰坦言,团队在研发过程中主要面临两大技术难点,一是如何将全局特征与区域特征有效融合;二是如何在模型训练中,不依赖大量人工标注,直接从临床病历中提取标签用于训练。
“这种创新训练方式使模型区别于传统AI,能够持续优化,重要性日益凸显。”李辰举例说,“肺癌存在不同亚型,治疗方案因亚型而异,因此亚型确诊尤为关键。我们的模型不仅能识别亚型,还能计算各亚型的占比,这种量化能力超越人眼判断。”
在前期方法创新阶段,团队遇到了诸多困难,他们尝试了多种方案,包括领域内较新的方法,历经两年多才获得突破。
“我认为我们的突破实际上靠的是‘笨功夫’。虽然不是穷举式尝试,但我们会根据结果反复比对,及时调整训练方向。”李辰坦言,团队最初仅专注于局部量化,但在训练中发现切片间存在结构关联,因此后续融入了全局信息。
然而,全局与局部信息融合初期效果并不理想,一度让团队考虑回到原方案。令李辰印象深刻的是,团队每周都会通过线上线下方式进行复盘,针对难点展开深入讨论,并反复验证测试。“论文第一作者高泽宇从西安交通大学博士毕业后,目前在英国剑桥大学从事AI研究工作,大家都没有因为距离等原因耽误进程,线上沟通频繁,在遇到困难的每个节点都能共同推进。”李辰表示,最终通过持续试验与测试,才得到稳定的量化结果。
研究人员表示,该框架有望进一步拓展用于肿瘤分子特征的推断,实现组织形态学与多组学数据的深度融合,推动综合癌症医学与精准医疗的发展。
“随着国内测序技术日益普及,未来我们能够获取纳米级的变化信息,使量化结果更加精准,甚至有望替代一部分成本高昂的分子检测。”李辰表示。
相关论文信息:https://doi.org/10.1038/s43018-025-01060-8
《中国科学报》 (2025-12-18 第3版 综合)