在生物医学研究领域,空间多组学技术的飞速发展为疾病诊断和治疗带来了前所未有的机遇。空间转录组技术能够精确绘制组织中基因表达的空间图谱,揭示肿瘤异质性等关键特征;数字病理图像分析则提供了组织形态学的全景视角,为疾病诊断提供金标准。然而,这些多模态数据间存在尺度差异和复杂关联,传统分析方法难以充分挖掘其协同价值。
针对这一挑战,西南华大生命科学研究院的研究团队与合作者在《生物信息学简报》联合发表研究论文,提出了一种名为StereoMM的创新算法。该方法通过深度学习框架开创性地实现了转录组数据与病理特征的融合,实现对空间域的精确识别,并在患者分类任务中展现出良好的判别性能。这一进展有望为肿瘤精准治疗等医学研究领域带来新的可能性。
基于深度学习技术,StereoMM的核心框架由两个主要模块构成:交叉注意力模块和变分图自编码器模块。交叉注意力模块通过考虑空间远距离关系,能够捕捉不同模态间的长距离相似性,这对于识别非相邻但具有重要影响的模式和相互作用具有关键意义;变分图自编码器模块则用于整合空间位置信息与多模态数据,并在自监督模式下训练,无需依赖标注数据。
该算法整体不仅考虑了空间近邻关系,还实现了远距离多模态特征的交互融合。最终生成的低维多模态特征表示综合了基因表达、细胞形态和空间位置信息,能够全面表征细胞组织特性,揭示复杂生物学功能,并支持后续临床分析,包括患者精准分类等。

StereoMM模型框架。研究团队供图
研究团队通过验证发现,在肺癌、乳腺癌和结直肠癌等不同类型的癌症样本中,StereoMM能够准确识别出与病理注释高度一致的空间域,还能发现传统方法可能遗漏的肿瘤区域;在结直肠癌样本中,StereoMM识别出了一些延伸到基质区域的肿瘤区域,这些区域在细胞形态和基因表达上与周围基质有显著差异。通过对这些区域的基因表达分析,研究人员发现了与肿瘤侵袭和免疫抑制相关的基因表达模式。
在临床应用方面,研究团队利用StereoMM对结直肠癌患者进行分类,成功区分了错配修复缺陷和错配修复正常的患者。结果表明这种基于多模态数据的患者分类方法,为精准医疗提供了新的工具。通过构建患者级别的图表示,StereoMM能够将组织水平的微环境关系整合为一个全面的患者表示,提高患者分类的准确性,为临床提供更合理有效的治疗方案。
文章第一作者、西南华大生命科学研究院助理研究员罗冰莹表示:“本次开发的新算法借助空间转录组信息和病理学图像信息,在解析肿瘤进展、微环境挖掘和患者分型上取得了初步成效,标志着多模态数据整合技术的一个重要进步。随着空间组学技术的不断发展,接下来StereoMM有望在更多的疾病研究和治疗中发挥重要作用。”
相关论文信息:
https://academic.oup.com/bib/article/26/3/bbaf210/8142327
版权声明:凡本网注明“来源:中国科学报、科学网、科学新闻杂志”的所有作品,网站转载,请在正文上方注明来源和作者,且不得对内容作实质性改动;微信公众号、头条号等新媒体平台,转载请联系授权。邮箱:shouquan@stimes.cn。