近日,记者从深圳华大生命科学研究院了解到,该院联合基因组多维解析技术全国重点实验室成功开发出一款名为SpaSEG的AI“解码器”,可处理多项核心任务,包括识别组织空间结构域、检测空间高变基因、整合多张组织切片以及解析细胞间的相互作用,为空间转录组分析提供了统一框架。相关研究成果发表于《基因组生物学》。
SpaSEG就像是一个训练有素的“AI分析师”,能够根据复杂的空间转录组数据,自动识别出组织中的功能分区、找到基因表达存在空间差异的区域、拼接多个组织切片,并推断细胞之间的通信模式。它能将空间转录组数据“图像化”处理,借助一种常用于图像识别的AI技术——卷积神经网络,对组织结构进行“看图识区”,该方法更智能,且具有更强的适应性和处理速度,突破了传统工具在兼容性、精度和运算效率上的瓶颈。
此外,SpaSEG具有显著的跨平台兼容性和处理多尺度分辨率数据的能力。实验表明,SpaSEG在面向Stereo-seq等多种平台不同分辨率的空间转录组数据时,识别空间结构域时的准确性均显著优于现有方法。
通过精准对齐相邻组织切片的空间坐标和基因表达模式,SpaSEG实现了跨切片空间结构域对齐,从而支持3D组织结构重建。在小鼠嗅球Stereo-seq数据中,SpaSEG成功对齐了多个解剖结构,对齐精度提升了20%至30%,且无需依赖复杂的对齐算法。
SpaSEG通过组织空间结构域的识别结果,可高效地检测出与特定空间结构相关的空间可变基因,从而揭示不同解剖区域的基因表达模式。在小鼠胚胎Stereo-seq数据中,SpaSEG识别出252个空间可变基因,并验证其生物学意义。SpaSEG在多个评分指标上较其他方法有所提升,且计算时间大幅缩短。此外,SpaSEG还可以结合配体-受体互作数据库,推测出细胞之间可能存在的信号传递通路。
总之,SpaSEG通过创新的无监督深度学习架构,为空间转录组学领域提供了统一的多任务解决方案,其处理超大规模数据的速度实现了2.5到26倍的显著提升,展现出了广阔的实际应用价值。
相关论文信息:https://doi.org/10.1186/s13059-025-03697-1
版权声明:凡本网注明“来源:中国科学报、科学网、科学新闻杂志”的所有作品,网站转载,请在正文上方注明来源和作者,且不得对内容作实质性改动;微信公众号、头条号等新媒体平台,转载请联系授权。邮箱:shouquan@stimes.cn。