近日,中国科学院广州生物医药与健康研究院研究员王杰团队与广州实验室研究员李亦学团队合作,成功开发了一种在单细胞水平构建调控网络的新工具ScReNI(Single-cell Regulatory Network Inference)。相关成果发表于《基因组蛋白质组与生物信息学报》(Genomics,Proteomics & Bioinformatics)。
论文共同通讯作者王杰表示,该工具通过整合单细胞转录组(scRNA-seq)与单细胞染色质可及性(scATAC-seq)数据,实现单细胞精度的基因调控网络推断。
ScReNI流程图。研究团队供图
?
每个细胞都具有独特的转录组和染色质可及性特征,其内在的基因调控网络也呈现出显著的异质性和细胞特异性。然而,目前仍缺乏能够有效整合单细胞多组学数据,构建单细胞精度调控网络的方法。scRNA-seq和scATAC-seq技术分别能够在单细胞水平上测量基因表达和染色质开放区域,二者的结合为解析精细的细胞特异性调控机制提供了新机会。
无论是配对还是未配对的单细胞多组学数据,都为构建单个细胞的调控网络奠定了基础。尽管已有多种方法可用于推断细胞类型特异性的调控网络,但在单细胞尺度上系统构建基因调控关系的研究仍十分有限,特别是在整合scRNA-seq与scATAC-seq数据方面仍面临诸多挑战。
针对上述问题,研究团队在国家自然科学基金、国家重点研发计划等项目的资助下,提出了一种创新算法ScReNI,能够在单细胞水平上整合scRNA-seq与scATAC-seq数据,实现细胞特异性的调控网络推断。ScReNI的核心设计思路包括以下四个关键步骤:
一是,多组学数据整合:利用Seurat软件中的加权最近邻分析方法,整合配对或未配对的scRNA-seq和scATAC-seq数据;二是,确定细胞邻域集合:为每个细胞识别k个最近邻细胞,作为后续调控网络推断的基础;三是,在细胞邻域内建立非线性基因调控关系:采用改进的随机森林模型,结合转录因子活性、基因表达和染色质可及性信息,推断非线性调控关系;四是识别关键调控因子:基于细胞特异的调控网络,统计识别每个细胞中的富集调控因子,揭示其在不同生物过程中的潜在作用机制。
ScReNI利用邻近细胞的信息模拟局部调控环境,并通过机器学习方法挖掘基因表达与染色质可及性之间的复杂关联,从而构建个性化的调控网络。评估结果显示,ScReNI在调控关系预测和细胞聚类任务中均表现出优异性能,同时还能识别出每个细胞中的关键调控因子,为深入理解单细胞层面的功能调控机制提供了有力支持。
相关论文信息:https://doi.org/10.1093/gpbjnl/qzaf060
版权声明:凡本网注明“来源:中国科学报、科学网、科学新闻杂志”的所有作品,网站转载,请在正文上方注明来源和作者,且不得对内容作实质性改动;微信公众号、头条号等新媒体平台,转载请联系授权。邮箱:shouquan@stimes.cn。