人类肠道微生物组有上千万个基因,这些基因所编码的蛋白质在人体的代谢、免疫等过程中发挥重要作用,也是开发疾病治疗新技术的重要资源库。然而,微生物蛋白质的进化多样性,给基于序列同源的功能推断方法带来了挑战。例如,在肠道噬菌体基因组中,有超过75%的蛋白无法注释功能。此外,肠道细菌中广泛存在宿主同工酶,但是这些酶与其真核同源蛋白的序列同源性很低,往往难以被识别。
近日,中国科学院深圳先进技术研究院定量合成生物学全国重点实验室、合成生物学研究所研究员戴磊团队联合北京大学研究员汪锴、香港中文大学教授李煜在《细胞—宿主与微生物》发表最新研究。研究团队建立了人体肠道微生物的蛋白质结构组数据库和结构检索方法,显著提高了对噬菌体蛋白、菌源宿主同工酶等功能暗物质的预测能力。
基于这一方法,研究团队成功验证了肠道致病菌的噬菌体裂解酶,并揭示了肠道细菌的褪黑素合成途径。
首先,研究团队构建了人体肠道微生物蛋白质结构组数据库,该数据库涵盖968个肠道细菌和1255个肠道噬菌体基因组所编码的约270万个蛋白结构。研究团队采用结构比对和聚类方法,研究噬菌体蛋白的功能注释和进化规律,发现许多噬菌体蛋白与已知功能蛋白之间存在结构相似度,可以大幅提高噬菌体蛋白的功能推断能力。
通过系统分析噬菌体裂解酶的结构多样性,研究团队发现其存在结构域重排的进化机制。研究人员在选取分析了人体肠道致病菌噬菌体来源的裂解酶,成功验证了其针对人体肠道致病菌的裂解活性。此外,一部分噬菌体裂解酶具有很高的物种靶向性,有望成为微生物组精准编辑的平台技术。
研究团队进一步将结构检索方法拓展至肠道菌源的宿主同工酶的研究中,他们在青春双歧杆菌、多形拟杆菌中发现了参与褪黑素合成的关键酶,揭示了肠道微生物的褪黑素合成途径。动物实验表明,菌源酶能够显著调节宿主体内的褪黑素水平,进而影响肠道生理与疾病状态。
最后,研究团队开发了人工智能方法 (DEER),能够快速、高效识别同工酶,其性能显著优于现有的基于序列或结构比对的方法。该模型训练运用了融合结构信息的蛋白质语言模型及对比学习技术,以及稠密检索技术,实现了对酶功能的准确预测,和不依赖传统序列或结构对齐的快速检索。该模型框架不仅适用于远源酶的挖掘,未来还可进一步拓展到其他功能的蛋白研究。
该研究提出蛋白结构检索的微生物组功能研究范式,不仅建立了人体肠道微生物蛋白质结构组数据库,还验证了多种噬菌体裂解酶和菌源宿主同工酶的功能,为解析人体肠道微生物组的功能暗物质提供了重要的工具和思路。
相关论文信息:https://doi.org/10.1016/j.chom.2025.11.001
版权声明:凡本网注明“来源:中国科学报、科学网、科学新闻杂志”的所有作品,网站转载,请在正文上方注明来源和作者,且不得对内容作实质性改动;微信公众号、头条号等新媒体平台,转载请联系授权。邮箱:shouquan@stimes.cn。