作者:廖洋,周文燕 来源:中国科学报 发布时间:2025/4/27 20:30:42
选择字号:
中国海洋大学科学家破解病毒“黑户”难题

 

病毒,是地球上最小且丰度最高的非细胞生物,不仅对人类健康产生了深远的影响,也是全球生物地球化学循环的幕后推手,它们如同隐形的“生态工程师”,调控微生物群落结构,驱动碳、氮等元素的全球循环。随着宏组学技术的迅速发展,发现了海量未知的DNA和RNA病毒。然而,全球约99%的病毒仍处于“黑户”状态——未被分类或命名。

日前 ,中国海洋大学海洋生命学院和海德学院教授汪岷团队传来好消息,他们基于序列比对和图论方法,开发了病毒分类新工具VITAP(Viral Taxonomic Assignment Pipeline)。近日,相关研究成果发表在《自然·通讯》上,为病毒组学和病毒生态学研究提供了重要工具。

“进入VITAP系统界面,输入一段基因序列,命令行瞬间输出从的分类结果。这就像给病毒发‘身份证’,流程缩短至几分钟。”成果共同通讯作者、海洋生命学院教授梁彦韬向《中国科学报》解释说。

汪岷团队成员合影  受访者供图

病毒传统分类遇瓶颈

病毒分类如同给未知星系命名,我们已知的仅是冰山一角。

过去鉴定病毒需要接近完整的基因组,但在现实中,科学家从环境样本中发现的病毒基因往往是碎片化的,传统工具难以识别。随着宏组学技术的发展,病毒基因组数据从2018年的5000多种激增至如今的1000多万条序列,与此同时,病毒分类标准变化非常快,这让分类工具“捉襟见肘”,如同用老地图导航新大陆,结果自然偏差百出。

这些问题限制了我们对环境中复杂病毒群体的深入解析。因此,如何准确细致地对环境病毒进行分类,已成为当今生物学、医学与生态学研究亟待突破的重要挑战。

团队在研究海洋病毒时,也面临了这一病毒分类难题。“研究病毒,我们首先要知道它的分类情况,属于哪一科,是什么类型的病毒,从而再去确定它的宿主类型。而传统的培养方法有很多弊端,培养周期长,效率低,我们想从基因组学的层面,通过算法快速大批量分类病毒,提高准确率和效率。”梁彦韬说。

跨学科协作成为破局关键。海洋生物学背景的成员提供生态视角,计算机专家优化算法,国际合作则引入前沿经验……共同通讯作者、澳大利亚塔斯马尼亚大学Andrew McMinn教授每周参与线上讨论,计算病毒学国际专家David Paez-Espino博士每月共同线上研讨,“时差会议”成为常态。“国际视野可以让我们进步更快,少走弯路。”团队成员感慨。  

从“试错”到“最优路径”

2023年初,团队开启病毒分类新工具VITAP的研发。最初的设想是用人工智能训练模型,但病毒数据的高度多样性让AI“水土不服”。“病毒没有像动植物那样的‘标准证件照’,训练样本的匮乏让AI举步维艰。”成果第一作者、海洋生命学院博士生郑凯阳回忆。团队转而回归传统方法,从序列比对和图论中寻找突破口。  

序列比对如同“人脸识别”,通过基因片段寻找相似病毒;图论则像构建“社交网络”,分析病毒间的亲缘关系。团队创新性地将两者结合,寻找解决问题的“最短路径”——为每条病毒基因筛选出从门到属的最佳分类谱系。

为提升准确性,团队为不同基因赋予权重,“这相当于给病毒基因贴上动态标签,即便碎片化也能精准溯源。”成果共同第一作者、海德学院孙建华助理教授比喻道。

研发过程充满“试错”。例如,针对长基因组病毒,团队一度陷入“盲人摸象”的困境。“长基因组被‘切碎’后,每段特征模糊,就像把一头猪分割后,单凭一块肉很难判断部位。”郑凯阳说。

最终,团队通过动态权重调整,测试国际病毒分类委员会(ICTV)报道的18000多种病毒参考基因组,实现了高置信度分类。测试显示,VITAP在科级和属级的分类分析中不仅能保持超过90%的准确率、精度和召回率,还显示出了优于其他方法的注释率。具体而言,对于1000bp的短序列,VITAP在所有病毒门中的注释率均优于其他方法;而在近完整基因组的分类中,VITAP对RNA病毒和大部分DNA病毒也表现出更高的注释率。

团队成员合影  受访者供图

精准“上户”背后的生态蓝图

“用户友好”是VITAP的另一亮点。传统工具安装复杂、更新滞后,VITAP则实现“一键安装”和ICTV自动同步。上线后,下载量迅速突破2000次,被广泛应用于海洋、医学等领域研究。

VITAP在保证高准确率的前提下,实现了更全面、稳定的病毒分类,并为病毒基因组学、分类学和生态学研究提供了一个高效的自动化新工具,就像给病毒研究装上了“智能搜索引擎”,让科学家能更快、更准地给海量病毒“验明正身”,无论是完整的还是碎片化的基因,都能高效分析。这对理解病毒在自然界的角色、应对公共卫生问题都有重要意义。

未来,团队计划引入AI生成新病毒类群,突破现有分类框架的局限。“当前工具只能‘上户口’,下一步要让‘黑户’自立门户。”郑凯阳透露。在应用层面,VITAP将助力极地、深海等极端环境病毒研究,快速解析环境中庞大而复杂的病毒群落,了解它们如何影响生态系统;医学上,可更高效发现与疾病相关的新病毒,辅助流行病追踪。

“做难而正确的事”是团队的信条。汪岷鼓励学生“勇攀高峰,允许失败”,实验室文化强调自由探索与合作共享。正如梁彦韬所言,“要想解决重要的科学问题,你就要不断地去面对困难、克服困难。”

“未来,我们会开发更多病毒学的生物信息工具,致力于南极、北极、马里亚纳海沟、青藏高原等极端环境的病毒研究,构建海洋病毒基因组数据库。”汪岷说。在全球病毒研究的浪潮中,他们正以“算法”为舟,驶向未知的“病毒宇宙”。

论文相关信息:

https://doi.org/10.1038/s41467-025-57500-7







 
版权声明:凡本网注明“来源:中国科学报、科学网、科学新闻杂志”的所有作品,网站转载,请在正文上方注明来源和作者,且不得对内容作实质性改动;微信公众号、头条号等新媒体平台,转载请联系授权。邮箱:shouquan@stimes.cn。
 
 打印  发E-mail给: 
    
 
相关新闻 相关论文

图片新闻
我国首次实现地月空间卫星激光测距 宇宙射电探测器或在15年内找到暗物质
2029年,“毁神星”将与地球擦肩而过 最精准太空时钟即将发射
>>更多
 
一周新闻排行
 
编辑部推荐博文