作者:廖洋,王红梅,李华昌 来源:中国科学报 发布时间:2024/12/17 13:09:03
选择字号:
中国海洋大学绘制贝类“生命之树”
构建国际最大规模贝类基因组学数据库

 

最大规模的贝类功能和进化基因组学综合数据库MolluscDB 2.0、整合约4200份软体动物多组学数据资源、自正式上线运行以来吸引来自70多个国家的近15000次访问。

这是中国工程院院士、中国海洋大学海洋生物遗传学与育种教育部重点实验室教授包振民和教授王师团队的最新成果,目前已成为全球范围软体动物研究的重要组学资源中心。

2021年,团队发起国际万种软体动物基因组计划(M10K project),并构建了国际首个软体动物综合基因组数据库MolluscDB 1.0。

目前, MolluscDB 2.0已经成为为软体动物研究领域提供物种覆盖度最广、组学资源最丰富、分析功能最全面的开放获取数据库平台。

“应国家需求,做一流学术;不做则已,做必完美。”这既是包振民的准则,也是他带领团队紧扣海洋强国建设的核心需求,全力以赴的态度。

贝类“生命之树”  中国海洋大学供图

成立一个填补国际空白的团队

起源于5亿年前早寒武纪的软体动物(俗称贝类)是动物界第二大门类,也是最大的海洋动物门类,现存种类超过10万种,是进化上最成功的无脊椎动物群体之一。许多贝类也是重要水产经济物种,占我国海水养殖水产总量约70%。

目前,贝类基因组学的迅速发展,极大地提升了对动物起源和适应性演化的认知深度。但是由于国际上尚没有贝类专有基因组数据库,因此,人们对贝类生物学的深度认知和资源开发利用远远不够。

“如何高效整合原始、分散的海量数据,构建贝类个性化组学分析平台?”

2019年,包振民提出了这个充满挑战的课题。

在他的带领下,团队迅速成立了一个攻关小组,由王师负责数据库架构整体设计,李语丽负责功能模块规划、网站主页设计,刘福云负责收集、梳理及分析数据。

团队经过一年的默契合作,MolluscDB 1.0构建成功,填补了国际贝类基因组学研究领域的空白,相关成果在国际生物信息数据库领域顶级期刊Nucleic Acids Research发表。

国际专家评价称:“这是迄今最综合的贝类基因组数据库,在未来所有种类软体动物组学项目中将被广泛使用。”

实现一件不可能的事

近年来,高精度、多维度的功能基因组学数据呈爆发式增长,推动贝类进入系统生物学时代,为贝类科学研究带来新的发展机遇。

2021年,团队联合国内外优势机构发起了国际万种软体动物基因组计划(M10K project),并陆续系统收集了1450个物种的近4200份多组学数据资源。

“如何利用系统生物学工具高效整合具有复杂、高维、海量等特征的多组学资源?”

包振民再次提出新的命题。

如果想要完成这一命题,则意味着团队既要开发相关的系统生物学工具,还要在短时间内完成数据的系统整合与分析。

在外人看来,“这几乎是不可能完成的任务。”但是,团队前期未雨绸缪性的工作却将不可能的局面转变了。

早在2021年,团队着手部署了系统生物学分析工具PanSyn软件包的研发工作。该研究成果以长达68页的大篇幅发表在国际方法学顶级刊物Nature Protocols。

中国基因组学研究奠基人之一、中国科学院北京基因组研究所研究员于军评价道:“PanSyn为应对高维度海量组学资源分析提供最全面和最强大工具,推动生命科学领域取得创新发现和重要突破。”

在他人看来的不可能面前,面向系统生物学前沿需求的MolluscDB平台逐渐问世了。

一项领跑国际竞争的成果

对各科研领域来说,时刻保持团队在国际竞争中的领先地位并不容易。

正当团队按计划有条不紊地推动数据库升级,并已完成大半任务时,却意外得知国际顶尖机构的同行也在着手构建贝类基因组数据库。

“我们必须在短时间内,高质量、高效率地完成MolluscDB 2.0的构建。” 王师教授深感紧迫,向小组成员下达了这项艰巨的“军令状”。

但是,棘手性的问题偏偏在攻关小组与时间赛跑的过程中出现了。

他们处理的海量数据处理亟需强大的服务器支持,但是现有服务器并不能满足这一需求。

愁眉不展之际,崂山实验室鼎力相助,以强大计算资源为MolluscDB 2.0的构建提供了充裕的存储与计算能力,解决了团队的燃眉之急。中国海洋大学大生命学科超级计算集群也提供了宝贵的分析资源,共同助力团队攻坚克难。

硬件设施问题解决后,团队成员不舍昼夜地朝着目标奋力前进。终于,MolluscDB 2.0在今年10月成功面向全球科学共同体发布,并再次在Nucleic Acids Research上发表,在中国海大百年校庆之际献上了“贺礼”。

相较于前版,MolluscDB 2.0实现了质的飞跃,贝类多组学数据量翻了3倍,数据维度提升了2倍,全面升级了原有的14种基础分析模块,新增了多达20种定制分析模块,还实现了复杂多组学信息的便捷可视化与高效整合分析,极大地提升了研究效率与深度。

包振民表示,未来,MolluscDB 2.0将推动认知海洋生物独特生命过程演变规律,也将为贝类重要基因资源发掘、遗传育种工作等提供有力支撑。

中国海大人将继续秉承“崇尚学术,谋海济国”的价值追求,加强原创性、引领性海洋科技攻关,集合精锐力量突破蓝色生命解码、良种创制等领域的“卡脖子”技术,锻造海洋领域国家战略科技力量,构筑世界重要的海洋创新高地,为建设海洋强国不断贡献“海大”智慧和力量。

论文相关信息:https://doi.org/10.1093/nar/gkae1026
 
版权声明:凡本网注明“来源:中国科学报、科学网、科学新闻杂志”的所有作品,网站转载,请在正文上方注明来源和作者,且不得对内容作实质性改动;微信公众号、头条号等新媒体平台,转载请联系授权。邮箱:shouquan@stimes.cn。
 
 打印  发E-mail给: 
    
 
相关新闻 相关论文

图片新闻
多波段观测揭示磁星快速射电暴可能起源 新型沸石分子筛合成领域取得突破性进展
热带森林“赢家”更小更快 《自然》2024年十大人物公布
>>更多
 
一周新闻排行
 
编辑部推荐博文