■本报记者 冯丽妃
近日,一场聚焦“人工智能(AI)时代下亚洲生物资源数据的有效挖掘与利用”的国际会议在北京召开。本次会议由亚洲研究资源中心网络(ANRRC)、中国科学院战略生物资源计划与中国科学院微生物研究所联合主办,吸引了中国、日本、韩国,以及乌兹别克斯坦等亚洲国家的科研机构代表参与。
会上,国家微生物科学数据中心主任、中国科学院微生物研究所研究员马俊才主持发布了“ANRRC微生物资源目录2026版本”。该目录汇聚了来自6个国家、14个保藏中心的83166株菌株资源信息,并整理了与菌株资源相关的24913篇论文、34880个专利及47256个基因组信息,可供全球科研人员应用。
ANRRC是由亚洲、大洋洲14个国家及100余家科研单位和大学共同组成的国际合作组织,2009年由中、日、韩三国科学家联合发起,致力于成为亚洲地区研究资源中心的合作与交流平台。
“数据要素就像数字经济的新石油,不仅驱动技术创新、优化资源配置,还能加速产业升级。”马俊才在接受《中国科学报》采访时说,国家微生物科学数据中心正在开展的“基于自主生物制造数据的氨基酸高产菌株改造示范场景建设”应用项目,通过构建生物制造科学数据共享平台、开发AI模型来实现工业菌种优化,赋能生物制造产业。基于其大数据挖掘和AI设计,科学家首创的普瑞巴林手性中间体R-单酰胺一步酶法合成技术,已在国内多家企业转化落地,不仅避免了有毒有机溶剂的使用,合成成本也比传统化学拆分工艺大幅下降,为我国生物制造产业的可持续发展注入了强劲动力。
“在生命科学领域,微生物的多样性最为突出。利用物种多样性与便捷的遗传操作特性,微生物成为生命科学研究的重要模型与生物技术基础材料。”国家微生物科学数据中心副主任吴林寰说,传统微生物研究依赖“试错法”,而AI时代范式已发生转变:从实验试错转向计算设计驱动,即以数据为起点,精准设计实验,大幅提升研究效率。
吴林寰介绍说,依托中国科学院微生物研究所建立的世界微生物数据中心(WDCM),目前已经整合全球78个国家、100余个保藏中心的数据,通过统一标准,提升了资源的可见性与数据质量。该中心开展的万株微生物基因组测序计划,填补了微生物基因组测序的诸多空白,目前已完成6000余株的测序工作,所有数据均免费共享。同时,基于AI驱动的调控元件挖掘研究,该中心分析了1.4万株微生物的基因组数据,发现20.7万个新调控元件,涵盖42个新类型,而此前全球已知调控元件仅约200个,AI的应用实现了该领域的重大突破。此外,吴林寰表示,针对大量未培养的微生物“暗物质”,通过构建AI模型,输入基因组与表型数据,有助于预测培养条件,助力微生物的分离培养。
“AI时代,从动物模型到生物模型正在发生范式转变。”会上,ANRRC主席、韩国科学家Je Kyung Seong表示,受微生物组、环境因素等影响,传统动物实验存在明显局限:同一靶点、候选药物、小鼠模型,实验结果可能截然不同,因此通过AI实现标准化、统一化操作至关重要。同时,AI技术能大幅缩短研发周期和新药靶点发现时间。
Seong表示,韩国政府正在全力打造AI生物经济,设立国家级AI中心,搭建“AI高速路”。AI落地的核心是数据库,韩国参照英国生物银行,构建了人类生物数据库,同时新增 KBD(生物数据站)、Bio One(生物资源数据库)两大平台,形成三大国家级平台,整合各实验室数据,实现生物资源与生物数据的一体化发展。
日本理化所综合生物资源信息部主任Hiroshi Masuya在会上表示,资源至关重要,而数据对资源同样不可或缺,支撑生物资源的数据整合,是实现生物资源广泛、高效、高质量利用的核心与基础。该机构正在与WDCM合作,推动人类罕见疾病微生物数据库建设。他建议,布局AI驱动的下一代生物资源基础设施,推动机构间数据互通,同时建立类似论文引用体系的生物资源引用机制,实现全球生物资源统一标识、规范使用、正确引用与可追溯。
会上还发布了“中国科学院战略生物资源目录2026版本”。该目录涵盖6966445个标本、231452个植物资源、433334个生物遗传资源、31756个实验动物资源及444041个生物多样性网络观测资源,通过数据共享促进生物实物资源共享,推动我国馆藏实物资源的社会全面共享。
据悉,中国科学院于“十二五”期间启动了“战略生物资源计划(BRP)”,集成植物园、标本馆、资源库、生物多样性监测网、实验动物平台等相关资源,构建整体化资源体系,并已形成“5+1”网络构架,包括5个资源收集保藏平台及1个战略生物资源信息中心。
《中国科学报》 (2026-04-13 第3版 综合)