作者:江庆龄 来源:中国科学报 发布时间:2025/3/23 16:26:10
选择字号:
用AI设计蛋白质“六边形战士” ,Venus模型发布!

 

蛋白质设计改造的时间长、成本高、试错密集问题,一直是业界难题。3月22日,在上海交通大学蛋白质功能预测Venus系列模型发布暨产业合作峰会现场,上海交通大学教授洪亮教授发布了团队的最新成果,将有助于解决蛋白质设计改造的问题。

团队将AI与蛋白质设计与改造相结合,建立了全球最大的蛋白质数据集,基于该数据集训练的模型,可以精准、高效地预测、设计蛋白质的功能,把蛋白质生产由“缓慢的试错”变为“高效率的精准设计”。该成果配合行业领先的自动化设备,已经进行产业化落地。

洪亮在上海交通大学蛋白质功能预测Venus系列模型发布暨产业合作峰会上发布该成果。

  ?

洪亮介绍,团队建立的蛋白质序列数据集Venus-Pod含有近90亿条蛋白质序列,包含数亿个功能标签,是全球数据规模最大、功能批注标签最多的数据集,也是另一行业知名模型——美国ESM-C模型训练用的21亿蛋白质序列的4倍体量。

具体而言,Venus-Pod数据集包含36.2亿条陆地微生物蛋白质序列、26.4亿条海洋微生物蛋白质序列、24.3亿条抗体蛋白质序列、0.6亿条病毒蛋白质序列,覆盖从常规地表生物到极端环境微生物的蛋白质序列信息,尤其是配备的数亿功能标签(蛋白质工作的温度、酸碱度、压强等)。

”该数据集构成了巨大的‘蛋白质矿藏,使得人类有可能挖掘新的蛋白或者生物催化剂,助力我们生物医药和合成生物学的快速发展。“洪亮表示。

同时,洪亮团队瞄准蛋白质“功能预测”这一终极目标,训练了Venus(启明星)系列模型,其预测蛋白质突变功能的精度位居行业榜单之首。

洪亮表示,Venus系列模型具备“AI定向进化”“AI挖酶”两大核心功能。

“AI定向进化”是指 Venus系列模型可以优化蛋白质产品的多种性能,使一个原本不尽如人意的蛋白质产品成为“六边形战士”,进而满足应用需求。“AI挖酶”则指 Venus 系列模型可基于其海量的未知功能蛋白质数据集,“海选超能力战士”,精准发掘满足苛刻应用需求的具备超常规功能的蛋白质,比如极度耐热、极度耐酸、极度耐碱、极度耐胃肠消化等。这些超常规功能的蛋白质在生物技术、医药研发和工业生产中具有巨大的应用潜力,能够为相关领域带来创新和突破。

值得一提的是,团队配置了配合Venus系列模型的全球首款低通量大体积蛋白质表达、纯化与功能检测自动化一体机,可在24小时内不间断地完成100余个蛋白质的表达、纯化与检测任务,较人力效率提高近10倍。

洪亮团队正进行湿实验验证工作。图片均由上海交通大学提供

  ?

在软件和硬件的双重加持下,经过Venus系列模型设计的多款蛋白质已经实现了落地产业化。

以金赛药业的单域抗体耐碱性改造为例,洪亮团队借助该模型结合少量湿实验闭环迭代验证,不到1年将普通单域抗体耐碱性提升4倍,每年可为金赛药业节约上千万元成本。该成果已实现多个批次5000升放大生产,这也是全球首款由大模型设计并规模化生产的蛋白质产品。

另一项Venus系列模型的创新应用则是对某体外诊断头部公司碱性磷酸酶(ALP)的改造项目。Venus 系列模型成功优化 ALP,使其分子活性超国际头部公司产品 3 倍,为超敏检测诊断(如心肌梗塞、阿尔兹海默症)带来巨大价值。目前,改造后的 ALP 已进入 200L 规模放大生产阶段,标志着 Venus 系列模型成功实现产业转化。

”我们的宗旨就是’设计AI化,实验自动化‘,让科研人员从繁琐的设计和实验中解放出来,只需要提出问题,而由AI和自动化来解决问题,最终将复杂的蛋白质科学发现变成’傻瓜相机式‘的简单过程。“洪亮说道。

 
版权声明:凡本网注明“来源:中国科学报、科学网、科学新闻杂志”的所有作品,网站转载,请在正文上方注明来源和作者,且不得对内容作实质性改动;微信公众号、头条号等新媒体平台,转载请联系授权。邮箱:shouquan@stimes.cn。
 
 打印  发E-mail给: 
    
 
相关新闻 相关论文

图片新闻
科学家撰文探讨甲醇制烯烃领域相关发展 新型双金属协同催化体系助力多相催化加氢
摄影师助攻科学家解析“闪电烟花” 2024年全球气候多项指标创下惊人纪录
>>更多
 
一周新闻排行
 
编辑部推荐博文