作者:陈曦 来源:科技日报 发布时间:2026/5/25 16:50:59
选择字号:
我国突破超大规模AI药物筛选技术:千亿级分子库秒级检索

 

记者5月25日从国家超级计算天津中心获悉,由该中心党组书记、首席科学家孟祥飞和清华大学智能产业研究院兰艳艳教授领衔的AI生物医药团队,研发的面向超大规模药物发现的人工智能虚拟筛选平台——GalaxyVS正式发布。该平台依托新一代天河超算系统,在全球范围内首次实现对近千亿级可合成化合物空间的秒级虚拟筛选,将传统需数月甚至数年的药物早期筛选过程缩短至数十秒。

长期以来,创新药物研发面临“双十”困境——耗时超十年、投入超十亿美元。其中,从海量化合物中找到能靶向特定蛋白的活性分子尤为关键。传统实验筛选成本高、周期长,常规分子对接方法计算效率有限且假阳性率较高。随着可合成化合物库迈入千亿乃至万亿级规模,现有虚拟筛选技术在算法、算力、存储和工程化能力上均面临严峻挑战。

“GalaxyVS不是对既有模型的简单放大,而是围绕近千亿级化学空间重构了一套‘AI模型+超级计算+高性能检索+药物化学约束’的全流程平台。”项目团队核心成员、国家超级计算天津中心李培顺博士介绍。平台以清华大学智能产业研究院团队前期发表于《科学》杂志的DrugCLIP模型为基础,将蛋白口袋与小分子映射到统一向量空间,把传统依赖逐一对接的蛋白—配体匹配问题,转化为可大规模并行执行的高维向量快速检索问题,从根本上突破了传统分子对接在速度和规模上的限制。

在算力层面,GalaxyVS充分发挥新一代天河超算的大规模并行能力。团队基于YH-Torch智能计算框架,对DrugCLIP模型开展国产异构算力适配与深度优化,替换传统CUDA/GPU依赖,使近千亿级分子编码从算法设想真正转化为可稳定运行的超算工程。在检索环节,系统引入磁盘原生图索引框架并结合定制化内存预加载机制,有效解耦共享存储瓶颈与计算执行过程,为超大规模虚拟筛选提供了关键吞吐能力。

GalaxyVS超大规模小分子药物虚拟筛选方法

实测数据显示,系统利用千级DSP节点完成全模式生物物种约400万个靶点口袋的高效编码,并在2万多个计算节点上开展超大规模分子检索。单次检索千亿分子库几十秒内即可完成,平均单个靶点口袋检索用时不到1秒。系统日吞吐量达约16万亿次分子对接,比当前国际最先进的超算纪录高出6个数量级。

李培顺强调:“我们不仅追求‘筛得快’,更追求‘筛得准、筛得新、筛得稳’。”面对超大化学空间中候选分子易集中于少数相似骨架的问题,GalaxyVS基于分子指纹对全库进行结构聚类与分片,引入多样性因子保证筛选结果具有丰富的分子骨架和结构多样性,并进一步引入高保真亲和力预测模型进行重排序,实现高速粗筛与精准精筛的协同统一。

李培顺表示,这一平台将有效破解传统药物研发中“活性分子稀少、可筛空间不足、候选分子同质化”的难题,为肿瘤、神经退行性疾病、新发传染病、罕见病等领域的先导分子发现提供全新路径,同时在突发公共卫生事件中可大幅提升药物研发响应速度。

未来,GalaxyVS有望进一步拓展至跨物种蛋白—配体互作图谱构建、大规模开放数据集建设和AI驱动药物发现基础设施建设,推动药物研发从经验试错走向数据驱动、从局部筛选走向全局探索、从单一模型走向系统工程。

 
特别声明:本文转载仅仅是出于传播信息的需要,并不意味着代表本网站观点或证实其内容的真实性;如其他媒体、网站或个人从本网站转载使用,须保留本网站注明的“来源”,并自负版权等法律责任;作者如果不希望被转载或者联系转载稿费等事宜,请与我们接洽。
 
 打印  发E-mail给: 
    
 
相关新闻 相关论文

图片新闻
镍基高温超导机制重要实验证据获发现 万米深渊发现“石茸”
中欧联合研制科学卫星“微笑”卫星升空 玄武岩能让水泥更“绿色”
>>更多
 
一周新闻排行
 
编辑部推荐博文