
一种结合基因表达数据的AI方法有助于加快药物研发。图片来源:Qilai Shen
本报讯 在用人体细胞的复杂数据进行训练后,一种人工智能(AI)模型有望为开发新药提供一条捷径。在这项10月23日发表于《科学》的研究中,科学家利用AI模型加快了从海量化合物中筛选候选药物的烦琐过程。
北京大学教授邓宏魁认为,这是一幅蓝图,它创造了一个从自己的实验中学习的“智能”筛查系统。
几十年来,研究人员一直通过大型化学数据库寻找药物,并测试每种化合物对实验室培育细胞的影响。近年来,研究人员期望利用新的筛选方法,审查过去10年积累的单细胞基因组数据,进而评估化合物是如何扰乱整个基因活性网络的,最终为药物发现开辟新的途径。
然而,美国麻省理工学院的生物医学工程师Alex Shalek说,这通常会筛选数以万计或更多的化合物,成本高且费时、费力。
为了找到一种利用基因组数据的简单方法,Shalek与其他研究人员和美国马萨诸塞州萨默维尔的一家生物技术公司Cellarity合作,训练了一个名为DrugReflector的深度学习模型。该模型基于公开数据,可以分析近9600种化合物如何干扰50多种细胞中的基因活性。
研究人员使用DrugReflector寻找能够影响血小板和红细胞生成的化学物质,这种特性可能有助于治疗某些血液疾病。之后,他们测试了其中107种化学物质,以确定后者是否具有预期的效果。
研究人员发现,与依赖从化学数据库中随机选择化合物的标准“暴力”药物筛选法相比,DrugReflector在查找相关化合物方面的效率高17倍。当研究人员将第一轮筛选的数据纳入模型后,其成功率又翻了一番。
美国得克萨斯大学安德森癌症中心的癌症数据科学家Bissan Al-Lazikani说,这种方法可以大大降低筛选新药所需的劳动力,需要筛选的化合物从以前的100万种减少到几百种。
邓宏魁指出,这样的方法可以帮助他的实验室成员寻找能够重新编程细胞以呈现新身份的化合物。他同时表示,DrugReflector目前仅限于评估其训练组中的近9600种化合物,无法发现真正的新分子。
科学家的终极梦想是设计一个可以直接利用分子化学结构预测生物效应的系统。邓宏魁认为,目前的技术很有前景,但它的准确性和泛化能力仍有待提高。(赵婉婷)
相关论文信息:
https://doi.org/10.1126/science.adi8577
《中国科学报》 (2025-10-29 第2版 国际)