作者:张双虎 来源: 中国科学报 发布时间:2020-12-10
选择字号:
阿尔法“再下一城”
结构生物学家有望被“解放”

 

AlphaFold让结构生物学从业者从现有结构解析手段对时间、环境的高要求中解放出来。图片来源:Unsplash

■本报记者 张双虎

继阿尔法围棋(AlphaGo)战胜职业围棋选手李世石后,人工智能(AI)再下一城,这次它将“目光”锁定在结构生物学。近日,在国际蛋白质结构预测赛(CASP)中,谷歌旗下DeepMind团队的阿尔法折叠(AlphaFold 2)摘得桂冠。在CASP的一系列测试中,AlphaFold 2斩获92.4分,在最具挑战的自由建模蛋白质测试中也获得87分,预测蛋白质结构的准确率甚至可以与实验方法媲美。

一时间,AlphaFold 2被“颠覆”“革命性突破”“诺奖级成果”等词汇围绕。有人称其解决了“困扰生物学家50年的问题”,有人担忧“结构生物学家是否会因此失业”。

人工智能再次完胜人类,究竟意味着什么?

AI破解生物学难题

人体内有成千上万种不同的蛋白质,蛋白质的功能很大程度上取决于其独特的结构。弄清楚蛋白质的折叠形状被称为“蛋白质折叠问题”。在过去50年中,这一直是生物学界的重大挑战。

此前,生物学家主要利用X射线晶体学或冷冻电镜等实验手段来破译蛋白质的三维结构,但这类方法耗时长、成本高。

预测蛋白质结构的CASP竞赛始于1994年,今天它已成为该领域交流新技术的国际平台。2018年,DeepMind 团队推出 AlphaFold 1参加第13届CASP竞赛,并取得不俗的成绩。今年参赛的系统是新版本的AlphaFold 2。此次比赛中,AlphaFold 2以高分领先,高出第二名25分。

CASP竞赛创始人之一、美国马里兰大学教授约翰·蒙特认为,人工智能预测蛋白质结构的结果与实际对照,达到90分即可与人类实验方法获得的结果媲美。美国密苏里大学哥伦比亚分校讲座教授许东认为,AlphaFold 2可以满足95%以上的理解功能、实验设计等需求,达到了应用的标准。

夺冠当日,DeepMind在官网发布新闻稿称,对于困扰生物学界50年的“蛋白质折叠”难题,AlphaFold 2已成为业内专家认可的解决方案。《自然》新闻评论更是以《它将改变一切》为题,指出DeepMind在解决蛋白结构问题上“迈出一大步”。

12月6日,在智识学研社与智源社区策划的“智2平方”论坛中,中国人民大学数学科学研究院教授龚新奇表示,在结构生物学领域,测蛋白质序列很容易,解析蛋白质结构很困难。AlphaFold的出现,验证了人工智能解决这一难题的可能性,这是一项突破。人类对蛋白质结构了解得越多,对生命科学、药物研发等的贡献越大。

清华大学生命科学学院教授王宏伟认为,这有可能为结构生物学的从业者带来“解放”:从业者不再受制于现有结构解析手段对时间、环境的高要求,能够很快拿到某个蛋白质的结构,以尽快探讨结构生物学的核心问题。

人机协同的结果

AlphaFold 1参加第13届CASP竞赛后,DeepMind团队在《自然》杂志发表文章,公开AlphaFold 1的代码。目前,DeepMind团队还没有发表关于AlphaFold 2的论文并公布相关数据,只在官网公布了相关消息就引起AI领域和生物学界的轩然大波。

“AlphaFold 2的相关文章还没有看到。以我对Alpha系列的了解,应该还是集成数据驱动机器学习诸多算法的创新应用之一。”浙江大学人工智能研究所所长吴飞告诉《中国科学报》,“这相当于从包含了无穷多种答案的空间中,通过学习、优化、搜索等技术,找到一种合适的解决方法。”

吴飞举例说,比如人类产生“恐惧”的情绪,需要在成千上万个神经元中锁定某种组合,形成某种神经回路结构,才会在功能上产生这种情绪。人类蛋白质的组成结构非常复杂,要从海量的组合中,找到某种特定的组合非常困难。由于计算机的计算能力非常强大(可以理解为计算机的学习模式能力和穷举搜索能力强),能帮助人们从几亿个结构里,找到某个特定的结构以及该结构能对应某个特点功能。

“这是一种大数据驱动的人工智能方法,是以深度学习和搜索组合优化相结合的整体应用。”吴飞说,“AlphaFold 2的成功基于算法、模型、算力以及该领域已有知识,这些元素缺一不可。”

吴飞进一步解释说,AlphaFold 2在一个具体任务中取得巨大成功,也许源于其在模型上的组合式创新。另外,DeepMind团队也收集了一批一一对应的数据,即蛋白质的结构和功能一一对应的数据。在算力上,因为要从无穷多的组合里面,找到一个对应的功能,需要对蛋白质大数据中蕴含的模式进行学习,对可能的答案空间进行搜索,同时提高大规模计算能力,这是人机协同的胜利。

超越人类还差一大步

“目前主流的机器学习技术还依赖于统计学习。在数据量大、人工难以靠直觉分析规律的领域,相对来说人工智能具有优势。”北京航空航天大学教授李甲告诉《中国科学报》。

吴飞也强调,在某些特定领域,人工智能拥有人类无法企及的能力,特别是在以海量数据搜索为导向的领域。

“就像有一颗珍珠沉入太平洋海底,人们都知道它在里面,但就是无法锁定它的具体位置。如果依靠人力去寻找,可能就是一项无法完成的任务。但人工智能可以凭借巨大的存储能力、超强的搜索能力和对数据高效利用的能力轻而易举找到它。”吴飞说。

2016年,DeepMind团队的AlphaGo战胜围棋大师李世石,曾掀起AI界和围棋界的滔天巨浪,AlphaGo也在很大程度上改变了人们对AI的认知。

在围棋比赛中,每一步都有一个“最优落子”的选择,人类不可能在大脑里把几十亿个落子情况都推演一遍,但是计算机就拥有这样的能力。

“AlphaFold 2和之前的AlphaGo类似,是机器学习模型的进步和算力的提升,以及‘标签数据’指导下完成的任务。”吴飞说,“即使在某些特定领域,也不能说是‘人工智能超越了人类’,而应该叫做‘人机协同完成’。”

吴飞认为,人工智能的成功基于‘模式学习和模式匹配’能力。比如,人们经常用到的人脸支付功能,人工智能并非精准‘识别’出你的脸,而是从几十万张人脸数据中,找到与你匹配的人脸模式。如果它发现相似度超过90%,就判断是你。

如果问人工智能,“为什么认为这张脸是我?”“人工智能就是有嘴也解释不清。”吴飞说,“人工智能是某些领域中非常好的工具,可以在某项任务中节省大量人力和时间,但对这个结果的利用,还要依靠人类专家来完成。如果将这种工具和人类的优势结合,协同赋能,就能加快创新,带来科学研究上的飞跃,进而改变人类生活。”

《中国科学报》 (2020-12-10 第3版 信息技术)
 
 打印  发E-mail给: 
    
 
相关新闻 相关论文

图片新闻
史上最亮伽马射线暴来自一颗坍缩的恒星 中国天眼揭秘宇宙“随机烟花”
导师:年年审毕业论文,总有这些问题! 科学家发现第一颗拥有永久黑暗面的行星
>>更多
 
一周新闻排行 一周新闻评论排行
 
编辑部推荐博文