|
|
知名学者发表论文,质疑2024年诺贝尔化学奖“不够格” |
|
文|《中国科学报》记者 赵广立 实习生 赵婉婷
2024年的诺贝尔奖,人工智能可谓“大赢家”,物理学奖和化学奖都与AI相关。其中,诺贝尔化学奖颁给了三位学者,以表彰他们在计算蛋白质设计和蛋白质结构预测方面取得的成就。
然而,最近一篇经过同行评议的公开论文,对2024年诺贝尔化学奖的评奖决定提出了质疑。论文作者指出,与获奖相关的蛋白质结构预测模型(AlphaFold和RoseTTAFold)无法预测功能性蛋白质的3D结构,“因此,这些成果称不上突破性发现,不值得诺贝尔奖”。
这篇题为《蛋白质结构预测中的量子力学悖论:与序列有内在联系,但又独立于序列》的论文4月9日发表于国际期刊Computational and Structural Biotechnology Reports(Computational and Structural Biotechnology Journal的姐妹刊)。
近日,《中国科学报》对该论文作者、美国伊利诺伊大学芝加哥分校药学院的兼职教授Sarfaraz K. Niazi进行了专访。
Niazi 1974年从伊利诺伊大学芝加哥分校药学博士毕业,之后留校任职。自2008年起,还任休斯顿大学兼职教授。根据其个人主页介绍,他在美国食品药品监督管理局(FDA)、欧洲药品管理局(EMA)和英国药品和健康产品管理局(MHRA)担任生物药品监管指导顾问,还“创建了美国首家生物仿制药公司”。
1 连发质疑论文,称最新一篇已被《自然》接收
《中国科学报》:我们注意到你在上个月发表了一篇质疑2024年诺贝尔化学奖授奖结果的论文。你在论文中用量子不可测量特性来比拟蛋白质结构预测的结果不可信,这样比较是否客观?这样的等效联系对生物医药学家而言,是否有失公正?
Sarfaraz K. Niazi:
这个类比其实非常好。当我们探测到一个粒子,它的波函数一定是坍缩的;虽然量子力学的尺度要小得多,但这样的类比我认为是准确的。
对蛋白质进行表征的行为破坏了其生理特性,数以百万计的冷冻蛋白质的结构(如低温图像)呈现的是静态结构,而这种静态结构与功能性结构毫无关联。因此,我提出的悖论是,基于静态结构的预测限制了功能蛋白质结构预测的范围。

Sarfaraz K. Niazi4月发表的论文
《中国科学报》:你是什么时候开始质疑这类蛋白质结构预测算法的局限性的?是什么改变了你对预测蛋白质结构实用性的看法?
Sarfaraz K. Niazi:
我们的第一篇相关论文是2024年1月发表的,名为《治疗性蛋白质开发中蛋白质结构预测算法的局限性》。当时,我们尝试用AlphaFold来预测所有获FDA批准的蛋白质药物的结构,结果我们发现,AlphaFold提供的蛋白质结构的置信度差异很大,对于较小的肽类置信度更低。
我们试图将这种置信度水平与蛋白质的多种物理化学性质联系起来、与所形成官能团的性质联系起来,但未发现置信度水平与任何性质存在相关性,氨基酸序列与任何性质之间也没有相关性。我们在这篇论文中报告了这一结果并提供了大量数据。
在上个月新发表的论文中,我提出,AlphaFold的预测基于蛋白质数据库(PDB)上可用的结构数据以及AlphaFold生成的内容。我们的测试表明,如果对一个全新氨基酸序列进行蛋白质结构的预测,AlphaFold就会完全失败。
我还有一篇讨论这一话题的论文已被《自然》接收,不久后大家也会看到。
《中国科学报》:你在4月的论文中提到,你曾与2024年诺贝尔化学奖获得者之一John Jumper取得了联系,并得到了他的回应,是否可以展开说说?
Sarfaraz K. Niazi:
2024年的论文发表后,我们联系了John Jumper,他的回复很直接,即我们永远不应将物理化学性质与氨基酸序列或AlphaFold的置信度分数联系起来。而对于主要的批评意见,即AlphaFold的整个学习过程都是基于已知结构这一点,他并没有给出解释。
Sarfaraz K. Niazi
2 发信给诺奖委员会未获回应,“意料之中”
《中国科学报》:这篇论文的发表是否顺利?论文审稿人、相关领域的同行和专家与你交流了哪些意见?
Sarfaraz K. Niazi:
这篇论文在被几家期刊拒稿后才得以发表。后来,出版《柳叶刀》的出版社(爱思唯尔)决定试一试,并将这篇论文发给六位以上的审稿人。
审稿人的回复多达几十页,首先批驳了我在文中指出这种预测完全错误的论调,并且提出这些算法已有成功的案例。我也针对他们的问题进行了详细阐述。经过数月的反复讨论,编辑们最终决定推翻审稿人的意见,发表了我的论文。
4月份我的论文发表后,我也收到了来自欧洲、美国、中国多位杰出科学家的邮件。所有的评论都非常鼓舞人心,没有人质疑我的假设。其中,有来自中国和德国的两位科学家建议我考虑新的计算模型。
结合他们的建议,目前我正在写一篇新的论文。我最近的尝试专注于通过与精细的力场和实验验证相结合,来减少量子力学悖论的限制,对蛋白质结构和动力学提出更完整的见解。
这段经历本身很有故事性。每当有人提出有争议的观点时——从伽利略提出地球绕太阳转而被处死开始,这种趋势就一直延续至今,尤其是涉及重大成果时。2023年的诺贝尔物理学奖颁给量子纠缠理论也经历了很长时间才获得认可。
《中国科学报》:你给诺贝尔奖委员会发过信件,是否得到了回应?
Sarfaraz K. Niazi:
我清楚,我所提出的观点极具争议性。我写信给诺贝尔奖委员会,分享我的论文和长篇讨论,但也告诉他们我不期望得到任何回复。最终果然没有回音,也不会有。
3 “欢迎批评意见,而不仅是赞同”
《中国科学报》:有观点认为,算法对于蛋白质结构预测虽然存在一定局限,但起码对科学研究有帮助、可以加速研发进展,因此,蛋白质结构预测算法在方法论上的突破仍值得赞誉,撤销诺贝尔奖没有必要。你如何回应这样的观点?
Sarfaraz K. Niazi:
这正是在各个学科中普遍存在的对科学的误解。
我的论点很简单:靶蛋白及其靶受体(同样是蛋白质)的三维结构完全依赖于热力学环境——Christian Anfinsen就曾证明了这一点,他也因此获得了1972年的诺贝尔化学奖。如果蛋白质的三维结构仅有几个选择,或有可能从不同条件下的溶剂或电解质中经研究推断出来,那人们大可反对我提出的观点;但由于蛋白质可能有数万亿的三维结构,算法是不可能预测的,无论其计算能力如何。
如果有人不认可我的观点,那说明他们同时否定了Anfinsen的结论和Cyrus Levinthal提出的悖论(注:Levinthal在1969年提出,如果一种蛋白质通过依次对所有可能的构象进行采样来获得其正确的折叠构型,那么它需要比宇宙年龄更长的时间才能得出其正确的天然构象)。
《中国科学报》:综合来看,你认为在蛋白质结构及功能的研究过程中,这类基于算法的预测工具的有效性究竟如何?研究者们应当如何理解、选择并合理使用这类AI辅助工具?
Sarfaraz K. Niazi:
我正是在这一点上遭到了很多人的反对。我想表明的是,如果预测目的是识别一个有活性的结构,那任何预测生理结构的算法都没有价值。并且,这与算法的计算能力无关,而与计算错误的属性有关,但这又是唯一可以被我们计算的属性(指静态结构)。
算法从已知的冷冻结构中学习,所以它只能提供一些关于冷冻结构的想法。基于Anfinsen的结论,这毫不奇怪,算法对预测新结构不起作用,而且即使对已知结构,置信度也很低。
《中国科学报》:你批判了这些试图获得蛋白质结构的技术手段,那你认为什么才是生命科学正确的科学研究路线?
Sarfaraz K. Niazi:
在我看来,诺贝尔化学奖的颁发不当。我们有必要将研究方向改变为实验设计,因为有数十亿美元被投入到基于人工智能的数据传递中,这使实验设计受到影响。
然而,要认同并实现这一想法并不容易——它是非此即彼的。对于这一认知,我们不能“公正地”持折中意见。我希望我的想法能很快得到讨论,希望我提出的质疑本身,在未来被认为是一个突破性的研究。当然,我也希望中国科学家能够了解这些信息,我希望得到他们的批评,而不仅仅是赞同。
相关论文信息:
https://doi.org/10.3390/biomedinformatics4010007
https://doi.org/10.1016/j.csbr.2025.100039
特别声明:本文转载仅仅是出于传播信息的需要,并不意味着代表本网站观点或证实其内容的真实性;如其他媒体、网站或个人从本网站转载使用,须保留本网站注明的“来源”,并自负版权等法律责任;作者如果不希望被转载或者联系转载稿费等事宜,请与我们接洽。