已故匈牙利数学家Paul Erd?s(1913—1996)曾自认为彻底解决了一道几何难题。如今,一款由OpenAI公司开发的聊天机器人却证明他错了。
Paul Erd?s一生发表1500多篇论文,留下超过1000个未解决的研究问题作为其精神遗产。图片来源:George Csicsery
5月20日,OpenAI宣布,其人工智能(AI)聊天机器人软件推翻了Erd?s提出的单位距离猜想。OpenAI的数学家仅通过向聊天机器人输入提示词,便攻克了这道长达80年的几何难题。
1946年,Erd?s推导出一种他认为最优的平面点阵排布方式,即让尽可能多的点之间的距离保持在给定范围内。他还提出,没有人能够做得更好。
现在,OpenAI表示其系统确实做到了这一点。它是通过运用代数数论中的相关技术实现的,这些技术使它能够选取坐标值为特定方程解的点。这一发现令数学家感到震惊。
“如果Erd?s还健在,他肯定会对这一进展赞不绝口。”美国佐治亚理工学院的数学家Tom Trotter说。他曾与Erd?s共同撰写过论文。
OpenAI的数学家Sebastien Bubeck表示,这是AI首次在科研领域独立产出重大学术成果。美国加州大学伯克利分校的数学家Tony Feng表示:“我一向对AI对数学领域的影响持审慎态度,但这次的成果实在令人惊叹。”
加拿大多伦多大学的数学家Daniel Litt,是OpenAI邀请来验证该证明的独立研究人员之一。他表示:“这是第一个完全由AI独立得出、本身就极具价值的研究结论。”
几何学中,可在平面上排布若干个点,让多组点对保持相等间距。例如,正九边形有九组等距点对,因其9条边长完全相等;在正方形网格上排布9个点,则能形成12组等距点对。
Erd?s证明了可以构造出越来越大的网格,其中包含的具有相同距离的点的数量会无限增加,其增长速度比点的数量增长速度略快。他还提出一个猜想,即没有人能找到一种更好的方法来排列如此多具有相同距离的点。
OpenAI则做到了这一点。该公司的AI模型是通过代数数论中的技术实现这一目标的,这使得它能够选择坐标值为特定方程解的点。Bubeck说,该模型已生成一条非常长的思考过程链,导致得出这一答案的提示是一个关于Erd?s猜想是否为真或为假的开放式问题,并非明确要求证明其错误。OpenAI的数学家Mehtaab Swahney说:“看到该模型像人类一样真正地对问题进行推理,这真是令人惊叹。”
这一推理过程包含在一份长达125页的文件中,但OpenAI尚未完全公布该文件内容。此外,该公司也未透露其模型的名称。Bubeck表示,这是一个实验性的通用推理模型,并非专门用于解决数学问题的模型,并且它完全自主地完成了所有工作,是根据一个单一的提示进行的,并且是对Erd?s问题的机器重写表述。
Bubeck表示,这种做法与利用AI解决数学问题的“编排”方法截然不同,在“编排”方法中,研究人员会使用大型语言模型(LLM),通过让模型不断纠正自身的错误来找到问题的解决方案。
相比之下,OpenAI系统给出的答案不会因提示语的表述方式不同而有太大差异。到目前为止,一些针对数学问题的最佳AI解决方案都需要大量试错过程,而提示语的使用也已变成一门艺术。“如今,你可以按照自己想要的任何方式提出问题,模型本身会正确理解问题。”Bubeck说。
Litt表示,该由AI生成的解决方案所使用的工具来自代数数论领域,这一事实表明,AI模型正在超越专业领域的“封闭体系”,实现更广泛的拓展。他还补充道,没有人类能够像LLM那样全面掌握数学文献的内容。
“我们所有人都曾预料到会有一天会看到这种情况,但没想到会这么快发生。”OpenAI的数学家Mark Sellke说,“这与一个月前我们所习惯看到的情况相比,是一个巨大飞跃。”
版权声明:凡本网注明“来源:中国科学报、科学网、科学新闻杂志”的所有作品,网站转载,请在正文上方注明来源和作者,且不得对内容作实质性改动;微信公众号、头条号等新媒体平台,转载请联系授权。邮箱:shouquan@stimes.cn。