科学网—DeepMind宣布AI测试得分达国际数学奥赛金牌水平

来源：中国科学报发布时间：2025-7-23

选择字号：小中大

DeepMind宣布AI测试得分达国际数学奥赛金牌水平

据新华社电 谷歌旗下DeepMind公司7月21日宣布，其搭载了“深度思考”能力的高级版“双子座（Gemini）”人工智能（AI）模型测试得分达到国际数学奥林匹克竞赛（IMO）金牌水平，该成绩已获官方认证。

“我们可以证实，谷歌DeepMind已达成这一备受期待的里程碑，在总分42分中获得35分——这已达到（今年）金牌分数线。”国际数学奥林匹克竞赛主席格雷戈尔·多利纳尔教授说。他称解题方案在诸多方面都“令人惊叹”。国际数学奥林匹克竞赛评分员认为这些方案清晰、精确，且大多数都易于理解。

国际数学奥林匹克竞赛自1959年起每年举办一届，参赛选手需在两天（每天各4.5小时）内解答涉及代数、组合数学、几何和数论四大领域的6道极具难度的题目。

DeepMind公司推出的AI模型AlphaProof与AlphaGeometry 2组合解答了2024年国际数学奥林匹克竞赛6道题中的4道，以28分的成绩达到当年银牌水平。为了让这两个模型理解题目，专家先将题目从自然语言翻译成特定计算机语言，解题总共耗费两到三天的计算时间。今年，高级版“双子座”测试成果相比去年有显著进展，它直接根据自然语言描述的题目给出数学证明，并在竞赛时限内完成挑战。

DeepMind公司说，今年取得的成果得益于高级版“双子座”的“深层思考”模式——这是一种针对复杂问题的增强推理模式，融合了“并行思维”等最新技术。这种模式设置可使模型在给出最终答案之前，同时探索并整合多种可能的解决方案，而非沿着单一、线性思路推进。

《中国科学报》 (2025-07-23 第2版国际)

编辑部推荐博文
国自然基金，这项优化让你的申请书更“吸睛”！科学网2026年1月十佳博文榜单公布！关于学者的思考长寿老人大脑能大量产生新神经元从植物符号学视角解读榴莲 EI会议合集计算机、光学、经管教育EI等多学科会议更多>>