【人工智能】DeepMind发布Alpha Geometry 2 | 攻克国际数学奥林匹克竞赛IMO几何难题 | 超越金牌得主水平 | 全新的语言模型和搜索算法 | 性能显著提升 | 人工智能领域的又一“AlphaGo时刻”
在科技圈人工智能领域竞争激烈的当下,谷歌DeepMind带着其最新成果AlphaGeometry 2 (AG2) 悄然惊艳了整个科技界。AG2在数学推理领域取得了突破性进展,甚至超越了国际奥林匹克数学竞赛 (IMO) 金牌得主的平均水平。
IMO面向全球高中生,汇聚了无数数学天才,其题目以难度高而闻名。几何题作为IMO的四大题型之一,逻辑性强,是检验AI系统高级数学推理能力的理想标杆。任何人工智能想要证明自己在数学领域的实力,都得在IMO几何题上接受考验。
2024年7月,谷歌DeepMind推出了AlphaGeometry 1 (AG1),它创新性地将语言模型和符号引擎结合在一起,在2000到2024年的IMO几何题中,解题率达到了54%,被人们称为数学领域的“AlphaGo时刻”。但AG1也存在局限,如领域语言范围有限、符号引擎效率有待提高、初始语言模型容量有限等。
为了克服AG1的局限,谷歌DeepMind的研究人员对系统进行了全面升级,打造出了更强大的AG2。AG2扩展了领域语言,涵盖了更广泛的几何概念,能够处理更复杂多样的几何问题。AG2的核心组件符号引擎也得到了全方位的升级,称为演绎数据库算术推理 (DDAR),在处理二重点、算法速度、实现方式等方面都有了显著改进。AG2还优化了训练数据,扩大了数据生成的来源,探索两倍大小的随机图,使得生成的问题更加复杂。数据分布也更加均衡,改进了数据生成算法,提高了数据生成的效率。此外,AG2还设计了一种名为搜索树的共享知识集合 (SKEST) 的新算法,可以并行执行多个不同配置的束搜索,并通过知识共享机制让这些搜索树相互帮助。AG2的语言模型也有了很大的改进,利用Gemini训练流程,将训练简化为一个阶段,对所有数据进行无监督学习。
经过这一系列的改进,AG2在2000 - 2024年IMO的50道几何题中,成功解决了其中的42道题,首次超越了IMO金牌得主的平均水平。其他AI模型的解题数远不及AG2,充分证明了AG2在解决IMO几何问题上的强大能力。
AlphaGeometry 2的推出具有重要的意义,它标志着人工智能在处理复杂数学推理任务方面实现了重大飞跃,对推动人工智能在数学领域的研究和应用有着深远的影响。在未来,人工智能或许可以帮助数学家们解决更多长期以来悬而未决的难题,为数学研究开辟新的思路和方法。同时,在教育领域,它也有可能成为一种辅助教学的工具,帮助学生更好地理解和掌握几何知识,提升数学学习的效率。AG2也让我们看到,随着技术的不断进步,AI在各个领域的应用将会越来越广泛,也倒逼着我们必须要尽快去思考如何更好地利用AI来为人类创造更多的福祉。