复制成功

分享至

主页 > 数字货币 >

AI抢攻人类奥赛金牌!DeepMind数学模型做对25道IMO几何题,GPT-4惨败得0分

2024.01.18

原文来源:新智元

AI抢攻人类奥赛金牌!DeepMind数学模型做对25道IMO几何题,GPT-4惨败得0分

图片来源:由无界 AI生成

今天,谷歌DeepMind的AlphaGeometry模型登上了Nature!30道IMO几何题中,它能做出25道,已经接近人类金牌选手的水平!而GPT-4,却一道题都没做出来,直接挂了零蛋。

谷歌DeepMind的AI智能体,又破纪录了!

这个名叫AlphaGeometry的AI系统,能做出国际数学奥林匹克(IMO)的30道几何题中的25道,这个表现,已经接近了人类的奥数金牌得主。

从此,AI在数学领域的推理能力再次实现史诗级升级,超越此前的最高水平。

这一研究已经登上Nature。

AI抢攻人类奥赛金牌!DeepMind数学模型做对25道IMO几何题,GPT-4惨败得0分

论文地址:https://www.nature.com/articles/s41586-023-06747-5

下面这道IMO大赛几何真题,曾经难倒了一大批参赛选手,而如今,AI却能把做出来了!

更特别的是,这个模型是靠合成数据训练出来的,而非通常使用的真实数据。

AI抢攻人类奥赛金牌!DeepMind数学模型做对25道IMO几何题,GPT-4惨败得0分

训练过程是这样的:先初始生成了十亿个随机几何图形,全面分析每个图形中点和线的所有关系。

随后,AlphaGeometry找出了每个图形中所有的证明,并反向追溯出为得到这些证明所需添加的额外几何元素(如果有的话)。

AI抢攻人类奥赛金牌!DeepMind数学模型做对25道IMO几何题,GPT-4惨败得0分

就这样,AlphaGeometry结合了神经语言模型和符号演绎引擎的优势,已经形成了一个神经符号系统。

两个系统中一个提供快速提供直觉式的想法,另一个负责更谨慎理性的决策。一个大胆假设,一个小心求证,不断改进方案,为复杂的几何定理找到证明。

而合成数据的思路,也为大模型语料不足的问题,提供了崭新的出路。

网友惊呼:这简直就是创造了历史!

AI抢攻人类奥赛金牌!DeepMind数学模型做对25道IMO几何题,GPT-4惨败得0分

OpenAI研究科学家,德扑AI之父Noam Brown表示,「祝贺GoogleDeepMind团队取得这个成绩!看到AI在高等数学方面取得了如此大的进步,令人兴奋」。

AI抢攻人类奥赛金牌!DeepMind数学模型做对25道IMO几何题,GPT-4惨败得0分

真题实测



话不多说,我们直接上真题。

已知等腰三角形ABC中,AB和AC的边长相等,求证:∠ABC=∠BCA。

AI抢攻人类奥赛金牌!DeepMind数学模型做对25道IMO几何题,GPT-4惨败得0分

等腰三角形的底角相等,这是学过初中数学的人都知道的常识(等腰定理1),可是要怎么证明?

AI抢攻人类奥赛金牌!DeepMind数学模型做对25道IMO几何题,GPT-4惨败得0分

AlphaGeometry的做法是,通过运行符号推理引擎,来启动证明搜索。

这个引擎会从定理前提中不知疲倦地推导出新语句,直到定理被证明,或新语句被穷尽。

但如果符号引擎无法找到证明,语言模型就会构造一个辅助点,在符号引擎重试之前增加证明状态。

如是循环,一直到找到解决方案为止。

AI抢攻人类奥赛金牌!DeepMind数学模型做对25道IMO几何题,GPT-4惨败得0分

比如,在第一个辅助构造「D作为BC的中点」之后,环路终止了。

随后就开始证明过程,证明由另外两个步骤组成,这两个步骤都利用了中点的特性:「BD = DC」,「B,D,C是共线的」。

此后不断循环,直至证明∠ABC=∠BCA。

AI抢攻人类奥赛金牌!DeepMind数学模型做对25道IMO几何题,GPT-4惨败得0分

免责声明:数字资产交易涉及重大风险,本资料不应作为投资决策依据,亦不应被解释为从事投资交易的建议。请确保充分了解所涉及的风险并谨慎投资。OKEx学院仅提供信息参考,不构成任何投资建议,用户一切投资行为与本站无关。

加⼊OKEx全球社群

和全球数字资产投资者交流讨论

扫码加入OKEx社群

相关推荐

industry-frontier