IT之家7月26日消息,谷歌DeepMind团队昨日(7月25日)发布博文,表示其研发的AlphaProof和AlphaGeometry2模型可以解决数学中的高级推理问题,在解答国际数学奥林匹克竞赛难题方面达到银牌标准。
AI模型简介
AlphaProof:基于强化学习的全新数学形式推理系统。
AlphaGeometry2:几何解题系统的改进版。
DeepMind团队结合两个AI模型,协作解决了今年国际数学奥林匹克(IMO)6道题目中的4道,首次在竞赛中取得与银牌得主同等的成绩。
评分团队
DeepMind团队两位专家,根据IMO的评分规则进行评分,这两位专家分别为:
蒂莫西・高尔斯教授(ProfSirTimothyGowers):著名数学家、IMO金牌得主和菲尔兹奖得主。
约瑟夫-迈尔斯博士(DrJosephMyers):两届IMO金牌得主、IMO2024年问题遴选委员会主席
AI模型推理
AI会将IMO的6道题目翻译成为模型可以理解的数学语言。
AlphaProof通过确定答案并证明其正确性,解决了两个代数问题和一个数论问题,而其中解决的1个问题是比赛中最难的,在今年的IMO中只有5位选手解决了这一问题。
AlphaGeometry2证明了几何问题,没有解决2个组合问题。
AI模型结果
按照IMO规则,6道题目每道题可获得7分,总分最高为42分。
DeepMind系统最终获得了28分,每个问题都得到了满分,相当于银牌组的最高分。
2024年的金奖门槛从29分开始,在正式比赛中,609名参赛者中有58人获得了金奖。
未经允许不得转载:头条资讯网_今日热点_娱乐才是你关心的时事 » 银牌组最高分,谷歌DeepMind捅破AI数学推理上限:6道国际奥数题解出4道