创建或修改目录:/www/wwwroot/104.219.215.234/data 失败!
发布日期:2024-07-27 07:32 点击次数:192
【谷歌 DeepMind 的 AI 在海外数学奥林匹克竞赛中斩获银牌】谷歌 DeepMind 布告,其 AI 系统在本年海外数学奥林匹克竞赛的真题中发达出色。AI 完成了 6 谈题中的 4 谈,每谈题均获满分,荒谬于银牌最高分 28 分,距金牌仅 1 分。609 名参赛选手中,获金牌的只消 58 东谈主。在崇拜比赛中,东谈主类选手分两次提交谜底,每次限时 4.5 小时,而 AI 有的题几分钟答出,有的题却花了三天。这次建功的是两款 AI 系统——Proof 和 Geometry2。2024IMO 不在这两个 AI 的西席数据中。早在本年 1 月,谷歌 DeepMind 的第一代 Geometry 就登上了 Nature疯狂小学生,其时作念出了 IMO30 个几何题中的 25 谈。AI 工程师 Devin 背后创举东谈主之一 Scott Wu 感叹,从没念念过 10 年后奥林匹克竞赛会被 AI 处分。本年的 IMO 竞赛共有六谈赛题,触及代数、组合学、几何和数论,AI 作念出四谈。AI 的数学推聪慧商恐慌了评分教养 Timothy Gowers 和 Joseph Myers 博士。Proof 正确作念出两个代数题和一个数论题,Geometry2 作念出一起几何题,未攻克的只消两谈组合数学题。Proof 是基于强化学习的表情数学推理新系统,聚合了预西席的大言语模子和 Zero 强化学习算法。Geometry2 是升级版,是神经记号夹杂系统,基于 Gemini 的言语模子从新运转西席,基于更多合成数据,能作念更难几何题,收受更快记号引擎,还有新颖学问分享机制。在参赛前,Geometry2 已战绩累累疯狂小学生,这次在 19 秒内作念出问题 4。这些问题先被东谈主工翻译成崇拜数学言语,再交给 AI。AI 解题进程中,如 IMO2024 第一题,先给出定理,再分两个标真实认,依赖三个公理。第二题考试正整数对相干,AI 先确认突出解温存条款,再确认是独一解。P4 是几何确认题,由 Geometry2 在 19 秒内完成,解题用了高斯消元法等。第六题斟酌函数性质,AI 求解并给出确认政策。斯坦福大学和红杉的 Andrew Gao 确定这次 AI 打破道理,英伟达高档科学家 Jim Fan 指出大模子会在浅陋问题上出错,谷歌配置者负责东谈主称能处分辛勤数学、物理问题的模子是通向 AGI 的环节旅途。