Google DeepMind AI 联合数学家在 FrontierMath 第 4 级取得 47.9%，超越 GPT-5.5 Pro，解决了 3 个此前无法解决的问题-区块链文库

Google DeepMind 发布了 AI 共数学家（AI co-mathematician），一种多智能体数学研究助手，在 FrontierMath 第 4 级基准上实现 47.9% 的准确率，超越 GPT-5.5 Pro 在 5 月 9 日创下的先前纪录（39.6%）。该系统解决了 48 道题中的 23 道题，包括 3 道此前所有模型都无法解答的问题。该系统基于 Gemini 3.1 Pro 构建，采用分层架构：项目协调员智能体向子智能体分发任务，由子智能体分别负责文献检索、编码与推理，并在提交前由多个审阅智能体对证明进行验证。

Epoch AI 进行了盲测，确保 DeepMind 团队看不到题目，每道题允许进行 48 小时的计算。在实际应用中，数学家 Marc Lackenby 使用该系统解决了《Kourovka Notebook》中的一个未决猜想，展示了其实际研究价值。目前，该系统正处于测试版阶段，仅向少数数学家开放。

免责声明：以上内容(如有图片或视频亦包括在内)均为平台用户上传并发布，本平台仅提供信息存储服务，对本页面内容所引致的错误、不确或遗漏，概不负任何法律责任，相关信息仅供参考。

本站尊重他人的知识产权、名誉权等法律法规所规定的合法权益!如网页中刊载的文章或图片涉及侵权，请提供相关的权利证明和身份证明发送邮件到qklwk88@163.com，本站相关工作人员将会进行核查处理回复

THE END

区块链专题

Google DeepMind AI 联合数学家在 FrontierMath 第 4 级取得 47.9%，超越 GPT-5.5 Pro，解决了 3 个此前无法解决的问题

平台公告