2026年05月的文章 第41页
Google DeepMind AI 联合数学家在 FrontierMath 第 4 级取得 47.9%,超越 GPT-5.5 Pro,解决了 3 个此前无法解决的问题
Google DeepMind 发布了 AI 共数学家(AI co-mathematician),一种多智能体数学研究助手,在 FrontierMath 第 4 级基准上实现 47.9% 的准确率,超越 GPT-5.5 Pro 在 5 月 9 日创下的先前纪录(...
Agent协调层赛道,到底有谁在做?我翻了一圈之后的笔记
前面写了四篇关于agent协调层的技术分析,从问题拆解、消息完整性、链上链下边界到节点设计,基本把'这个东西应该长什么样'梳理清楚了。 接下来一个自然的问题就是:有没有人在做?做到什么程度...
MCP、A2A、OAMS——Agent协议栈到底有几层?一个做集成的人的困惑
最近在尝试把几个不同来源的agent串成一条工作流,踩了不少协议层的坑。最大的感受是:大家都在说'互操作性',但真正动手接的时候才发现,协议和协议之间有一大片空白地带没人管。 这篇把我理解...
天扬科技计划在算力服务方面投入 35-40 亿人民币
中国 A 股上市公司天阳科技已宣布已签署协议,将在一个计算算力服务项目上投资 35 亿至 40 亿元人民币,并设有 60 个月的锁定期。该公司的业务涵盖人工智能、区块链以及面向金融行业的 fintech ...
OpenAI 的奖励系统无意中在包括 GPT-5.4 在内的 6 个模型上对思考链进行评分
根据 OpenAI 的对齐团队称,该公司最近发现了一个影响 6 个大型语言模型(包括 GPT-5.4)的关键训练错误:奖励机制无意中对模型的思维链进行了评分——即在生成答案之前的内部推理过程。GPT-5.5...
阿里巴巴未与 DeepSeek 进行谈判,市场消息人士在 5 月 9 日作出澄清
据《财新》5月9日报道的市场消息,阿里巴巴并未就融资与 DeepSeek 进行谈判。此澄清是在此前媒体报道称两家公司会谈已破裂之后作出。DeepSeek 于4月发起一轮重要的融资,吸引了腾讯和阿里巴巴的...
OpenAI 发布 Codex 迁移工具,用于从竞争性的 AI 助手导入配置
根据 OneMillion_AI(Beating),OpenAI 已在 Codex 中发布了一款迁移工具,使用户能够从其他 AI 编程助手导入配置和数据,包括 Claude Code。该工具通过 OpenAI 官方 Twitter 账号发布公告,可...
字节跳动在 5 月 9 日将 AI 基础设施支出提高 25% 至 2,000 亿元人民币
据媒体报道,字节跳动将其计划在 2026 年的人工智能基础设施支出提高 25% 至 2000 亿人民币,因为该公司在内存芯片成本上升的背景下加速部署人工智能。
伯恩斯坦在 IREN 于 34 亿美元的 NVIDIA AI 交易之后设定 100 美元目标价
据 Bernstein 分析师称,该公司在周五于宣布与 NVIDIA 达成长期战略合作之后,为 IREN 设定了 100 美元的目标价。该合作包括一份价值 34 亿美元的 AI 云合同,以及一项股权期权,使 NVIDIA 能以...
Anthropic 将 Claude 越狱率削减至 0%,采用新颖的对齐训练方法
Anthropic 最近发布了对齐研究,详细介绍了训练策略,这些策略在 Claude 4.5 及后续模型中消除了代理的不一致性,使测试中的勒索类行为降至 0%。团队发现,仅靠传统行为示范并无效,导致故障率...

