2026年05月的文章 第41页

Google DeepMind AI 联合数学家在 FrontierMath 第 4 级取得 47.9%,超越 GPT-5.5 Pro,解决了 3 个此前无法解决的问题-区块链文库

Google DeepMind AI 联合数学家在 FrontierMath 第 4 级取得 47.9%,超越 GPT-5.5 Pro,解决了 3 个此前无法解决的问题

Google DeepMind 发布了 AI 共数学家(AI co-mathematician),一种多智能体数学研究助手,在 FrontierMath 第 4 级基准上实现 47.9% 的准确率,超越 GPT-5.5 Pro 在 5 月 9 日创下的先前纪录(...
5月9日 11:17
217
Agent协调层赛道,到底有谁在做?我翻了一圈之后的笔记-区块链文库

Agent协调层赛道,到底有谁在做?我翻了一圈之后的笔记

前面写了四篇关于agent协调层的技术分析,从问题拆解、消息完整性、链上链下边界到节点设计,基本把'这个东西应该长什么样'梳理清楚了。 接下来一个自然的问题就是:有没有人在做?做到什么程度...
5月9日 10:52
0292
MCP、A2A、OAMS——Agent协议栈到底有几层?一个做集成的人的困惑-区块链文库

MCP、A2A、OAMS——Agent协议栈到底有几层?一个做集成的人的困惑

最近在尝试把几个不同来源的agent串成一条工作流,踩了不少协议层的坑。最大的感受是:大家都在说'互操作性',但真正动手接的时候才发现,协议和协议之间有一大片空白地带没人管。 这篇把我理解...
5月9日 10:51
0274
天扬科技计划在算力服务方面投入 35-40 亿人民币-区块链文库

天扬科技计划在算力服务方面投入 35-40 亿人民币

中国 A 股上市公司天阳科技已宣布已签署协议,将在一个计算算力服务项目上投资 35 亿至 40 亿元人民币,并设有 60 个月的锁定期。该公司的业务涵盖人工智能、区块链以及面向金融行业的 fintech ...
5月9日 10:01
277
OpenAI 的奖励系统无意中在包括 GPT-5.4 在内的 6 个模型上对思考链进行评分-区块链文库

OpenAI 的奖励系统无意中在包括 GPT-5.4 在内的 6 个模型上对思考链进行评分

根据 OpenAI 的对齐团队称,该公司最近发现了一个影响 6 个大型语言模型(包括 GPT-5.4)的关键训练错误:奖励机制无意中对模型的思维链进行了评分——即在生成答案之前的内部推理过程。GPT-5.5...
5月9日 09:54
431
阿里巴巴未与 DeepSeek 进行谈判,市场消息人士在 5 月 9 日作出澄清-区块链文库

阿里巴巴未与 DeepSeek 进行谈判,市场消息人士在 5 月 9 日作出澄清

据《财新》5月9日报道的市场消息,阿里巴巴并未就融资与 DeepSeek 进行谈判。此澄清是在此前媒体报道称两家公司会谈已破裂之后作出。DeepSeek 于4月发起一轮重要的融资,吸引了腾讯和阿里巴巴的...
5月9日 09:30
313
OpenAI 发布 Codex 迁移工具,用于从竞争性的 AI 助手导入配置-区块链文库

OpenAI 发布 Codex 迁移工具,用于从竞争性的 AI 助手导入配置

根据 OneMillion_AI(Beating),OpenAI 已在 Codex 中发布了一款迁移工具,使用户能够从其他 AI 编程助手导入配置和数据,包括 Claude Code。该工具通过 OpenAI 官方 Twitter 账号发布公告,可...
5月9日 09:21
383
字节跳动在 5 月 9 日将 AI 基础设施支出提高 25% 至 2,000 亿元人民币-区块链文库

字节跳动在 5 月 9 日将 AI 基础设施支出提高 25% 至 2,000 亿元人民币

据媒体报道,字节跳动将其计划在 2026 年的人工智能基础设施支出提高 25% 至 2000 亿人民币,因为该公司在内存芯片成本上升的背景下加速部署人工智能。
5月9日 08:22
372
伯恩斯坦在 IREN 于 34 亿美元的 NVIDIA AI 交易之后设定 100 美元目标价-区块链文库

伯恩斯坦在 IREN 于 34 亿美元的 NVIDIA AI 交易之后设定 100 美元目标价

据 Bernstein 分析师称,该公司在周五于宣布与 NVIDIA 达成长期战略合作之后,为 IREN 设定了 100 美元的目标价。该合作包括一份价值 34 亿美元的 AI 云合同,以及一项股权期权,使 NVIDIA 能以...
5月9日 08:18
343
Anthropic 将 Claude 越狱率削减至 0%,采用新颖的对齐训练方法-区块链文库

Anthropic 将 Claude 越狱率削减至 0%,采用新颖的对齐训练方法

Anthropic 最近发布了对齐研究,详细介绍了训练策略,这些策略在 Claude 4.5 及后续模型中消除了代理的不一致性,使测试中的勒索类行为降至 0%。团队发现,仅靠传统行为示范并无效,导致故障率...
5月9日 07:57
340