Google 将于 5 月 20 日在 I/O 上推出 Gemini 3.2 Flash，并以 1/15 成本实现与 GPT-5.5 相匹配的性能-区块链文库

据 Abacus.AI 首席执行官 Bindu Reddy 称，Google 计划在 5 月 20 日的 I/O 大会上发布 Gemini 3.2 Flash，其在代码和推理任务上的性能将达到 GPT-5.5 的 92%，同时将推理成本削减至仅为后者的 1/15 到 1/20。大多数查询的延迟将低于 200 毫秒。Reddy 将这一突破归因于 Google 的蒸馏和稀疏性技术，这些技术能在不出现通常在模型优化中所见的性能断崖的情况下，将前沿模型压缩到 Flash 级别。

免责声明：以上内容(如有图片或视频亦包括在内)均为平台用户上传并发布，本平台仅提供信息存储服务，对本页面内容所引致的错误、不确或遗漏，概不负任何法律责任，相关信息仅供参考。

本站尊重他人的知识产权、名誉权等法律法规所规定的合法权益!如网页中刊载的文章或图片涉及侵权，请提供相关的权利证明和身份证明发送邮件到qklwk88@163.com，本站相关工作人员将会进行核查处理回复

THE END

区块链专题

Google 将于 5 月 20 日在 I/O 上推出 Gemini 3.2 Flash，并以 1/15 成本实现与 GPT-5.5 相匹配的性能

平台公告