Step Audio 2.5 实时发布：主观评分 80.41 分，较 GPT-Realtime-1.5 大幅领先 18%，语音通话费用 3.8 元/小时-区块链文库

据 Beating，Step Audio 2.5 Realtime（Step Cosmos 的端到端实时语音模型）于 2026 年 4 月在其开放平台 API 上线。该模型强调自然对话，支持可定制的角色人设，并具备副语言感知（语调、停顿、叹息）。

在官方五个维度的测试中，Step Audio 2.5 Realtime 在所有类别中均排名第一。主观评估得分（真实用户手机应用对话）达到 80.41，而 GPT-Realtime-1.5 为 68.01，Gemini Live 为 67.16。语音问答基准得分为 79.80，几乎是 GPT-Realtime-1.5 的 1.5 倍（53.20）。API 定价：每百万输入 token 收取 10 元（缓存命中为 2 元），每百万输出 token 收取 70 元；持续语音通话预计为每小时 3.8 元。

免责声明：以上内容(如有图片或视频亦包括在内)均为平台用户上传并发布，本平台仅提供信息存储服务，对本页面内容所引致的错误、不确或遗漏，概不负任何法律责任，相关信息仅供参考。

本站尊重他人的知识产权、名誉权等法律法规所规定的合法权益!如网页中刊载的文章或图片涉及侵权，请提供相关的权利证明和身份证明发送邮件到qklwk88@163.com，本站相关工作人员将会进行核查处理回复

THE END

区块链专题

Step Audio 2.5 实时发布：主观评分 80.41 分，较 GPT-Realtime-1.5 大幅领先 18%，语音通话费用 3.8 元/小时

平台公告