Thinking Machines 推出交互模型,响应时间为 200 毫秒,表现优于 GPT-Realtime-2.0

据 Beating、Thinking Machines(由前 OpenAI CTO Mira Murati 创立的实验室)称,该实验室发布了其 Interaction 模型的研究预览版。该模型具备原生的实时音频和视频处理能力,并实现 200 毫秒的微轮次响应。该模型使用户能够在同时聆听、观看和发言的同时,支持实时的用户中断。

TML-Interaction-Small 模型采用 2760 亿参数的 MoE 架构,每次推理激活 120亿参数。官方数据显示,该模型的语音轮次切换延迟为 0.40 秒,FD-bench V1.5 分数为 77.8,均超过 GPT-Realtime-2.0 和 Gemini 3.1 Flash Live。有限预览访问计划在未来数月推出。

© 版权声明
THE END
喜欢就支持一下吧
分享