据 Beating、Thinking Machines(由前 OpenAI CTO Mira Murati 创立的实验室)称,该实验室发布了其 Interaction 模型的研究预览版。该模型具备原生的实时音频和视频处理能力,并实现 200 毫秒的微轮次响应。该模型使用户能够在同时聆听、观看和发言的同时,支持实时的用户中断。
TML-Interaction-Small 模型采用 2760 亿参数的 MoE 架构,每次推理激活 120亿参数。官方数据显示,该模型的语音轮次切换延迟为 0.40 秒,FD-bench V1.5 分数为 77.8,均超过 GPT-Realtime-2.0 和 Gemini 3.1 Flash Live。有限预览访问计划在未来数月推出。
© 版权声明
免责声明:以上内容(如有图片或视频亦包括在内)均为平台用户上传并发布,本平台仅提供信息存储服务,对本页面内容所引致的错误、不确或遗漏,概不负任何法律责任,相关信息仅供参考。
本站尊重他人的知识产权、名誉权等法律法规所规定的合法权益!如网页中刊载的文章或图片涉及侵权,请提供相关的权利证明和身份证明发送邮件到qklwk88@163.com,本站相关工作人员将会进行核查处理回复
THE END



