语音 | 第2页 | 梭哈 AI

字节跳动发布全双工语音大模型Seeduplex，豆包实现”边听边说”

语音交互正在迎来一场静默的革命。近日，字节跳动正式公布新一代全双工语音交互系统Seeduplex，并将其率先接入豆包。这套系统最大的突破在于：它打破了传统语音助手”你说完、我再答”的单轮逻辑，实现了真正的边听边说，让人和 AI 的对话节奏更接近真人打电话。核心看点全双工架构：听说同步处理，不再是”听完再说”，对话中断感明显降低…

模型框架 2026年4月13日

字节跳动发布全双工语音大模型Seeduplex：打电话能边听边讲

4月9日，字节跳动正式推出原生全双工语音大模型 Seeduplex，并已在豆包 App 全量落地。这也是行业内首个规模化应用的全双工语音大模型。核心看点打破传统 AI 语音”一问一答”的半双工模式，实现真正的边听边说误回复率和误打断率相比半双工模型减少一半抢话比例下降 40%，对话节奏更接近真人交流对话流畅度 MOS 分提升 12%，整体通话满…

模型框架 2026年4月11日

AI 日报

AI 行业日报 · 2026年3月7日 | OpenAI双向语音模型美团上线OpenClaw服务

📰 AI 行业日报 · 2026年3月7日 📅 2026年3月7日 | 聚焦全球AI行业最新动态 🎯 今日核心要点 🎙️ 双向语音模型 OpenAI开发BiDi，被打断也能秒回 ⭐⭐⭐⭐⭐ 🔧 OpenClaw服务美团联合联想百应上线远程部署 ⭐⭐⭐⭐ 🔒 AI安全审计 OpenAI推出Codex Security工具 ⭐⭐⭐⭐ 📧 Google Workspace 谷歌开源…

2026年3月7日

开源项目

新发布的开源语音模型 Zonos

Zonos 被称为最强开源语音模型，其语音生成质量非常高，并且有中文版本。它包含两种 1.6B 模型，分别是 transformer 和 SSM。可以使用 5 到 30 秒的语音进行高保真语音克隆。还能够调节速度、音高、音频质量和情绪。通过添加文本和音频前缀，可以实现更丰富的说话人匹配效果。在 RTX 4090 显卡上运行时，实时率约为 2 倍。详情: https://www…

2025年2月11日

语音

字节跳动发布全双工语音大模型Seeduplex，豆包实现”边听边说”

字节跳动发布全双工语音大模型Seeduplex：打电话能边听边讲

AI 行业日报 · 2026年3月7日 | OpenAI双向语音模型 美团上线OpenClaw服务

新发布的开源语音模型 Zonos

AI 行业日报 · 2026年3月7日 | OpenAI双向语音模型美团上线OpenClaw服务