语音
-
字节跳动发布全双工语音大模型Seeduplex,豆包实现”边听边说”
语音交互正在迎来一场静默的革命。近日,字节跳动正式公布新一代全双工语音交互系统Seeduplex,并将其率先接入豆包。这套系统最大的突破在于:它打破了传统语音助手”你说完、我再答”的单轮逻辑,实现了真正的边听边说,让人和 AI 的对话节奏更接近真人打电话。 核心看点 全双工架构:听说同步处理,不再是”听完再说”,对话中断感明显降低…
-
字节跳动发布全双工语音大模型Seeduplex:打电话能边听边讲
4月9日,字节跳动正式推出原生全双工语音大模型 Seeduplex,并已在豆包 App 全量落地。这也是行业内首个规模化应用的全双工语音大模型。 核心看点 打破传统 AI 语音”一问一答”的半双工模式,实现真正的边听边说 误回复率和误打断率相比半双工模型减少一半 抢话比例下降 40%,对话节奏更接近真人交流 对话流畅度 MOS 分提升 12%,整体通话满…
-
AI 行业日报 · 2026年3月7日 | OpenAI双向语音模型 美团上线OpenClaw服务
📰 AI 行业日报 · 2026年3月7日 📅 2026年3月7日 | 聚焦全球AI行业最新动态 🎯 今日核心要点 🎙️ 双向语音模型 OpenAI开发BiDi,被打断也能秒回 ⭐⭐⭐⭐⭐ 🔧 OpenClaw服务 美团联合联想百应上线远程部署 ⭐⭐⭐⭐ 🔒 AI安全审计 OpenAI推出Codex Security工具 ⭐⭐⭐⭐ 📧 Google Workspace 谷歌开源…
-
新发布的开源语音模型 Zonos
Zonos 被称为最强开源语音模型,其语音生成质量非常高,并且有中文版本。它包含两种 1.6B 模型,分别是 transformer 和 SSM。可以使用 5 到 30 秒的语音进行高保真语音克隆。还能够调节速度、音高、音频质量和情绪。通过添加文本和音频前缀,可以实现更丰富的说话人匹配效果。在 RTX 4090 显卡上运行时,实时率约为 2 倍。 详情: https://www…
