TTS
-
阶跃StepAudio 2.5 TTS登顶全球前三,中国大模型语音合成冲进第一梯队
阶跃星辰的StepAudio 2.5 TTS模型在Artificial Analysis Speech Arena的全球盲测榜单中位列前三。这个榜可不是随便排的——它用的是Elo评分机制,让真实用户盲听对比,拼的是”听起来像不像人”。 核心看点 StepAudio 2.5 TTS在Speech Arena Leaderboard全球前三 采用盲测Elo评…
-
谷歌发布最强TTS模型Gemini-TTS:支持近70种语言,提示词即可调控情感风格
谷歌正式推出 Gemini-TTS 模型,在文本转语音(TTS)领域实现了重大突破。该模型可通过提示词直接调控语音的情感、节奏和风格,使合成语音更加自然细腻。 核心亮点 ✨ 提示词精确控制 Gemini-TTS 支持通过提示词精确控制语音的情感、节奏和风格。用户无需复杂的参数设置,只需用文字描述想要的语调、情感或风格,模型就能生成符合要求的语音输出。 🌍 近70种语言支持 该模…
-
高度真实和自然的文本到语音(TTS)转换模型-MetaVoice-1B
该模型拥有1.2亿个参数,经过了10万小时的语音数据训练。 * 专注于英语情感演讲* 跨语言语音克隆* 支持美国和英国声音的零样本克隆* 支持长篇内容语音合成 主要特点: 1、情感语音节奏和音调:MetaVoice-1B专注于英语语音的情感表达,提供流畅、自然的语音输出,无幻觉现象。 2、跨语言语音克隆:支持通过微调实现跨语言的声音克隆。例如,对于印度说话者,仅需1分钟的训练数…
