Meta 推出全能语音生成 AI 模型 Voicebox 支持六种语言和多种语音处理功能

– 今天，我们宣布了一项语音生成方面的突破。我们开发了Voicebox，这是一种先进的人工智能模型，可以执行语音生成任务，如编辑、采样和风格化。
– Voicebox可以生成高质量的音频剪辑并编辑预先录制的音频，如去除汽车喇叭或狗叫声，同时保留音频的内容和风格。该模型也是多语言的，可以用六种语言发音。
– 未来，像Voicebox这样的通用生成AI模型可以为虚拟助手和元宇宙中的非玩家角色提供自然的声音。它们可以让视障人士听到朋友用他们的声音朗读的书面消息，为创作者提供新的工具，轻松创建和编辑视频音轨等等。
– Voicebox的多功能性使其能够执行各种任务，包括：上下文文本到语音合成、语音编辑和降噪、跨语言风格转移、多样化语音采样等。
– Voicebox是我们生成AI研究的重要进展，我们期待继续在音频领域探索并看到其他研究人员如何在我们的工作基础上建立。了解更多关于Voicebox的信息。

官方介绍：

https://ai.facebook.com/blog/voicebox-generative-ai-model-speech/

本文地址：https://www.163264.com/4295