体验meta开源的专注于声音的 Generative AI 工具： AudioCraft

体验地址：

https://huggingface.co/spaces/facebook/MusicGen

我输入的提示词：

Summer nights, with stars filling the sky.

下面是它输出的音乐：

再试一个悲伤主题的：

可以通过输入文字描述来生成音频，包括音乐生成、音效生成和智能音频压缩三个主要功能。

官方介绍：

https://ai.meta.com/blog/audiocraft-musicgen-audiogen-encodec-generative-ai-audio/

AudioCraft是一个简单的框架，通过在原始音频信号上进行训练，从基于文本的用户输入中生成高质量、逼真的音频和音乐，而不是基于MIDI或钢琴卷轴。

AudioCraft包括三个模型：MusicGen、AudioGen和EnCodec。MusicGen通过Meta拥有和特许使用的音乐进行训练，从基于文本的用户输入生成音乐；而AudioGen通过公共音效进行训练，从基于文本的用户输入生成音频。

AudioCraft的模型可用于研究目的，帮助人们进一步了解这项技术，并且可以让研究人员和从业者训练自己的模型。

AudioCraft可以轻松地从文本生成音频，包括环境音效、音乐等。

AudioCraft简化了音频生成模型的设计，使人们能够在相同的代码基础上构建更好的声音生成器、压缩算法或音乐生成器。

AudioCraft的模型能够生成高质量的音频，并具有长期一致性，可以通过自然界面进行交互。

生成音频需要对不同尺度的复杂信号和模式进行建模，而AudioCraft通过学习原始信号中的离散音频令牌来解决这个挑战。

AudioCraft团队正在不断改进模型的速度和效率，并改进对模型的控制，以开拓新的用途和可能性。

通过开源研究和模型，AudioCraft希望促进创新，使所有人都能平等获得资源。

AudioCraft的开源基础将促进创新，为未来的音频和音乐制作提供支持。

AudioCraft的模型可以成为音乐家和声音设计师的专业工具，为他们提供灵感和帮助创作。

AudioCraft是生成AI研究的重要一步，相信其简单的方法将对高级人机交互模型的开发产生有意义的影响。期待看到人们用它创造出什么样的作品。

本文地址：https://www.163264.com/4693