体验meta开源的专注于声音的 Generative AI 工具: AudioCraft

体验地址:

https://huggingface.co/spaces/facebook/MusicGen

我输入的提示词:

Summer nights, with stars filling the sky.

下面是它输出的音乐:

再试一个悲伤主题的:

可以通过输入文字描述来生成音频,包括音乐生成、音效生成和智能音频压缩三个主要功能。

官方介绍:

体验meta开源的专注于声音的 Generative AI 工具: AudioCraft

https://ai.meta.com/blog/audiocraft-musicgen-audiogen-encodec-generative-ai-audio/

AudioCraft是一个简单的框架,通过在原始音频信号上进行训练,从基于文本的用户输入中生成高质量、逼真的音频和音乐,而不是基于MIDI或钢琴卷轴。

AudioCraft包括三个模型:MusicGen、AudioGen和EnCodec。MusicGen通过Meta拥有和特许使用的音乐进行训练,从基于文本的用户输入生成音乐;而AudioGen通过公共音效进行训练,从基于文本的用户输入生成音频。

AudioCraft的模型可用于研究目的,帮助人们进一步了解这项技术,并且可以让研究人员和从业者训练自己的模型。

AudioCraft可以轻松地从文本生成音频,包括环境音效、音乐等。

AudioCraft简化了音频生成模型的设计,使人们能够在相同的代码基础上构建更好的声音生成器、压缩算法或音乐生成器。

AudioCraft的模型能够生成高质量的音频,并具有长期一致性,可以通过自然界面进行交互。

生成音频需要对不同尺度的复杂信号和模式进行建模,而AudioCraft通过学习原始信号中的离散音频令牌来解决这个挑战。

AudioCraft团队正在不断改进模型的速度和效率,并改进对模型的控制,以开拓新的用途和可能性。

通过开源研究和模型,AudioCraft希望促进创新,使所有人都能平等获得资源。

AudioCraft的开源基础将促进创新,为未来的音频和音乐制作提供支持。

AudioCraft的模型可以成为音乐家和声音设计师的专业工具,为他们提供灵感和帮助创作。

AudioCraft是生成AI研究的重要一步,相信其简单的方法将对高级人机交互模型的开发产生有意义的影响。期待看到人们用它创造出什么样的作品。


来源:https://mp.weixin.qq.com/s/uKPAil1VOZ7MXkEsyxLCeA

本文地址:https://www.163264.com/4693

(0)
打赏 微信扫一扫,鼓励一下~ 微信扫一扫,鼓励一下~
上一篇 2023年8月5日 下午9:45
下一篇 2023年8月5日 下午9:45

相关推荐