音频 | 梭哈 AI

AI 日报

AI日报：豆包音频生成模型1.0发布；企业微信内测AI Agent大圆；Cursor发布全自主训练大模型 16

欢迎来到【AI日报】栏目！这里是你每天探索人工智能世界的指南，每天为你呈现AI领域的热点内容，聚焦开发者，助你洞悉技术趋势、了解创新AI产品应用。新鲜AI产品点击了解：https://app.aibase.com/zh 1、豆包音频生成模型1.0 发布，开启音频导演时代豆包音频生成模型1.0正式发布，通过多模态参考生成和长时音色一致性技术，彻底革新了传统音频制作流程。创作者…

6天前

AI 日报

AI日报｜豆包音频模型1.0登场，Cursor自研大模型，企业微信AI Agent内测

今天AI圈又热闹了。豆包、Cursor、企业微信、OpenAI、阿里云、即梦AI轮番上场，从音频生成到代码安全，从办公提效到视频4K，各家都在秀肌肉。来，快速过一遍今天值得关注的动态。豆包音频生成模型1.0：普通人也能当”音频导演” 字节跳动的豆包团队今天正式推出了音频生成模型1.0。这不是简单的文字转语音，而是能让你输入一段描述，直接生成一段完整的、…

6天前

开源项目

MMAudio：输入视频或文本可自动给视频配音效

MMAudio是一项由伊利诺伊大学厄巴纳-香槟分校、Sony AI及Sony集团联合推出的新技术，它能够实现视频到音频的高质量合成。这项技术的核心创新在于利用视频和文本输入生成同步音频，从而拓展了音频生成的应用场景。MMAudio的设计使其能够在各种视听和音频文本数据集上进行训练，这种多模态联合训练的方式，不仅提高了合成音频的质量，还确保了生成的音频与视频帧之间的同步。 MMA…

2024年12月14日