AI 共存派
-
HeyGen推出Avatar2.0 ,Instant Avatar 即时虚拟分身
详情: https://www.heygen.com/article/introducing-avatar-2-0-instant-avatar HeyGen的“即时化身”是一项新技术,可以在短短5分钟内简化个性化化身的创建过程,使先进的工作室技术普及化。它通过翻译工具支持可扩展的定制视频内容和多语言能力。这一创新将改变企业的视频制作方式,实现独特的故事叙述和个性化互动。 &#…
-
AI 能将视频中的主题转化为 SVG 素描 – sketchvideo
AI 能将视频中的主题转化为 SVG 素描!因此,素描视频合成可以实现各种渲染技术,包括调整大小、填充颜色以及在原始背景图像上叠加涂鸦。 项目地址: https://sketchvideo.github.io/ 这篇内容介绍了一种基于优化的视频素描生成框架,通过使用逐帧的贝塞尔曲线来表示视频。首先,通过交叉帧笔画初始化方法来确定每条曲线的位置和宽度。然后,通过利用基于CLIP特…
-
Meta推出了一款名为Audiobox的音频生成模型,通过语音输入和自然语言文本提示来生成语音和音效
Meta推出了一款名为Audiobox的音频生成模型,它可以通过语音输入和自然语言文本提示来生成语音和音效,用于创建自定义音频。据Meta称,Audiobox是第一个支持语音和文本双输入进行语音重新设计的模型。Meta将在接下来的几周内开放基于Audiobox的应用程序,并展示Audiobox功能的交互式演示。 详情: https://ai.meta.com/blog/audi…
-
在速度提升30倍的情况下生成与Stable Diffusion v1.5相当的图像质量的方法:DMD
Adobe和麻省理工学院的研究人员共同发布论文,介绍一种分布匹配蒸馏(Distribution Matching Distillation,DMD)方法,可在速度提升30倍的情况下生成与Stable Diffusion v1.5相当的图像质量。 项目地址: https://tianweiy.github.io/dmd/
-
一个专门针对角色动画的新框架Animate Anyone,可从静态图像AI生成动态视频
来自阿里的研究团队发布论文,利用扩散模型的能力,提出了一个专门针对角色动画的新框架Animate Anyone,可从静态图像AI生成动态视频,从而将任意角色动画化。 论文地址: https://arxiv.org/pdf/2311.17117.pdf
-
基于大学知识的多模态LLM测评基准MMMU发布
《专家级人工智能的大规模多学科多模态理解和推理基准》是一个新的基准,旨在评估多模态模型在大规模多学科任务上的专家级理解能力。该基准包括来自大学考试、测验和教科书的11500个精心收集的多模态问题,涵盖了艺术与设计、商业、科学、健康与医学、人文与社会科学以及技术与工程等六个核心学科。与现有的基准不同,该基准侧重于具有领域特定知识的高级感知和推理,挑战模型执行类似于专家面临的任务。…
-
Meta AI 发布实时人工智能语言翻译模型:Seamless,可以实时翻译100多种语言,延迟不到2秒钟
在我们与SeamlessM4T的合作基础上,我们今天公开发布了一些改进,这些改进可以跨语言保留表达,并将延迟降低到约两秒。在我们日益互联的世界中,语言差异可能成为沟通的障碍,翻译系统可以使来自不同语言背景的人更无缝地分享知识和经验。然而,如今许多这些系统并不能保留人类沟通所具有的关键要素。具体而言,传达我们想要表达的不仅仅是我们选择的词语,还有我们说话的方式。语调、停顿和强调都…
-
MagicDance:序列动作+角色参考生成动作视频
摘要:在这项工作中,我们提出了MagicDance,一种基于扩散的模型,用于挑战性的人类舞蹈视频的二维人体动作和面部表情转移。具体而言,我们的目标是在保持身份不变的情况下,生成任何目标身份驱动的人类舞蹈视频,其驱动因素是新颖的姿势序列。为此,我们提出了一个两阶段的训练策略,用于解开人体动作和外观(例如面部表情、肤色和着装)之间的关系,包括对外观控制块的预训练和对相同数据集的人类…
-
还没试用 OpenAI 新发布的 TTS 文字转语音?
有人询问有多少人还没有试用OpenAI新发布的TTS文字转语音,提供了一个在线版本的链接,可以直接在网页上输入文字,并提供了多种男声和女声选择,无需安装和部署,还免费试用。其中一个评论试用了中文绕口令,使用了喜欢的声音。 地址: https://huggingface.co/spaces/ysharma/OpenAI_TTS_New
-
OpenAI首个开发者日:自定义GPT、GPT商店太炸,还有模型更强更便宜了
机器之心报道 机器之心编辑部 真如 Sam Altman 此前所言,OpenAI 首届开发者大会为人们带来了一些非常棒的新东西。 继今年春天发布 GPT-4 之后,OpenAI 又创造了一个不眠夜。 过去一年,ChatGPT 绝对是整个科技领域最热的词汇。OpenAI 也依靠 ChatGPT 取得了惊人的成绩:总结来说,OpenAI 证实 ChatGPT 目前每周有超过 1…