模型框架
-
阿里云推出数字人视频生成工具 Live Portait
阿里云推出数字人视频生成工具 Live Portait,上传一张照片和一段文本或语音即可生成一段开口说话的数字人视频,可应用于视频直播、聊天机器人、企业营销等场景。 体验地址: https://modelscope.cn/studios/DAMOXR/LivePortrait/summary/
-
风险投资公司在 Github 上开源了 AI Town 代码
风险投资公司 Andreessen Horowitz (a16z) 已在 Github 上开源了 AI Town 代码,允许开发人员创建由人工智能驱动的虚拟世界。 地址: https://github.com/a16z-infra/ai-town
-
视频生成视频的AI模型CoDeF,可在线使用,效果好,稳定不跳帧
蚂蚁集团、香港科技大学、浙江大学发布的视频生成视频的AI模型CoDeF,可在线使用,效果好,稳定不跳帧。 项目地址: https://qiuyu96.github.io/CoDeF/ 这篇内容介绍了一种新型的视频表示方法,称为内容变形场(CoDeF)。它由一个聚合整个视频中静态内容的规范内容场和一个记录从规范图像到每个单独帧的变形场组成。通过精心设计的渲染流程,这两个场可以联合…
-
Stability AI 发布 Control-LoRA适用于 SDXL 的 ControlNet
Stability AI 发布 Control-LoRA,体积小,可玩度高,适用于 SDXL 的 ControlNet,目前支持深度、边缘线、黑白上色和两张图混合。 模型地址: https://huggingface.co/stabilityai/control-lora
-
名为Mantella的AI Mod可以让《上古卷轴5》中的NPC复活。
YouTube博主Art from the Machine发布了一个新的AI Mod,名为Mantella,可以让《上古卷轴5》中的NPC复活。 地址: https://www.nexusmods.com/skyrimspecialedition/mods/98631/
-
一个提示词可同时体验8种AI绘画模型Zoo
这个网站提供了8种AI绘画模型生成的图片,用户只需输入提示词就可以比较各个模型的效果。核心功能包括文本到图像生成和多个模型选择,用户可以根据需求选择不同的模型进行图像生成。此外,这是一个开源项目,用户可以自由使用、修改和贡献代码,促进了AI技术的共享和进步。 网址: https://zoo.replicate.dev/ 不同模型下的猫 来源:https://mp.weixin.…
-
短视频自动化框架ShortGPT:简化视频制作的过程
ShortGPT是一个强大的框架,用于自动化内容创作。它简化了视频制作、素材获取、配音合成和编辑任务。 它支持多种语言的配音和内容创作,并自动生成视频字幕。通过连接网络和Pexels API,它可以获取图像和视频素材。使用TinyDB可以确保自动化编辑变量的长期持久性。安装和运行ShortGPT可以使用Google Colab或按照指南在本地系统上进行。 Shor…
-
文本到视频:AnimateDiff



项目介绍: https://animatediff.github.io/ 代码: https://github.com/guoyww/animatediff/ 论文: https://arxiv.org/abs/2307.04725 – 文本到图像模型和个性化技术的进步使得每个人都能以较低的成本将他们的想象力体现为高质量的图像。 – 存在对图像动画技术的…
-
之前大火的可以通过拖动操纵图像的模型DragGAN 源代码发布了!
之前发过的: AI 绘图工具DragGAN:你可以自由地调整图片上的控制点/手柄 DragGAN是由谷歌、麻省理工学院和马克斯普朗克研究所创建的一种新的人工智能模型。可以让你轻松通过点击拖动等简单的交互操作就能改变拍摄对象的姿势、形状和表情等 今天开源代码发了~ https://github.com/XingangPan/DragGAN 在线体验地址: https://hugg…
-
Meta开源的文本音乐生成模型 MusicGen,随心所欲创造独一无二的音乐
我直接来体验一下: 1,输入你要的音乐类型,用文本描述,支持中文 2,你也可以上传个音频旋律(可以不传,只输入文本内容) 3,点击生成,稍等片刻即可听到根据你文本内容的音乐。 我输入的是欢快的儿歌。 谷歌和Meta都推出了文本音乐生成模型,Meta的MusicGen可以免费使用。 音乐生成是一个具有挑战性的任务,需要对长序列进行建模,同时考虑到音乐的复杂结构和不和谐的容错率。 …
