应用
-
一个开源的「贴纸生成器」StickerBaker
开源贴纸制作工具StickerBaker,傻瓜式操作即可,输入关键词就能生成卡通贴纸,支持批量制作多样化贴纸。 StickerBaker是一个使用fofr/sticker-maker强大功能的应用,为用户提供高效、便捷的贴纸制作体验。它不仅支持批量制作贴纸,还能一次性创建多个独特的贴纸,为聊天和分享增添更多乐趣。 无论你想制作具有地域特色的贴纸,如乌克兰国旗色的豹子,还是创造出…
-
Suno 发布AI音乐生成模型V3 Alpha 版本
更好的音质和更高的表现力+其他强烈要求的功能:– 提升音质和表现力– 加强其他重要功能 最大生成长度增加到两分钟– 将生成音乐的最大长度延长至两分钟 更快的生成速度– 加快音乐生成的速度 特定乐器的专门支持– 提供对特定乐器的专业支持 扩大语言覆盖范围– 增加支持的语言种类 从任何地方继续– 允…
-
剪映海外版CapCut推出了文字生成视频功能
剪映海外版CapCut推出了文字生成视频功能,每个用户每天可免费生成五次。该功能支持中文提示词,但生成的内容质量目前较低。 可以通过文本生成4秒的视频支持多种4:3、9:16等多种比例的视频类型。 体验地址: https://www.capcut.com/editor-tools/ai-video-generator
-
Stability AI 的 Stable Video官网正式上线,支持上传图片和文字提示生成视频
Stability AI 官方的 SVD 视频生成平台公测了,功能上就是 SVD 模型增加了镜头控制能力。 每天会有 150 的免费额度可以生成 15 个视频,可以去体验一下。 平台帮助模型获取标记数据的设计比较有意思。类似的视频生成平台可以参考。 首先是在视频生成等待的过程中会出现一个弹窗,会展示两个社区的视频让用户评选哪个好。 另外是生成视频之后也会又一个评价的气泡,你可以…
-
秘塔AI搜索metaso有意思,关键词去搜索,搜完总结归纳,并把来源也告诉你
这个秘塔AI搜索不错。丢个问题给它,它去帮你变换关键词去搜索,搜完总结总结,并把来源也告诉你。搜素时可选择简洁、深入、研究三种模式,给出的结果包含总数、大纲和来源。体验地址:https://metaso.cn/
-
Meta等发布视频剪辑AI Agent,能实现素材概览、创意头脑风暴、视频检索、故事板、剪辑修剪等
2月16日,来自多伦多大学、Meta、加州大学圣迭戈分校的研究团队在arXiv上发表论文,提出利用大模型的多功能语言能力。作者构建了视频剪辑工具LAVE,其引入了一个基于大模型的规划与执行智能体,能实现素材概览、创意头脑风暴、视频检索、故事板、剪辑修剪等功能。 论文地址: https://arxiv.org/pdf/2402.10294.pdf
-
一个可控的虚拟服装试穿开源工具-OOTDiffusion,和模特非常贴合
可以根据不同性别和体型自动调整,和模特非常贴合。也可以根据自己的需求和偏好调整试穿效果 OOTDiffusion支持半身模型和全身模型两种模式。 主要功能: 1、基于潜在扩散的装备融合:利用潜在扩散模型(latent diffusion models)的先进技术,OOTDiffusion实现了高质量的服装图像生成和融合,确保试穿效果自然且逼真。 2、半身和全身虚拟试穿:OOTD…
-
MIT研究团队开发的项目PixelPlayer,能自动从视频中识别和分离出不同的声音源
PixelPlayer:MIT研究团队开发的项目,能自动从视频中识别和分离出不同的声音源,并与画面位置匹配。 例如,它可以识别出视频中哪个人物正在说话或哪个乐器正在被演奏。 而且还能够分别提取和分离这些声音源的声音。 PixelPlayer能自我学习分析,无需人工标注数据。 这种能力为音视频编辑、多媒体内容制作、增强现实应用等领域提供了强大的工具,使得例如独立调整视频中不同声音…
-
Vercel将9个AI集成到了一起,用户可以在一个界面上尝试多种模型,生成文本、图像、音频等内容
Vercel将9个人工智能整合在一起,并创建了一个新的模型播放器,用户可以在一个界面上尝试多种模型,生成文本、图像、音频等内容。 Vercel为人工智能应用提供了丰富的产品基础设施,包括聊天机器人来增强客户服务流程,带有语义搜索的推荐系统,检索增强生成(RAG)和生成图像服务等。 为了使这一切更加简单,Vercel还提供了一套工具(AI SDK),帮助开发者在他们的网站上快速使…
-
ML Blocks:让用户可以轻松创建复杂的图像处理工作流,无需编写代码
该工具提供了一个简单易用的界面,让用户可以轻松创建复杂的图像处理工作流,无需编写代码。 用户只需要将不同的功能块组合在一起,例如图像编辑功能和AI模型,就可以实现个性化的图像自动化处理。 这个工具主要解决电商领域中批量处理图片的问题。 ML Blocks允许用户创建自定义的图像处理工作流,可以处理多步骤的图像生成或分析管道,使用基于图的工作流。用户只需要按照顺序连接几个块,比如…
