视频
-
拿2500万用户的团队不卷AI视频生成了,改做”视频PS”Buzzy,融了2000万美元
【核心看点】• AI视频公司Creati(2500万用户、1500万美元ARR)推出新产品Buzzy,不做视频”生成”,专做视频”修改”• 定位”视频版Photoshop”,用户上传已有视频,用自然语言描述修改需求即可完成换人、调光、去路人等操作• 已获红点2000万美元融资,不绑定单一基模,同时使用Sor…
-
阿里 HappyHorse 1.0 视频生成模型开启灰测:15 秒多镜头叙事,千问 App 免费体验
4月27日,阿里巴巴正式宣布视频生成模型 HappyHorse 1.0(欢乐马)开启灰度测试。这款此前神秘登顶 Artificial Analysis AI Video Arena 排行榜的模型,终于向大众揭开了面纱。全球创作者和企业用户可通过官网和阿里云百炼平台注册体验,普通用户则可在千问 App 中直接尝鲜。 核心看点 支持 15 秒多镜头叙事,可生成连贯剧情短片,支持多画…
-
腾讯视频宣布全AI制作长剧和电影,第三季度正式上线
在第十三届中国网络视听大会上,腾讯公司副总裁、腾讯在线视频董事长孙忠怀透露,腾讯视频正在用AI全流程制作十几集的剧集和90分钟的电影,预计第三季度对外发布。这标志着AI正式从短创意视频杀入长内容领域。 核心看点 全AI长内容:AI全流程制作十几集连续剧和90分钟电影,第三季度上线 行业首创:目前业界AI视频多为两三分钟的”玩梗”短视频,30分钟以上长内容…
-
火山引擎Seedance 2.0全面开放API:文图音视频四模态输入,视频生成进入SOTA时代
火山引擎今日正式上线 Seedance 2.0 系列 API 服务,面向企业和个人开发者全面开放其视频生成能力。作为当前视频生成领域的全球 SOTA 模型,Seedance 2.0 的推出标志着 AI 视频创作正式进入多模态工业化应用阶段。 核心看点 四模态融合输入:支持文字、图片、音频、视频四种模态输入,集成业界最全面的多模态内容参考和编辑能力 物理准确度大幅提升:在复杂交互…
-
阿里 HappyHorse 模型横空出世:AI视频生成登顶全球第一
4月10日,阿里官方正式”认领”了此前在AI视频领域引发轰动的神秘模型HappyHorse。 据悉,该模型由阿里ATH创新事业部独立研发,主打原生音视频一体化生成、多语言唇形同步等核心能力。根据第三方权威评测,HappyHorse已在文生视频和图生视频双赛道超越Seedance等头部竞品,跃居全球第一。 核心能力解析 原生音视频一体化:告别传统先生成视频…
-
通义万相视频生成模型在最新2.1版本
通义万相视频生成模型在2025年1月9日发布了2.1版本,带来了多项新功能和技术升级。以下是新版通义万相的主要功能、能力及技术架构的详细介绍: 主要功能和能力 技术架构 评测表现 通义万相2.1在视频生成领域的权威评测集VBench上登顶,超越了混元、海螺AI、Gen3、Pika等国内外视频生成模型。具体来看,VBench一共有16个评分维度,通义万相在运动幅度、多对象生成、空…
-
See3D 模型:能够利用无标注互联网视频进行3D 生成的模型
北京智源人工智能研究院推出的See3D模型是一项创新的技术,它能够利用无标注的互联网视频进行3D内容的生成。以下是See3D模型的一些关键特点: See3D模型的推出为3D生成领域带来了新的可能性,特别是在降低成本和提高效率方面,它为3D数据的采集和应用提供了一种新的解决方案。 项目地址: https://vision.baai.ac.cn/see3d
-
OpenAI 发布了 Sora
它支持高达 1080p 的分辨率,视频时长最长为 20 秒,并且可以选择宽屏、竖屏或方形格式。该工具提供文本转视频、图像转视频和视频转视频的功能。还配备了精美的分镜工具,能够帮助用户精准地指导视频创作。它包含 “精选” 和 “最近” 两个内容板块,用户可以从社区中获取灵感。此外,该工具内置了安全措施,以确保透明性并防止滥用。用户可以通过 Plus 订阅来使用这个工具,或者通过 …
-
Adobe联手MIT打造CausVid视频生成模型
Adobe与MIT合作推出的CausVid视频生成模型是一项突破性技术,它能够实现实时视频生成,极大地提升了视频内容创作的效率。以下是CausVid的一些关键特性: CausVid的出现标志着视频生成领域的一次重大突破,它将彻底改变我们创作和消费视频内容的方式,开启一个充满无限可能性的未来。 项目地址: https://causvid.github.io
-
MMAudio:输入视频或文本可自动给视频配音效
MMAudio是一项由伊利诺伊大学厄巴纳-香槟分校、Sony AI及Sony集团联合推出的新技术,它能够实现视频到音频的高质量合成。这项技术的核心创新在于利用视频和文本输入生成同步音频,从而拓展了音频生成的应用场景。MMAudio的设计使其能够在各种视听和音频文本数据集上进行训练,这种多模态联合训练的方式,不仅提高了合成音频的质量,还确保了生成的音频与视频帧之间的同步。 MMA…
