视频
-
谷歌Gemini Omni登场:动动嘴就能改视频,AI创作进入对话时代
核心看点 Google I/O 2026 重磅发布 Gemini Omni,支持文本/图像/音频/视频多模态输入 用户通过自然语言指令即可编辑视频内容,添加/删除对象、切换镜头角度、修改风格 首款模型 Gemini Omni Flash 已上线 Gemini 应用,面向全球 AI 订阅用户开放 详细解析 在 2026 年 Google I/O 开发者大会上,谷歌正式推出了 Ge…
-
Google重磅发布Gemini Omni:一个模型生成万物,视频创作进入新纪元
核心看点:Google DeepMind刚刚发布了Gemini Omni,这是他们首款”万物生成”模型——能从任何内容生成任何内容,首发支持视频创作。这标志着AI多模态能力的一次质的飞跃。 什么是Gemini Omni? Gemini Omni不是简单的视频生成工具。它结合了Gemini的智能理解能力与Google的生成式媒体系统,实现了对世界理解、多模…
-
拿2500万用户的团队不卷AI视频生成了,改做”视频PS”Buzzy,融了2000万美元
【核心看点】• AI视频公司Creati(2500万用户、1500万美元ARR)推出新产品Buzzy,不做视频”生成”,专做视频”修改”• 定位”视频版Photoshop”,用户上传已有视频,用自然语言描述修改需求即可完成换人、调光、去路人等操作• 已获红点2000万美元融资,不绑定单一基模,同时使用Sor…
-
阿里 HappyHorse 1.0 视频生成模型开启灰测:15 秒多镜头叙事,千问 App 免费体验
4月27日,阿里巴巴正式宣布视频生成模型 HappyHorse 1.0(欢乐马)开启灰度测试。这款此前神秘登顶 Artificial Analysis AI Video Arena 排行榜的模型,终于向大众揭开了面纱。全球创作者和企业用户可通过官网和阿里云百炼平台注册体验,普通用户则可在千问 App 中直接尝鲜。 核心看点 支持 15 秒多镜头叙事,可生成连贯剧情短片,支持多画…
-
腾讯视频宣布全AI制作长剧和电影,第三季度正式上线
在第十三届中国网络视听大会上,腾讯公司副总裁、腾讯在线视频董事长孙忠怀透露,腾讯视频正在用AI全流程制作十几集的剧集和90分钟的电影,预计第三季度对外发布。这标志着AI正式从短创意视频杀入长内容领域。 核心看点 全AI长内容:AI全流程制作十几集连续剧和90分钟电影,第三季度上线 行业首创:目前业界AI视频多为两三分钟的”玩梗”短视频,30分钟以上长内容…
-
火山引擎Seedance 2.0全面开放API:文图音视频四模态输入,视频生成进入SOTA时代
火山引擎今日正式上线 Seedance 2.0 系列 API 服务,面向企业和个人开发者全面开放其视频生成能力。作为当前视频生成领域的全球 SOTA 模型,Seedance 2.0 的推出标志着 AI 视频创作正式进入多模态工业化应用阶段。 核心看点 四模态融合输入:支持文字、图片、音频、视频四种模态输入,集成业界最全面的多模态内容参考和编辑能力 物理准确度大幅提升:在复杂交互…
-
阿里 HappyHorse 模型横空出世:AI视频生成登顶全球第一
4月10日,阿里官方正式”认领”了此前在AI视频领域引发轰动的神秘模型HappyHorse。 据悉,该模型由阿里ATH创新事业部独立研发,主打原生音视频一体化生成、多语言唇形同步等核心能力。根据第三方权威评测,HappyHorse已在文生视频和图生视频双赛道超越Seedance等头部竞品,跃居全球第一。 核心能力解析 原生音视频一体化:告别传统先生成视频…
-
通义万相视频生成模型在最新2.1版本
通义万相视频生成模型在2025年1月9日发布了2.1版本,带来了多项新功能和技术升级。以下是新版通义万相的主要功能、能力及技术架构的详细介绍: 主要功能和能力 技术架构 评测表现 通义万相2.1在视频生成领域的权威评测集VBench上登顶,超越了混元、海螺AI、Gen3、Pika等国内外视频生成模型。具体来看,VBench一共有16个评分维度,通义万相在运动幅度、多对象生成、空…
-
See3D 模型:能够利用无标注互联网视频进行3D 生成的模型
北京智源人工智能研究院推出的See3D模型是一项创新的技术,它能够利用无标注的互联网视频进行3D内容的生成。以下是See3D模型的一些关键特点: See3D模型的推出为3D生成领域带来了新的可能性,特别是在降低成本和提高效率方面,它为3D数据的采集和应用提供了一种新的解决方案。 项目地址: https://vision.baai.ac.cn/see3d
-
OpenAI 发布了 Sora
它支持高达 1080p 的分辨率,视频时长最长为 20 秒,并且可以选择宽屏、竖屏或方形格式。该工具提供文本转视频、图像转视频和视频转视频的功能。还配备了精美的分镜工具,能够帮助用户精准地指导视频创作。它包含 “精选” 和 “最近” 两个内容板块,用户可以从社区中获取灵感。此外,该工具内置了安全措施,以确保透明性并防止滥用。用户可以通过 Plus 订阅来使用这个工具,或者通过 …
