视频 | 第2页 | 梭哈 AI

谷歌Gemini Omni登场：动动嘴就能改视频，AI创作进入对话时代

核心看点 Google I/O 2026 重磅发布 Gemini Omni，支持文本/图像/音频/视频多模态输入用户通过自然语言指令即可编辑视频内容，添加/删除对象、切换镜头角度、修改风格首款模型 Gemini Omni Flash 已上线 Gemini 应用，面向全球 AI 订阅用户开放详细解析在 2026 年 Google I/O 开发者大会上，谷歌正式推出了 Ge…

Google Gemini 2026年5月21日

Google重磅发布Gemini Omni：一个模型生成万物，视频创作进入新纪元

核心看点：Google DeepMind刚刚发布了Gemini Omni，这是他们首款”万物生成”模型——能从任何内容生成任何内容，首发支持视频创作。这标志着AI多模态能力的一次质的飞跃。什么是Gemini Omni？ Gemini Omni不是简单的视频生成工具。它结合了Gemini的智能理解能力与Google的生成式媒体系统，实现了对世界理解、多模…

Google Gemini 2026年5月20日

拿2500万用户的团队不卷AI视频生成了，改做”视频PS”Buzzy，融了2000万美元

【核心看点】• AI视频公司Creati（2500万用户、1500万美元ARR）推出新产品Buzzy，不做视频”生成”，专做视频”修改”• 定位”视频版Photoshop”，用户上传已有视频，用自然语言描述修改需求即可完成换人、调光、去路人等操作• 已获红点2000万美元融资，不绑定单一基模，同时使用Sor…

应用 2026年5月2日

阿里 HappyHorse 1.0 视频生成模型开启灰测：15 秒多镜头叙事，千问 App 免费体验

4月27日，阿里巴巴正式宣布视频生成模型 HappyHorse 1.0（欢乐马）开启灰度测试。这款此前神秘登顶 Artificial Analysis AI Video Arena 排行榜的模型，终于向大众揭开了面纱。全球创作者和企业用户可通过官网和阿里云百炼平台注册体验，普通用户则可在千问 App 中直接尝鲜。核心看点支持 15 秒多镜头叙事，可生成连贯剧情短片，支持多画…

应用 2026年4月28日

腾讯视频宣布全AI制作长剧和电影，第三季度正式上线

在第十三届中国网络视听大会上，腾讯公司副总裁、腾讯在线视频董事长孙忠怀透露，腾讯视频正在用AI全流程制作十几集的剧集和90分钟的电影，预计第三季度对外发布。这标志着AI正式从短创意视频杀入长内容领域。核心看点全AI长内容：AI全流程制作十几集连续剧和90分钟电影，第三季度上线行业首创：目前业界AI视频多为两三分钟的”玩梗”短视频，30分钟以上长内容…

行业/好文 2026年4月16日

火山引擎Seedance 2.0全面开放API：文图音视频四模态输入，视频生成进入SOTA时代

火山引擎今日正式上线 Seedance 2.0 系列 API 服务，面向企业和个人开发者全面开放其视频生成能力。作为当前视频生成领域的全球 SOTA 模型，Seedance 2.0 的推出标志着 AI 视频创作正式进入多模态工业化应用阶段。核心看点四模态融合输入：支持文字、图片、音频、视频四种模态输入，集成业界最全面的多模态内容参考和编辑能力物理准确度大幅提升：在复杂交互…

应用 2026年4月14日

阿里 HappyHorse 模型横空出世：AI视频生成登顶全球第一

4月10日，阿里官方正式”认领”了此前在AI视频领域引发轰动的神秘模型HappyHorse。据悉，该模型由阿里ATH创新事业部独立研发，主打原生音视频一体化生成、多语言唇形同步等核心能力。根据第三方权威评测，HappyHorse已在文生视频和图生视频双赛道超越Seedance等头部竞品，跃居全球第一。核心能力解析原生音视频一体化：告别传统先生成视频…

模型框架 2026年4月10日

应用

通义万相视频生成模型在最新2.1版本

通义万相视频生成模型在2025年1月9日发布了2.1版本，带来了多项新功能和技术升级。以下是新版通义万相的主要功能、能力及技术架构的详细介绍：主要功能和能力技术架构评测表现通义万相2.1在视频生成领域的权威评测集VBench上登顶，超越了混元、海螺AI、Gen3、Pika等国内外视频生成模型。具体来看，VBench一共有16个评分维度，通义万相在运动幅度、多对象生成、空…

2025年1月10日

模型框架

See3D 模型：能够利用无标注互联网视频进行3D 生成的模型

北京智源人工智能研究院推出的See3D模型是一项创新的技术，它能够利用无标注的互联网视频进行3D内容的生成。以下是See3D模型的一些关键特点： See3D模型的推出为3D生成领域带来了新的可能性，特别是在降低成本和提高效率方面，它为3D数据的采集和应用提供了一种新的解决方案。项目地址： https://vision.baai.ac.cn/see3d

2024年12月14日

应用

OpenAI 发布了 Sora

它支持高达 1080p 的分辨率，视频时长最长为 20 秒，并且可以选择宽屏、竖屏或方形格式。该工具提供文本转视频、图像转视频和视频转视频的功能。还配备了精美的分镜工具，能够帮助用户精准地指导视频创作。它包含 “精选” 和 “最近” 两个内容板块，用户可以从社区中获取灵感。此外，该工具内置了安全措施，以确保透明性并防止滥用。用户可以通过 Plus 订阅来使用这个工具，或者通过 …

2024年12月14日