谷歌 Gemini Omni 视频模型曝光:一键去水印、替换物体,I/O 2026 见

谷歌的 AI 视频大招可能比我们想的更近。

就在 Google I/O 2026(5月19-20日)前夕,一个叫 Gemini Omni视频模型悄然现身在新版本 Gemini 应用的 UI 界面中,被眼尖的用户抓了个正着。

Omni 能做什么?

根据泄露的信息,Gemini Omni 的视频编辑能力远超现有模型:

  • 去水印——上传一段带水印的视频,Omni 可以直接把水印抹掉,效果自然到看不出痕迹
  • 物体替换——用嘴说一句”把蓝色的车换成红色”,视频里的车就真的变色了,光照、阴影、遮挡关系全自动适配
  • Sora 视频也能处理——甚至上传一段 OpenAI Sora 生成的视频,Omni 也能直接去掉水印,兼容性很强
  • 统一多模态——不同于独立的视频生成模型,Omni 是真正的全模态模型,文本、图片、视频在一个模型里搞定

这意味着谷歌想做的事情很明确:把视频 AI 从单独的工具,变成 Gemini 的原生能力。你不需要再切换到另一个页面去生成或编辑视频,在聊天界面里一句话就能搞定。

两个版本:Pro 和标准版

消息称谷歌可能会发布两个版本——一个 Pro 变体和一个标准版。Pro 版预计在处理更高分辨率、更复杂的编辑任务上更强,标准版则主打快速出片。

这也符合谷歌一贯的产品分层策略:Pro 给专业创作者,标准版给普通用户日常用。

取代 Veo 3.1?

有分析认为 Gemini Omni 可能会替代谷歌之前推出的 Veo 3.1 视频生成模型。毕竟趋势已经很明确了——独立的视频模型正在被全模态 AI 整合。

OpenAI 在做同样的事,谷歌也不例外。一个能同时理解文字、图片、视频,还能直接输出视频的大模型,才是下一代 AI 的形态。

不过 Omni 目前还只是 UI 泄露,正式发布要等下周的 Google I/O 2026。到时候谷歌会放出什么猛料,会不会直接开放公测,很快就能知道了。

本文地址:https://www.163264.com/11613

(0)
上一篇 1天前
下一篇 1天前

相关推荐