谷歌 Gemini Omni 视频模型曝光：一键去水印、替换物体，I/O 2026 见

谷歌的 AI 视频大招可能比我们想的更近。

就在 Google I/O 2026（5月19-20日）前夕，一个叫 Gemini Omni 的视频模型悄然现身在新版本 Gemini 应用的 UI 界面中，被眼尖的用户抓了个正着。

Table of Contents

Omni 能做什么？

根据泄露的信息，Gemini Omni 的视频编辑能力远超现有模型：

这意味着谷歌想做的事情很明确：把视频 AI 从单独的工具，变成 Gemini 的原生能力。你不需要再切换到另一个页面去生成或编辑视频，在聊天界面里一句话就能搞定。

消息称谷歌可能会发布两个版本——一个 Pro 变体和一个标准版。Pro 版预计在处理更高分辨率、更复杂的编辑任务上更强，标准版则主打快速出片。

这也符合谷歌一贯的产品分层策略：Pro 给专业创作者，标准版给普通用户日常用。

有分析认为 Gemini Omni 可能会替代谷歌之前推出的 Veo 3.1 视频生成模型。毕竟趋势已经很明确了——独立的视频模型正在被全模态 AI 整合。

OpenAI 在做同样的事，谷歌也不例外。一个能同时理解文字、图片、视频，还能直接输出视频的大模型，才是下一代 AI 的形态。

不过 Omni 目前还只是 UI 泄露，正式发布要等下周的 Google I/O 2026。到时候谷歌会放出什么猛料，会不会直接开放公测，很快就能知道了。

本文地址：https://www.163264.com/11613