谷歌的 AI 视频大招可能比我们想的更近。
就在 Google I/O 2026(5月19-20日)前夕,一个叫 Gemini Omni 的视频模型悄然现身在新版本 Gemini 应用的 UI 界面中,被眼尖的用户抓了个正着。
Omni 能做什么?
根据泄露的信息,Gemini Omni 的视频编辑能力远超现有模型:
- 去水印——上传一段带水印的视频,Omni 可以直接把水印抹掉,效果自然到看不出痕迹
- 物体替换——用嘴说一句”把蓝色的车换成红色”,视频里的车就真的变色了,光照、阴影、遮挡关系全自动适配
- Sora 视频也能处理——甚至上传一段 OpenAI Sora 生成的视频,Omni 也能直接去掉水印,兼容性很强
- 统一多模态——不同于独立的视频生成模型,Omni 是真正的全模态模型,文本、图片、视频在一个模型里搞定
这意味着谷歌想做的事情很明确:把视频 AI 从单独的工具,变成 Gemini 的原生能力。你不需要再切换到另一个页面去生成或编辑视频,在聊天界面里一句话就能搞定。
两个版本:Pro 和标准版
消息称谷歌可能会发布两个版本——一个 Pro 变体和一个标准版。Pro 版预计在处理更高分辨率、更复杂的编辑任务上更强,标准版则主打快速出片。
这也符合谷歌一贯的产品分层策略:Pro 给专业创作者,标准版给普通用户日常用。
取代 Veo 3.1?
有分析认为 Gemini Omni 可能会替代谷歌之前推出的 Veo 3.1 视频生成模型。毕竟趋势已经很明确了——独立的视频模型正在被全模态 AI 整合。
OpenAI 在做同样的事,谷歌也不例外。一个能同时理解文字、图片、视频,还能直接输出视频的大模型,才是下一代 AI 的形态。
不过 Omni 目前还只是 UI 泄露,正式发布要等下周的 Google I/O 2026。到时候谷歌会放出什么猛料,会不会直接开放公测,很快就能知道了。
本文地址:https://www.163264.com/11613

