Gemini Spark 正式上线：谷歌的24小时AI管家开始替你干活了

Table of Contents

核心看点

Gemini Spark 正式向美国 AI Ultra 用户开放 Beta 测试，7×24 小时后台运行的个人 AI Agent 成为现实
搭载 Gemini 3.5 Flash 模型，输出速度 289 tokens/秒，比 GPT-5.5 和 Claude Opus 4.7 快 4 倍以上
深度整合谷歌全家桶：Gmail、Docs、Sheets、Slides、Calendar，自动执行多步骤任务
Google 搜索迎来 25 年来最大升级，AI Mode 以 Gemini 3.5 Flash 作为全球默认模型
AI Ultra 订阅新增 $100/月档位，最高档从 $250 降至 $200

详细解析

1. Gemini Spark：你的私人 AI 管家终于来了

6月初，谷歌正式向美国 AI Ultra 订阅用户（$100/月及以上）开放了 Gemini Spark 的 Beta 测试。这是谷歌在 I/O 2026 大会上最受瞩目的产品之一——一个可以 7×24 小时持续运行的个人 AI Agent。

Spark 运行在 Google Cloud 的专用虚拟机上，这意味着即使你合上笔记本电脑、关掉手机，它依然在后台默默工作。它深度整合了 Gmail、Docs、Sheets、Slides、Calendar 等谷歌全家桶，能够自动执行跨应用的多步骤任务。

几个典型场景：

工作场景：你对 Spark 说”汇总过去一周 Gemini 相关的所有信息，起草给团队的邮件”，它会自动跨 Gmail、Docs、聊天记录抓取信息，调用你的个人写作风格，全程后台完成，你只需最后审核发送。
生活场景：规划街区派对，Spark 自动创建 RSVP 追踪表、连接 Gmail 实时更新、起草邮件、生成宣传 PPT，全程无需你打开任何 App。
监控场景：设置触发条件，比如监控信用卡账单提醒新增订阅费用，或持续跟踪收件箱中的重要动态。

Spark 还支持自定义 Skills，你可以让它学习你的个人语气、偏好和工作方式。未来还将支持通过短信和邮件与 Spark 交互、创建自定义子 Agent，以及操控本地浏览器。

2. Gemini 3.5 Flash：谷歌史上最强编码和 Agent 模型

Spark 的底层搭载的是 Gemini 3.5 Flash，这是谷歌在 I/O 2026 上发布的最新旗舰模型。官方定位很明确：”迄今为止最强的编码、智能体模型”。

数据说话：

Terminal-Bench 2.1（编码能力）：76.2%
GDPval-AA（真实世界 Agent 任务）：1656 Elo
MCP Atlas（大规模工具使用）：83.6%
CharXiv Reasoning（多模态理解）：84.2%

这四项核心基准全面超越了上代旗舰 Gemini 3.1 Pro。更夸张的是速度——289 tokens/秒，比 GPT-5.5 和 Claude Opus 4.7 快 4 倍以上。执行长程任务的成本通常低于其他前沿模型 50% 以上。

目前 Gemini 3.5 Flash 已经登陆 Gemini App、Google Search AI Mode（全球默认模型）、Antigravity 2.0、Gemini API 和 Android Studio。

3. Gemini Omni：任意输入，生成视频

除了文本模型，谷歌还推出了 Gemini Omni 全模态生成模型。这是谷歌首次将生成式 AI 能力直接整合进视频编辑流程。

Omni 的核心差异在于”多轮对话式编辑”和”物理世界理解”：它不只是”生成一次完事”，而是支持在原有视频基础上反复叠加指令，且保持角色和物理逻辑的连贯性。比如拍摄一段手掌视频，加一句话”手掌上出现黑洞”，它就能生成对应效果；街景视频变成赛博朋克场景，多轮编辑中角色保持一致。

Omni Flash 已经上线 Gemini App、Google Flow 和 YouTube Shorts（免费）。所有生成视频都内嵌 SynthID 数字水印，人眼不可察觉但可检测。

4. Antigravity 2.0：93 个 Agent 12 小时造出操作系统

Antigravity 2.0 是谷歌的 Agent-first 开发平台，从 IDE 进化为独立桌面应用。最震撼的演示：93 个子 Agent 并行工作，发出超 15,000 次模型请求，处理 26 亿 token，12 小时后从零构建出功能完整的操作系统内核——调度程序、内存管理、文件系统一应俱全，最终在 AI 写的 OS 上成功运行 DOOM。

API 总费用不到 1000 美元。

核心升级包括动态子 Agent 生成（主 Agent 自动拆解任务并分配给子 Agent）、异步任务管理、Scheduled Tasks（定时任务），以及新的斜杠命令如 /goal（Agent 一口气跑完任务）、/grill-me（Agent 反向提问搞清楚需求再动手）。

谷歌内部使用 Antigravity 处理的 token 量从 3 月的每天 5000 亿增长到现在的每天 3 万亿，增幅约 6 倍。

5. Google 搜索 25 年来最大升级

Google Search 接入 Gemini 3.5 Flash，宣布”25 年来最大升级”。主要变化包括：

全新 AI-powered 搜索框，理解复杂自然语言查询
搜索结果可自动生成 mini 应用：查询旅行计划直接生成可交互的行程应用
AI Mode 以 Gemini 3.5 Flash 为默认模型，面向全球所有用户

6. 定价重构：AI Ultra 新增 $100 档位

Gemini App 迎来”Neural Expressive”全新设计，计费模式从”按订阅套餐”改为算力计费（按实际使用的计算量计费）。

AI Ultra 订阅调整：

AI Ultra Beta（Spark 入口）：新增 $100/月
AI Ultra 最高档：从 $250/月降至 $200/月

总结

Google I/O 2026 是谷歌历年发布密度最高的一届大会。从 Gemini 3.5 Flash 的极致速度，到 Gemini Spark 的 7×24 小时个人 Agent，再到 Gemini Omni 的全模态视频生成，谷歌正在从”提供 AI 工具”转向”替你完成工作”。

Agent 时代的竞争已经正式开打。OpenAI 有 GPT-5.5，Anthropic 有 Claude Opus 4.7，而谷歌的打法是：用速度最快的模型 + 最深的生态整合 + 7×24 不间断运行的 Agent，直接嵌入你每天都在用的 Gmail、Docs、Calendar 里。

Spark 的 Beta 已经开放，Pro 版本和 Omni Pro 也已经在路上。接下来的几个月，我们将看到这场 Agent 大战如何演变。

本文地址：https://www.163264.com/12570