Gemini Spark 正式上线:谷歌的24小时AI管家开始替你干活了

核心看点

  • Gemini Spark 正式向美国 AI Ultra 用户开放 Beta 测试,7×24 小时后台运行的个人 AI Agent 成为现实
  • 搭载 Gemini 3.5 Flash 模型,输出速度 289 tokens/秒,比 GPT-5.5 和 Claude Opus 4.7 快 4 倍以上
  • 深度整合谷歌全家桶:Gmail、Docs、Sheets、Slides、Calendar,自动执行多步骤任务
  • Google 搜索迎来 25 年来最大升级,AI Mode 以 Gemini 3.5 Flash 作为全球默认模型
  • AI Ultra 订阅新增 $100/月档位,最高档从 $250 降至 $200

详细解析

1. Gemini Spark:你的私人 AI 管家终于来了

6月初,谷歌正式向美国 AI Ultra 订阅用户($100/月及以上)开放了 Gemini Spark 的 Beta 测试。这是谷歌在 I/O 2026 大会上最受瞩目的产品之一——一个可以 7×24 小时持续运行的个人 AI Agent。

Spark 运行在 Google Cloud 的专用虚拟机上,这意味着即使你合上笔记本电脑、关掉手机,它依然在后台默默工作。它深度整合了 Gmail、Docs、Sheets、Slides、Calendar 等谷歌全家桶,能够自动执行跨应用的多步骤任务。

几个典型场景:

  • 工作场景:你对 Spark 说”汇总过去一周 Gemini 相关的所有信息,起草给团队的邮件”,它会自动跨 Gmail、Docs、聊天记录抓取信息,调用你的个人写作风格,全程后台完成,你只需最后审核发送。
  • 生活场景:规划街区派对,Spark 自动创建 RSVP 追踪表、连接 Gmail 实时更新、起草邮件、生成宣传 PPT,全程无需你打开任何 App。
  • 监控场景:设置触发条件,比如监控信用卡账单提醒新增订阅费用,或持续跟踪收件箱中的重要动态。

Spark 还支持自定义 Skills,你可以让它学习你的个人语气、偏好和工作方式。未来还将支持通过短信和邮件与 Spark 交互、创建自定义子 Agent,以及操控本地浏览器。

2. Gemini 3.5 Flash:谷歌史上最强编码和 Agent 模型

Spark 的底层搭载的是 Gemini 3.5 Flash,这是谷歌在 I/O 2026 上发布的最新旗舰模型。官方定位很明确:”迄今为止最强的编码、智能体模型”。

数据说话:

  • Terminal-Bench 2.1(编码能力):76.2%
  • GDPval-AA(真实世界 Agent 任务):1656 Elo
  • MCP Atlas(大规模工具使用):83.6%
  • CharXiv Reasoning(多模态理解):84.2%

这四项核心基准全面超越了上代旗舰 Gemini 3.1 Pro。更夸张的是速度——289 tokens/秒,比 GPT-5.5 和 Claude Opus 4.7 快 4 倍以上。执行长程任务的成本通常低于其他前沿模型 50% 以上。

目前 Gemini 3.5 Flash 已经登陆 Gemini App、Google Search AI Mode(全球默认模型)、Antigravity 2.0、Gemini API 和 Android Studio。

3. Gemini Omni:任意输入,生成视频

除了文本模型,谷歌还推出了 Gemini Omni 全模态生成模型。这是谷歌首次将生成式 AI 能力直接整合进视频编辑流程。

Omni 的核心差异在于”多轮对话式编辑”和”物理世界理解”:它不只是”生成一次完事”,而是支持在原有视频基础上反复叠加指令,且保持角色和物理逻辑的连贯性。比如拍摄一段手掌视频,加一句话”手掌上出现黑洞”,它就能生成对应效果;街景视频变成赛博朋克场景,多轮编辑中角色保持一致。

Omni Flash 已经上线 Gemini App、Google Flow 和 YouTube Shorts(免费)。所有生成视频都内嵌 SynthID 数字水印,人眼不可察觉但可检测。

4. Antigravity 2.0:93 个 Agent 12 小时造出操作系统

Antigravity 2.0 是谷歌的 Agent-first 开发平台,从 IDE 进化为独立桌面应用。最震撼的演示:93 个子 Agent 并行工作,发出超 15,000 次模型请求,处理 26 亿 token,12 小时后从零构建出功能完整的操作系统内核——调度程序、内存管理、文件系统一应俱全,最终在 AI 写的 OS 上成功运行 DOOM。

API 总费用不到 1000 美元。

核心升级包括动态子 Agent 生成(主 Agent 自动拆解任务并分配给子 Agent)、异步任务管理、Scheduled Tasks(定时任务),以及新的斜杠命令如 /goal(Agent 一口气跑完任务)、/grill-me(Agent 反向提问搞清楚需求再动手)。

谷歌内部使用 Antigravity 处理的 token 量从 3 月的每天 5000 亿增长到现在的每天 3 万亿,增幅约 6 倍。

5. Google 搜索 25 年来最大升级

Google Search 接入 Gemini 3.5 Flash,宣布”25 年来最大升级”。主要变化包括:

  • 全新 AI-powered 搜索框,理解复杂自然语言查询
  • 搜索结果可自动生成 mini 应用:查询旅行计划直接生成可交互的行程应用
  • AI Mode 以 Gemini 3.5 Flash 为默认模型,面向全球所有用户

6. 定价重构:AI Ultra 新增 $100 档位

Gemini App 迎来”Neural Expressive”全新设计,计费模式从”按订阅套餐”改为算力计费(按实际使用的计算量计费)。

AI Ultra 订阅调整:

  • AI Ultra Beta(Spark 入口):新增 $100/月
  • AI Ultra 最高档:从 $250/月 降至 $200/月

总结

Google I/O 2026 是谷歌历年发布密度最高的一届大会。从 Gemini 3.5 Flash 的极致速度,到 Gemini Spark 的 7×24 小时个人 Agent,再到 Gemini Omni 的全模态视频生成,谷歌正在从”提供 AI 工具”转向”替你完成工作”。

Agent 时代的竞争已经正式开打。OpenAI 有 GPT-5.5,Anthropic 有 Claude Opus 4.7,而谷歌的打法是:用速度最快的模型 + 最深的生态整合 + 7×24 不间断运行的 Agent,直接嵌入你每天都在用的 Gmail、Docs、Calendar 里。

Spark 的 Beta 已经开放,Pro 版本和 Omni Pro 也已经在路上。接下来的几个月,我们将看到这场 Agent 大战如何演变。

本文地址:https://www.163264.com/12570

(0)
上一篇 6小时前
下一篇 3小时前

相关推荐