Google I/O 2026 发布 Gemini 3.5 系列:全能多模态 Omni 登场,速度碾压竞品

核心看点

  • Gemini 3.5 Flash发布:号称谷歌最快、最高效模型,成本仅为竞品一半
  • Gemini 3.5 Pro下月登场,已在内部使用
  • Gemini Omni全能模型:支持”任意输入→任意输出”,一句话修改视频
  • Gemini for Science:科研专用版,追踪论文、生成假设
  • Gemini Spark:跨平台AI智能体,管理用户数字生活

详细解析

5月20日,Google I/O 2026开发者大会上,谷歌打出组合拳,发布Gemini 3.5系列和Gemini Omni,全面反击OpenAI和Anthropic。

Gemini 3.5 Flash:速度与成本的极致

这是Gemini 3.5系列的首发成员,谷歌CEO皮查伊称其为”迄今为止最快、最高效的模型”。每秒可输出超过280个tokens,速度是GPT-5.5和Claude Opus 4.7的4倍。

成本方面,使用成本较其他前沿模型降低50%以上。谷歌测算,一家每天处理约1万亿Token的头部企业,如果将80%负载迁移至Gemini 3.5 Flash,每年可节省超过10亿美元。

在基准测试中,3.5 Flash在Terminal-Bench 2.1中取得76.2%的得分,MCP Atlas测试中以83.6%的准确率位列全场最高。该模型已成为全球Gemini应用和搜索AI模式的默认模型。

Gemini Omni:真正的全能选手

DeepMind负责人哈萨比斯称Gemini Omni是”Gemini系列迄今最全面的模型”。它支持”任意输入→任意输出”的交互范式,尤其在视频编辑方面表现惊艳 —— 用户只需自然语言指令,即可实时修改视频中的人物形象、场景背景、光照风格。

Gemini for Science

面向科研工作者的专用版本,具备论文动态追踪、研究目标代码化转化、科学假设生成等能力。这直接对标Anthropic的科研应用布局。

Gemini Spark

这是Gemini应用中的新型通用AI智能体,能够跨平台推理关联应用中的信息,代表用户执行操作。谷歌称其能”管理用户的数字生活”。

总结

Google I/O 2026的发布表明谷歌不再满足于”追赶者”角色。Gemini 3.5 Flash在速度和成本上的优势非常明显,Omni的多模态能力则开辟了新的应用场景。但Gemini 3.5 Pro尚未正式发布,与Claude Opus 4.8和GPT-5.5的正面交锋还需等待。

三大巨头(OpenAI、Anthropic、Google)的AI军备竞赛已进入白热化阶段,每周都有新产品发布。对开发者和用户来说,这是最好的时代。

本文地址:https://www.163264.com/12528

(0)
上一篇 3小时前
下一篇 3小时前

相关推荐