核心看点
- Gemini 3.5 Flash发布:号称谷歌最快、最高效模型,成本仅为竞品一半
- Gemini 3.5 Pro下月登场,已在内部使用
- Gemini Omni全能模型:支持”任意输入→任意输出”,一句话修改视频
- Gemini for Science:科研专用版,追踪论文、生成假设
- Gemini Spark:跨平台AI智能体,管理用户数字生活
详细解析
5月20日,Google I/O 2026开发者大会上,谷歌打出组合拳,发布Gemini 3.5系列和Gemini Omni,全面反击OpenAI和Anthropic。
Gemini 3.5 Flash:速度与成本的极致
这是Gemini 3.5系列的首发成员,谷歌CEO皮查伊称其为”迄今为止最快、最高效的模型”。每秒可输出超过280个tokens,速度是GPT-5.5和Claude Opus 4.7的4倍。
成本方面,使用成本较其他前沿模型降低50%以上。谷歌测算,一家每天处理约1万亿Token的头部企业,如果将80%负载迁移至Gemini 3.5 Flash,每年可节省超过10亿美元。
在基准测试中,3.5 Flash在Terminal-Bench 2.1中取得76.2%的得分,MCP Atlas测试中以83.6%的准确率位列全场最高。该模型已成为全球Gemini应用和搜索AI模式的默认模型。
Gemini Omni:真正的全能选手
DeepMind负责人哈萨比斯称Gemini Omni是”Gemini系列迄今最全面的模型”。它支持”任意输入→任意输出”的交互范式,尤其在视频编辑方面表现惊艳 —— 用户只需自然语言指令,即可实时修改视频中的人物形象、场景背景、光照风格。
Gemini for Science
面向科研工作者的专用版本,具备论文动态追踪、研究目标代码化转化、科学假设生成等能力。这直接对标Anthropic的科研应用布局。
Gemini Spark
这是Gemini应用中的新型通用AI智能体,能够跨平台推理关联应用中的信息,代表用户执行操作。谷歌称其能”管理用户的数字生活”。
总结
Google I/O 2026的发布表明谷歌不再满足于”追赶者”角色。Gemini 3.5 Flash在速度和成本上的优势非常明显,Omni的多模态能力则开辟了新的应用场景。但Gemini 3.5 Pro尚未正式发布,与Claude Opus 4.8和GPT-5.5的正面交锋还需等待。
三大巨头(OpenAI、Anthropic、Google)的AI军备竞赛已进入白热化阶段,每周都有新产品发布。对开发者和用户来说,这是最好的时代。
本文地址:https://www.163264.com/12528


微信扫一扫,鼓励一下~