谷歌Gemini月活突破9亿,3.5系列模型全面上线:AI竞赛进入新阶段

核心看点

  • Gemini App月活用户数正式突破9亿,成为全球第二大AI助手应用
  • Gemini 3.5 Flash全面上线,速度是GPT-5.5和Claude Opus 4.7的4倍
  • 谷歌推出常驻后台AI智能体Gemini Spark,可自动完成邮件、账单扫描等任务
  • Gemini 3.5实时翻译模型支持70+语言,保留说话者语调和情感
  • 谷歌云与诺基亚合作,将Gemini模型整合至电信网络运维平台

正文

2026年,AI大模型的竞争已经进入白热化阶段。就在各家还在卷参数、拼榜单的时候,谷歌Gemini交出了一份相当亮眼的成绩单——月活用户突破9亿,3.5系列模型全面铺开,产品矩阵持续扩张。

Gemini 3.5 Flash:快,而且便宜

5月20日的I/O大会上,谷歌正式发布了Gemini 3.5系列的首款产品——Gemini 3.5 Flash。这款模型的核心卖点就一个字:快。

官方数据显示,Gemini 3.5 Flash每秒可输出289个token,速度是GPT-5.5和Claude Opus 4.7的4倍。在MCP Atlas测试中,它以83.6%的准确率拿下全场最高。更关键的是,它的使用成本比其他前沿模型低了50%以上——谷歌算了一笔账:一家每天处理1万亿token的头部企业,如果把80%的负载迁移到3.5 Flash,每年能省超过10亿美元。

这不仅仅是技术参数的堆叠,而是直接指向了商业化落地。当其他模型还在”实验室性能”和”实际成本”之间做取舍时,谷歌选择了一条更务实的路。

Gemini Spark:你的后台AI助理

如果说3.5 Flash是”更快的大脑”,那Gemini Spark就是”更勤快的手”。

这是一个常驻后台的AI智能体,可以在你处理其他事情的时候自动完成任务——发邮件、扫描信用卡账单找出隐藏订阅、整理会议记录摘要。它基于3.5 Flash运行,能接入Google Workspace全家桶,还支持Canva、Instacart、OpenTable等第三方应用。

这个思路其实和年初火出圈的OpenClaw很像:AI不应该只是你问一句它答一句,而是能主动帮你把事情办了。Spark目前已经向受邀测试用户开放,下周会面向美国地区的Google AI Ultra订阅用户启动公测。

翻译模型升级:70种语言,同声传译级别

6月9日,谷歌推出了基于Gemini 3.5的实时翻译模型。和传统的逐句翻译不同,新模型采用”连续实时生成”机制,在翻译速度和质量之间自动找平衡,延迟只有几秒钟,体验接近真人同声传译。

更厉害的是,它能自动识别70多种语言,不用你手动切换源语言和目标语言。在多语言混合的交流场景下也能持续翻译。而且翻译后的语音会保留原说话者的语调、语速、停顿和情感表达,听起来不那么”机器”。

Google Translate的交互也做了优化:以前语音翻译需要连耳机,现在直接把手机贴近耳朵就能听,更像打电话。

谷歌云×诺基亚:AI进入电信基础设施

6月22日,谷歌云和诺基亚宣布扩展合作,把Gemini模型整合进诺基亚的网络软件套件Nokia Assurance Center。双方将基于Gemini开发六个专项AI智能体,帮助电信运营商降低运营成本、快速定位网络故障,推动网络运维向全自动化”自驾”模式演进。

这六个智能体分工明确:路由智能体负责核心编排,异常推理智能体判断是真故障还是误报,动作推理智能体推荐修复步骤,仪表板智能体让团队用自然语言快速生成可视化分析界面。AI不再只是聊天工具,开始进入工业级基础设施的核心环节。

Neural Expressive:Gemini的新面孔

除了模型能力,谷歌还给Gemini应用换了一套叫”Neural Expressive”的新设计语言。更流畅的动画、更鲜明的配色、全新的字体排版,还有点击时的触感反馈。回复展示方式也优化了,重要信息置顶,配上图片、交互式时间轴、旁白视频和动态图表。

从网页版到Android、iOS,这套新设计会逐步铺开。Gemini Live(语音交互模式)的操作流程也简化了,而且即将支持更多地区方言。

还有几个值得关注的更新

  • Gemini Omni Flash:支持图片、音频、视频、文字任意组合输入来生成视频,场景物理效果更真实。已向Plus/Pro/Ultra订阅用户开放。
  • Gemini Daily Brief:整合日历和Gmail信息,生成个性化每日简报,按目标优先级排序。已向美国地区订阅用户推出。
  • Gemini 3.5 Pro:更强的版本已在谷歌内部使用,计划下个月正式推出。

总结

谷歌Gemini在2026年上半年的节奏非常清晰:模型更快更便宜,产品更主动更智能,生态从消费端延伸到企业基础设施。9亿月活是一个里程碑,但更重要的是,谷歌正在把Gemini从一个”聊天工具”变成真正的”AI操作系统”——它不仅能回答问题,还能帮你完成任务、管理日程、翻译语言、甚至维护电信网络。

当OpenAI还在推GPT-5.5、Anthropic在打磨Claude Opus 4.7的时候,谷歌选择了一条”全面铺开”的路线。这场AI竞赛,远未到终局。

本文地址:https://www.163264.com/13242

(0)
上一篇 19小时前
字节AI再放大招:豆包2.1Pro多项评测压过Claude Opus 4.6,成本砍到1/5
下一篇 12小时前

相关推荐