核心看点
- Gemini 3.5 Live Translate 重磅发布:6月9日,谷歌推出实时语音互译音频模型,支持70+语言,能保留说话者语调、语速和音高
- Gemini 3.5 Flash 性能爆表:I/O 2026 首发,编码测试超越前代旗舰,输出速度是竞品4倍
- Gemini 3.5 Pro 即将登场:代号”卡布奇诺”,编程能力追平 GPT-5.5,成本仅1/15
- 月活用户突破9亿:较2025年同期增长一倍以上
详细解析
1. Gemini 3.5 Live Translate:打破语言壁垒
6月9日,谷歌发布了最新的实时语音互译模型 Gemini 3.5 Live Translate,这是AI翻译领域的重大突破:
- 自动识别70+语言:无需手动设置源语言和目标语言
- 保留原声特征:翻译后的语音保留说话者的语调、语速和音高,听起来更自然
- 实时流畅翻译:几秒内完成语音识别和翻译输出
- 已接入多产品:Google翻译App、Google Meet、Gemini Live API、Google AI Studio
这意味着什么?以后开国际会议、看外语直播、和外国朋友聊天,语言不再是障碍。普通用户用耳机就能体验,开发者还能把这能力嵌入自己的应用。
2. Gemini 3.5 Flash:快,但不止于快
5月19日的 Google I/O 2026 上,Gemini 3.5 Flash 率先登场,打破了谷歌”先Pro后Flash”的惯例:
- Terminal-Bench 2.1 编码测试:76.2%,超越前代旗舰 Gemini 3.1 Pro 的 70.3%
- MCP Atlas 多工具协调测试:83.6%,领先 Claude Opus 4.7 和 GPT-5.5
- 输出速度:289 tokens/秒,是其他前沿模型的4倍以上
- 已成为 Gemini App 和 Google Search AI Mode 的默认模型
谷歌这次玩了个策略反转——Flash 先上,Pro 压轴。这说明他们对 Flash 的性能足够自信,也让普通用户第一时间用上最强模型。
3. Gemini 3.5 Pro:真正的重头戏
据谷歌母公司 Alphabet 确认,Gemini 3.5 Pro 将于6月正式发布(就是最近!)。内部代号”Cappuccino(卡布奇诺)”,已知信息:
- 编程能力追平 GPT-5.5 的92%
- 成本仅为 GPT-5.5 的 1/15 ~ 1/20
- 已在谷歌内部全面使用
- 美国 Google AI Ultra 订阅用户预计下周可用 Beta 版
从3.2直接跳级命名到3.5,谷歌这次明显是要放大招。
4. 月活9亿,Gemini生态加速扩张
Alphabet 6月3日披露,Gemini App 5月月活突破9亿,较2025年5月的4亿翻倍。这背后是谷歌把 Gemini 塞进几乎所有产品:搜索、邮箱、文档、相册、智能家居…
总结
谷歌正在打一套组合拳:
- Flash 负责日常高频场景,快且强
- Pro 负责复杂任务,即将登场
- Live Translate 打破语言边界
- 9亿月活 证明用户买账
AI竞赛进入白热化阶段,谷歌这次显然是有备而来。Gemini 3.5 系列能否真正撼动 OpenAI 的地位?让我们拭目以待。
本文整理自公开报道,信息截至2026年6月22日
本文地址:https://www.163264.com/13177


微信扫一扫,鼓励一下~