Google发布Gemini 3.5实时翻译模型：支持70+语言，保留原声语调

Table of Contents

核心看点

6月9日，Google宣布推出Gemini 3.5实时翻译模型，这是其最新的实时语音到语音翻译音频模型。据Google介绍，该模型具备以下核心能力：

该模型即日起在Google各产品中逐步推出，包括：

这意味着Google正在将Gemini从”独立AI产品”转变为”底层基础设施”，渗透到每一个Google产品中。

在2026年Google I/O大会上，Google还正式官宣进军消费级智能眼镜市场，将携手Warby Parker、Gentle Monster两大国际潮流眼镜品牌，推出搭载Gemini AI系统的全新智能眼镜产品，定于今年秋季正式发售。

此举标志着Google正式正面入局，直面Meta旗下Ray-Ban Meta系列智能眼镜的市场统治地位。Gemini 3.5实时翻译功能将成为Google智能眼镜的核心卖点之一——戴上眼镜，就能实时看到/听到翻译内容。

6月初的Google I/O 2026大会上，Gemini迎来全生态升级：

特性	Google Gemini 3.5	OpenAI GPT-5.5	Anthropic Claude Fable 5
实时翻译	✅ 原生支持	❌ 需第三方集成	❌ 未重点宣传
语言数量	70+	约50	约40
语音保留	✅ 语调+语速+音高	⚠️ 部分支持	⚠️ 部分支持
硬件生态	✅ 智能眼镜秋季上市	❌ 无自有硬件	❌ 无自有硬件

Google正在走一条与OpenAI、Anthropic截然不同的道路——不单纯追求模型参数的”军备竞赛”，而是将AI能力深度整合到现有产品生态和硬件中。

Gemini 3.5实时翻译模型的发布，体现了Google的”实用主义AI”策略：不追求最强大模型，但追求最广泛的应用场景和最无缝的用户体验。70+语言支持、保留原声特征、与全系产品整合——这些特性让翻译从”工具”变成了”基础设施”。

随着秋季Gemini智能眼镜的上市，Google将在AI硬件领域与Meta展开正面竞争。实时翻译+智能眼镜的组合，可能会彻底改变旅行、商务、教育等场景的语言沟通方式。

本文地址：https://www.163264.com/12852