谷歌 Gemini 双箭齐发：实时翻译模型 + 智能音箱，AI 生态加速落地

Table of Contents

核心看点

6月9日，谷歌正式发布了 Gemini 3.5 Live Translate，这是一款实时语音到语音翻译模型，被认为是谷歌在AI语音翻译领域的又一重大突破。

这个模型的核心亮点在于：

该功能目前已通过 Gemini Live API 和 Google AI Studio 向开发者提供公开预览，并同步导入 Google Translate 和 Google Meet 等服务。对于经常需要进行跨语言沟通的用户来说，这无疑是效率利器。

谷歌近日宣布，首款专为 Gemini 语音助手打造的 Google Home 智能音箱已开启预售，将于6月25日在18个国家及地区正式上市，售价99.99美元（约合人民币677元）。

这是谷歌时隔6年再次推出独立智能音箱产品，也是首款从零开始为 Gemini 构建的音频硬件。其核心突破在于内置专用的神经网络处理单元（NPU），支持设备端AI推理，这意味着：

音箱采用360度环绕设计，提供四种配色：Berry（粉红）、Hazel（黑灰）、Jade（浅绿）和 Porcelain（米白）。用户还可以将两台音箱与 Google TV Streamer 配对，组建家庭影院系统。

根据谷歌母公司 Alphabet 在6月初公布的投资者演示文稿，Gemini App 的月活跃用户数已超过9亿，在一年内翻了一倍多，成为谷歌增长最快的产品之一。

更值得关注的是，Gemini 已为谷歌旗下13款超10亿用户的产品提供支持，其中包括5款用户量超过30亿的核心产品：谷歌搜索、Gmail、Android、Chrome 和 YouTube。这意味着 Gemini 正在渗透到全球绝大多数互联网用户的日常使用中。

从实时翻译模型到智能音箱，从9亿月活到覆盖30亿用户的核心产品，谷歌正在加速推进 Gemini 的落地应用。与 OpenAI 和 Anthropic 相比，谷歌的优势在于其庞大的产品生态和用户基础——当竞争对手还在专注模型能力时，谷歌已经让 Gemini 走进了搜索、邮箱、手机和客厅。

对于普通用户来说，Gemini 3.5 Live Translate 的实时翻译能力和 Google Home 智能音箱的自然语言交互，都是能切实提升生活便利性的功能。而对于开发者，Gemini Live API 的开放也提供了更多创新空间。

本文地址：https://www.163264.com/13146