谷歌 Gemini 双箭齐发:实时翻译模型 + 智能音箱,AI 生态加速落地

核心看点

  • 谷歌发布 Gemini 3.5 Live Translate 实时翻译模型,支持70+语言,延迟仅2-4秒
  • 首款为 Gemini 打造的 Google Home 智能音箱开启预售,6月25日上市,售价99.99美元
  • Gemini App 月活突破9亿,一年内翻倍,成为谷歌增长最快的产品

Gemini 3.5 Live Translate:语音翻译迎来新突破

6月9日,谷歌正式发布了 Gemini 3.5 Live Translate,这是一款实时语音到语音翻译模型,被认为是谷歌在AI语音翻译领域的又一重大突破。

这个模型的核心亮点在于:

  • 支持70多种语言:可自动检测输入语音的语言种类,无需人工设置
  • 连续串流翻译:不同于传统翻译系统需要等待整段话结束再翻译,它能边接收语音边输出译文,体感接近人工同传
  • 保留原声特征:翻译语音能够还原说话者的语调、语速和音高,让交流更自然
  • 低延迟:整体延迟仅数秒,连续说30秒的对话,对方能持续听到翻译输出
  • 混合语言识别:具备自动识别混合语言输入的能力,抗干扰能力强,适配嘈杂环境

该功能目前已通过 Gemini Live API 和 Google AI Studio 向开发者提供公开预览,并同步导入 Google Translate 和 Google Meet 等服务。对于经常需要进行跨语言沟通的用户来说,这无疑是效率利器。

Google Home 智能音箱:Gemini 走进客厅

谷歌近日宣布,首款专为 Gemini 语音助手打造的 Google Home 智能音箱已开启预售,将于6月25日在18个国家及地区正式上市,售价99.99美元(约合人民币677元)。

这是谷歌时隔6年再次推出独立智能音箱产品,也是首款从零开始为 Gemini 构建的音频硬件。其核心突破在于内置专用的神经网络处理单元(NPU),支持设备端AI推理,这意味着:

  • 响应速度更快:本地AI处理减少云端依赖
  • 隐私保护更强:敏感数据处理在设备端完成
  • 多轮对话能力:能记住对话内容,衔接讨论脉络
  • 复杂指令处理:可一次性接收多个指令,处理更复杂的问题

音箱采用360度环绕设计,提供四种配色:Berry(粉红)、Hazel(黑灰)、Jade(浅绿)和 Porcelain(米白)。用户还可以将两台音箱与 Google TV Streamer 配对,组建家庭影院系统。

Gemini 生态加速扩张

根据谷歌母公司 Alphabet 在6月初公布的投资者演示文稿,Gemini App 的月活跃用户数已超过9亿,在一年内翻了一倍多,成为谷歌增长最快的产品之一。

更值得关注的是,Gemini 已为谷歌旗下13款超10亿用户的产品提供支持,其中包括5款用户量超过30亿的核心产品:谷歌搜索、Gmail、Android、Chrome 和 YouTube。这意味着 Gemini 正在渗透到全球绝大多数互联网用户的日常使用中。

总结

从实时翻译模型到智能音箱,从9亿月活到覆盖30亿用户的核心产品,谷歌正在加速推进 Gemini 的落地应用。与 OpenAI 和 Anthropic 相比,谷歌的优势在于其庞大的产品生态和用户基础——当竞争对手还在专注模型能力时,谷歌已经让 Gemini 走进了搜索、邮箱、手机和客厅。

对于普通用户来说,Gemini 3.5 Live Translate 的实时翻译能力和 Google Home 智能音箱的自然语言交互,都是能切实提升生活便利性的功能。而对于开发者,Gemini Live API 的开放也提供了更多创新空间。

本文地址:https://www.163264.com/13146

(0)
小米发布并开源Xiaomi Miloco 2.0:接入OpenClaw!让AI掌控全屋智能
上一篇 9小时前
下一篇 2小时前

相关推荐