Google Gemini 3.5 Live Translate发布:70种语言实时同声传译,开口即翻

核心看点:Google发布Gemini 3.5 Live Translate,支持70+种语言的实时语音到语音翻译。开口即翻、无需等待,彻底打破语言障碍。

什么是Gemini 3.5 Live Translate?

6月9日,Google AI官方宣布发布Gemini 3.5 Live Translate——这是Google最新的音频模型,专门用于实时语音到语音翻译。

它的核心特点是:一开口说话就立即开始翻译,在聆听你接下来所说内容的同时流式传输翻译结果。没有尴尬的停顿,没有断续的音频,只有真正自然的对话体验。

技术亮点

  • 70+种语言支持:覆盖全球绝大多数常用语言
  • 真正的实时翻译:边说边翻,无需等待整句话说完
  • 流式传输:翻译结果持续输出,对话节奏自然流畅
  • 语音到语音:直接输出目标语言的语音,无需文字中转

同期其他更新

Google在6月13日的置顶推文中还公布了本周的其他重要发布:

  • NotebookLM重大升级:新增聊天中的代理能力、更高级的推理能力,以及一系列新的输出格式
  • Project Genie开放:Google Labs的Project Genie现已向全球Google AI Ultra 5x订阅者开放
  • Nano Banana 2/Pro发布:可通过Gemini Enterprise Agent Platform、Gemini API和Google AI Studio获取
  • Co-Scientist多代理系统:用于结构化科学思维,可生成并优化新颖假设

与OpenAI的竞争格局

Google I/O 2026(5月19日)上,Gemini成为绝对主角。从Gemini Intelligence到Gemini 3.5 Live Translate,Google正在全面发力AI产品化。

与此同时,苹果WWDC 2026也传出消息:Siri将全面替换为Google Gemini模型和Google Cloud基础设施。这意味着Gemini将深度融入数亿iPhone用户的日常体验。

对用户的意义

实时语音翻译一直是AI应用的”圣杯”之一。Gemini 3.5 Live Translate的发布,让”无障碍跨语言交流”从科幻走向现实。

无论是国际商务谈判、海外旅行,还是与外国朋友的日常聊天,语言障碍正在被AI一步步消除。

总结:Google在AI音频领域的布局正在加速。Gemini 3.5 Live Translate不仅是技术突破,更是Google将AI能力产品化、大众化的重要一步。语音AI的iPhone时刻,或许已经到来。

本文地址:https://www.163264.com/13013

(0)
上一篇 4小时前
下一篇 4小时前

相关推荐