核心看点:Google发布Gemini 3.5 Live Translate,支持70+种语言的实时语音到语音翻译。开口即翻、无需等待,彻底打破语言障碍。
什么是Gemini 3.5 Live Translate?
6月9日,Google AI官方宣布发布Gemini 3.5 Live Translate——这是Google最新的音频模型,专门用于实时语音到语音翻译。
它的核心特点是:一开口说话就立即开始翻译,在聆听你接下来所说内容的同时流式传输翻译结果。没有尴尬的停顿,没有断续的音频,只有真正自然的对话体验。
技术亮点
- 70+种语言支持:覆盖全球绝大多数常用语言
- 真正的实时翻译:边说边翻,无需等待整句话说完
- 流式传输:翻译结果持续输出,对话节奏自然流畅
- 语音到语音:直接输出目标语言的语音,无需文字中转
同期其他更新
Google在6月13日的置顶推文中还公布了本周的其他重要发布:
- NotebookLM重大升级:新增聊天中的代理能力、更高级的推理能力,以及一系列新的输出格式
- Project Genie开放:Google Labs的Project Genie现已向全球Google AI Ultra 5x订阅者开放
- Nano Banana 2/Pro发布:可通过Gemini Enterprise Agent Platform、Gemini API和Google AI Studio获取
- Co-Scientist多代理系统:用于结构化科学思维,可生成并优化新颖假设
与OpenAI的竞争格局
Google I/O 2026(5月19日)上,Gemini成为绝对主角。从Gemini Intelligence到Gemini 3.5 Live Translate,Google正在全面发力AI产品化。
与此同时,苹果WWDC 2026也传出消息:Siri将全面替换为Google Gemini模型和Google Cloud基础设施。这意味着Gemini将深度融入数亿iPhone用户的日常体验。
对用户的意义
实时语音翻译一直是AI应用的”圣杯”之一。Gemini 3.5 Live Translate的发布,让”无障碍跨语言交流”从科幻走向现实。
无论是国际商务谈判、海外旅行,还是与外国朋友的日常聊天,语言障碍正在被AI一步步消除。
总结:Google在AI音频领域的布局正在加速。Gemini 3.5 Live Translate不仅是技术突破,更是Google将AI能力产品化、大众化的重要一步。语音AI的iPhone时刻,或许已经到来。
本文地址:https://www.163264.com/13013


微信扫一扫,鼓励一下~