多模态

  • Google I/O 2026 全面解析:Gemini 进入智能体时代,5 大核心看点

    在 2026 年 5 月 20 日的 Google I/O 大会上,谷歌扔下了一颗”AI 核弹”——全面进入”智能体 Gemini 时代”。这不仅是产品的迭代,更是整个 AI 战略的转向。从全能多模态模型到个人 AI 智能体,谷歌正在构建一个由 AI 深度渗透的数字生态。 核心看点 1. Gemini 3.5 Flash:速度与智…

    学起来 2026年5月28日
  • 英伟达发布 Nemotron 3 Nano Omni 全模态开源模型:30B-A3B MoE架构,吞吐量飙升9.2倍

    4月29日消息,英伟达今日正式推出 Nemotron 3 Nano Omni 开源全模态推理模型,这是一款面向企业级 AI Agent 的一体化基础模型,将视频、音频、图像和文本的统一推理集成于单个高效开放式模型中。 核心看点 超强吞吐量:在视频推理任务中,相比其他全模态模型,有效系统容量最高提升约 9.2 倍 全模态统一:视频、音频、图像、文本全部打通,告别碎片化模型链 架构…

    模型框架 2026年4月29日