伟达
-
英伟达发布Nemotron 3 Nano Omni全模态模型:30B-A3B MoE架构,推理吞吐量暴涨9倍
核心看点 全模态统一:Nemotron 3 Nano Omni将视频、音频、图像和文本推理集成于单一模型,替代传统碎片化的视觉-语音-语言模型链 30B-A3B混合MoE架构:结合Mamba层(提升序列与内存效率)和Transformer层(精准推理),内存和计算效率最高提升4倍 吞吐量9倍领先:在视频推理任务中,相比其他开源全模态模型,有效系统容量最高提升约9.2倍;多文档推…
-
英伟达开源Nemotron 3 Nano Omni全模态模型:30B参数MoE架构,吞吐量暴增9.2倍
英伟达又放了个大招。当地时间4月28日,英伟达正式发布了 Nemotron 3 Nano Omni 开源全模态推理模型,一口气把视频、音频、图像和文本的多模态推理能力塞进了一个统一的模型里。翻译成大白话就是:以前需要好几个模型串起来干的活儿,现在一个模型全搞定。 核心看点 采用30B-A3B混合MoE(混合专家)架构,每个token只激活3B参数,效率拉满 视频推理吞吐量最高提…