模型框架

  • 英伟达发布 Nemotron 3 Nano Omni 全模态开源模型:30B-A3B MoE架构,吞吐量飙升9.2倍

    4月29日消息,英伟达今日正式推出 Nemotron 3 Nano Omni 开源全模态推理模型,这是一款面向企业级 AI Agent 的一体化基础模型,将视频、音频、图像和文本的统一推理集成于单个高效开放式模型中。 核心看点 超强吞吐量:在视频推理任务中,相比其他全模态模型,有效系统容量最高提升约 9.2 倍 全模态统一:视频、音频、图像、文本全部打通,告别碎片化模型链 架构…

    模型框架 4天前
  • 英伟达开源Nemotron 3 Nano Omni全模态模型:30B参数MoE架构,吞吐量暴增9.2倍

    英伟达又放了个大招。当地时间4月28日,英伟达正式发布了 Nemotron 3 Nano Omni 开源全模态推理模型,一口气把视频、音频、图像和文本的多模态推理能力塞进了一个统一的模型里。翻译成大白话就是:以前需要好几个模型串起来干的活儿,现在一个模型全搞定。 核心看点 采用30B-A3B混合MoE(混合专家)架构,每个token只激活3B参数,效率拉满 视频推理吞吐量最高提…

    模型框架 4天前
  • 小米MiMo-V2.5系列正式开源!MIT协议商用无限制,同步启动百万亿Token激励计划

    今天凌晨,小米技术官方宣布MiMo-V2.5系列模型全面开源,采用宽松的MIT协议,允许自由商用、二次训练与微调,无需额外授权。与此同时启动的MiMo Orbit百万亿Token计划,更是直接向全球AI开发者送出价值数亿元的免费Token。 核心看点 MiMo-V2.5-Pro在GDPVal-AA和ClawEval榜单上位列全球开源模型第一 两款模型均支持100万Token上下…

    模型框架 5天前
  • 小米 MiMo-V2.5 系列模型全面开源:MIT 协议 + 百万亿 Token 免费送,登顶全球开源榜首

    4月28日凌晨,小米技术官方正式宣布,旗下 MiMo-V2.5 系列大模型全面开源,同步启动「Orbit 百万亿 Token 计划」,面向全球开发者免费发放总计 100 万亿 Token 额度。这一动作将小米 AI 推向了开源赛道的最前沿。 核心看点 MiMo-V2.5 系列包含 Pro 和标准版两款模型,均支持 100 万 Token 超长上下文窗口 Pro 版本在 GDPV…

    模型框架 5天前
  • 美团万亿级大模型 LongCat-2.0-Preview 开放测试:全程国产算力,突破”卡脖子”困境

    美团正在悄悄干一件大事。旗下新一代基础大模型 LongCat-2.0-Preview 已正式开放邀请测试,总参数量级突破万亿,更关键的是——全程基于国产化算力集群完成训练。 核心看点 LongCat-2.0-Preview 采用混合专家(MoE)架构,总参数量级达万亿级别 整体能力对标 GPT-4,跻身全球顶尖大模型行列 全程基于国产化算力集群训练,标志着美团在国产算力训练万亿…

    模型框架 6天前
  • 蚂蚁百灵发布万亿旗舰 Ling-2.6-1T:不走推理路线的”快思考”模型,对标 GPT-5.4

    蚂蚁集团旗下百灵大模型团队正式发布了一款不走寻常路的作品——面向即时任务执行的万亿级综合旗舰模型 Ling-2.6-1T。它放弃了行业普遍追求的”慢思考”多步推理模式,用”快思考”机制硬刚 GPT-5.4 非推理版。 核心看点 Ling-2.6-1T 采用 MLA + LinearAttention 混合架构,万亿参数仅凭极低 T…

    模型框架 6天前
  • 国家超算互联网上线 DeepSeek-V4 免费对话:百万上下文从「高端选配」变「基础标配」

    4 月 26 日,国家超算互联网宣布推出 DeepSeek-V4 限时免费对话服务。企业、科研机构及个人开发者登录超算互联网(www.scnet.cn)即可免费体验百万 Token 超长上下文实时对话。 核心看点 国家超算互联网免费提供 DeepSeek-V4 百万上下文对话服务 百万上下文相当于《三体》三部曲总字数,可一次性处理全文并全局思考 此前百万上下文能力仅出现在闭源高…

    模型框架 2026年4月26日
  • DeepSeek-V4预览版正式发布:1M超长上下文进入全员普惠时代

    4月24日,DeepSeek正式发布了V4预览版,这款开源大模型带来了两个重磅升级:1M超长上下文能力,以及结构创新和Agent生态适配。这意味着,处理超长文档、视频分析、复杂代码库等场景,不再需要昂贵的闭源API。 核心看点 1M上下文普惠化:DeepSeek-V4将百万级上下文窗口带入开源领域,Pro版性能接近顶级闭源模型,Flash版则主打性价比,满足不同场景需求。 DS…

    模型框架 2026年4月26日
  • OpenAI发布GPT-5.5:运算更快Token更省,科研能力大幅提升

    核心看点 OpenAI发布GPT-5.5,号称”最智能、最直观”的版本 运算速度更快,Token消耗显著降低 电脑操控和科研能力大幅提升,可应用于药物研发 OpenAI又放大招了。4月24日,GPT-5.5正式发布,官方给出的定义很直接:这是迄今为止智能程度最高、使用体验最直观的版本。联合创始人布罗克曼透露,相比5.4版本,5.5在运算速度、逻辑精准度上…

    模型框架 2026年4月25日
  • DeepSeek-V4预览版发布:1M超长上下文进入普惠时代

    核心看点 DeepSeek-V4预览版正式发布,开源并支持1M超长上下文 提供Pro和Flash双版本,兼顾性能与性价比 寒武纪完成Day 0适配,国产芯片生态加速完善 4月24日,深度求索(DeepSeek)正式发布了V4预览版,这次更新可以说是国产大模型领域的又一里程碑。最让人眼前一亮的是,V4直接标配了1M超长上下文能力,这意味着什么?简单来说,你可以扔给AI一整本书、一…

    模型框架 2026年4月25日