开源

  • 小米 MiMo-V2.5 系列正式开源:MIT协议全量开放,启动百万亿Token激励计划

    4月28日凌晨,小米技术官方宣布 MiMo-V2.5 系列模型正式开源,同步启动 MiMo Orbit 百万亿 Token 激励计划。这标志着小米在大模型开源领域的又一重要里程碑。 核心看点 MiMo-V2.5-Pro 在 ClawEval 榜单位列全球开源模型第一,深度适配 Agent 与 Coding 全系列采用 MIT 开源协议,允许自由商用、二次训练与微调,无需额外授权…

    学起来 2026年4月29日
  • 小米MiMo-V2.5系列正式开源!MIT协议商用无限制,同步启动百万亿Token激励计划

    今天凌晨,小米技术官方宣布MiMo-V2.5系列模型全面开源,采用宽松的MIT协议,允许自由商用、二次训练与微调,无需额外授权。与此同时启动的MiMo Orbit百万亿Token计划,更是直接向全球AI开发者送出价值数亿元的免费Token。 核心看点 MiMo-V2.5-Pro在GDPVal-AA和ClawEval榜单上位列全球开源模型第一 两款模型均支持100万Token上下…

    模型框架 2026年4月28日
  • 小米 MiMo-V2.5 系列模型全面开源:MIT 协议 + 百万亿 Token 免费送,登顶全球开源榜首

    4月28日凌晨,小米技术官方正式宣布,旗下 MiMo-V2.5 系列大模型全面开源,同步启动「Orbit 百万亿 Token 计划」,面向全球开发者免费发放总计 100 万亿 Token 额度。这一动作将小米 AI 推向了开源赛道的最前沿。 核心看点 MiMo-V2.5 系列包含 Pro 和标准版两款模型,均支持 100 万 Token 超长上下文窗口 Pro 版本在 GDPV…

    模型框架 2026年4月28日
  • 小米未来三年AI投入超600亿:MiMo-V2.5即将开源,大模型团队平均仅25岁

    在4月27日的小米投资者日上,小米集团副总裁、技术委员会主席屈恒披露了一系列重磅AI战略规划。从”保底600亿”的投入预算,到MiMo-V2.5开源适配国产芯片,再到25岁的大模型团队,信息量巨大。 核心看点 三年600亿只是保底 屈恒明确表示,未来三年AI投入超过600亿元,而且”这个数字只是保底,会更高”。这一数字早在年初雷军…

    学起来 2026年4月28日
  • 小米开源VLA大模型!机器人实现亚毫米级精细操作

    小米在机器人领域放了个大招——开源了 VLA 大模型 Xiaomi-Robotics-0 的完整后训练流程,这意味着机器人能够做到亚毫米级的精细操作。 核心看点 亚毫米级是什么概念?比头发丝还细的精度。通过这个模型,机器人可以完成诸如精密装配、精细抓取等过去只能靠人工完成的复杂任务。 小米这次不仅发布了模型,还开源了技术报告、模型权重和源代码。开发者可以直接基于这套方案进行二次…

    应用 2026年4月27日
  • OpenAI开源Privacy Filter:1.5B参数PII脱敏模型,可在笔记本上运行

    OpenAI于4月22日发布了一款全新的个人身份信息(PII)脱敏模型——Privacy Filter,并以Apache 2.0许可协议在Hugging Face和GitHub同步开源,开发者可自由下载、定制及商业部署。 核心看点 轻量级设计:总参数量15亿,采用MoE混合专家架构,每次仅激活约5000万参数,可在笔记本甚至浏览器上运行 12.8万Token超长上下文:单次前向…

    学起来 2026年4月27日
  • 亚毫米级精度!小米开源VLA机器人大模型后训练全流程,机器人自己学会收纳耳机

    小米开源Xiaomi-Robotics-0后训练全流程,机器人仅用20小时学会亚毫米级精准收纳耳机操作,模型权重及代码全部开源。

    应用 2026年4月27日
  • DeepSeek-V4预览版发布:1M超长上下文进入普惠时代

    核心看点 DeepSeek-V4预览版正式发布,开源并支持1M超长上下文 提供Pro和Flash双版本,兼顾性能与性价比 寒武纪完成Day 0适配,国产芯片生态加速完善 4月24日,深度求索(DeepSeek)正式发布了V4预览版,这次更新可以说是国产大模型领域的又一里程碑。最让人眼前一亮的是,V4直接标配了1M超长上下文能力,这意味着什么?简单来说,你可以扔给AI一整本书、一…

    模型框架 2026年4月25日
  • DeepSeek-V4正式发布:国产大模型迎来百万上下文时代

    4月24日,深度求索(DeepSeek)正式发布V4模型预览版,这是国产开源大模型领域的又一里程碑。此次发布的V4系列包含两个版本:285B参数的DeepSeek-V4-flash和1.6T参数的DeepSeek-V4-pro,均已在发布当日实现稳定运行。 核心看点 百万级超长上下文:V4支持1M超长上下文记忆,在处理长文档、代码库分析等场景下表现突出 双版本策略:flash版…

    模型框架 2026年4月25日
  • 单张图片生成可行走3D世界!NVIDIA开源Lyra2.0,解决长视频空间遗忘和时间漂移难题

    核心看点:NVIDIA Research 发布 Lyra 2.0 框架,从单张图像即可生成可自由探索的 3D 场景,同时解决了长视频生成中的空间遗忘和时间漂移问题,具有广泛的应用价值。 【核心创新】 Lyra 2.0 框架通过两大技术突破实现高质量长视频生成: • 空间记忆机制:维护 3D 几何信息,用于信息路由,避免几何误差积累,确保多帧生成的空间一致性 • 自增强训练策略:…

    模型框架 2026年4月21日