开源 | 第2页 | 梭哈 AI

小米 MiMo-V2.5 系列正式开源：MIT协议全量开放，启动百万亿Token激励计划

4月28日凌晨，小米技术官方宣布 MiMo-V2.5 系列模型正式开源，同步启动 MiMo Orbit 百万亿 Token 激励计划。这标志着小米在大模型开源领域的又一重要里程碑。核心看点 MiMo-V2.5-Pro 在 ClawEval 榜单位列全球开源模型第一，深度适配 Agent 与 Coding 全系列采用 MIT 开源协议，允许自由商用、二次训练与微调，无需额外授权…

学起来 2026年4月29日

小米MiMo-V2.5系列正式开源！MIT协议商用无限制，同步启动百万亿Token激励计划

今天凌晨，小米技术官方宣布MiMo-V2.5系列模型全面开源，采用宽松的MIT协议，允许自由商用、二次训练与微调，无需额外授权。与此同时启动的MiMo Orbit百万亿Token计划，更是直接向全球AI开发者送出价值数亿元的免费Token。核心看点 MiMo-V2.5-Pro在GDPVal-AA和ClawEval榜单上位列全球开源模型第一两款模型均支持100万Token上下…

模型框架 2026年4月28日

小米 MiMo-V2.5 系列模型全面开源：MIT 协议 + 百万亿 Token 免费送，登顶全球开源榜首

4月28日凌晨，小米技术官方正式宣布，旗下 MiMo-V2.5 系列大模型全面开源，同步启动「Orbit 百万亿 Token 计划」，面向全球开发者免费发放总计 100 万亿 Token 额度。这一动作将小米 AI 推向了开源赛道的最前沿。核心看点 MiMo-V2.5 系列包含 Pro 和标准版两款模型，均支持 100 万 Token 超长上下文窗口 Pro 版本在 GDPV…

模型框架 2026年4月28日

小米未来三年AI投入超600亿：MiMo-V2.5即将开源，大模型团队平均仅25岁

在4月27日的小米投资者日上，小米集团副总裁、技术委员会主席屈恒披露了一系列重磅AI战略规划。从”保底600亿”的投入预算，到MiMo-V2.5开源适配国产芯片，再到25岁的大模型团队，信息量巨大。核心看点三年600亿只是保底屈恒明确表示，未来三年AI投入超过600亿元，而且”这个数字只是保底，会更高”。这一数字早在年初雷军…

学起来 2026年4月28日

小米开源VLA大模型！机器人实现亚毫米级精细操作

小米在机器人领域放了个大招——开源了 VLA 大模型 Xiaomi-Robotics-0 的完整后训练流程，这意味着机器人能够做到亚毫米级的精细操作。核心看点亚毫米级是什么概念？比头发丝还细的精度。通过这个模型，机器人可以完成诸如精密装配、精细抓取等过去只能靠人工完成的复杂任务。小米这次不仅发布了模型，还开源了技术报告、模型权重和源代码。开发者可以直接基于这套方案进行二次…

应用 2026年4月27日

OpenAI开源Privacy Filter：1.5B参数PII脱敏模型，可在笔记本上运行

OpenAI于4月22日发布了一款全新的个人身份信息（PII）脱敏模型——Privacy Filter，并以Apache 2.0许可协议在Hugging Face和GitHub同步开源，开发者可自由下载、定制及商业部署。核心看点轻量级设计：总参数量15亿，采用MoE混合专家架构，每次仅激活约5000万参数，可在笔记本甚至浏览器上运行 12.8万Token超长上下文：单次前向…

学起来 2026年4月27日

亚毫米级精度！小米开源VLA机器人大模型后训练全流程，机器人自己学会收纳耳机

小米开源Xiaomi-Robotics-0后训练全流程，机器人仅用20小时学会亚毫米级精准收纳耳机操作，模型权重及代码全部开源。

应用 2026年4月27日

DeepSeek-V4预览版发布：1M超长上下文进入普惠时代

核心看点 DeepSeek-V4预览版正式发布，开源并支持1M超长上下文提供Pro和Flash双版本，兼顾性能与性价比寒武纪完成Day 0适配，国产芯片生态加速完善 4月24日，深度求索（DeepSeek）正式发布了V4预览版，这次更新可以说是国产大模型领域的又一里程碑。最让人眼前一亮的是，V4直接标配了1M超长上下文能力，这意味着什么？简单来说，你可以扔给AI一整本书、一…

模型框架 2026年4月25日

DeepSeek-V4正式发布：国产大模型迎来百万上下文时代

4月24日，深度求索（DeepSeek）正式发布V4模型预览版，这是国产开源大模型领域的又一里程碑。此次发布的V4系列包含两个版本：285B参数的DeepSeek-V4-flash和1.6T参数的DeepSeek-V4-pro，均已在发布当日实现稳定运行。核心看点百万级超长上下文：V4支持1M超长上下文记忆，在处理长文档、代码库分析等场景下表现突出双版本策略：flash版…

模型框架 2026年4月25日

单张图片生成可行走3D世界！NVIDIA开源Lyra2.0，解决长视频空间遗忘和时间漂移难题

核心看点：NVIDIA Research 发布 Lyra 2.0 框架，从单张图像即可生成可自由探索的 3D 场景，同时解决了长视频生成中的空间遗忘和时间漂移问题，具有广泛的应用价值。【核心创新】 Lyra 2.0 框架通过两大技术突破实现高质量长视频生成： • 空间记忆机制：维护 3D 几何信息，用于信息路由，避免几何误差积累，确保多帧生成的空间一致性 • 自增强训练策略：…

模型框架 2026年4月21日