小米MiMo-V2.5公测:4.3小时搞定北大编译原理项目,Token成本直降50%

小米今天正式放出大招——Xiaomi MiMo-V2.5系列模型开启公测,而且即将全球开源。这套模型被官方定义为「小米迄今最强大模型」,在推理能力、Agent稳定性、多模态感知等维度全面跃升。

核心看点

  • 4.3小时搞定北大编译原理项目:MiMo-V2.5-Pro仅用4.3小时、672次工具调用,就完成了北大本科生通常需要数周才能完成的SysY编译器项目,隐藏测试集满分233/233
  • Token效率大幅提升:相比Kimi K2.6节省42% Token,相比Muse Spark节省50% Token,API成本降低约50%
  • 全模态Agent能力:支持原生图像、音频、视频多模态感知,在VideoMME、CharXiv等评测中逼近顶级闭源模型
  • 长程任务稳定性:可稳定完成单次近千轮工具调用的长程任务,在超长周期内保持逻辑一致

Pro版到底有多强?

MiMo-V2.5-Pro的定位是「为更高难、更复杂的任务目标而生」。在官方演示中,它不仅完成了编译器项目,还仅凭几句简单指令就构建了一个功能完整的视频编辑器Web应用——多轨道时间线、片段裁剪、交叉淡化、音频混合、导出流程一应俱全,代码量达8192行,历时11.5小时自主完成。

在Agent基准榜单ClawEval上,MiMo-V2.5-Pro已经能与Claude Opus 4.6、GPT-5.4等全球顶尖Agent模型正面较量。

定价策略也卷起来了

小米这次在商业化上也下了功夫:取消1 Token=4 Credits的高价计费,统一为MiMo-V2.5按1x计费、Pro版按2x计费。夜间(00:00-08:00)再打8折,还推出了包月、包年等订阅模式。

更狠的是,所有已购买Token Plan的用户,Credits额度全部重置清零,重新开始计算——这波操作堪称「氪金玩家的春天」。

随着MiMo-V2.5系列即将开源,国内大模型赛道的竞争无疑将更加激烈。小米凭借在端侧AI的积累,正在从「手机厂」向「AI基础设施提供商」快速转型。

本文地址:https://www.163264.com/11056

(0)
上一篇 9小时前
下一篇 2小时前

相关推荐