小米大模型API价格屠夫:MiMo-V2.5最高降幅99%,百万tokens只要2分钱

核心看点

5月27日,小米宣布旗下自研大模型MiMo-V2.5系列API永久降价,最高降幅达99%。这是继DeepSeek之后,又一家中国AI公司向大模型API价格发起猛烈冲击。

详细解析

降价幅度有多狠?

  • MiMo-V2.5 Pro输入缓存命中:降至0.025元/百万tokens,降幅99%
  • MiMo-V2.5输入缓存命中:降至0.02元/百万tokens,降幅98%
  • MiMo-V2.5 Pro输出:降至6元/百万tokens,降幅86%
  • MiMo-V2.5输出:降至2元/百万tokens,降幅93%

技术底气在哪?

小米技术团队基于SGLang HiCache完整支持SWA(Sliding Window Attention),将KV Cache在多级存储间的数据搬运量降低至优化前的近1/7,可缓存token数量提升至近5倍。同时优化专家并行方案、输入长度分桶策略,大幅提升集群输入吞吐能力。

Token Plan同步升级

用量提升至原来的5至8倍,引入Credits概念,计费规则更清晰。

简评

大模型API价格战已进入白热化阶段。从DeepSeek到小米,中国AI公司正在用极致的工程优化能力,把大模型调用成本打到地板价。这对开发者是巨大利好——AI应用创新的门槛正在快速降低。当百万tokens只需要几分钱,AI原生应用的爆发只是时间问题。

本文地址:https://www.163264.com/12330

(0)
上一篇 18小时前
下一篇 12小时前

相关推荐