小米大模型API价格屠夫：MiMo-V2.5最高降幅99%，百万tokens只要2分钱

2026年5月27日下午3:12 • 模型框架 • 阅读 320

Table of Contents

核心看点

5月27日，小米宣布旗下自研大模型MiMo-V2.5系列API永久降价，最高降幅达99%。这是继DeepSeek之后，又一家中国AI公司向大模型API价格发起猛烈冲击。

降价幅度有多狠？

技术底气在哪？

小米技术团队基于SGLang HiCache完整支持SWA（Sliding Window Attention），将KV Cache在多级存储间的数据搬运量降低至优化前的近1/7，可缓存token数量提升至近5倍。同时优化专家并行方案、输入长度分桶策略，大幅提升集群输入吞吐能力。

Token Plan同步升级

用量提升至原来的5至8倍，引入Credits概念，计费规则更清晰。

大模型API价格战已进入白热化阶段。从DeepSeek到小米，中国AI公司正在用极致的工程优化能力，把大模型调用成本打到地板价。这对开发者是巨大利好——AI应用创新的门槛正在快速降低。当百万tokens只需要几分钱，AI原生应用的爆发只是时间问题。

本文地址：https://www.163264.com/12330