tokens

  • 小米大模型API价格屠夫:MiMo-V2.5最高降幅99%,百万tokens只要2分钱

    核心看点 5月27日,小米宣布旗下自研大模型MiMo-V2.5系列API永久降价,最高降幅达99%。这是继DeepSeek之后,又一家中国AI公司向大模型API价格发起猛烈冲击。 详细解析 降价幅度有多狠? MiMo-V2.5 Pro输入缓存命中:降至0.025元/百万tokens,降幅99% MiMo-V2.5输入缓存命中:降至0.02元/百万tokens,降幅98% MiM…

    模型框架 2026年5月27日
  • 小米大模型API永久降价99%:国产大模型价格战再升级

    核心看点 5月27日,小米宣布旗下自研大模型MiMo-V2.5系列API永久降价,最高降幅达99%。更关键的是,小米取消了上下文窗口长度的区分定价——无论输入多少token,统一按新价格计费。这一调整已于北京时间5月27日0:00全球同步生效。 详细解析 价格有多狠? MiMo-V2.5 Pro输入缓存命中:降至0.025元/百万tokens,降幅99% MiMo-V2.5输入…

    模型框架 2026年5月27日
  • DeepSeek API永久降价75% + 500并发扩容:国产大模型进入”白菜价”时代

    核心看点 DeepSeek接连放出两记重拳:V4-Pro API永久降至原价1/4,同时完成服务扩容默认支持500并发。这意味着国产大模型的调用成本正式跌破”地板价”。 详细解析 新价格有多狠? 输入(缓存命中):0.1元 → 0.025元/百万Tokens 输入(缓存未命中):12元 → 3元/百万Tokens 输出:24元 → 6元/百万Tokens…

    学起来 2026年5月25日
  • DeepSeek-V4-Pro API永久降价75%,国产大模型价格战再升级

    核心看点 DeepSeek-V4-Pro API价格永久调整为原定价的1/4(2.5折) 输入缓存命中0.1元/百万Tokens,未命中12元/百万Tokens,输出24元/百万Tokens 此前限时优惠变为永久政策,开发者成本大幅降低 详细解析 5月22日,DeepSeek官方宣布了一个重磅消息:DeepSeek-V4-Pro模型的API价格将在5月31日结束限时优惠活动后,…

    AI 日报 2026年5月23日
  • 大模型算力”水电化”:中国电信推出9.9元/月Token套餐

    核心看点 中国电信推出系列试商用Token套餐,个人版最低9.9元/月 融合星辰大模型、DeepSeek V3.2、GLM5等国内主流大模型 提供”Token+连接+安全”一体化服务 标志着大模型算力从”奢侈品”走向”日用品” 详细解析 5月17日,中国电信正式推出Token套餐,分企业和个人两条线,价格直…

    行业/好文 2026年5月18日
  • 蚂蚁集团百灵大模型Ling-2.6-flash正式开源:104B参数,推理速度340 tokens/s

    核心看点 104B总参数-7.4B激活参数:采用混合线性架构,推理速度在4卡H20条件下最快达340 tokens/s,Prefill吞吐达Nemotron-3-Super的2.2倍 极致Token效率:在Artificial Analysis评测中,仅消耗15M tokens完成评测,约为同类模型的1/10,大幅降低商用成本 多精度版本开源:同步提供BF16、FP8、INT4…

    开源项目 2026年4月30日