tokens

OpenAI GPT-5.6系列模型或将于下周发布，上下文窗口扩展至150万tokens

核心看点：据科技媒体 testingcatalog 6月19日报道，OpenAI有望在下周推出GPT-5.6系列模型，涵盖mini、标准版以及Pro版等多个版本。这是继4月发布GPT-5.5后的又一次重大升级。详细解析： 1. 上下文处理能力大幅提升 GPT-5.6最引人注目的改进是上下文窗口从原有的100万tokens扩展至150万tokens。这意味着模型能够一次性处理…

openai-gpt 2026年6月21日

小米大模型API价格屠夫：MiMo-V2.5最高降幅99%，百万tokens只要2分钱

核心看点 5月27日，小米宣布旗下自研大模型MiMo-V2.5系列API永久降价，最高降幅达99%。这是继DeepSeek之后，又一家中国AI公司向大模型API价格发起猛烈冲击。详细解析降价幅度有多狠？ MiMo-V2.5 Pro输入缓存命中：降至0.025元/百万tokens，降幅99% MiMo-V2.5输入缓存命中：降至0.02元/百万tokens，降幅98% MiM…

模型框架 2026年5月27日

小米大模型API永久降价99%：国产大模型价格战再升级

核心看点 5月27日，小米宣布旗下自研大模型MiMo-V2.5系列API永久降价，最高降幅达99%。更关键的是，小米取消了上下文窗口长度的区分定价——无论输入多少token，统一按新价格计费。这一调整已于北京时间5月27日0:00全球同步生效。详细解析价格有多狠？ MiMo-V2.5 Pro输入缓存命中：降至0.025元/百万tokens，降幅99% MiMo-V2.5输入…

模型框架 2026年5月27日

DeepSeek API永久降价75% + 500并发扩容：国产大模型进入”白菜价”时代

核心看点 DeepSeek接连放出两记重拳：V4-Pro API永久降至原价1/4，同时完成服务扩容默认支持500并发。这意味着国产大模型的调用成本正式跌破”地板价”。详细解析新价格有多狠？输入（缓存命中）：0.1元 → 0.025元/百万Tokens 输入（缓存未命中）：12元 → 3元/百万Tokens 输出：24元 → 6元/百万Tokens…

学起来 2026年5月25日

DeepSeek-V4-Pro API永久降价75%，国产大模型价格战再升级

核心看点 DeepSeek-V4-Pro API价格永久调整为原定价的1/4（2.5折）输入缓存命中0.1元/百万Tokens，未命中12元/百万Tokens，输出24元/百万Tokens 此前限时优惠变为永久政策，开发者成本大幅降低详细解析 5月22日，DeepSeek官方宣布了一个重磅消息：DeepSeek-V4-Pro模型的API价格将在5月31日结束限时优惠活动后，…

AI 日报 2026年5月23日

大模型算力”水电化”：中国电信推出9.9元/月Token套餐

核心看点中国电信推出系列试商用Token套餐，个人版最低9.9元/月融合星辰大模型、DeepSeek V3.2、GLM5等国内主流大模型提供”Token+连接+安全”一体化服务标志着大模型算力从”奢侈品”走向”日用品” 详细解析 5月17日，中国电信正式推出Token套餐，分企业和个人两条线，价格直…

行业/好文 2026年5月18日

蚂蚁集团百灵大模型Ling-2.6-flash正式开源：104B参数，推理速度340 tokens/s

核心看点 104B总参数-7.4B激活参数：采用混合线性架构，推理速度在4卡H20条件下最快达340 tokens/s，Prefill吞吐达Nemotron-3-Super的2.2倍极致Token效率：在Artificial Analysis评测中，仅消耗15M tokens完成评测，约为同类模型的1/10，大幅降低商用成本多精度版本开源：同步提供BF16、FP8、INT4…

开源项目 2026年4月30日