GPT-5.5发布逼Claude紧急修复降智:大模型竞争重心从跑分转向生态

OpenAI在4月下旬甩出了GPT-5.5这个重磅炸弹,不仅让整个AI圈炸了锅,更让老对手Anthropic坐不住了——发布当天,Claude官方就火速承认并修复了被用户吐槽整整一个月的”降智”问题。

**核心看点**

**GPT-5.5——更贵但不更”烧”,Codex才是真主角**

GPT-5.5的API定价直接翻倍,$5/$30每百万token,是GPT-5.4的两倍。但Sam Altman强调:”完成任务需要的token更少了。”换算下来,单任务的综合成本反而下降了。加上和NVIDIA GB200/GB300的协同设计,推理速度提升了20%。

性能数据也很亮眼:
– Terminal-Bench 2.0(长时间推理):82.7%,碾压Opus 4.7的69.4%
– 100万token上下文窗口,长文本检索从GPT-5.4的36.6%跃升至74.0%
– GDPval(覆盖44个职业的知识工作基准)达到84.9%

但有趣的是,GPT-5.5在SWE-Bench Pro(代码修复)上只有58.6%,反而低于Opus 4.7的64.3%。这也印证了一个事实:大模型的能力边界是锯齿状推进的,没有全维度碾压的”神”。

**真正的杀招:Codex生态取代API卖水**

比起模型本身,OpenAI的生态布局更值得关注。发布同一天同步推出了:浏览器控制、Sheets/Slides/Docs处理、系统级语音、自动审查。而且他们做了一件让业界震惊的事——挖来OpenClaw创始人,宣布Codex订阅可以在任何第三方工具中使用,包括JetBrains、Xcode,甚至Claude Code。

这就很耐人寻味了:Anthropic刚封杀了OpenClaw通过订阅接口调用Claude,OpenAI就反过来拥抱开放。一个守API利润率,一个把订阅制变成开放平台——两条完全不同的路线。

**被刺痛了:Claude发布当天紧急修复降智**

被用户吐槽”变笨”整整一个月,Anthropic一直没动静。结果GPT-5.5一发布,Claude官方开发平台账号马上发公告承认”降智”问题并紧急修复。网友都笑了:”被骂了三十天不改,对手一发新模型你就急了?”

这件事本身就给GPT-5.5做了最好的背书。

**总结**

GPT-5.5的发布表面上是一个更强的模型,但从战略层面看,它标志着AI竞争进入新阶段——不卖算力,抢入口。OpenAI在押注一个”用户走不掉”的生态闭环。而对Anthropic来说,压力不在跑分,在于怎么守住自己的地盘。这场好戏,才刚开场。

本文地址:https://www.163264.com/11427

(0)
上一篇 22小时前
下一篇 22小时前

相关推荐