AI圈的竞争,永远不缺戏剧性。
**核心看点:OpenAI在4月23日发布GPT-5.5之后,被用户吐槽”降智”长达一个月的Claude官方突然承认问题并发布修复——时间点耐人寻味。**
GPT-5.5这次来势汹汹。定价翻倍($5/$30每百万token),但每个任务消耗更少token,总体划不划算还得看场景。性能上,Terminal-Bench 2.0跑出82.7%,碾压Opus 4.7的69.4%;1M token长文本从GPT-5.4的36.6%跳到74.0%。不过SWE-Bench Pro代码修复只拿了58.6%,不如Opus 4.7的64.3%——不是全维度碾压。
真正有意思的是生态层面的动作。OpenAI不仅发布了模型,还同步升级了Codex——增加浏览器控制、Sheets/Docs处理、系统级语音,最关键的是:Codex订阅可以在任何第三方工具里使用,包括JetBrains、Xcode甚至……Claude Code。
更骚的操作是,Anthropic封杀了OpenClaw通过订阅接口调用Claude,而OpenAI直接雇了OpenClaw创始人Peter Steinberger,把竞争对手的人才和代码都收编了。
”
就在GPT-5.5发布当天,被用户骂了整整一个月的Claude官方开发平台账号突然发公告:承认存在”降智”问题,并表示已经修复。
网友直接翻白眼:”被骂了一个月不理,对手一发布新品你就修复了?”
这个时间点有多戏剧性呢?当天有独立开发者发了两条推文——第一条说”Claude Opus 4.7在SWE-Bench Pro上碾压GPT-5.5″,几小时后又说”Claude Opus 4.7已经不是世界最好模型了,而且差得远”。同一个人,同一天,结论完全反转。
宾夕法尼亚大学教授Ethan Mollick给出了一个精妙的框架:”锯齿边缘”(jagged frontier)——AI的能力边界不是平线推进,而是锯齿状膨胀。你选报道哪颗齿,就决定了你讲什么故事。
**总结:模型能力趋同的背景下,真正决定胜负的是生态——Codex和Claude的战场,已经从谁更聪明,转移到了谁能让你更离不开它。**
本文地址:https://www.163264.com/11441

