GPT-5.5发布当天,Claude终于承认了被吐槽一个月的”降智”问题

近日,OpenAI发布GPT-5.5的消息炸翻了AI圈,但有趣的是,最大的反应反而来自对手Anthropic。

就在GPT-5.5发布的同一天,Claude官方开发平台账号发布了一则公告:承认了用户诟病已久的”降智”问题,并表示已修复。

网友纷纷揶揄:被吐槽了整整一个月,偏偏在对手发布新模型后承认和修复,这节奏感也太强了。

核心看点

GPT-5.5来了,Claude”慌了”?

GPT-5.5的发布显然给Anthropic带来了不小压力。这款新模型在多个核心基准测试上表现亮眼:

– Terminal-Bench 2.0(长时间推理):82.7%,碾压Claude Opus 4.7的69.4%
– 百万token上下文窗口:长文本检索从GPT-5.4的36.6%飙升至74%,Opus 4.7仅32.2%
– GDPval(覆盖44个职业的知识工作):84.9%

不过也不是全面碾压。SWE-Bench Pro(代码修复)上,Opus 4.7拿了64.3%,GPT-5.5只有58.6%。两边各有优势。

“降智”问题从何而来?

所谓”降智”,是指Claude模型在实际使用中,某些场景下的表现明显不如之前的版本。这一问题被用户吐槽了整整一个月,但Anthropic一直未正面回应。

有分析认为,这可能是Anthropic在优化模型时,为了控制成本或提升推理速度,某些能力出现了”回退”。而这种优化与性能之间的博弈,几乎是所有大模型公司都会面临的难题。

这次Anthropic选择在GPT-5.5发布之际承认并修复,一方面展示了解决问题的态度,另一方面也被外界解读为:在新一轮竞争中,Claude需要保持最好的状态迎战。

竞争升级:从模型到生态

这次GPT-5.5发布背后,一个更大的趋势值得关注——竞争的重心正在从模型本身转移到整个生态。

OpenAI的策略很明确:涨价两倍同时API延迟上线,唯一能用GPT-5.5的路径是Codex生态。而且他们还直接挖了OpenClaw创始人,让Codex订阅可以在第三方工具里用,甚至兼容Claude Code。

Anthropic这边则选择了不同路线——封杀第三方通过订阅接口调用Claude,保护API利润率。

两家公司在商业模式上的分歧越来越清晰:

– OpenAI:订阅制开放平台,抢入口
– Anthropic:API壁垒,保利润率

创作者依旧受益

无论巨头们怎么打,对普通用户来说,这次的”承认+修复”是好事。更快的问题响应意味着更好的产品质量。正如一位开发者所说:”被骂了一个月才修,改了总比不改强。”

Claude的修复以及GPT-5.5的出现,说明AI模型正进入一个高频迭代期。不管是OpenAI还是Anthropic,都不想在这个窗口期掉队。而用户,则成为这场竞争的最大赢家。

总结:GPT-5.5的发布给行业注入了新变量,而Claude在压力下的快速响应也值得肯定。后续两家在模型能力和生态构建上的较量,才是真正的好戏。

本文地址:https://www.163264.com/11443

(0)
上一篇 2026年5月4日 下午10:01
下一篇 2026年5月5日 下午10:01

相关推荐