GPT-5.5 深度解读：价格翻倍不只是涨价，OpenAI 在下一盘大棋

4 月 27 日，GPT-5.5 正式亮相。API 定价 $5/$30 每百万 Token，直接翻倍。但 Sam Altman 补了一句：你每个任务用的 Token 会少很多。那么问题来了——是真的更划算，还是割韭菜？

核心看点

先看硬指标。GPT-5.5 在多个基准测试中表现炸裂：Terminal-Bench 2.0 达 82.7%（前代 Opus 4.7 是 69.4%），百万 Token 上下文窗口让长文本检索从 GPT-5.4 的 36.6% 飙升至 74.0%。

有个真实案例很震撼：24,771 份 K-1 税表（71,637 页）的自动审阅，原本需要两周，GPT-5.5 瞬间搞定。还有研究者用 GPT-5.5 参与了一个 Ramsey 数渐近证明，原本需要数月人工分析才能完成的开创性工作。

但并非全维度碾压

在 SWE-Bench Pro（代码修复）测试中，GPT-5.5 只有 58.6%，而 Claude Opus 4.7 拿了 64.3%。幻觉率方面，GPT-5.5 为 86%，Opus 4.7 只有 36%。说明 GPT-5.5 在纯粹编码和事实准确性上并非无敌。

宾夕法尼亚大学教授 Ethan Mollick 给了一个很好的分析框架：AI 的能力边界不是平坦推进的，而是锯齿状的。选报道哪颗「齿」，就决定你讲什么故事。

真正的亮点是 Codex

GPT-5.5 发布同一天，Codex 桌面端上线了浏览器控制、Sheets/Docs 处理、系统级语音和自动审查。这才是 OpenAI 的真正意图。

更关键的是生态布局。Anthropic 封杀了第三方通过订阅接口调用 Claude。而 OpenAI 反其道而行之——雇了 OpenClaw 创始人 Peter Steinberger，宣布 Codex 订阅可以在任意第三方工具里使用，包括 JetBrains、Xcode，甚至 Claude Code。

OpenAI 开发者体验主管 Romain Huet 直言：「我们希望用户在任何地方都能用 Codex。」

API 延期发布也不是巧合。官方说「正在做安全审查」，但客观效果是：想用 GPT-5.5，短期内唯一路径就是 Codex 生态。用户被锁进了应用层。

Anthropic 慌了

最有意思的剧情是：GPT-5.5 发布当天，Claude 官方开发平台账号突然发公告承认了用户诟病已久的「降智」问题，并表示已经修复。被用户投诉了一个月没反应，竞争对手一发力就修复了——网友调侃这是 GPT-5.5 能力最好的背书。

加速才刚刚开始

GPT-5.5 距离 GPT-5.4 只隔了一个多月。OpenAI 首席科学家 Jakub Pachocki 说了一句让人惊讶的话：「过去几年其实慢得令人意外。」在 OpenAI 内部，已经有人用 GPT-5.5 做「隔夜实验」——给个算法想法，通宵跑，醒来 dashboard 就绪。他们用的词不是 assistant，而是「competent AI research partner」。

总结
GPT-5.5 不是一次单纯的模型升级。它是 OpenAI 从「卖算力」转向「抢入口」的战略转折点。价格翻倍不是核心，Codex 生态才是真正的战场。当 Anthropic 还在守着 API 利润率时，OpenAI 已经把订阅制做成了一个开放平台。

这场 AI 竞赛的下半场，拼的已经不是模型跑分，而是谁能把用户留在自己的生态里了。

本文地址：https://www.163264.com/11214

GPT-5.5 深度解读：价格翻倍不只是涨价，OpenAI 在下一盘大棋

相关推荐