GPT-5.5 深度解读:价格翻倍不只是涨价,OpenAI 在下一盘大棋

4 月 27 日,GPT-5.5 正式亮相。API 定价 $5/$30 每百万 Token,直接翻倍。但 Sam Altman 补了一句:你每个任务用的 Token 会少很多。那么问题来了——是真的更划算,还是割韭菜?

核心看点

先看硬指标。GPT-5.5 在多个基准测试中表现炸裂:Terminal-Bench 2.0 达 82.7%(前代 Opus 4.7 是 69.4%),百万 Token 上下文窗口让长文本检索从 GPT-5.4 的 36.6% 飙升至 74.0%。

有个真实案例很震撼:24,771 份 K-1 税表(71,637 页)的自动审阅,原本需要两周,GPT-5.5 瞬间搞定。还有研究者用 GPT-5.5 参与了一个 Ramsey 数渐近证明,原本需要数月人工分析才能完成的开创性工作。

但并非全维度碾压

在 SWE-Bench Pro(代码修复)测试中,GPT-5.5 只有 58.6%,而 Claude Opus 4.7 拿了 64.3%。幻觉率方面,GPT-5.5 为 86%,Opus 4.7 只有 36%。说明 GPT-5.5 在纯粹编码和事实准确性上并非无敌。

宾夕法尼亚大学教授 Ethan Mollick 给了一个很好的分析框架:AI 的能力边界不是平坦推进的,而是锯齿状的。选报道哪颗「齿」,就决定你讲什么故事。

真正的亮点是 Codex

GPT-5.5 发布同一天,Codex 桌面端上线了浏览器控制、Sheets/Docs 处理、系统级语音和自动审查。这才是 OpenAI 的真正意图。

更关键的是生态布局。Anthropic 封杀了第三方通过订阅接口调用 Claude。而 OpenAI 反其道而行之——雇了 OpenClaw 创始人 Peter Steinberger,宣布 Codex 订阅可以在任意第三方工具里使用,包括 JetBrains、Xcode,甚至 Claude Code。

OpenAI 开发者体验主管 Romain Huet 直言:「我们希望用户在任何地方都能用 Codex。」

API 延期发布也不是巧合。官方说「正在做安全审查」,但客观效果是:想用 GPT-5.5,短期内唯一路径就是 Codex 生态。用户被锁进了应用层。

Anthropic 慌了

最有意思的剧情是:GPT-5.5 发布当天,Claude 官方开发平台账号突然发公告承认了用户诟病已久的「降智」问题,并表示已经修复。被用户投诉了一个月没反应,竞争对手一发力就修复了——网友调侃这是 GPT-5.5 能力最好的背书。

加速才刚刚开始

GPT-5.5 距离 GPT-5.4 只隔了一个多月。OpenAI 首席科学家 Jakub Pachocki 说了一句让人惊讶的话:「过去几年其实慢得令人意外。」在 OpenAI 内部,已经有人用 GPT-5.5 做「隔夜实验」——给个算法想法,通宵跑,醒来 dashboard 就绪。他们用的词不是 assistant,而是「competent AI research partner」。

总结
GPT-5.5 不是一次单纯的模型升级。它是 OpenAI 从「卖算力」转向「抢入口」的战略转折点。价格翻倍不是核心,Codex 生态才是真正的战场。当 Anthropic 还在守着 API 利润率时,OpenAI 已经把订阅制做成了一个开放平台。

这场 AI 竞赛的下半场,拼的已经不是模型跑分,而是谁能把用户留在自己的生态里了。

本文地址:https://www.163264.com/11214

(0)
上一篇 20小时前
下一篇 19小时前

相关推荐