Anthropic 发布 Claude Sonnet 5:中端模型逼近旗舰性能,价格直降四成

Anthropic 发布 Claude Sonnet 5,性能逼近旗舰 Opus 4.8,价格却便宜 40%-60%,直接设为平台默认模型。

Table of Contents

核心看点

  • Claude Sonnet 5 正式发布,性能逼近旗舰 Opus 4.8,价格却便宜 40%-60%
  • 智能体能力大幅增强,能自主制定计划、使用浏览器和终端工具
  • 直接设为 Claude 平台默认模型,免费和付费用户都能用
  • API 优惠期至 8 月 31 日:输入 /百万 token,输出 /百万 token

正文

7 月 1 日,Anthropic 正式发布了 Claude Sonnet 5,这是其 Sonnet 系列中智能体能力最强的模型。官方毫不掩饰地称其为"迄今为止最具 Agent 属性的 Sonnet 模型"。

从性能数据来看,Sonnet 5 确实做到了"以下犯上"。在 SWE-bench Pro 编程基准测试中,Sonnet 5 得分 63.2%,而旗舰 Opus 4.8 为 69.2%,差距已经缩小到个位数。在 Terminal-Bench 2.1 上,Sonnet 5 的 80.4% 对比 Opus 的 82.7%,同样非常接近。更夸张的是,在 GDPval-AA v2 测试中,Sonnet 5 的 1618 分甚至反超了 Opus 的 1615 分

这意味着什么?以前必须花高价调用旗舰模型才能放心交给 AI 干的活,现在中端模型就能接住了。对开发者来说,多 Agent 架构的成本门槛被一脚踹低——同样的预算,以前跑一个 Opus 级 Agent,现在可以跑两到三个并行的 Sonnet。

智能体能力方面,Sonnet 5 能够制定计划、使用浏览器和终端等工具,并以自主方式运行。在 BrowseComp 智能体搜索评测和 OSWorld-Verified 计算机使用评测中,相比前代 Sonnet 4.6 有明显改进。

定价策略是这次发布最狠的一招。优惠期(至 2026 年 8 月 31 日)内,API 调用价格为每百万输入 Token 2 美元、输出 Token 10 美元,比 Opus 4.8 便宜约 60%。优惠期结束后,价格调整为输入 3 美元、输出 15 美元,但仍比 Opus 便宜约 40%。

Anthropic 还直接把 Sonnet 5 设为 Claude 聊天服务的默认模型,免费和付费用户都能直接使用。开发者调用 API 时指定模型名"claude-sonnet-5"即可。

值得注意的是,Anthropic 的定价策略与 OpenAI 形成了鲜明对比。OpenAI 的 GPT-5.6 Terra 在 4 月调价时,每百万输入 token 从 2.5 美元提到 5 美元,走的是"能力越强、价格越贵"的溢价路线。而 Anthropic 选择把接近旗舰的能力,用中端价格大规模铺开。

总结

Claude Sonnet 5 的发布,标志着中端模型与旗舰模型的性能差距正在被压缩到可以忽略的程度。对 Anthropic 来说,这是在用便宜的模型蚕食自己更贵的 Opus,但背后的逻辑是:当模型能力越来越同质化,"谁能用更低成本把能力铺到更多人手里",可能比"谁拥有最强的那个模型"更有商业价值。

对普通用户和开发者来说,这无疑是好消息——花更少的钱,用更强的模型。

本文地址:https://www.163264.com/13569

(0)
Anthropic 发布 Claude Science:科学家的 AI 工作台,内置 60 多个科研技能
上一篇 9小时前
下一篇 4小时前

相关推荐