核心看点
- Claude Sonnet 5 正式发布:Anthropic 推出迄今 Agent 能力最强的中端模型,性能直逼旗舰 Opus 4.8
- 价格砍掉 60%:优惠期内每百万输入 Token 仅 2 美元、输出 10 美元,企业部署 AI 智能体成本大幅降低
- Agent 能力全面升级:可自主规划任务、调用浏览器和终端、编写代码、多步骤办公
- 成为平台默认模型:免费及付费用户全面开放,已接入 Claude Code 和 Claude Platform
详细解析
Sonnet 5 强在哪?
7 月 1 日,Anthropic 正式发布新一代中端模型 Claude Sonnet 5(代号 Fennec),并将其设为 Claude 平台的默认模型。官方定义这是”迄今智能体能力最强的 Sonnet 模型”。
相比上一代 Sonnet 4.6,新模型在多个维度实现显著提升:
- 编程能力:SWE-bench Pro 得分 63.2%(前代 58.1%),Terminal-Bench 2.1 提升 13.4%
- 知识工作:GDPval-AA v2 基准测试得分 1618 分,超越 Opus 4.8 的 1615 分
- 智能体任务:BrowseComp 搜索评测、OSWorld-Verified 计算机使用评测均有明显改进
- 任务连续性:能更长时间保持任务连续性,多步骤推理中减少偏离目标
三大核心应用场景
Anthropic 明确 Sonnet 5 针对三类应用优化:
- AI 智能体自动执行复杂任务——自主规划、浏览网页、调用工具
- 软件开发与代码生成——重构代码、添加异常处理、生成注释
- 日常知识工作和专业办公——文档分析、数据处理、多工具协同
性价比炸裂
Sonnet 5 的定价策略堪称”降维打击”:
- 优惠期(截至 8 月 31 日):输入 2 美元/百万 Token、输出 10 美元/百万 Token
- 优惠结束后:输入 3 美元、输出 15 美元
- 对比 Opus 4.8:输入 5 美元、输出 25 美元
也就是说,Sonnet 5 以旗舰模型 40% 的价格,提供了接近 90% 的性能。这对企业部署 AI 智能体来说,成本直接腰斩。
安全表现
Sonnet 5 的幻觉率和谄媚率低于前代,对恶意请求的拒绝能力更强。Anthropic 已默认启用实时网络安全防护。不过在 Firefox 漏洞评估中,部分成功率为 13.2%(高于 Sonnet 4.6 的 8.8%,但远低于 Opus 4.8 的 68.8%)。
总结
Claude Sonnet 5 的发布,标志着 Anthropic 在企业 AI 自动化市场的全面发力。以中端定价提供接近旗舰的性能,同时强化 Agent 能力——这不仅是产品迭代,更是一场性价比革命。对于需要大规模部署 AI 智能体的企业而言,Sonnet 5 可能是 2026 年最具成本效益的选择。
目前 Sonnet 5 已在 Claude.ai、API、AWS Bedrock 等平台全面上线,开发者可直接调用 “claude-sonnet-5” 模型。
本文地址:https://www.163264.com/13608


微信扫一扫,鼓励一下~