Claude Sonnet 5 正式发布：Agent能力最强中端模型，价格砍掉60%

Table of Contents

核心看点

Claude Sonnet 5 正式发布：Anthropic 推出迄今 Agent 能力最强的中端模型，性能直逼旗舰 Opus 4.8
价格砍掉 60%：优惠期内每百万输入 Token 仅 2 美元、输出 10 美元，企业部署 AI 智能体成本大幅降低
Agent 能力全面升级：可自主规划任务、调用浏览器和终端、编写代码、多步骤办公
成为平台默认模型：免费及付费用户全面开放，已接入 Claude Code 和 Claude Platform

详细解析

Sonnet 5 强在哪？

7 月 1 日，Anthropic 正式发布新一代中端模型 Claude Sonnet 5（代号 Fennec），并将其设为 Claude 平台的默认模型。官方定义这是”迄今智能体能力最强的 Sonnet 模型”。

相比上一代 Sonnet 4.6，新模型在多个维度实现显著提升：

编程能力：SWE-bench Pro 得分 63.2%（前代 58.1%），Terminal-Bench 2.1 提升 13.4%
知识工作：GDPval-AA v2 基准测试得分 1618 分，超越 Opus 4.8 的 1615 分
智能体任务：BrowseComp 搜索评测、OSWorld-Verified 计算机使用评测均有明显改进
任务连续性：能更长时间保持任务连续性，多步骤推理中减少偏离目标

三大核心应用场景

Anthropic 明确 Sonnet 5 针对三类应用优化：

AI 智能体自动执行复杂任务——自主规划、浏览网页、调用工具
软件开发与代码生成——重构代码、添加异常处理、生成注释
日常知识工作和专业办公——文档分析、数据处理、多工具协同

性价比炸裂

Sonnet 5 的定价策略堪称”降维打击”：

优惠期（截至 8 月 31 日）：输入 2 美元/百万 Token、输出 10 美元/百万 Token
优惠结束后：输入 3 美元、输出 15 美元
对比 Opus 4.8：输入 5 美元、输出 25 美元

也就是说，Sonnet 5 以旗舰模型 40% 的价格，提供了接近 90% 的性能。这对企业部署 AI 智能体来说，成本直接腰斩。

安全表现

Sonnet 5 的幻觉率和谄媚率低于前代，对恶意请求的拒绝能力更强。Anthropic 已默认启用实时网络安全防护。不过在 Firefox 漏洞评估中，部分成功率为 13.2%（高于 Sonnet 4.6 的 8.8%，但远低于 Opus 4.8 的 68.8%）。

总结

Claude Sonnet 5 的发布，标志着 Anthropic 在企业 AI 自动化市场的全面发力。以中端定价提供接近旗舰的性能，同时强化 Agent 能力——这不仅是产品迭代，更是一场性价比革命。对于需要大规模部署 AI 智能体的企业而言，Sonnet 5 可能是 2026 年最具成本效益的选择。

目前 Sonnet 5 已在 Claude.ai、API、AWS Bedrock 等平台全面上线，开发者可直接调用 “claude-sonnet-5” 模型。

本文地址：https://www.163264.com/13608