Claude Sonnet 5 正式发布:Agent能力最强中端模型,价格砍掉60%

核心看点

  • Claude Sonnet 5 正式发布:Anthropic 推出迄今 Agent 能力最强的中端模型,性能直逼旗舰 Opus 4.8
  • 价格砍掉 60%:优惠期内每百万输入 Token 仅 2 美元、输出 10 美元,企业部署 AI 智能体成本大幅降低
  • Agent 能力全面升级:可自主规划任务、调用浏览器和终端、编写代码、多步骤办公
  • 成为平台默认模型:免费及付费用户全面开放,已接入 Claude Code 和 Claude Platform

详细解析

Sonnet 5 强在哪?

7 月 1 日,Anthropic 正式发布新一代中端模型 Claude Sonnet 5(代号 Fennec),并将其设为 Claude 平台的默认模型。官方定义这是”迄今智能体能力最强的 Sonnet 模型”。

相比上一代 Sonnet 4.6,新模型在多个维度实现显著提升:

  • 编程能力:SWE-bench Pro 得分 63.2%(前代 58.1%),Terminal-Bench 2.1 提升 13.4%
  • 知识工作:GDPval-AA v2 基准测试得分 1618 分,超越 Opus 4.8 的 1615 分
  • 智能体任务:BrowseComp 搜索评测、OSWorld-Verified 计算机使用评测均有明显改进
  • 任务连续性:能更长时间保持任务连续性,多步骤推理中减少偏离目标

三大核心应用场景

Anthropic 明确 Sonnet 5 针对三类应用优化:

  1. AI 智能体自动执行复杂任务——自主规划、浏览网页、调用工具
  2. 软件开发与代码生成——重构代码、添加异常处理、生成注释
  3. 日常知识工作和专业办公——文档分析、数据处理、多工具协同

性价比炸裂

Sonnet 5 的定价策略堪称”降维打击”:

  • 优惠期(截至 8 月 31 日):输入 2 美元/百万 Token、输出 10 美元/百万 Token
  • 优惠结束后:输入 3 美元、输出 15 美元
  • 对比 Opus 4.8:输入 5 美元、输出 25 美元

也就是说,Sonnet 5 以旗舰模型 40% 的价格,提供了接近 90% 的性能。这对企业部署 AI 智能体来说,成本直接腰斩。

安全表现

Sonnet 5 的幻觉率和谄媚率低于前代,对恶意请求的拒绝能力更强。Anthropic 已默认启用实时网络安全防护。不过在 Firefox 漏洞评估中,部分成功率为 13.2%(高于 Sonnet 4.6 的 8.8%,但远低于 Opus 4.8 的 68.8%)。

总结

Claude Sonnet 5 的发布,标志着 Anthropic 在企业 AI 自动化市场的全面发力。以中端定价提供接近旗舰的性能,同时强化 Agent 能力——这不仅是产品迭代,更是一场性价比革命。对于需要大规模部署 AI 智能体的企业而言,Sonnet 5 可能是 2026 年最具成本效益的选择。

目前 Sonnet 5 已在 Claude.ai、API、AWS Bedrock 等平台全面上线,开发者可直接调用 “claude-sonnet-5” 模型。

本文地址:https://www.163264.com/13608

(0)
微信支付宝正式入局,AI助手赛道进入三方混战新阶段
上一篇 10小时前
下一篇 3小时前

相关推荐