北京时间6月10日凌晨,Anthropic在没有任何预热的情况下,突然放出了旗下最强大模型——Claude Fable 5,以及其孪生版本Claude Mythos 5。这是Anthropic首次将”Mythos级”(最高能力等级)模型面向公众开放,标志着大模型竞争正式进入”安全对齐 + 极致能力”的双轨新阶段。
核心看点
1. Mythos级首次公开,性能全面屠榜
Claude Fable 5是Anthropic首个面向公众开放的Mythos级模型。在各项基准测试中,它几乎全面领先:
– SWE-Bench Pro(编程任务):80.3%,远超Opus 4.8的69.2%,更是把GPT-5.5的58.6%甩出近22分
– FrontierCode Diamond:29.3%,翻倍领先竞品
– Humanity’s Last Exam:59.0%
– GDPval-AA:1932分
这意味着什么?简单来说,Fable 5是目前公开可用的最强编程AI,没有之一。
2. 百万Token上下文 + 128K输出,吞吐量恐怖
Fable 5的上下文窗口直接拉满到100万Token,单次最大输出支持128K Token。你可以直接把一整套中型微服务系统的源码丢给它,让它一次性生成完整的系统架构文档或模块代码,不用再频繁”断点续传”。
3. 自适应思考机制:AI会自己决定”想多久”
Fable 5引入了Adaptive Thinking(自适应思考)机制,这是默认且无法关闭的核心功能。模型会根据问题复杂度自主分配”认知预算”——简单问题快速回答,复杂问题深度推理。这不是简单的推理开关,而是真正的智能资源调度。
4. 长时程自主性:能自己干好几天的活
Fable 5专为长时程任务设计,能够自主运行数天,完成规划、执行、自我验证的完整闭环。从百万行代码库迁移到复杂科学研发,以前只有顶尖人类团队能做的事,现在AI可以独立完成。
5. 视觉能力突破:看图写代码、玩游戏
Fable 5在视觉理解上也达到了SOTA水平。它能理解复杂图表、通过截图重建代码,甚至在Pokémon FireRed等纯视觉任务中实现突破。对于需要处理UI设计稿、数据可视化图表的开发者来说,这简直是神器。
安全护栏:能力越强,责任越大
鉴于Mythos级底层能力过于强大,Anthropic为Fable 5设置了动态安全网关。涉及网络安全(漏洞利用、渗透工具)、生物合成、化学制剂等高风险领域的查询,系统会自动拦截并回退到Opus 4.8作答。官方表示,触发率平均不到5%。
这种设计很聪明:让普通用户安全享用前沿智能,同时把最危险的能力锁在笼子里。
定价:能力翻倍,价格翻倍
Fable 5的API定价为:
– 输入:10美元/百万Token
– 输出:50美元/百万Token
这是Opus 4.8的两倍,但考虑到性能提升幅度,对于企业级应用场景来说,性价比依然很高。
双模型策略:Fable vs Mythos
这次Anthropic同时发布了两个版本:
– Claude Fable 5:面向普通用户和企业,带有保守安全护栏
– Claude Mythos 5:同样的模型主体,放宽了部分安全限制,通过Project Glasswing项目,专门提供给网络防御和关键基础设施安全团队
一句话总结:能力一样,权限不同。
总结
Claude Fable 5的发布,标志着Anthropic在AI能力与安全平衡上迈出了关键一步。它不是简单的模型迭代,而是一次质的飞跃——百万Token上下文、自适应思考、长时程自主性、视觉SOTA,这些特性组合在一起,让Fable 5成为当前全球综合性能最强的商用大模型之一。
对于开发者来说,这意味着更强大的编程助手;对于企业来说,这意味着更可靠的AI同事。而对于整个行业来说,Anthropic正在证明:能力与安全,不是二选一,而是可以兼得。
本文地址:https://www.163264.com/13016


微信扫一扫,鼓励一下~