核心看点
- 阿里巴巴发布全新一代千问旗舰模型Qwen3.7-Max,千问APP、PC端及网页端同步接入
- 在三方机构Artificial Analysis全球大模型榜单中得分56.6分,位列全球第五、国产第一
- 编程智能体、通用智能体、推理能力、多语言能力四大维度全面领先国产竞品
- 用户可免费体验,无需额外付费
详细解析
5月22日,阿里巴巴在2026阿里云峰会上正式发布了全新一代千问旗舰模型Qwen3.7-Max。这是千问旗舰模型在短短三个月内完成的第三次重大迭代,从3.5到3.6再到3.7,阿里大模型的迭代速度令人瞩目。
编程智能体方面,Qwen3.7-Max在SWE-Pro、SWE-Multilingual等测评中均取得领先表现,在Terminal Bench 2.0-Terminus得分69.7,超过了DeepSeek-v4-pro-Max、Claude-Opus4.6等一众国际顶尖模型。
通用智能体方面,Qwen3.7-Max在MCP-Atlas、MCP-Mark、Skillbench等现实能力测试中表现优异,超越GLM5.1、Kimi-K2.6等国产模型,创下国产新高,并在Kernel Bench L3上展示了强大的GPU内核优化能力。
推理能力方面,Qwen3.7-Max在GPQA Diamond、HLE、HMMT 2026 Feb、IMOAnswerBench等推理核心测评中均超越了Claude-Opus4.6及所有国产模型。
多语言能力方面,Qwen3.7-Max在指令遵循IFBench评测中得分79.1分突破新高,在多语言理解和翻译的WMT24、MAXIFE评测中领先。
用户只需将千问APP更新至最新版(6.9.7及以上),点击下方胶囊”Qwen3.7-Max”,或在PC端及网页端对话界面的模型选择栏中进行下拉切换,即可第一时间免费体验。
简评
Qwen3.7-Max的发布标志着国产大模型在多个核心维度上实现了对国际顶尖模型的追赶甚至超越。阿里在三个月内完成三次重大迭代,展现了其在AI领域的决心和执行力。更值得关注的是,这款旗舰模型面向用户免费开放,这将大大降低AI技术的使用门槛,推动AI应用的普及。对于开发者和企业用户来说,Qwen3.7-Max在编程和智能体方面的突出表现,意味着更高效的生产力工具已经到来。
本文地址:https://www.163264.com/12266

