阿里Qwen3.7-Max发布:国产模型首次逼近GPT/Claude/Gemini顶级水准

核心看点

  • 阿里云峰会 2026 发布全新一代旗舰模型 Qwen3.7-Max
  • Arena 全球大模型盲测总榜超越 Kimi-K2.6、DeepSeek-v4-pro、GLM-5.1
  • 支持 35 小时智能体自主进化,覆盖编程智能体到视觉智能体全场景

详细解析

5 月 20 日,在 2026 阿里云峰会上,阿里巴巴正式发布了千问系列的最新旗舰模型——Qwen3.7-Max。阿里将其定位为”面向智能体时代的新一代旗舰模型”,也是千问迄今最全面、最强大的智能体基座。

在第三方机构 Arena 的全球大模型盲测总榜中,Qwen3.7-Max 的表现尤为亮眼:它超越了 Kimi-K2.6、DeepSeek-v4-pro、GLM-5.1 等国内强劲对手,与 GPT、Claude、Gemini 的最强模型接近,位列国产模型第一

能力方面,Qwen3.7-Max 主打智能体场景。无论是编写和调试代码、自动化办公流程,还是跨越数百乃至数千步的长周期任务,它都能持续自主执行。据官方介绍,该模型可实现35 小时智能体自主进化,拥有极强的多模态推理和视觉理解能力。模型 API 即将通过阿里云百炼平台开放。

简评

国产大模型之间的竞争已经进入白热化阶段。Qwen3.7-Max 的意义不仅在于榜单排名,更在于阿里明确释放了信号:智能体(Agent)才是下一阶段的战场

从”聊天问答”到”自主执行”,从”单次交互”到”长周期任务”,大模型的价值正在被重新定义。Qwen3.7-Max 能否在真实业务场景中兑现这些能力,将是检验其成色的关键。但至少在纸面实力上,国产模型与海外顶尖水平的差距,正在肉眼可见地缩小。

本文地址:https://www.163264.com/12061

(0)
上一篇 1小时前
下一篇 1小时前

相关推荐