核心看点
- 阿里在阿里云峰会发布千问旗舰模型Qwen3.7-Max,定位”面向智能体时代的新一代旗舰”
- Arena全球大模型盲测总榜中位列国产模型第一,超过Kimi-K2.6、DeepSeek-v4-pro、GLM-5.1
- 可全自主完成35小时超长程智能体复杂任务,通过超1000次工具调用实现关键内核自我进化
- 推理速度较原版本提升10倍,编程、推理等核心能力持续突破
详细解析
5月20日的阿里云峰会,阿里云连发两弹:上午千问云上线,下午Qwen3.7-Max发布。前者是基础设施,后者是模型内核——双管齐下,阿里在Agent时代要抢的是”全栈话语权”。
Qwen3.7-Max是阿里千问迄今最全面、最强大的智能体模型。在第三方机构Arena的全球大模型盲测总榜中,它超过了Kimi-K2.6、DeepSeek-v4-pro、GLM-5.1,与GPT、Claude、Gemini的最强模型接近,位列国产模型第一。
这个模型的核心设计目标是”全能智能体基座”——无论是编写和调试代码、自动化办公流程,还是跨越数百乃至数千步的长周期任务,都能持续自主执行。
最 impressive 的一个 demo:Qwen3.7-Max在一个全新芯片平台上,通过自主编程和超1000次工具调用,实现了一个关键内核的自我进化,推理速度较原版本提升10倍。全程35小时,全自主完成,无需人工干预。
这意味着什么?意味着这个模型不仅能”用工具”,还能”造工具”——在陌生环境中自我迭代、自我优化,这是通向真正自主智能体的关键一步。
简评
Qwen3.7-Max的发布,加上上午千问云的上线,阿里云在5月20日这一天完成了从”模型层”到”基础设施层”的双层布局。
国产模型第一的成绩单,说明阿里在基础模型能力上已经不输国际顶尖水平。而35小时自主进化、1000+工具调用、内核自我迭代的 demo,则展示了阿里在”智能体”这个下一代AI形态上的技术储备。
更值得玩味的是时间线——同一天发布模型和平台,明显是刻意为之。阿里想传递的信号很清晰:我们既有最强的国产模型,也有最Agent友好的模型服务平台,开发者来这就够了。
对行业来说,这意味着国产大模型的竞争已经从”单点模型能力”升级到”模型+平台+生态”的全栈较量。阿里先出了一手,其他玩家怎么接,值得关注。
本文地址:https://www.163264.com/12005

