国产第一!阿里Qwen3.7-Max发布:35小时自主进化,智能体时代的新标杆

核心看点

  • 阿里在阿里云峰会发布千问旗舰模型Qwen3.7-Max,定位”面向智能体时代的新一代旗舰”
  • Arena全球大模型盲测总榜中位列国产模型第一,超过Kimi-K2.6、DeepSeek-v4-pro、GLM-5.1
  • 可全自主完成35小时超长程智能体复杂任务,通过超1000次工具调用实现关键内核自我进化
  • 推理速度较原版本提升10倍,编程、推理等核心能力持续突破

详细解析

5月20日的阿里云峰会,阿里云连发两弹:上午千问云上线,下午Qwen3.7-Max发布。前者是基础设施,后者是模型内核——双管齐下,阿里在Agent时代要抢的是”全栈话语权”。

Qwen3.7-Max是阿里千问迄今最全面、最强大的智能体模型。在第三方机构Arena的全球大模型盲测总榜中,它超过了Kimi-K2.6、DeepSeek-v4-pro、GLM-5.1,与GPT、Claude、Gemini的最强模型接近,位列国产模型第一

这个模型的核心设计目标是”全能智能体基座”——无论是编写和调试代码、自动化办公流程,还是跨越数百乃至数千步的长周期任务,都能持续自主执行。

最 impressive 的一个 demo:Qwen3.7-Max在一个全新芯片平台上,通过自主编程和超1000次工具调用,实现了一个关键内核的自我进化,推理速度较原版本提升10倍。全程35小时,全自主完成,无需人工干预。

这意味着什么?意味着这个模型不仅能”用工具”,还能”造工具”——在陌生环境中自我迭代、自我优化,这是通向真正自主智能体的关键一步。

简评

Qwen3.7-Max的发布,加上上午千问云的上线,阿里云在5月20日这一天完成了从”模型层”到”基础设施层”的双层布局。

国产模型第一的成绩单,说明阿里在基础模型能力上已经不输国际顶尖水平。而35小时自主进化、1000+工具调用、内核自我迭代的 demo,则展示了阿里在”智能体”这个下一代AI形态上的技术储备。

更值得玩味的是时间线——同一天发布模型和平台,明显是刻意为之。阿里想传递的信号很清晰:我们既有最强的国产模型,也有最Agent友好的模型服务平台,开发者来这就够了。

对行业来说,这意味着国产大模型的竞争已经从”单点模型能力”升级到”模型+平台+生态”的全栈较量。阿里先出了一手,其他玩家怎么接,值得关注。

本文地址:https://www.163264.com/12005

(0)
上一篇 17小时前
下一篇 10小时前

相关推荐