阿里开源Qwen3.6-35B-A3B:30亿激活参数挑战编程大模型新高度

4月16日,阿里巴巴千问大模型团队正式开源Qwen3.6-35B-A3B,这是一款采用稀疏混合专家(MoE)架构的轻量级大模型。虽然总参数量达到350亿,但运行时仅需激活30亿参数,却在编程能力上实现了跨越式升级。

核心看点

  • 轻量架构重性能:30亿激活参数超越270亿参数的稠密模型,效率与性能实现双赢
  • 编程能力突破:在多项核心编程基准测试中表现优异,成为轻量级模型中的编程能手
  • 全模态能力:具备空间智能与视觉感知能力,可处理更复杂的多模态任务
  • 生态整合:已集成至Qwen Studio,通过阿里云百炼平台提供API服务
  • 思维链保留:支持思维链功能,让开发者能够追踪模型的推理过程

Qwen3.6-35B-A3B的开源标志着国产大模型在效率与性能平衡上的重要突破。传统的稠密模型需要加载全部参数才能运行,而MoE架构的稀疏激活机制让模型在保持大参数量的同时,推理成本大幅降低。

对于开发者而言,这意味着可以在消费级硬件上运行更高性能的模型。特别是在AI编程助手这一应用场景中,Qwen3.6-35B-A3B的低资源消耗与强编程能力组合,有望推动AI辅助编程的进一步普及。

阿里云百炼平台的API服务接入,也让企业和开发者能够快速集成这一模型能力,无需自建复杂的模型部署环境。

本文地址:https://www.163264.com/10967

(0)
上一篇 2小时前
下一篇 2小时前

相关推荐