moe
-
阿里开源Qwen3.6-35B-A3B:30亿激活参数挑战编程大模型新高度
4月16日,阿里巴巴千问大模型团队正式开源了Qwen3.6-35B-A3B,这是一款采用稀疏混合专家(MoE)架构的轻量级大模型。虽然总参数量达到350亿,但运行时仅需激活30亿参数,却在编程能力上实现了跨越式升级。 核心看点 轻量架构重性能:30亿激活参数超越270亿参数的稠密模型,效率与性能实现双赢 编程能力突破:在多项核心编程基准测试中表现优异,成为轻量级模型中的编程能手…
-
阿里开源Qwen3.6-35B-A3B:30亿激活参数实现编程能力跨越式升级
阿里巴巴千问大模型团队于2026年4月16日开源了稀疏混合专家(MoE)模型Qwen3.6-35B-A3B,标志着轻量级模型在智能体编程领域的关键突破。该模型总参数量为350亿,但运行时的激活参数仅为30亿。 核心看点 高效参数利用:总参数350亿,激活参数仅30亿,在性能上超越了270亿参数的稠密模型 编程能力突出:在多项核心编程基准测试中表现优异,展现出与大体量模型比肩的能…
-
阿里黑科技炸场!0.6B 小模型”魔改”成 17B MoE,激活参数仅 5%,CPU 直接跑 30token/s
阿里国际数字商业团队推出重磅研究成果——Marco-Mini-Instruct模型,通过一项名为Upcycling的技术,将仅有0.6B参数的小模型”魔改”成拥有17B参数总量的MoE(混合专家)架构,而实际激活参数仅0.86B,推理效率极高,甚至可以在普通CPU上跑到30token/s,极大降低了本地部署门槛。 【AiBase提要】 🧠 通过Upcyc…
