moe | 梭哈 AI

阿里开源Qwen3.6-35B-A3B：30亿激活参数挑战编程大模型新高度

4月16日，阿里巴巴千问大模型团队正式开源了Qwen3.6-35B-A3B，这是一款采用稀疏混合专家（MoE）架构的轻量级大模型。虽然总参数量达到350亿，但运行时仅需激活30亿参数，却在编程能力上实现了跨越式升级。核心看点轻量架构重性能：30亿激活参数超越270亿参数的稠密模型，效率与性能实现双赢编程能力突破：在多项核心编程基准测试中表现优异，成为轻量级模型中的编程能手…

模型框架 2026年4月19日

阿里开源Qwen3.6-35B-A3B：30亿激活参数实现编程能力跨越式升级

阿里巴巴千问大模型团队于2026年4月16日开源了稀疏混合专家（MoE）模型Qwen3.6-35B-A3B，标志着轻量级模型在智能体编程领域的关键突破。该模型总参数量为350亿，但运行时的激活参数仅为30亿。核心看点高效参数利用：总参数350亿，激活参数仅30亿，在性能上超越了270亿参数的稠密模型编程能力突出：在多项核心编程基准测试中表现优异，展现出与大体量模型比肩的能…

模型框架 2026年4月18日

阿里黑科技炸场！0.6B 小模型”魔改”成 17B MoE，激活参数仅 5%，CPU 直接跑 30token/s

阿里国际数字商业团队推出重磅研究成果——Marco-Mini-Instruct模型，通过一项名为Upcycling的技术，将仅有0.6B参数的小模型”魔改”成拥有17B参数总量的MoE（混合专家）架构，而实际激活参数仅0.86B，推理效率极高，甚至可以在普通CPU上跑到30token/s，极大降低了本地部署门槛。【AiBase提要】 🧠 通过Upcyc…

模型框架 2026年4月10日