蚂蚁百灵开源Ring-2.6-1T:万亿参数思考模型,推理强度可调

核心看点

  • 蚂蚁集团百灵大模型正式开源万亿级旗舰思考模型
  • 引入可调节Reasoning Effort机制,支持high与xhigh两种推理强度
  • high模式适合Agent工作流,xhigh模式适合数学/科研等高难任务
  • 已上架Hugging Face和ModelScope

详细解析

5月16日,蚂蚁集团旗下百灵大模型宣布开源Ring-2.6-1T——一款面向真实复杂任务场景打造的万亿级旗舰思考模型。

可调节推理深度。Ring-2.6-1T的最大亮点是Reasoning Effort机制,开发者可以根据任务复杂度在high和xhigh之间灵活切换:

high模式:面向高频Agent工作流,Token开销更低、多步执行更快,适合多轮交互、工具协作、任务拆解等生产级场景。简单说,就是”快思考”——用最小成本完成常规任务。

xhigh模式:面向数学、科研、复杂逻辑分析与多路径探索等高难任务,为复杂推理提供更充分的思考空间。简单说,就是”深思考”——不惜成本攻克难题。

这种设计思路很务实:不是让模型每次都”全力以赴”烧光算力,而是让开发者自己决定”值不值得”。

开源地址:

  • Hugging Face: inclusionAI/Ring-2.6-1T
  • ModelScope: inclusionAI/Ring-2.6-1T

简评

国内大模型开源战场越来越热闹。阿里通义千问、百度文心、现在蚂蚁百灵也加入战局。Ring-2.6-1T的可调节推理机制是一个聪明的差异化设计——它承认了现实:不是所有任务都需要”深度思考”,生产环境需要的是”恰到好处”的性价比。万亿参数+可调推理,这个组合拳如果能跑出好的评测成绩,有望在开源社区掀起一波采用潮。蚂蚁的金融和支付场景数据,可能是这个模型最独特的训练燃料。

本文地址:https://www.163264.com/11824

(0)
上一篇 3小时前
下一篇 3小时前