智元发布具身基座大模型GO-2:让机器人真正”知行合一”

核心看点

  • 🤖 GO-2引入”动作思维链”机制,让机器人”想清楚再做”
  • ⚡ 首创异步双系统架构,高频执行匹配低层规划
  • 🏆 在多个机器人基准测试中刷新SOTA成绩

4月9日,智元机器人正式发布新一代具身基座大模型Genie Operator-2(简称GO-2)。该模型旨在解决机器人从”理解意图”到”稳定执行”之间的断层,在统一架构中打通逻辑推理与精准动作执行的链路。

核心突破:弥合”语义-运动鸿沟”

长期以来,机器人系统被困在一种深层割裂中:高层语义推理足够聪明,底层运动能力也已日趋成熟,但一旦进入真实场景、面向复杂任务时,从”理解意图”到”稳定完成”之间依然隔着一道看不见的门槛。

GO-2首次在统一架构中打通从逻辑推理到精准动作执行的”最后一公里”,让机器人从”边看边做”转变为“想清楚再做”

动作思维链:在动作空间推理规划

GO-2引入了动作思维链(Action Chain-of-Thought)机制。与传统方法不同,模型不会立即输出控制信号,而是先生成一段高层动作序列,作为任务的整体规划。这一设计使复杂任务被自然拆解为有序的动作步骤。这一成果已被CVPR 2026接收。

异步双系统:规划与执行的高效协同

GO-2还引入了异步双系统架构:慢系统以较低频率运行生成高层动作序列,快系统以更高频率运行并结合视觉观测生成控制信号。这种”低频规划+高频执行”的组合,使机器人既能保持整体行为的一致性,又能够灵活应对局部变化。这一成果已被ACL 2026接收。

性能表现:刷新行业SOTA

GO-2在多个主流具身智能基准测试中取得全面SOTA:LIBERO Benchmark四类任务平均成功率达98.5%,LIBERO-Plus零样本测试取得86.6%,Genie Sim 3.0真实环境测试取得82.9%,显著优于π0.5(77.5%)。

具身智能的终极追求,是知行合一。GO-2的出现,标志着具身智能从”理解世界”迈向”稳定作用于世界”的关键一步。

本文地址:https://www.163264.com/10834

(0)
上一篇 4小时前
下一篇 4小时前

相关推荐