核心看点
4月9日,智元机器人正式发布新一代具身基座大模型Genie Operator-2(简称GO-2)。该模型旨在解决机器人从”理解意图”到”稳定执行”之间的断层,在统一架构中打通逻辑推理与精准动作执行的链路。
核心突破:弥合”语义-运动鸿沟”
长期以来,机器人系统被困在一种深层割裂中:高层语义推理足够聪明,底层运动能力也已日趋成熟,但一旦进入真实场景、面向复杂任务时,从”理解意图”到”稳定完成”之间依然隔着一道看不见的门槛。
GO-2首次在统一架构中打通从逻辑推理到精准动作执行的”最后一公里”,让机器人从”边看边做”转变为“想清楚再做”。
动作思维链:在动作空间推理规划
GO-2引入了动作思维链(Action Chain-of-Thought)机制。与传统方法不同,模型不会立即输出控制信号,而是先生成一段高层动作序列,作为任务的整体规划。这一设计使复杂任务被自然拆解为有序的动作步骤。这一成果已被CVPR 2026接收。
异步双系统:规划与执行的高效协同
GO-2还引入了异步双系统架构:慢系统以较低频率运行生成高层动作序列,快系统以更高频率运行并结合视觉观测生成控制信号。这种”低频规划+高频执行”的组合,使机器人既能保持整体行为的一致性,又能够灵活应对局部变化。这一成果已被ACL 2026接收。
性能表现:刷新行业SOTA
GO-2在多个主流具身智能基准测试中取得全面SOTA:LIBERO Benchmark四类任务平均成功率达98.5%,LIBERO-Plus零样本测试取得86.6%,Genie Sim 3.0真实环境测试取得82.9%,显著优于π0.5(77.5%)。
具身智能的终极追求,是知行合一。GO-2的出现,标志着具身智能从”理解世界”迈向”稳定作用于世界”的关键一步。
本文地址:https://www.163264.com/10834