智元发布具身基座大模型GO-2：让机器人真正”知行合一”

Table of Contents

核心看点

4月9日，智元机器人正式发布新一代具身基座大模型Genie Operator-2（简称GO-2）。该模型旨在解决机器人从”理解意图”到”稳定执行”之间的断层，在统一架构中打通逻辑推理与精准动作执行的链路。

长期以来，机器人系统被困在一种深层割裂中：高层语义推理足够聪明，底层运动能力也已日趋成熟，但一旦进入真实场景、面向复杂任务时，从”理解意图”到”稳定完成”之间依然隔着一道看不见的门槛。

GO-2首次在统一架构中打通从逻辑推理到精准动作执行的”最后一公里”，让机器人从”边看边做”转变为“想清楚再做”。

GO-2引入了动作思维链(Action Chain-of-Thought)机制。与传统方法不同，模型不会立即输出控制信号，而是先生成一段高层动作序列，作为任务的整体规划。这一设计使复杂任务被自然拆解为有序的动作步骤。这一成果已被CVPR 2026接收。

GO-2还引入了异步双系统架构：慢系统以较低频率运行生成高层动作序列，快系统以更高频率运行并结合视觉观测生成控制信号。这种”低频规划+高频执行”的组合，使机器人既能保持整体行为的一致性，又能够灵活应对局部变化。这一成果已被ACL 2026接收。

GO-2在多个主流具身智能基准测试中取得全面SOTA：LIBERO Benchmark四类任务平均成功率达98.5%，LIBERO-Plus零样本测试取得86.6%，Genie Sim 3.0真实环境测试取得82.9%，显著优于π0.5（77.5%）。

具身智能的终极追求，是知行合一。GO-2的出现，标志着具身智能从”理解世界”迈向”稳定作用于世界”的关键一步。

本文地址：https://www.163264.com/10834