亚毫米级精度！小米开源VLA机器人大模型后训练全流程，机器人自己学会收纳耳机

2026年4月27日上午9:01 • 应用 • 阅读 453

核心看点

• 小米开源Xiaomi-Robotics-0真机后训练全流程，仅用20小时数据即学会高难度操作
• 机器人实现亚毫米级空间感知精度，可连续丝滑完成多个耳机收纳
• 模型权重、代码全部开源，下载量曾登HuggingFace全球VLA模型榜第六

小米今天放了个大招：正式开源Xiaomi-Robotics-0的真机后训练（Post-training）全流程，让机器人自己学会了「把耳机装进耳机盒」这种看起来简单、实际上极其精细的操作。

这项能力的难度远超你的想象。耳机和收纳槽位之间的公差极小，机器人必须具备亚毫米级的空间感知精度才能完成精准对位。更麻烦的是，耳机和盒体表面极度光滑（粗糙度最低到Ra0.03μm），触碰到后极易发生位移——就像你试图在一个全镜面盒子里放东西一样。

小米团队仅用20小时的任务数据做真机后训练，就让模型掌握了这一高难度技能，并且可以连续、流畅地完成多个耳机的收纳。

Xiaomi-Robotics-0是小米在今年2月发布并开源的VLA（视觉-语言-动作）大模型。发布首月就在HuggingFace全球VLA模型下载榜上拿了第六名，已经证明了社区的关注度。

这次开源的后训练全流程，意味着开发者拿到这个开源项目后，不再只是一个「看」的模型，而是可以真正「用起来」——直接在自己的机器人上进行训练和部署，真正做到了”开箱即用”的生产力工具。

项目相关链接：
🔗 技术官网：robotics.xiaomi.com
🔗 技术报告：arxiv.org/abs/2602.12684
🔗 GitHub开源代码：github.com/XiaomiRobotics/Xiaomi-Robotics-0
🔗 模型权重：huggingface.co/XiaomiRobotics

本文地址：https://www.163264.com/11198

亚毫米级精度！小米开源VLA机器人大模型后训练全流程，机器人自己学会收纳耳机

相关推荐