核心看点
• 小米开源Xiaomi-Robotics-0真机后训练全流程,仅用20小时数据即学会高难度操作
• 机器人实现亚毫米级空间感知精度,可连续丝滑完成多个耳机收纳
• 模型权重、代码全部开源,下载量曾登HuggingFace全球VLA模型榜第六
小米今天放了个大招:正式开源Xiaomi-Robotics-0的真机后训练(Post-training)全流程,让机器人自己学会了「把耳机装进耳机盒」这种看起来简单、实际上极其精细的操作。
这项能力的难度远超你的想象。耳机和收纳槽位之间的公差极小,机器人必须具备亚毫米级的空间感知精度才能完成精准对位。更麻烦的是,耳机和盒体表面极度光滑(粗糙度最低到Ra0.03μm),触碰到后极易发生位移——就像你试图在一个全镜面盒子里放东西一样。
小米团队仅用20小时的任务数据做真机后训练,就让模型掌握了这一高难度技能,并且可以连续、流畅地完成多个耳机的收纳。
Xiaomi-Robotics-0是小米在今年2月发布并开源的VLA(视觉-语言-动作)大模型。发布首月就在HuggingFace全球VLA模型下载榜上拿了第六名,已经证明了社区的关注度。
这次开源的后训练全流程,意味着开发者拿到这个开源项目后,不再只是一个「看」的模型,而是可以真正「用起来」——直接在自己的机器人上进行训练和部署,真正做到了”开箱即用”的生产力工具。
项目相关链接:
🔗 技术官网:robotics.xiaomi.com
🔗 技术报告:arxiv.org/abs/2602.12684
🔗 GitHub开源代码:github.com/XiaomiRobotics/Xiaomi-Robotics-0
🔗 模型权重:huggingface.co/XiaomiRobotics
本文地址:https://www.163264.com/11198

