亚毫米级精度!小米开源VLA机器人大模型后训练全流程,机器人自己学会收纳耳机

小米开源Xiaomi-Robotics-0后训练全流程,机器人仅用20小时学会亚毫米级精准收纳耳机操作,模型权重及代码全部开源。

核心看点

小米开源Xiaomi-Robotics-0真机后训练全流程,仅用20小时数据即学会高难度操作
机器人实现亚毫米级空间感知精度,可连续丝滑完成多个耳机收纳
• 模型权重、代码全部开源,下载量曾登HuggingFace全球VLA模型榜第六

小米今天放了个大招:正式开源Xiaomi-Robotics-0的真机后训练(Post-training)全流程,让机器人自己学会了「把耳机装进耳机盒」这种看起来简单、实际上极其精细的操作。

这项能力的难度远超你的想象。耳机和收纳槽位之间的公差极小,机器人必须具备亚毫米级的空间感知精度才能完成精准对位。更麻烦的是,耳机和盒体表面极度光滑(粗糙度最低到Ra0.03μm),触碰到后极易发生位移——就像你试图在一个全镜面盒子里放东西一样。

小米团队仅用20小时的任务数据做真机后训练,就让模型掌握了这一高难度技能,并且可以连续、流畅地完成多个耳机的收纳。

Xiaomi-Robotics-0是小米在今年2月发布并开源的VLA(视觉-语言-动作)大模型。发布首月就在HuggingFace全球VLA模型下载榜上拿了第六名,已经证明了社区的关注度。

这次开源的后训练全流程,意味着开发者拿到这个开源项目后,不再只是一个「看」的模型,而是可以真正「用起来」——直接在自己的机器人上进行训练和部署,真正做到了”开箱即用”的生产力工具。

项目相关链接:
🔗 技术官网:robotics.xiaomi.com
🔗 技术报告:arxiv.org/abs/2602.12684
🔗 GitHub开源代码:github.com/XiaomiRobotics/Xiaomi-Robotics-0
🔗 模型权重:huggingface.co/XiaomiRobotics

本文地址:https://www.163264.com/11198

(0)
上一篇 16小时前
下一篇 9小时前

相关推荐