蚂蚁灵波科技近日开源了流式三维重建模型 LingBot-Map,该模型仅需单个普通 RGB 摄像头即可在视频采集过程中实时估计相机位姿并重建场景三维结构,为机器人导航、自动驾驶及 AR 硬件等提供了高效、稳定且连续的在线建图能力。
核心特性
📱 单摄像头实时重建
LingBot-Map 支持单个普通 RGB 摄像头实时估计相机位姿并重建场景三维结构,无需昂贵的激光雷达或多摄像头阵列,大幅降低了高精度三维感知的硬件门槛。
🚀 流式处理架构
采用流式处理架构,实现边接收画面边输出定位与结构的实时交互。这种设计使得模型能够在视频采集的同时完成三维重建,无需等待完整视频采集完毕后再处理。
应用场景
LingBot-Map 的高效、稳定且连续的在线建图能力可广泛应用于:
- 机器人导航:为服务机器人、工业机器人提供实时环境感知
- 自动驾驶:辅助车辆实时构建周围环境的三维地图
- AR 硬件:为增强现实设备提供空间定位和环境理解能力
- 具身智能:加速具身智能设备的感知能力发展
开源地址
LingBot-Map 已开源,可在以下平台获取:
- Hugging Face:https://huggingface.co/robbyant/lingbot-map
- ModelScope:https://www.modelscope.cn/models/Robbyant/lingbot-map
技术意义
开源 LingBot-Map 降低了高精度三维感知的硬件门槛,使更多开发者和研究者能够以低成本实现实时三维重建。这对于加速具身智能设备的发展和普及具有重要意义。
来源:蚂蚁灵波科技 / AiBase
本文地址:https://www.163264.com/10934