视觉 SLAM
Visual SLAM (Simultaneous Localization and Mapping),机器人 / AGV 用相机同时实现自身定位 + 构建环境地图的技术。
定义
视觉 SLAM 是 SLAM (同步定位与地图构建) 的视觉实现方式,与激光 SLAM 并列两大主流方案。机器人移动过程中通过相机连续拍摄环境图像,匹配特征点跟踪相机位姿,同时累积建图。
技术细节
经典框架:
- 前端:特征提取(ORB、SIFT、深度学习特征)+ 帧间匹配
- 后端:图优化(Bundle Adjustment、g2o)
- 回环检测:识别曾访问位置,校正累计误差
- 建图:稀疏点云 / 半稠密 / 稠密 / 语义地图
主流开源框架:ORB-SLAM3、VINS-Fusion、OpenVSLAM、Kimera
传感器配置
- 单目 SLAM:成本低,但尺度不定
- 双目 SLAM:能恢复绝对尺度
- RGB-D SLAM:相机 + 深度(结构光 / TOF),最适合室内
- 视觉惯性 SLAM(VINS):相机 + IMU,鲁棒性最好
主要玩家
在 AI 产业链中的角色
视觉 SLAM 在 5-12-AI制造-工业视觉 子行业中是 AGV 智能仓储、码垛机器人等下游场景的关键技术,也与 5-02-具身智能-人形机器人 高度共享技术栈。
∈ belongs_to::5-12-AI制造-工业视觉