来源:3D视觉工坊
添加v:dddvision,备注:SLAM,拉你入群。文末附行业细分群
论文题目:Comparative Evaluation of RGB-D SLAM Methods for Humanoid Robot Localization and Mapping
作者:Amirhosein Vedadi, Aghil Yousefi-Koma等
作者机构:Center of Advanced Systems and Technologies (CAST) School of Mechanical Engineering University of Tehran
论文链接:https://arxiv.org/pdf/2401.02816.pdf
本研究通过对比评估了三种RGB-D SLAM算法在SURENA-V人形机器人的定位和地图构建任务中的性能。在定位精度方面,ORB-SLAM3表现最佳,其ATE为0.1073,次之为RTAB-Map(0.1641)和OpenVSLAM(0.1847)。然而,ORB-SLAM3和OpenVSLAM在机器人遇到具有有限特征点的墙壁时存在准确里程计的挑战。OpenVSLAM表现出在机器人接近初始位置时检测循环闭合并成功重新定位的能力。地图制作方面,RTAB-Map通过提供多样化的地图输出(密集地图、OctoMap和占据格地图)领先于ORB-SLAM3和OpenVSLAM,它们仅提供稀疏地图。
读者理解:
在这篇论文中,对三种RGB-D SLAM算法进行了全面而深入的研究,主要关注了它们在定位、循环闭合检测和地图生成方面的性能。
ORB-SLAM3的定位性能:论文指出,在机器人运动中,ORB-SLAM3在绝对轨迹误差(ATE)方面表现最佳。这显示了该算法在处理机器人自身运动以及在环境中的定位方面具有卓越的准确性。这对于需要高精度定位的应用非常重要,比如需要避障或与其他智能系统进行合作的情境。
RTAB-Map的稳定性和多样性:RTAB-Map在循环闭合检测和地图生成方面表现出色。论文中提到,RTAB-Map能够在机器人遇到挑战时保持稳定,如当机器人遇到墙壁时特征点急剧减少。此外,RTAB-Map生成了多种类型的地图,包括密集地图、OctoMap和占据格地图,显示了其在不同应用场景中的灵活性。
OpenVSLAM的灵活性和重新定位能力:OpenVSLAM被描述为一种模块化且灵活的开源库,能够处理多种摄像机模型。论文指出,OpenVSLAM在一些情况下通过循环闭合检测能够重新定位自己。这表明该算法对于环境变化或机器人在运动中发生变化的场景具有一定的适应性。
总体而言,这篇论文为我们提供了对三种RGB-D SLAM算法在特定应用场景中性能的深入了解。选择合适的算法应该取决于具体的应用需求,例如对定位准确性的要求、对稳定性的需求以及是否需要生成多样化的地图。此外,对于实际应用,可能需要根据具体情况进行调整和优化,以满足特定任务的要求。
1 引言
本文通过对各种RGB-D SLAM方法的严格评估,考察了其在人形机器人行走场景中的准确性、效率、稳健性、可扩展性等方面。分析了RTAB-Map、ORB-SLAM3和OpenVSLAM等突出技术,提供了它们底层原理和算法框架的全面概述。实验设置的讨论确保了比较分析的可靠性和可重复性。研究发现,不同算法在定位和地图构建任务中表现各异,具有各自的优势和局限性。
2 方法
本文主要介绍了三种RGB-D SLAM(Simultaneous Localization and Mapping)算法,分别为RTAB-Map、ORB-SLAM3和OpenVSLAM,以用于SURENA-V人形机器人的定位和地图构建。研究通过对机器人执行完整圆形轨迹的测试,使用Intel RealSense D435 RGB-D摄像头来评估这三种算法的性能。
RTAB-Map方法:
基本原理:RTAB-Map是一种基于图的SLAM算法,具有与ROS兼容的优势,支持多种输入传感器,包括RGB-D和立体摄像头,激光雷达等。
关键特点:可以整合外部里程计信息,采用Good Features to Track (GFTT)算法进行特征跟踪,使用Binary Robust Independent Elementary Features (BRIEF)描述符描述和匹配特征。
循环闭合检测:使用词袋法进行循环闭合检测,通过对比当前帧的特征与地图中的视觉单词进行匹配,识别潜在的循环闭合。
图优化:应用g2o图优化来最小化地图和里程计之间的误差,提高地图的准确性和一致性。
地图生成:具有生成不同类型地图的能力,包括密集地图、占据格地图和稀疏地图。
ORB-SLAM3方法:
基本原理:ORB-SLAM3是一种开源软件库,用于各种SLAM任务,支持单目、立体和RGB-D相机,是首个能执行视觉惯性SLAM的系统。
关键特点:包含“Atlas”多地图表示,通过三个主要线程运行,分别负责跟踪、局部制图和循环检测与地图合并。
多地图表示:包括主动地图用于定位和非主动地图用于重定位、循环闭合和地图合并等。
实时定位和地图更新:使用最大后验估计方法实现实时定位,实时更新地图,处理循环闭合和地图融合。
可扩展性:具有较强的可扩展性,支持不同类型和模型的相机。
OpenVSLAM方法:
基本原理:OpenVSLAM是一个模块化、多功能的开源库,用于视觉SLAM和视觉里程计任务,支持各种摄像机模型。
关键特点:能够处理透视、鱼眼和等距等多种摄像机模型,兼容单目、立体和RGB-D相机设置。
软件架构:分为跟踪、地图制作和全局优化三个模块,利用g2o实现姿态图优化。
能力比较:与ORB-SLAM相比,具有更好的ORB提取实现,较短的跟踪时间,支持存储和加载地图等功能。
本文通过对这三种RGB-D SLAM算法在SURENA-V人形机器人上的比较评估,从定位准确性、效率、稳健性、可扩展性和在人形行走场景中的适用性等方面进行了详细介绍。这些算法在处理人形机器人的复杂运动和环境感知方面都展现出各自的优势和特点。
3 总结
本文对三种RGB-D SLAM算法进行了全面的评估,着重考察了它们在定位精度、循环闭合检测和地图生成能力方面的表现。其中,ORB-SLAM3在定位准确性方面表现最佳,具有较小的绝对轨迹误差。RTAB-Map在循环闭合检测和地图生成方面表现卓越,能够成功跟踪机器人位置,并在面对挑战时保持稳定。OpenVSLAM在一些情况下能够通过循环闭合检测重新定位自己,但在其他方面略逊于其他两种方法。总体而言,不同算法在不同方面有各自的优势,选择应根据具体应用场景和需求。
下载
在公众号「3D视觉工坊」后台,回复「 3dcv」,即可获取工业3D视觉、SLAM、自动驾驶、三维重建、事件相机、无人机等近千余篇最新顶会论文;巴塞罗那自治大学和慕尼黑工业大学3D视觉和视觉导航精品课件;相机标定、结构光、三维重建、SLAM,深度估计、模型部署、3D目标检测等学习资料。
3D视觉方向交流群成立啦
目前工坊已经建立了3D视觉方向多个社群,包括SLAM、工业3D视觉、自动驾驶、三维重建、无人机方向,细分群包括:
[工业3D视觉]相机标定、立体匹配、三维点云、结构光、机械臂抓取、缺陷检测、6D位姿估计、相位偏折术、Halcon、摄影测量、阵列相机、光度立体视觉等。
[SLAM]视觉SLAM、激光SLAM、语义SLAM、滤波算法、多传感器融合、多传感器标定、动态SLAM、MOT SLAM、NeRF SLAM、机器人导航等。
[自动驾驶]深度估计、Transformer、毫米波|激光雷达|视觉摄像头传感器、多传感器标定、多传感器融合、自动驾驶综合群等、3D目标检测、路径规划、轨迹预测、3D点云分割、模型部署、车道线检测、Occupancy、目标跟踪等。
[三维重建]NeRF、多视图几何、OpenMVS、MVSNet、colmap、纹理贴图等
[无人机]四旋翼建模、无人机飞控等
除了这些,还有求职、硬件选型、视觉产品落地、最新论文、3D视觉最新产品、3D视觉行业新闻等交流群
大家可以添加小助理v:dddvisiona,备注:加群+方向+学校|公司, 小助理会拉你入群。