百度360必应搜狗淘宝本站头条
当前位置:网站首页 > 编程字典 > 正文

人形机器人的RGB-D SLAM哪个才是最佳智能之选

toyiye 2024-06-21 12:01 21 浏览 0 评论

来源:3D视觉工坊

添加v:dddvision,备注:SLAM,拉你入群。文末附行业细分群


论文题目:Comparative Evaluation of RGB-D SLAM Methods for Humanoid Robot Localization and Mapping

作者:Amirhosein Vedadi, Aghil Yousefi-Koma等

作者机构:Center of Advanced Systems and Technologies (CAST) School of Mechanical Engineering University of Tehran

论文链接:https://arxiv.org/pdf/2401.02816.pdf

本研究通过对比评估了三种RGB-D SLAM算法在SURENA-V人形机器人的定位和地图构建任务中的性能。在定位精度方面,ORB-SLAM3表现最佳,其ATE为0.1073,次之为RTAB-Map(0.1641)和OpenVSLAM(0.1847)。然而,ORB-SLAM3和OpenVSLAM在机器人遇到具有有限特征点的墙壁时存在准确里程计的挑战。OpenVSLAM表现出在机器人接近初始位置时检测循环闭合并成功重新定位的能力。地图制作方面,RTAB-Map通过提供多样化的地图输出(密集地图、OctoMap和占据格地图)领先于ORB-SLAM3和OpenVSLAM,它们仅提供稀疏地图。

读者理解:

在这篇论文中,对三种RGB-D SLAM算法进行了全面而深入的研究,主要关注了它们在定位、循环闭合检测和地图生成方面的性能。

  • ORB-SLAM3的定位性能:论文指出,在机器人运动中,ORB-SLAM3在绝对轨迹误差(ATE)方面表现最佳。这显示了该算法在处理机器人自身运动以及在环境中的定位方面具有卓越的准确性。这对于需要高精度定位的应用非常重要,比如需要避障或与其他智能系统进行合作的情境。

  • RTAB-Map的稳定性和多样性:RTAB-Map在循环闭合检测和地图生成方面表现出色。论文中提到,RTAB-Map能够在机器人遇到挑战时保持稳定,如当机器人遇到墙壁时特征点急剧减少。此外,RTAB-Map生成了多种类型的地图,包括密集地图、OctoMap和占据格地图,显示了其在不同应用场景中的灵活性。

  • OpenVSLAM的灵活性和重新定位能力:OpenVSLAM被描述为一种模块化且灵活的开源库,能够处理多种摄像机模型。论文指出,OpenVSLAM在一些情况下通过循环闭合检测能够重新定位自己。这表明该算法对于环境变化或机器人在运动中发生变化的场景具有一定的适应性。

总体而言,这篇论文为我们提供了对三种RGB-D SLAM算法在特定应用场景中性能的深入了解。选择合适的算法应该取决于具体的应用需求,例如对定位准确性的要求、对稳定性的需求以及是否需要生成多样化的地图。此外,对于实际应用,可能需要根据具体情况进行调整和优化,以满足特定任务的要求。

1 引言

本文通过对各种RGB-D SLAM方法的严格评估,考察了其在人形机器人行走场景中的准确性、效率、稳健性、可扩展性等方面。分析了RTAB-Map、ORB-SLAM3和OpenVSLAM等突出技术,提供了它们底层原理和算法框架的全面概述。实验设置的讨论确保了比较分析的可靠性和可重复性。研究发现,不同算法在定位和地图构建任务中表现各异,具有各自的优势和局限性。

2 方法

本文主要介绍了三种RGB-D SLAM(Simultaneous Localization and Mapping)算法,分别为RTAB-Map、ORB-SLAM3和OpenVSLAM,以用于SURENA-V人形机器人的定位和地图构建。研究通过对机器人执行完整圆形轨迹的测试,使用Intel RealSense D435 RGB-D摄像头来评估这三种算法的性能。

RTAB-Map方法:

  • 基本原理:RTAB-Map是一种基于图的SLAM算法,具有与ROS兼容的优势,支持多种输入传感器,包括RGB-D和立体摄像头,激光雷达等。

  • 关键特点:可以整合外部里程计信息,采用Good Features to Track (GFTT)算法进行特征跟踪,使用Binary Robust Independent Elementary Features (BRIEF)描述符描述和匹配特征。

  • 循环闭合检测:使用词袋法进行循环闭合检测,通过对比当前帧的特征与地图中的视觉单词进行匹配,识别潜在的循环闭合。

  • 图优化:应用g2o图优化来最小化地图和里程计之间的误差,提高地图的准确性和一致性。

  • 地图生成:具有生成不同类型地图的能力,包括密集地图、占据格地图和稀疏地图。

ORB-SLAM3方法:

  • 基本原理:ORB-SLAM3是一种开源软件库,用于各种SLAM任务,支持单目、立体和RGB-D相机,是首个能执行视觉惯性SLAM的系统。

  • 关键特点:包含“Atlas”多地图表示,通过三个主要线程运行,分别负责跟踪、局部制图和循环检测与地图合并。

  • 多地图表示:包括主动地图用于定位和非主动地图用于重定位、循环闭合和地图合并等。

  • 实时定位和地图更新:使用最大后验估计方法实现实时定位,实时更新地图,处理循环闭合和地图融合。

  • 可扩展性:具有较强的可扩展性,支持不同类型和模型的相机。

OpenVSLAM方法:

  • 基本原理:OpenVSLAM是一个模块化、多功能的开源库,用于视觉SLAM和视觉里程计任务,支持各种摄像机模型。

  • 关键特点:能够处理透视、鱼眼和等距等多种摄像机模型,兼容单目、立体和RGB-D相机设置。

  • 软件架构:分为跟踪、地图制作和全局优化三个模块,利用g2o实现姿态图优化。

  • 能力比较:与ORB-SLAM相比,具有更好的ORB提取实现,较短的跟踪时间,支持存储和加载地图等功能。

本文通过对这三种RGB-D SLAM算法在SURENA-V人形机器人上的比较评估,从定位准确性、效率、稳健性、可扩展性和在人形行走场景中的适用性等方面进行了详细介绍。这些算法在处理人形机器人的复杂运动和环境感知方面都展现出各自的优势和特点。

3 总结

本文对三种RGB-D SLAM算法进行了全面的评估,着重考察了它们在定位精度、循环闭合检测和地图生成能力方面的表现。其中,ORB-SLAM3在定位准确性方面表现最佳,具有较小的绝对轨迹误差。RTAB-Map在循环闭合检测和地图生成方面表现卓越,能够成功跟踪机器人位置,并在面对挑战时保持稳定。OpenVSLAM在一些情况下能够通过循环闭合检测重新定位自己,但在其他方面略逊于其他两种方法。总体而言,不同算法在不同方面有各自的优势,选择应根据具体应用场景和需求。

下载

在公众号「3D视觉工坊」后台,回复「 3dcv」,即可获取工业3D视觉、SLAM、自动驾驶、三维重建、事件相机、无人机等近千余篇最新顶会论文;巴塞罗那自治大学和慕尼黑工业大学3D视觉和视觉导航精品课件;相机标定、结构光、三维重建、SLAM,深度估计、模型部署、3D目标检测等学习资料。

3D视觉方向交流群成立啦

目前工坊已经建立了3D视觉方向多个社群,包括SLAM、工业3D视觉、自动驾驶、三维重建、无人机方向,细分群包括:

[工业3D视觉]相机标定、立体匹配、三维点云、结构光、机械臂抓取、缺陷检测、6D位姿估计、相位偏折术、Halcon、摄影测量、阵列相机、光度立体视觉等。

[SLAM]视觉SLAM、激光SLAM、语义SLAM、滤波算法、多传感器融合、多传感器标定、动态SLAM、MOT SLAM、NeRF SLAM、机器人导航等。

[自动驾驶]深度估计、Transformer、毫米波|激光雷达|视觉摄像头传感器、多传感器标定、多传感器融合、自动驾驶综合群等、3D目标检测、路径规划、轨迹预测、3D点云分割、模型部署、车道线检测、Occupancy、目标跟踪等。

[三维重建]NeRF、多视图几何、OpenMVS、MVSNet、colmap、纹理贴图等

[无人机]四旋翼建模、无人机飞控等

除了这些,还有求职、硬件选型、视觉产品落地、最新论文、3D视觉最新产品、3D视觉行业新闻等交流群

大家可以添加小助理v:dddvisiona,备注:加群+方向+学校|公司, 小助理会拉你入群。

相关推荐

为何越来越多的编程语言使用JSON(为什么编程)

JSON是JavascriptObjectNotation的缩写,意思是Javascript对象表示法,是一种易于人类阅读和对编程友好的文本数据传递方法,是JavaScript语言规范定义的一个子...

何时在数据库中使用 JSON(数据库用json格式存储)

在本文中,您将了解何时应考虑将JSON数据类型添加到表中以及何时应避免使用它们。每天?分享?最新?软件?开发?,Devops,敏捷?,测试?以及?项目?管理?最新?,最热门?的?文章?,每天?花?...

MySQL 从零开始:05 数据类型(mysql数据类型有哪些,并举例)

前面的讲解中已经接触到了表的创建,表的创建是对字段的声明,比如:上述语句声明了字段的名称、类型、所占空间、默认值和是否可以为空等信息。其中的int、varchar、char和decimal都...

JSON对象花样进阶(json格式对象)

一、引言在现代Web开发中,JSON(JavaScriptObjectNotation)已经成为数据交换的标准格式。无论是从前端向后端发送数据,还是从后端接收数据,JSON都是不可或缺的一部分。...

深入理解 JSON 和 Form-data(json和formdata提交区别)

在讨论现代网络开发与API设计的语境下,理解客户端和服务器间如何有效且可靠地交换数据变得尤为关键。这里,特别值得关注的是两种主流数据格式:...

JSON 语法(json 语法 priority)

JSON语法是JavaScript语法的子集。JSON语法规则JSON语法是JavaScript对象表示法语法的子集。数据在名称/值对中数据由逗号分隔花括号保存对象方括号保存数组JS...

JSON语法详解(json的语法规则)

JSON语法规则JSON语法是JavaScript对象表示法语法的子集。数据在名称/值对中数据由逗号分隔大括号保存对象中括号保存数组注意:json的key是字符串,且必须是双引号,不能是单引号...

MySQL JSON数据类型操作(mysql的json)

概述mysql自5.7.8版本开始,就支持了json结构的数据存储和查询,这表明了mysql也在不断的学习和增加nosql数据库的有点。但mysql毕竟是关系型数据库,在处理json这种非结构化的数据...

JSON的数据模式(json数据格式示例)

像XML模式一样,JSON数据格式也有Schema,这是一个基于JSON格式的规范。JSON模式也以JSON格式编写。它用于验证JSON数据。JSON模式示例以下代码显示了基本的JSON模式。{"...

前端学习——JSON格式详解(后端json格式)

JSON(JavaScriptObjectNotation)是一种轻量级的数据交换格式。易于人阅读和编写。同时也易于机器解析和生成。它基于JavaScriptProgrammingLa...

什么是 JSON:详解 JSON 及其优势(什么叫json)

现在程序员还有谁不知道JSON吗?无论对于前端还是后端,JSON都是一种常见的数据格式。那么JSON到底是什么呢?JSON的定义...

PostgreSQL JSON 类型:处理结构化数据

PostgreSQL提供JSON类型,以存储结构化数据。JSON是一种开放的数据格式,可用于存储各种类型的值。什么是JSON类型?JSON类型表示JSON(JavaScriptO...

JavaScript:JSON、三种包装类(javascript 包)

JOSN:我们希望可以将一个对象在不同的语言中进行传递,以达到通信的目的,最佳方式就是将一个对象转换为字符串的形式JSON(JavaScriptObjectNotation)-JS的对象表示法...

Python数据分析 只要1分钟 教你玩转JSON 全程干货

Json简介:Json,全名JavaScriptObjectNotation,JSON(JavaScriptObjectNotation(记号、标记))是一种轻量级的数据交换格式。它基于J...

比较一下JSON与XML两种数据格式?(json和xml哪个好)

JSON(JavaScriptObjectNotation)和XML(eXtensibleMarkupLanguage)是在日常开发中比较常用的两种数据格式,它们主要的作用就是用来进行数据的传...

取消回复欢迎 发表评论:

请填写验证码