英语原文共 16 页
SPM-SLAM:使用平方同时定位和映射平面标记
目录
摘要
SLAM通常使用关键点或纹理等自然界标来解决,但它会带来一些限制,例如需要足够的纹理环境和高计算要求。在某些情况下,优选通过使用人造地标来牺牲这些方法的灵活性以提高速度和稳健性。最近的工作[1]提出了一种在大型室内环境中获得平方平面标记图的离线方法。通过自由分配印在一张纸上的一组标记,该方法假设在每个图像中至少有两个标记可见,则从一组图像估计标记姿势。之后,可以以正确的比例完成相机定位。但是,离线过程有一些限制。首先,在整个过程结束之前不能检测到错误,例如,场景中的标记数量不足或者在捕获阶段没有正确地发现标记。其次,该方法不是增量的,因此,在需要扩展地图的情况下,有必要从头开始重复整个过程。最后,该方法不能用于具有有限计算资源的实时系统,例如移动机器人或UAVs。为了解决这些限制,这项工作提出了一个实时的解决方案,解决了同时定位摄像机和建立平面标记图的问题。本文提出了许多解决方案,解决了从平方平面标记求解SLAM时出现的问题,创造了术语SPM-SLAM。所进行的实验表明,与基于关键点或纹理的视觉SLAM方法相比,我们的方法可以更健壮,更精确和更快速。
关键词:基准标记,标记映射,SLAM
1介绍
同时定位和映射是创建环境地图和同时估计相机姿态的问题[2]。使用自然特征的稀疏[3]和密集[4]解决方案吸引了大部分研究工作,达到了高度的性能。 然而,它们在一些现实场景中有许多局限性。首先,它们需要一定量的纹理,这在一些室内环境中是不可用的(例如,实验室和走廊)。其次,采用词袋(BoW)[5]方法来解决重定位问题。但是,它们在视点变化和某些环境中常见的重复模式下性能有限。第三,当使用单个摄像机时,生成的地图是规模不可知的,因此不能直接用于导航任务。第四,众所周知,为了在使用单个相机时构建地图,需要平移运动。
在许多情况下,使用人工标记是使用非常少的计算资源以非常低的成本稳健地估计相机姿态并且解决上述问题的可接受的解决方案。 基于平方平面标记的方法非常流行[6-14]。这些标记由外部黑色边框和内部代码(通常是二进制代码)组成,以唯一标识它们。它们的主要优点是单个标记的角可用于相机姿态估计。 然而,一般方法是使用单个标记,或者至多使用它们的一小部分,其预先知道它们的相对姿势(例如,打印的纸片中的一组标记)。当然,这种系统的适用范围仅限于非常小的区域。很少有尝试基于平方标记创建大规模相机定位系统,任何人都可以打印并粘贴在所需的环境中。
图1:SPM-SLAM:使用平方标记构建经济高效且稳健的定位系统的方法。印刷的标记放置在环境的任意位置。然后,给定观察标记的视频序列,所提出的系统建立平方标记的平面图并同时定位摄像机。蓝色方块表示从所示视频序列的图像获得的标记图。右图显示了以蓝色显示的标记的三维表示,而绿色显示了用于优化的相机的选定位置。(对于这个图例中的颜色参考的解释,读者可以参考本文的网络版。)
处理平方平面标记时的主要困难是模糊问题[15-17]。虽然理论上应该可以从平面正方形的四个角准确地获得姿势,但实际上,由于角落定位中的噪声,会出现两种解决方案,在某些情况下,无法区分纠正一个。
在以前的工作[1]中,本文的作者提出了一个离线方法,以创建平方标记平面标记的地图处理歧义问题。只需要打印标记使用普通打印机,将它们放置在所需的环境中覆盖工作区域并拍照。然后,方法通过分析创建具有标记姿势的地图图像。该方法可以采用无限数量的高分辨率图像,以便实现非常高的精度,因为没有时间限制(这是一个离线过程)。然而,离线过程有一些局限性。首先,错误不可能检测到整个过程结束,例如,不足场景中的标记数量或未正确发现的标记在捕获阶段。其次,该方法不是增量的,因此,在在需要扩展地图的情况下,有必要从头开始重复整个过程。最后,该方法不适用于实时应用,例如移动机器人或具有UAV的无人机有限的计算资源,必须创建一个地图导航时的环境。
本文提出了一个能够动态完整的系统构建标记的地图并同时从视频序列中定位相机姿势。建议的方法仅使用来自平面标记的信息,能够处理模糊问题。在我们的测试中,所提出的方法能够运行使用笔记本电脑上的单个线程以超过150 Hz的频率。图1显示了在我们的实验室中创建的示例,其中的姿势标记和相机都是使用增量获得的用手持摄像机录制的视频序列图像。
本文提出了四个原始贡献,以构建所提出的系统。首先,据我们所知,这是第一个实时SPM-SLAM系统能够处理模糊问题并在大型室内环境中运行。第二,我们提出了一种从至少两个不同位置看到的一组模糊检测标记进行地图初始化的方法。第三,我们提出了一种估计标记姿势的方法模棱两可地观察他们。最后,我们提出了一种方法使用平方平面标记进行环闭合检测和校正。值得一提的是,所提出的方法可公开用于评估目的。
本文的其余部分安排如下。在第2节介绍相关工作之后,我们在第3节中给出了问题的概述以及解决问题所需的主要元素。第4节描述了所提出系统的每个模块的细节,并且在第5节中,对具有挑战性的场景进行了彻底的实验研究,以验证我们的方法。最后,第6节总结了这项工作的主要结论。
2相关工作
Visual SLAM旨在解决同步本地化问题仅使用视觉信息映射问题。在[18]中,
Klein和Murray介绍了他们的PTAM系统,其中两个并行运行的线程执行跟踪和映射。这项工作表明了将任务分成两部分的可能性不同的线程,实现实时性能。但是,他们的关键点描述符没有考虑检测大循环。Mur-Artal等人最近的工作[3]提出了一个基于关键帧的方法使用ORB关键点的SLAM方法[19]。他们的方法运作实时,并能够检测循环闭合并纠正因此构成。恩格尔等人[4]提出了一种称为LSD-SLAM的半密集单目视觉SLAM解决方案。在他们的方法,通过融合时空一致的边缘,以半密集的方式重建场景。但是,为了解决重定位和循环闭包问题,它们使用了关键点功能。尽管这些类型的系统取得了良好的效果,但它们仍然存在有几个缺点。跟踪通常会因快速运动而失败,视点的大变化或显着的外观变化。此外,获得的地图是规模不可知的,因此它们不可能直接用于机器人导航。最后,重定位经常失败在远离这些地图创建的环境中。
基于方形的基准标记[6-11]由外部标记组成黑色边框和内部代码(通常是二进制)唯一识别每个标记。这种标记的主要优点是可以使用其四个角来估计相机姿势某些情况。虽然理论上,相机的姿势可以从四个角落中进行唯一估算,在实践中,有旋转模糊度对应于未知的反射关于相机z轴的平面[15-17]。问题显示出来了在图2中,标记表示为立方体的一侧可以处于两种不同的方向(红色和蓝色),从而从两个不同的摄像机位置gamma;和gamma;中获得几乎相同的投影。[15-17]中提出的方法通过仔细分析预测找到了最佳解决方案。在大多数情况下,一种解决方案的重投影误差远低于另一种解决方案的重投影误差。然后,没有观察到模糊问题,正确的解决方案是具有最低错误的解决方案。然而,当在远大于相机焦距的距离处对小平面或平面进行成像时,在存在噪声的情况下,两种解决方案的重投影误差非常相似,因此无法确定正确的方法。在这些情况下,图像中标记物的观察尺寸变小,因此角落估计中的误差变得相对较大。然后,两种溶液的重投影误差变得相似,并且无法区分正确的重投影误差。
图2:姿态模糊问题:可以从两个不同的相机姿态gamma;和gamma;中获得相同的观察投影。(有关此图中对颜色的引用的解释,读者可参考本文的Web版本。)
也许是因为这个问题,很少有尝试如我们在本工作中提出的那样,它可以自动创建放置在任意位置的大型标记贴图。戴维森等人提出在[20]中一种单眼SLAM的方法,其中有一个平方标记用于初始化。虽然他们完全依赖用于跟踪的自然特征,它们表明使用单个平方初始化标记是获取地图的好选择实际规模。
Lim和Lee [21]提出了一种平面SLAM方法标记。 扩展卡尔曼滤波器(EKF)用于跟踪机器人在其中包含一些标记的环境中导航时摆出姿势。当找到标记时,考虑到它们将它们添加到地图中当前的机器人姿势以及标记的相对姿势和机器人。然而,他们的方法并未考虑模糊性或循环闭包问题。对于自主飞艇,在[22]中提出了类似的方法。
Klopschitz和Schmalstieg[23]的工作展示了一个系统估计室内环境中基准标记的3D位置。记录环境的视频序列,并使用(运动结构)SfM(具有自然关键点)估计摄像机位置。一旦准确获得相机位置,标记位置通过三角测量获得。 这种方法可行没有处理相机和标记本地化的双重问题共同。此外,它假定SfM方法的正确功能正如我们已经评论过的那样,并非总是可行的。
Shaya等人[24]建议在其中创建姿势图节点表示标记和边缘之间的相对姿势他们。地图是在在线过程中创建的,边缘是动态更新。每当看到一对标记时框架,它们的相对位置会更新,如果它更好上一个,取而代之。对于本地化,他们的方法选择,从那时的可见标记集,其路径原始节点是最小的。他们的方法有几个问题。首先,他们没有解释歧义问题。其次,他们只考虑一个可见的定位标记那些。但是,同时使用所有可见标记可能会导致以更好的本地化结果。最后,他们的实验结果并没有真正证明他们的提案在复杂中的有效性场景。
Neunert等人的工作[25]提出了一种基于人造地标的单目视觉EKF-SLAM系统。再说一次EKF用于从标记中进行SLAM融合信息和惯性测量单元。与以前的情况一样,标记他们的思想中没有考虑歧义和循环闭包问题工作。另外,我们的方法不需要使用惯性传感器解决问题。
最后,这项工作的作者在[1]中提出了一种离线方法,以获得大型室内环境中的标记图。在我们以前的工作中,我们处理歧义问题并提出一个强大的标记映射和定位解决方案。与这项工作的主要区别在于[1]认为所有视频帧一次全部可用,并全球范围内解决了问题。尽管如此,离线方法还是存在一些局限性。例如,序列的视频捕获中的错误,例如缺失标记,在进行后处理之前无法检测到。相比之下,这项工作提出了一个在线解决方案,其中的地图在捕获视频帧时逐步构建。
3: 系统总览
本文要解决的问题如下。考虑一个视频序列记录基准的环境标记已被放置。 目标是同时确定相机的姿势w.r.t。任意参考系统(全球参考系统)并创建标记及其标记的地图全球参考系统中的位置。在我们的问题中,仅使用来自基准标记的信息。
本节介绍系统的主要元素。首先,我们提供有助于
以上是毕业论文外文翻译,课题毕业论文、任务书、文献综述、开题报告、程序设计、图纸设计等资料可联系客服协助查找。