使用几何约束的直接反馈的轮式移动机器人的视觉导航
Heacute;ctor M. Becerra · Carlos Saguuml;eacute;s ·
Youcef Mezouar · Jean-Bernard Hayet
摘要:轮式移动机器人的许多应用要求解决自主移动性问题,即大位移导航。 解决这个问题的有效方法是从视觉记忆中提取视觉路径。 在本文中,我们提出了一种基于图像的控制方案,用于沿着视觉路径驱动轮式移动机器人。 我们的方法是基于由几何约束给出的信息的反馈:对极几何或三焦张量。 所提出的控制法则只需要通过几何约束从图像数据容易地计算出一个测量值。 所提出的方法具有两个主要优点:不需要显式姿态参数分解,并且旋转速度平滑或最终分段恒定,以避免在目标图像改变时通常出现在先前工作中的不连续性。 平移速度根据路径的要求进行调整,合成运动与该速度无关。 此外,我们的方法适用于具有近似中央投影的所有相机,包括常规,反射折射和一些鱼眼相机。 模拟和现实世界的实验说明了提案的有效性。
关键词:词视觉导航、视觉路径关注、视觉记忆、对极几何、三焦张量
1.介绍
提高轮式平台导航能力的策略引起了人们对机器人技术特别是服务机器人领域的极大兴趣。 视觉导航的一个好策略是基于使用所谓的视觉记忆。 这种方法包含两个阶段。 首先,存在一组学习阶段,其中存储一组图像以表示环境。 然后,选择这些图像的子集(关键图像)以定义自治阶段中要遵循的路径。 这种方法可以应用于结构化需求场所的自主个人交通,如机场候机楼,景点胜地或大学校园等。视觉记忆方法已在松本等人引入。 (1996)用于传统相机并且在Matsumoto等人中延伸 (1999)适用于全向摄像头。 后来,已经提出了一些依赖于视觉记忆方法的基于位置的方案,其使用基于EKF的SLAM进行三维(3D)重建(Goedeme等人 2007),或从运动算法到束调整的结构(Royer等人 2007)。 Courbon等人避免了一幅完整的地图建筑。 (2008, 2009)通过使用通用相机分别放松到单应性和基本矩阵分解的局部欧几里德重建。
一般而言,基于图像的视觉路径方案在闭环频率更高的情况下具有良好的性能。 在中工作陈和Birchfield(2009)提出了一个基于一些启发式规则的视觉导航方案。 基于雅可比行列式的方法,它使用的是质心呈现特征点的横坐标Diosi等人 (2011)。 当必须达到新的关键图像时,上述方法中的大多数都会产生产生不连续旋转速度的问题。 这个问题已经解决了凯鲁比尼和Chaumette(2009)对于传统的相机,其中作者提出使用与时间无关的变化参考。 下面介绍一种不同的视觉路径跟踪方法Cherubini等人(2011),其中路径由地板上绘制的线条定义。
基于视觉记忆的方法是机器人导航的成熟范例,它允许在不同的条件下重播路径,而不是在学习阶段。 更重要的是,这种方法具有闭环控制的优点,与在开环中回复训练阶段的控制命令的简单方法相反。 值得注意的是,与轨迹跟踪问题相反,在路径跟随问题中,路径没有基于时间的参数化。 另外,在路径跟随问题中,我们对达到严格的期望配置不感兴趣如在姿势调节问题中 (De Luca et al。1998)。 已经解决了避免碰撞的视觉路径问题凯鲁比尼和Chaumette (2013)由于使用纯视觉系统来完成这项任务的复杂性,所以依靠车载范围扫描仪进行障碍物检测。
在本文中,我们提出了一种基于图像的方案,利用视觉记忆导航环境中几何约束的直接反馈。 所提出的控制方案仅使用一个测量的反馈,即当前对极的值或三焦张量(TT)的一个元素。 几何约束的使用使我们能够将许多视觉特征收集到单个测量中。 利用对极几何(EG)的方案已经在初步的论文中引入(Becerra et al。2010)侧重于使用鱼眼相机。 在这里的工作中,除了将TT用作视觉测量的扩展之外,还使用全方位视觉对不同的控制方案进行综合比较。 所提出的方法不需要显式姿态参数估计,而不像Goedeme等人2007; Royer等人2007)。 视觉控制问题转化为相应测量的参考跟踪问题。 参考跟踪避免了在基于存储器的方案的关键图像切换中不连续旋转速度的经常性问题,Courbon等人(2008), Segvic等人(2009)和Courbon等人(2009)。
我们通过使用几何约束(EG或TT)的直接反馈来解决视觉路径跟踪问题。 几何约束的反馈以前已经用于姿态调节问题的背景中,例如Loacute;pez-Nicolaacute;s等人。(2010)和Becerra等人(2010,2011); 但是,现有的作品都不能直接扩展到导航问题。 路径跟随问题基本上需要计算旋转速度,因此,使用一个测量提供了获得平方控制系统的优点,其中闭环的稳定性可以与基于雅可比行列式的方案类似地得到保证(Diosi等人 2011; Cherubini等人 2009),并且与启发式方案(陈和Birchfield 2009)。 尽管平方控制系统对于应用基于雅可比行列式方案来说不是必不可少的,但它是有利的。 在我们的方法中使用的几何约束条件给出了将视觉路径中可用的有价值的先验信息考虑进去的可能性,以前的基于图像的方法未利用这些先验信息。 该信息用作前馈控制,允许在给出新的参考图像时根据所学习的路径获得分段恒定的旋转速度,而没有不连续性。 另外,这个先验信息用于根据路径的形状调整平移速度。
传统相机受限于视野。 基于视觉的机器人控制中的许多方法(例如本文提出的方法)可以从全方位或鱼眼相机提供的广泛视野中受益。 我们也贡献利用通用相机模型(Geyer和Daniilidis2000)来获得通用控制方案。 这意味着所提出的方法不仅适用于传统相机,而且适用于所有中央反射折射式视觉系统和一些鱼眼相机。
总之,该论文的贡献如下:
(1)基于几何约束EG和TT的两个任务函数的提议使得能够直接控制机器人的旋转速度以实现准确的视觉路径跟随,将平移速度作为独立参数。
(2)开发两种不同的控制方案来利用所提出的任务功能,一种是纯粹的反馈控制,另一种包括强大的前馈控制组件。 两种控制方案在给出新的参考图像时避免不连续性,然而,使用前馈项的方案计算优选的分段恒定旋转速度。
(3)报告了不同控制方案之间的综合比较研究,这表明基于TT的控制在机器人速度的平滑度和对噪声的稳健性方面为一般设置提供了更好的性能。
(4)所提出的导航方案适用于大量视觉系统:常规透视摄像机,中央折反射系统(例如超反射,副透镜)和一些鱼眼相机。
本文的结构如下。第二部分概述了视觉记忆方法并提出了本工作中涉及的整体方案。第三部分介绍了轮式移动机器人的数学建模以及从通用相机获得的视觉测量的计算。 第四部分根据EG或TT提供的信息描述拟议的导航策略。第五部分对两种几何约束的自主导航的控制规律进行了详细描述。第六部分通过模拟和现实世界的实验显示了控制方案的性能,最后,第七部分总结结论。
- 视觉记忆方法
基于视觉记忆的导航框架由两个阶段组成。 第一个是建立视觉记忆的学习阶段。 在这个阶段,用户沿着它允许移动的地方引导机器人。 为了表示环境,在此阶段从车载相机存储一系列图像。 从所有拍摄的图像中选择缩小的集合作为关键图像。 两个连续的关键图像之间必须存在最少数量的视觉特征。 在该阶段之后,请求机器人到达由目标图像定义的环境中的特定位置。 最初,机器人必须通过比较当前正在看到的信息和一组关键图像来定位自己。 当找到与当前图像“更类似”的关键图像时,机器人就会被本地化。 然后,生成将当前位置与目标位置连接为n个关键图像序列的视觉路径。 为了达到目标位置,应在自主导航阶段遵循此路径。 尽管在我们的方法中不会使用度量信息,但我们假设与任何两个连续的关键图像相关的机器人位置之间至少有距离d分。 该参数将在Sects中使用。5.1 和5.2 用于前馈控制和关键图像切换的基于时间的策略。 这个假设意味着机器人可以在学习阶段停止,但是,直到机器人继续定义路径并且视觉特征的数量小于阈值时才存储关键图像。
图1 概述了提出的视觉路径跟踪框架。 给定具有n个关键图像的视觉路径,我们假定基于图像的定位组件为自主导航阶段(例如,I\)的开始提供了要到达的第一个关键图像。 然后,图像点特征在车载相机的当前图像和相应的关键图像之间匹配。 使用匹配的点特征:(1)计算作为所提出的控制律的基础的几何约束,以及(2)计算出给出切换的图像误差条件转换为下一个关键图像。 当图像误差很小时,请求达到新的关键图像,并且重复相同的周期,直到达到最终关键图像I\。 我们的兴趣是有一个目标切换标准,适用于不同类型的控制法则,同时限制从图像点坐标中提取信息。 对目标切换使用相同的几何约束可能需要针对每种情况的特定策略,或者可能需要部分欧几里德重建,如Courbon等人所述(2008, 2009)。
值得注意的是,我们专注于自主导航阶段控制方案的设计。 从这个意义上说,我们假设视觉路径已经被适当地生成了。 视觉路径由更高层次提供,处理诸如关键图像的选择,关键图像的拓扑组织,视觉路径的规划和初始本地化等方面。 有关这些方面的更多细节请参阅Courbon等人(2009)和Diosi等人 (2011)。 对于基于内存的可视化导航环境中的功能检测和匹配,请参阅Goedeme等人 (2007)和Courbon等人(2009).
图1.基于视觉记忆的导航总体方法
- 机器人模型和视觉测量
在本节中,我们介绍所需的数学建模,以便将机器人的运动学运动与视觉测量相关联。 正如我们感兴趣的那样,导航方案可以适用于任何中央视觉系统,通用相机模型格耶尔和丹尼利迪斯(2000)以及估算作为所提出的控制律的基础的几何约束的方法。
(a) (b) (c) (d)
图2 a机器人模型和相机模型的表示,以x和y作为世界坐标的机器人框架定 义; b中央反折射视觉系统的例子;c由反折射系统捕获的图像的示例;d中央相机的通用相机型号.
3.1机器人运动学
Let chi; = (x , y, phi;)T为图2a所示框架下差速驱动机器人的状态向量。x (t )和y(t ) 是平面内机器人位置坐标,phi; (t )是机器人方向。在状态空间中表达的机器人的运动学模型可以写成如下:
upsilon;(t)和omega;(t)的平移和角输入速度。 我们假定机器人参考系的原点与机器人上安装的固定摄像机相关的参考坐标系一致,这样光学中心就与机器人的旋转轴一致。 我们认为透视和鱼眼摄像机是向前看的,而全向系统则向上看。 因此,模型(1)也描述了相机的运动。
3.2通用相机型号
常规相机的受限视野可以使用宽视场视觉系统(例如鱼眼相机或全视野全向相机)来增强。 有一些基于视觉的机器人导航方法可以利用全向图像的特定属性,例如,Menegatti et al. (2004), 等人在图像的傅里叶分量,以及Argyros等人(2005),使用从全景图提取的角度信息。 图2b,2c显示了中央反折射视觉系统和系统捕获的图像的一个例子。 众所周知的统一投影模型适用于具有近似单个投影中心的视觉系统,如传统相机,反射折射系统和一些鱼眼相机(格耶尔和丹尼利迪斯2000)。 统一投影模型将图像形成描述为两个中心投影的组合。 第一种是3D点在虚拟幺正球上的中心投影,第二种是通过定义为K的图像平面上的透视投影:
其中alpha;x 和alpha;y 是透视凸轮的焦距,在这个w我们假设摄像机已校准(Mei和Rives2007),它允许我们使用单位球上的点的表示。 参考图.2d并考虑3D点X =[ X, Y, Z ]Y。 其在球面X上的相应点坐标Xc 可以从归一化图像平面x = [u, v]T上的点坐标和镜像参数xi;计算如下:
参数eta;是三维点的范数除以它的深度(eta;= X/ Z ) 它可以从点坐标计算出来并取决于传感器的类型。 参数xi;编码图像的非线性用于折反射视觉系统的范围xi;le;1和用于鱼眼相机的xi;> 1。
3.3多视图几何约束
多视图几何约束是将两个或更多个视图之间的投影几何相关联的数学实体。 单应性模型,EG和TT已被用于文献中的姿势再现的视觉控制gulation问题,例如, Fang等人 (2005), 马里奥蒂尼等人。(2007)和Loacute;pez-Nicolaacute;s等人。(2010)。与路径跟随问题相反,这些工作中希望达到期望的机器人配置。而且,单应性模型和EG已经用于视觉路径跟踪的背景下,用于基于位置的方案从几何约束分解放松到欧几里德重建(Courbon et al。2008; 2009).我们在本研究中选择了EG和TT,而不是单应性,因为它们提供了3D场景中摄像机之间几何图形的更一般表示,并且它们用于基于图像的方法。
接下来,简要描述通用相机的图像对EG和TT的估计。
3.3.1EG
如果根据从有效观点发出的射线来制定传统相机和中央反射折射系统,则基本核线约束是类似的。 设X\和X\为投影到与当前帧F\和目标帧F\相关联的单位球体上的3D点X的坐标。 极线约束然后表示如下:
E是与这对归一化相机相关的基本矩阵,标准化意味着已知校准矩阵的效果已被移除并且获得几何点,基本矩阵可以使用经典方法从投影到球体的一组相应图像点线性计算得到(哈特利1997a)。 位于基线上并与相应的虚像平面相交的点称为epipole:当前c=[cx
全文共14814字,剩余内容已隐藏,支付完成后下载完整资料
英语原文共 20 页,剩余内容已隐藏,支付完成后下载完整资料
资料编号:[12609],资料为PDF文档或Word文档,PDF文档可免费转换为Word
以上是毕业论文外文翻译,课题毕业论文、任务书、文献综述、开题报告、程序设计、图纸设计等资料可联系客服协助查找。
您可能感兴趣的文章
- 2.3港口吞吐量预测外文翻译资料
- 使用多标准移动通信分层遗传算法的阻抗 匹配网络的宽带优化外文翻译资料
- 移动RFID标签阅读与非重叠串联阅读器在输送带的应用外文翻译资料
- 利用数字图像进行的全场应变测量方法外文翻译资料
- 自然灾害中并发事件的多种应急资源的分配外文翻译资料
- 基于主机的卡仿真:开发,安全和生态系统影响分析外文翻译资料
- 实现基于Android智能手机的主机卡仿真模式作为替代ISO 14443A标准的Arduino NFC模块外文翻译资料
- 探索出行方式选择和出行链模式复杂性之间的关系外文翻译资料
- 信息系统研究、教育和实践的基本立场及其影响外文翻译资料
- 仓储和MH系统决策模型的设计优化与管理外文翻译资料