对公路工作区可靠自主驾认识外文翻译资料

 2021-11-06 19:48:42

英语原文共 11 页

对公路工作区可靠自主驾认识

摘要

为了部署在真实的驾驶环境中,自动驾驶汽车必须够识别并响应特殊的道路状况,例如高速公路工作区,因为这些不寻常的事件可以改变先前已知的交通规则和道路几何形状。在本文中,我们提出了一套计算机视觉方法,通过识别工作区标志,识别公路工作区的界限和公路驾驶环境的临时变化。通过使用关于在各种天气条件下记录的高速公路工作区的视频数据进行测试,我们的方法能够完美地识别工作区的边界并且可以有力地检测大多数驾驶状况变化。除了这些测试之外,我们

还使用模拟工作区设置评估了我们的工作区识别系统输出对于保护自动驾驶汽车的有用性。

索引术语 - 分类置信度传播,高速公路工作区识别,基于内核的符号跟踪,用于符号检测的学习颜色模型,符号分类。

I. 介绍

驾驶者一直梦想着自动驾驶汽车,这将减轻他们的通勤和旅行,使他们更安全

而且生活更方便。为了实现这样一个雄心勃勃的目标,研究人员在过去几十年中花费了大量精力并大幅改进了相关技术。例如,研究人员通过早期方法推进消费者车辆,例如为他们配备黑白摄像机,这些摄像机仅以非常低的速度跟踪道路标记,开发出一种半自动驾驶车辆,可在高达数千公里的公路路线上行驶并且包含正常交通[8],[31]以及开发全自动车辆,在与其他机器人车辆交互的同时驾驶

60英里长的模拟城市路线[23],[32]。来自两个行业的最新报告(在各种交通条件下自动驾驶超过70万英里[33])和学术界(具有车辆外观的自动驾驶汽车[35])表明自驾车的潜力增加不久的将来。

对于要在真实的日常驾驶环境中部署的自动驾驶车辆,尽管有上述进步,仍然存在许多技术和社会问题。一个这样的技术挑战是成功开发应对路上意外事件的能力。例如,假设自动驾驶车辆由驾驶环境地图引导;虽然可以事先为车辆提供有关道路几何形状和交通规则的详细信息的地图[9],[12],[18],[32],但不可能先验地描述意外事件,例如道路工程或交通事故。1车辆必须能够有效地处理此类事件,因为它们可能导致道路状况的临时变化。例如,想象一下由于道路工作,车辆正在行驶的道路车道向前横向移动;地图上的道路描绘为沿着直线路径。如果车辆的制动距离长于其感应范围怎么办?除非车辆能够处理道路上的这种意外变化,否则灾难性后果是不可避免的。为了有效地处理高速公路上的意外事件,自动驾驶汽车应首先能够识别它们,然后相应地对它们作出响应。为了解决为车辆提供这种感知和行为能力的问题,本文提出了一种努力来开发我们的自动驾驶汽车的计算机视觉方法和自动驾驶行为[35]。特别地,通过识别输入图

像中的工作区交通标志,所开发的计算机视觉算法旨在识别工作区的边界(例如,工作区的开始/结束)并且识别公路驾驶条件的临时变化(例如,减少车道的速度或横向移动)。自动驾驶行为逻辑旨在响应(例如,降低其速度)到我们的工作区识别系统所识别的内容(即,工作区的界限和交通规则的变化)。关于高速公路工作区和相关行为逻辑的这些详细信息将有助于机器人车辆并且可能帮助人类驾驶员正确地响应高速公路上的意外事件。反过来,这应该导致安全可靠(车道换挡)自动和手动高速公路驾驶。我们的贡献包括:

  1. 开发完整的视觉系统,以识别公路工作区的范围和公路驾驶条件的临时变化;
  2. 处理方法的发展交通标志识别的潜在错误。
  3. 通过使用真实世界的视频数据进行测试,证明了开发系统的有效性;
  4. 在感知和车辆控制之间演示闭环系统,以协助安全的城市驾驶。

II. 相关工作

本节通过将其与交通标志识别领域的先前工作进行比较,进一步描述了我们的方法。对于专注于视觉传感器的任何交通标志识别方法,初始要求是从输入图像定位潜在的标志图像区域。一些系统,包括我们的系统,使用颜色信息来定位标志。另外,对于任何利用颜色的符号识别系统,必须找到最佳目标颜色值范围;实际上,目标颜色的实际值基于图像采集过程而变化。一些研究人员已经手动调查了颜色值[10],[11],它们适用于大多数采样图像,而其他人,包括我们的,使用机器学习技术来获得目标颜色的最佳阈值[20],[28] 。由于其简单的实现,寻找颜色值的手动过程是有吸引力的,但往往容易出错。相比之下,我们的方法通过二进制像素分类器训练自动获得最佳颜色值的限制。交通标志检测的另一种主要方法是使用标志形状。一些研究人员使用符号形状的几何特性,如等角度,来定位交通标志的质心[3]。这种本质上容易出错的方法依赖于几何特性,一种不在透视成像下保留,并且假设图像强度具有高对比度,这是从现实世界图像采集中不容易获得的质量。利用符号的几何特性的替代方法是定位交通标志的部分(例如,角落或边缘)并组合这些部分检测的结果。例如,为了识别潜在的符号图像位置,一些研究人员使用类Haar特征[27],[30],[34]及其变体,例如一组矩形特征,特别是颜色通道[1]和非对称解离偶极子[4]或取向梯度直方图的变体[26]。这种学习方法只有在大量手动标记的数据可用于在很长一段时间内在多个尺度上训练探测器时才表现出成功的性能。作为输入图像中的潜在符号位置,符

号检测器输出图像的子区域的像素坐标。要理解符号强制执行的流量规则,需要“读取”符号的内容。由于大多数交通标志的内容已经由政府机构[24]预先确定,因此检测到的标志的分类足以作为其内容的读数。对于符号分类,大多数相关工作使用现有的机器学习技术,如神经网络。

(NN)[10],线性判别分析(LDA)[1],加速 -向上鲁棒特征匹配[6],支持向量机(SVM)[28]和互相关[29]。一些现有的方法[26],[30]已经在他们的实验设置中证明了令人印象深刻的识别结果,例如,检测率超过98.8%。然而,总的来说,期望在符号识别中获得完美的表现是不现实的。大多数交通标志识别方法可能错过工作区标志或者也可能错误地对透视图像流中的标志图像进行分类。这种不可避免的错误会导致任何符号识别方法误解交通规则和道路几何形状。

为了解决潜在的符号检测错误,一些交通标志识别系统将它们的符号检测方法与跟踪方法相结合。大多数跟踪系统处理视频中跟踪标志的动态,而其余的则跟踪随时间跟踪的标志的外观。为了减少搜索区域并提高检测性能,车辆的离散时间动态,例如贝叶斯滤波器[13],[20] - [22],[29]和信息融合[1],用于基于先前接收的图像帧预测后续帧中的符号的位置。跟踪的外观方法,包括我们的,基于视觉外观[19],以及完善的Lucas-Kanade跟踪器(LKT)[2]。刘等人。[19]选择了几个有趣的点来克服LKT的计算成本,并且这些改进允许他们的算法实时运行,尽管当车辆运动导致图像模糊时可能会出现问题。相反,我们使用基于内核的对象跟踪[7]来利用图像的外观来有效地处理通过一系列图像的变化,而不考虑复杂的车辆动态。

即使借助于标志跟踪,交通标志识别系统也容易出错。为了应对这种潜在的符号识别错误,我们以双重方式利用我们的符号分类输出:首先,我们将分类置信度值传播到未来,以减少漏报的影响;第二,我们调查相同符号的先前分类决策,以减少误报的数量。据我们所知,这种方法尚未在该领域中使用,特别是在处理潜在的符号识别错误以识别临时公路变化时。

IV. 实验

我们开发了一个高速公路工作区识别系统,使我们的自动驾驶汽车能够响应高速公路几何和交通规则的变化[17],[28]。例如,我们希望看到我们的车辆在自动驾驶时能够识别由于道路工作而降低速度限制并降低其张贴的速度。因此,我们进行了各种实验来评估我们工作区的稳健性识别系统和自动驾驶的可靠性行为逻辑。特别是,我们使用视频评估了高速公路工作区识别系统的性能在各种照明条件下获得。我们调查了我们的行为逻辑在响应识别系统在实际驾驶模拟工作区设置时观察到的可靠性。第IV-A节详述了我们的工作区识别系统的性能,第IV-B节描述了实际驾驶测试的实验结果。

我们在不同驾驶条件下的系统性能测试结果

图6.高速公路工作区识别测试的结果。这个数字最好用彩色看。(a)显示视频数据E测试结果摘要的图表。对于该测试,我们将sigma;设置为800(约1120米)。(b)该子图放大(a)中的虚线矩形,并显示另外两条信息。

  1. 公路视频分析的实验结果

我们收集了几个小时的各种高速公路驾驶体验视频片段,并从中准备了6个视频作为测试数据。这是因为这些视频片段中只有一小部分包含高速公路工作区。六个视频中的每一个都显示了在正常高速公路上行驶,经过工作区,以及在另一条正常高速公路上行驶时的车辆视角。5表IV的第一行提供了有关测试视频数据的详细信息 - 图像总数帧,工作区标志出现的图像数量,视频采集期间的季节和天气条件。

对于每个测试视频数据,将图像流馈送到我们的系统中,如果存在,则需要对其进行定位和跟踪标记,并在必要时对它们进行分类。对于符号检测器,符号跟踪器和分类器,我们使用了前面部分中描述的性能最佳的学习器和参数。我们凭经验发现,当gamma;为0.9且T为5时,时间平滑效果最好。根据观察到视频采集期间的平均驱动速度为50 mi / h,我们将sigma;设置为350(490 m)范围内的值根据公路规模和标志之间的最大距离,对于高斯平滑处理为800(1120 m),如[24]中所述。为了清楚地说明我们的实验结果,我们选择并详述了其中一个实验结果。图6示出了视频数据E的实验结果,其中x轴表示按时间和组织的图像帧的数量y轴表示目标类标签,即工作区标志。视频E中的工作区开始出现在第750帧附近。工作区标志的倍数,例如“道路工作”和“车道移位”,出现在“工作区开始”标志之后。当出现“End Road Work”标志时,工作区围绕框架3200结束。每当表示地面实况的绿色圆圈与表示符号分类器的输出的红色“x”重叠时,符号识别的实例被计为正确。对于工作区标志检测,我们测试了两种设置:“仅检测”和

“跟踪检测”。“仅检测”方法在每一帧中执行我们的符号检测器,而“检测跟踪”对执行我们的标志检测器,直到它满足预定条件。然后,我们的符号跟踪方法在剩余的帧中执行,直到符号消失。一旦通过检测或跟踪生成子区域图像,我们的分类器就预测了标志的目标类别。为了在应用跟踪组件时看到我们的工作区识别系统的性能增益,图6(b)放大了图6(a)中的虚线矩形。识别检测的召回用红色圆圈表示,仅用于检测,蓝色方块用于跟踪检测。符号检测的精度在品红色x中仅用于检测,在青色三角形

中用于跟踪检测。在图6(b)中,“道路工程警告”标志出现了12次,然后才从摄像机的视野中消失。请注意,仅检测方法的召回波动,而跟踪检测的方法保持稳定。我们的标志检测器错过了第1515和1517帧的真实迹象。当PASCAL测量值小于0.65时,我们将检测方法视为缺失符号。另一方面,我们的跟踪模块能够在此期间跟踪标志,并提供具有高精度和召回的边界框。这种可靠的符号检测实际上导致了符号分类任务中的更好性能。

表IV总结了所有六个视频的显微分析,如图6(a)所示。该表主要分为两部分:检测和分类。对于检测,第一行强调通过结合符号跟踪来改善符号检测性能的事实。例如,在视频A中,仅检测方法检测到241个工作区标志中的172个;在241个工作区标志中检测到181个跟踪检测方法。仅检测方法通过分析出现在该图像帧上的颜色信息来搜索任何工作区标记,从而导致检测结果与符号在视频上的连续外观不一致。而跟踪方法一旦由探测器启动,就能够可靠地跟踪工作区标志的坐标随时间的变化。“检测”结果第二行

中的另外两个数字表示精确度和召回率。其中,第一行报告跟踪检测方法的性能,以及仅检测方法的第二行。对于大多数试验,跟踪检测优于仅检测方法。这主要是因为跟踪检测能够在初始ROI内以更集中的方式搜索任何工作区标志。换句话说,当符号检测器将图像区域定位为图像帧中的潜在符号t时,很有可能出现在图像帧周围的相同符号。符号检测器先前检测到符号的图像区域。对于视频数据A和D,跟踪检测的性能略低于仅检测的性能。这是由我们的跟踪模块根据边界框内强度的模式和标准偏差裁剪潜在

的符号图像区域引起的。由于这种过度的迹象,这导致召回率降低。

对于表IV的分类部分中的每个单元格,我们评估了具有九个目标类别的分类器的性能。使用对数极坐标变换,我们使用rho;= 32和theta;= 32作为符号特征表示,选择前10个特征基以将原始维度(1024 1)减少到10 1,并使用SVM作为符号分类方法。每个单元格中的三个符号分别对应于特定事件/精确度/工作区标志分类召回的成功()或失败()。仅从跟踪上执行的帧计算精度和召回值(例如,忽略跟踪开始之前的所有检测性能。)每个单元也被分成两行,因为分类模块可以具有不同的输入集来自基于跟踪和仅检测的符号检测方法。

我们的方法在识别工作区边界方面表现出优异的性能。例如,有三个图像包含“最终工作区”标志。尽管在这些标志事件上工作区标志分类的表现并不令人印象深刻,但0.25回忆,我们的标志检测器和分类器成功地认识到这三个标志中的一个具有高可信度。事实上,“正确”发生在三个标志出现的中间,而对于第一个和最后一个(或最近的,就经过的时间而言)出现的相同标志给出了“不正确”的分类。如果我们的系统只考虑最新的分类决策而不考虑以前的分类决策,那么系统将错过重要的工作区标志,并最终低估了工作区的界限。然而,如(8)中所解释的,我们的识别错误处理方法之一利用这些连续的分类决策,使系统能够打开标志以指示我们的车辆在工作区中行驶。即使有一些内在的分类错误,置信度值的折扣总和得出结论,系统已经识别出“终点工作区”标志并关闭标志,表明我们的车辆正在离开高速公路工作区。如果没有这些方法,对于不同时间范围(或尺度)中的相同符号可能会出现不一致的符号分类决策,并且会错过一些对确定工作区界限至关重要的工作区标志。因此,虽然工作区标志分类

性能存在波动,但整体趋势与此示例类似,导致我们的系

原文和译文剩余内容已隐藏,您需要先支付 30元 才能查看原文和译文全部内容!立即支付

以上是毕业论文外文翻译,课题毕业论文、任务书、文献综述、开题报告、程序设计、图纸设计等资料可联系客服协助查找。