英语原文共 12 页,剩余内容已隐藏,支付完成后下载完整资料
智能车辆交通标志识别与分析
系统工程和自动化司,马德里卡洛斯三世大学,C/Butarque 15, 28911 Legane #39;s,马德里,西班牙 (文章信息:2000年10月22日收到;2002年10月24日接受)摘要
本文研究了室外环境下的目标识别问题。在这种环境中,照明条件是无法控制和预测的,对象可以部分遮挡,它们的位置和方向是未知的。选择的对象类型是交通或道路标志,由于其在标识维护、公路和城市盘点、驾驶员支持系统和智能等方面的实用性自主车辆。检测步骤采用遗传算法,允许在位置、尺度、旋转,天气条件,部分遮挡,以及其他相同颜色物体的存在。一个神经网络实现分类。全球系统不仅能识别交通标志,还能提供有关其状况或状态的信息。
2002 Elsevier Science B.V.版权所有
关键词:对象识别;遗传算法;神经网络;交通标志识别;驱动支持系统;智能车辆;聪明的交通系统
1介绍
1.1 动机
交通标志的检测与识别在过去的几年里已经引起了越来越浓的兴趣。这是由具有此功能的系统的广泛应用程序范围所提供的:
1. 公路养护。如今,人类操作员已经做到了通过观看录像带来检查现场情况的迹象。这是一项乏味的工作,因为有迹象表明,有时因为运营商要引起很大的关注。Esprit欧洲项目AUTOCAT[4]展示了一辆能够自动采集交通标志的位置的货车。
2. 库存的迹象。但在城镇和城市里它基本上是相同的应用程序。在这种情况下,环境的问题比高速公路更困难。这些标志并不总是固定的垂直于飞行器的运动,使符号的形象发生变形;此外,有遮挡物和其他颜色相同的物体。在那里在这种特殊的环境下很少会起作用,他将在后面会提到。
3.驱动程序支持系统。交通标志探测及分类是目前国内外研究较少的学科之一驱动支持系统领域。研究组织被集中在其他方面,大多与自动导航,作为检测道路的边界[12,35]或障碍的承认在车辆的路径上,如其他车辆[7,15]或行人[15 20]相关。根据探测到的信号来判断,未来智能汽车特拉杰克,将决定他们的速度。尽管如此,在未来,它可以成为全自动交通工具的一部分,现在它可以支持自动限制速度的车辆,发出警告信号指示超速、警告或限制非法操纵或指示早些时候出现的司机的标志。一般的想法是在一些任务中支持驱动程序,让他或她专心开车。最重要和更一般的任务之一是Estable在参考文献[14]中对该研究进行了描述由戴姆勒-奔驰在其车辆VITA-II。作为一个特殊应用,一种用于检测的系统停车标志作为盲人辅助系统,见文献[39]。
4. 智能自动车辆。移动机器人的使用地标作为他们重新定位[38]的手段。如果在人工地标的例子中,它们可以设计为交通标志[3,32]。这个想法的优点是一些精确的信息被添加到符号中,例如,指示机器人它必须在特定位置跟随路径或执行一些任务。
1.2 困难
交通标志的提取或检测以及后期识别和自然环境的识别一样具有相同的困难:
1. 光照条件多变,不可控。根据一天中不同的时间、季节、云量及其他天气情况等(图1 a - c)1照明是不同的。
2. 其他物体的存在。除了高速公路之外,一些简单的情况以及其他经常环绕交通标志的物体可能会产生部分遮挡,阴影,等(图1d、e)。
3.不可能生成所有的离线模型符号出现的可能性,因为有很多自由度。对象大小取决于到相机的距离; 如果摄像机的光轴不垂直于标志,那么每个轴的比例是不同的,因此需要某些方面的修改(图1g);此外,符号的物理条件也会随着时间的变化而变化,关于它的年龄,事故,等等。如图1f所示,呈现了一个旋转的符号的例子。
1.3目标
本论文的目标是:
1. 这个系统必须能够探测到独立于它们在图像中交通标志的出现。因为,它必须是不变的:
- 透视失真
- 照明的变化
- 部分遮挡
- 阴影
2. 此外,它还必须提供有关可能存在的问题的信息:
- 缺乏可见性
- 条件不好
- 坏的位置
2. 当前发展状况
很少有研究提出完整的用于交通标志的检测和识别的算法。因此,对于检测来说最重要的研究首先是呈现,其次是致力于识别的工作。
2.1信号检测
交通标志检测研究可分为以下两种方法:
1. 颜色阈值分割,区域检测和形状分析。
2. 通过边界检测分割出黑色和白色图像及其分析。
在第一种方法中有两个组工作,一组在标准的色彩空间工作,还有一组致力于开发更详尽的色彩研究。因此,RGB空间在参考文献中被使用[11、13、27、40]。因为灯光的变化问题,他们使用了在颜色空间中的组件或子组的关系。其他研究人员更喜欢在免于照明变化的空间。虽然HSI空间是最常用的[4,21,25,34], Luv空间也被使用[24]。
第二组是那些发展出更多的详尽的色彩研究,注意到HSI空间不能涵盖所有可能的情况。因此Aoyagi[1]指出颜色符号分割不能完成,因为色调组件随距离、天气和标志年龄而变化。结论是分割阶段不是绝对的可靠的完美检测符号像素。一些更复杂的颜色分类方法被用来解决这个问题。从而为彩色像素建立一个数据库分类是在参考文献中发展起来的[36、37]。文献的使用已经在参考文献中提出。[27,28],在参考文献[16]中采用模糊分类。神经网络在参考文献[6,23,26]中被提出。
然而,尽管最后这些分类方法比那些使用的更复杂和完整吗使用固定值进行阈值化时,它们不接受说明遮挡问题。物体的存在部分遮挡一个标志也会产生同样的效果而不是一个糟糕的分割。除非是高速公路,由于标识的大小和位置,遮挡物更困难,在道路中这是一个正常的情况,并且几乎总是在城市出现。因此直到现在人们才相信,如果完成算法处理部分遮挡,颜色细分阶段虽然重要,但并不是决定性的。
那些直接处理黑白图像的人是Austerirmeier等人[5],Besserer等人[8]以及在金字塔形的结构中检测边界的Buker和Mertsching[10]。它们不接受闭塞帐户。Aoyagi和Asakura[1]呈现了一个基因符号检测算法(GA)。他们的工作是更详细地解释了Gas,因为在本文中也被使用。他们工作的目的是探测速度极限的迹象。它们只与明亮的图像一起工作,因为色调变化之前解释过。后获得原始图像的拉普拉斯变换,有一个阈值化。稍后将分析那些通过阈值的像素。几乎所有的研究小组,他们都没有考虑到水平轴和垂直轴的不同比例;因此他们做了一个圆形图案的匹配。要做到这一点基因信息是x位置(7位),y位置(7位)位)和半径(4位)。人口由32人组成个体的选择率是30%突变率是10%有150次迭代。最后是多重交叉点。在Ref.[17]中,离线生成多个模型。它们表示考虑到规模的符号边界的变化。在图像中呈现的对象边界通过距离变换(倒角-距离)得到并增强。对于符号检测,模型与图象相互关联。
图1所示,交通标志检测问题
(a)反映;(b)不受控制的照明;(c)阴影;(d, e)部分闭塞; (f) 旋转迹象;(g)变形。
2.2信号识别
一旦信号被检测到,识别就是完成了。在Ref.[21]中,区域是在颜色之后得到的阈值化,并对其外部边界进行编码;随后复对数映射变换(免疫的规模和旋转)FFT实现。对于最终的分类与光谱数据库进行匹配。在参考文献[24]采用了类似的算法,但是反向传播神经网络(NN)做最后分类。细胞神经网络定位圆形和三角形在参考文献[2]中的符号,但是没有最终的分类每一组都不进行闭塞帐户。网络的输入层是边界检测到的黑白图像的大小符号是固定的。对轮廓线进行了分析的特征空间分类的模型基础。在Ref.[34]区域边界进行了分析;在第一次分类之后三角形和圆形的符号,一个互相关联最终的分类。闭塞和符号变形在这项工作中没有考虑到。一个反向传播神经网络分为限速、无限速和无标志Ref.[1]。输入层是一个规范化的图像18*18像素;隐藏层有15个神经元输出层有三个神经元。没有具体地提到遮挡。Kohonem NN用于参考文献[29]中所考虑的网络训练旋转和闭塞。另一个NN,接受域在参考文献[30,31]中被提出。其中输入直接为图像。在Ref.[13]中,颜色检测的边框区域分析是通过搜索角落从一定角度分析了它们之间的关系反向传播神经网络在哪里执行最终的classifi-阳离子。符号内的小旋转和遮挡是考虑在内的。在Ref.[9]中,标准化相关性的检测和分类符号同时进行。算法不受光照变化和遮挡的影响。检测尺度和角度的差异在模型和图像之间,前者发生了变化在线模拟退火。尽管想法是有趣的,但它没有被证明是实际的,因为它必须对每个符号都做计算成本,这将是令人望而却步的。
3交通标志检测
交通标志通过颜色和形状分析将被检测到。首先是色调和饱和度的分量图像将被分析,图像中的区域完成一些颜色限制将被检测。如果该地区其中一个区域足够大,一个可能的符号可以位于图像中。区域的周长是可以获取的并对可能的符号进行全局搜索。这个搜索是用遗传算法完成的。
3.1 颜色分类
颜色分析的使用是基本的,因为交通标志设计通过思考是否使用颜色来反映信息的迹象。这样一来,所选的颜色就显得特别突出环境。HSI是选择的颜色空间,在本文中,因为它给出了不同的颜色分析每个组件中的信息。这一步有两个目标:触发整个算法并作为中间步骤进行检测标识的边界。
只有色相和饱和度的分量才能避免照明状况。两个表(LUTs)(图2)被构建,其中一个用于色调以及另一个是饱和分量。一般如果一个组件有错误的值,它可能是得到另一个分量的帮助。因此,对于色调来说组件标志的红色有很低的0度和高的360度的值。一个图像对应着255个不同的值是0红,85绿,170蓝,255红。从两个值开始有一个斜坡,直到最大值
图2所示 颜色分类附近地区
以下方程式:
(1)
其中i是以前的Hue组件值,海特是新的一个。
对于饱和分量,其值更高,这个标志就更红。LUT将跟随a斜坡直到饱和值,从那一点将有最大值,下式:
(2)
其中i是前饱和度分量值和SeiT新的一个。
一旦应用了两个lut,图像就会相乘并标准化到255的最大值。这样做的理由不是为两者选择一些固定的阈值组件并通过与运算符形成二进制图像,而是为避免像素分类错误。两个分量互相帮助,如果其中一个有低值,那另一个可以纠正它并传递组合阈值。结果和其他问题可以在图3中观察到。强调一个正确的分类这一点是很重要的,虽然是正面的,但没有必要因为会考虑到遮挡。在(a)和(d)中属于符号的所有像素值都很高,但是还有其他颜色相同的物体;在(b)中所有的像素是很好的分类,但也有其他的对象与标志相连;在(c)中部分符号中有一些值比其他值低得多,符号将被拆分三个不同的对象。
图3所示 颜色检测 (a, d)其他有相同颜色的物体;(b)将两个符号合并成一个物体;(c)很难分类的标志
3.2 遗传算法
GAs[18]在几个方向上进行并搜索模仿自然的优化过程选择和演化。要做到这一点,有一系列的可能性交换信息的解决方案(个人)取决于搜索结果的适应度全球最大值。气体的健壮性取决于它们的能力是否到达一个由本地元素包围的全局最大值。这是如图4a所示,图像中三角符号的检测在哪里想要的。所有可能的三角形符号,只考虑帐户不同的规模,已测试为每个像素(图4 b)的相似性度量公式符号和图像将在后面解释。几个地方最大值可以在全局值附近观察到。他们对应于符号的角处其他三角形标志的尺寸比实际的小。
搜索算法必须在两者之间找到平衡相反的任务:探索整个搜索空间开发特定区域。随着探索,搜索空间被覆盖,寻找有前途的领域必须进行更详细的调查;这就是剥削任务,在已知的区域中寻找最佳解决方案一样好。被困风险在局部最大值或最小值。哈希方法是基于坡度的方法探索(爬山)最极端的情况属于极端的探索。尽管气体容易被发现平衡这两个目标,相比较与勘探他们更擅长开发。在这个例子中
图4所示 局部和全局最大值
(a)原始图像;(b)最适合三角形的标志;(c)以前的高程图;(d)详细地图最高的山峰。
物品也不例外。因此,危险的a必须避免过早收敛,这是等价地使一个物种失去其丰富的基因。遗传算法的步骤是:
1. 种群初始化。
2. 每个人的健康评估。
3.良好的解决方案选择产生新的种群。
4. 产生新的人口。
5. 对新结果的评价。
6. 用新的人口来交换旧的人口。
步骤3-6执行固定次数(代)或者直到最佳个人提供的解决方案达到一定的价值。3.3 基因编纂
基因编码从一个呈现一种距离固定且垂直于光学元件的符号轴符的号模型开始。所考虑的修改是位置和比例尺,由于符号的远近比模型近,或者是因为光轴不近垂直于产生变形的符号,这是由于对于每个轴的放大倍数的不同。
如果存在进行无变形变换的理想模型和在图像中寻找的模型之间存在仿射,那么所有这些因素都可以表示出来
剩余内容已隐藏,支付完成后下载完整资料
资料编号:[444430],资料为PDF文档或Word文档,PDF文档可免费转换为Word
以上是毕业论文外文翻译,课题毕业论文、任务书、文献综述、开题报告、程序设计、图纸设计等资料可联系客服协助查找。