复杂背景下的中国汽车牌照的定位与识别外文翻译资料

 2022-09-06 10:50:04

英语原文共 8 页,剩余内容已隐藏,支付完成后下载完整资料


复杂背景下的中国汽车牌照的定位与识别

摘要:本文提出了车牌定位和字符识别的算法。这些算法有三个优点,首先,它们对许多噪声干扰具有较强的鲁棒性;其次,该方法可以处理不同颜色的车牌;第三,这种基于人工神经网络的识别方法也适用于汉字。

关键词:车牌定位,字符分割,字符识别,人工神经网络

一、引言

随着交通技术的发展以及车辆的普及,车牌管理系统成为了一个热门课题,这是一个已经研究了几十年的许多商业系统已在使用的领域,但很少是针对中国汽车设计的,因为汉字的定位识别算法与英语字母和数字的有很大不同,尤其是车牌在非常复杂的背景下显示。

本文提出了一种复杂背景下的车牌定位识别方法,整个算法系统分为四个部分:图像预处理,车牌区域定位,字符分割和字符识别,如图1所示。

车牌识别系统

字符识别

字符分割

车牌区域定位

图像预处理

图1.系统结构图

图像预处理部分,主要任务是调整整个图像的亮度,并根据车牌的特征,对图像进行增强处理。车牌定位是系统中最基本也最重要的一步,如果不能提取一个准确的车牌区域,字符分割将失败。因此,整个工作将变得毫无意义。一般来说,算法越复杂,定位结果就越准确。本文给出了一种有效的方法来定位热点区域。字符分割部分的目的是得到车牌中的所有字符,然后输出到下一步——字符识别,因此,它会直接影响到字符识别成功的概率。本文提出的算法给出了一种方法来判断车牌的颜色类型,然后为垂直投影选择正确的二值图像。此外,这种新方法提高了对字符粘连和字符间隙的判别能力,并极大增加了分割成功的概率。最后一部分是字符识别,尽管稿件识别系统的研究已经有几十年,有的已经非常成功地运用在个人数字助理(PDA)和移动电话上,但它们的识别原理有很大的不同。对于稿件的识别,它主要取决于笔画信息,但对于字符识别,没有笔画信息,该系统只能在没有其他帮助的条件下处理整个图像。当图像的亮度变化时,字符的形状也会随之改变。本文提出了一种基于人工神经网络的字符识别方法。在传统的方法中,研究者通常都是采用一种模式,但是我们结合后传神经网络和支持向量机两种方法,获得了更好的结果。

二、图像预处理

图像预处理主要包括亮度调节和图像增强两个任务,可通过改变亮度曲线和顶帽变换来实现这两个目标。

1.亮度调节

对于一个包含x*y个像素的图像,第一步是使用以下公式计算其亮度总和:

(1)

其中n=x*y,l代表热点像素的亮度。

然后得到平均热值:

Ave=Sum/(2*x*y*q) (2)

其中q代表量化数字。

之后,图像增强的结果如图2所示。

图2.图像增强的结果

2.顶帽变换

灰度顶帽变换是数字图像处理中常用的一种成熟算法,其优点是在弱化其他区域的同时增强热点区域,使正面和背景有明显的差异。这种变换的结果如图3所示。

图3.顶帽变换的结果

三、车牌定位

车牌定位是四个主要处理过程中最重要、最困难的环节,可以分为以下几个步骤:

1.车牌的特征

根据我国的相关规定,车牌具有一些基本特征,其中最有用处、最有帮助的,一是背景和文字之间有巨大的颜色差异,存在很多边缘信息;二是对于长宽率的规定。这些规定可以作为主要特征。

2.粗定位

即将提到的方法对噪声具有很强的鲁棒性,即使没有图像预处理部分,它也能定位到热点区域,就像下面的例子一样。但我们认为图像预处理是必要的,因为本系统将工作在复杂的背景下,预处理可明显削弱冗余信息,大幅减少相关计算。

(1)边缘检测

灰度图像的边缘检测是基于梯度变化,梯度函数f(x,y)定义为一个向量:

(3)

mag(f ) = [Gx2 Gy2 ]1/ 2 = [( part;f / part;x ) 2 (part;f / part;y) 2 ]1/ 2 (4)

用于数字图像处理中的边缘检测器由掩模所取代,它可以代表Gx,Gy的微分系数。例如,在一个区域中心的梯度可以通过这种方式用Sobel算子边缘检测器来计算:

g= [Gx2 Gy2 ]1/ 2 ={[]2 []2}1/ 2(5)

选择合适的算子是至关重要的。评判主要依据来自实验结果的经验,即边缘信息不应该太复杂,比如Canny算子(图4.(b));也不能太简单,比如Roberts算子(图4.(c))。经过比较,Sobel算子是定位车牌区域的最佳选择,可以显示车牌特征和消除其他纹理。

(a)原始图像 (b)Canny算子的边缘检测

(c)Roberts算子的边缘检测(d)Sobel算子的边缘检测

图4.使用不同方法的边缘检测结果

(2)车牌纹理的增强

膨胀运算是数字图像处理中的一种数学形态学应用,通过在结构元素和图像对象之间进行运算得到图像特征。在集合Z内,集合B对集合A的膨胀运算定义为:

(6)

其中B为结构元素。

这一运算使得图像在内外都有扩展,这就是为什么它被称为膨胀,如图5。

图5.扩张运算的结果 图6.红色通道输出的结果

但是,膨胀运算有一个问题,即不仅仅字符区内被扩张,也在附近区域充满新的要素。在这种情况下,相邻字符会粘连在一起,干扰垂直纹理特征。因此,问题是如何消除两个字符之间的冗余像素,而同时不消除各个字符的必要像素。图6显示的是图5所示的图像与上面提到的有限红色通道的逻辑和运算的结果。红色通道在这里相当于滤波器。

(3)二值图像的顶帽变换

人们常用顶帽变换来补偿背景亮度或强化灰度形态学的纹理信息。它的第一步是开运算。如果结构元素大于你想要提取的对象,然后这些对象将被删除,只留下背景。下一步是要用原始图像减去开运算处理后的图像,结果只留下对象。本文提出了一种基于上述理论的二值图像的顶帽变换算法,其第一步是膨胀,与灰度图像的顶帽变换不同;第二步是用原始图像减去膨胀处理后的图像。此外,为了增强垂直纹理,需要一种开运算,使结构元素大于字符高度,小于字符宽度。

开运算可以分为两个步骤,侵蚀和膨胀,如公式(7)所示:

在集合Z内,通过构建元素集合B对集合A的侵蚀运算定义为:

(7)

在集合z内,通过构建元素集合B对集合A的开运算定义为:

(8)

其中,表示括号里的所有集合。

不同步骤的结果如图7所示。

(a)横向膨胀运算 (b)开运算的结果

图7.使用不同处理方法后的结果

3.水平和垂直定位

对于水平定位,车牌区域中的白像素数要有一个低的阈值,因为反映车牌纹理特征的垂直线条时常出现。因此,短于低阈值的线应被删除,然后整个图像将被分割成若干段,并分别查找这些片段,提取出与车牌最有相似特性的区域。这个过程的结构如图8所示。

分割

高度判断

宽度判断

高宽比判断

纹理间隔和频率

定位结果

图8.最终定位的结构框图

对于垂直定位,首要任务是突出膨胀运算后的车牌区域,然后在水平定位上使用同样的方法得到左右边框。定位结果如图9所示。

(a)水平定位的结果

(b)车牌区域的位置

图9.垂直定位的结果

4.鲁棒性检验和定位结论

传统的算法,是很难处理一些特殊种类的车牌,如不同颜色背景的车牌,在保险杠上的车牌,主灯明显影响的车牌,倾斜的车牌,车牌与车辆颜色相同,和被散热器影响垂直纹理的车牌。对于这些问题,利用本文给出的算法,我们得到了良好的结果。利用本文方法,定位结果如下图10所示。

(a) (b)

(c) (d)

(e) (f)

(a)背景颜色与汽车相同的车牌的定位结果

(b)散热器影响垂直纹理的车牌的定位结果

(c)主灯严重影响的车牌的定位结果

(d)黑身颜色字符的车牌的定位结果

(e)被保险杠保护的车牌的定位结果

(f)假牌照影响的车牌的定位结果

图10.鲁棒性测试结果

实验结果证明,该算法具有很强的鲁棒性。

本文所提方法(方法一)和传统小波变换方法(方法二)的量化比较结果如表1所示:

表一 定位结论

不同图像

识别成功数目

方法一

方法二

100蓝色车牌

98(98%)

92(92%)

40黄色车牌

40(100%)

13(32.5%)

20白色车牌

18(90%)

3(15%)

20黑色车牌

20(100%)

19(95%)

20干扰车牌

11(55%)

8(40%)

共200车牌

187(94%)

135(68%)

从比较结果来看,新的方法更善于区别不同颜色的车牌,这是相对于传统方法的一大改进。

四、字符分割

一般有三种常用的分割算法:垂直投影、模板匹配和连通域分割,垂直投影是基于车牌图像的二值图像,对于未被字符粘连严重影响的图像是一个好方法,但它对于类似“1”、“川”等字符和噪声的鲁棒性就弱些。

模板匹配对于多干扰有较强鲁棒性。但是,这一切都是基于车牌的左边框位置定位绝对准确的前提下。否则,整个分割过程将是完全错误

剩余内容已隐藏,支付完成后下载完整资料


资料编号:[146975],资料为PDF文档或Word文档,PDF文档可免费转换为Word

原文和译文剩余内容已隐藏,您需要先支付 30元 才能查看原文和译文全部内容!立即支付

以上是毕业论文外文翻译,课题毕业论文、任务书、文献综述、开题报告、程序设计、图纸设计等资料可联系客服协助查找。