英语原文共 5 页,剩余内容已隐藏,支付完成后下载完整资料
基于ELM的MSR和HOG的车牌识别
摘要-本文在极限学习机(ELM)的基础上,提出了一种有效的自动车牌识别方法(ALPT)。首先,应用形态学Top Hat滤波算子对图像进行预处理,然后通过最大稳定极值区域(MSER)检测器提取候选字符区域。第三,根据标准车牌中字符的几何关系,去除了大部分噪声字符区域。最后,从检测到的每个模块的每个字符中提取方向梯度直方图(HOG)的特征,并通过用ELM训练的分类器识别这些字符。实验评价表明,我们的方法在ALPR系统中表现良好。
关键词—车牌识别;极限学习机(ELM);最大稳定极值区域(MSER);方向梯度直方图(HOG)
Ⅰ介绍
在过去的几年中,智能交通系统(ITSs)对人们的生活产生了广泛的影响。随着计算机视觉和模式识别的快速发展,越来越多的基于视觉的技术被应用在ITSs中以进行交通控制和管理。自动车牌识别(ALPR)在ITS的众多应用中起着重要作用,例如道路交通监控,电子支付系统和交通执法[1],[2]。
虽然ALPR的研究历史悠久,但在复杂的交通场景中仍是一项具有挑战性的任务,因为影响最终识别结果的因素很多,比如照明条件的不均、车牌字符的部分模糊等。ALPR算法通常由两个主要步骤组成:车牌检测和字符识别。
车牌检测,对应于检测原图像中车牌的矩形角区域,这对于ALPR系统至关重要。许多研究人员致力于车牌检测领域。用基于颜色的方法来检测牌照,因为车牌和字符的颜色组合几乎仅在车牌区域中发生[3]- [5]。[4]根据色调、饱和度和光度 (HSL)提取了车牌区域,并根据纵横比来验证车牌。但是,基于颜色的方法对照明条件很敏感,尤其是在全天监视场景中。此外,基于边缘的方法更有可能被使用,因为它们更有效、更快速[6],[7]。[6]垂直边缘由Sobel算子提取,噪声边缘被移除。因此,可以轻松检测板区域。这些基于边缘信息的方法可以在相对简单的环境中检测实际车牌区域,但在具有复杂背景的交通场景中存在许多边缘时,它们对噪声非常灵敏,并且计算复杂。
经过车牌检测后,将从车牌区域中分割出每个字符,并由分类器识别。现在已经研究出了许多分割每个字符的技术。在实际车牌二进制化后,是很容易分段的。基于二进制的方法将图像转换为二进制图像,并采用滤波器消除噪声。[8]每个像素都使用局部阈值,因为用一个全局阈值进行二进制化并不能总产生令人接受的结果。通过以像素为中心的窗口中的灰度平均值减去一个常量来计算阈值。[9]使用每个字符的维数进行分割,并事先了解中国车牌的布局,来构建了识别的分类器。此外,为了有效地识别字符,光学字符识别(OCR)是主要应用的方法。如今已研究出了各种各样的字符识别方法,包括传统神经网络[10]和支持向量机(SVM)[11]。[12] 提出了一种具有特征显著性算法的多级分类器来识别字符。这些识别方法适应性好,学习能力强,能达到较高的正确水平,但在训练和测试也非常耗时。
本文在极限学习机(ELM)的基础上,提出了一种对ALPR的有效方法。该方法的
图1 所提出方法的流程图
流程图如图1所示。首先,我们使用顶帽转换对输入图像进行预处理,这有助于抑制背景噪声。然后提取MSERs,选择候选字符区域,并根据标准车牌中字符的几何关系来选择真实车牌字符区域。最后,从输入图像中提取名为HOG描述符的字符区域特征,并使用基于ELM的神经网络识别字符。
本文的内容如下,II先描述了车牌字符检测,然后是图像预处理和MSER提取,Ⅲ详细讨论了使用HOG和基于ELM的神经网络的车牌识别,Ⅳ描述了实验的结果,Ⅴ最后得出一个简短的结论。
Ⅱ 车牌字符检测
A 图像预处理
对于在现实环境中获得的车牌图像大多都是彩色图像,我们应将其更改为灰色图像以减少计算量。此外,我们进行了顶帽操作,这是一种数学形态学转换。对于数学形态学[13],它是一个非线性滤波器,具有抑制噪声,提取特征和分割图像等功能。
B 字符区域提取
1)最大稳定极值区域:MSER功能可用于各种不同的领域,例如场景分类,物体识别和目标跟踪。 MSER最初是在[14]中提出的,它表示一组不同的区域,这些区域由其内部及其外边界的强度函数的极值性
- (b)
图2 提取的MSERs (a)候选的MSERs.(b)过滤后的MSERs.
质来定义。最大强度区域是在该区域边界中所有像素值均小于像素灰度级的区域,而最小强度区域大于该值。包括最大强度区域和最小强度区域的最值区域被表示为如果末梢区域的面积在较大的灰度范围内稳定,则该区域为最大稳定极值区(MSER)。数学表达式如(1)所示。
与其他区域特征相比,MSER在比例变换、旋转变换和视点变换方面是不变的。类似于[15],[16],我们在实验中使用MSER检测器来检测车牌字符,并且获得较好的效果。
2)字符和车牌定位:车牌字符中的像素稳定变化,并且这些区域满足最大稳定的极值条件。尽管我们已经做了预处理来消除一些干扰区域,但图像中的其他有噪声MSERs也同时被提取。在提取MSERs时,我们发现干扰区域的形状具有多样性,如图2(a)所示。考虑到标准车牌中字符的几何关系,我们可以选择正确的对应参数来消除干扰区域,如图2(b)所示。如图3所示的标准中国车牌,车牌的长宽比及其字符均在一定范围内。根据上述的相关结论,我们可以同时定位车牌并分割每个字符区域。
Ⅲ 车牌识别
A 极限学习机
极限学习机(ELM)由黄等人提出。在[17]中作为单隐藏层前馈神经网络(SLFN)的有效学习算法。对于多类结构而言,具有L个隐藏节点和M个输出的SLFN架构如图4所示。ELM旨在最大程度地减少训练误差和输出权重的范数。 ELM的关键在于确定参数时不需要迭代,从而减少训练SLFNs的计算时间。
图3 标准中国车牌
图4 SLFN的结构
对于由N个任意不同样本组成的训练集
一个具有N个隐藏节点的标准ELM公式如下所示。
其中g(x)是激活函数,是连接第i个隐藏节点和输入神经元的n维权重向量。为了使用N个隐藏节点来近似N个样本,如果要获得零误差,则应该存在。因此,将(2)建模为具有更紧凑格式的(3)。
图5 训练样本的例子
H为神经网络的隐藏层输出矩阵,H的第i列是第i个隐藏的输出关于输入的节点。在实际应用中考虑到隐藏节点N总是小于训练样本N的数量, [17]建议对参数随机赋值,因此系统为线性系统,从而输出权重可通过公式估算,其中是隐藏层输出矩阵的Moore-Penrose广义逆矩阵。因此,学习该模型需要三个步骤,如下所示。
1)分配随机输入的权重向量或中心和影响因子的隐藏节点偏差,为隐藏节点的数量。
2)计算隐藏层输出矩阵。
3) 计算输出权重:
B 识别
我们已经根据上述ELM离线训练了分类模型。 [18]和[19]指出,具有随机选择的S形隐藏节点(输入权重和隐藏偏差都随机生成)的SLFNs(具有N个隐藏节点)可以准确地学习N个不同的观测值。在本文中,我们将隐藏节点设置为1100个,以获得更好的识别结果。
中文车牌字符由31个中文字符,10个数字和24个字母组成。在本文中,我们手动收集了1358个字符样本进行训练(见图5)。我们提取方向梯度直方图(HOG)[20]作为特征描述符来表示车牌字符。此外,我们将单元格大小,块大小,块步幅和方向数分别设置为10*10、20*20、5*5和9。因此,我们得到了180个维度的特征向量来表示字符区域。然后我们在ELM的基础上训练出具有1100个隐藏节点和65个输出神经元的网络作为分类器。
Ⅳ 实验结果
所有实验均在具有2.66GHz英特尔酷睿2 Quad CPU和2GB RAM的标准PC上进行。完整的测试图像数据库包含来自全天交通监控视频的286个数字图像和408个车牌。
表格1 数据库的实验结果
图6 位置和识别结果示例
在大多数OCR引擎中,只有高度超过20像素的图片才能被识别,20像素通常是可识别字符的最低高度[21]。通过一些检测和识别结果可以证明我们提出的系统是具有效果的(见图6)。
为了评估我们提出的方法的性能,使用了车牌位置召回率(LPLRR),车牌位置精确率(LPLPR),字符识别率(CRR)。在本文中,只有当检测到的车牌和地面真实边界框的重叠大于0.8时,该位置才是正确的。实验结果如表1所示。车牌的定位率和识别率分别达到94.85%和97.90%。此外,由于它只需不到一秒钟的时间即可处理1280*736的图像,因此可以满足实时应用的要求。实验结果表明,该方法是实时,可靠和高效的。但是,大多数被错误识别的字符往往是汉字,因为它们的结构复杂,笔划多,而且全天交通监控录像中的测试图像具有复杂的背景和不同的光照条件。
Ⅴ 结论
本文提出了一种基于ELM的有效ALPR方法。首先,应用顶帽变换来抑制背景噪声,然后提取MSERs然后,根据标准车牌中。字符的几何关系,选择合适的MSERs作为候选字符区域。此外,只有当检测到五个或更多相邻字符时,车牌才会被同时定位。最后,我们通过基于ELM的离线训练网络提取HOG描述符并识别车牌号。我们未来的工作将侧重于添加更强大的训练样本,并通过使用深度架构来寻找更抽象和有用的车牌表示形式。
致谢
我们要感谢中国科学院自动化研究所的王飞跃教授对这项工作的支持和指导。
参考文献
[l]Anagnostopoulos,C-NE等。“从静止图像和视频序列中识别牌照:一项调查。”智能交通系统,IEEE Transactions on 9.3(2008):377-391。
[2] Chiou,Yu-Chiun等。“车牌识别的最佳位置,以增强起点-终点矩阵的估计。” 亚洲交通研究2.1(2012)。
[3]魏,吴,王明军和黄忠祥。“使用颜色功能来自动识别车牌的位置。” 图像处理,2001,会议记录,2001年国际会议,卷1. IEEE,2001。
[4]石霞,赵伟,沈宇。基于彩色图像处理的自动车牌识别系统[M]。计算科学与应用CICCSA 2005。Springer Berlin Heidelberg,2005:1159-1168。
[5] Deb K,Gubarev V V,Jo K H.基于色彩空间和几何特性的车辆牌照检测算法[M]。新兴的智能计算机技术和应用。 Springer Berlin Heidelberg,2009:555-564。
[6] D. Zheng,Y. Zhao and J.Wang,一种有效的车牌定位方法,《模式识别字母》,第26卷,第2431-2438页,2005。
[7] H.Mahini,S.Kasaei和F.Dorri,一种有效的基于特征的车牌定位方法, in Proc. 18th Int. Conf. 模式识别,香港 2006, 第841-844页。
[8] Llorens,David等。“基于连接组件分析和HMM解码的车牌提取和识别。”模式识别和图像分析。 Springer Berlin Heidelberg,2005。571-578。
[9]高,钱,王新年,谢功夫。“基于先验知识的车牌识别。”自动化与物流,2007 IEEE国际会议。IEEE,2007。
[10] B.Shan,基于文本行结构和多级RBF神经网络的车牌识别,J.Compu., 卷6号2,第246C253页,2011。
[11] Wen Y, Lu Y, Yan J等。关键词:智能交通系统,车牌识别算法智能交通系统,IEEE Transactions on,2011,12(3):830-845。
[12]陈振学等。“基于特征功能显著性的自动车牌定位和识别。”车辆技术,IEEE Transactions on 58.7(2009):3781-3785。
[13]谢建伟,余淑华,陈永生。复杂场景中基于形态学的车牌检测[C]。模式识别,2002。第16届国际会议。IEEE,2002,3:176-179。
[14] Mats J,Chum O,Urban M等。关键词:极端稳定区域,稳健的宽基线立体声图像与视觉计算,2004,22(10):761-767。
[15]李波等。“使用条件随机场模型的基于组件的车牌检测。”(2013):1-10。
[16]王伟,姜庆,周新等。基于MSER的汽车牌照检测[C]。消费电子,通信和网络(CECNet),2011年国际会议。IEEE,2011:3973-3976。
[17] Huang G B, Zhu Q Y, Siew C K。极限学习机:理论
剩余内容已隐藏,支付完成后下载完整资料
资料编号:[237254],资料为PDF文档或Word文档,PDF文档可免费转换为Word
以上是毕业论文外文翻译,课题毕业论文、任务书、文献综述、开题报告、程序设计、图纸设计等资料可联系客服协助查找。