在ELM上运用MSER和HOG的车牌识别外文翻译资料

 2021-12-12 21:18:26

英语原文共 5 页

在ELM上运用MSER和HOG的车牌识别

Chao Gou *t,Kunfeng Wang *t,Zhongdong Yu 和Haitao Xie

*青岛智能工业学院智能城市系统研究所

中国青岛

t中国科学院智能系统与技术研究所北京工程技术研究中心

中国北京

广州通信信息建设投资运营有限公司中国广州

摘要- 本文在极端学习机(ELM)的基础上,提出了一种有效的车牌识别自动识别方法(ALPR)。首先,应用形态顶帽过滤算子进行图像预处理。然后通过最大稳定极值区域(MSER)检测器提取候选字符区域。其次,根据标准车牌中的字符几何关系,去除大部分噪声字符区域。最后,从检测到的每个板的每个字符中提取定向梯度(HOG)特征的直方图,并且通过ELM训练的分类器识别字符。实验评估表明,我们的方法在ALPR系统中表现良好。

关键词 - 车牌识别;极端学习机(ELM);最大稳定的极值区域(MSER);定向梯度直方图(HOG)

I.介绍

智能交通系统(ITSs)在过去几年中对人们的生活产生了广泛的影响。随着计算机视觉和模式识别的快速发展,越来越多的基于视觉的技术应用于智能交通系统中,用于交通控制和管理。自动车牌识别(ALPR)在智能交通系统中在众多应用起着重要作用,例如道路交通监控,电子支付系统和交通执法[1],[2]。

尽管自动车牌识别具有悠久的研究历史,但在复杂的交通场景中仍然是一项具有挑战性的任务,因为许多因素会影响最终的识别结果,例如不均匀的照明条件,部分模糊的车牌字符等. 自动车牌识别算法通常由两个主要步骤组成:车牌检测和字符识别。

对于自动车牌识别系统是最关键的部分对应于检测原始图像中的车牌的矩形区域。许多研究人员致力于车牌检测领域。基于检测颜色特性的方法可以用于检测车牌,因为车牌和字符的颜色组合几乎只出现在车牌上区域[3]-[5]。

这项工作部分得到了国家自然科学基金项目61304200的支持。中国MIlT的loT开发专项基金项目:实时图像识别技术和社会保障应用系统的研发。以及授予2F13Q02的SKLMCCS早期职业发展奖。

[4] 基于色调、饱和度和亮度(HSL)来提取的车牌区域并根据各方面的比例来验证车牌。然而,基于颜色的方法对照明条件敏感,尤其是在全天监视场

景中。此外,基于边缘的方法更有可能会被用于更有效和更快[6],[7]的算法中。在[6]中,Sobel算子提取垂直边缘并去除噪声边缘。结果,可以容易地检测车牌区域。这些基于边缘信息的方法可以在相对简单的环境中检测真实的牌照区域,但是当在存在许多边缘具有复杂背景的交通场景中时,它们对噪声非常敏感并且计算复杂。在牌照检测之后,每个特征从牌照区域分割并由分类器识别。已经开发了许多分割每个特征的技术。真正的车牌二值化后很容易分段。基于二进制的方法将图像转换为二值化图像并采用滤波器来消除噪声。在[8]中,局部阈值用于每个像素,因为具有一个全局阈值的二值化不能总是产生可接受的结果。通过从以像素为中心的窗口中的平均灰度级减去常数来计算阈值。钱等人。[9]使用每个特征的尺寸进行分割,并利用中国车牌布知识局的先验构建识别分类器。另外,为了有效地识别字符,光学字符识别(OCR)是主要应用的方法。报告了各种各样的字符识别方法,包括[10]中的传统神经网络和[11]中的支持向量机(SVM)。陈等人。[12]提出了一种多级分类器,它具有特征显著性算法来识别字符。这些识别方法具有较高的适应性,良好的学习能力,可以达到较高的正确水平,但是它们在训练和测试中也很耗时。本文在极端学习机(ELM)的基础上,提出了一种有效的自动车牌识别方法。该方法的流程图如图1所示。首先,我们使用顶帽转换来预处理输入图像,这有助于抑制背景噪音。然后提取MSER,挑选候选字符区域并选择真实的牌照。

图1:所提出方法的流程图

根据标准牌照中字符的几何关系的字符区域。最后,从输入图像中提取名为HOG描述符的字符区域特征,并使用基于ELM的神经网络识别字符。

本文的结构如下。在II部分,描述车牌字符检测,然后进行图像预处理和MSER提取。在部分III中详细讨论了使用HOG和基于ELM的神经网络进行车牌识别。实验结果描述于部分IV。最后,在部分V中作出了简短的结论。

II车牌字符检测

A.图像预处理

因为从真实环境获得的牌照的图像大多数是彩色图像,我们应该将它们更改为灰色图像以减少计算量。而且,我们做了顶帽操作,这是一种数学形态转换。对于数学形态学[13],它是一个非线性滤波器,具有抑制噪声,提取特征和分割图像等功能。

B.字符区域提取

1)极其稳定的极值区域:MSER特性允许广泛的不同应用,如场景分类,对象识别和目标跟踪。最初,在[14]中提出了MSER来表示一组区分区域,这些区域由其区域内及其外边界上的强度函数的极值特性定义。最大强度区域是像素的所有值都小于该区域边界中的像素的灰度级的区域,并且最小强度区域大于该区域。极值区域包括最大值强度区域和最小强度区域表示为Q1,...,Qi-1,Qi,......()。如果极值区域的面积在很宽的灰度范围内是稳定的,那么这个区域就是最大稳定极值区域(MSER)。数学表达式如(1)所示

(1)

与其他区域特征相比,MSER对于视点的尺度变换,旋转变换和变换具有仿射不变性。与[15],[16]类似,我们在实际中使用MSER检测器来检测车牌字符并获得良好的性能。

2)字符和车牌定位:车牌字符中的像素稳定变化,这些区域满足最大稳定的极值条件。虽然我们已经进行了预处理以去除一些干扰区域,但同时也提取了图像中的其他噪声MSER。在提取MSER的同时,我们发现相关区域具有多样性,如图2(a)所示。考虑到标准车牌中字符的几何关系,我们可以选择合适的相应参数去除干扰区域,如图2(b)所示。作为图3所示的标准中国车牌,车牌及其字符的长宽比均在一定范围内。根据上述先验知识,我们可以定位车牌并同时分割每个字符区域。

  1. (b)

图2:提取的MSER。(a)候选MSER。(b)过滤后的MSER

III.车牌识别

A.极限学习机

极限学习机(ELM)由Huang等人提出。在[17]中作为单隐藏层前馈神经网络(SLFN)的有效学习算法。对于多类分类,SLFN的体系结构具有L个隐藏节点和M个输出如图4所示。ELM旨在最小化训练误差和输出权重的范数。ELM的关键点在于确定参数时不需要迭代,这样可以减少训练SLFN的计算时间。

对于由N个任意不同样本组成的训练具有N个隐藏节点的标准ELM如下公式化

(2)

其中g(x)是激活函数,并且是连接第i个隐藏节点和输入神经元的n维权重向量。对于使用隐藏节点来近似N个样本,要获得零误差是可能存在的。因此,(2)被建模为具有更紧凑格式的(3)。

(3)

这里

(4)

和 (5)

H被称为神经网络的隐藏层输出矩阵,H的第i列是第i个隐藏的输出关于输入X1,X2,...,XN的节点,考虑到隐藏节点如果在实际应用中总是小于训练样本N的数量,Huang等。[17]建议随机分配参数值wi和bi。因此系统变为线性的,因此可以通过估计输出权重beta;=HtT,其中Ht是摩尔定义了隐藏层矩阵的逆。

因此,有三个步骤来学习模型,如下所示。

1)分配随机输入的权重向量或中心Wi隐藏节点偏差影响因子bi,i = 1,2,...,L。L是隐藏节点的数量。

2)计算隐藏层输出矩阵H.

3)计算输出重量:beta;=HtT。

B.识别

我们在上述极限学习机的基础上离线训练了分类模型。田村等人[18]和黄等人。[19]指出单层前馈神经网络SLFN(具有N个隐藏节点)具有随机选择的S形隐藏节点(具有随机生成的输入权重和隐藏偏差)可以准确学习N个不同的观察。在本文中,我们设置隐藏节点到1100以获得更好的识别结果。车牌汉字由31个汉字、10位数字和24个字母组成。在本文中,我们手动采集1358个字符样本进行培训(见图5)。我们提取定向梯度(HOG)的柱状图[20]为表示车牌字符的功能描述符。此外,我们还设置了单元大小、块大小、块步幅,方向数为10*10、20*20、5*5、9*9。因此,我们得到一个180的特征向量。表示字符区域的维度。然后我们训练一个包含1100个隐藏节点和65个输出神经元的网络基于极限学习机的分级机。

图3:标准中国车牌 图5:训练样本的示例

神经元 L隐藏层神经元 M输出神经元

图4:SLFN的体系结构

IV 实验结果

所有的实验都是在一台标准的PC上进行的。2.66-GHz Intel Core 2四核CPU和2-GB RAM。这个完整的测试图像数据库包括286个数字图像.全天候交通监控录像中的408个车牌。只有超过20像素的车牌图像才被认为是可检测,因为20像素通常是大多数OCR引擎中可识别字符的最低值[21]。一些检测和识别结果用于说明我们提出的系统的有效性(见图6)。

为了评估我们提出的方法的性能,使用车牌定位召回率(LPLRR),车牌定位精度率(LPLPR),字符识别率(CRR)。在本文中,只有当检测到的车牌的地面真实边界框的重叠高于0.8时,位置才是正确的。实验结果列于表Ⅰ中。定位板的速率,识别字符分别达到94.85%和97.90%。此外,它达到了实时应用的要求,处理1280 x 736图像只需不到一秒钟。实验结果表明,该方法具有实时性,鲁棒性和有效性。然而,大多数错误识别的字符都是汉字,因为它们的复杂结构具有更多的笔划,而全日交通监控视频的测试图像具有复杂的背景和不同的光照条件。

表I:数据库的实验结果

评估指标 比率(%)

LPLRR 94.85(387/408)

LPLPR 95.56(387/405)

CRR 97.90(2652/2709)

图6:位置和识别结果的示例

V. 结论

本文提出了一种有效的自动车牌识别方法。以极限学习机为基础。首先,应用顶帽变换抑制背景噪声,然后提取MSERs。然后,选择合适的MSER最大稳定极值区域作为候选基于几何关系的特征区域标准车牌上的字符。此外,许可证只有在五个或五个以上的情况下,车牌才能同时定位。检测到相邻字符。最后,通过离线识别车牌号,我们以极限学习机为基础的训练网络提取HOG描述符进行作业。我们未来的工作将集中在关于添加更强大的训练样本和发现更多车牌的抽象和有用表示深度架构。

参考文献

[l] Anagnostopoulos, C-NE, et al. 'License plate recognition from still

images and video sequences: A survey.' Intelligent Transportation

Systems, IEEE Transactions on 9.3 (2008): 377-391.

[2] Chiou, Yu-Chiun, et al. 'Optimal locations of license plate recognition

to enhance the origin-destination matrix estimation.' Asian Transport

Studies 2.1 (2012).

[3] Wei, Wu, Mingjun Wang, and Zhongxiang Huang. 'An automatic

method of location for number-plate using color features.' Image

Processing, 2001. Proceedings. 2001 International Conference on. Vol.

1. IEEE, 2001.

[4] Shi X, Zhao W, Shen Y. Automatic license plate recognition system

based on color image processing[M].Computational Science and Its

ApplicationsCICCSA 2005. Springer Berlin Heidelberg, 2005: 1159-

1168.

[5] Deb K, Gubarev V V, Jo K H. Vehicle license plate detection algorithm based on color space and geometrical properties[M].Emerging

Intelligent Computing Technology and Applications. Springer Berlin

Heidelberg, 2009: 555-564.

[6] D. Zheng,Y. Zhao and J.Wang, An efficient method

资料编号:[5606]

原文和译文剩余内容已隐藏,您需要先支付 30元 才能查看原文和译文全部内容!立即支付

以上是毕业论文外文翻译,课题毕业论文、任务书、文献综述、开题报告、程序设计、图纸设计等资料可联系客服协助查找。