英语原文共 10 页,剩余内容已隐藏,支付完成后下载完整资料
目录列表可在 ScienceDirect 阅读
图像和视觉计算
期刊主页:www.elsevier.com/locate/imavis
使用深度神经网络识别汽车牌照*
a同济大学控制科学与工程系
b澳大利亚阿德莱德大学计算机科学学院
文 章 信 息 摘要
文章历史:
2016年12月20日收到
收到修订后的表格2018年2月21日接受2018年2月27日
2018年3月6日在线提供
关键词:
车牌检测与识别卷积神经网络递归神经网络
LSTM
在这项工作中,我们基于强大的深度神经网络(DNN)解决了自然场景图像中车牌检测和识别的问题。首先,训练37级卷积神经网络(CNN)来检测图像中的字符,与二进制文本/非文本分类器相比,这导致高召回率。然后通过平板/非平板CNN分类器有效地消除假阳性。关于车牌识别,我们将字符串读取视为序列标记问题。训练具有长短期记忆(LSTM)的递归神经网络(RNN)以识别通过CNN从整个牌照提取的顺序特征。这种方法的主要优点是它是无分段的。通过探索上下文信息并避免由分割引起的错误,该方法比传统方法表现更好并且实现了最先进的识别准确度。
copy;2018 Elsevier BV保留所有权利。
介绍
随着智能交通系统的最新进展,自动车牌检测和识别(LPDR)已引起相当大的研究兴趣。它在安全性和流量控制方面具有各种潜在的应用,并且已经就LPDR的主题做了大量工作。
然而,大多数现有算法在受控条件下或使用复杂的图像捕获系统都能很好地工作。在开放环境中准确读取牌照仍然是一项具有挑战性的任务。困难在于字符模式的极端多样性,例如不同的大小,字体,扭曲,遮挡或模糊,以及高度复杂的背景,如商店板,窗户,护栏或砖块中的一般文本。
以前关于LPDR的工作通常依赖于一些手工制作的图像特征,这些特征捕捉了车牌的某些形态,颜色或纹理属性[1, 2]。这些功能可能对图像噪声敏感,并在复杂背景下导致许多错误警报。在本文中,我们通过利用卷积神经网络(CNN)和递归神经网络(RNN)的高性能来解决LPDR问题。CNN由多层神经元组成,可以从大量标记的训练数据中有效地学习高级特征。在我们的LPDR系统中,我们将牌照视为文本字符串。首先应用字符CNN来检查
*本文已被Thomas Pock推荐接受。
*通讯作者。
电子邮件地址:myyou@tongji.edu.cn (M.You)。
存在字符,然后是CNN板,然后拒绝误报。这种级联框架显示出高辨别能力和对复杂背景的强大鲁棒性。对于车牌识别,我们将其制定为序列标签问题。车牌图像被视为未分段的序列。CNN用于提取图像特征。具有连接时间分类(CTC)的RNN[3] 因为输出层用于标记顺序数据。使用这种方法,我们不需要处理具有挑战性的字符分割任务。RNN的重复属性也有助于利用上下文信息并提高识别性能。我们的LPDR系统的总体框架如图所示图。1.这项工作的主要贡献如下:
我们提出了一个级联框架,它使用不同的CNN分类器用于不同的目的。首先,在整个图像中以滑动窗口的方式使用4层37级(10位,26个大写字母加负非字符类别)CNN分类器(我们将其表示为CNN-I)来检测存在文本并生成文本显着性图。基于字符的聚类性质提取类似文本的区域。然后采用另一个板/非板CNN分类器(表示为CNN-II)来拒绝误报并将牌照与一般文本区分开来。通过这个框架,我们的系统可以检测复杂背景的车牌,具有高召回率和高精度。此外,它可以用于检测各种样式的牌照(例如,来自不同国家),而不管板的颜色,字体或尺寸多种多样。
bull;
https://doi.org/10.1016/j.imavis.2018.02.002
0262-8856 /copy;2018 Elsevier BV保留所有权利。
H. Li等人。/ Image and Vision Computing 72(2018)14-23 15
许可证位置检测
许可证地点识别
输入灰度图像
检测到车牌
认可车牌
CNN消除误报
序列解码
边界框精炼
序列标记
通过启发式规则消除误报
特征提取
基于CNN的文本字符串检测
图1.拟议的汽车牌照检测和识别方法的总体框架。
我们开发了一种深度循环模型,可以一次性读取车牌中的所有字符。据我们所知,这是第一部识别车牌而没有字符分割的作品。我们通过CNN从整个车牌中提取特征而无需预先分段。多层CNN功能连接在一起,结合了本地和全局信息。采用具有长短期记忆(LSTM)的双向递归神经网络(BRNN)来识别特征序列。CTC应用于BRNN的输出以解码板中的字符串。这种方法利用了用于特征学习的深度CNN和用于上下文信息利用的BRNN,并且产生了吸引人的性能。
bull;
其余论文的结构如下。第2节 简要讨论了相关工作。第3节描述了车牌检测的细节,以及第4节介绍了车牌识别的方法。随后进行实验验证第5节,并得出结论第6节.
相关工作
在本节中,我们将简要介绍以前关于车牌检测和识别的工作。不久还讨论了有关CNN和RNN的相关工作。
-
- 车牌检测
车牌检测旨在将车牌定位在图像中并生成潜在的车牌边界框。现有算法大致可分为四类[1, 4, 5]:基于边缘,基于颜色,基于纹理和基于字符。
基于边缘的方法试图找到边缘密度高于图像中其他位置的区域作为牌照。考虑到牌照区域的亮度变化比其他地方更显着和更频繁的特性,Tan等人。[6] 使用边缘检测器和一些形态学操作来寻找候选车牌。在[7],提出了一种基于改进的Prewitt算子算子的车牌定位方法。拉希德等人。[8] 使用Canny算子检测边缘,然后使用Hough变换找到强烈的垂直和水平线作为车牌的边界。基于边缘的方法计算速度快,但它们不能应用于复杂图像,因为它们对不需要的边缘过于敏感。
基于颜色的方法基于以下观察:车牌的颜色通常不同于车身的颜色。HSI颜色模型用于[9] 检测候选牌照区域,稍后通过位置直方图验证。贾等人。[10] 首先通过均值平移算法根据颜色将图像分割成不同的区域。然后根据包括矩形,纵横比和边缘密度的特征区分车牌。基于颜色的方法可用于检测倾斜或变形的牌照。但是,它们无法区分图像中与牌照颜色和大小相似的其他物体。而且,它们对自然场景图像中的各种照明变化非常敏感。
基于纹理的方法试图检测车牌
到板块区域的非常规像素强度分布。在[在[11, 12],开发了滑动同心窗(SCW)算法,根据图像纹理中车牌的局部不规则性来识别车牌。在[13]首先应用小波变换得到图像的水平和垂直细节。然后采用经验模式分解(EMD)分析来处理投影数据并定位指示牌照位置的所需波峰。基于纹理的方法使用比边缘或颜色更多的辨别特性,但是导致更高的计算复杂度。
基于字符的方法将牌照视为一串字符,并通过检查图像中字符的存在来检测它。林等人。[14] 建议根据图像显着性检测车牌。该方法首先使用强度显着图将高回忆率分割出图像中的字符,然后对这些字符应用滑动窗口以计算一些与显着性相关的特征并检测车牌。李等人。[15] 在第一阶段应用最大稳定的极值区域(MSER)来提取图像中的候选字符。然后构造条件随机场(CRF)模型以表示牌照字符之间的关系。车牌最终通过CRF上的置信传播推理进行了本地化。基于角色的方法更可靠,并且可以导致高召回率。但是,性能主要受图像背景中的一般文本的影响。
我们的板检测方法是基于字符的方法。
我们使用CNN来区分字符与杂乱的背景。CNN强大的分类能力保证了字符检测性能。为了区分车牌与图像中的一般文字,设计了另一种平板/非平板CNN分类器,有效地消除了这些硬假阳性。
16 H. Li等人。/ Image and Vision Computing 72(2018)14-23
-
- 车牌识别
以前关于车牌识别的工作通常需要首先对车牌中的字符进行分段,然后使用光学字符识别(OCR)技术识别每个分段字符。
车牌分割的现有方法主要可分为两类:基于投影和基于连通分量(CC)。基于投影的方法利用垂直和水平二进制像素投影的直方图进行字符分割[16, 17]。这种方法很容易受到车牌旋转的影响。基于CC的方法将二进制牌照中的连接像素标记为基于4或8邻域连接的组件[11, 12, 18]。基于CC的方法可以从旋转的牌照中提取字符,但如果它们连接在一起或分开,则无法正确分割字符。郑等人。[19] 结合两种方法来提高分割准确性。值得注意的是,两种方法都是在二进制图像上实现的。因此,二值化结果对分割性能具有显着影响。
车牌字符识别是一种图像分类
问题,其中分段字符需要分为36类(26个大写字母和10个数字)。现有算法包括基于模板匹配和基于学习的方法。
基于模板匹配的方法通过测量字符和模板之间的相似性来识别每个字符。最相似的模板被视为目标[8].提出了几种相似度量方法,如Mahalanobis距离,Hausdorff距离,汉明距离等。[1].模板匹配方法简单明了,但它们只能用于识别单字体,固定大小,无旋转和破碎的字符。基于学习的方法更加健壮。他们从更具辨别力的特征中学习信息,例如图像密度[12, 18],本地二进制模式(LBP)功能[20]他们可以
全文共21400字,剩余内容已隐藏,支付完成后下载完整资料
资料编号:[1856]
以上是毕业论文外文翻译,课题毕业论文、任务书、文献综述、开题报告、程序设计、图纸设计等资料可联系客服协助查找。