英语原文共 5 页,剩余内容已隐藏,支付完成后下载完整资料
关于高效识别车牌字符的一种混合方法
Pan Xiang
Institute of computer science,
Zhejiang university Hangzhou,China
Ye Xiuzi
Institute of computer science,
Zhejiang university Hangzhou,China
Zhang Sanyuan
Institute of computer science,
Zhejiang university Hangzhou,China
摘要:基于图像的车牌识别系统是智能交通系统不可或缺的一部分。根据实际情况,车牌信息提取的质量,特别是中国车牌的提取,有时会变得很差。此外,这里还存在一些“近似”的字符,比如“8”与“B”、“7”与“T”等等。由于可能的噪声或者失真,它们的可识别性较差。为了准确而高效地实现我们的目的,在这篇论文中,将会展示一种结合了统计识别法和结构识别法的两阶段识别法。车牌图像在识别之前要先进行倾斜矫正以及标准化处理。接下来进行第一阶段,4个基于字符统计的分类器将会对输入的字符一一识别,然后用贝叶斯法将识别结果整合起来。如果第一阶段的输出结果包含了预先规定的那些“近似”字符组合,那么接下来调用结构识别模块进行下一个阶段的识别。实验证明我们的识别系统非常的高效可靠。作为智能交通系统的一部分,这个系统已经成功地被商业化。
关键字:汽车车牌字符识别(car plate character recognition),
相似字符区分(similar character recognition),
基于统计学的识别(statistical recognition),
结构化识别(structural recognition)。
- 总体介绍
近些年,智能交通控制系统已经在收费系统、即时监控系统、停车系统中被广泛应用[1]。基于图像的车牌识别系统正是这个系统不可或缺的一部分。
一般来说,基于图像的车牌识别系统主要由以下三步组成:车牌区域的定位,从车牌区域对每个字符进行的分割,对分割出来的每个字符进行识别[2]。一些识别车牌区域和分割字符的方法已经被开发出来了(第一步和第二步)[3-4]。但是,很少有针对字符识别(第三步)的方法。神经网络(neural network)方法被使用在车牌字符识别上[5]。如果车牌图片的质量足够好,这种方法的性能值得期待。然而,采集的车牌图片质量不是总是很好,特别是中国车牌。质量取决于当时的操作条件(比如车牌上的灰尘)以及由于拍摄环境造成的图像失真或不清晰。此外,这里还存在一些“近似”的字符,比如“8”与“B”、“7”与“T”等等。由于可能的噪声或者失真,它们的可识别性较差。实验已经证明:只靠神经网络来实现车牌号的高概率识别是很困难的。
最近,许多方法都已经被开发出来以提升字符识别率,值得注意的是多重识别器联合法(multiple classifiers combination methods),比如多重分类法(multistage classification schemes)[6],多重识别器联合对比法(“parallel” combination of multiple classifiers)[7]。此外,许多研究者转而去整合这两种方案[8]。拥有不同特性的不同识别器将会互相补足,将之整合再得出结论可以很大程度上降低出错的概率,并且实现更高的识别率[9]。
在多重联合识别器中,一个主要的问题是如何整合基于统计学的识别以及结构化识别这两者的优势。这篇论文提供了一个联合统计法以及结构识别法的两阶段的车牌识别系统。车牌图片在被识别前要先经过倾斜校正以及标准化处理。接下来进行第一阶段,4个基于字符统计的分类器将会对输入的字符一一识别,然后用贝叶斯法将识别结果整合起来。如果第一阶段的输出结果包含了预先规定的那些“近似”字符组合,那么接下来调用结构识别模块进行下一个阶段的识别:字符图片信息已经被提前准备好,然后获取结构特点并且提供给决策树分类器(decision tree classifier)。这个方法已经被整合到了一个商用的汽车车牌识别系统中,并且代替了以前使用的BP神经网络法。这种方法已经被证明是十分高效和稳定的。
这篇论文的结构如下:在第二节,将对基于统计方法的车牌识别法进行介绍;在第三节,将对于区分相似字符组合的结构化识别法进行介绍;在第四节,将会给出以上方法的实验结果,以及与以前的BP神经网络方法的结果进行的比较;第五节对这篇论文进行总结,并对其未来进行展望。
- 预处理
为了能够准确地进行字符识别,预处理的操作,比如倾斜校正和标准化,不可或缺。在这一节中,我们将会对倾斜校正以及标准化操作进行简短的介绍。
2.1倾斜校正
图像的倾斜对字符识别的过程影响很大。因此,倾斜检测与矫正非常重要。我们在这里提出了一种基于最小二乘法的倾斜检测法。假设有一个如下定义的二值图像(binary image):
white
Black
第一步:找出所有互相联系的区域。让这些被联系的区域组成集合
{C1,C2,C3......},每一个Ci包含一个高Hi以及一个宽Wi。
第二步:对每一个Ci,检查它是否是“合法”的。如果有:
那么这个Ci(这个区域)即是“合法”的。Tmin与Tmax是提前规定的值。至于制定标准,在中国车牌号的格式上,这个值在0.4~0.8之间。因此在我们实际操作中,Tmin与Tmax分别设为0.3和1.0。
第三步:对于每个“合法”的Ci,计算它的centroid(Gix,Giy)(质心):
第四步:对于计算的质心(centroid(Gix,Giy)),使用最小二乘法将其倾斜进行校正。使用最小二乘法得到一个近似的倾斜角theta;。给出原图函数F(x,y),校正后的函数F(xrsquo;,yrsquo;),它们之间有如下关系:
下图是该算法处理前后车牌的图像:
在对图片进行倾斜校正后,字符已经被从原图分割了出来。
2.2尺寸标准化
这些字符是从不同尺寸的不同车牌上分割出来的。一种线性标准化算法被使用在对这些输入图像上以达到我们要求的标准尺寸(在我们实际操作中,大小为32times;16)。假设我们将原始图片F的宽和高分别定为H和V。那么标准化(i,j)的位置(m,n)将如此得到:
其中M、N分别是标准化后图像的高和宽。
下面是该算法操作前后的一些图像:
- 使用统计学方法(statistical methods)识别字符
在预处理之后,首先使用统计学方法识别这些字符图片。在我们的方法中,4个子分类器(sub-classifier)分别识别这些字符,最后使用贝叶斯法将这些结果整合起来。
四个子分类器都是互不相干分开设计的,用于识别不同的字符特性。这些子分类器的识别方法是模板匹配,这样既简单又稳定。对于系统里的这些特性,我们给出了一个简短的介绍。
1号子分类器
1号子分类器使用分区密度法(zoning density)。为了计算分区密度,输入的图片(32times;16)被分为4times;4的区域。在每一块区域,计算黑色点的密度。因此这个分类器的特性就是:对每一个输入的字符图片,拥有其32块组件的密度值。
2号子分类器
此分类器的特性是一个数组{y(i)|i=1,2,3......,16},y(i)对应32times;16(32行16列的图像点阵)第i列的黑色点的个数。
3号子分类器
这个子分类器的特性是计算输入图像的左右轮廓。我们以如下方式来计算轮廓特性:对于第k行,首先从左向右扫描这一行的点,记录第一个黑色点距离左边框的点个数,然后从右向左扫描,记录第一个黑色点距离右边框的点的个数。每一行都如此操作。最后我们得到了一个含有64个元素的轮廓特性数据数组。
4号子分类器
在4号子分类器中,我们提取每一行每一列的线段数量(黑线和白线),这样又得到了一个含有48个元素的线段特性数组。
为了在系统中实现稳定性和高识别率,需要通过贝叶斯法来整合以上四个子分类器所得出的结果。在整合之后,我们得到了识别结果P1.如果这个结果不属于我们事先规定的“近似”字符组合,就将其作为当前字符的最终识别结果。不然的话,就进入结构识别部分,这将在第4节给出一定的描述。
- 用结构识别法识别“近似”字符
为了在我们的车牌识别系统中识别“近似”字符,提取出具有稳定性与代表性的结构特征就显得十分重要。幸运的是,不同的相似组合拥有不同的结构特征。举个例子,我们将会在这一节讨论如何使用左侧边界轮廓特征来区分“8”与“B”——这一最常见的“近似”组合。
首先,我们给出边界点的定义。
定义 1: 如有点(i,j)满足:
(公式分析:只要以点(i,j)为中心的9宫格中有一个点为0(白色),那么(i,j)即为边缘点)
那么这个点就被称为边缘点(edge point)。
定义图像F的左边缘点的序列集合如下,{F(i,k)|i=1,2,......,M}。对于点F(i,ki),ki可以由以下过程得到:在第i行从左到右找到第一个边缘点,将其列值赋给ki,然后用边缘点描述的曲线方向就如下定义:
(公式分析:三个数字分别表示该曲线相对于内侧来说是凸、平、凹的)
让这些曲线方向的序列为{diri|i=1,......M},如果diri与dirk满足接下来的条件:
那么这个序列就被认为是包含一个“弧点”(curve point),而W则是一个预先定义的阈值(threshold,临界值)。
对左侧边界轮廓特点作出如下处理:
第一步:
取得输入图片的左边缘界点序列F(i,k)|i=1,2,......,M}。
第二步:
计算左边缘点列的曲线方向{diri|i=1,......M}。
第三步:
从左边缘点序列中得出所有的“弧点”的集合。
第四步:
使用最小二乘法估计左边缘点序列,并计算近似误差。
由标准的“8”和“B”得出的两种结构特征将被加入决策树用来区分实际图片中的“8”和“B”。这个决策树并不是总能给出精确结果。如果决策拒绝了对这个字符的识别,那么最终识别结果将会返回给过程P1(第2节的过程)。在我们的系统中,一些参数与决策参数在被用于二进制决策树(binary decision tree)之前,需要先被确定下来。这些参数可以由一些优化算法得到,同时我们使用遗传算法来优化他们。
- 实验结果
为了测试这种混合法的性能,我们将结果对比了BP神经网络法所得出的结果(反向传播的多层感知训练算法,Multi Layer Perception with back propagation training algorithm),后者已经在以前的车牌识别算法中被应用且商业化。识别率见下表(已经排除无法识别的字符)。这是一个三层结构,并且隐藏层都有50个节点。
从表中可以看到,我们的方法比BP神经网络法有稍许的进步。在测试组中这一点尤为明显。
为了更进一步提高我们混合方法的效率和稳定性,我们测试了超过1000种实际车牌图像的识别。就像在第2节第1小节的图片所展示的,识别率受道路条件、明亮度、车辆清晰度影响很大。与BP神经网络法相比,我们的混合法总是能够在识别效率上实现很大的进步。
对于含中国13个省份车牌的超过1000个实际车牌图像识别结果两种方法的对比
下面两图展示了对于某些特殊车牌图像的识别结果的不同,可以看出我们的混合方法对比BP神经网络法有很大的进步。
BP神经网络法
混合法
- 结论与未来展望
在这篇论文中,我们提出了一种针对车牌识别的两阶段混合方法。我们主要做了以下几方面事情:
- 使用结构特征法区分相似的字符组合。
- 开发了一种整合了统计法和结构法的识别方法系统架构。我们使用了大量不同实际情况下的车牌图像来车时这种方法,而且这种方法已经被证明可以在商用车牌识别中被成功地应用。与BP神经网络法相比,我们的混合法更加高效和稳定。我们相信我们的方法可以扩展到其他的ORC(Optical Character Recognition,光学字符识别)领域。
中国车牌的第一个字符是一个汉字,有时甚至让人类去辨认
剩余内容已隐藏,支付完成后下载完整资料
资料编号:[25918],资料为PDF文档或Word文档,PDF文档可免费转换为Word
以上是毕业论文外文翻译,课题毕业论文、任务书、文献综述、开题报告、程序设计、图纸设计等资料可联系客服协助查找。