基于图像处理的二维码识别外文翻译资料

 2022-03-18 22:02:12

英语原文共 4 页,剩余内容已隐藏,支付完成后下载完整资料


基于图像处理的二维码识别

Yunhua Gu, Weixiang Zhang

摘要

为了解决由普通的相机收集造成的QR码识别问题,本论文提出基于图像处理的识别算法。整个过程包括图像二值化,图像倾斜校正,图像方向,图像几何校正和图像归一化。允许在不同光照条件下,不同的获取角度来收集图像,可以快速识别。基于其他识别算法,对图像倾斜校正,图像定位,图像归一化有一些改进,这样就可以加快图像处理并实现更多简单。实验表明,改进的方法可以提高二维代码的识别速度准确性。

I.介绍

在计算机技术和信息技术的基础上,由编码组成的条码技术,打印、识别、数据采集和处理是蓬勃发展的[1]。与条形码相比,二维码在数据容量、数据类型、数据密度和数据恢复能力和数据方面有显著的优势。根据实现原理,结构和形状的差异,二维码可以被划分为线性条形码和矩阵条形码。主要的应用是物流管理,餐饮订单,安全应用,票务系统、身份验证、业务事务等[2~5]

快速响应代码(QR码)是一种由日本Denso公司开发的二维矩阵代码。除了具有二维条形码的优点之外,同时也有超快的特性响应,全面阅读,可移植的离线应用程序数据库,更有效地表示字母、字符、图像等优点[5]QR码比其他二维条形码增加了20%字符表示的效率,它的特有中国模式更适合我们的应用。

在实际应用中,条形码读取技术将会遇到以下困难。(1)与许多与条形码无关的信息,条形码与条形码无关在商品包装上印上符号。导致复杂的条形码图像背景。(2)光照的变化,导致图像亮度不均匀,增加识别的难度。(3)不同的角度和距离,再加上几何图形由图像捕捉装置引起的失真和平面失真,QR码的图像将会旋转,放大和缩小拉伸。为了解决上面的问题,二维码图像应该有一系列采用国家快速反应代码解码标准算法的图像处理 [6]

II.基于图像处理的识别

图1显示了基于图像的二维码识别过程的算法处理

图1识别处理

A.图像二值化

从更实际的意义上来说,图像获取使用了一个通用的用于图像的聊天摄像机和相机控制程序在图像模式下的获取。图像采集通过灰度处理转换成灰度格式。一个好的二值化方法在整个条形码识别系统中扮演着非常重要的角色。参考文献[7]指出Niblack方法是比较各种本地数据的最佳方法阈值算法。但是要设定一个合适的窗口大是非常困难,对模块有很大的影响,而且花费了太多的时间。参考[8]使用了一个block阈值法将SOM神经网络与Niblack二值化算法联合在一起。参考文献[9]提出的引用一种基于利用二维二阶多项式拟合方法的表面拟合技术来二值化的QR码背景图像图像分割。这个方法需要点的数值应该是矩阵结构的两到三倍,在图像分割中图像拟合的数量背景的过程也需要确定为图像选择合适的样本。参考文献[10]建议通过计算直方图来判断光的强度灰色图像条码,中位滤波器消除噪声分析直方图的峰值特征。总之,我们选择全球阈值方法(OTSU方法)普通光条件,而局部阈值法(自适应阈值)在不均匀的光条件下使用。

B.倾斜校正

当图像被扫描时,QR码的位置经常发生倾斜,需要旋转操作修正。对这一问题进行了研究,参考[10]建议的算法挖空条形码的点,然后得到边缘信息和峰值以及用Hough变换的杆码的斜率检测已知点。参考文献[II]和[12]通过在形态学图像处中使用打开操作并关闭操作的解码前寻找位置的检测模式。参考文献[13]使用OTSU方法进行双化,通过梯度法提取QR码的边缘信息,使用Hough在减少图像分辨率后转换为定位。然而,这两种方法的识别率并不高。参考文献[14]提出了一个快速定位方法,使用基于特定位置模式和代码的检查模式的一维模式匹配,以及通过Hough变换应用于代码的边缘点,4条边线和4个顶点被计算出来,最后是控制点变换和空间双线性插值算法,根据4个顶点对代码图像进行操作组成一个正方形。参考文献[15]使用了Hough变换,sobel操作符定位条形码符号,然后使用空间转换以修正图像失真。然而,QR码的边界不是连续的,大的错误是采用Hough变换定位产生的。基于二维条码图像特征设置的约束,参考文献[16]绘制了凸壳的概念计算几何图形,通过数据矩阵来定位条形码。这个算法可以定位二维的在扭曲或倾斜的情况下有效地编码。

上面的这些方法可以用来实现图像定位。然而,定位的时间复杂度在某些方面是非常高的。在不断变换中,它们很难应用。本论文提出了以下的定位旋转方法。首先,它需要提取QR码符号,然后捕捉图像区域以确保其中心QR码是新图像的中心,这一步消除了周围的噪音信息。那么旋转角度应该是可以确定,最后旋转是通过双线性插值法算出的。

如图2所示,QR码包含3个检测模式ABC的大小和形状相同。检测模式由三个重叠的同心圆组成,这个黑色模块的比例是1:1:3:1:1。每一个的宽度模块允许偏差0.5。根据大小和QR码符号旋转具有不变的特性,它非常快地通过寻找发现的区域来确定检测的位置满足1:1:3:1:1的近似比率。根据它可以在A 、B 、C中构成近似等腰三角形,当适当式样的数量是超过3个,位置检测式样将会最终确定。通过这个步骤,我们可以得到中心ABCQR码符号的坐标。为了加快图像处理速度,在实际应用中,当没有关于QR码的噪音信息和它的形状没有改变,QR码的中心坐标和三个顶点的坐标(ABC)可以由排列和排列扫描方法计算得出。

图2 位置检查 图3 旋转校正

QR码的中心坐标和特征点的坐标是确定时,是需要的来确定旋转的角度。如图3所示S方形区域是最初的二维码图像;N方形区域是截取后的区域。P1,P2,P3这三个特征点(中心点位置检测模式或QR码顶点),假设旋转角度是theta;,计算这三点之间的距离找到最长的距离,假设它是P2P3。

  1. 找到P2P3的斜率。

  1. 如果k大于-1小于1,需要顺时针旋转。

theta;=arctan((k-I)/(1 kraquo;

否则需要逆时针旋转;

theta;=arctan(-(k-I)/(1 kraquo;

QR码的中心坐标确定之后,在图像中心捕捉它的方块以确保QR码都可以访问。被拦截的边的长度至少是

New Length = * SourceLength * sintheta;

当旋转角度是90度时,区域的范围达到最大。为了确保QR码可以填满路径,截取的部分通常会得到最大值,也就是*Sourcelength

因为旋转坐标的目标不是非要为整数坐标,而是确保图形没有失真,目标像素的灰色值需要在图像旋转变换中的插值。经常使用的方法包括最近的近邻插值,双线性插值和三线性插值[17]。其中,最近的近邻插值法很简单,处理时间是最短的,而实时性能是很好,但是结果的质量并不高,这个过程旋转倾向于锯齿状的边界。这个方法是需要高旋转实时性能的应用程序,但在图像质量上却不那么严格。三线性插值计算的精度是最高的,加工过的图像质量最好,而且并没有出现离散像素值的情况。然而,相比双线性插值法考虑到围绕着四个坐标,影响了浮点数,三线性插值在这方面考虑了16个受影响的邻近点,从而三线性插值的时间复杂度非常高。双线性插值方法的结果图像质量高,且它的质地很清晰,符合大多数程序的要求。因此,本论文在图像旋转中使用双线性插值法。此外,如果QR码的坐标不够精确,结果是不太令人满意,就像图4所示。

图4 三种插值方法比较

C.图像几何校正

因为拍摄角度,图像几何扭曲会出现图像旋转和其他问题。QR码几何扭曲会带来巨大的识别错误降低识别率。一般来说,QR码图像失真是线性失真。因此,可以使用QR码修正为具有一个正方形的特征。失真修正算法如下

1)获取QR码的四个顶点的图像。由于外部噪声信息在旋转过程排除了,所以我们可以逐行扫描QR码图像,从QR码区域的八个方向(上,下,左,右,左上,左下,右上,右下,右下)扫描QR码直到出现两个或更多的交集线和黑色方块。在8个方向的扫描之后,我们会至少得到16个点;在两个方向都出现的点是顶点。当这些步骤完成时,会得到三个或更多的顶点。基于这些顶点与位置中心的距离检测,3个距离最短的顶点可以是得到的。

2)确定第四个顶点。参考文献[10]提出将条形码内部点挖出来的算法,得到边缘信息,和一个已知的点,Hough变换为检测出QR码的第四个顶点。本论文提出了一种新的检测算法。根据已知的三个顶点的位置之间的关系,我们可以确定QR码中第四个顶点的方向(左上,左下,右上,右下)。然后由相邻两条线的位置,可以知道第四个顶点。沿着中心坐标进行扫描位置检测模式,直到黑色的交叉点线和QR码模块。这两个边界的斜率行可以计算。然后这两条直线的交点是第四个顶点,就像图5中所示。

图5计算第四顶点 图6控制点变换

3)如图6 所示,P1,P2,P3,P4是没有失真的QR码图像的四个顶点,1,2,3,4是实际QR码的四个顶点。在校正图像中,使用f(x,y)作为坐标(xy)的灰度值,使用fx#39;,y#39;)作为未修正的图像坐标(x#39;,y#39;)的灰度值。假设Pii)的坐标是(xiyi),ii)的坐标是(x#39;iy#39;i)。

这就存在下面的关系

Xi=ax#39;i by#39;i c x#39;i y#39;i d (i)

Yi= mx#39;i ny#39;i px#39;i y#39;i q (i)

通过雅可比迭代法可以解出在上面的方程中的8个参数abcdmnpq,然后就会实现了从一般四边形到一个正方形。

通过几何畸变校正使点(x#39;,y#39;)转换成点(xy),双线性插值可以用于确定灰度值fxy),假设这四个相邻的(x#39;, y#39;)坐标(x#39;0, y0#39;),(x#39;0, y#39;1),(x1#39;, y#39;0),(x1#39;, y#39;1)和对应的灰度值是f(x#39;0, y0#39;),f(x#39;0, y#39;1),f(x1#39;, y#39;0),f(x1#39;, y#39;1),然后双线性插值公式是:

f(x,y)=[f(x1#39;,y#39;0)f(x#39;0,y0#39;)]*(x#39;-x#39;0) [f(x#39;0,y#39;1)f(x#39;0,y0#39;)]*(y#39;-y0#39;) [f(x1#39;,y#39;1) f(x#39;0,y0#39;)-f(x#39;0,y#39;1)- f(x1#39;, y#39;0)]* (x#39;-x#39;0)* (y#39;-y0#39;) f(x#39;0, y0#39;)

D.图像归一化

QR码的图像几乎是固定地通过几何变换,那么它就必须要归一化。参考文献[14]提出了一种方法,QR码被划分为基于Sobel edge的模型和基于傅里叶变换的模型,所有位流数据的检测和消除与代码对应的数据是在最后解码得到的。在本论文中,我们的方法如下所说。

首先,确保基于国家标准的解码算法中QR码的版本号和QR码本身的符号结构。其次,把

全文共7073字,剩余内容已隐藏,支付完成后下载完整资料


资料编号:[16070],资料为PDF文档或Word文档,PDF文档可免费转换为Word

原文和译文剩余内容已隐藏,您需要先支付 30元 才能查看原文和译文全部内容!立即支付

以上是毕业论文外文翻译,课题毕业论文、任务书、文献综述、开题报告、程序设计、图纸设计等资料可联系客服协助查找。