基于主成分分析法的二维码识别外文翻译资料

 2022-08-09 10:14:52

英语原文共 8 页,剩余内容已隐藏,支付完成后下载完整资料


基于主成分分析法的二维码识别

摘要:

QR码识别系统(基于计算机视觉)由于两个主要的限制因素,一直难以精确设计:1、即使在不利条件下,QR 码识别系统必须能够获得图像(照明变化,透视扭曲)2、系统必须适应嵌入式系统平台处理复杂度和资源需求。早期的QR码识别系统具有复杂特征描述符,比如Harris特征,霍夫变换,来提取二维码的图案特征,并估计他们的位置。这个过程由图案分类器进行加强,比如(随机森林,SVM)用来去除错误的检测指标。这些方法在计算上非常昂贵。因此,他们不能用于实时系统中。

本文在一个性能有限的系统中有效地运用了一种简化的QR码识别方法。触发的方法是:将捕获的图像进行分割,以减少搜索空间,提取特定的区域。在之后,进行水平和垂直扫描,以定位初步的二维码图案,利用主成分分析法(PCA)来消除错误。此后,根据约束条件对剩余的图案进行装配,以定位相应的二维码。实验结果表明,PCA的加入显著缩短了处理时长,提高了二维码的识别准确率(96%)。

关键词:QR码; 图像分割;主成分分析法;透视校正; 图案相似度度量

一、介绍

如今,由于电子商务和手机市场的快速增长,QR码已经成为最受依赖的数据存储工具。QR码显著地结合了牢固性和成本效益。因此,在不同领域(如工业,商业等),二维码有着越来越广泛的需求。以及,由于如目标追踪和附加的产品标签等原因,需要给予通信信息。它使用可靠的纠错码(reed-Solomon)和基于可视化解码器来存储,用于数据提取。QR码解码器必须严格进行设计,同时考虑很多不可避免的因素。本质上讲,QR码主要放置于具有不规则纹理和光照变化的复杂环境中,这给QR码的识别带来极大挑战。这方面,已经举办了很多场邀请计算机视觉研究员来发明QR码识别算法的比赛,以证明他们有克服此类障碍的能力。

QR码识别算法主要为手机或嵌入式平台设计,其特点是资源非常有限,而且程序实时执行。由于此类因素,原先的算法结构在计算上一定不能太复杂。相反,当我们分析文献中的早期方法时,我们发现它们大多依赖于大量的特性描述,而产生大尺寸的描述符。这些特性用于提供复杂的图案分类器(假实例移除)。早期提出的QR码识别算法由于具有高度资源需求和时间耗费,而并不适合嵌入式系统。

本文的变种QR码识别系统,完全按照嵌入式系统的性能限制所设计。该方法以主成分分析法为基础,以图案分类器的形式实现,基本上有助于在进行有效处理之前降低原始数据的大小。此外,PCA函数接收一组测试图案图像以及与提取的候选图案相关的图像作为输入数据,并随后生成加载系数矩阵,其中每一行表示给定的图案。之后,利用欧几里得相似性度量,将提取的图案系数分别与测试图案系数进行比较。如果提取的图案至少有一个相似度小于或等于预定义的阈值,则将其视为真正图案。

本文的其余部分安排如下:第二节讨论了二维码识别系统的现有方法。第三节介绍本文的背景,第四节对文章提出的方法进行了说明,第五节给出研究成果,第六节报告了结论与未来进步的展望。

二、相关工作

基于不同的识别技术,许多二维码识别方法已经在相关文献中提出。这方面有G.S.Vardhan等人使用QR码作为RFID的标签,因此通过频域反射仪进行识别。N.Bhardwaj等人和Z.Yang等人提出了RGB颜色分割和亮度增强,以减少QR码的搜索区域。Y、 L.Lin等人将方向梯度直方图作为QR码特征描述算子,与AdaBoost分类器相结合实现。

图1.二维码识别系统总体图

M.Ostkamp等人使用了光线追踪技术,该技术允许即使在存在弯曲变形的情况下,也可以识别检索QR码,M.Ahn等人的识别方法是基于云的预生成图像匹配。Y.Kato等人使用基本的QR码特征和滑动窗口检测器从低分辨率图像中识别QR码,这是通过构造高分辨率图像来实现的。Z. l.Liao等人依赖于顶点特征,该特征旨在定位与QR码的finder图案相关的角点。Y.Liu等人主要关注使用多级阈值以及二值图像的全局扫描的二值化阶段。完成后,即可估计QR码的位置。I.Szentandrasi等人实现了霍夫变换,因为他们认为QR码可以作为一组垂直段。刘慧娟还实现了霍夫变换和一维波扫描,用于几何畸变情况下的QR码识别和结构恢复。五十、 Zhong等人利用傅里叶变换进行光谱空间分析,从而实现了QR码识别和去模糊。P.Bodnar等人[实现了一个级联分类器的组合,这些分类器分别由类Haar特征、局部二进制图案和定向梯度特征。K. Suran则是基于哈里斯角度检测和凸壳算法。

三、背景材料

二维码是一种有效的二维条码(根据ISO/IEC 18004标准)。它允许存储和读取不同类型的大量数据:多达7089个数字值、4296个字母数字字符、2953个二进制值和1817个汉字。QR码还提供40种不同版本(1到40之间不等)以及各种模块尺寸(21x21到177x177)。每个模块最多可以处理四个数据纠错级别(L、M、Q和H)。在结构有损的情况下,这些不同等级可分别恢复7%、15%、25%和30%的QR码结构。此外,由于QR码的技术优势,它在经济上是可行的,因为考虑到它可以打印在一张小纸片上或直接以电子格式开发,而RFID标签需要特定且昂贵的设备。

重点是,二维码的定位是通过一个经过了复杂定义的图案来进行的,该图案具有独特的纹理特征。这些图案有助于扫描器初步定位二维码,即使二维码被放置在复杂的纹理上。诱发图案可分为两类:查找图案(FP)和对齐图案(AP)。前者允许对QR码位置进行初步估计,而后者用于确定QR码的方向和几何变形。QR码的结构测量如图2所示。

图2.QR码的结构综述

四、所选方法

  1. 减少搜索空间

QCR识别系统大多设计用于手持设备(如手机、平板电脑)或嵌入式系统平台(Arduino、Raspberry Pi)。这些设备的特点是资源有限,基本上是实时运行的。为了克服这些限制,在进行QR码识别处理之前,不可避免地需要减少搜索空间。在这方面出现了各种方法。P. Moallem等人实现了边缘特征和视差梯度限制技术,以减少立体视觉区域对应时的搜索空间。E.Cho等人使用四叉树结构来提取假定包含感兴趣区域的图像的前景层。诱发过程是一个双重目标,一方面它可以在减少资源需求的同时减少计算时间,另一方面它可以通过丢弃不满足预定义约束的区域来提高识别精度。本文实现了一个功能强大的基于颜色的滤波器,这种方法是F.zaklouta等人已经提出的,通过该方法,在扫描与输入图像相关的所有RGB像素并提取由消色差颜色区分的所有区域(考虑到QR码纹理具有黑白颜色的特征)之后,获得二值掩模(图3(b))。通过这样做,可以提取一组感兴趣的候选区域。所得结果如图3所示。

其中K是消色差颜色提取率。K设定为30。

图3.兴趣区域提取 (a) 原始图像(b)二值掩膜,黑色区域为兴趣区域

到目前为止,一组潜在的QR码区域已经通过上述二元掩模初步定位。为了检验获得的ROI的有效性,它被传递到一个附加的评估过程中。在这个过程中,每个ROI被分别扫描成两个方向(垂直和水平)。有效的采集回报率必须正好包含三个FP和至少一个AP。在进行诱发过程之前,提取的roi集合被二值化,以便用于纹理分析。该算法首先使用(2)定义的方法将它们中的每一个转换为灰度表示。该方程突出了与三个RGB颜色通道相关的主强度和最小强度之间的平均值。因为它提供了最佳对比度,上述变换优于其他灰度变换。(3)定义了二进制转换公式。达到的结果如图4所示。

其中P(R,G,B)表示RGB像素。IGray表示灰度像素。Binary代表二进制像素。T是灰度阈值。

图4.二值化后的候选兴趣区域

B、QR码图像定位

为了在提取的ROI中找到FP和AP的准确位置,分别对每个ROI执行三个连续的处理。首先启动水平扫描,水平扫描每个ROI相关的二进制区域。扫描过程保留并保存每个有效水平段(在表示为H的特定矩阵上)的坐标(开始像素和结束像素的坐标),看其结构是否符合比率1:1:3:1:1(与FP相关)或1:1:1:1:1:1(与AP对应)。与FP和AP相关的水平段和垂直段的结构分别显示在图5(a)和(b)中。红色垂直段表示FP和AP的水平和垂直部分。完成水平扫描后,以与上一次相同的方式启动垂直扫描。垂直扫描保存与上述比率相关的所有有效垂直段(在表示为V的特定矩阵上)的坐标。

图5.FP和AP的纵剖面和横剖面。(a) FP的部分。(b) AP的部分

最后,扫描算法计算两个扫描结果(Hcap;V)之间的交集,即保留的垂直段和水平段之间的交集,该过程实质上允许提取与每个提取的图案相关的中心像素的位置。除了实例(FP和AP)外,还提取了一组假实例。后者严重干扰了二维码的定位。因此,所有提取的图案都被传输到一个基于主成分分析的滤波过程中,该滤波过程被用作图案特征描述符,并结合欧几里得相似性度量来比较得到的图案特征。所实现的滤波器由在不同光照条件下拍摄的大量FP和AP图像来充分进行测试。初步提取的图案如图6所示。

图6.去除假实例前初步提取模式

C、错误剔除算法

大多数错误剔除算法主要基于三个不同的步骤:(1) 图案特征提取(2)分类器检测(3) 预测和分类。尽管该体系结构的效率很高,但在计算时间和资源方面有非常大的需求,考虑到在二维码识别系统中实现的大多数特征描述符,如SIFT、SURF、MSER生成巨大的图案描述,后者的特点是高维度。除此之外,大多数的诱发结构实现了复杂的分类器,其中包括随机树、K-d树。这些分类器通常需要建立一个巨大的树的组合来形成一个巨大的决策路径。为了提高树分类器的性能,必须处理各种约束条件,重点是:(1)寻找一个有效的停止准则。(2) 找到一个最优的树分叉法。(3) 确定最佳叉树选择,从而获得准确的分类。(4) 浏览所有森林路径,即从根(主节点)开始到最深的叶子(终端节点)。对于每个浏览路径,必须计算反映特征出现次数的概率。在诱发约束的基础上,讨论的方法对于嵌入式系统平台是不一样的。针对这一问题,本文提出了一种改进的QR码识别方法,这是通过实施著名的统计程序—主成分分析(PCA),这是由[24]和欧几里得相似性度量共同发明的。如上所述,PCA允许公平地降低原始数据维度,并以两个流线型矩阵(即加载矩阵和得分矩阵)的形式交替地生成减少的输出数据。这些矩阵今后用于处理和分析原始数据。PCA的使用在保证高精度的同时,显著降低了复杂度和处理时间。最后,值得注意的是PCA的主要优点在于不需要进行错误测试,显著地减小了测试数据的大小,而支持向量机和树分类器则需要输入大量的错误样本。

值得注意的是,本文的想法来源于人脸识别系统,该系统在人脸识别领域已经取得了相当大的成功。在理想系统中也维持了同样的准则,即将提取图案的有效性评价分为三个步骤:(1) 准备图案图像的样本作为测试数据,例如图7(a)和(b),它们分别涉及FP和AP类别。测试后的图像在不同的光照条件下拍摄,并经历了各种几何变形(如仿射变形和投影变形)。然后,与提取的测试图案(例如,图7(c)和(d)分别表示真阳性和假阳性)一起的图像将被发送到PCA函数。后者将依次生成相应的加载矩阵,其每一行表示给定的图案。下一节将详细说明讨论的过程。

图7.测试样本和提取图案

  1. FP的测试图像(b)AP的测试图像(c)提取实例(FP)(d)假实例
  • 所选方案步骤

所选方案按如下方式进行:

  1. 首先,对提取的每个图案图像的大小进行重新缩放,使其与练习图案的大小保持一致。此外,每个图案图像被转换为列向量(即,通过连续地连接其向量)。触发的列向量将被表示为CVi(对于i=1,2,hellip;.X),其中X表示查询的图案总数,i表示列索引。如果图像大小为NxN,则对应的列向量大小为N^2x1。该过程应用于所有查询的图案(练习和提取的图案)。通过此方法,得到了一个全局矩阵(表示为a),其大小为N^2 xX。矩阵A的定义如下:

  1. 计算A的每列的平均值(表示为mi),即计算与每列CVi相关的所有系数之和,并将所得和除以列系数N2的总数。触发平均值由表达式(5)定义。

其中Coef(CVi)表示与A的第i列相关的系数集合。X表示A中包含的列总数,mi是第i列的平均值。

  1. 用表达式(6)定义的相应mi平均值减去A的每一列。此操作允许A的每一列接近其平均值。由此产生的中心矩阵表示为Arsquo;,其相应结构由(7)定义。

其中CVNi代表A的第i个中心列向量。

这一区域中,基于主成分分析法从数学的角度解释了原矩阵A的分解。如前所述,使用PCA的主要目的是在消除错误的同时,减轻在检测到的图案和练习图案之间进行比较的复杂性。在这方面,矩阵A作为输入发送到PCA函数,PCA函数随后以两个不同矩阵的形式生成输出。后者通常称为加载矩阵(表示CM)和得分矩阵(表示SM)。该方法以加载矩阵CM为主要矩阵,以保证图案比较。CM系数反映了与原始数据相关的特征向量的主方差以及查询图案之间的相关性。此外,CM的每一列的平方和是1。在提取与输入矩阵A相关的协方差矩阵的特征向量之后获得加载矩阵CM。该过程由表达式(9)定义。对于得分矩阵SM,它主要表示两个主要的正交方向(即两个主要的主成分),这两个方向通过两条垂直直线最优地分割输入数据。得分矩阵通过将中心矩阵A乘以由等式(10)定义的加载矩阵CM来获得。另一方面,根据方程(8)对原始矩阵A进行分解。如前所述,所提出的错误去除算法将完全依赖于加载矩阵系数。考虑到这些系数提供了关于处理图案的重要信息。从今以后,每一个图案都将用一行厘米来

剩余内容已隐藏,支付完成后下载完整资料


资料编号:[239569],资料为PDF文档或Word文档,PDF文档可免费转换为Word

原文和译文剩余内容已隐藏,您需要先支付 30元 才能查看原文和译文全部内容!立即支付

以上是毕业论文外文翻译,课题毕业论文、任务书、文献综述、开题报告、程序设计、图纸设计等资料可联系客服协助查找。