英语原文共 10 页
高效的二维码美化,高品质的视觉内容
林世勋,林敏春胡,IEEE会员,李建汉,李东仪,IEEE资深会员
摘要快速响应(Abstract-Quick response, QR)码通常用于嵌入消息,方便人们使用移动设备捕捉二维码,通过二维码阅读器获取信息。在过去,二维码生成器的设计仅仅是为了实现较高的可解码性,生成的二维码通常看起来像随机的黑白图案,没有视觉语义。近年来,研究人员试图赋予二维码美学元素,并将二维码美化问题制定为在可接受解码率的前提下,使视觉感知失真最小化的优化问题。然而,现有方法生成的二维码的视觉质量仍有很大的不足。在这项工作中,我们提出了一种两阶段的生成高质量视觉内容二维码的方法。在第一阶段,先根据高斯约当消去法合成一个解码可靠但视觉质量较差的基线二维码。第二阶段,我们设计了一种渲染机制,在不影响二维码可解码性的同时提高视觉质量。实验结果表明,该方法大大提高了二维码的外观,处理复杂度接近实时。
索引项-高斯-约当消去法,快速响应(QR)码美化,Reed-Solomon (RS)码。
介绍
随着智能手机的日益普及,二维码(快速响应码)已经成为我们日常生活中获取特定对象/事件信息的一种流行形式,众多的应用[1]-[5]都是基于二维码构建的。QR码的原始框架旨在嵌入具有容错能力的机器可读信息,生成的二维矩阵通常看起来像一个随机图案。由于QR码使用Reed-Solomon (RS)纠错码进行编码,QR扫描器在解码内容时并不需要正确地看到每个像素。这个错误修正机制让一些错误的引入成为
图1 美化二维码的两种变体。
可能,使得二维码设计者能够在一定程度上改变二维码的外观。在过去的几年里,设计师们试图通过添加美学元素或可识别的视觉内容[6]来美化二维码。一般情况下,为了使原有的二维码在视觉上更加赏心悦目,设计师的目标有两种,一是改变模块的形状/颜色,二是将图片嵌入二维码中。图1给出了这两种变化的一些例子。将图片嵌入二维码可以很容易的传达二维码拥有者的特点,也会给浏览者留下更深刻的印象。例如,如果二维码是为了访问你的个人主页而生成的,那么将你自己的肖像嵌入二维码将使二维码在视觉上独特和具有代表性。因此,在本次工作中,我们的目标是通过嵌入图片的方式来美化二维码。
在不影响二维码可扫描性的前提下,手工将视觉内容嵌入二维码并非易事。之前有人提出了通过图片嵌入[7]-[9]自动美化二维码的几种方法。然而,它们在嵌入图片的尺寸约束、生成的二维码的视觉质量、计算复杂度等方面都有局限性。
Lin等人在[7]中引入了一种错误感知的图像变形技术,使生成的二维码中的错误最小化,并优化了代码的可读性。此外,他们通过使用二进制样例来重塑模块的规则正方形,使其局部外观与示例形状相似。Lin的方法适用于嵌入图像为小logo的情况。不幸的是,如果我们希望嵌入的视觉内容占很大比重的话大面积的二维码中,嵌入的内容会
表1
示例结果与不同的QR码生成器进行了比较
严重变形。
Peled等开发的Visualead是一种可视化的二维码生成器,它保持模块的同心圆区域不变,并将相邻区域与图像内容均匀混合。他们的核心思想是在融合图像内容和二维码的同时,保持模块之间的原始对比。然而,他们的方法造成了严重的伪影,如图像内容中显著区域的损坏(请参见表一)。此外,当相同的图像内容应用于不同的二维码时,视觉二维码的结果质量差异很大。
旨在保留可读二维码的局部特征,同时使得二维码近似于嵌入的整体形状图像内容,Chu等人[8]提出了一种基于半色调技术的高质量视觉二维码生成方法。他们建立了一个模式可读性函数,其中一个概率分布显示的是哪些模块可以被其他模块所替代。然后,输入图像由学习字典表示,以此对源文本进行编码。与Visualead相比,Chu的工作产生的腐败较少,因为他们在很大程度上放松了二维码和半色调图像之间的绑定。但由此产生的半色调二维码的视觉质量仍有待提高。Lin等人在[9]中同时考虑了输入视觉内容的显著性映射和边缘映射,优化了生成美化二维码的最佳可变模块。模块选择的基本单元是一个“区块(block)”,它由八个模块组成,代表一个8位RS码字。因此,修改模块信息的灵活性受到块大小的限制。此外,由于RS码的算术运算是在有限域内定义的,Lin没有直接采用常规的凸优化方法,而是采用模拟退火技术来实现优化过程,因此生成一个漂亮的QR码需要更长的时间。
针对以上现有作品的不足,我们提出了一种新的二维码美化器,我们的贡献包括:
bull;我们提出了一种两阶段的二维码美化器,它不仅确保了可解码性,而且几乎实时地保留了嵌入内容的大部分视觉特征。与现有的方法相比,我们的工作有两个优点:1)嵌入的图像可以占据QR码图像的很大一部分。2)结果二维码噪声较小,保持了输入图像的大部分视觉内容。对所提出的二维码美化器在多种视觉内容上进行了评价,结果表明,我们的方法优于最先进的方法。
bull;我们运用Cox[10]提出的控制位的概念,保证生成的二维码的可解码性,并通过改变选择控制位的策略进一步修改Cox的方法,提高视觉质量。
bull;我们设计了一种基于椭圆alpha蒙版的渲染方法,使二维码在不影响可解码性的情况下,与输入图像更加愉悦和相似。
二.概述
一个标准的二维码是由包含比特信息的黑白方块组成的二维模块。二维码的大小由版本号控制。对于一个二维码的版本,相应的二维码
大小是(17 4V)*(17 4V)模块。四个纠错等级(即L、M、Q、H)用于确定二维码的纠错能力。下面简单介绍一下如何合成一个可解码的二维码。首先对嵌入的信息进行分析,确定合适的版本和二维码的纠错水平。根据相关的编码模式,嵌入的消息被编码成带有终止符(0000)和填充位的k位流。然后将Reed-Solomon (RS)码应用于k位流,生成奇偶校验位,用于在扫描QR码时检测和纠正错误。最后,生成的k位RS代码(包括信息比特位,位填充比特,和位的奇偶校验位)和功能模式(即搜索模式、调整模式和计时模式,用于提高阅读性能)放置到二维码屏蔽操作[11]。如图2(a)所示,蓝色/绿色/红色区域分别表示消息/填充/奇偶校验位在二维码中的位置。每个消息位以垂直的交错书写(boustrophedon)顺序(从右下角开始)放在蓝色区域的一个模块上,而每个填充/奇偶校验位以相同的方式放在绿色/红色区域的一个模块上。
二维码美化一般被表述为在可接受的解码速率下,将视觉感知失真最小化的优化问题。然而,由于RS码的算术运算是在有限域上定义的,
图2 (a)说明如何将RS可解码比特流放置在二维二维码上。(b)通过改变控制位的位置获得的新比特流及其对应的二维二维码。(c)基于模块的二进制图像及其对应的1D位流。
一般的凸优化方法不能直接应用。因此,求解优化问题成为一个挑战,相关工作通常需要花费大量的时间来生成近似的结果[9]。在这项工作中,我们提出一个两阶段的方法,在一个有着可解码性强劲但视觉质量差的基线二维码上先合成了基于高斯消去法中一个有效的过程[10],然后再进行渲染机制,旨在提高视觉质量,并不去严重影响二维码的可解码性。由于这两个阶段都可以在0.8秒内完成,因此我们的方法对于实时应用是有效的。
图3为我们的二维码美化器流程图。给定一个输入图像I,我们的目标是生成一个可解码的二维码IR,它与图像I中的视觉内容类似。也就是说,IR中模块mi的颜色应该类似于像素pi的颜色。我们首先对在LAB颜色空间的L通道中的输入图像I进行阈值处理生成两个二进制图像:一个是根据固定的阈值对每个像素分别进行阈值化得到的基于像素的二进制结果IP,另一个是根据模块中心区域内所有像素的平均值,为每个模块分配一个二进制值得到的基于模块的二进制结果IM。(如何确定中心区域的大小将在第四节讨论)然后将函数模式添加到两个二值图像中,生成两个中间二值图像(即and),用于以下过程。
对于基于模块的二值图像IM,我们对其进行预掩,保持查找模式的可识别性,并执行二维码合成步骤生成基线二维码图像IB。该二维码合成步骤基于Russ Cox[10]提出的方法,被证明具有可接受的解码速率。在选择控制位的策略上做了一些修改,使感兴趣区域(ROI)保持在。基线二维码图像可以有效克服噪声,但与原始输入图像I相比仍然
图3所示。提出的二维码美化器流程图。
是一个二进制图像,因为它具有可被感知的阻塞工件。为了进一步提高二维码的视觉质量,我们提出了一种将输入图像I、基于像素的二进制图像IP和基线二维码图像IB结合起来生成最终二维码结果IR的渲染机制。下面我们将详细介绍二维码合成阶段和二维码渲染阶段。
在基集的RS块(即,和)上应用XOR操作可以生成111,或000。我们称前三位为控制位,因为它们的值控制奇偶校验位的值。在基集中,每个控制位上只有一个基的值为1。如果我们想要第二个,第三个和第四个比特成为控制比特,我们必须替换为。然后将新控制位的基集对应的RS码更新为
三.基线二维码合成
为了容忍噪声,提高二维码的解码能力,将多个像素组成一个模块,表示1位信息。因此,我们将基于模块的二值图像作为参考图像,希望我们的基线二维码能够保留最重要的视觉内容IM同时保持其可读性。我们采用Russ Cox的[10]方法生成IB,并对控制位的选取进行了修改。图2说明了主要思想。图2(a)为采用传统方式放置m-bits消息的RS可解码比特流BQ得到的QR码。图2(c)为基于模块的二值图像IM及其对应的一维比特流BM。我们的目标是对BQ的比特进行操作并将其转换为一个新的比特流BN,如图2(b)所示,BN仍然是RS可解码的,类似于BM。这一目标可以通过高斯-约当消去程序来实现,该程序将在下一节中解释。
如图2(a)所示,n-bits RS代码由k个控制位(包括编码的消息、终止符和填充位)和t个奇偶校验位组成,用于纠错。RS码的一个重要特征是两个RS码的XOR结果也是一个RS码[12],这意味着我们可以在其他两个RS码的基础上构建一个有效的RS码。例如,给定以下3个5位RS码,它们的k=3,t=2.
RS1=10010(K1=100 amp; T1=10)
RS2=01011(K2=010 amp; T2=11)
RS3=00101(K3=001 amp; T3=01)
在基集的RS块(即RS1,RS2和RS3)上应用XOR操作可以生成K1,K2,K3形成有效RS码与RS码Bi的整个向量空间的基集Ki=011,110,101,111,000。我们称前三位为控制位,因为它们的值控制奇偶校验位的值。在基集中,每个控制位上只有一个基的值为1。如果我们想要第二个,第三个和第四个比特成为控制比特,我们必须替换RS2为RS1RS2。然后将新控制位的基集对应的RS码更新为
RS1rsquo;=10010(K1rsquo;=100 amp; T1rsquo;=10)
RS2rsquo;=01011(K2rsquo;=010 amp; T2rsquo;=11)
RS3rsquo;=00101(K3rsquo;=001 amp; T3rsquo;=01)
找到新基集的RS码的过程{K1rsquo;,K2rsquo;,K3rsquo;}可以用高斯-约当消去法变形过程。再通过{RS1rsquo;,RS2rsquo;,RS3rsquo;},我们就可以进一步应用XOR操作来获得110,101,111或000的RS代码。根据RS码的上述特点,我们可以将问题表述如下:
(1)
其中BQ为原始比特流,BN为目标比特流,为高斯约当消去过程,krsquo;为目标控制位,trsquo;为目标奇偶校验位。我们可以改变位流BQ中控制位的位置,生成新的位流BN以此将控制位放置在二维二维码的中心部分(ROI) [cf]。图2(a)和(b)]。在通过应用高斯消去法过程的RS码的基础上,我们可以找到新的基础的RS码集。此外,我们可以设置新的控制位的值与ROI的IM的值一样并获得相应的RS码的ROI应用RS码的XOR运算的新基础。因此,可解码的二维码,可以生成类似于,。
Cox方法将QR码划分为凸性区域和非凸性区域。如图4(a)所示,选取凸点(绿色)区域作为控制位区域。相反,我们将二维码分为两部分,即边框和中心。如图4(d)所示,选取绿色中心区域为控制位区域。在分别应用基于(a)和(d)的高斯-约当消
资料编号:[4909]
以上是毕业论文外文翻译,课题毕业论文、任务书、文献综述、开题报告、程序设计、图纸设计等资料可联系客服协助查找。