英语原文共 5 页,剩余内容已隐藏,支付完成后下载完整资料
快速鲁棒图像识别
Paul Brasnett 和 Miroslaw Bober
三菱电机 ITE-VIL, Guildford, 英国
{paul.brasnett, miroslaw.bober}@vil.ite.mee.com
摘要
本文提出了一种对常见修饰具有鲁棒性的图像标识符。 引入了多分辨率Trace变换,构建了一组图像的一维表示。 使用傅立叶变换从每个表示中提取二进制标识符。 在一组超过60,000个独特图像上对该算法和三种最新方法进行了实验评估,结果表明该方法在检测时,鲁棒性和速度方面优于现有技术方法,并且实现了99%的假阳性率低于百万分之一的检测率,在台式PC上搜索速度超过每秒1000万个图像对。
- 引言
一项针对知名网站的调查显示,Flickr拥有超过20亿张图片,Photobucket拥有超过40亿张图片,Facebook拥有超过20亿张图片。 消费者通常在他们的个人收藏中拥有数千张照片,专业人士将拥有更多。 目前,缺乏支持识别可视多媒体内容的强大工具,例如找到修改后图像的原始版本。 此类内容识别工具对于版权保护,数据库重复数据删除和管理,内容链接和内容识别等应用非常重要。 鉴于数据集的大小,工具必须非常快,并以非常低的误报率提供良好的检测。
通常,多媒体识别涉及提取以某种方式捕获特征的标识符。 图像标识符必须对常见的图像修改具有鲁棒性。 它也应该是紧凑的,它必须允许极快的搜索。 图像标识符领域的过去工作可以通过其支持区域分为三种方法,i)基于局部特征点,ii)基于区域,iii)基于全局。
局部特征方法为几何变换提供了高水平的鲁棒性[6],但通常具有高复杂度搜索。 基于区域的方法克服了特征点的一些搜索复杂性问题,但性能较差,特别是在存在旋转时[8,4]。 全球方法在搜索复杂性和稳健性方面显示出前景[5,7,2]。
基于局部特征的方法通常对几何变换和裁剪具有鲁棒性。 然而,随着特征数量的增加,暴力搜索会遭受组合爆炸的困扰。 确实存在提高性能的方法,但搜索成本仍然相对较高。
在本工作中使用了Trace变换, 并通过引入多分辨率Trace变换来实现以往工作 [2], 从而显著提高了结果。本文的贡献是:i) 多分辨率Trace变换的归纳, ii) [2] 中引入的标识符的数学论证。iii) 使用 mpeg-7 试验条件与3种替代方法进行实验比较。
Trace变量及其属性以及如何使用它来提取不变特征在第2节中给出。多分辨率Trace变换在第3节中介绍。图像中鲁棒标识符的提取在第4节中描述。第5节给出了实验结果, 然后在第6节中得出结论。
- Trace变换
Trace转换会在图像上投影所有线条,并在这些线条上应用功能1。 另一种功能,称为直径功能,应用于Trace变换,以获得称为马戏函数的一维函数。 使用迹线和直径函数开发图像标识符。
图1. Trace变换在图像上投影线条,线条由角度theta;和距离d进行参数化
(a) Lena (b)Trace变换
图2.这里显示的是Lena(a)和使用函数IF1的Lena(b)的Trace变换
线在坐标系统 c1 中按 (1, d1, t1) 参数化, 见图1。其中1是法线的角度, d1 是原点和直线之间的距离, t1 是沿直线的距离。沿特定线的图像函数的值为
F1(theta;1, d1, t1)= F (C1; theta;1, d1, t1).
现在, Trace变换 t 在图像函数上应用了一些函数, 从而产生了直径函数
d(C1; phi;1, p1)= T (F (C1; phi;1, p1, t1)).
图2中显示了图像及其Trace变换的示例。直径函数D对直径函数进行操作以给出马戏函数
c(C1; phi;1)= D(T (F (C1; phi;1, p1, t1)). (1)
不变函数:函数Xi;xi;(x)的函数性是不变的,如果
Xi;(xi;(x b)) = Xi;(xi;(x)), forall;b isin; R. (I1)
不变函数可以有另外两个属性
Xi;(xi;(ax)) = alpha;(a)Xi;(xi;(x)), forall;a gt; 0, (i1)
Xi;(dxi;(x)) = gamma;(d)Xi;(xi;(x)), forall;d gt; 0. (i2)
可以证明[3]
alpha;(a)= akappa;Xi;, gamma;(d)= dlambda;Xi;,
其中kappa;Xi;和gamma;(d)= dlambda;Xi;是函数的特征性质。 以下函数遵循属性I1,i1和i2
IF1 = int; xi;(t)dt,
IF3 = int; |xi;(t)j| dt,
IF6 = max(xi;(t)).
- 多分辨率Trace变换
多分辨率表示因其强大的能力来描述从粗到细的不同细节水平的能力而广受欢迎。 这里引入了多分辨率Trace变换,可以从原始Trace变换快速有效地生成。
具有特定功能的Trace变换T提供图像的一种表示。 从这一个抽象中,可以生成图像的多分辨率表示,其捕获不同尺度的信息。 Trace变换多分辨率分解是通过对图像的原始Trace变换进行二次采样,在其两个维度d或theta;或两个维度中进行二次采样。 分解只涉及一系列一维操作,可以非常有效地执行,只需要一点点额外的复杂性。 仅在一个维度上的分解具有阶O(N),其中N是迹变换的维度的大小,并且在维度O(N M)中,维度的大小是N和M. 在实践中,它仅提高了5%的提取复杂性,并且不会影响匹配复杂性,同时极大地提高了性能。
(a)图像域 (b)Trace域
(c)图像域 (d)Trace域
图3.多分辨率Trace变换
通过对列中的间隔进行积分,通过对d参数进行二次采样,在Trace域中执行分解,如图3(b)所示。 这与在Trace变换期间在图像上投影宽度为d的条带相对应,如图3(a)所示。
通过对theta;参数(图3c)中的间隔进行积分也可以进行子采样,即沿着行。 如图3d所示,这大致相当于在迹线变换期间在图像中的双锥体上与开角theta;进行积分。
- 鲁棒标识符
可以从两个不同的坐标系C1和C2观察图像f(x,y)。 坐标系C2是通过旋转角度phi;从C1获得的,通过参数upsilon;缩放轴并通过向量转换(s0cosPsi;0,s0sinPsi;0)。 从C2看的图像f2(x〜,y〜)可以看作是经过phi;旋转的图像f1(x,y),按upsilon;-1缩放并移位(s0cosPsi;0,s0sinPsi;0)。 在这些线性变换下,f1中的一条线仍然是f2中的一条线; 转换是线保留。 在C2中的线的参数方面,坐标系C1中的图像线的参数是
theta;1 = theta;2 minus; phi;,
d1 = upsilon; [d2 minus; s0 cos(Psi;0 minus; theta;2)] ,
t1 = upsilon; [t2 minus; s0 sin(Psi;0 minus; theta;2)]
从(1)可以看出,坐标系C2中的图像的马戏函数与坐标系C1中的图像的关系如下:
c(C2; phi;2)= D(T (F1(phi;1minus;theta;, upsilon; [p1 minus; s0 cos(Psi;0 minus; phi;1)] ,
upsilon; [t1 minus; s0 sin(Psi;0 minus; phi;1)]))). (2)
选择Trace功能T以服从(I1)和(i1)
c(C2; phi;2)= D(alpha;T (upsilon;)T (F1(phi;1 minus; theta;,
upsilon; [p1 minus; s0 cos(Psi;0 minus; phi;1)] , t1))). (3)
此外,可以选择直径函数D来服从(I1),(i1)和(i2)使得
c(C2; phi;2)= gamma;D(alpha;T (upsilon;))D(T (F1(phi;1 minus; theta;,
upsilon; [p1 minus; s0 cos(Psi;0 minus; phi;1)] , t1))),
全文共7764字,剩余内容已隐藏,支付完成后下载完整资料
资料编号:[2552]
以上是毕业论文外文翻译,课题毕业论文、任务书、文献综述、开题报告、程序设计、图纸设计等资料可联系客服协助查找。