基于局部SVD的NIR人脸检索
摘要
从上个十年开始,局部二元模式(Local Binary Pattern,LBP)等局部描述符被认为是非常突出的特征描述符,用于表征诸如脸部等图像。这种描述符的性能取决于图像的局部关系。与原始图像相比,经过一定的预处理后,图像的局部关系更有鉴别力,鲁棒性也较好。通过对原始图像的奇异值分解(SVD),得到了4个子带(即S、U、V、D子带)的预处理图像。在这些子带(主要是S子带)上计算局部描述符,并将其称为基于SVD的局部描述符。利用PolyU-NIR和CASIA-NIR人脸数据库对用于近红外人脸检索的SVD子带上的四个局部描述符的性能进行测试,并与使用没有SVD子带的描述符获得的结果进行比较。 实验结果证实了使用SVD的S子带在近红外人脸数据库中局部描述符性能上的优越性。
关键词:局部特征 近红外人脸图像人脸检索 奇异值分解局部二值模式。
1.前言
基于有效内容的图像检索(CBIR)在计算机视觉和图像处理领域仍是一个不断发展的研究领域[1]。每个CBIR系统都会从大型数据库中检索给定查询图像的最相似图像。CBIR的方法主要是根据图像中包含的信息检索相似的图像[2]。
人脸检索可以被视为是图像检索的一种特殊情况,其中人脸检索是针对查询脸部检索同一个人的脸部。Park 和Jain已经提议使用人口统计信息(例如性别和种族)和面部标记(例如疤痕,痣和雀斑)进行面部分析和检索[3]。最近,一项人脸识别调查表明,面部表情符号/描述符的改进是面部分析方法发展的下一步[4]。在[5-7]中描述了一些最新的人脸识别方法。人脸检索可以被视为是图像检索的一种特殊情况,其中人脸检索是针对查询脸部检索同一个人的脸部。在本文中,采用人脸检索而不是人脸识别, 是因为在识别中仅获得一个最高匹配图像,而在检索中,多个最高匹配图像以相似性的降序被检索。
有时可能会出现可见光不可用的情况。 在这种情况下,近红外(NIR)相机能够拍摄图像。因此,需要研究近红外图像的图像分析方法。此外,NIR成像对室内和合作用户更有用。NIR面部分析是当今时代的公开挑战[8,9]。NIR成像中不同光照方向下同一面孔的图像高度相关,而在可见光下则呈负相关[9]。Hollingsworth等人研究了人和机器在近红外光和可见光下的性能。 使用眼周生物测量学[10]。在最近的一项关于视觉与近红外人脸图像匹配的研究中[11],研究人员使用了NIR人脸图像作为探针,同时进行了视觉人脸图像的登记。由于NIR人脸图像在室内/办公环境下的重要性,本文提出了NIR人脸检索方法。
每个检索系统的性能都在很大程度上取决于图像特征的有效描述,如颜色,纹理,形状,结构等[12-14]。在需要照明鲁棒图像匹配的条件下,文献[12]提出了一种照明补偿机制。这种照明补偿权限于彩色图像,而NIR图像大多是灰度图像。许多研究人员已经引入了各种图像特征描述符,其中局部二元模式(LBP)是最常用的[15]。完整的局部二元模式[16],基于交叉强度顺序局部描述符[17],数据驱动的局部二元模式[18],局部对角极值模式[19],局部比特平面解码模式[20]]和局部二值模式傅里叶直方图[21], 局部小波模式[50],多通道解码局部二值模式[51]等是用于结构和医学图像分析中作为LBP的变体所提出的描述符。LBP在面部分析方面也得到了十分符合预期的结果[22,23]。最近针对人脸识别提出的一些最先进的LBP变体是半结构化的局部二元模式[24],方向二进制代码[8]和局部Gabor二进制模式[25],局部导数模式[26], 扩展的局部二值模式[27],局部梯度模式[28],梯度方向和幅度模式[29]以及单基因二值编码[30]。
奇异值分解(SVD)是数值线性代数中最基本的矩阵计算之一[31]。它可以简单地称为线性滤波理论的扩展版本或用于图像增强的工具[32,33]。SVD在信号分析[34],门表征[35],图像编码[36],图像水印[37],图像隐写分析[38],图像压缩[39]和人脸识别[40]等中有多种用途。 Singh等人介绍了一种利用SVD对数字彩色图像进行子带分解和多分辨率表示的新概念。他们基本上都是将SVD应用于图像的区域,最终形成了4个子带。在本文中,我们也使用了与文献[41]中相同的方法,即基于SVD的子带计算近红外(NIR)人脸图像。在文献[42,43]中,SVD被用于在整个人脸图像上的光照鲁棒人脸识别。由于SVD在整个人脸图像上的成功[40],[42,43],我们在人脸区域上形成了SVD子带[41]以克服NIR人脸图像的不良光照问题。一些研究人员使用其他分解技术,例如半离散分解(SSD)[52],在训练集中找出原始的单一图像及其转置,用于计算类内散布矩阵;类内最大值、最小值、中值平均向量被用于人脸识别的最大散度差(MSD)模型[53]。 类内散布矩阵零空间中值法,QR分解,QR分解加权核判别分析和核模糊判别分析被用于人脸识别任务[54-57]。本文提出的方法与文献[52 57]中的主要区别在于:本文提出的方法利用局部因子分解和局部关系来形成描述符,而在文献[52 57]中执行的是全局因分解;本文提出的描述符并不取决于训练数据,而在文献[52 57]中的描述符则取决于训练数据。
SVD基本上代表图像中包含的局部信息,以更具鲁棒性的方式[31],而局部二元模式(LBP)[15],半结构局部二元模式(SLBP)[24],方向二进制码 (DBC)[8]和局部Gabor二进制模式(LGBP)[25]以描述符形式对图像的局部信息进行编码。基本上,在原始强度值上计算的图像描述符错过了利用局部空间关系的原因,因为它们在图像上编码图案的出现。 如果将图像划分为子区域,则由于时间限制,描述符的维数变得太高而不适合图像匹配。这些是我们将SVD与局部特征描述符相结合以提出本文中新的基于SVD的局部特征描述符的驱动因素。 我们在SVD子带图像上对描述符进行编码,而不是原始图像。SVD子带形成实际上通过对图像的每个2times;2个非重叠的子区域的关系进行编码来利用局部空间信息。这种行为对于探索近红外图像的局部关系是非常有用的,因为这些图像主要在非常糟糕的照明条件下被捕获,并且直接在其上计算描述符并不能准确捕获本地信息。我们在两个NIR人脸数据库上进行了人脸检索实验,即PolyU-NIR[44] 和CASIA-NIR[45]。 从实验中,发现了非常有希望的结果,并且观察到当在SVD分解的S个子带上构建时局部描述符的性能得到改善。以下是主要贡献:
1.我们研究了利用局部SVD进行图像表示的可能性。
2.我们探讨了局部SVD和局部描述符的注释性质。
3.我们在NIR人脸数据库上进行了基于SVD和局部描述符的图像检索。
4.我们还测试了不同距离测量在拟议背景下的适用性。
本文的后续部分内容为:在第2节中提出了NIR人脸检索系统的描述,第3节为性能测量和评估标准,NIR人脸图像检索实验,第4节为结果和观察以及第5节为结论。
提出的基于SVD子带的NIR人脸检索
提出的NIR人脸检索框架如图1所示。它由四个主要组成部分组成,即奇异值分解(SVD)子带形成,局部描述子提取,特征向量计算和相似性测量以及NIR人脸检索。该特征向量是利用提取的局部描述符,通过对数据库的每个人脸图像进行SVD分解得到的SVD子带,以及查询人脸图像。人脸检索是通过查询人脸特征向量与数据库人脸特征向量之间的最佳相似性来实现的。在本节中,我们将详细介绍所介绍方法的每个组成部分。
2.1.SVD子带形成
本小节致力于描述给定图像在特定级别(即多分辨率)上奇异值分解(SVD)的子带的构造过程。采用基于SVD的子带分解和多分辨率表示[41]来增强原始图像的特征(即处理NIR成像的光照问题)。
设Ii, j是具有mx行和my列的任何灰度缩放的NIR人脸图像M(即,M中的像素的总数是mxtimes;my)的ith行和jth列上的任何像素的强度值。设PL是尺寸为mLxtimes;mLy的输入图像的SVD因式分解的第Lth级。输入图像PL首先被分成2times;2个不重叠的块,然后对每个块运用SVD。因此,总共有nL = nLxtimes;nLy数量的SVD是必需的,其中nLx=mLx/2而且nLy =mLy/2。令PL,tx, ty表示(tx,ty)th 图像模块PL。按照上述约定,PLi,j表示图像PL的第ith行第jth列像素的强度值。图像PL的(tx,ty)th模块的强度值由如下得出:
(1)
其中 ,。
(tx,ty)th个PL模块(即PL,tx, ty)的SVD可以用下面的分解形式表示:
图1.
图1提出的使用SVD子带进行NIR人脸检索的框架。所有的人脸图像,包括查询,也被分解成四个子带,使用基于SVD块的分解。S子频带基本上包含低频信息,而其余的子频带包含高频信息。局部描述符是在SVD子带图像上计算出来的,并用于找出与查询面对应的最佳匹配面。
(2)
其中AL,tx ,ty 和CL,tx ,ty 是包含正交列向量的2times;2个矩阵,而BL,tx ,ty是在主对角线上具有奇异值的2times;2对角矩阵。
我们可以写出方程式(2)如下:
(3)
其中BL2tx-1,2ty=BL2tx,2ty-1=0。
在Lth级有四个子带,即SL,UL,VL和DL子带,由(3)式如下:
(4)
(5)
(6)
(7)
用于Lth级的SVD的输入图像PL在原始图像(I)和S的子带(BL-1tx,ty)在(L-1)th处递归地定义如下:
(8)
同样,PL(即mLx和mLy)的维度也递归地定义如下:
(9)
(10)
为了找到多分辨率子带,将在前一级中获得的S子带视为输入图像。图2说明了基于SVD的子带形成的一个例子。四个子带,即S,U,V和D的大小为2times;2每个都是从大小4times;4的输入创建的在图3(a)中,输入图像的子带被显示到SVD分解的第二级。请注意,子带以S2,U2,V2,D2,U1,V1和D1的顺序显示。原始图像和SVD分解的第一级和第二级的近似子带(即S子带)在图3(b)中以金字塔的形式可视化,其中S子带在金字塔顶部的第二层。
图2.
图2.(a)使用一个大小为2times;2的例子,从任何输入PL的SVD因式分解中形成的子带(即S,U,V和D子带)使用尺寸为4times;4的示例从任何输入PL的SVD因式分解形成的子带(即,S,U,V和D子带)的示例,S子带包括与信息相关的信息到最大的本地特征值。
图3.
图3.(a)第二级SVD分解的例子,和(b)原始图像被第一级和第二级的S个子带叠加。 该图像来自PolyU-NIR人脸数据库。可以容易地观察到S子频带中的低频信息(即,环境)和U,V和D子频带中的高频信息(即水平,垂直和对角线细节)。在每个分解层次上,图像的分辨率都与金字塔类似。
2.2局部描述符提取
在本小节中,我们介绍了在原始人脸图像上的特定等级上应用SVD之后获得的子带人脸图像上提取局部描述符。 为了说明局部描述符构造在SVD子带中对于NIR人脸检索的重要性,我们提取了局部二值模式(LBP)[15],半结构局部二值模式(SLBP)[24],方向二进制码(DBC) )[8]和局部Gabor二进制模式(LGBP)[25]为基础的局部描述符。
在S,U,V和D子带上计算的LBP描述符分别表示为SVD-S-LBP,SVD-U-LBP,SVD-V-LBP和SVD-D-LBP。算子应用于第Lth(即SL子带)的SVD的S子频带上以形成描述符。SLj的SVD-S-LBP值计算如下:
<p
全文共8081字,剩余内容已隐藏,支付完成后下载完整资料</p
资料编号:[14493],资料为PDF文档或Word文档,PDF文档可免费转换为Word
以上是毕业论文外文翻译,课题毕业论文、任务书、文献综述、开题报告、程序设计、图纸设计等资料可联系客服协助查找。