基于判别分析的复合特征人脸识别外文翻译资料

 2022-02-07 22:17:33

英语原文共 8 页,剩余内容已隐藏,支付完成后下载完整资料


基于判别分析的复合特征人脸识别

SANG-IL CHOI 1,(IEEE会员),SUNG-SIN LEE2,SANG TAE CHOI3,WON-YONG SHIN1(IEEE高级会员)

1台湾大学计算机科学与工程系,韩国龙仁16890

2台湾大学数据科学系,韩国龙仁16890

3中央大学内科,首尔06984,韩国

通讯作者:Sang Tae Choi(beconst@cau.ac.kr)和Won-Yong Shin(wyshin@dankook.ac.kr)

这项工作在2016年得到了丹东大学研究基金的部分支持,部分由韩国政府国家研究基金会通过韩国政府(MSIT)资助2018R1A2B6001400,部分由能源技术人力资源计划 韩国能源技术评估与规划研究所

贸易,工业和能源,韩国,格兰特20174030201740。

摘 要

从整个人脸中提取整体特征和从子图像提取人脸局部特征基于不同情况各有优劣。为了有效地利用各种类型的整体特征和局部特种的优点,同时弥补各个缺陷,我们提出了一种基于判别分析的人脸识别复合特征向量的构造方法。首先,我们利用判别特征提取方法,从人脸图像和各种局部图像中提取出整体特征和局部特征。然后,我们测量个体整体特征和局部特征中的判别信息量,并构造仅具有判别特征的复合特征用于人脸识别。通过对各种人脸图像数据库的人脸识别实验,我们将所提出的方法的综合特征与整体特征、局部特征以及其他混合方法进行了比较。结果发现我们所提出的复合特征向量比其他方法具有更好的性能。

关键词:综合特征;判别分析;人脸识别;特征选择;整体特征;局部特征

1.引言

近年来,随着计算机硬件技术的发展和软件应用的扩展,各种领域的科学技术应运而生。尤其是新兴智能移动设备的发展传播促进了各种智能图像处理技术的发展和普及,并引起了公众的关注和兴趣。在这些技术中,人脸识别技术是最常用的,它可以应用于包括电视节目、游戏娱乐、访问控制、安全防护和监控等各个领域。 [1]–[8]

目前人们已经开发出许多人脸识别算法。基于从特定图像中提取的关键信息的不同,这些算法可分为基于整体特征的方法[9]–[12]、基于局部特征的方法 [13]–[15]和混合方法 [16]–[20]。部分方法使用整体特征,例如特征脸方法[10],、零空间线性判别分析方法(LDA)[11]、特征规则化提取法(ERE) [12]以及基于离散余弦整体特征转换 (D-DCT) [21]的判别方法使用各种线性变换从面部的整体图像中提取必要的特征。在[22]中,将多视点学习编码和低秩学习编码应用于人脸识别。近年来,随着深度学习研究的深入开展,引入了深度神经网络的人脸识别方法[23]–[25]。整体特征具有保留纹理或形状信息的优点,这对于区分面部是十分有用的。许多已提出的基于整体特征的方法对于在有限的环境中获得的归一化的面部图像(如[1 ],[10 ],[11 ]实验室内部结果)表现得十分出色。然而,由于面部的变化,如图像照片的磨损、发型的变化、表情的变化以及不受控制的环境(包括相机拍摄姿势角度或光线的变化),整个面部图像的较大改变显著降低了识别率[1], [4], [15], [26], [27]。

从面部的子图像中提取局部特征的方法与基于整体特征的方法相比,具有对许多变化不那么敏感的优点。尽管不能使用关于整个面部轮廓的信息。也就是说,虽然同一个人脸的不同图像可以在图像周围显示不同的像素,但是没有图像的子图像就没有这样的效果。基于局部特征的方法比基于整体特征的方法更不易受到这种变化的影响。然而,这些方法的识别性能跟随脸部图像质量不同会有明显波动。在[16 ]的方法中,使用基于眼睛、鼻子和嘴巴等面部元素的图像作为基于心理物理实验得到的结果的子图像表明,显著的面部成分将包含更多的描述性信息。在[15 ]中,提出了一种基于判别分析的方法,通过定量测量构成人脸图像的单个像素的判别信息的量来选择用于人脸识别的像素。

人们还提出了一种利用人脸整体图像及其子图像的混合方法。[16]和[19]中的方法使用从面部的整体图像中提取的整体特征和从子图像中提取的局部特征,如眼睛、鼻子或嘴的特征,以及与整个面部的图像等分的子图像。在[18 ]中,将DCT变换应用于整个图像及其子图像,以分别提取整体特征和局部特征。然后将提取的特征连接起来,同时,改进后的LDA(I-LDA)[28 ]也得到应用。在[19], [20]和[29]中,采用主成分分析(PCA)[13] 和Gabor微波核心来提取整体特征和局部特征。随后,采用自适应神经模糊推理系统(ANFIS)[30]和支持向量机(SVM)[31]作为算法来提取所提取的特征。

本文提出了一种利用各种特征的有利条件来构造人脸识别的复合特征向量的方法。没有任何特征提取方法总是优于其他特征提取方法的。各种类型的整体和局部特征在识别人脸方面有其自身的优势,但同时,它们也可能根据变化或噪声的类型而表现出不同的缺点,这使得人脸识别变得困难。例如,一些特征对环境照明变化没有太大的反应,但易受遮挡变化的影响,而另一些特征则表现出相反的特征。我们评估个体整体或局部特征的辨别力,而不是使用现有的整体或局部特征提取方法,这是由于具有不同性质的这些特征可以是互补的。然后,我们只选择具有高鉴别能力的特征,构造可用于人脸识别的最优复合特征。这些复合特征利用各种特征的优势方面,同时补偿它们的弱点,从而为多种类型的变化提供更精准的识别性能。在本文所所提出的方法中,由于整体和局部特征的提取是并行执行的,除了用于评估单个特征的模块之外,没有额外的操作,因此这是同时进行的。此外,该方法可以用于有效地结合新开发的特征提取方法,如深度学习与现有方法的相结合。我们已经报道了从最近的研究中获得的复合特征的构建的结果[ 32 ]。在这里,我们进一步改善这些结果,提供更详细的分析与广泛的讨论,并在各种各样的条件下不断实验,得出结果。

为了提取用于人脸识别的整体特征,我们根据两个眼睛的坐标来均匀地划分人脸图像,并从分割图像[19]创建的子图像或由特征选择方法[15], [33]所制作的子图像中提取局部特征。用于构建基本特征集的整体和局部特征是通过采用空间LDA方法[11]提取的,并且是在判别性特征提取方法中选择的,因为空间LDA和判别特征提取方法有利地具有高维度数据,比如图像。通过使用基于判别分析的输入特征选择方法来评估基本特征集合中每个特征的类别判别力量[33]。然后通过基于该评估选择最佳特征来构建面部识别的复合特征。

对于确定人脸识别性能的实验,将所提出的方法应用于FERET数据库[34],CMU-PIE数据库[35],耶鲁B数据库[36]和AR数据库[37],所有这些方法都有 在以前的研究中经常被用作人脸识别的参考数据。从实验中,我们发现所提出的该方法在其他混合方法的面部识别,以及仅采用整体或局部特征的情况下是十分优越的。

本文总体由以下部分组成。在第2节中,不仅描述了用于构建脸部整体和子图像的方法,还描述了用于从构造的整体和子图像中提取整体和局部特征的方法。第3节说明了从每个特征的权力的阶级判别度量来构造复合特征向量,以选择为面部识别提取的整体和局部特征中的最终特征。该方法对于各种人脸图像数据库的人脸识别性能将在第4节中介绍。第5节总结本文。

整体和局部特征的提取

2.1整个脸部图像和子图像的构建

人脸对齐步骤将图像中不同大小的人脸区域种植到相同大小,是影响人脸识别系统最终识别性能的一个重要因素[26]。本文对人脸图像进行旋转,使两个眼睛在水平坐标上进行坐标变换,并对图像进行重新缩放,以保持所有人脸图像中眼睛之间的距离不变。

图1 (a) xH , (b) xIVS [15], (c) xFSDD [33], (d) xENM [16], and(e) xSEG

为了避免图像的发型和背景对人脸识别性能的影响,将图像裁剪成几乎相等的尺寸[4 ](图1)。局部特征对人脸识别的性能具有不同的特征,这取决于如何构建子图像。四类子

本文采用图像,如图1所示。

xH xSEG是通过分割人脸图像的局部区域构建的子图像。在心理物理学领域的研究[38 ],特别是深入研究人类如何识别人脸的过程,以及生物信息学[16],[39]的研究,也检查人脸识别,通常报告相关信息集中。在眼睛、鼻子和嘴巴等显著成分上。基于从这些研究中获得的结果, xENM导致由眼睛、鼻子和嘴域组成的子图像。通过对人脸区域进行区域划分,可以提取特征,以减轻由于光照等因素引起的人脸图像畸变对人脸识别性能的影响。xSEG是从人脸的域分成四个子域的子图像,从中提取局部特征[19]。

同时也可以选择面部图像的一些像素来创建子图像。考虑到人脸识别问题是图像数据的一个分类问题,特征空间中同一个人图像中的方差小且与其他人的图像有较大差异的像素适合于数据分类。xFSDD xIVS是构造的子图像。

通过基于这些判别分析选择用于人脸识别的像素。xFSDD是用较大的判别距离[33]的像素构造的子图像,它代表单个像素的类辨别能力,而xIVS是基于线性判别式的大小的具有更多判别信息的像素构造的子图像。特征向量的元素[15]。在本文中,采用NLDA(零空间LDA)特征向量构造xIVS。选择整个人脸图像的像素总数的大约50%来制作xFSDDxIVS。将FRET数据库中包含的200个主题的各自的两个人脸图像(FA,FB)用作训练图像,以获得判别距离和NLDA特征向量。

2.2脸部识别的特征提取

用于人脸识别的被称为“Fisherface”的LDA和特别用于诸如图像数据和ERE方法的处理高维数据的NLDA方法是经常用于人脸识别中特征提取的代表性方法。NLDA方法用于从脸部的全部和子图像中提取整体和局部特征。假设训练集由N个样本和C个类组成,则类间(SB)和类内(SW)协方差矩阵在下面的等式中定义[10]。

mu;i和mu;表示属于类别ci的样本的平均值和所有样本的总平均值。对于LDA的情况,用作特征空间基础的投影向量是SWminus;1SB的特征向量[40]。这意味着LDA构造特征空间的基之间的协方差在SW (W T SW W 0)的范围空间中,各类将被最大化并且类内的协方差将被最小化。然而,关于判别信息,SW的零空间(即,通过同时满足条件W T SW W 0使W T SBW的值最大化的空间)将具有比最大化空间更多的区分信息同时满足标准W T SW W 0的W T SBW的值。因此,NLDA将样本投影到SW的零空间上,通过使用方程(2)中表达的目标函数将样本集中在一个点上,然后尝试搜索由最大化方差的投影向量组成的子空间SB [11]。

3.基于信息量度的复合特征向量的构造

在NLDA特征空间中,图像样本被表示为NLDA特征向量y=W T x

图2使用复合特征向量进行人脸识别的整个过程。

测量各个特征的功率信息以评估面部识别的基本特征的有用性。 然后,基于测量结果,采用具有更多辨别力的复合特征来创建复合特征向量。 每个基本特征的判别力用判别距离来衡量[33]。

这里,Ymacr; i和macr;j 分别表示属于类ciYPool 的均值的第j个分量和训练集中的所有 YPool 的均值的第j个分量。将第j个基本特征的差异距离定义为Dj beta;Dj ,用作表示判别性信息量的尺度[33]。 beta;是从样本分布中确定的用户参数。 表示Dj 惩罚的较小的beta;值在类内方差将被扩大的情况下将是有利的,但分布将允许相对有利的类别歧视。 通过研

全文共16347字,剩余内容已隐藏,支付完成后下载完整资料


资料编号:[17363],资料为PDF文档或Word文档,PDF文档可免费转换为Word

原文和译文剩余内容已隐藏,您需要先支付 30元 才能查看原文和译文全部内容!立即支付

以上是毕业论文外文翻译,课题毕业论文、任务书、文献综述、开题报告、程序设计、图纸设计等资料可联系客服协助查找。