英语原文共 11 页,剩余内容已隐藏,支付完成后下载完整资料
PCA在姿态不变人脸识别中的应用
Reecha Sharma1bull;MS Patterh1
摘要
本文提出了一种利用PCA进行姿态不变人脸识别的混合方法。在此方法中,将三种算法结合起来,提出一种新的混合方法。第一步是检测面部及其部位。这是由著名的Viola Jones算法完成的。在这一新的使用PCA的新混合方法中,检测到人脸图像的五个部分,分别是脸、左眼、右眼、鼻子和嘴巴。第二步是找到每个部分的局部二进制模式(LBP)。LBP从检测到的人脸及其部件中提取特征。第三步是在每个提取的特征上应用PCA进行识别。从实验结果中可以看出,采用PCA的混合方法可以提高人脸图像的识别率,并具有不同的面部表情和姿态。与传统的PCA相比,PCA 小波、2DPCA, 2DPCA DWT和LBP算法提高了人脸图像的识别率。在不同的表达和姿态条件下,对传统的PCA和混合方法的准确性进行了评价。这些图像取自ORL人脸数据库。
关键词:人脸检测、局部二进制模式、主成分分析、人脸识别。
1介绍
访问控制的身份验证包括基于标记的标识或基于知识的标识。基于令牌方法的人应持有驾驶执照、护照或其他授权的身份证。在基于知识的识别系统中,密码或唯一的代码被使用。这两种身份验证方法都不安全,因为passportor许可证可以被窃取,密码也可以被破解。所以我们需要一些独特和安全的东西。每个个体都有独特的生物学特性。生物测定学与这些可测量的生物学特性有关。这些是DNA,虹膜,指纹,手,声音,手掌几何识别和面部识别。如果单一性状被用于识别,那么它就被称为单模式生物识别。两种或两种以上特征的结合称为多模态生物统计学。在所有这些特征中,面部识别是唯一不涉及到人的特征。所以这些天的脸是吸引力的主要焦点。人脑在不同情况下识别人脸是相当聪明的。但如果我们讨论的是基于计算机的系统,这是一项困难的任务。研究表明,人脸识别有两种类型。一是基于外观,二是基于特征。在人脸识别中,人脸识别方法的整体特征被应用到整个面部或子区域。但在面部识别方法中,嘴巴、嘴唇、眼睛、脸颊都被用作几何面部特征。人脸的验证或识别包括三个主要阶段。(1)人脸检测:基于基于外观的方法或基于特征的方法进行人脸检测。如果是基于外观,则从图像中检测到整个人脸。如果是基于特征的,则会检测到人脸特征。(2)特征提取:提取人脸特征并存储为数据库。(3)人脸识别:在本阶段的训练和测试人脸数据库中,从提取的人脸特征中提取。提出了一种新的姿态不变人脸识别混合方法。(1)人脸检测,(2)人脸特征提取,(3)人脸识别。下一节将详细讨论所有这些阶段。
论文的其余部分组织如下:第2节对相关工作进行简要回顾。第3节给出了一种新的混合方法的方法的细节,使用PCA来保持不变的人脸识别。第4节解释了实验的结果和讨论,并讨论了论文的结论和未来的研究范围。
2相关工作
通过基于几何特征匹配或模板匹配的方法,可以实现人脸识别匹配。与基于特征的匹配[1]相比,模板匹配具有更好的识别率。特征图是基于K-L扩展在模式识别上的最佳坐标系的人脸[2]。正面脸是直立的,所以三维面可以用二维矩阵表示。脸被分解成特征向量或特征面。这些特征面是训练数据集的主要组成部分。将查询图像投影到人脸空间中,并将其与测试图像的识别方法进行比较[3]。比较了特征面和渔面的性能,发现在光和表达的变化中,渔民的脸表现得更好。特征面退化的性能随着主成分的水平的增加而增加[4]。面向人脸识别的通用模块PCA测量了变化对性能的影响。该算法给出了基于pca的人脸识别的计算和性能方面[5]。2DPCA的识别率较高,因为它基于二维图像矩阵。没有必要将二维图像矩阵转化为传统PCA中的一维向量[6]。在模块化的PCA人脸图像中,分割为较小的子人脸图像,并在这些子人脸图像上应用PCA。模块化的PCA在光和表达的变化中提供了改进的人脸识别[7]。对基于组件的技术和基于全局的技术进行了比较。用线性支持向量机(SVM)对基于构件的特征向量进行了分类。在全局技术中,使用了非线性SVM分类器,但在全局技术中使用了更强的分类器(非线性支持向量机),而基于组件的技术优于全局技术[8]。计算和内存需求是简单PCA的限制。增量PCA (IPCA)克服了这些限制。IPCA的主要缺点是不能保证近似误差。该错误被奇异值分解(SVD)更新算法所忽略[9]。局部二进制模式(LBP)是一种灰度不变的纹理方法,在静态图像和视频剪辑中表现和识别人脸的效果非常好[10]。LBP由于其计算简单性[11],分析了实时环境下的图像。利用LBP法提取了形状和纹理信息,并采用最近邻分类器与x平方误差进行识别。可见,LBP方法优于PCA、EBGM和Bayesian个人分类器[12]。采用全局和局部特征提取技术对图像进行识别。LDA和LPP的局部特征提取了全局特征[13]。PCA、LBP和SVM用于面部表情识别。PCA提取全球灰度特征,LBP提取口腔局部特征。面部表情识别是由支持向量机(SVM)[14]完成的。
3提出了采用PCA的新混合方法
采用PCA对训练人脸数据库进行姿态不变人脸识别的新混合方法的流程图如图1所示。第一个输入图像是为准备训练的数据库。应用Viola-Jones算法对人脸及其零件进行检测。根据所提出的采用PCA的新混合方法进行姿态不变人脸识别,检测了5个部分,分别是人脸、左眼、右眼、鼻子和嘴巴。特征提取采用局部二进制模式(LBP)。每个检测部分的LBP使用了3个9个小区。它给出8位代码,基于中心像素周围8个像素。每部分的直方图绘制。然后计算各部分的PCA。这些特征值存储在一个经过训练的人脸数据库中。这里面的数据库是为170张相同大小的图像准备的。这些图像取自ORL人脸数据库。
图1利用PCA对训练人脸数据库进行姿态不变人脸识别的新混合方法流程图
图2显示了使用PCA进行姿态不变人脸识别的新混合方法的完整示意图。本文将测试图像或查询图像与经过训练的人脸数据库图像进行比较。测试图像也遵循与经过训练的face数据库相同的步骤。然后将测试图像或查询图像与使用Euclidian距离的数据库图像进行比较。具有最小欧几里得距离和查询图像的数据库图像是公认的人脸。
图2采用PCA进行姿态不变人脸识别的新混合方法的示意图
在接下来的章节中详细解释了人脸检测算法(Viola-Jones)、局部二进制模式(LBP)和主成分分析(PCA)。
3.人脸及其特征检测
在提出的新混合方法中,利用PCA进行姿态不变人脸识别的第一步就是从图像中检测人脸。该方法的人脸检测是由Viola-Jones算法完成的。通过扫描子窗口,从输入图像中检测到人脸。输入图像被重新扫描到不同的大小和固定大小的检测器运行这些图像。这些探测器由整体图像构成[15]。
viola john人脸探测步骤:
- Viola-Jones面部探测器使用的是特征而不是像素,因为它的特点是对特定领域的知识进行编码,并且比基于像素的系统更快。Haar功能是简单的功能。这些也被称为Haar特性。使用了三种类型的特性。这是两个矩形的特征,三个矩形的特征和四个矩形的特征。
- 整体图像是用于计算矩形特征的图像的中间插画。积分图像的值是通过在两个矩形区域内的像素个数的差值来计算的。位置p,q的积分图像包含了上面的像素和p,q的左边的总和:
(1)
其中ii(p, q)为积分图像,i(p, q)为原始图像。
(2)
(3)
s(p, q) =累积行和,s(p,-1) = 0和ii(-1, q) = 0。
- AdaBoost是一种机器学习算法,用于选择Haar特征和阈值水平。弱分类器表示为:
(4)
其中x = 24 *24的窗口,f = Haar特征,p =极性和o=阈值,决定x是面还是非面。如果x是正的,那么它是面,如果是负的,那么它就不是一张脸。许多弱分类器组合成强分类器。这些被称为级联分类器。图3显示了弱分类器的级联。
图3级联增强了较弱的分类器
提出了一种新的基于PCA的混合方法,采用了中提琴的算法对人脸及其零件进行检测。在本文中,我们检测了输入图像的五个部分。这些是脸,左眼,右眼,嘴巴和鼻子。图4显示了在提出的方法中使用的Viola Jones人脸检测算法的输出。
图4人脸及其特征检测
3.2局部二进制模式
在1996年,Ojiala引入了局部二元模式(LBP)作为一种简洁的局部灰度结构。LBP算子基本被用作纹理描述符。它使用了3*3个区域,基于中心1的8个像素给出8位代码。人脸图像首先被分割成几个小块,由LBP直方图组成,然后拼接成一个特征向量。该特征向量在人脸的有效表示中起着至关重要的作用,并通过计算图像之间的距离来度量相似性[12]。图5显示了基本的LBP操作符。
图5基本LBP算子
标记图像i(p,q)的直方图经过LBP算子标记后,可以定义为:
(5)
在这里u是LBP算子产生的不同标签的数量。
在这提出了一种新的混合方法LBPs和所有检测到的人脸的直方图,并将其存储到一个经过训练的人脸数据库中。图6显示了检测到的部分,LBPs及其直方图。在图6中分别显示了脸的每个部分和它的LBP和直方图。
图6 LBPs及其检测人脸及其各部分的直方图
3.3主成分分析
主成分分析(PCA),也称为Karhunen-Loeve扩展,是一种经典的特征提取和数据表示技术,广泛应用于模式识别和计算机视觉领域。PCA的基本步骤如下:
步骤1 从图像中获取一组像素。
(6)
其中x1, x2hellip;xN是图像的像素值。N是图像中像素的总数。
步骤2计算平均值。
(7)
步骤3 计算协方差矩阵。
(8)
步骤4计算协方差矩阵k的特征向量e和特征值k。
如果K是一个方阵,非零向量e是K的特征向量如果有一个标量(特征值)。
(9)
步骤5按照特征值的降序排列特征向量。
(10)
特征向量具有最高的特征值是图像的主成分。
步骤6 PCA通过保持方向e(lambda;lt;T)来减小尺寸。
4实验结果
本节给出了在ORL人脸数据库中使用PCA进行姿态不变人脸识别的新混合方法的实验结果。ORL人脸数据库包含40个主题的400个图像,10个不同的图像,大小为112 *992。这些图像是在不同时间、不同的光线、不同的面部表情(开/闭的眼睛、微笑/不微笑)和面部细节(眼镜/不戴眼镜)和对某些侧运动的耐受性的不同背景下拍摄的。在这里,欧几里得距离被用作所有测试图像的人脸识别的分类器。这种欧氏距离分类器是人脸识别中最常用的测量相似度的方法。这是一种非常成功的方法。欧几里得距离(d)度量图像的两个向量(X和Y)之间的距离。这计算为:
(11)
其中X和Y分别是查询和数据库图像的特征向量,n为特征数,i = 1, 2, 3hellip;n 。
采用PCA进行姿态不变人脸识别的新混合方法使用了170幅图像,分别为34个个体,5个不同于ORL人脸数据库64 964的图像,准备了170幅图像的训练人脸库。有100个测试图像。训练图像与测试图像不一样。170幅图像的训练是在411.358秒内完成的。表1显示了采用PCA方法进行姿态不变人脸识别的新混合方法的训练时间、执行时间和测试时间的比较。简单的PCA的训练时间与提出的混合方法相比较少,因为在混合方法中,它的子部件检测是跟随LBP的。但是在简单的PCA中,面部的部分没有分裂。采用PCA进行姿态不变人脸识别的混合方法获得了98.156 %的识别率。简单的PCA只有88%的识别率。
表1采用PCA进行姿态不变人脸识别和简单PCA的混合方法的结果比较
表2利用现有的ORL数据库方法,对采用PCA进行姿态不变人脸识别的新混合方法的平均百分比进行了比较。
表2显示的平均百分比的比较提出了新的混合方法使用PCA姿势不变的ORL人脸识别与现有技术的数据库。从表2可以看出,提出了新的混合方法使用PCA执行对ORL数据库优于主成分分析, PCA, wavelet PCA, 2DPCA,2DPCA DWT 和LBP 等方法。
5结论和未来的展望
利用PCA进行姿态不变人脸识别的一种新的混合方法是三种技术的结合。,面部检测,LBP和PCA。ORL人脸数据库用于测试姿态不变人脸识别。实验在MATLAB上进行。提出了一种基于PCA的姿态不变人脸识别的混合方法,其识别率为98.156 %。在这一研究中,我们发现PCA对姿态不变人脸识别的混合方法得到了很好的识别,它优于简单的PCA和其他现有的 wavelet PCA, 2DPCA, 2DPCA DWT和LBP方法。因此,通过组合方法获得的PCA特征集的混合方法似乎是许多人脸图像应用的一个很有吸引力的选择。这项工作可以扩展到其他参数,如照明,年龄或部分遮挡。
我谨向我的导游M博士表示我最大的感激。在概念开始的早期阶段,他从最初的建议和接触中不断地支持这篇论文,并通过不断的建议
全文共8742字,剩余内容已隐藏,支付完成后下载完整资料
资料编号:[14678],资料为PDF文档或Word文档,PDF文档可免费转换为Word
以上是毕业论文外文翻译,课题毕业论文、任务书、文献综述、开题报告、程序设计、图纸设计等资料可联系客服协助查找。