英语原文共 13 页,剩余内容已隐藏,支付完成后下载完整资料
PCA与2DPCA在人脸识别中的应用与比较研究
天津商业大学信息工程学院,天津300134
*通讯作者
关键词:人脸识别,数据降维,主成分分析,2DPCA
摘要:人脸识别技术是模式识别领域的研究热点之一,而这也是在模式识别领域的难点之一。本文主要研究了主成分分析(PCA)算法及其在人脸识别技术中的应用。首先,讨论了传统的1DPCA算法。然后,在上述1DPCA算法的基础上,提出了改进的2DPCA算法。仿真结果表明,2DPCA方法避免了图像阵列向一维矢量的变换,优于传统的PCA方法。本文设计的基于1DPCA和2DPCA的可编程程序具有较高的识别率,在理论上具有重要的影响和应用价值。
简介
随着社会、科学技术的发展,特别是计算机软硬件性能的快速提高,实现自动认证的需求是越来越迫切的。各种各样的生物识别技术都在科学技术研究开发当中。其中人脸识别具有广阔的应用前景。
目前,许多国家都开展了人脸识别的研究,主要集中在欧洲、美国、日本等国家。著名的研究院有麻省理工学院的媒体实验室[1]、人工智能实验室[2]、卡内基梅隆大学的人机界面研究所[3]、微软研究院[4]、剑桥大学[5]等。
很多大学在这一领域取得了很大进展,并且他们的研究涉及领域很广泛。德克萨斯大学达拉斯分校,Abdi和Toole [6]小组,从感知和心理学的角度探讨人类对人脸机制的认识,主要研究了人类对人脸的认知规律;哈佛大学Smith-Kettlewell研究中心的Yuille [7]使用弹性模板来提取眼睛和嘴巴的轮廓,Zhang [8]和Huang [9]进一步提出使用活动的轮廓来提取眉毛,下巴和鼻孔以及其他等不确定的形状; 荷兰格罗宁根大学的Petkov[10]研究小组研究了人类视觉系统的神经生理机制,并在此基础上开发了一种平行模式识别方法。越来越多的学者致力于利用输入图像进行计算机人脸识别的研究工作。
国内关于人脸自动识别的研究始于20世纪80年代,中国科技大学的杨光正等人提出了一种基于马赛克的人脸自动识别方法,通过三棱锥结构人脸知识,基本定位人脸。前两个阶段是基于不同分辨率的马赛克导图,第三个阶段使用改进的边缘检测方法进一步检测眼睛和嘴巴。清华大学的彭辉[12]对其他特征面方法做了进一步的研究,提出了利用类间扩展矩阵作为矩阵。进一步减小了矩阵的维数,在保持识别率的同时大大减少了计算量。
将每幅图像在特征面空间上的投影作为其代数特征,然后用层次判别法进行分类。主要研究领域涉及计算机视觉、模式识别、机器学习,特别是人脸识别和多模式人机交互技术。他们关注的核心技术包括:实时准确的人脸检测与跟踪,快速准确的人脸特征定位,准确快速的人脸识别或确认方法。
利用动态和颜色信息对动态图像序列进行人脸识别的方法。本文主要研究基于K-L变换的特征方法,也称为主成分分析(PCA)。并针对表情和姿态的变化,对识别和识别率进行计算。
PCA人脸识别方法
PCA是应用最广泛的特征提取方法之一,其基本思想是提取空间数据的主要特征(也称为主元素)。减少数据冗余,使数据在处理低维特征空间的同时,保持了原始数据的绝大部分。有效解决了空间维度过大的瓶颈问题。
PCA人脸识别原理
PCA算法人脸识别的基本过程包括:训练系统样本和测试样本集,训练样本特征值和特征向量计算,特征脸矢量的计算,测试样本投影到特征脸空间的计算,并分类识别。整个过程将在下面详细描述。
(1)导入系统训练样本集和测试样本集
在对人脸数据库进行规范化后,库中的每个人都会选择一定数量的图像组成训练集,其余的则构成测试集。归一化后的图像为Ntimes;N,相互连接形成一个N2维矢量,可以看作N2维空间中的一个点。该图像可以用低维子空间的K-L变换来描述。
(2)训练样本特征值和特征向量的计算
可以确定的从上面导入图像数据,样本维数为n,总共分为L类,N1,N2,···,Nf分别表示每个类别的训练样本个数,N为训练样本总数。C类训练样本集表示为Xc=,当的时候,Nc表示C类训练样本的数量。Nc是C类训练样本的数量。所有训练样本集均由X={X1,X2,···,Xf}表示。所有训练图像的平均脸定义为
(1)
此时,协方差矩阵定义为
(2)
其中,v为训练样本的归一化向量。由矩阵Q的特征值和特征向量,取m个较大的特征值和对应的特征向量,即Wi(i=1,2,···,m) ,从而在mlt;n的条件下,形成特征面空间WRN*m,即W=[W1,W2,···,W3]。
(3)分类和识别
K-L变换的本质是建立一个新的坐标系,将一个物体主轴沿特征矢量对齐的旋转变化,这种变换消除了原始数据向量的各分量之间的相关性,从而有可能的去掉了那些带有较少信息的坐标系,从而达到降低特征空间维数的目的。
2DPCA人脸识别
训练图像。设图像大小为m*n,令投影矩阵Xisin;R,其中每一列为正交向量,并且ngt;=d。将图像矩阵A投影到X上将得到Y=AX的矩阵m*d。定义Y的协方差矩阵Sx的轨迹是发散的。
J(X)=tr(Sx) (3)
为了使该标准最大化,我们找到最佳投影方向X,使得投影后的矢量Y最开放。 其中,
(4)
所以
(5)
由于图像协方差(散度)矩阵Gt的定义可以看出它是一个非负n*n-维矩阵。假设有M个训练图像,J图像记为Aj,所有训练图像的均值记为。
(6)
准则改变为J(X)=XTGTX,将上面的公式X最大化称为最优投影轴。最优投影轴是对应于Gt最大特征值的特征向量。通常最优投影轴是不充分的,因此选择相应的特征值以正交d正交单位向量的最大值作为最优投影轴
(7)
分类方法。使用最近邻分类。 任意两幅图像的特征矩阵B1= 和之间的距离定义为
, (8)
给定测试样本B,如果d(B,Bj)=min(B,Bj),并且 ,分类结果是。
主分量向量是Yk=AKk。顺序v=[Y1,···,Yd],U=[X1,···,Xd],所以v=AU。因为X1,···,Xd是正交的,所以图像A的重建图像是:
(9)
阶数,其大小与图像A一致,称为图像A的重建子图。当d=n时,完全重建;当时dlt;n时,它被近似重建。
基于PCA的人脸识别基于以下事实:所有人脸都在低维线性空间中,并且在这样的空间中不同的人脸是可分离的。
实验程序
本文利用MATLAB语言设计了基于PCA算法的人脸识别系统。 基本过程包括训练系统训练样本集和测试样本集,训练样本的特征值和特征向量的计算,计算特征脸矢量,计算测试样本投影到特征脸空间的坐标系数以及分类识别。 具体步骤将在下面详细描述。
人脸图像的预处理
图像的归一化可分为图像的归一化和图像的几何归一化。这种方法是将输入图像的直方图转换成特定的直方图,使图像的灰度分布尽可能覆盖所有的灰度级。消除了灰度的绝对优势或绝对劣势,从而部分消除了光线对灰度图像的影响。
对于数字图像,将灰度级数设置为灰度级,k级的出现频率可以表示为
(10)
Nk为灰度k的像素数,N为图像的总像素数
(11)
图像的几何归一化是指在每张人脸图像中,人脸的关键部分在图像中的对应位置是否相同。分别可以达到使面部保持正面,消除左右面部识别后的滞后影响。使眼睛保持水平位置,使人脸图像在平面尺度上保持不变的效果。
训练和识别
PCA的人脸识别过程包括训练阶段和识别阶段。在训练阶段,将每个已知的人脸映射到具有特征人脸组成的子空间和m维向量
(12)
其中N是已知的数。
距离阈值是
(13)
其中。在识别阶段,首先将待识别的图像R映射到特征空间。Omega;与每个人脸组之间的距离定义为
(14)
为了区分人脸和非人脸,还需要利用特征空间计算出原始图像R与其重建图像Rf之间的距离ε。
(15)
仿真结果与数据分析
通过之前的理论分析,采用PCA和2DPCA联合实验方案,分别使用灰度图像和彩色图像。
灰色人脸图像人脸识别仿真
该实验使用英国剑桥Olivetti研究所的ORL(Olivetti研究实验室)人脸数据库,该数据库是灰色图像集。 该数据库由40个不同的人组成,每个人有10个图像,总共400个。 每张原始图像为256级灰度,分辨率为112times;92。ORL人脸图像在拍摄条件下有不同的视角、不同的时间、不同的表情(微笑、闭上眼睛、睁开眼睛、生气、高兴、惊讶等)和不同的面部细节(胡须和无胡须、戴眼镜和不戴眼镜、不同的发型等)。 本实验仅从人脸数据库中选取10个人,每人3张图片。他们中的每一个选择了两个图像,总共20个,由训练样本集组成,图1所示的是这组图像的一部分。其他10个图像组成了测试样本集,图2为所示的部分人脸图像。
图1 ORL训练样本的子集
图2 ORL测试样本的子集
将图像数据导入系统时,每个类的训练样本数为2,测试样本可以从1到10随机分配。实验结果如图3所示,图(a)是选定的测试图像 ,图(b)是匹配操作的结果。
(a)测试图像 (b)效果图像
图3 实验结果
2DPCA实验仿真
在本实验中,还利用ORL人脸数据库研究了主成分维数(RDIM)和训练样本数(M)对2DPCA算法识别的影响。
选择40个人的ORL人脸数据库,每个测试选择m个图像作为训练集,为训练集的总容量。 在本实验中,设定m的值为4,5,6,7,8,然后训练集的总容量为160,200,240,280,320。然后将每个人的剩余(10-m)图像用作测试,并且测试集的总容量是(10-m)6,5,4,3,2,试验组的总容量分别为240,200,160,120,80。 同时,rdim值分别为10,12,14,16,18,20。 结果如表1所示。
表1 2DPCA训练结果
根据上表的统计数据,我们可以看出,在m的情况下,随着rdim的增加,2DPCA的训练时间和正确率没有明显变化,并且存在改变测试时间的趋势。 在rdim的情况下,随着m的增加,2DPCA的测试时间没有明显的变化规律,训练时间增加,正确率增加。这是因为随着m增加,测试数据减少,并且训练图像增加,因此训练时间变长。可以看出,影响2DPCA识别率的参数主要是训练样本的数量(m),主成分的维度(rdim)对2DPCA算法的总体耗时有很大影响。
仿真结果分析
根据以上结果,本文主要探讨主成分维数(rdim)对两种算法的影响。在本实验中,仍选取ORL人脸数据库中的40个个体,每个人6张图像作为训练集,4张图像作为测试用。主分量的维数选择为25、30、35、40、45、50、55,取值较大。操作结果如表2所示。
表2 1DPCA与2DPCA实验结果比较
从表3中的结果可以看出,当rdim值相同时,2DPCA的正确速率出现在1 DPCA以下。 在m不变的情况下,随着rdim的增加,1DPCA的正确率几乎恒定,但2DPCA的正确率先上升然后下降。 而2DPCA的训练时间和测试时间也明显长于1DPCA使用的时间。 通过分析,我们知道这是因为2DPCA比传统的PCA识别方法需要更多的系数来描述原始图像。 因此,系数的存储容量大于PCA方法的存储容量,这直接影响算法的计算时间。
实验表明,虽然在大多数情况下,两组实验都可以通过已知的测试图像识别出正确对应的训练图像,但总体上,灰度图像的识别率仍然略高于彩色图像。这是由于使用灰色图像识别时,在一定限度内排除了背景因素的影响,尤其是肤色背景,这是比较容易处理的。因此,可以看出,在PCA人脸识别中推荐使用基于灰度的图像处理。
总结
基于以上实验,我们得出结论,使用2DPCA人脸识别方
全文共6478字,剩余内容已隐藏,支付完成后下载完整资料
资料编号:[417]
以上是毕业论文外文翻译,课题毕业论文、任务书、文献综述、开题报告、程序设计、图纸设计等资料可联系客服协助查找。