英语原文共 11 页,剩余内容已隐藏,支付完成后下载完整资料
基于CNN和LBP特征的人脸识别系统,用于分类器优化和融合
摘要
人脸识别是模式识别领域的一个热点,特征提取和分类在模式识别中起着重要的作用。然而,卷积神经网络(convolutional neural network, CNN)和局部二值模式(local binary pattern, LBP)只能提取人脸图像的单一特征,无法选择最优的分类器。针对分类器参数优化问题,提出了两种基于人工蜂群算法优化的支持向量机(SVM)结构,分别对CNN和LBP特征进行分类。为了解决单特征问题,提出了一种基于CNN和LBP特征的融合系统。人脸特征可以通过提取和融合人脸图像的全局和局部信息来表示。我们通过融合特征分类器的输出来达到这个目的。在Olivetti研究实验室(ORL)和人脸识别技术(FERET)数据库上的显式实验结果表明了该方法的优越性。关键词CNN特征,LBP特征,分类器优化,融合系统,人脸识别
1介绍
近年来,人脸识别已经成为人们日常生活中多个领域的热门话题,在识别、访问控制、普适计算等领域有着广泛的应用[]。与指纹、掌纹等生物识别系统相比,人脸识别更容易采集。 然而,人脸识别还需要解决很多问题,例如:表情变化、噪音、姿势[2]和光照。因此,学习特征在人脸识别中起着非常重要的作用。CNN和LBP已经被应用到face识别与分类[3-4]。这种算法取得了优异的性能。然而,单一的人脸特征很难完全表达人脸信息。近年来,基于深度学习的特征学习方法在人脸识别中的应用越来越受到重视。最典型的算法之一就是CNN。CNN是LeCun等人提出的一种处理全球图像的全局方法,它可以直接从原始图像中学习特征,避免了复杂的特征提取过程。CNN已成功应用于人脸识别、手写体数字识别、车牌识别和语音识别等领域[6-7]。LBP是为了提取不同的局部特征进行图像识别而设计的,在人脸分析、纹理分类、场景分类等[8-9]。然而,这些方法仍然存在一些问题。CNN的结构是一个在全连通laver和输出层之间的线性分类器。例如,很难达到良好的分类效果。对于LBP特征,还需要一个更好的分类器.
支持向量机是powerul深度学习领域的分类工具之一,取得了很好的效果,Boser等人提出了最优边缘分类器[10]的训练算法。Platt等人提出了序列最小优化(sequential minimum optimization, SMO)的分解算法,并提出了一种kemel优化方法来提高SMO的性能。切尔卡斯基等人总结了基于支持向量机[11]参数设置经验。但是,根据经验选择的参数可能不是最优的。群体智能优化算法是一种优秀的参数优化方法,已成功地应用于SVM参数的优化。Raj等人使用粒子群优化(PSO)算法对SVM参数进行优化,获得了满意的效果[12]。然而,大多数优化算法容易陷入局部最优。美国广播公司提出了Dervis Karaboga等人的 《新群体智慧》优化算法。ABC在很大程度上可以避免陷入局部最优位置。并成功地应用于[3]的许多领域。
一方面,图像的不同特征提取是图像表征的关键。对于以上提到的方式,仅仅用一种方式来表达面部特征是不够的。另一方面,在上述方法中忽略了分类器参数的选择,因此选择支持向量机的最优参数也具有重要意义。
1.1原因
在人脸识别应用中,采用深度学习方法和传统的波形提取人脸特征,提高了识别的准确性。虽然上述方法已成功地应用于人脸识别领域,但仍有很大的发展空间。以下两个方面还没有得到全面的考虑:
1)如何为深度学习方法和传统的特征提取方法选择合适的分类器。上述方法如CNN和LBP是很好的特征提取器,而不是有效的分类器。即使在分类器的选择上,现有的算法也没有考虑最优参数的原则。
2)如何充分利用图像的全局和局部特征。结合深度学习方法和传统方法,可以获得更完整的面部信息表达。现有的一些方法对具有不同特征的人脸进行局部特征[14]处理,而其他方法对人脸信息进行全局[15]处理。这两种方法不能全面地捕捉人脸的特征。
1.2贡献
针对上述问题,采用最优分类器原理,防止分类器参数陷入局部最优[12]。该方法将人脸局部信息和局部信息融合起来,而不是提取单一的人脸信息[16]。提出了两种特征提取分支后采用最优分类器的结构。设计了一个融合系统来提取局部特征和局部特征。主要贡献总结如下:
1)提出了两种结构。其中一种方法是用ABC算法优化的sVM代替CNN在全连通层和输出laver之间的线性分类器。采用ABC算法对支持向量机径向基函数(RBF)核函数的参数进行优化。该算法避免了参数陷入局部最优,同时采用了基于bp的人脸特征识别算法作为最优分类器。
2)将深度学习方法CNN与传统的LBP相结合,设计融合系统。利用CNN提取全局人脸特征,利用LBP获取局部人脸信息,利用ABC-VMs对获取的人脸信息进行分类分别具有全局和局部特征。然后根据最大后验概率原理对输出进行融合。
1.3结构
论文的其余部分组织如下。第2节,简要介绍了相关工作。在第3节中,具体描述了两种结构和一个融合系统,包括分类器参数的优化过程和融合方法。实验结果见第4节。最后,得出的结论在第5节。
2相关工作
2.1cnn
CNN是由发现的生物学特征提出的哺乳动物大脑视觉皮层的一种特殊设计 识别二维图像[17]。两个稀疏连接的结构特征与权重共享使其广泛应用于图像领域 识别和分类。传统结构如图1所示,其主要包括三种层:卷积层,采样层和完全连接层。卷积层的输出特征映射为具体如下:
(1)
其中 和是第j个和第i个输出特性l层和l-1层图,是第i个特征映射和第j个特征映射,“*”表示卷积计算,是l层第j特征图的偏差矩阵N为l-1层的要素图编号,f为激活功能。
采样层的输出特征图如下:
(2)
其中D是下采样函数,第1层第j个要素图的参数。
设由m个类组成的输出单元为Y=〔y1,y2,hellip;,yi,hellip;,ym〕。满输出连接层如下:
(3)
其中N是图层上的要素地图数在输出层之前,M是每个特征映射,a是权重,bi是偏差 第i层。
图1 CNN的传统结构
2.2 LBP
LBP是一种传统的描述图像局部纹理特征的算子,具有旋转不变性和灰度列维尔不变性等显著优点。原始的LBP操作符被定义为一个3 * 3的窗口。通过比较中心像素与相邻8个像素的灰度值,总结出图像的局部特征。原始图像通常分为几个块,每个块的信息分别提取。
在最初的LBP被提出之后[18],研究者们不断地在人脸识别中得到各种各样的改进。其中一个改进是采用均匀模式来减少LBP模式的维数。设P为邻域集合中的采样点,通过改进,模式数从变为P(P-1) 2。
2.3 SVM
支持向量机是一种有监督的深度学习算法,可以解决分类和回归问题[19]。它最初是一个二元模型。后来发展成分类器,在特征空间中找到最优分割超平面。
设一组线性可分训练数据为D={(,),(,),hellip;,(,)},xkisin;R,ykisin; { 1,-1},yk表示样本被分成两类。这个问题可以转化为凸二次规划(QP):
(4)
其中w是权向量,b是偏差。通过求解式(4),可以得到一个全局最优解。
然而,在实践中,训练数据并不是线性可分的。提出了拉格朗日对偶问题,SMO算法解决了这一问题。同时,核函数可以在特征空间中构造一个分类超平面,不需要进行所有的向量计算。核函数表示为:
(5)
其中phi;(x)是x的映射,phi;phi;(z)替换内积的计算。
将SVM模型优化的目标函数赋值为:
(6)
式中,and;=(lambda;1,lambda;2,hellip;,lambda;M)T是拉格朗日乘子。
在存在噪声的情况下,通过松弛变量提高模型的泛化能力。结合松弛变量对偶问题,目标函数可改写为:
(7)
其中C表示一个惩罚因子,用来控制分类间隔和训练错误之间的平衡。
2.4ABC算法
Karaboga等人提出的ABC算法是一种模拟蜜蜂自然觅食行为寻找最优解的智能优化算法[20]。ABC算法的优点是不需要设置太多的参数,不容易陷入局部最优。
ABC算法由三个基本部分组成:食物来源、有工作的觅食者和失业的觅食者,以及三种行为模式:寻找食物来源、寻找食物来源和放弃食物来源。蜜蜂分为三种:工蜂、觅食蜂和搜索蜂。
让随机搜索食物来源如下:
(8)
其中是第j个维度,第i个可行维度解,phi;表示从0到1的随机数。
在当前位置附近搜索新位置如下:
(9)
k和j是随机产生的,且不相同, r是0到1之间的随机数。
以下觅食者根据概率选择食物来源:
其中Ns是可行解的个数,Ti(Ti,Tmisin;T)表示适应度函数。
3建议及方法
3.1基于CNN和LBP的两种结构特征
在介绍这两种结构之前,首先确定了两种识别结构的最优分类器。ABC-SVM不容易陷入局部最优[21]。支持向量机模型的目标函数如式(7)所示,大量的经验证明了RBF核函数具有良好的分类性能。我们选择RBF作为SVM的核函数,它可以表示为:
其中gamma;gt;0是RBF核函数的一个参数。
支持向量机模型的泛化性能取决于C和gamma;的选择,在一定程度上两个参数[22]之间也存在一定的交互作用。利用获得目标函数的交叉验证(cross validation, CV)方法对SVM模型的性能进行评价,SVM模型的均方误差可表示为:
是判别函数,lambda;是拉格朗日乘子,G(C, gamma;)是C和gamma;的函数。
我们使用ABC算法来优化C和gamma;,食物来源,雇佣的觅食者和失业的觅食者被设置为相同的数字N。对ABO算法的步骤进行优化SVM的阐述如下:
步骤1算法初始化:初始化食物源数量、最大迭代次数和最大限制次数,通过式(8)随机初始化食物源。
步骤2雇佣的觅食者寻找新的地点通过公式(9)接近当前位置,并选择 基于贪婪准则的式(12)的最优值。
步骤3 失业的觅食者选择就业按式(10)取料,重复步骤2中雇佣的觅食者的行为。
步骤4记录步骤2、3的最优值和参数值。
步骤5如果搜索时间大于最大限制时间,则通过公式(8)更新搜索位置。
步骤6如果没有达到最大迭代次数,则转到步骤2,否则算法结束,输出最优值和最优参数值。
当输入图像时,利用图1的结构获取图像特征。但是,使用ABC-SVM代替CNN结构的线性分类器,可以更好地处理非线性数据。提出的基于CNN特征的结构如图2所示:
图2基于CNN特征的结构
另一种传统的图像特征提取方法是LBP。它具有旋转不变性和灰度不变性的优点。LBP用于提取图像的纹理特征:首先对输入图像进行分块,然后根据LBP均匀模式对图像进行降维,提取图像的局部纹理特征。使用ABC-SVM对LBP特征进行分类,基于LBP特征的结构如图3所示。
图3基于LBP特征的结构
3.2融合系统
针对单个图像特征不能完全表达图像信息的问题,利用全局和局部图像特征,提出了一种将深度学习方法CNN与传统的LBP相结合的融合系统。提出了一种决策层次融合方法。
第三节介绍了融合系统的两个分支。1. 该系统的融合目标是两个ABC-SVMs的输出。融合的方法是基于或最大后验概率原理。使用sigmoid函数将ABC-SVM输出拟合到图像类的后验概率。单个分类器的后验概率矩阵可以表示为:
其中k为第k个分类器,p(|)表示样本的后验概率为类,m是类数量,n是测试样本的数量。
通过设置每个分类器的权值来实现多个分类器的融合。系统的后验概率输出可表示为:
其中为第K个分类器,为第K个分类器的权值,K为分类器个数。
采用投票法确定分类器的权重:
其中为第k个分类器的识别率。
提出的基于CNN和LBP图像特征的融合系统如图4所示。
图4基于CNN和LBP特征的融合系统
4实验结果
在本节中,首先通过与支持向量机的比较,验证了所提出的基于LBP特征的结构。基于经验选择参数的分类器和基于PSO算法优化的SVM分类器(PSO- 8vm)。然后与传统的CNN进行了对比,验证了基于CNN特征的结构。最后,将所提出的融合系统与两种基于LBP和CNN特征的融合系统进行了比较。所采用的人脸数据库有OHL数据库和FERET数据库。
对比实验的参数选择和设置如第4.1节所示。在每个数据库中,都相应地选择了大量的训练数据和测试数据。在本节中,所有的结果数据都是通过大量的实验操作方法得到的。
所有实验均在Ma
剩余内容已隐藏,支付完成后下载完整资料
资料编号:[237465],资料为PDF文档或Word文档,PDF文档可免费转换为Word
以上是毕业论文外文翻译,课题毕业论文、任务书、文献综述、开题报告、程序设计、图纸设计等资料可联系客服协助查找。