LBP人脸图像识别算法的比较分析及应用外文翻译资料

 2022-08-11 11:11:17

英语原文共 14 页,剩余内容已隐藏,支付完成后下载完整资料


LBP人脸图像识别算法的比较分析及应用

摘要:人脸识别是生物特征学的一个分支,它以人脸的特征为核心,利用人脸的独特性来识别不同的个体。人脸识别技术目前主要应用于图像集和单图像的识别。虽然单一图像的人脸识别技术已相对成熟,但也存在一些不足。本文利用Honda/USCD视频数据库对这两种技术进行了比较分析,并对基于局部二值模式(LBP)的人脸识别方法的识别精度进行了测试。结果表明,基于图像集的人脸识别技术具有较好的识别精度,可以更好地应用于智能购物、门禁系统、车辆门禁系统、智能安防、身份识别等领域。

关键字:空间识别、图像集、智能购物、局部二值模式(LBPs)

|简介

人脸识别作为生物特征学的一个分支,主要研究人脸的特征以及利用人脸的唯一性来识别不同个体的方法。目前,人脸识别技术主要有两种:一种是使用单个图像,另一种是使用图像集。后者的出现,提高了识别效率,扩大了人脸识别的应用范围。

单一图像的人脸识别技术更为普遍,已广泛应用于特征提取、特征融合、分类器设计等领域,多分类器连接在现实生活中有着广泛的应用。人脸识别由于其友好性和方便性,近年来已成为生物识别和商业活动中的一个热点。然而,单图像人脸识别技术仍存在一些不足,其中最严重的是识别精度取决于图像质量,图像质量会受到多种因素的影响而降低。具体来说,由于个人姿态和表情的变化、某些面部特征的归纳、年龄的变化以及图像质量相对较低,会降低识别精度,因此图像集识别技术具有较好的应用空间。同时,在有正面图像约束的情况下,以往的研究大多能达到令人满意的识别率。然而,在实际应用中,利用人脸识别技术,存在许多不受约束的因素,如遮挡、姿态变化、复杂背景以及光照变化等,这是非常普遍和不可避免的。这一技术在很多实际应用中都不能保证很好的效果。比如视频监控不能随意控制。另一方面,基于图像集的人脸识别技术比单一图像的人脸识别技术具有更强的鲁棒性和高效性,扩大了人脸识别的应用范围。在许多应用中,例如使用不同的摄像机进行人脸跟踪或比较,使用图像集技术更为有利。

人脸识别在科学和技术上都具有重要的意义,它不仅可以满足人工智能发展的需要,而且可以帮助我们更好地了解自己的视觉系统。近年来,人脸识别技术的发展反映在强人工智能领域,将推动专家系统、视频图像处理、机器学习等领域的技术发展。由此可见,人脸识别具有广阔的发展前景。基于图像集的人脸识别技术的发展,扩大了人脸识别的应用范围,将视频图像应用于其中。此外,机器学习和模式识别的发展也将从中获益。

物联网依靠互联网实现了物与物之间的信息传输。如今,物联网和大数据环境越来越复杂,物联网的解决方案以及基于大数据的系统和基础设施越来越难以解决。人脸识别是利用和解决互联网和大数据问题的一种方法。人脸识别根据特定的算法公式、阈值区间和面部特征,为人们提供身份识别的智能体验。物联网是人脸识别的平台,人脸识别是物联网传感器网络的智能识别方法。二者相辅相成,促进物联网发展。

为了克服光照变化对人脸识别过程的不利影响,本文提出了一种有效可行的算法。本文的结构如下:首先,研究了目前最常用的基于Viola-Jones方法的人脸检测方法,以便快速检测、定位,其次,研究了局部二值模式特征提取算法,并对其特点和算法进行了研究。然后,将局部二值模式(LBP)特征提取算法应用于图像特征提取,并对图像集进行建模,提高了算法的识别率。最后,研究了基于LBP的人脸图像集识别算法,详细研究了仿射包的建模方法和一些参数的优化。

| 人脸识别算法综述

LBP是指局部二值模式,它最初用作辅助图像的局部对比度。物联网是互联网从人到物的延伸。随着社会的发展和人工智能的广泛应用,互联网技术逐渐向物联网发展,并在实践中得到了广泛的应用,这是一个大的趋势。人脸识别技术在物联网领域的应用是相对前沿的技术。这两种技术的结合也是图像集人脸识别技术的基础。因此,本研究基于上述研究。

人脸识别的研究始于20世纪60年代,并取得了很大的进展。人脸识别作为计算机视觉领域的一个经典而重要的研究课题,目前广泛应用于视频检索、行人跟踪、分布式诊断和家庭医疗等领域。人脸识别技术的核心是算法,它决定了识别的准确性和速度。目前,图普科技、广州南翼科技信息有限公司、科技大学迅飞、迈普科技、阿里巴巴等公司的人脸识别技术均处于领先地位。它们的一些应用成果不仅可以应用于手机、智能锁等方面,还可以与公安机关合作,取得了良好的效果。可见,人脸识别技术不仅具有重要的理论意义,而且具有重要的实践意义。人脸识别的概念是通过将未标记的人脸图像与标记的人脸图像进行比较来区分不同的个体。作为一门综合性学科,人脸识别涉及到生物学、心理学等其他学科的知识。在角度变化、光照变化、表情和姿势变化、噪声、低分辨率、物体遮挡、少量多类别单类样本(百万)等因素的干扰下,尽管人脸识别技术有了长足的进步,但它仍然是一个挑战。目前,对人脸识别的研究在理论上已经比较完整,可以预期,随着人们的进一步努力,人脸识别在实际应用中会越来越成熟。

作为人脸识别的雏形,上述算法具有鲜明的特点,因而适用于不同的条件。考虑到它们的优缺点,在大多数实际情况下,可以组合多种算法以获得更高的识别精度。尽管使用单个图像的人脸识别技术经过多年的研究,已经比较成熟,应用范围也比较广泛,但由于拍摄、光线、姿势和表情的变化会降低识别精度的问题很难解决。近年来,基于图像集的人脸识别技术作为一种可以避免这一问题的替代技术越来越受到人们的关注。这项技术可以结合一些为使用单一图像而开发的技术,如流形和稀疏性。此外,这两项技术可以结合起来,以获得更好的识别性能。

| 人脸识别过程

如图1所示,人脸识别有四个步骤:第一,收集和检测人脸图像;第二,对其进行预处理;第三,从中提取特征;第四,匹配和识别。

图像采集和检测装置,用于确定给定图像或视频流中是否存在人脸。如果一个人脸在图像中被检测到,它应该被定位并且需要提取图像中的相关部分。如果在视频流中检测到面部,则需要根据面部组件(如鼻子、眼睛、嘴和面部轮廓)对其进行跟踪。本文从本田/UCSD的视频数据中提取人脸图像。

图像预处理的主要目的是消除干扰,它包括去除噪声和图像灰度化。使用图像集的人脸识别中的图像预处理比使用单个图像的人脸识别中的图像预处理简单得多,甚至可以跳过,因为一个图像集包含更多的信息,不管信息有多有效,只要从整体上考虑信息,就可以有效地描述个人的特征。因此,干扰对图像集的影响很小,甚至是负的。

特征提取是指从大量原始信息中提取少量有效信息来表示一个人脸,是一种降低计算成本的方法。在利用图像集进行人脸识别的技术中,一个人与多幅图像相关,因此他的特征由每幅图像的特征组成。特征提取可以在不降低识别精度的前提下大大降低计算量。

图像匹配与识别是指将提取的未标记人脸的特征与数据库中标记人脸的特征进行比较,并根据相似度来确定数据库中未标记人脸匹配的人脸。对于使用图像集的人脸识别,相似度由两个图像集之间的距离表示。

目前最先进的人脸识别算法很难在不经过预处理的情况下,利用少量的单类训练样本来实现高识别精度的模型。在当前的公共人脸样本数据集中,每个人的人脸样本数量相对较少。如果没有足够的数据,深度学习很难培养出一个优秀的网络模型。人脸识别的准确性在很大程度上取决于特征提取算法和匹配算法。总之,数据在训练一个优秀的网络模型中起着至关重要的作用。如图2所示,使用本文研究的图像集进行人脸识别也需要上述四个步骤,特别是建模图像集的额外步骤,这是该方法的关键点。

图 1 人脸识别的基本过程

图 2 基于图像集的人脸识别基本过程

| 用于人脸检测的Viola-Jones算法

经过几十年的研究,人们提出了许多经典的人脸检测算法。在众多算法中,Viola和Jones于2001年提出的基于AdaBoost算法的算法以其良好的性能和较快的速度而著称,是目前应用最为广泛的算法,Viola-Jones算法具有哈尔特征、弱分类器和强分类器的特点,该算法分为四个步骤:首先,用类哈尔特征表示图像;其次,用积分图像的思想计算类哈尔特征值;第三,用AdaBoost算法训练得到满足分类误差阈值的弱分类器,并进一步得到强分类器与弱分类器相结合;第四,将强分类器连接形成一个级联分类器,具有较高的检测效率。总之,Viola-Jones算法的目的是在一系列训练集的基础上得到一个级联分类器,能够准确、快速地检测图像。训练分类器的过程如图3所示。

| 哈尔特征/矩形特征

在Viola-Jones算法中,输入图像由Rainer提出的哈尔特征(或矩形特征)表示。每个哈尔特征都与两个矩形相关,一个白色矩形和一个黑色矩形,哈尔特征的值是白色矩形中像素的灰度和与黑色矩形中像素的灰度和之差。21由此定义可知,哈尔特征值的变化对应于图像灰度的变化。然而,哈尔特性扫描只描述定向结构,如水平结构和垂直结构。哈尔特征的主要类型如图4所示。为了在人脸检测方法中训练弱分类器,需要对图像上所有检测子窗口的哈尔特征进行训练。哈尔特征的数量与矩形的大小和图像的大小有关,矩形的大小与它们的大小有关。如果一个哈尔特征值的计算需要计算每个矩形中像素的灰度值之和,则计算量较大,检测速度较低,针对这个问题,引入了积分图像的思想,加快了哈尔特征值的计算,考虑到矩形的数量庞大,我们可以使用AdaBoost算法来选择那些最重要的矩形,从而降低计算成本,提高检测效率。

图 3 分类器训练过程、

图 4 哈尔特征

| AdaBoost算法

如上所述,检测子窗口中可能有数十万个矩形,因此,如果将所有矩形都考虑在内,将导致较大的计算成本。先前的实验结果表明,只有很小的一部分矩形是非常重要的,足以产生有效的分类器,我们讨论了如何使用AdaBoost算法来获得这些分类器,AdaBoost算法的基本思想是给每个样本分配一个权值,然后根据权值来决定训练时需要用到哪些分类器。样本的权重最初是相同的。经过一轮训练后,应增加未正确分类的样品的重量,减少正确分类的样品的重量。显然,这是一个迭代过程,样本的权重决定了在这一轮训练中选择哪些样本,这取决于最后一轮训练的结果。由此可以推断,AdaBoost算法主要针对难以分类的样本。利用该算法可以得到满足分类误差阈值的最优弱分类器。然后,利用弱分类器进一步得到强分类器。AdaBoost算法的过程如图5所示。

| 基于LBP的特征提取

人脸检测后的下一个关键步骤是对人脸图像进行分析。而人脸图像分析的关键是如何有效地描述人脸,其本质就是特征提取。

特征提取是解决“维数灾难”问题的一种方法,它可以用来从大量原始数据中找出少量足以表示人脸的特征。如图6所示,特征提取的思想是通过线性变换或非线性变换将原始图像映射到低维空间。

线性特征提取比非线性特征提取得到了更广泛的应用,在实际应用中已经比较成熟。线性特征提取的实质是用低维数据代替原始的高维数据,低维数据足以表示不同个体之间的差异,主要的线性特征提取方法包括主成分分析(PCA)、线性判别分析(LDA)、局部性分析(locality)保存投影(LPPs)、LBPs等。这类蟑螂有十多种,有的是基于全局特征,有的是基于局部特征。非线性特征提取方法包括基于核主成分分析(PCA)和核LDA的非线性特征提取方法,基于流形学习的非线性特征提取方法(Laplacian特征映射和Isomap等),本文采用了Ojala于1996年提出的LBP算法,该算法可用于描述图像的局部文本特征。

图 5 AdaBoost 算法训练过程

图 6 特征提取的基本过程

| LBP算法的基本原理

LBP算法简单而有效,且LBP算子对图像灰度的单调变化具有免疫性。LBP算法的基本原理如下。为了计算像素的LBP特征值,首先将像素的灰度设置为阈值。然后,将该像素邻域的灰度尺度与阈值进行比较,得到一个二值化的数字,该数字可以表示局部文本特征。在综合所有这些局部文本特征之后,就可以理解完整的图像。LBP算法可以看作是分析图像文本特征的传统模型和结构模型的结合。LBP算子由于其优良的分类性能和较低的计算成本,在各种特征提取方法中得到了广泛的应用,除了具有优良的分类性能和较低的计算成本外,LBP算子的另一个优点是它对灰度的单调变化免疫,因此对光的变化不敏感。由于在使用LBP算法时,不需要预先假定任何参数的分布,因此它本质上是一个非度量算法。

| LBP operator

原始LBP运算符通过比较每个像素的灰度与其相邻像素的灰度,为每个像素分配一个值。相邻像素的数目被选为8个初始像素。令gc表示中心像素的灰度,gi表示其相邻像素的灰度。图7显示了像素的LBP值的计算。具体来说,如果相邻像素的灰度比中心像素小,则将其标记为0,否则将其标记为1。将这些标记组合生成一个二进制数,并将其转换为十进制数,即LBP值,例如,中心像素的灰度值为54,用作阈值,其八个八像素的灰度值分别为54、57、12、13、86、21、99和85。根据上述计算过程,我们可以计算出LBP模式为11001011,LBP值为203。将LBP算法应用于人脸图像将生成一个LBP值数组,该数组替换了相应的像素。这就意味着,这些个人已经被LBP特征所代表,这正是我们所渴望的。

根据以上所述,如果将一张人脸图像分成多个部分,并将LBP算法应用到每个部分中,我们可以用所有部分的LBP值的统计直方图来描述图像。

| 基于图像集的人脸识别方法

人脸识别实际上是对人脸图像的识别。人脸图像识别主要包括两部分:一部分是图像特征提取,另一

剩余内容已隐藏,支付完成后下载完整资料


资料编号:[237475],资料为PDF文档或Word文档,PDF文档可免费转换为Word

原文和译文剩余内容已隐藏,您需要先支付 30元 才能查看原文和译文全部内容!立即支付

以上是毕业论文外文翻译,课题毕业论文、任务书、文献综述、开题报告、程序设计、图纸设计等资料可联系客服协助查找。