面部识别算法的FERET数据库和评估程序外文翻译资料

 2021-11-06 19:55:10

英语原文共 12 页

面部识别算法的FERET数据库和评估程序

摘要

人脸识别技术(FERET)程序数据库是一个大型的人脸图像数据库,分为开发和隔离部分。开发部分供研究人员使用,隔离部分留作测试面用。FERET评估程序是对人脸识别算法的独立管理测试。这篇论文将提出一种基于分块主成分分析的人脸识别算法。这个算法与传统的PCA算法相比提高了人脸图像在光照方向和面部表情剧烈变化下的识别率。这种技术中,将人脸图像分成小的子图,同时使用PCA算法处理这些子图。因为人脸的一些脸部特性不会变化,甚至在姿态,光照方向,面部表情变化时,我们期望这种方法能够适应上述几种的变量的变化。传统PCA方法和分块PCA方法的准确性会被使用标准人脸数据库在变化的表情,光照,和姿态情况下进行评估。

关键词:人脸识别;算法评价;图像数据库

1 介绍

在过去的几年里,人脸识别已经成为计算机视觉的活动区域。带来的利润增加了通过潜在的应用和同时开发-算法技术和廉价计算机的发展用计算能力运行这些算法。这些发展产生了大量关于人脸识别,多数报告未完成识别结果(通常大于95%正确识别)在有限大小的数据库上(通常少于50个数据)。很少在这些算法中,报告了来自公共数据库;很少满足根据标准测试协议进行评估,其中包括单独的培训和测试集。因此,没有办法对藻类进行定量评估-里兹的相对优势和劣势。不幸的是,这不是一个孤立的病例,而是计算机视觉研究。在计算机视觉文献中,各种文章和数据-Cuses主张使用允许COM的方法。-算法的并列评估[L-5]。好处这些方法包括:(1)将计算机视觉置于坚实的实验和科学基础,(2)协助为实际问题制定工程解决方案,(3)允许对最新技术进行准确评估,以及(4)向潜在用户提供令人信服的证据视觉研究已经找到了解决问题的方法。尽管有这些有根据的论据,计算机视觉社区在很大程度上没有注意到这一呼吁。有几个例外:手写字符识别-国家研究所提供标准数据库。-标准与技术(NIST)(NIST特别版)数据库3)以及来自Unipen公司联盟的以及大学[6]。希思等人最近的研究。〔7〕及胡佛等人。[8]确定的边缘比较方法范围和强度图像中的探测器。在人脸识别中,Robertson和Craw[9]提出了一种评估方法。人脸图像数据库的算法与讨论应该收集。但是,他们不比较algo-将实验限制在五个受试者的数据库中。本文提出了一种综合评价方法-UATING人脸识别算法,作为人脸识别技术(FERET)计划[10111.FERET评估方法包括-集成数据收集工作和测试程序。这些两部分通过feret数据库集成面部图像;数据库分为一个开发提供给研究人员的部分用于测试的部分。数据库的分区使对不同但相关的算法进行培训和测试,

一组图像。FERET评估程序是一套标准测试协议:费列测试是独立的-牙科治疗,每项测试都在三天。标准测试协议的使用允许用于直接比较DIFF开发的算法-

不同的小组,以及衡量所做的改进随着时间的推移,任何一个群体。

人脸识别是一个很困难的问题,因为同一个人的人脸的图像间是大致相同的脸部形状结合众多的变化。人脸图像会随着面部表情,年龄,角度,光照条件和噪音而改变。人脸识别系统的任务就是使用一种方式识别这些变化尽可能不相关的人脸图像。

自动人脸识别系统被作为计算机视觉和模式识别领域的一个基础性问题,许多来自不同领域的科学家在研究它。Chellappa 等人在1995年提交了一份关于统计方法,神经网络方法和特征方法的调查。目前,主成分分析在正面人脸识别可以取得不错的结果。它是一种统计方法,人脸被表示为他们特征向量的一个子集,并因此被称为特征脸(Sirovichand Kirby 1987; Turk and Pentland 1991;Moghaddam and Pentland 1997;Martinez,2000;Graham and Allinson, 1998)。

PCA也已被用于指纹设别(Murase 等人1981),人造目标识别(Murase and Nayar, 1995),工业机器人(Nayar 等人1996)和移动机器人(Weng 1996)。但是结果表明在姿态变化30°和光照极度变化的情况下识别率不尽如人意。

这个研究的主要目标是改善人脸识别受到面部表情,光照和头部姿态变化下的准确度。在上述之前,PCA方法已是人脸识别领域非常流行的技术。但是这种技术在光照和面部姿态变化非常大时并不十分准确。在这项研究工作试图提高这项技术在面部表情,光照和姿态变化条件下的准确性。我们提出了分块PCA方法,这是传统PCA方法的一个延伸。在分块PCA方法,人脸图像被分成较小的图像,使用PCA处理每个子图。而在传统PCA方法以整个人脸图像来考虑,因此大范围姿态或光照的变化会严重影响识别率。对于分块PCA方法,原始图像被分成子图,这个图像姿态或光照的变化将只会影响一些子图。所以我们希望这个方法相比传统PCA方法有比较好的识别率。一个相似的方法叫做特征空间被Pentland等人在1994年提出。在这个PCA方法中PCA方法应用在面部图像的眼睛和鼻子。

FERET数据库已被广泛应用于人脸识别领域。在整体人脸近似重建方面,使用加权组合的特征向量(特征脸),它是从整体中提取出来的(Sirovich and Kirby, 1987)。把给定的图像用被看成全局面部特征的特征图像进行扩展。这个工作的深入延伸是Kirby和Sirovich(1990)的人脸特征图像固有对称性。

在人脸数据库中的所有人脸被以很长的向量进行表示,而不是用普通矩阵进行表示。这样就构造出了整个图像空间,其中每一个图像就是一个点。由于人脸都有相似的结构(眼睛,鼻子和嘴等等),那些描述人脸的向量都有相互的联系。我们可以看到同一类的人脸图像位于图像空间的某一位置周围。因此人脸图像用一组由训练人脸图像协方差矩阵产生的特征向量表示。这个想法来自于特征图像(我们的案例特征图像)是去找到一个更低维空间,在哪儿用短的向量描述人脸图像。图1以图形的方式阐释了这个想法。

2.测试方案原理

假设人脸数据库的人脸图像是L*L的。这些图像可以被表示为维的向量,或维空间的一个点。一组图像相当于一组在高维空间的点。

因为脸部图像在结构上是相似的,这些点将不会随机的分布,因此可以使用低纬子空间进行描述。PCA给出了这个子空间的基向量(被称为面部空间)。每个基向量的长,同时协防差矩阵的特征向量与原人脸图像相一致。

,,...,为一组人脸图像训练集。平均脸定义为:

(1)

每个脸偏离平均脸程度用向量表示,协方差矩阵C为:

(2)

协方差矩阵的特征向量被计算出来,同时选择最大特征值对应的特征向量作为有意义的特征向量。从这些特征向量,每一幅图像在训练组的分量通过如下计算出来

(3)

其中是C最大的特征值对应的特征向量,K从1变化到。

2.2 分类

测试图像通过以下操作如下放入面部空间

(4)

权重组成一个向量,这个描述每一个输入脸部图像的特征脸的贡献。这个向量可以用来使测试图像与预先确定的脸部类相匹配。一个简单的技巧是通过计算的距离,其中是pth类的均值向量。当时,这个测试图像可以认为是p类的,其中和是阀值。

3.评估的算法

我们报告了FERET评估人脸的结果。-三个机构开发的识别算法:

麻省理工学院媒体实验室,计算神经科学洛克菲勒大学实验室和计算机-

国立大学视觉与生物视觉实验室南加州(USC)。麻省理工学院媒体实验室算法基于Princi-PAL成分分析。在主成分分析中,a一组参考面用于计算一组特征值面#39;[12-151,这是由分析。图像中的一个面表示为其投影。在特征向量上。该算法通过用本征空间比较它们的投影。特征向量从数据库中的图像子集计算并且不会随着数据库的更改而修改。洛克菲勒算法是基于因式学习的局部特征分析[16-181.局部特征分析是非相关局部特征的稀疏分布编码。此编码是本地低维压缩represen-脸上的表情。用于表示的局部特征分析人脸在Penev和Atick[17]中有介绍,但详细介绍了不讨论人脸识别。USC算法使用动态链接结构

范例,将图像投射到一组gabor上喷气机(19-211)。gabor-jet是一组gabor小波不同的尺度和方向,都集中在同一个中心像素。每个喷射的位置是平面的顶点。图,其中平面图是面对。一个面表示为图像投影到Gabor喷流的系数,以及距离。图中顶点之间。两者的相似之处通过比较Gabor射流确定两个面系数和图;这个过程被称为弹性图匹配。

在这个方法中,每一幅在训练集中的图像被分成N个小的图像。因此每个子图的大小将是。这些子图用数学表示为:

(5)

其中i从1到M,M是训练集中图像的数量,j从1到N,N是子图的数量,m和n从1到。图表2显示的是将人脸图像使用(5)式在N=4时分成四个子图的结果。

所有训练子图的均值图像可以通过以下计算出来:

(6)

下一步是通过减去均值来标准化每个训练子图:

(7)

通过标准化子图的可以计算协防差矩阵如下:

(8)

下一步我们发现C的特征向量与最大的特征值相关联。我们把特征向量记为。通过特征向量计算权重如下所示:

(9)

其中K取值为1,2,hellip;,,n从1到,为每个人的图片数量,p从1到P,P为训练集中人的数量。同样也可以使用特征向量即如下所示的方程计算测试子图的权重。

(10)

在训练集中每一类均值权重集通过类的权重组计算出来。如下所示:

(11)

下一步通过如下所示计算出最小距离

(12)

(13)

,p为一个特定的值。在训练集对应的人脸类是最接近测试图像。因此测试图像被公认为属于pth人脸类。

4.FERET数据库

4.1 目的

feret数据库的建立是为了支持算法开发和评估。两个导向弹簧-遵守了密码。首先,算法的评估需要一个共同的图像数据库,以便两者都开发-测试和测试。在费里评价中,图像测试来自开发和隔离部分feret数据库。第二,品种和数据中图像定义的问题的难度-基数必须递增。对数据库测试算法的需求是显而易见的,但是数据库的开发功能是一样的重要(如果不太明显)。用于评估程序为了产生有意义的结果,图像在显影-数据库的心理部分必须与哪些算法需要测试。发展和测试数据集的质量和数量必须相似。例如,如果测试将由1000个库组成

个人,不适合发展数据库由50个人组成。测试的算法只会和它们所在的数据库一样好发达的。FERET评估程序遵循以下步骤:通过将feret数据库划分为devel的原理-门诊部和隔离部-TAL部分代表隔离部分(详情见第4.2节)。另一个原则是数据库中的图像必须与当前级别相匹配算法的开发,以及数据库的难度必须随着算法的复杂度的提高而增长。如第2节所述,如果数据库定义了一个问题,这太容易了,测试算法就变成了一种调整运动。在另一个极端,如果问题太严重

除了最先进的技术,测试不会产生任何有意义的结果。防止feret数据库

随着时间的推移,我们不断扩大和调整数据库以最先进的面部识别技术。在数据库收集工作开始时(1993年9月),大多数算法适用于小型数据库(通常少于50个人)。在这些数据库中,一个面通常在图像中严格对齐,以便算法不需要定位或规范化它。这个麻省理工学院媒体实验室的数据库[121和数据库用Lades等人[19]有两个显著的例外。这个收集了7562张图像的媒体实验室数据库。眼睛和脸对着黑色背景。在Lades等人,数据库包括88张照片拍摄时面部没有严格对齐。根据1993年9月的最新技术,feret数据库收集图像以支持开发-在图像中定位人脸的算法从大约300人的画廊里认出那张脸个人。采集的图像没有严格对齐。-面部表情。这允许在比例、位置上发生变化。图像、照明和姿势中的面。跟随Aug94 Feret测试,额外的图像被收集到(1)人像算法支持评估在不同的日期拍摄,(2)Aug94 Feret测试。

4.2 描述

feret数据库中的图像最初是用35毫米相机拍摄。使用的胶片,颜色

对Kodak Ultra进行了处理,并将图像放在通过柯达的多分辨率技术的CD-ROM。这些从CD-ROM和Con中检索彩色图像。-转换为8位灰度图像。图像是256

像素宽384像素高。试图保持眼间距离每个主题在40到60像素之间。每个图像都是分配了一个唯一的文件名,对图像地面进行编码真理。这包括受试者的身份号码,nom-图像的最终姿势、拍摄日期,以及特殊变化。身份号码已键入拍摄的人,以便将来收集的任何图像那个人的身份证号码是一样的。这些面部图像是从

1993年8月至1994年12月。在乔治进行梅森大学和美国陆军研究实验室设施,会议持续了一两天,地点-操作和

原文和译文剩余内容已隐藏,您需要先支付 30元 才能查看原文和译文全部内容!立即支付

以上是毕业论文外文翻译,课题毕业论文、任务书、文献综述、开题报告、程序设计、图纸设计等资料可联系客服协助查找。