Face Recognition: A Literature Survey
W. ZHAO
Sarnoff Corporation
R. CHELLAPPA
University of Maryland
P. J. PHILLIPS
National Institute of Standards and Technology
AND
A. ROSENFELD
University of Maryland
As one of the most successful applications of image analysis and understanding, face recognition has recently received significant attention, especially during the past several years. At least two reasons account for this trend: the first is the wide range of commercial and law enforcement applications, and the second is the availability of feasible technologies after 30 years of research. Even though current machine recognition systems have reached a certain level of maturity, their success is limited by the conditions imposed by many real applications. For example, recognition of face images acquired in an outdoor environment with changes in illumination and/or pose remains a largely unsolved problem. In other words, current systems are still far away from the capability of the human perception system.
This paper provides an up-to-date critical survey of still- and video-based face recognition research. There are two underlying motivations for us to write this survey paper: the first is to provide an up-to-date review of the existing literature, and the second is to offer some insights into the studies of machine recognition of faces. To provide a comprehensive survey, we not only categorize existing recognition techniques but also present detailed descriptions of representative methods within each category. In addition, relevant topics such as psychophysical studies, system evaluation, and issues of illumination and pose variation are covered.
Categories and Subject Descriptors: I.5.4 [Pattern Recognition]: Applications
General Terms: Algorithms
Additional Key Words and Phrases: Face recognition, person identification
An earlier version of this paper appeared as “Face Recognition: A Literature Survey,” Technical Report CARTR-948, Center for Automation Research, University of Maryland, College Park, MD, 2000.
Authorsrsquo; addresses: W. Zhao, Vision Technologies Lab, Sarnoff Corporation, Princeton, NJ 08543-5300; email: wzhao@sarnoff.com; R. Chellappa and A. Rosenfeld, Center for Automation Research, University of Maryland, College Park, MD 20742-3275; email: {rama,ar}@cfar.umd.edu; P. J. Phillips, National Institute of Standards and Technology, Gaithersburg, MD 20899; email: jonathon@nist.gov.
Permission to make digital/hard copy of part or all of this work for personal or classroom use is granted without fee provided that the copies are not made or distributed for profit or commercial advantage, the copyright notice, the title of the publication, and its date appear, and notice is given that copying is by permission of ACM, Inc. To copy otherwise, to republish, to post on servers, or to redistribute to lists requires prior specific permission and/or a fee.
ACM Computing Surveys, Vol. 35, No. 4, December 2003, pp. 399–458.
INTRODUCTION
As one of the most successful applications of image analysis and understanding, face recognition has recently received significant attention, especially during the past few years. This is evidenced by the emergence of face recognition conferences such as the International Conference on Audioand Video-Based Authentication (AVBPA) since 1997 and the International Conference on Automatic Face and Gesture Recognition (AFGR) since 1995, systematic empirical evaluations of face recognition techniques (FRT), including the FERET [Phillips et al. 1998b, 2000; Rizvi et al. 1998], FRVT 2000 [Blackburn et al. 2001], FRVT 2002 [Phillips et al. 2003], and XM2VTS [Messer et al. 1999] protocols, and many commercially available systems (Table II). There are at least two reasons for this trend; the first is the wide range of commercial and law enforcement applications and the second is the availability of feasible technologies after 30 years of research. In addition, the problem of machine recognition of human faces continues to attract researchers from disciplines such as image processing, pattern recognition, neural networks, computer vision, computer graphics, and psychology. The strong need for user-friendly systems that can secure our assets and protect our privacy without losing our identity in a sea of numbers is obvious. At present, one needs a PIN to get cash from an ATM, a password for a computer, a dozen others to access the internet, and so on. Although very reliable methods of biometric personal identification exist, for example, fingerprint analysis and retinal or iris scans, these methods rely on the cooperation of the participants, whereas a personal identification system based on analysis of frontal or profile images of the face is often effective without the participantrsquo;s cooperation or knowledge. Some of the advantages/disadvantages of different biometrics are described in Phillips et al. [1998]. Table I lists some of the applications of face recognition.
Commercial and law enforcement applications of FRT range from static, controlled-format photographs to uncontrolled video images, posing a wide range of technical challenges and requiring an equally wide range of techniques from image processing, analysis, understanding, and pattern recognition. One can broadly classify FRT systems into two groups depending on whether they make use of static images or of video. Within these groups, significant differences exist, depending on the specific application. The differences are in terms of image quality, amount of background clutter (posing challenges to segmentation algorithms), variability of the images of a particular individual that must be recognized, availability of a well-defined recognition or matching criterion, and the nature, type, an
剩余内容已隐藏,支付完成后下载完整资料
人脸识别:文献综述
W.赵
萨诺夫公司
R. 切尔拉帕
马里兰大学
P·J·菲利普斯
国家标准与技术研究所
和
A.罗森菲尔德
马里兰大学
人脸识别作为图像分析和理解的最成功的其中一个应用,近年来受到了极大的关注,尤其是在过去的几年里面。至少有2个原因说明了这一个趋势:第一是广泛的商业和执法应用,其次是经过30年的研究得出了可行的技术。即使现今的机器识别系统已经达到了一定程度的成熟,不过他们的成功是有限的,限于许多实际应用的条件。例如,在室外环境中获得的人脸图像识别的照明和或构成的变化依旧是一个很大的仍未解决的问题。换句话说,目前的系统还远远偏离人类感知系统的能力。
本文提供了一个最新的关键调查和基于静态和视频的人脸识别研究。我们有2个潜在的动机,我们写这篇调查报告:第一是提供一个对现有的文献最新的回顾,第二是提供一些洞察机器识别的研究。为了提供一个全面的调查,我们不仅对现有的识别技术进行分类,而且在每个类别中的代表方法的详细说明。此外,还有相关的主题,如心理物理学的研究,系统评价,以及光照和姿态变化的问题上。
分类和主题描述:i.5.4 [识别]:应用
一般术语:算法
其他关键词和短语:人脸识别,个人识别
本文的早期版本出现“人脸识别:一个文献综述,《技术报告cartr-948,自动化研究中心,马里兰大学学院公园,MD,2000。
作者地址:W.赵,视觉技术实验室,萨诺夫公司,普林斯顿,新泽西08543-5300;电子邮件:wzhao@sarnoff.com;R. 切尔拉帕和A.罗森菲尔德,中心自动化研究,马里兰大学学院公园,MD 20742-3275;电子邮件:{拉玛,AR } @cfar.umd.edu;P·J·菲利普斯,美国国家标准与技术研究所,盖瑟斯堡,MD 20899;电子邮件:jonathon@nist.gov。
许可使个人或课堂上使用这项工作的一部分或全部数字硬拷贝是不收费提供的副本不会制作或分发利润或商业优势理所当然,版权声明,标题的出版物,和出现的日期,并通知的复制是允许的责任有限公司以其他方式复制、转载、发布的服务器上,或分配清单需要事先特定的权限和(或)费用。
介绍
作为一个图像分析和理解的最成功的应用,人脸识别最近收到显着的国际会议在人脸识别(AFGR)。自1995以来,人脸识别技术进行了系统的实证评价(FRT),包括FERET [菲利普斯等人.1998,2000;里兹维等人.1998 ]、[布莱克本等人FRVT 2000,2001 ]、[菲利普斯等人.FRVT 2002,2003 ],和XM2VTS[梅塞尔等人.1999]协议,和许多商业可用系统(表二)。这种趋势至少有两点原因,第一是广泛的商业和执法应用,其次是经过30年的研究后得到的可行的技术。此外,机器识别人脸的问题,继续从众相关学科中吸引研究人员,如图像处理,模式识别,神经网络,计算机视觉,计算机图形学,心理学。对于用户友好的系统强大的需求,可以保护我们的资产,保护我们的隐私,而不失去我们的身份在一个海洋中的数字是显而易见的。目前,人们需要一个密码来从一个自动取款机,一个密码,一台电脑,一打其他人访问互联网,等等。虽然非常可靠的生物识别个人身份的方法存在,例如,指纹分析和视网膜或虹膜扫描,这些方法依赖于参与者的合作,而个人识别系统的基础上分析的正面或侧面的人脸图像的人脸的合作或知识往往是有效的。一些不同的生物识别技术的优点或者缺点菲利普等人对其有作描述.[1998]。我列出了一些人脸识别的应用。
分数范围从静态商业和执法应用,控制图片格式不受控制的视频图像,提出了广泛的技术挑战,需要一个在图像处理,分析,理解和模式识别领域中同样广泛的技术。一个可以大致分类的FRT系统分为两组,取决于他们是否使用静态图像或视频。在这些群体中,存在显着的差异,这取决于具体的应用程序。它们的差异是在图像质量,背景杂波(构成挑战的分割算法),一个特定的个体的图像的变化,必须被确认,可用性的一个明确的识别或匹配标准,并从用户输入的性质,类型和数量的变化的图像。在表2中列出了一些商业系统的列表。
人脸识别问题的一般性陈述,可以表述为:给定静止或视频图像的场景,在场景中识别或验证一个或多个使用人脸的存储库。
表一.人脸识别的典型应用
范围 |
具体应用 |
娱乐 |
视频游戏,虚拟现实,培训方案 |
人机(机器人)交互,人机(计算机)交互 |
|
智能卡 |
驱动程序的许可证,授权计划 |
移民,国民身份证,护照,选民登记 |
|
福利欺诈 |
|
信息安全 |
电视家长控制,个人设备登录,桌面登录 |
应用安全、数据库安全、文件加密 |
|
内网安全,互联网接入,医疗记录 |
|
安全的交易终端 |
|
执法监察 |
先进的视频监控,央视的控制 |
门控制,事后分析 |
|
入店行窃,嫌疑人跟踪调查 |
表二,可用的商业人脸识别系统(这些网站中的一些可能已更改或已被删除)[任何公司,商业产品,或贸易名称并不意味着国家的认可或推荐
标准和技术研究所或任何作者或其机构。]
商业产品 |
网站 |
面对来自视觉 |
http://www.FaceIt.com |
面貌技术 |
http://www.viisage.com |
由plettac 到FaceVACS |
http://www.plettac-electronics.com |
facekey 公司 |
http://www.facekey.com |
cognitec系统 |
http://www.cognitec-systems.de |
keyware技术 |
http://www.keywareusa.com/ |
从ID艺术通关脸蛋 |
http://www.id-arts.com/ |
逆向设计软件 |
http://www.iwsinc.com/ |
eyematic接口 |
http://www.eyematic.com/ |
BioID传感器融合 |
http://www.bioid.com |
视觉领域技术 |
http://www.visionspheretech.com/menu.htm |
生物识别系统公司 |
http://www.biometrica.com/ |
facesnap记录仪 |
http://www.facesnap.de/htdocs/english/index2.html |
面对复合spotit |
http://spotit.itc.it/SpotIt.html |
图1一个通用的人脸识别系统的结构。
注:Face Detection: 人脸检测
Face Tracking: 人脸跟踪
Pose Estimation: 姿态估计
Compression: 压缩
HCI Systems: 人机交互系统
Feature Extraction:特征提取
Facial Feature Tracking:人脸特征跟踪
Emotion recognition:情感识别
Gaze Estimation:视线估计
Face Recognition:人脸识别
Holistic Templates:整体模板
Feature Geometry:几何特征
Hybrid:混合
Identification/Verfication:识别/验证
可用的抵押品信息,如种族,年龄,性别,面部表情,或讲话,可用于缩小搜索(加强识别)。该问题的解决方案涉及到人脸分割(人脸检测)从杂乱的场景,对人脸区域的人脸特征提取,识别或验证(图1)。在识别问题,输入到该系统是一个未知的脸,和系统报告确定的身份从一个已知的个人数据库,而在验证问题,该系统需要确认或拒绝所声称的身份的输入面。
人脸感知是人类感知系统能力的一个重要组成部分,是人类的日常任务,而构建类似的计算机系统仍然是一个正在进行的研究领域。人脸识别技术的最早的工作至少可以追溯到上世纪50年代心理学[布鲁纳和塔居里.1954 ]和60年代工程文献[ 1964 ]布莱索。一些最早期的研究包括达尔文(1972)(参见高尔顿[ 1998 ])和基于面部轮廓的艾克曼[ 1888 ]。但对人脸的机器自动识别研究真正起步是在上世纪70年代[ 1970 ]凯利和奏[ 1973 ]的开创性工作之后。在过去的30年里,大量的研究已经由心理物理学家、科学家和通过人类和机器有关人脸识别各方面工程师进行。心理物理学家和神经科学家一直关注如人脸感知是一个专门的工艺问题(这个问题还是在心理社区[比德曼和卡洛赛1998;讨论埃利斯高蒂尔等人1986。1999;高蒂尔和洛戈塞蒂斯 2000 ])这类的问题,无论是从整体或局部特征进行分析。
在这些学科中,研究人员提出的许多假说和理论都是基于对小图像的。然而,许多研究结果有重要的影响,工程师们设计的算法和系统的机器识别人脸。2节将简要回顾这些研究结果。
除了一些使用范围数据[戈登1991 ],人脸识别问题已经制定了从二维(2D)图像识别三维物体。早期,它是作为一个二维模式识别问题的。因此,在早期和中期,典型的模式分类技术,利用测量特征的属性(例如,在重要的点之间的距离)在面或面谱,用[布莱索1964;奏1973;凯利1970]。在20世纪80年代,人脸识别工作基本上仍然处于休眠状态。自上世纪90年代初以来,在FRT的研究兴趣显著增长。一个人可以把这归因于几个原因:商业机会感兴趣的增加,实时硬件的可用性,以及越来越重要的监控相关应用。
在过去的15年中,研究主要集中在如何使人脸识别系统完全自动的解决问题,如人脸定位在一个给定的图像或视频剪辑和提取的功能,如眼睛,嘴巴等,同时,显着的进步已经取得了成功的人脸识别分类器的设计。基于特征脸方法中的整体外观,[柯比和西若威齐1990;特尔奇和彭特兰1991]贝尔胡米尔等人.1997;埃特马.切尔拉帕1997和赵等.1998在大型数据库实验中已被证明是有效的。基于图匹配的方法[维斯科特等人.1997 ]也相当成功。相比,整体的方法,基于特征的方法是不敏感的照明和观点的变化和不准确的人脸定位。然而,这种方法需要的特征提取技术仍然是不可靠的或不够准确的[考克斯等人.1996 ]。例如,大多数眼睛定位技术假设一些几何和纹理模型和不工作,如果眼睛是关闭的。第3节将提出一个回顾仍然基于图像的人脸识别。
在过去的5到8年,许多研究都集中在视频人脸识别。静止图像的问题有几个固有的优点和缺点。对于应用程序,如驱动程序的许可证,由于图像采集过程的控制性质,分割问题是相当容易的。然而,如果只有一个静态图片的机场场景是可用的,自动的位置和分割的脸可能会带来严重的挑战,任何分割算法。另一方面,如果一个视频序列是可用的,分割的一个移动的人可以更容易地完成使用运动作为一个提示。但视频中的小尺寸和低的图像质量可以显着提高识别难度。视频人脸识别在4节回顾。
随着我们提出新的算法,建立更多的系统,测量新系统和现有系统的性能变得非常重要。系统的数据采集及人脸识别系统评价在5节回顾。
从二维图像中识别一个三维物体带来了许多挑战。照明和构成问题是一个突出的问题,外观或基于图像的方法。对此,已经提出了许多方法来处理这些问题,与他们中的大多数探索领域知识。这些方法的详细信息在6节中讨论。
1995年,综述[切尔拉帕等人.1995]论文的深入调查当时的分数。(早期的调查[萨马尔和艾扬格1992]出现在
剩余内容已隐藏,支付完成后下载完整资料
资料编号:[152926],资料为PDF文档或Word文档,PDF文档可免费转换为Word
以上是毕业论文外文翻译,课题毕业论文、任务书、文献综述、开题报告、程序设计、图纸设计等资料可联系客服协助查找。