英语原文共 23 页,剩余内容已隐藏,支付完成后下载完整资料
研究之门
参见本出版物的讨论、统计和作者简介:https://www.researchgate.net/publication/326667118
人脸检测技术:综述
·2018年7月DOI: 10.1007/s10462-018-9650-2
引用23
3作者:
5发表论文58篇
阅读量1795
本出版物的一些作者也在从事这些相关的项目:
该页面的所有内容均由Munish Kumar于2019年10月27日上传。用户请求对下载的文件进行增强。
人工智能审查
https://doi.org/10.1007/s10462-018-9650-2
人脸检测技术:综述
Ashu Kumar1 · Amandeep Kaur2 · Munish Kumar3
copy;施普林格Nature B.V. 2018
摘要
随着视频和图像数据库的惊人增长,智能系统对信息的自动理解和检查的需求达到了令人难以置信的程度,而人工理解和检查正变得越来越遥远。面容在社会交往中起着重要的作用,它传递着一个人的身份和情感。人类识别人脸的能力不如机器。因此,自动人脸检测系统在人脸识别、面部表情识别、头部姿态估计、人机交互等方面起着重要的作用。人脸检测是一种计算机技术,它可以确定数字图像中人脸的位置和大小。人脸检测一直是计算机视觉领域的研究热点。本文综述了数字图像中人脸检测的各种技术。本文还介绍了人脸检测面临的不同挑战和应用。最后给出了人脸检测标准数据库的特点。此外,我们还组织了关于开发鲁棒人脸检测系统的实践方面的专题讨论,并对本文进行了总结,为今后的研究指明了几个有前景的方向。
关键词 人脸检测特征人脸PCA特征分析
1介绍
随着计算能力的快速增长和创新的传感、分析和渲染设备和技术的普及,计算机正变得越来越智能化。许多研究项目和商业产品都展示了电脑与人类进行自然互动的能力,通过摄像头看人,通过麦克风听人,理解这些输入,并以友好的方式对人做出反应。人脸检测是实现这种自然人机交互(HCI)的基本技术之一。人脸检测是所有人脸分析算法的基石,包括人脸对齐、人脸建模、人脸重定位、人脸识别、人脸验证/认证、头部姿态跟踪、面部表情跟踪/识别、性别/年龄识别等等。因此,计算机可以清楚地理解人脸,之后,它们开始真正地理解人的想法和意图。给定一幅数字图像,人脸检测的主要目标是确定图像中是否有人脸。这对于人类来说似乎是一项微不足道的任务,但对于计算机来说却是一项极具挑战性的任务,并且在过去几十年里,它一直是最热门的研究课题之一。与人脸检测相关的困难可以归因于许多变化的尺度、位置、方向(平面内旋转)、姿态(平面外旋转)、面部表情、光照条件、遮挡等。文献中关于人脸检测的报道很多。人脸检测领域在过去十年中取得了长足的进步。
Mukherjee等人(2017)讨论了这两种方法的配方。例如,使用手工制作的特征,然后训练一个简单的分类器和一个使用神经网络从数据学习特征的完全现代的方法。Ren等人(2017)提出了一种实时检测和跟踪人脸的方法。该方法将卷积神经网络检测与卡尔曼滤波跟踪相结合。采用卷积神经网络对视频中的人脸进行检测,比传统的检测方法精度更高。当人脸严重偏转或严重遮挡时,利用卡尔曼滤波跟踪预测人脸位置。他们试图提高人脸检测率,同时满足实时需求。Luo等人(2018)提出了一种深度级联检测方法,该方法迭代地利用一种定位技术,即边界盒回归,来接近于检测图像中的潜在人脸。他们还考虑了分类和界限盒回归的内在相关性,并利用它们进一步提高整体性能。他们的方法利用了级联架构,通过精心设计的深度卷积网络的三个阶段来预测人脸的存在。TensorFlow是一个大规模、异构环境下运行的机器学习系统。Tensor-Flow使用数据流图来表示计算、共享状态和改变状态的操作。它将一个数据流图的节点映射到集群中的许多机器上,并在一台机器内映射到多个计算设备上,包括多核cpu、通用gpu和定制设计的asic,即张量处理单元(TPUs)。这种体系结构为应用程序开发人员提供了灵活性:而在以前的“参数服务器”设计中,共享状态的管理构建到系统中。TensorFlow使开发人员能够试验新的优化和训练算法。TensorFlow支持多种应用,专注于深度神经网络的训练和推理。一些谷歌服务在生产中使用TensorFlow。他们描述了TensorFlow数据流模型,并展示了TensorFlow在几个实际应用程序中的出色性能(Abadi et al. 2016)(图1,2)。
本文综述了近年来数字图像人脸检测技术的研究进展。论文的其余部分组织如下。第2节概述了人脸检测面临的挑战。第3节介绍了人脸检测的应用。第四部分,介绍人脸检测的各种技术。第5节讨论了现有的人脸检测标准数据库。第六节是结论和未来的发展方向。
图1人脸样本
图2检测到的人脸
2人脸检测的两个挑战
人脸检测面临的挑战是导致人脸检测准确率和检测率下降的原因。这些挑战包括复杂的背景、图像中过多的人脸、奇怪的表情、光照、分辨率较低、人脸遮挡、肤色、距离和方向等(图3)。
bull; 人脸在图像中可能会有不同于正常的奇怪表情,这对人脸检测是一个挑战。
bull; 面部遮挡是通过任何物体来隐藏面部。它可能是眼镜,围巾,手,头发,帽子和任何其他物体等。它还降低了人脸检测率。
bull; 照明效果可能不均匀的图像。图像的某些部分可能有非常高的照明度,而其他部分可能有非常低的照明度。
bull; 复杂背景是指图像中存在大量的物体,降低了人脸检测的准确性和准确率。
bull; 这意味着图像中包含了太多的人脸,这对人脸检测是一个挑战。
bull; 低分辨率图像的分辨率可能很差,这对人脸检测也是一个挑战。
bull; 肤色随着地理位置的变化而变化。中国人的肤色不同于非洲人,非洲人的肤色不同于美国人等等。改变肤色对于人脸识别来说也是一个挑战。
库马尔等人
图3人脸检测的各类挑战
bull; 摄像头与人脸之间的距离过大,会降低人脸在图像中的检出率。
bull; 面朝向是一个角度的脸的姿态。它也降低了准确性和人脸检测的检出率。
3人脸检测系统的应用
bull; 性别分类可以从人类形象中找到性别信息。
bull; 通过人脸识别系统,可以对文件访问进行文件控制和访问控制。
bull; 人机交互系统它是计算机技术的设计和使用,特别关注用户和计算机之间的接口。
bull; 生物统计考勤它是通过人们的指纹或面部等记录考勤的系统。
bull; 一些最近的数码相机使用人脸检测来实现自动对焦。人脸检测对于选择图片幻灯片中感兴趣的区域也很有用。
bull; 可以从图像中提取鼻子、眼睛、嘴巴、肤色等面部特征。
bull; 面部识别系统是一个从数字图像或视频帧中识别或验证一个人的过程。其中一种方法是通过比较从图像和面部数据库中选择的面部特征。它通常用于安全系统。
bull; 营销人员对人脸检测越来越感兴趣。网络摄像头可以集成到电视中,并检测任何经过的面孔。然后系统会计算人脸的种族、性别和年龄范围。一旦收集到信息,就可以播放一系列针对被检测到的种族/性别/年龄的广告。
图4不同的人脸检测技术
4人脸检测技术
人脸检测是一种计算机技术,它可以确定数字图像中人脸的位置和大小。人脸特征被检测到,而其他任何物体,如树木、建筑物和身体,则从数字图像中被忽略。它可以看作是对象类检测的一种特殊情况,其中的任务是查找属于给定类的图像中所有对象的位置和大小。人脸检测,可以看作是一个更普遍的情况下的人脸定位。人脸定位的任务是识别已知数目的人脸(通常是一张)的位置和大小。基本上,在给定的数字图像中有两种检测人脸的方法,即基于特征的方法和基于图像的方法。基于特征的方法试图提取图像的特征,并将其与人脸特征知识进行匹配。而基于图像的方法试图在训练图像和测试图像之间取得最佳匹配。以下方法通常用于检测静止图像或视频序列中的人脸(图4)。
4.1基于特征的方法
4.1.1主动形状模型
活动形状模型(ASM)关注复杂的非刚性特征,如实际物理特征和更高层次的特征外观。ASM的主要目标是自动定位地标点,这些点定义了图像中统计建模对象的形状。例如,在一张人脸图像中,提取出眼睛、嘴唇、鼻子、嘴巴和眉毛等特征。ASM的训练阶段包括构建一个统计面部模型,其中包含带有手动标注的地标的图像。将活动形状模型分为蛇类、点分布模型(PDM)和可变形模板三组
蛇 第一种蛇使用一种称为蛇的通用活动轮廓(Kass等,1988年)。蛇被用来识别头部边界。为了完成这项任务,蛇首先在头部边界附近初始化。然后,它看着附近的边缘,然后就形成了头部的形状。蛇的进化是通过最小化能量函数Esnake(类似于物理系统)来实现的,表示为:
Esnake=Einternal Eexternal
其中Einternal和Eexternal是内部和外部的能量函数。
内能是取决于蛇的内在属性并定义其自然演化的部分。蛇的典型自然进化是缩小或扩大。外部的能量抵消了内部的能量,使得等高线偏离了自然演化,最终呈现出附近特征的形状——在平衡状态下的边界。形成蛇的两个主要考虑,即能量项的选择和能量的最小化。弹性能(Erik and Low 2001)是常用的内能。内能是改变蛇的控制点之间的距离,通过它我们可以得到轮廓线,这是一种使蛇收缩或膨胀的弹性带特性。另一方面,外部能量依赖于图像特征。能量最小化过程是通过优化技术来完成的,比如最陡的梯度下降,这需要最高的计算量。采用贪心算法进行快速迭代。蛇类有一些缺点,如轮廓常陷入到伪图像特征中,另一个缺点是不适合提取非凸特征。
点分布模型 点分布模型(PDM)是独立于计算机图像分析而开发的,并开发了形状的统计模型(Erik和Low 2001)。这个想法是,一旦一个人可以表示形状作为向量,之后他们可以应用标准的统计方法,就像任何其他多元对象。这些模型从训练实例中学习允许的形状点星座,利用主成分建立模型,称为点分布模型(PDM)。这些已被用在各种各样的方式,例如分类铁器时代的胸针。提出了第一个基于地标间距离主成分的图像分析参数统计形状模型(Cootes et al. 1992)。基于这种方法,他们发表了一系列的论文,这些论文被我们称为经典的活动形状模型。
可变形的模板 可变形的模板考虑到面部特征的先验,以提高蛇的性能(Yuille等,1992年)。定位人脸特征边界并不是一项简单的任务,因为人脸边缘的局部证据很难用通用轮廓法组织成一个可感知的全局实体。这些特征周围的低亮度对比度也使边缘检测过程存在问题。蛇的概念是一个进一步的整合全球信息的眼睛采取提高可靠性的提取过程。可变形模板方法就是为了解决这个问题而设计的。变形是基于窄谷,边缘,峰值和亮度。除了人脸边界,人脸特征(眼、鼻、口、眉)提取是人脸识别的一大挑战。
E = Ev Ee Ep Ei Einternal
其中Ev、Ee、Ep、Ei、Einternal是由谷、边、峰、图像亮度和内能决定的外部能量。
图5 双锥模型
4.1.2低水平分析
肤色基地 肤色是人类面部的重要特征。使用肤色作为跟踪人脸的特征有几个优点。颜色处理比其他面部特征要快得多。在一定的照明条件下,色彩的方向是不变的。这个特性使得运动估计更加容易,因为运动估计只需要一个平移模型。人脸跟踪使用颜色特征有几个问题像一脸的颜色表示相机获得的受多种因素的影响,环境光,物体运动等建议已经提出简单的肤色像素算法检测皮肤克劳利和Coutaz (1997)。感知到的人的颜色随着相对方向和光照的变化而变化。使用归一化颜色直方图可以检测皮肤区域的像素,并且可以根据亮度除以亮度的变化进行归一化(图5)。
将[R, G, B]矢量转换为归一化颜色的[R,
剩余内容已隐藏,支付完成后下载完整资料
资料编号:[409580],资料为PDF文档或Word文档,PDF文档可免费转换为Word
以上是毕业论文外文翻译,课题毕业论文、任务书、文献综述、开题报告、程序设计、图纸设计等资料可联系客服协助查找。