面部特征实时检测外文翻译资料

 2022-11-13 15:54:30

英语原文共 6 页,剩余内容已隐藏,支付完成后下载完整资料


毕业论文(翻译)

面部特征实时检测

Preeti Jha

Department of Information Technology

Devi AhilyaVishwavidyalaya, Indore(M.P.)

Bhavesh Joshi

Institute of Engineering amp; Technology

Devi AhilyaVishwavidyalaya, Indore(M.P.)

摘要:人脸由一系列的信息组成, 这些信息在我们的日常生活中很重要。一张脸帮助我们认识到一个我们所看到的人, 并提供性别、吸引力和年龄等许多信息。一张脸给出了关于人类情感的重要暗示。情感在人类认知中发挥着基础性作用, 因此在神经科学、认知科学和社会心理学的研究中至关重要。情感的面部表达也可以在人类交流中发挥至关重要的作用。机器学习和计算机视觉研究人员之所以对创建对某种情感呈现出来的面部表情的感知的计算模型感兴趣, 第一个原因是为了帮助上述科学的研究。此外, 情感面部表情的计算模型对人工智能的发展也很重要, 在人机交互系统中也是必不可少的。

关键字:情感识别; 面部表情识别; 人脸检测; 特征提取

I.引言

人与人之间的人际交往不仅包括口语, 还包括面部表情等非语言线索, 用于表达情感和反馈。然而, 人类计算机接口的新趋势, 已经从传统的鼠标和键盘演变为自动情感识别系统和专为残疾人设计的特殊接口, 并没有完全利用这些宝贵的交际能力往往导致不自然的互动。如果计算机能够识别这些情感输入, 它们可以以更符合用户需求和偏好的不同方式向用户提供具体和适当的帮助。从心理学理论中可以广泛地接受, 人类的情感可以分为六个典型的情感, 如: 惊喜、厌恶、恐惧、愤怒、幸福和悲伤。面部运动在表达这些情绪方面起着重要作用。面部肌肉可以改变, 以传达不同的感觉。即使这些信号没有明显地表现出来, 人类也可以通过同时处理眼睛、眼皮和嘴巴获得的信息来识别。据报道, 面部表情对听力对话者有相当大的影响,说话者的面部表情约占传达信息效果的55%, 剩下的38%是通过语音语调传达的, 7%是由口语表达的。

本研究为边缘检测提供了一种计算效率高的方法, 进而实现了静态面部图像面部表情识别的分类。首先, 图像将加载到训练文件夹和测试文件夹中。在此基础上, 通过一系列算法和技术对图像进行分析, 以增强图像输入, 保持强度, 消除图像中的噪声。其次, 通过算法,检测图像的边缘。从边缘点计算要素之间的各种距离, 并通过另一种算法检测人脸。

II.问题定义

用于检测面部特征, 如眼睛、眉毛、鼻子和嘴巴。首先,使用 Haar 级联分类器的方式,这与人脸检测和眼睛追踪相同, 其次, 通过 FaceSDK 软件接口,使用预先计算的 Haar 分类器(通过 OpenCV 下载)找到额面, 左眼, 右眼, 嘴和鼻子。利用这些分类器返回的有界框图详细信息, 在输入图像的顶部绘制彩色圆圈。一个缺点是分类器返回的细节不足。例如, 如果能获得更多有关嘴和鼻子轮廓形状的信息就更有用了(但分类器获得的信息是有限的)。而且分类器也不是那么准确。但是, 该项目解释了如何通过在图像上使用裁剪感兴趣的区域 (ROI)来提高检测率。

2.1 使用 Haar 级联

OpenCV 配备了大量的位于子目录 opencv/datacadesse/arcascesn的预先计算的 Haar 级联分类器。本次采用的OpenCV 版本包括从正面和侧面的面部分类器和包括对眼睛,眼镜, 左眼,右眼, 嘴, 鼻子和耳朵的分类。特征检测器应用程序加载图像, 将其转换为灰度, 并使用正面面 Haar 分类器获取有界圆或框的脸见下面的图1:

图 1 节性

Paul Viola和Michael Jones提出了一种基于Haar级联特征的级联分类器进行Haar级联对象检测的方法。大多数现代算法都是基于Viola-Jones对象检测框架, 该框架基于Haar 级联器(一个外观空间模型)。Haar类特征是一个直观的类似Haar小波的版本, 一个数学方型函数和一系列重新计算的Haar小波形成一个小波族或基础。类似于Haar的特征基本上是黑色和白色矩形模式数据, 它们是基本分类器的输入, 如下图2。

图 2 哈尔式特征

2.2 接口

接口需要所有输入通过键盘或触摸屏。为了进一步简化,例如那些能够或不能被所有人使用的设备, 需要在机器和人类之间架起一座桥梁, 俗称人机界面 (人机交互)。

2.2.1 硬件接口

该系统需要一个强大的处理器, 以实现复杂的模式识别和立体匹配算法, 如每秒处理6-7 帧图像。像Intel Atom这样强大的处理器就足够了。系统内存消耗永远不会超过总内存的 20%, 约为 200 MB。系统的立体摄像机可以捕获分辨率为640x480 的帧。此外, 这些的焦距应在1.2 毫米至2.1 毫米之间。大多数移动设备可确保此约束条件。

2.2.2 软件接口

OpenCV 2.4.9 (开源计算机视觉) 是英特尔于1999年启动的一个流行的计算机视觉库。跨平台库将重点放在实时图像处理上, 包括最新计算机视觉算法的无专利实现。2008年, 由Willow Garage将其接管。如今OpenCV 2.3.1提出了一个转到 C, C , java的编程接口。OpenCV 是在 BSD 许可下发布的, 因此它用于学术项目和商业产品。

JavaCV 0.6 与 OpenCv 兼容。JavaCV 首先为计算机领域的研究人员提供了常用图书馆的包装。在 'com.googlecode.javacv.cpp' 包命名空间下找到的类公开了它们的完整应用程序接口。

III.面部检测技术

3.1 Viola-Jones技术

Viola-Jones技术 [25] 是基于探索输入图像通过子窗口能够检测的功能。此窗口进行缩放, 以检测图像中不同大小的面。

Viola-Jones的系统架构基于一系列的探测器。第一阶段包括简单的探测器, 它只消除那些不包含人脸的窗口。在接下来的阶段中, 增加了检测器的复杂性, 以更详细地分析特征。只有通过整个级联观察到人脸, 才会检测到。这些探测器是由一个整体图像和Haar一样的特征所显示的。

该算法的第一步是将输入图像转换为积分图像。它是通过使每个像素等于有关像素上方和左侧所有像素的整个总和来完成的。通过这样做, 可以只使用四个值计算任何给定矩形内所有像素的总和。

矩形 ABCD = D-(B C) A 的总和。

Viola-Jones方法中的人脸检测器使用特征分析子窗口。这些功能由两个或多个矩形组成。每个要素都给出一个结果值, 该值通过从黑色矩形的总和中减去白色矩形的总和来计算。不同类型的特征如上图2所示。

Viola 和 Jones 使用了一个简单的分类器, 该分类器是根据使用 AdaBoost [26]、[27] 进行功能选择的计算效率有效的功能构建的。AdaBoost是一种机器学习提升算法, 它通过弱分类器的加权组合构造强分类器。

Viola-Jones人脸检测算法用探测器对同一图像扫描几次, 每次都有一个新的尺寸。探测器检测图像中的非人脸区域, 并丢弃导致检测人脸区域的区域。为了丢弃非面部区域, Viola Jones利用了层叠。当子窗口应用于级联阶段时, 每个阶段都判断出子窗口是否为面部对象。包含具有一定百分比面部的子窗口将传递到下一阶段, 而那些不是面部的子窗口将被丢弃。最后阶段被认为具有较高的面部对象百分比。

IV.ADABOOST算法

要素可以具有不同的形状或大小, 并且可以通过不同的方式组合以描述更复杂的对象。但是, 对于特定大小的特征, 所有可能的组合集非常大。虽然可以快速评估这些功能, 但完整集所需的计算数量将使这种方法不切实际。为了解决这个问题, 采用了一种基于 AdaBoost 的弱学习算法来选择少量的特征, 这些特征结合在一起, 可以有效地描述人脸。在每一轮中, 都会从一个完整的集合中选择一个要素, 该要素给出了形成弱分类器的最低误差。在查看了可能的特征并否定了大量的特征后, 将其余的特征合并到一个正式的强分类器中。

然后以级联的方式将分类器应用于图像, 以便定位人脸。在每一轮中, 都会连续使用一个更复杂的分类器。如果在任何一轮中, 图像的一部分被拒绝, 那么它将被后续的分类器忽略, 从而逐渐限制搜索空间。更复杂的分类器仅应用于具有潜在兴趣的图像区域。随着每次需要搜索的图像部分的减少, 分类器的级联应用大大提高了方法的性能。

利用 Adaboost 算法 '提高学习算法的性能'。在这种情况下, 既可以在训练分类器上使用算法, 也可以在分析输入图像时使用算法。在24x24 像素图像中, 可以检测到超过 180.000 Haar式要素, 远远超过图像中的像素数量, 因此, Adaboost 用于选择哪些要素实际上与热门对象相关, 从而大幅减少了要分析的功能的数量。在每次迭代中, Adaboost 都会从每个图像中180.000个要素中选择整个训练集中最具特征的特征。图3显示了前两个选定的功能:

图 3 选定的要素

V.的特色城堡

本节介绍了一种构造分类器级联的算法, 该算法在从根本上减少计算时间的同时, 实现了更高的检测性能。关键是, 它更小, 因此效率更高。通过构造增强分类器, 可以消除许多负子窗口, 同时检测到几乎所有的正实例。根据使用验证训练集测量的性能, 可以调整两个特征分类器, 以检测出100% 的假阳性率为40% 的人脸。

双特征分类器作为一种目标检测系统, 其检测性能远不能被接受。不过, 分类器可以通过以下几个操作显著减少需要进一步处理的子窗口的数量:

1.评估矩形要素 (每个要素需要6到9个数组引用)。

2.计算每个要素的弱分类器 (每个要素需要一个阈值操作)。

3.组合弱分类器 (每个要素需要一个倍数、一个加法, 最后一个阈值)。

VI.培训一个经典的案例

级联设计过程是由一组检测器和性能目标决定的。在人脸检测任务方面, 过去的系统已经实现了良好的检出率 (85% 至 95%) 和极低的假阳性率 (约为10-5 或 10-5)。级联阶段的数量和每个阶段的大小必须足以实现类似的检测性能, 同时最大限度地减少计算。

给定一个受过训练的分类器级联, 一个错误的级联阳性率包括以下几个部分:f 是一个假阳性率的级联分类器, K 是分类器的数量和 fi 是检测通过分类器的样品的假阳性率。所谓的检测率包括:d 是级联分类器的检测率, K 是分类器的个数, di 是检测通过分类器的样品上的二维分类器的检测率。考虑到总体假阳性率和检测率的具体目标, 可以确定级联过程中每个阶段的目标率。

总体培训过程涉及这两种平衡。在大多数情况下, 具有更多功能的分类器将实现更高的检测率和更低的假阳性率。同时, 具有更多功能的分类器需要更多的时间来计算。在该原则中, 可以定义一个优化框架, 为了最大限度地减少给定F和D的目标的预期数量N,其中分类器阶段的数目、每个阶段 特征的数量和阈值的要素数量都可以进行调节。不幸的是,找到这个最佳特性是一个非常困难的问题。

VII.使用Canny 边缘探测器提取特征

Canny 边缘检测器 [8] 是基于计算平方梯度幅度的。梯度幅度的局部最大值高于某个阈值, 然后标识为边缘。这种阈值局部峰值检测方法称为非最大抑制或 NMS。Canny 边缘运算符是用来推导出一个 '最优' 运算符, 从这个意义上说, 通过检测边缘将乘法的概率降至最低, 最大限度地减少无法检测边缘的概率, 并最大限度地减少检测出的边缘与真正的边缘之间的差距。这些标准中的前两个解决了一个检测问题, 这个问题被称为边缘存在的问题, 边缘探测器会找到那个边缘 (而不是其他边缘)。第三个条件解决了本地化问题, 即边缘位置

剩余内容已隐藏,支付完成后下载完整资料


资料编号:[18384],资料为PDF文档或Word文档,PDF文档可免费转换为Word

原文和译文剩余内容已隐藏,您需要先支付 30元 才能查看原文和译文全部内容!立即支付

以上是毕业论文外文翻译,课题毕业论文、任务书、文献综述、开题报告、程序设计、图纸设计等资料可联系客服协助查找。