英语原文共 6 页,剩余内容已隐藏,支付完成后下载完整资料
基于空间建模的面部识别
Yuwen Wu |
Hong Liu |
Hongbin Zha |
National Lab. on Machine Perception |
National Lab. on Machine Perception |
National Lab. on Machine Perception |
Peking University |
Peking University |
Peking University |
Beijing, China |
Beijing, China |
Beijing, China |
wuyw@cis.pku.edu.cn |
liuhong@cis.pku.edu.cn |
zha@cis.pku.edu.cn |
摘要
在本文中,我们提出了用对人脸表情建模的方法替代模糊积分方法来识别面部表情。使用传统的形状特征方法识别表情时,在描述面部表情分类的不确定性和描述面部特征和面部表情的关系时存在问题。使用面部表情建立空间模型,可以轻松地解决这些问题。首先,我们使用模糊积分的中值不同的面部表情空间来描述不确定性的面部表情。第二,我们通过自动在每个面部表情空间构造模糊测度来处理面部表情的面部特征分类产生的不同的影响。实验结果证明该方法具有良好的描述面部表情不确定性的能力及可以获得良好的分类。
关键字 — — 面部表情识别,人脸表情分析,模糊积分,模糊测度
1、简介
面部表情在人类的情感认知中占有很大的比重。为了自然和谐的人机交流,必须有效地理解人类的意图。人脸表情识别是情绪理解的基础。同时,它也是理解人类情感的有效途径。人类的大脑只是通过面部形状特征来识别面部表情。面部形状特征具有一些特征:特征向量的维数较小,计算复杂的培训和认识较低。本文的目的是设计一种可以有效地使用形状特征特性和能很好地描述表情的不确定性的新算法。
人脸表情识别自最初成为电脑科学的主要研究课题以来至今已有20多年。于形状特征的人脸表情识别的方法一直是一个重要的研究课题。传统方法利用形状特征很小的特点。这些方法使用的算法很简单。最近的方法采用了一些复杂的算法。但这些方法大多数利用形状特征来识别行动单位。在使用形状特征来识别面部表情上还存在两个问题。首先,不确定性是面部表情识别的一个标志性特征。面部表情的不确定性是一个表达式属于几个不同可能性的表达式。因此,不确定性的描述应该基于分类结果。第二,不同特征的运动范围是不同的;比如嘴部特征的运动范围比眼部特征的运动范围大。同时,不同表情也将导致不同的面部运动。怎么利用这两个特性将会影响到面部表情的分类。
本文通过分析上述问题设计了一种建立面部表情空间结构来实现表情识别的方法。首先,我们使用一种自动的方法来对面部表情对应的每一个空间构建模糊措施。这些模糊措施表达空间模型、描述不同面部动作所引起的不同表情。第二,计算表达式的每个空间的模糊积分的值被视为不同的面部表情的输入样本的可能性。因此,通过这些模糊积分的值,我们的算法提供了一种描述不确定性的面部表情的方法。
本文是通过以下列方式组织的。第二节描述了如何使用模糊积分分类、 模糊测度和模糊积分的理论。第三节提供了形状特征提取和表示的方法。第四节展示了面部表情空间建模的方法。第五节介绍了使用表达空间模型的人脸表情识别的技术。第六届展示实验结果。最后,第七节涉及结论性意见。
2、模糊测度和模糊积分
模糊积分是一种证据融合的方法。它非线性的结合客观证据。基本模糊积分的概念是模糊测度。在这里,我们首先展示模糊测度的定义。
定义在 X 上的模糊测度 g 是一个 set 函数 g︰P (X) →[0,1],满足以下定理:
1)g(Phi;) = 0,g (X) = 1。
2)A isin; B rArr; (A) le; g (B)。
3) ,如果 是增加序列的测度。
满足以下附加属性的P(x)表示 X 的幂集。Sugeno从这个定义出发,介绍了所谓满足以下附加属性条件的模糊测度 ︰
(1)
所有的A,B isin; X,A cap; B = Phi;,lambda; gt; minus; 1。一般情况下,lambda;的值可以由对应的模糊测度 确定。设 X 为有限指数集, 。这种情况下令g (X) = 1,因此,可通过求解以下内容来确定lambda;的值。
(2)
让这两个值等价,
(3)
当及为模糊密度函数的值时,。它的值可以解释为相关信息来源的重要的程度。这种方法很容易求解。根据的根,任何一组密度可由以下公式计算得出:
(4)
模糊积分是一个关于积分模糊测度的实函数。由x计算得出的关于积分模糊测度g的模糊积分函数h在窗体中可被定义为
(5)
当显示指数已被置换位置时,,同时,,。因此有关模糊测度的模糊积分的计算可以通过我们之前提供的每个单独的点对应的密度函数的值求出。
现在有很多用模糊积分来解决分类问题的论文。在任何情况下,分类问题一如既往地遵循以下几点:将归为同一类别的利率,让在以n为特征向量的维度时作为识别特定类的一个特定功能组。在这里,一个特征组也可以包括一个单例。让Q成为识别的对象,再让成为对象Q对类别的偏评定,即是用来显示我们利用组别来进行对象Q在类别中分类的准确性和重要性。现在将每个与重要的程度一一对应,,类别,必须被首先给出。通过密度函数,我们给出了利用模糊积分来分类的算法。
使用模糊积分的关键问题在于密度函数的计算。密度函数描述其对不同类别的不同属性的影响。它可视为类空间的模型。如果密度函数不是正确的,那么分类结果也会出错。所以接下来我们将提供一种有效的密度函数的计算方法。
3、形状特征提取及表征
本节介绍了本文使用过的构建功能载体的方法以及表征表示的方法。我们使用主动外观模型 (AAM) 提取面部关键点。在我们的表现中,我们使用了53个关键点。图1显示的是特征提取的结果。基于非盟的想法,面部表情可以分解为一些基本的行动单位。我们选择的那六种基本面部动作的基本面部表情表如表一所示。我们设计分类的那些基本的形状特征向量运动 (如表2所示)。
后特征提取、特征向量将归一化处理。在本文中,归一化处理是由两部分组成的。首先,我们使用两个内眼角、人中再到一个正常人任意一个中性表情图像。其次,我们使用这三个点构建一个坐标。横跨两眼内部角落的线,是 x 轴。两眼内的中间点是原点。两个内眼角之间的距离是水平方向的长度单位,人中和两个内眼角线之间是垂直方向的的长度单位。利用此坐标,我们可以正常化任意两幅图像。
我们将密度函数视为面部模型的表达空间,因为它在特殊的表达上被定义为类空间,反映了这个子空间的特征。如何计算密度函数是基于模糊积分的识别的关键问题。它既可以从主观上得出也可以从实验数据上得出结果。在本文中,我们使用Adaboost 和分类的错误率来估算密度。
图1特征提取的结果
表1
人脸表情运动
愤怒 |
眉毛向下和挤压,眼睛睁得大大的,嘴唇紧抿 |
厌恶 |
眯着眼睛,嘴巴张开,嘴唇角推下来和抵港 |
担心 |
眉毛向上和压缩,眯起双眼,嘴巴张开 |
悲伤 |
眉毛内角提出,眯起了眼睛 |
快乐 |
闭着眼睛,嘴张大了,嘴唇角推向上和向外 |
惊喜 |
眉起来,瞪大了眼睛,嘴张大了 |
表2
形状特征向量
1 |
左边的眉毛内角在垂直方向的位移 |
2 |
左的眉中间点在垂直方向位移 |
3 |
右眼眉毛内角在垂直方向的位移 |
4 |
右眼眉毛中间点在垂直方向位移 |
5 |
左的眉和右眉毛之间的距离 |
6 |
左眼的高度 |
7 |
左上眼睑中间点在垂直方向的位移 |
8 |
左降低眼睑中间点在垂直方向的位移 |
9 |
右眼的高度 |
10 |
右眼睑中间点在垂直方向的位移 |
11 |
右降低眼睑中间点在垂直方向的位移 |
12 |
口的宽度 |
13 |
嘴的高度 |
14 |
左嘴角在垂直方向的位移 |
15 |
右嘴角在垂直方向的位移 |
16 |
上唇中间点在垂直方向位移 |
17 |
下嘴唇中间点在垂直方向位移 |
18 |
左嘴角在水平方向的位移 |
19 |
右嘴角在水平方向的位 |
4、建立面部表情空间模型
Adaboost 是一种从一个大的弱分类器池选择少量的弱分类器的学习算法。Adaboost 排序弱分类器的分类能力。因此,我们可以使用 Adaboost根据它们在特殊表达式类的作用来给它们的属性排序。使用 Adaboost 算法进行属性排序的详细信息显示如下︰
为了使类别初始化加权,给出;,。
如果 i=1,...,I
1.;;
2.令;
3.重新使,当为归一化因子时,为PDF,此时输出最后的系数。
在此,只是输出值为布尔值的阈值类型弱分类器的标志。此时是形状特征向量的属性值,T 是门槛。I相当于是形状特征向量的维数。是展现动态所引发出来的反映类别对应的可靠性程度的可靠性系数。
我们使用K最近邻分类算法来来预估每一类别的错误率。一种面部表情混淆了所表达的情绪,但又与其它的完全不同。比如,愤怒与厌恶混淆在一起,但没有与快乐和惊讶混淆。因此,我们为每一个类别设置一组错误率来预估最后的错误率。首先,我们组一类集,,哪些元素为一组类为类别。一类组至少包含一个由所有类(本文中有六个类别)类别组成的元素。这类组的其他元素组成类别,其他类别与类别相混淆。例如,此类别设置的愤怒由两个元素组成,。包含六种类别,包含两种类别:愤怒类和厌恶类。其次,对于每一个元素,我们可通过类别的类设置计算出分类的错误率,,在这所有属性中,n是特征向量维数且。然后我们可以计算出平均错误率,,类别的分类属性的错误率可等同于类别设置,。我们可使用文中所述公式(6)中的和来计算类别的。
(6)
当且n足够大时,的根值应该无限接近-1。由于计算机功能的精度范围的限制,输出的根值在某些情况下值为-1.如果,的根将在开区间里。接着我们用公式(7)来估算密度。
(7)
每一组密度都是由特殊类计算得出。它描述了表达类定位的特征向量空间,即特征子空间。所以我们将其视为面部表情空间模型。
- 基于模糊积分的人脸表情识别
为了使用模糊积分来识别面部表情,我们需要一套分类器。在本文中,模糊C均值聚类算法(FCM)被用来设计分类器。FCM可将一属性数据集划分为模糊聚类n。此分区基于模糊组内目标函数的最小二乘法。FCM采用欧氏距离来衡量隶属值。但它并没有考虑类别的协方差。不同的协方差将导致样本点和类别之间存在一段更长的距离,但它更有可能与此类别匹配。所以我
剩余内容已隐藏,支付完成后下载完整资料
资料编号:[152935],资料为PDF文档或Word文档,PDF文档可免费转换为Word
以上是毕业论文外文翻译,课题毕业论文、任务书、文献综述、开题报告、程序设计、图纸设计等资料可联系客服协助查找。