目录列表可在 ScienceDirect
神经计算
期刊主页: www.elsevier.com/locate/neucom
使用狄利克雷树分布增强随机森林的鲁棒头部姿态估计
刘媛媛,陈晶莹,苏志明,罗振真,南罗,
刘乐源,张坤
a华中师范大学电子学习国家工程研究中心,中国武汉
b中国教育技术协作与创新中心(CICET)
c文华学院,中国武汉
文章信息
文章历史:
2014年6月16日收到修改后的2015年3月10日收到
2015年3月23日接受
2015年8月4日在线提供
关键词:D-RF HPE
结合纹理
几何特征修补程序分类
综合加权投票
摘 要
头部姿态估计(HPE)在人机界面中非常重要。然而,各种照明,遮挡,低图像分辨率和广泛的场景使得估算任务变得困难。因此,本文提出了一种狄利克雷树分布增强型随机森林方法(D-RF),以在无约束的环境下高效稳健地估计头部姿态。首先,正/负面部贴片被分类以消除噪音和遮挡的影响。然后,D-RF被提出来使用更有力的组合纹理和分类的正片的几何特征以粗略的方式估计头部姿态。此外,在D-RF的叶片中已经学习了多个概率模型,并且引入了复合加权投票方法来提高该方法的辨别能力。对三个标准数据库进行了实验,其中包括两个公共数据库和我们的实验数据库,头部姿势在不同条件下垂直和水平方向上从-90°到90°跨度,平均准确率达到76.2%,25个类别。所提出的方法也通过从教室中的头顶相机收集的低分辨率数据库进行了评估,平均准确率达到80.5%,15个类别。令人鼓舞的结果表明,在无约束的环境中头部姿势和注意力估计的潜力很大。
&2015 Elsevier 保留所有权利。
1.介绍
实时,强大的HPE算法非常重要,是计算机视觉领域的一个活跃的研究课题 [1,2]。了解人的头部姿势可以提供关于视觉焦点和分析人类行为的重要线索。此外,头部姿势对视频监控,智能环境,人机界面和情感识别等应用至关重要 [3–6]。 由于其实际意义和挑战,有相当数量的工作为头部姿态估计开发了快速可靠的算法。然而,大多数工作在受限环境中报告了良好的结果,由于不受约束的环境如面部外观,姿势,照明,遮挡,表情和化妆等的高度变化,其性能可能会下降。
☆完整文档模板可在 CTAN的elsarticle软件包中找到.
n通讯作者:华中师范大学电子学习国家工程研究中心,武汉。
电子邮件地址: jane19840701@hotmail.com (Y.Liu), chenjy@mail.ccnu.edu.cn (J.Chen), happyszm@foxmail.com (Z.苏), 13720269596@139.com (Z.罗), luonanccnu@hotmail.com (N.罗), lyliu@email.ccnu.edu.cn (L. Liu), zhk@mail.ccnu.edu.cn (K. Zhang)。
因此,本文提出了一种狄利克雷树分布增强型随机森林方法(D-RF),以在无约束的环境下高效稳健地估计头部姿态。
基于不同的特征,几种方法可以简单地分为两类,面部几何特征和基于面部纹理特征的方法。基于面部几何特征的方法通常需要用于面部特征识别的高图像分辨率,诸如眼睛,眉毛鼻子或嘴唇 [7–9]。 这些方法可以依靠精确检测面部特征点和高质量图像来提供准确的估计结果。其他基于面部纹理的方法通常使用整个脸部的纹理特征来估计头部姿势 [10–13]。 处理低分辨率图像可能很好,但对遮挡不太好。在现实生活中,各种照明,遮挡,低分辨率和宽场景使得头部姿势估计变得困难。 为了估计无约束环境下的头部姿态,我们基于组合几何和纹理特征来解决问题。
最近,分类和回归是用于低分辨率图像如神经网络(NN)的头部姿态估计的非常流行的方法 [14],支持向量机器(SVM)[15,16],最接近的原型匹配 [7] 或随机森林 [17,10,8,18]。 Gourier等人 [14] 使用自动关联网络来学习映射
对低分辨率图像进行头部姿态估计。 应用简单的胜者通吃过程来选择原型在NN中最佳匹配的头部姿势。 只有在Pointing#39;04数据库中,他们的偏航角精度为10.3°,俯仰角精度为15.9°[9]。Orozco等人 [16] 训练了一个支持向量机的多类支持向量场景中的姿势分类。已经提出了头部的每个像素与不同姿势的头部图像的平均外观模板的距离特征以训练用于头部姿势分类的多类别SVM。 在四人头像分类中,人群公共空间和低分辨率视频的表现达到了80%的准确率。 在 [7]Wu和Trivedi提出了基于几何结构的连续头部姿态估计的两阶段框架。 第一阶段采用最近的原型匹配方法对粗糙头部姿态进行分类,并在第二阶段对头部姿态进行估计,形成复杂的几何结构。 偏航角和俯仰角的总精度为75.4%。 最近,多级随机森林由于其能够处理大型训练数据集,具有较高的泛化能力和速度以及相对易于实施而成为该领域非常流行的方法。
随机森林是Breiman在2001年引入的一个集合类别家族 [19],它可以用于多级分类 [17,10,13],回归 [8,11],甚至是两者兼而有之 [12,18]。Fanelli等人 [18] 提出了回归随机森林,用于深度相机的实时头部姿态估计。 头部和鼻部尖端在高质量深度图像中定位成功率达到了89%。有些作品 [8,20] 在广义Hough空间中显示了将图像特征映射到投票中的RF功能[21] 或实值函数。 随机森林已经与霍夫变换的概念结合用于物体检测和动作识别。 这些方法使用两个目标函数来优化随机森林的分类和Hough投票属性。Huang等人 [13] 提出了基于Gabor特征的多类随机森林方法进行头部姿态估计。 为了增强判别能力,他们采用LDA技术进行节点测试。 公共高分辨率数据库的成功准确率达到89%。[12] 提出了条件随机森林来估计在各种条件下仅在水平方向上的头部姿态。他们利用一些全局变量的先验知识来约束输出。 在这种情况下,全局变量是头部的方向,分为5类。 野外数据库中的头部姿势类别的准确率达到72.3%。因此,野外和无约束环境下的头部姿态估计仍然是一个挑战和一个重要问题。
为提高野外和无约束环境下的精度和效率,本文将狄利克雷t树分布算法引入随机森林框架来估计头部姿态。本文的想法是利用一些全局变量的先验知识来约束基于输出狄利克雷树分布。狄利克雷树分布是由Minka提出的 [22]。 它是由先验分支概率引起的叶分布概率分布。Minka证明了分配的高精度和高效率。 一些研究人员在多对象跟踪中使用狄利克雷树分布 [23] 面部特征检测 [24] 和情感计算 [25]。在这项工作中,D-RF被提出用于在各种不受限制的环境中以粗糙的方式估计头部姿态。
本文是在会议上发表的论文的延伸 [10]。会议文件主要和不同的贡献如下。首先,为了改善分类,提取来自正面面部贴片的更强大的组合纹理和几何特征(即,基于Gabor特征的PCA,Sobel,LBPH和两个几何特征)以用D-RF估计头部姿态,而不是仅仅ICPRAM文件中使用的纹理特征(基于Gabor特征的PCA和灰度值)。其次,在以前的ICRPAM论文中,单一的概率模型已经被提出
在D-RF的叶子中学习,并使用GMM方法投票叶子。 本文在新的D-RF叶片中学习了多个概率模型(即头部姿态角和两个几何偏移向量),并将一种由分类和回归投票测度组成的复合加权投票方法引入投票的概率改进方法的歧视能力。第三,利用复合加权投票法中的叠加节奏参数pf,通过存储在叶片上的几何偏移向量来控制正片区的数量,从而消除由于人脸变形和大范围头部姿势造成的影响。最后,我们对三个标准数据库进行了更详细的实验,我们从教室的顶置摄像头收集了低分辨率数据库,平均准确率达到76.2%,标准数据库中有25个类别,在我们收集的低分辨率下有15个类别,平均准确率分别为80.5%数据库。
2. 用于头部姿态估计的D-RF
该建议方法的流程图见于图1。在第一阶段,从检测到的面部区域中提取面部贴片并分类为正面/负面贴片,并且提取了来自正面面部贴片的组合纹理和几何特征。在第二阶段,基于我们以前的工作来估计水平和垂直方向的头部姿态,提出了一种结合纹理和几何特征的更精确的D-RF方法。拟议的D-RF由四层组成。 D-L1和D-L2是水平方向上的两层,D-L1表示粗分类,而D-L2是分类分类。在D-L2中,根据D-L1的分类结果估计偏航角。D-L3和D-L4在垂直方向上是两层,D-L3代表水平分类和垂直粗分类,而D-L4代表两个自由头姿态下的最终分类。在D-RF的每个叶子中,有多个概率模型,包括补丁类概率,头部姿态和两个几何偏移矢量。采用复合加权投票方法获得叶子中多头概率模型的最终头部姿态参数。最后,在D-RF的D-L4层中已经获得了最终头部姿态角。详情如下。
2.1 正脸部修补提取
一个面部区域首先被Adaboost检测到,具有Haar-like特征 [26],其中可能包括用于头部姿势估计的一些噪声,例如头发,颈部和闭塞。 为了消除噪音,面部区域被分割成前景和背景区域。 前景区域包括正片和负片,其中正片有助于估计头部姿态,而负片包括遮挡或噪音可能会给任务带来误差。
为了分割背景,将检测到的被标准化为125*125像素的面部区域划分为6*6个非重叠正方形,并且如图2所示计算正方形的直方图分布。我们分析直方图的一致性,补丁的分布以及分割大部分背景补丁。
从其余面部区域随机提取200个贴片,背景被去除,其中包括正面和负面面部贴片。正片和负片分别使用RF进行分类 [17,19]。 为了对随机树进行建模,将正面面部贴片标记为1,将负面面部贴片标记为0。基于Gabor特征和标记贴片的直方图,树T成长。培训和测试类似于RF
阶段1:积极补丁提取 阶段2:头部姿势估计
人脸检测
纹理特征
几何特征
偏航1偏航2偏航3偏航4偏航5
分类
亚森林预测
亚森林预测
D-L1 1 0 -1
D-L2 -2
D-L3
D-L4
1 0 -1
2 1
0 -1
2 1 0 -1 -2
负面补丁 积极的补丁
特征提取
综合体重投票
偏航角度
偏航
综合体重投票
最终角度
{偏航,俯仰}
图1.提出的鲁棒头部姿态估计方法的流程图。
前景广场 背景正方形
面部区域
面部区域的正方形直方图
随机森林
积极的补丁
输入图像面部区域特征提取
负面的补丁
图2.前景和背景的正方形分割。 图3.面部正面和负面贴片分类。
[17,12,18]。当所有的测试补丁都到达树中的树叶时森林中,我们使用存储在一片叶子上的概率p来判断测试补丁是否属于k类,其中k = 1表示积极的补丁,而K = 0代表负面的补丁。该算法图如图3所示。只有积极的补丁是用于使用D-RF估计头部姿势。
D-L4
分类
4-1
分类分类
<s
全文共12531字,剩余内容已隐藏,支付完成后下载完整资料</s
资料编号:[14490],资料为PDF文档或Word文档,PDF文档可免费转换为Word
以上是毕业论文外文翻译,课题毕业论文、任务书、文献综述、开题报告、程序设计、图纸设计等资料可联系客服协助查找。