英语原文共 6 页,剩余内容已隐藏,支付完成后下载完整资料
一种新的基于模糊C均值分割策略得到LIP区域识别的应用
米哈拉·戈丹*、康斯坦丁·科托布洛斯*、阿波斯托洛斯·乔治阿基斯*、伊奥尼斯皮塔斯*
*集群技术大学电子系基础-Napoca mihag@bel.utcluj.roConstantin Daicoviciu街,第15号,克拉伊-纳波卡,RO-3400,罗马尼亚*信息学系人工智能和信息分析实验室,亚里士多德塞萨洛尼基大学,盒451,GR-54006塞萨洛尼基,希腊{Costas,Apostolos,Pitas}@zeus.csd.auth.gr
摘要
在基于轮廓处理的唇纹识别系统中,唇轮廓检测问题是一个非常关键的问题。在低对比度灰度图像的情况下,基于均匀区域图像分割的典型轮廓检测策略是失败的。所采用的大多数解决办法需要手动标记一些轮廓点。本文提出了一种适用于唇形轮廓提取的图像分割类的新方法,采用了一种改进的模糊c均值图像分割算法。该解决方案的新颖性在于用于分割的特征类型,不仅包括亮度信息(如模糊C方法的标准使用),还包括图像中像素的空间信息。在对孤立点进行简单滤波之后,提取出所产生的分段对象的轮廓。实验结果优于标准或其他几何约束模糊c-均值法或基于梯度的边缘检测策略,不需要对任何轮廓点进行人工标记。因此,我们认为所提出的策略在唇轮廓自动提取方面有很好的应用前景。
关键词:模糊c-均值,空间约束图像分割,唇轮廓检测
1介绍
基于唇形分析的一类比较大的唇读算法。这样的算法的例子可以在[1-3]中找到。在这些情况下,嘴唇轮廓提取是第一步。唇部轮廓提取通常是指在视听图像序列的第一帧中进行嘴唇轮廓检测的过程。在后续帧中获得唇形轮廓通常被称为唇部跟踪。虽然唇部轮廓跟踪有充分发展的技术和算法来自动执行这一任务,在第一帧中唇部轮廓提取的情况下,情况是不同的。这是一个比跟踪更困难的任务,因为缺乏关于图像中嘴部位置、嘴大小、嘴的近似形状、嘴张开等的良好先验信息,因此,在嘴唇轮廓跟踪中,我们有一个很好的口吻的初始估计。UR从前一帧,这个初始估计并不总是可用于第一帧,但它必须通过某种手段产生。不同的作者尝试不同的程序来解决一个良好的嘴唇轮廓提取的初始帧。当然,目标是自动解决这一任务,提出了基于区域的图像分割和边缘检测等方法。这些方法在轮廓图像和说话人戴口红或反射标记的正面图像中的效果相当好。然而,在没有嘴唇的任何标记的正面图像中,不幸的是,上述技术失败,并且这些图像是最常用的用于朗读的图像。在灰度图像中,唇部轮廓的自动提取变得更加困难,嘴唇和皮肤之间的色差信息不再存在。通常这些图像具有低对比度,因此基于区域的分割和边缘检测算法不能提供良好的结果[1,2]。在这些情况下,所采用的解决方案是基于手动地在嘴唇轮廓上标记点或从插补或几何造型中检测嘴唇轮廓,或者甚至手动绘制整个唇形轮廓。模糊C均值算法是一种成功的图像分割算法。有许多可视化应用报告模糊C均值的使用,例如在医学图像分析、土壤结构分析、卫星图像中。[4-6]。不幸的是,实验表明,它仍然不适合将嘴唇图像分割成嘴唇和皮肤区域。问题在于,在其标准使用中,由于仅检测到灰度均匀性,所以所得到的区域不是空间连续的。因此,我们建议使用模糊C-均值,以确保分割后的空间连续区域。以前的方法使用模糊C-均值几何约束的报告[7-9]。这些方法是基于使用额外的步骤来更新模糊分区,其中考虑在不同大小的邻域(通常为3times;3)的像素的几何性质的步骤。然而,在模糊C均值算法中使用的特征与标准方法相同:像素的灰度级(颜色分量强度)。本文提出的方法是基于以下原则:修改的特征还包括关于像素的空间位置的信息,而不仅仅是它们的灰度值。目前我们使用最简单的方法来包括空间信息:每个像素由亮度、x和y坐标来表示。对于应用的解决方案,在小尺寸的图像上,这种技术允许我们获得非常好的分割结果,优于模糊C均值的标准使用和空间约束的模糊C-均值[7,8]的其他版本,而不需要任何手动标记的轮廓点。
2基于模糊C均值的图像分割策略需要一种新的嘴巴图像分割策略到两个均匀区域,即嘴唇区域和皮肤区域,来自观察,在特定的应用中,对于灰度级嘴巴图像的标准模糊C均值算法,所得到的对象不紧凑,意义,像素的分离到嘴唇和皮肤区域没有准确地完成。换句话说,仅仅是像素的灰度值不足以区分嘴唇和皮肤,也由于图像的低对比度;两个类中都存在许多离群值,因此它们很难被过滤掉。图1(b)给出了一个例子。因此,我们建议在数据中添加新的特征,以分类/聚类,旨在保存相邻像素的拓扑结构,考虑到嘴唇和皮肤区域都是空间连续区域的事实。换言之,具有相似亮度的相邻像素应该保持在一起,并且类之间的距离应该考虑空间距离和灰度距离。要做到这一点,最直接的方法是考虑每个数据点所代表的空间位置和它的灰度级。因此,我们将具有三维特征空间,其中嘴部图像PI的每个像素将由其x和y坐标及其亮度L表示:pi = (xi yi li )T其中: xi isin;[0...W minus;1];W图像宽度;yi isin;[0...H minus;1];H–图像高度;li isin;[0...LMax minus;1]; LMAX–最大亮度水平,例如256。所有特征向量的三个分量都具有整数值,因此,对于Wtimes;H大小的图像,待分割的数据集是P= {P1,P2,hellip;,PWH}。这个数据集将形成话语的宇宙,在C类中被划分。在我们的特定应用中,虽然类是皮肤和嘴唇,但有时更有利的是将皮肤分割成两个区域(以确保它们的凸性),从而导致C=3类而不是C=2的数目。包含C类的隶属度的划分矩阵(C=2或C=3),u=[uij]的大小ctimes;w h,以及类中心的集合,v= {v1,hellip;,vc},结果最后作为模糊C-均值算法的输出。这里,每个VI是包含x坐标、y坐标和亮度值的三个分量Vi=(VXI VYI VLI)T的矢量。划分矩阵应满足与标准模糊C均值相同的约束条件。利用欧几里得距离,使代价函数最小化:J m(u,v)=Sig-Sig-Wh c uij m(p j·vi)(t p j·vi)(2)j=1 i=1在模糊C均值的标准使用中,我们将加权系数m设为m=2。然后,改进的模糊C-均值算法在以下步骤中迭代地运行:
步骤1:将C设置为2或3(取决于嘴部图像的照度变化)。
步骤2:设置收敛误差ε=0.001%。
步骤3:集M=2。
步骤4:随机初始化分区矩阵,u= u0。集合j=0。
步骤5:如果= MAX=(UIK J·UIK J=1)>ε,则进入步骤6。否则,转到步骤7:I 1,hellip;,C;K 1,hellip;WH
步骤6:6.1:J=J 1;6.2:计算类中心:W Sigih H(UIKJ(1))2pi;Vij= k为每个i=1,hellip;,c6.3:更新模糊划分:Uik-alpha;-εNC=1alpha;-((PPKK,-VVNI)(TT PPKK,εVVIN)),对于所有i=1,hellip;,C,K=1,hellip;,W·H=2,alpha;=1。6.4:转到步骤5。
步骤7:设置最终的分区矩阵u= uJ和最终类中心向量v= vJ。在得到最终分割结果后,我们将所有数据标记为最可信类。类标签由对应的类中心VI的灰度级编码,I=1,hellip;,C,即:对于每个k,k=1,hellip;,w,h,pundefinedk=(xk yk vLi)t,使得UIK=nMAX=1,hellip;,C,所提出的基于区域的分割方案的最后一个步骤是指消除每个区域内存在的离群值。分割图像中的像素被定义为离群点,如果其周围的3times;3邻域中的大多数像素属于被调查的像素的另一类。在这种情况下,像素被标记为离群值,并且在第二遍中,它将被“移动”到其大多数邻居所属的类。以这种方式,将消除“嘈杂”类决策,结果是一组光滑连续的区域。
3.该策略在低对比度灰度图像唇形提取中的应用如引言所述,基于模糊C方法的图像分割新策略的最终目标是改进唇轮廓提取。在低对比度灰度口腔图像中,出现了关键问题。在这里,我们区分两类图像,这需要两种不同的方法:(A)中-低对比度灰度口腔图像,光照略有变化.在这种情况下,我们可以同时处理整个口腔图像,但由于口腔图像内的光照变化和皮肤区域的非凸性,可能需要在C=3类中进行分割。也就是说,一个类代表嘴唇,另两个类代表皮肤区域,这样每个皮肤区域都是凸的。(B)极低对比度的灰度级口腔图像,具有可变的光照。在这种情况下,将所提出的模糊c-均值算法同时应用于整个口腔图像,仍然不能提供较好的分割结果。一个更好的方法是把口腔图像分成四个子图像,左上角、右上角、左下角和右下角。因此,在对每个子图像进行分割,并在每个子图像上提取轮廓后,我们将得到一个分段的唇形轮廓,最后通过插值将其连接起来,图1(A)给出了一个将口腔图像分割成4个子图像的例子。目前只考虑闭口图像中的唇轮廓提取。对于张口图像,包括牙齿区域、舌区等,类数会增加。在这里我们必须注意到,在将口腔图像分割成4个子图像的情况下,只需要在C=2个类中进行分割,因为现在子图像中的皮肤区域变得凸化了。前三个处理步骤:数据集建立、改进的模糊c-均值算法和孤立点滤波。最后一步的分割方案是确保基于区域的分割策略的最终目标:找到嘴唇轮廓。一旦我们有了一个好的基于区域的分割,这就变成了一个简单的任务。我们必须注意,对于C=3类的口腔图像分割,我们可能会在梯度图像中得到两个皮肤区域之间的额外边界,或者嘴唇区域内的边界,这并不代表嘴唇边界,但是这些假边界可以很容易地根据它们的形状或区域来识别,或者因为它们不是封闭的边界,因为嘴唇轮廓必须是。与传统的边缘检测方法或简单的基于模糊c均值区域的分割方法相比,提取的唇形轮廓的质量要好得多。
4.实验结果
为了评价新提出的基于区域分割策略在唇轮廓检测应用中的性能,我们在C语言中实现了上述系统。通过对一组不同灰度的口腔图像进行视觉检测,对分割后的图像和提取的唇形图像进行检测,并将其叠加到原始口腔图像上,对结果进行了估计。将所提出的分割策略与模糊c均值的其他变体进行了比较:标准模糊c-均值;规则基邻域增强(RB-NE)模糊c-均值[7]。作为测试集,我们选择了两类口腔图像:(1)中等-低对比度的灰色口腔图像:我们从“莉娜”、“丽莎”和“女孩”的图像中手工选择由嘴巴组成的矩形区域;(Ii)极低对比度的灰色口腔图像,来自视听数据库郁金香1[10]:受试者安东尼、本、坎迪斯、乔治的闭嘴图像。这些图像在分割前被分割成四个子图像。来自类(A)的原始图像和来自测试集的类(B)(Subject Anthony)的一个示例测试映像如图1(A)所示。图1(B)、(C)和(D)分别给出了标准模糊c-均值、提出的模糊c-均值和Rb-NE模糊c-均值的分割结果。我们可以直观地看到在所有测试用例中所提出的策略的更好的性能。与其他算法一样,我们的算法失败的唯一情况是针对郁金香1数据库中描述的口腔图像的下半部分。图1.一些原始口腔图像(A)及其应用不同变种的模糊c-均值算法的分割结果:(B)标准模糊c-均值;(C)提出的模糊c-均值算法。模糊c-均值的增强;(D)Rb-NE模糊c-均值。从左到右,四个原始图像代表:“女孩”、“莉娜”、“丽莎”的嘴部;“郁金香”中“安东尼”的嘴部形象,分为四个子图像。图2.得出区域边界后提出的修正模糊c-表示分割的例子;从左到右:用于口腔图像的“莉娜”;“丽莎”;“安东尼”(郁金香1)。图2显示了基于区域的分割图像的一些边界,这些边界重叠在原始的嘴图像/子图像上。在这里,我们注意到提取的嘴唇轮廓的良好质量。3类分割图像中存在的假边界很容易被过滤掉,因为它们要么是非封闭边界(所以它们不能是唇边界),要么边界是封闭的,但不是最外层的边界,所以不能是外唇轮廓。
5.结论
针对第一帧低对比度口腔图像的唇轮廓提取问题,提出了一种新的低对比度灰度图像目标边界提取方法。从一种著名的算法模糊c-均值出发,我们修改了模糊c-均值算法的标准用法,在特征向量中加入了像素位置的空间信息。在一组低对比度灰度口图像上的实验结果表明,与标准模糊c-均值或其他几何制导模糊c-均值相比,该算法在分割区域的紧凑性方面具有更好的性能。提出的解决方案使得完全自动化的轮廓提取成为可能,因为不需要手动标记唇轮廓上的点。在我们未来的研究中,我们将研究在特征向量中包含一些纹理特征,以及在模糊c-均值算法中使用更详细的距离度量,以获得更好的聚类形状可变性。
参考文献
[1]R.Kaucic,B.Dalton,A.Blake(1996),“用于视听语音识别应用的实时唇跟踪”,PROC。欧洲委员会计算机视觉,剑桥,英国,第376-387页
[2]J.Luettin,N.A.Thacker,S.W.Beet(1996),“视觉语音特征提取的主动形状模型”,“人和机器的语音识别”,北约ASI系列,F系列:计算机和系统,斯普林格·维拉格,柏林,150:383-390
[3]I.Matthews,T.Cootes,S.Cox,R.Harvey,J.A.Bangham(1998),“使用形状、阴影和比例尺拼读”,Proc。听觉-视觉语音处理,悉尼,澳大利亚,第73-78页
[4]S.E.Crane,L.O.Hall(1999),“学习识别磁共振图像中的模糊区域”,第18页。NAFIPS,第352至356页
[5]P.Thitimajima(2000),“用于多光谱卫星图像分割的一种新的修正模糊c-均值算法”,PROC。地球科学和遥感专题讨论会,第一卷。4,第1684-1686页
[6]D.L.Pahm,J.L.Prince(1999),“磁共振图像的自适应模糊分割”,IEEE Trans工况on Medical Image,第二卷。18,No.9,pp
全文共5982字,剩余内容已隐藏,支付完成后下载完整资料
资料编号:[13879],资料为PDF文档或Word文档,PDF文档可免费转换为Word
以上是毕业论文外文翻译,课题毕业论文、任务书、文献综述、开题报告、程序设计、图纸设计等资料可联系客服协助查找。