英语原文共 6 页,剩余内容已隐藏,支付完成后下载完整资料
基于多尺度距离矩阵的快速植物叶片识别
摘要:在本文中,我们提出了一种新颖的基于轮廓的形状描述符,称为多尺度距离矩阵,用于捕捉形状几何形状,同时对平移,旋转,缩放和双边对称不变。描述符进一步与降维相结合以提高其判别能力。所提出的方法避免了在大多数先前使用的形状识别算法中遇到的耗时的逐点匹配。因此它用于实时应用程序是快速且合适的。我们将所提出的方法应用于计划叶片识别任务,并对瑞典叶片数据集和ICL Leaf数据集这两个数据集进行了实验。实验结果清楚地表明了所提出的描述符的有效性和有效性。
关键词:成本矩阵,内部距离,多尺度距离矩阵(MDM),植物叶片,形状识别。
Ⅰ.介绍
形状是对象最重要的特征之一。它在许多物体识别任务中扮演着关键角色,在这些任务中,物体可以通过形状而非其他特征(如边缘,角落,颜色和纹理)轻松区分。通常在形状识别方法,形状表示和形状匹配中有两个关键部分。根据形状表示的选择,形状识别方法一般可以分为两类,即基于轮廓的类别和基于区域的类别[1]。
在过去的十年中,由于以下原因[1],基于轮廓的形状识别[2]-[17]的研究比基于区域的形状识别更加活跃:首先,人类被认为主要通过轮廓特征来区分形状。其次,在许多形状应用中,只有形状轮廓是有意义的,而内部内容并不重要。同样,在这篇简短的文章中,我们关注基于轮廓的形状识别。最近已经提出了几种基于轮廓的重要方法。 Petrakis等人[3]提出了一个有效的基于轮廓的方法使用动态规划(DP),这是不变的转变,缩放和旋转。Belongie等人[2]提出了一种称为形状上下文(Shape Context,SC)的形状特征,它通过一组捕获地标分布的二维直方图来描述形状。Ling等人[10]通过用关节不敏感的内距代替欧几里得距离将SC扩展到内距SC(IDSC)。麦克尼尔等人[6]介绍了一种多尺度形状匹配算法,名为Hierarchical Procrustes Matching(HPM),它研究各种不同位置的形状匹配。 Felzenszwalbetal[9]描述了一种称为形状树(ST)的分层形状表示,以在不同的分辨率级捕获形状几何。Xu等人[13]提出了一种称为轮廓柔性(CF)的形状描述符,它表示轮廓上每个点的可变形势。从这些方法中,我们得出结论:轮廓点之间的相对位置包含关于对象结构的丰富信息,多尺度表示可以更好地捕捉形状的几何倾向。
虽然上述基于轮廓的有前途的识别性能的方法已经被报道了,但他们不得不面对一个关键问题,即如何在匹配阶段解决两个形状之间的对应关系。解决方案通常需要计算两个形状之间的距离,作为相应点或片段之间匹配误差的总和。许多现有的基于轮廓的方法已经应用了DP程序来解决这个问题,这是非常耗时的[2]-[4]。因此,计算效率更高的替代解决方案是实时应用的理想选择[1]。
在这篇简短的文章中,我们提出了一种新颖的基于轮廓的形状描述符,称为多尺度距离矩阵(MDM),用于捕捉形状的几何结构,同时对平移,旋转,缩放和双边对称不变。使用MDM进行形状识别时,不需要使用DP构建明智的对应关系,这使MDM成为高效的形状描述符。另外,MDM在底层建筑距离方面具有灵活性:在MDM中可以使用欧几里德距离或其他度量来计算两个形状的不相似度。此外,我们申请降维方法提取MDM提取判别信息,进一步提高了该方法的效率和准确性。与其他基于轮廓的方法(如SC和IDSC)相比,MDM可以实现可比较的识别性能,同时运行速度更快。
我们将所提出的方法应用到植物叶子识别任务中,最近引起了研究的关注[4]。自动植物叶片识别对于植物分类非常重要[18],并且电子现场指南或在线检索系统通常需要实时性能。我们的实验是在两个植物叶子数据集上进行的:瑞典叶[19]和ICL叶[20]。由Soderkvist建立的众所周知的公共数据集“Swedish Leaf”已经通过许多形状识别方法进行了测试[4],[9],[12],[16],[17],[21]。 [22]。然而,它只涉及15种,这使得对其进行分析的效果不够一般化。最近,为了提供更大的数据集以进行更全面的评估,我们收集了包含6000种植物叶片图像的ICL Leaf数据集,这些图像可以从[20]中免费下载。
本简介的其余部分安排如下:第二部分给出了MDM的定义。然后第三节报告实验结果。最后,第四节总结了整个简报。
Ⅱ多标度距离矩阵
A.两阶段形状识别方案
典型的基于轮廓的形状识别方法包含两个阶段:形状表示和形状匹配。我们可以将基于轮廓的方法分为两个子类,即基于局部和基于全局的方法,如图1和图2所示。1和2基于局部的方法提取形状的局部特征,然后找到匹配阶段中的轮廓点的对应关系,而基于全局的方法提取形状的全局特征,并执行匹配而不找到轮廓点的对应关系。显然,我们在第一部分提到的所有以前的方法都是基于本地的方法。
另一方面,全局方法也被应用于形状匹配。一个例子是普查变换直方图(PACT)的主成分分析[22]。 在PACT中,使用普查变换(CT)直方图将局部形状信息归纳为全局特征,然后将主成分分析(PCA)[23]应用于CT直方图以提取CT直方图分布中最重要的成分。但是,PACT对于旋转和缩放并不是不变的。相比之下,我们提出的MDM是一个基于全球的功能,并且不受旋转和缩放的影响。因此,它在形状识别问题上有更广泛的应用,同时它也和PACT一样高效。
B.MDM
我们将形状O定义为R平方的连通和闭合子集。 给定形状O的轮廓上的n个采样点p1,p2,...,pn,其中每个点具有坐标(xi,yi),可以构造ntimes;n距离矩阵D,其中Dij表示点pi和点pj之间的欧几里德距离。 显然,这个距离矩阵是对称的,所有对角线条目都是零。
基于D,可以通过以下步骤计算MDM:
1) 对于矩阵D的每一列,它都是循环移位的,以便第一个元素变为零。 这样,就构成了一个新的矩阵Dm,其中第一行具有直零点。
2) 对于Dm的每一行,其元素都是按照顺序排列的。这产生矩阵Dms。
图1.基于局部方法的两阶段方案。
3)对于Dms,我们删除它的第一个和最后一个行来构建一个新的矩阵,这是基本的MDM。图3说明了如何构建MDM的一个例子,其中n是4。对于矩阵Dms,每行记录一个形状的几何特征的一定范围。例如,第一行的条目全部为零,这是每个点与其自身之间的距离。 第二行的条目是所有点和它们旁边的点之间的距离,它捕捉了形状的最佳水平几何属性。对于其余的Dms行,这些条目捕获较粗糙的几何特性。随着行向下移动,条目可以捕获更粗糙的几何属性,直到行数达到,其中最粗糙的几何属性存在。很容易看出封闭的轮廓。第二行Dms与最后一行相同,两者描述间隔为1的点之间的距离。由于类似的原因,大约一半的Dms行是冗余的,应该删除。
图2.基于全球方法的两阶段方案。
图3.构建MDM的示例说明。
在图4中,给出了从叶形中提取的MDM的例子。对于这种叶子形状,在轮廓上采样了64个点,因此其MDM的大小为32times;64.在特征矩阵[Fig.4(e)],蓝色条目表示较小值,而红色条目表示较大值。我们选择矩阵的四行来说明特征。点之间的距离为绿线。图4(a),(c),(d)和(f)分别描绘了MDM的第1,8,16,32行。可以注意到,第一行描述了形状的最好级别,最后一行描述了形状的最粗糙级别。
考虑到图像中形状的轮廓,图像的平移与轮廓点之间的距离无关,因此MDM对于平移而言是不变的。
图4.叶子的不同行MDM (b)叶片图像和 (e)提取叶片的MDM,绿色连接对应于初始的(a) (c)MMD的第八行(d)MMD的第十六行(f)MDM的最后一行。
通常,图像的旋转将改变轮廓点的顺序。计算MDM时,排序步骤自然会忽略点集的原始顺序,并带来旋转的不变性。但是这一步也会导致原始距离矩阵的一些重要判别信息的丢失。为了在Dm中保留尽可能多的信息,我们循环地计算沿Dm每一行的相邻元素之间的差异,并且也对它们进行排序。具体而言,对于具有条目d1,d2,...,dn的Dm的行,该行的圆形差为d2 d1,d3 d2,...,d1 dn。然后,我们可以将这种差异矩阵添加到MDM的底部,以构建一个新的MDM-CD矩阵,该MDM-CD矩阵将MDM的大小加倍。
请注意,形状的顺时针和逆时针轮廓将导致矩阵Dm的列的顺序不同,但不会影响矩阵Dms。因此,这两个订单都会生成完全相同的MDM描述符。换句话说,MDM对形状的双侧对称性不敏感。在许多情况下,具有双侧对称性的形状应该划分为一类,但这种不变性在某些应用中可能不是合适的属性。
为了使MDM不变缩放,我们使用不同的归一化方案引入MDM的五个标准化版本,即MDM-M,MDM-A,MDM-C,MDM-RM和MDM-RA。MDM-M,MDM-A和MDM-C分别使用整个矩阵的最大值,整个矩阵的平均值以及轮廓点与形状的质心的最大距离对MDM进行归一化。 MDM-RM和MDM-RA分别使用每行的最大值和每行的平均值对MDM的每一行进行规范化。
我们现在将降维应用于提出的描述符以提高其效率和有效性。 一般而言,降维方法试图通过线性变换在高维输入空间中找到低维子空间。该低维子空间可以提供紧凑表示或提取高维输入数据的最高判别信息。 众所周知,PCA [23]和线性判别分析(LDA)[24]是两种典型的降维方法,可以分别视为最简单的无监督和监督降维方法。通常,在大多数情况下,LDA可以获得比PCA更好的识别性能。然而,传统的LDA患有小样本量(SSS)问题,并且解决方案是近似的并且有时不稳定。为了解决这个问题,Jia等人[25]提出了分解牛顿法(DNM)以迭代的方式解决LDA。Li等人 [26]提出了最大裕度标准(MMC),将LDA的目标函数从比率形式改为差异的形式。事实上,DNM和MMC与LDA一样有效,但不会遭受SSS问题。在我们的方案中,为了简单和鲁棒性,在从形状轮廓中提取MDM特征之后,我们将DNM和MMC应用于降维,然后使用欧几里得距离和最近邻规则(1NN)进行分类。
C.MDM的扩展
上面介绍的MDM在构建距离矩阵D时使用欧几里得距离。我们可以通过使用不同的距离度量来扩展MDM。一种这样的测量是IDSC[10]中使用的内部距离(ID),以通过替换SC中的欧几里得距离来实现关节不敏感[2]。两点之间的内距是两点之间形状最短路径的长度,内距矩阵的计算可参考文献[10]。 为了进一步探究MDM的可辨性,我们用矩阵D的内部距离来扩展矩阵D,并且保持其他分量不变。我们将这种描述符命名为多距离距离矩阵与内部距离(MDM-ID)。
除了欧几里得距离和内部距离之外,一对点之间的其他不相似性度量可用于扩展MDM描述符。这些度量标准可能没有明确的几何解释,但它们可能对某些应用程序有效且有用。例如,在MDM中,我们也可以使用基于直方图比较的成本距离矩阵,如[2],[10]中使用的那样。在这种情况下,距离矩阵中的每个条目是不同形状上的两个点的匹配成本,其中每个点由其SC或IDSC直方图表示。要计算同一形状上的点之间的差异性,我们只需要将直方图比较方法应用于一个形状和它自己的形状。我们称之为多尺度成本矩阵(MCM)。一般来说,MCM的每一行都可以在一定范围内捕捉轮廓点之间的不相似度的统计特性。请注意,MCM与实际几何距离无关,并且缩放本质上不变,因此它不具有不同归一化的版本。
Ⅲ实验与讨论
为了验证所提出的方法,我们将它们应用于叶形分类任务,使用两个叶数据集:瑞典叶数据集和ICL叶数据集。 后者是我们自己收集的,以弥补前者的局限性。 请注意,还有另一个公共数据集,即史密森叶数据集[10],其中包含来自93个物种的343种树叶。然而,它平均每个物种少于四个图像,因此不适合于广泛的实验。
在这篇文章中,我们比较了所提出方法与IDSC和经典傅里叶形状描述符(FD)[1]的识别性能,原因有几个。首先,IDSC已经成功地应用于叶子形状分析,并被用于真实电子现场指导系统[4],[10]。其次,IDSC是一种典型的局部形状描述符,其计算复杂度与其他许多类似,这使得它成为比较合理的选择,因为我们主要关心的是效率问题。第三,FD是一个经典的基于全球的描述符,运行速度非常快。 因此,它是评估所提出的方法的精度 - 效率折衷的最佳选择。第一部分提到的其他方法如ST [9],HPM [6]和CF [13]由于缺少文献中的一些技术细节,难以公平执行。
对于每个形状,我们在其轮廓上统一采样128个点,并在这些点上构建MDM。采样点也用于IDSC。请注意,要应用降维方法将MDM转换为矢量,最终特征维度通过实验确定,范围从20到50。注意DNM和MMC在大多数数据集上具有非常相似的目标函数和相似的性能,但没有一个总是优于另一个。 因此,在我们的实验中,我们分别在瑞典叶型数据集和ICL Leaf数据集中报告了其中的最佳结果。
表一 在瑞典叶数据库上的识别率(%)
表二 在干净的瑞典叶片上的识别率(%)
图5.来自瑞典Leaf数据集的八个样本
图6.来自Clean Swedish Leaf数据集的八个样本
A.瑞典叶数据集的实验结果
瑞典叶数据集[19]包含来自15种瑞典树种的分离叶,每种物种有75叶。图5显示了一些代表性的例子。遵循先前工作的协议[9],[12],[19],[22],每个类的前25幅图像用于训练,其余50幅图像被用于测试。
在表1中,我们报告了不同版本的MDM的识别率,其中DNM的方法用于降维。在本表中,我们还列出了[10]中报告的IDSC和FD的识别率。从结果中我们得出几点看法:首先,具有#39;-CD-#39;的MDM版本的识别性能比基本版
剩余内容已隐藏,支付完成后下载完整资料
资料编号:[465766],资料为PDF文档或Word文档,PDF文档可免费转换为Word
以上是毕业论文外文翻译,课题毕业论文、任务书、文献综述、开题报告、程序设计、图纸设计等资料可联系客服协助查找。