英语原文共 8 页,剩余内容已隐藏,支付完成后下载完整资料
Content-Based Digital Image Retrieval based on Multi-Feature Amalgamation
Linhao Li
ATamp;T Labs, 200 South Laurel Ave, #D4-3C05, NJ, USA
Email: lli@research.att.com
基于多特征融合的基于内容的数字图像检索
李林浩
AT&T实验室,南劳雷尔大道200号,#D4-3C05,新泽西州,
美国电子邮件: lli@research.att.com
摘 要
在实际应用中,数字图像检索面临着各种各样的问题,应用措施和方法仍然存在一些困难。目前没有明确的算法可以直接显示图像内容的明显特征,同时满足特征的颜色,尺度不变性和旋转不变性,所以我们分析了基于内容的图像检索相关技术。 研究主要集中在7个HU不变矩,边缘方向直方图和偏心率等全局特征上,还讨论了图像阻塞的方法。在图像匹配过程中,提取的图像特征被视为向量空间中的点,通过两点之间的接近度来测量两幅图像的相似度,并通过欧几里德距离和直方图的相交距离来计算相似度。然后提出了一种基于多特征融合的新方法,解决了全局特征和局部特征检索方法存在的问题,它提取偏心率,7个HU不变矩和边缘方向直方图,计算图像各特征的相似距离,然后对其进行归一化。本文对全局特征内部采用加权特征距离形成相似性度量函数进行检索,利用基于极坐标的分割方法提取分块图像的特征。 最后,全局特征和局部特征之间的层次检索的思想是将全局特征如不变矩等的输出结果作为二次检索的局部特征匹配的输入,从而提高准确性有效的检索。
关键词:不变矩;边缘方向直方图;偏心;相似性度量;CBIR;特征
Ⅰ. 介 绍
随着信息和计算机网络技术的迅速发展,基于图像的多媒体信息已经应用到各个领域。我们每天都可以获得大量的数字图像,数字视频信号,音频信号,新闻照片等,越来越多的多媒体数据应用于商业活动,交易和信息呈现。因此,如何高效且正确地表达、存储、传输或检索这些高速数据已成为一个必要研究的问题。传统的字符标记方法相对简单,但人为地标记信息既费时又主观,人为标记信息不能适用于巨大图像和视频的信息,它不能自动有效地描述图像和视频的数据,因此在数据库中无法发现大量的信息。因此,基于内容的多媒体信息检索研究应运而生。最近,基于内容的图像检索(CBIR)技术已成为国内外研究热点之一[1-5]。CBIR基于图像特征,其过程具有很强的客观性,但是在检索结果和视觉一致性方面仍然存在一些问题:
(1) 现有的7个HU不变矩(SHIM),边缘方向直方图(EDH)等[6-8]都是图像的全局特征,这些方法也存在一些缺点。例如,这些方法不考虑图像和空间关系中元素的形成特征。对于一些边界由清晰的几何图像组成的图像,应充分考虑其内部子图像的形成特征。
(2) 目前一些基于子图像局部形成特征的检索方法忽略了图像的空间关系[9,10]。但是,如果某些相似的几何图形出现在不同的空间中,即使这两个图像的每个元素可能都是相似的,人们也会有不同的视觉感受。
(3) 空间位置关系是指与图像分离的多目标相对空间关系。它包括目标之间的相对条件,如目标之间的距离等。然而,局部图像特征和局部图像之间的空间关系也是图像检索的重要特征。在这种情况下,提取被遮挡的图像特征的检索结果不是很理想。
(4) SHIM,EDH和被阻止的图像特征不能全面反映内容。为了解决上述问题并提高图像检索的性能,国内外研究人员提出了基于相关反馈的检索方法用于人机交互的方法[11-16]。用户将评估检索结果,系统将重新计算检索结果以更有效地满足用户需求。
在SHIM,EDH和偏心率(ECC)等单特征检索的基础上,提出了一种综合多特征图像检索方法。该方法首先提取ECC,SHIM,EDH和分块图像特征,计算图像与各特征的相似距离,然后他们将被归一化。ECC,SHIM,EDH等全局特征体现了内部采用同步组合的特点,即综合加权特征距离形成图像检索的相似性度量函数。然后,分块图像特征表示图像的局部特征,并由每个加权子块获取。这些特征相对和完整地描述了关于边界,区域和地方视角的形象。它们在运动,旋转,缩放和镜像中具有不变的特征。
最后,在全局特征和局部特征之间实现分层检索,即异步组合的检索结构。首先,根据HU不变矩全局特征的输出结果,将这些结果作为第二层检索的局部特征匹配的输入,提高了准确性。基于多特征融合的改进方法考虑了三个方面来提高检索性能。
功能选择。SHIM和ECC可以更好地反映全局图像的区域特征,EDH可以提供简单的计算并反映图像的全局边缘特征。为了表达局部特征,本文选取极坐标为基础的闭塞特征进行检索。上述选择的特征可以反映图像的全部内容,因此,这些特征首先被提取以供使用。
在第一次检索时,权重如何分布在检索性能上可能会有所不同。所以当SHIM,ECC和EDH这三个特征加权时,值差异对检索性能有一定的影响。
分层检索的想法。通过使用加权的SHIM,ECC和EDH进行初始检索,获取的结果集将使用被阻止的图像特征在第二层进行详细检索。这个想法可以检索不同层次中的图像。通过第一层检索,我们可以执行详细的检索,以获得更准确的检索结果。
Ⅱ. 相关工作
A.主要方向确定
为了获得分块图像特征的旋转不变性,我们可以根据图像的主方向旋转图像。所以它的主要方向将在旋转后水平向右。形成的主要方向取决于图像的形成特征,可以从轴线方向和水平方向之间的角度来获取。轴方向意味着图像目标像素区域中的最佳长轴方向。从KL变化[17,18]可知,轴方向是具有最大特征的特征向量方向。根据图像的中心矩,计算公式为:
(1)
是图像的(p q)阶中心距,是图像质心,使用角theta;和第三个中心矩来确定形成方向alpha;。
(2)
在进行图像分割之前,需要将主要方向旋转到右侧,然后提取目标区域,以这种方式获得的地层特征在平移,旋转和尺度变化方面具有更好的不变性。图1显示了确定主要方向并提取目标区域的示例。(a)表示图像的形成方向及其垂直方向;(b)示出了提取旋转图像的目标区域的例子,矩形区域是目标区域。
B.目标区域提取
我们采用质心半径法[19],图像像素的质心作为基准点。目标区域通过从每个像素到图像质心的距离来计算。我们画出一个圆,圆心是中心,圆形区是目标区。首先,我们选择二值图像f(x,y)的焦点作为基准点。
,
选择是因为该地区的焦点是全局描述符。其坐标由属于该区域的所有点计算。其次,计算从每个目标像素点到基准点的距离。由于焦点计算的距离对目标区域的平移不敏感,因此从像素点(x ,y)到基准点(x ,y)的距离为
(3)
然后,设置所有像素点到基准点的最大距离为基准点
(4)
L是图像中目标像素点的总数。
最后以Dmax为半径绘制目标像素区域的外接圆,作为图像的目标区域。
C.块状图像的特征提取
当目标区域被分割成多个子块时,我们可以提取每个子块的相应特征。
(1)相对位置。它反映了每个子块的全局焦点位置,即从子块焦点到整个图像焦点的距离。
(5)
考虑到取值的范围差异带来的影响,我们需要归一化距离,表示为
(6)
表示图像子块的区域,用于对距离进行归一化。 它使距离特征远离尺度变化的影响。
(2)像素密度。 子块中的目标像素Pi的密度表示目标像素点的数量。 它反映了第i个块中目标像素的数量。那么假设第i个块的范围是Ai,那么
(7)
像素密度的特征在平移,旋转,缩放和镜像方面会变化。
(3)阻挡图像的相似性测量。 图像之间的相似性可以通过相应地层特征的距离来度量。 对于正在等待检索的图像T0和查询图像Tq,它们的子块特征的距离是
(8)
由于该特征的每个元素具有不同的意义,其幅度可能具有较大差异。 我们不能直接使用求和方法来度量图像的相似度。 因此,我们采用特征距离来归一化它们,并使用求和方法来计算图像之间的特征距离。如果图像数据库包括L张图像特征是 ,那么两幅图像的相似度为:
(9)
其中,是第k个子块的特征权重,且,所有的和为1。
Ⅲ. 拟议方案
A.多特征加权的相似度测量
将T0设置为目标图像,在数据库中有M张图片。由于M个图像在数据库中,存在基数为K的特征距离集。设服从正态分布,其平均值为
(10)
标准差为
(11)
归一化为
(12)
这可以消除由于特征距离不一致而导致的错误。如果F中的每个特征对图像检索有不同的影响,那么当计算图像的相似性度量时,我们可以为每个特征距离添加权重。
图1 目标区域的主要方向确定和提取
我们首先根据图像的极坐标提取遮挡图像的ECC,SHIM,EDH特征,用欧几里得距离计算两个图像之间每个特征的相似距离。 它被标准化为DEC,Dm,DE,DB。 然后将三个全局特征分配权重来计算图像之间的距离为
(13)
B.权重设置
我们的方案基于加权组合ECC,SHIM和EDH的第一层检索。采用欧几里德距离法根据两幅图像的特征计算相似距离。多特征加权组合图像检索中的一个主要问题是不同特征的权重设置。每个图像特征可能对检索的性能有不同的影响。因此,权重设置也会影响检索的性能。在目前的图像检索方法中,解决得不好。在现有的权重分配方案中,最简单的方法是为每个特征分配相同的权重。基特勒[20]已经证实,在一些假设下,这种分配超出了其他特征组合的表现。由于不同用户对不同用户对图像相似性的不同理解,体验也可能会分配不同的权重。文献[21]中的MA提出了一种基于用户评估的设置方法,该方法针对不同的用户对不同的初始权重进行检索。
我们的方案基于加权组合ECC,SHIM和EDH的第一层检索。采用欧几里德距离法根据两幅图像的特征计算相似距离。然后它被标准化为DEC,Dm,DE,。通过公式13计算加权相似距离。
上述设置方法对于本文中的初始系统来说相对复杂。因此,我们应该采用简化的方法,也可以检索性能。通过实验中不同的权重设置方法,比较不同的权重,发现EDH的权重为0.5时,偏心率和SHIM的权重为0.25,可以获得更好的检索结果。比较了等重条件下的结果和后验结果,验证了方法的效果。这是因为SHIM和ECC代表了整体区域特征。 EDH对于反映图像的边界内容显得更为重要。
C.分层检索
层次检索的思想来自Jain和Vallaya的参考文献[22],其中提出了一个双层检索系统。它提出了使用边缘方向直方图与SHIM结合的第一层图像检索。排除与查询图像明显不同的图像。然后使用变量模板方法来精确匹配第二层。引入了由卡内基梅隆大学开发的系统[23],该系统也提到了分级检索的思想。系统将轮廓和骨架提取为特征向量,以便继续后续工作。我们采用本文中提出的分层检索算法[24]。它定义了六个全局特征,这些特征对于旋转,缩放和反色转换是不可改变的。对于用户发布的查询示例,该算法使用分支选择子方法来分析图像的特征重要性。然后自动调用最佳粗糙分割算法进行第一层检索,对不明显相似的图像进行滤波。距离分布直方图用于精确的第二层匹配。该算法可以为两层图像提供不同深度的相似度匹配,并将检索算法作为待检索图像的显着特征。在本文中,我们使用SHIM,ECC和EDH的组合进行初始检索。然后将从图像结果集中获取的分块图像的特征用于第二次检索。
D.基于多特征融合的检索
除了SHIM,ECC和EDH之外,我们还提出了一种使用多特征融合的图像检索方法。其检
全文共13764字,剩余内容已隐藏,支付完成后下载完整资料
资料编号:[13596],资料为PDF文档或Word文档,PDF文档可免费转换为Word
以上是毕业论文外文翻译,课题毕业论文、任务书、文献综述、开题报告、程序设计、图纸设计等资料可联系客服协助查找。