英语原文共 6 页
用于浏览和检索图像数据的纹理特征
摘要-
基于图像内容的检索正在成为一种重要的研究领域,应用于数字图书馆和多媒体的数据库。本文的重点是图像处理方面,特别是使用纹理信息来浏览和检索大图像数据。我们建议使用Gabor小波特征纹理分析,并提供全面的实验评估。与其他多分辨率纹理特征相比,
使用 Brodatz纹理数据库表明Gabor特征提供了最佳模式检索准确性。浏览大型空气照片的应用程序说明了这一点。
关键字-
数字图书馆,图像数据库,基于内容的图像检索,纹理分析,Gabor小波
1.引言
基于图形查询的图像数据的检索是一个有趣且具有挑战性的问题。最近出现的多媒体数据库和数字图书馆使得这个问题变得更重要。虽然可以在一定程度上使用手动图像注释来帮助图像搜索,但是这种方法的可行性对于大型数据库是一个值得考虑的问题。在某些情况下,例如面部或纹理图案,简单的文本描述可能是模糊的,并且通常不适合数据库搜索。
本文的目的是研究使用纹理作为图像检索的图像特征。图像可以被视为不同纹理区域的马赛克,以及与这些区域相关联的图像特征可用于搜索和检索。一个典型的查询可以是用户提供的感兴趣区域,例如概述卫星图像中的植被斑块。在这种情况下的输入信息是矩形窗口内的强度图案或纹理。参见图6,以获得基于纹理的浏览应用程序示例。
纹理分析具有悠久的历史,并且纹理分析算法的范围从使用随机场模型到诸如小波变换的多分辨率滤波技术。一些研究人员已经考虑过将这种纹理特征用于模式检索[18],[19]。本文重点介绍基于Gabor滤波器的多分辨率表示。Gabor滤波器在提取纹理图像特征中的使用中受到各种因素的驱动。在最小化空间和频率的联合二维不确定性的意义上,Gabor表示已被证明是最优的[4]。这些滤波器可以被视为方向和尺度可调边缘和线(条)探测器,并且给定区域中这些微观特征的统计通常用于表征基础纹理信息。 Gabor功能已用于多种图像分析应用程序,包括纹理分类和分割[l],[14],图像识别[5],[8],[13],图像登记和运动跟踪[15]。
本文的主要贡献概述如下:
1)提出了一种基于Gabor特征的简单纹理特征表示,并提出了一种滤波器设计策略来减少表示中的冗余。
2)提出了一种自适应滤波器选择算法,可以方便快速的图像浏览。3)提供了与其他三种多尺度纹理特征的性能的详细比较。 我们提出的表示在特征计算和检索准确性方面比较有利。
4)最后,演示了浏览大型空中照片的应用程序。
2. 纹理特征提取
2.1 Gabor函数和小波
二维Gabor函数g(x,y)及其傅里叶变换G(u,v)可写为:
其中
Gabor函数形成完整但非正交的基础集。使用该基础扩展信号提供了局部频率描述。现在考虑一类自相似函数,在下面的讨论中称为Gabov小波。设g(x,y)为母Gabor小波,然后通过生成函数通过g(x,y)的适当扩张和旋转得到这个自相似滤波器字典:
其中,K是方向的总数。(3)中的比例因子a-m意味着确保能量与m无关。
2.2 Gabor滤波器字典设计
Gabor小波的非正交性意味着滤波图像中存在冗余信息,并且使用以下策略来减少这种冗余。 设U和U表示感兴趣的下中心频率。 令K为取向数,S为多分辨率分解中的刻度数。 然后设计策略是确保频谱中滤波器响应的半峰值幅度支持相互接触,如图1所示。这导致以下公式用于计算滤波器参数和。
其中,m = 0,1,...,S - 1。为了消除滤波器对绝对强度值的响应灵敏度,2D Gabor滤波器的实部(偶数)分量通过增加一个常数来偏置,使它们成为零均值(这也可以通过设置G(0,O)来实现)在(2)中为零。
图1.轮廓表示Gabor滤波器字典中滤波器响应的半峰值幅度。 使用的滤波器参数是Uh= 0.4,Ul= 0.05,K = 6,和S = 4。
2.3特征表示
给定图像I(x,y),然后定义其Gabor小波变换为
其中*表示复共轭。假设局部纹理区域在空间上是均匀的,并且变换系数的大小的平均和标准偏差用于表示用于分类和检索目的的区域:
现在使用和构造特征向量作为特征组件。 在实验中,我们使用四个尺度S = 4和六个方向K = 6,产生特征向量。
2.3.1距离测量:
考虑两个图像模式i和j,并且让和表示相应的特征向量。 然后将特征空间中两个图案之间的距离定义为
其中
和是整个数据库中各个特征的标准偏差,用于标准化各个特征组件。
2.4检索性能
2.4.1纹理数据库
实验中使用的纹理数据库由116种不同的纹理类组成。 512 x 512图像中的每一个被分成16个128times;128个非重叠子图像,从而创建1,856个纹理图像的数据库。 以下查询模式是数据库中1,856个模式中的任何一个。 然后处理该模式以计算特征向量,如(7)中所示。 计算距离d(i,j),其中i是查询模式,j是来自数据库的模式。 然后按递增顺序对距离进行排序,然后检索最接近的图案集。在理想情况下,所有前15个检索都来自相同的大图像。 性能是根据平均检索率来衡量的,平均检索率定义为与前15个匹配中的查询模式属于同一图像的模式的平均百分比数。
我们观察到除了均值之外使用,特征可以显著提高检索性能。 这或许可以解释[3]中报告的Gabor滤波器的低分类率,其中仅使用了平均值。在前15个检索图像中有平均74.37%的正确模式。 如果相反地考虑前100个(整个数据库的约6%)检索,则性能增加到92%(即,存在15个正确模式中的13个以上)。 一些检索示例如图2所示。第4节给出了与其他纹理特征的详细比较。
图二:使用Gabor功能进行纹理浏览。 显示的示例是一些难以分析的模式。 平均检索率显示在括号中:(a)纹理浏览界面,包含所有116种纹理和D42检索,花边(50%),(b)D43,摆动灯泡(54%),(c)D23,海滩 鹅卵石(54%)和(d)D91,云(25%)。 (b) - (d)中的每一个中的第一图像表示查询图像。 请注意,某些不正确的匹配实际上看起来与查询模式非常相似。
3. 自适应滤波器选择
在许多情况下,希望尽可能减少图像处理时间,同时不严重影响整体性能。 减少计算的一种方法是以模式相关的方式选择Gabor滤波器。
通过考虑每个组件的平均类内到类间距离比,可以获得对各个特征的辨别质量的了解。 这个比率平均约为0.25,频率成分越高,识别效果越好[16]。 在数据库搜索中,人们通常感兴趣的是通过使用特定特征来找出可以消除多少搜索空间。 假设我们想要在检索到的图像集中保留属于同一模式的所有15个正确纹理。 平均阈值约为30%,并且与前一种情况一样,高频分量具有更好的辨别力。 更多细节可以在[16]。 这些实验表明,每个特征组件可以单独提供有用的区分测量,通过基于查询模式选择性地选择这些过滤器,可以进一步改善。
这里描述的选择方案使用光谱信息结合平均数据库图像属性来选择滤波器的子集。 目的是识别突出的查询图像属性,最好将其从数据库项目中删除。 图3显示了该方法的示意图。 输入图像图案的光谱与平均光谱之间的差异提供了关于给定图像的显着光谱特性的信息。令
其中是输入图像模式的傅里叶变换。 和是与数据库中所有图像模式的傅里叶变换分布相关的均值和方差。 D(u,v)基本上是由与每个频率分量(u,v)相关联的方差归一化的差的能量。 每个滤波器的评估基于其频谱覆盖范围内的总差异能量:
其中是滤波器的频率响应。 值越大,滤波器的性能越好,用于模式检索。 因此,可以基于对滤波器进行排序。 图3示出了输入模式具有强定向偏好的示例,其将模式与许多数据库图像区分开。 仅使用前四个过滤器,可以在前15个检索到的模式1161中平均检索大约50%的正确模式。这种策略在许多图像数据库应用中可能是合理的并且相当于显着节省图像处理。putations。 图4示出了使用不同数量的滤波器的一些示例。
计算(7)的整个Gabor特征向量需要9.3秒的CPU时间(在SUN-Sparc20上的MATLAB中,参见表2)。 搜索和检索大约需要1.02秒。 仅使用四个要素组件需要2.3秒的特征提取时间,包括自适应滤波器选择(0.7秒),以及大约0.1秒的搜索和检索。
4.实验结果
本节将详细比较最近提出的其他一些多分辨率纹理图像特征。 对于Gabor特征情况,使用24 x 2分量特征向量。 示出了用于浏览大型空中照片的应用程序。
4.1与其他纹理特征的比较
使用传统的金字塔结构小波变换(PWT)特征,树状结构小波变换(TWT)特征和多分辨率同时自回归模型(MR-SAR)特征进行比较。 用于计算PWT的滤波器系数是16抽头Daubechies正交小波[61(与TWT中[3]中使用的相同)。 128times;128图像模式被分解为小波变换的三个级别(4times;3 = 12个波段)。 对应于每个分解级别的每个子带的能量分布的平均值和标准偏差用于构造(12times;2)特征向量。
在[3]中,每个级别的图像子带的分解基于能量考虑,并且这导致树结构分解,其中不同的图案具有不同的结构。 对于模式检索应用,具有固定结构是方便的。 可以通过顺序地分解LL,LH和HL子带来获得固定的d&组成树。 HH带不会分解,因为这通常不会导致稳定的特征。 三级分解产生52(4(1 3 9))个子带。 如在PWT中,每个子带中的平均值和标准偏差用于构造52times;2分量特征向量。
使用的第三组特征是MR-SAR模型特征[17]。 以前的工作[9],[20]表明2,3级和4级的MR-SAR特征提供了最佳的整体性能。 在每个级别,计算五个参数以表示纹理,因此总共需要15个特征组件。 马哈拉诺比斯距离用于比较特征向量。
4.1.1比较总结
表1提供了实验结果的总结。 它显示了数据库中116个纹理类中每个纹理类的不同纹理特征的检索精度。 Gabor功能在接近74%的检索时提供最佳性能。 紧随其后的是MR-SAR功能,占73%。
表格1
数据库中116个纹理图像的平均识别率。
D *标签显示来自BORDATZ ALBUM [2]和O *标签的纹理表示USC数据库的纹理。
表2
CPU时间(在带有一个处理器的SUN SPARC20上)和各种纹理特征的特征向量长度。在MATLAB中重新编写GABOR特征,并且所有其他的都用C语言书写。
TWT功能比PWT功能(68.7%)略微好一点(69.4%)。 图5示出了将该检索性能表示为所考虑的最高匹配数的函数的图表。 综上所述,
1.通常,对应于较高频率的特征分量具有更好的区分性能。 然而,在树形结构表示中分解HH频带经常导致性能降低,表明这些特征不是非常稳健。
2.不同小波变换的实验表明,相对于滤波器的选择,性能变化很小[10]。
3.TWT功能的边际改进是以牺牲具有更大的特征向量为代价的,这增加了与索引和搜索相关的开销。
4.为每个不同的特征集探索不同的相似性度量是很重要的。 例如,使用马哈拉诺比斯距离而不是欧几里德距离将MR-SAR特征的性能从64%提高到73%。 归一化欧几里德距离对所有其他距离更好。
5.对于Brodatz图像,使用Gabor特征的最佳结果是使用每个尺度内的四个尺度和六个方向获得的。 请注意,不解决旋转和比例不变性。
表2提供了用于数据库的特征提取和顺序搜索的CPU时间。 涉及Gabor特征的计算在MATLAB中执行,其他特征计算在C语言中实现。 在特征计算时间方面,MR-SAR是最昂贵的。
图5.根据所考虑的最高匹配数量的检索性能。
图6.使用Gabor纹理特征浏览大型空中照片的示例。 (a)部分显示了图像的下采样版本和植被图案的检索结果,(b)查询模式包含高速公路的一部分,检索全部来自公路段,(c)显示包含某些区域的区域 建筑物(左侧图像的中心),(d)显示一个有趣的结果,其中查询包含图像上标记的数字(左下角),顶部匹配也包含相似的模式。
4.2图像浏览示例
基于纹理属性的查询将在图像和多媒体数据库中具有许多应用。 在这里,我们通过一个例子来描述我们当前关于将这些功能用于浏览大型卫星图像和空中照片的工作。 这项工作涉及UCSB亚历山大数字图书馆项目[21],其目标是创建一个空间索引数据的数字图书馆,如地图和卫星图像。 这种数据库中的典型图像范围从几兆字节到几百兆字节,在图像分析和视觉数据化方面构成了具有挑战性的问题。 基于内容的检索在此上下文中非常有用,可以回答诸如“检索云量小于20%的圣巴巴拉的所有LANDSAT图像”或“查找看起来像这个区域的植被补丁”之类的查询。
我们目前正在研究使用纹理基元来在图像内或类似图像上实现基于内容的快速浏览。 图6显示了浏览5,248 x 5,248张空中照片的示例。 以128times;128像素的块分析原始图像,并计算纹理特征并将其存储为图像“元数据”。 用户可以选择任何位置并使用该模式来搜索相似的区域。 我们目前的工作是将简单的基于纹理的分割方案结合到此浏览中,从而允许任意形状的区域进入分析。
4.3讨论
提出了一种基于Gabor小波的纹理分析方案,并演示了其在图像数据库中的应用。使用大量纹理给出该方法的
资料编号:[4094]
以上是毕业论文外文翻译,课题毕业论文、任务书、文献综述、开题报告、程序设计、图纸设计等资料可联系客服协助查找。