英语原文共 7 页,剩余内容已隐藏,支付完成后下载完整资料
图像数据的快速增长已经增加了在许多应用方面高效处理它们方法的需求,包括艺术馆,数字图书馆,生物制药,军事和教育方面。考虑到这些方面,基于内容的图像检索(CIBR)技术,已经被开发出来用于从一系列图像集中检索需求的一系列图像。这项技术利用视觉内容例如颜色,纹理,形状和图像内在的空间联系。这与传统的基于文字的图像检测系统利用关键词注释图像特征不同。一项成熟的关于大图像数据库的关键词注释技术是很花费劳力的,一次CIBR被开发出来作为一种更好的基于文本的图像检索技术。
一、简介
许多关于研究和商业的CIBR系统已经在近几年得到了很快发展。但是CIBR系统仍然不能达到令人满意的图像检索表现。这主要的由于低水平的视觉特征(颜色,纹理,形状)和高水平的人类感观之间的语义代沟。考虑到这些,关联性反馈被引入用于克服这种代沟。关联性反馈是一种交互式机制使得用户参与其中。在这种框架下,用户提供他们对于检索后图像的关联性的判断。然后系统基于反馈学习用户信息需求。许多关联性反馈算法被引入系统中并且被证明能合理地改善CIBR的表现。一些著名的方法包括优化查询(query refinement),权系数调整(feature re-weighting),统计学习(statistical learning),神经网络(neural networks)和支持向量机(support vector machine)。
优化查询(query refinement)和权系数调整(feature re-weighting)是CIBR常用的关联性反馈方法。优化查询(query refinement)尝试通过移动寻找一个在关联图像和飞关联图像之间最佳的查询点。其中最著名的方法是Multimedia Analysis and Retrieval System (MARS)。权系数调整(feature re-weighting)技术通过更新矢量特征的重点来强调矢量特征的组成来帮助检索相关图像,同时弱化那些阻碍的进程。它运用开放式构想运用经验来调整权重参数。统计学习(statistical learning)通过模仿数据库中可能的图像分布发展。贝叶斯分类器也同样被用于基于反馈样本的图像检索。正向样本被用来评估高斯分布,代表这查询中需要的图像,同时负向样本被用来调整被检索图像的方向。神经网络(neural networks)因考虑到它的学习性能和更新的能力被应用于交互式图像处理。模糊径向基函数网络已经提议通过模糊关联性反馈去学习用户的模糊视觉概念认知。它提供了一种普通的模拟用户对于图像相似性认知的方法。另一种CIBR的关于关联性反馈应用的方法聚焦于SVM。SVM是一种强大的学习机器。它在一个特征空间的两个类中寻求最大的边缘值,作为一个最优分类超平面。基于SVM的主动学习被应用于认真选择用户提供的样本,为了达到用户所期望的最大目标值。它会选择最靠近超平面的未知图像作为反馈最有利的参考。
尽管之前有关于CBIR系统关联性反馈系统的研究,但开发有效和高效的交互机制以获得令人满意的检索性能仍然是一个具有挑战性的任务。关联性反馈相关的一个主要问题是小样本问题。这是因为用户通常没有足够的耐心来标记大量的图像。因此,关联性反馈方法的性能往往受到训练样本不足的制约。为了解决这个问题,我们已经做了一些工作来整合无标记的数据来提高学习性能。判别期望最大化(D-EM)算法被加入用来将未标记的样本合并到估计的潜在概率分布中。结果是有希望的,但是对于大数据库来说计算的复杂性十分重要。对文本分类的转换支持向量机通过整合无标签的数据来解决问题(TSVM)。它也被应用于图像检索。该方法会将未标记的图像合并到初始的SVM中,然后是要求的主动学习。然而,在某些情况下,该方法的性能可能不稳定。将先验知识引入到SVM中来解决小样本问题,所有这些方法都显示了一些有希望的结果;然而,很少有能有效地从标记和未标记的数据中学习的系统。
计算机智能,因其人工智能提供的数学模型,由于其有效性而被应用于该项目。应用算法的主要原则可以简洁地描述为:将有用的未标记图像识别为伪标记的候选对象,将伪标记图像中嵌入的模糊性集成到方案中,并开发适当的计算技术以优化学习。系统的数据识别、智能信息集成和鲁棒学习对计算智能技术的要求很重要。计算智能假设,模拟智能背后的基本推理在于它的计算。我们的工作中使用了两类计算智能,即SVM和模糊逻辑。我们在本文中开发了PLFSVM框架。通过利用标签图像的特征,对未标记的图像进行仔细的选择,并指定“相关”或“无关”的伪标签。这一过程将扩大训练数据集。由于这些图像没有被用户明确标注,所以在他们的类信息中存在潜在的不精确。考虑到这些,模糊隶属函数被用来估计伪标记图像的类符合度。然后把模糊的信息加入到FSVM中进行主动学习。
这篇论文的其他部分概述如下。第二节解释了小样本问题和PLFSVM的形成。第三节我们讲述了FSVM并详细讨论了伪标签估计方案。我们进一步说明用来确定伪标记图像的隐式类符合度的模糊隶属函数。在第四节,讨论了使用该方法的实验结果,并与其他方法进行了比较。最后,在第五节中给出结论。
二、小样本学习
A、小样本问题
在关联性反馈的CBIR系统中,由于对于用户不友好,训练样本的数量通常是小的;具体来说,它不会让用户给太多的图片贴上标签。因此,小样本问题在交互式CBIR系统中很突出。即使对于一个强大的学习机器,如SVM,从如此少量的训练样本中学习可能不会产生好的检索结果。因此,需要找到关联性馈所面临的小样本问题的解决方案。
因为获得大量的标签图像是需要花费大量劳动力的,而没有标记的图像是容易获得的,我们建议利用未标记的图像来增加可用的标签图像。仔细选择未标记的图像,以便它们有利于检索性能;否则,如果使用不当,就会降低性能。每一个被选中的、未被标记的图像都被分配到一个“相关”或“无关”的伪标签,这是基于在第III-C小节中解释的算法。这些伪标记图像在本质上是模糊的,因为它们没有被用户明确标记。因此,应该考虑到其潜在的不确定的类信息。模糊逻辑为模拟数据的不确定性提供了一种自然而又灵活的方法。我们利用模糊隶属度函数来确定每个伪标记图像的不确定性程度,从而将这些图像的相对重要性放在环境中。然后将这些伪标记的样本与标记的样本结合起来训练SVM。该算法的细节将在第三节中解释。
B、伪标签图像的主动学习
SVM是由Vapnik引入的一种强大的学习机器,基于结构风险最小化的思想,它已经应用于许多应用领域,包括文本分类、语音识别、数据挖掘和通信,并表现出优于传统的学习机器。对二元分类的支持向量机的基本思想是,它在一个特征空间的两个类中寻求最大的边缘值,作为一个最优分类超平面。尽管它具有优秀的泛化性能,但它仅限于清晰的分类,每个训练示例都属于一个或一个具有同等重要性的类。然而,在许多实际应用中,不同的训练数据具有不同的重要性,应该考虑到这种模糊的性质。因此,提出了FSVM来解决这个问题。FSVM是支持向量机的扩展。它可以考虑到培训数据的不同重要性。FSVM在我们的框架中展示了以下特性:模糊数据的集成、强大的理论基础和优秀的更新能力。
我们开发了一个统一的集成了伪标签和FSVM的优点的PLFSVM框架。和CBIR系统中大多数只关注标签数据的反馈方法相比,选择的PLFSVM利用未标记的数据来提高检索表现。值得注意的是,PLFSVM在几个方面与传统的SVM不同。PLFSVM被开发为通过处理伪标签图像来解决小样本问题,而传统的SVM只能处理有标签的图像。更重要的是,PLFSVM的用户工作负载更少,这样它更适合于实际应用,例如在带宽有限的网络上进行图像检索。最后,PLFSVM可以考虑到训练样本的相对重要性,因此,更通用和更灵活。
在新的框架下,PLFSVM发展的几个重要问题需要解决。(i)为伪标记选择正确的图像,(ii)伪标签的确定,(iii)对伪标签图像的不确定性程度的估计,以及(iv)将伪标记图像集成到基于fsvm的主动学习中。为了解决这些问题,提出了以下观点:(i)开发了一种两阶段聚类算法,用于选择伪标记的无标记图像,(ii)提出了一种类似于k近邻(KNN)的相似度度量方法,用于伪标签赋值,(3)建立了一个合适的模糊隶属函数来估计伪标记图像的类隶属度,并通过在训练时强调标记图像多于伪标记图像来使用FSVM。
主动学习的目的是实现最大的信息增益或最小化决策的不确定性。它选择最丰富的样本来查询用户的标签。在各种主动学习技术中,基于SVM的主动学习是目前最有前途的方法之一。它的目的是选择最大限度地减少支持向量机的版本空间的样本。它选择最接近当前SVM决策边界的样本作为信息最丰富的点。离边界最远的样本被认为是最相关的图像。我们在这项工作中采用了相同的选择策略。将PLFSVM的优点整合到积极的学习中,我们可以通过更少的用户标识来获得改进的检索性能。
三、伪标签模糊支持向量机
A、回顾之前采用的框架
采用的PLFSVM是一个统一的框架,在CBIR的背景下将伪标签合并到FSVM中。框架概述如下。
1、给定用户提交的查询,系统使用用于相似性匹配的欧几里得距离来执行KNN搜索。最接近的l 0图像显示给用户反馈。
2、用户提供对l 0图像的反馈,作为相关的或无关的。基于l 0标记图像,对初始SVM分类器进行训练。
3、通过选择最接近当前SVM决策边界的l未标记图像来进行SVM主动学习。
4、在用户标签后,将l图像添加到先前标记的训练集。
5、两阶段聚类分别在标签相关和无关的图像上进行。然后,将生成的集群用于未标记的图像选择和伪标签分配。
6、用模糊度度量方法对伪标记图像的软相关性进行评价。
7、一个FSVM训练使用标记和伪标记图像的混合。
8、重复步骤3-7,直到检索性能令人满意为止。
B、构想的FSVM
我们先提供一段关于SVM的简介。让成为一系列n的训练集,而是一个输入的m维度的样本,是Xi的一个类标签。SVM首先将输入数据映射到一个高维特征空间通过映射函数,发现最小的最优分离超平面分类错误。超平面可以表示为:
,(1)
其中w是超平面的法向量,而b是一个标量。通过求解以下优化问题,可以得到最优的超平面:
最小化 ,
其中 ,
啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊 (2)
其中C为正则化参数,控制了边际最大化和分类误差之间的权衡。被称为松弛变量,它与SVM中的分类错误有关。优化问题可以转化为以下等价的对偶问题:
最小化,
其中 (3)
其中是拉格朗日因子,SVM决策函数可表述为:
, (4)
其中K(x i,x)是输入空间中的核函数,它计算特征空间中两个数据点的内积。利用内核的技巧,我们可以在不知道映射的情况下,在特征空间中构造出最优的超平面.
FSVM是支持向量机的扩展,它考虑到训练样本的不同意义。对于FSVM,每个训练样本都与模糊隶属度相关联。成员价值反映了数据的保真度;换句话说,我们对数据的实际类信息有多大的信心。它的价值越高,我们对它的类标签就越有信心。FSVM的优化问题如下所示。
最小化 ,
其中 ,
啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊 (5)
可以注意到,的误差项是由隶属度来衡量的。糊成员值用于在SVM的成本函数中权衡软惩罚项。加权的轻罚术语反映了训练时训练样本的相对忠诚。具有较大值的重要样本在FSVM训练中会比那些值较小的样本有更大的影响。
与传统的SVM相似,FSVM的优化问题可以转化为其对偶问题如下:
最小化,
其中 (6)
求解式(6)将导致与(4)相似的决策函数,但有不同的支持向量和相应的权重。
C.未标记图像选择和伪标签估计。
仔细地将未标记的图像合并在一起,有助于获得良好的检索结果。如果选择不当,那么未标记的图像可以降级,而不是提高性能。在此工作中,我们建议利用标记图像的特征来选择伪标记的无标记图像。其基本思路是在未标记的图像种群中识别某些样本,它们与标记图像“相似”,然后进行伪标记和模糊隶属度估计。这将扩大训练数据集。
标记的相关图像通常表现出图像相似性的局部特征。为了开发此属性,需要采用多集群的本地建模策略。考虑到图像相似度的局部多聚性,我们采用两阶段聚类过程来确定局部簇。标记的样本根据其类型聚集:相关的或不相关的。K-means聚类是最广泛使用的聚类算法之一。它找到一个分区,其中每个集群中的数据点尽可能地接近彼此,并且尽可能地从其他集群中的数据点。它使用一种迭代算法,将每个数据点的距离最小化到其各自的集群中心。尽管K-means集群具有吸引人的特性,但它对所选择的集群的数量和初始估计有很大的敏感性。为了解决这一难题,我们采用了两阶段的聚类策略。首先,将减法聚类作为预处理步骤来估计簇的数目和结构。然后,K-means使用这些估计来执行基于迭代优化的聚类。减法聚类是一种快速、高效的方法,不需要预先指定簇的数目。
聚类后得到两组独立的簇,相关的和不相关的集合。我们使用与K-NN技术相似的启发式参数;也就是说,更紧密的数据点往往有类似的类标签。我们为每个标记的集群选择K最近的未标记的邻居,基于它们的Euclidean距离到标记集群的中心。然后将每个标记的集群的标签(相关的或无关的)传播给未标记的邻居。这被称为伪标记过程。由于计算成本会随着伪标签图像数量的增加而增加,因此
全文共6873字,剩余内容已隐藏,支付完成后下载完整资料
资料编号:[14543],资料为PDF文档或Word文档,PDF文档可免费转换为Word
以上是毕业论文外文翻译,课题毕业论文、任务书、文献综述、开题报告、程序设计、图纸设计等资料可联系客服协助查找。