基于机器学习的倾斜摄影数据对象识别算法研究外文翻译资料

 2022-04-25 22:32:03

英语原文共 29 页,剩余内容已隐藏,支付完成后下载完整资料


摘要

该论文为高光谱图像的分类提出了一种基于图的半监督方法,用于处理高光谱图像的特征,像素的高输入维数,低标记样本数量和光谱特征的空间可变性。为了能解决这些问题,该方法将相对地融入三种成分:第一,其使用基于核方法去高效的解决在维度上的问题;第二,采用半监督方法,利用图像中未标记样本的丰富性,通过基于图的方法自然地赋予标记样本相对重要性;最后通过一整簇的复合核函数去整合背景信息。注意到图的方法依赖于对已标记样本和未标记样本两者形成的巨大核矩阵进行逆变换,为了加快分类过程,本文首先引入了Nystrom方法。

该提出的基于图的半监督方法是用于与当前在高光谱数据分类上最有效的SVM方法,该提出的方法产生了一个更好的分类图,其能更好的展现通过标记点和未标记点共同揭示的内在结构,并能在输入不理想的分类问题(高维空间和低标签样本数)中产生良好并稳定的准确率。此外,引入的复合核函数框架能大幅度地改善分类结果,而且新的公式在计算中几乎是线性的。

关键词:

高光谱想分类,半监督学习,不适定问题,复合核,拉普拉斯矩阵,无向图,Nystrom方法

引言:

包含在高光谱图像中的信息可以用于对土地覆盖物的表征,识别和分类,具有良好的准确性和鲁棒性。然而,在高光谱数据的分类中应该考虑几个关键问题,其中有:其一,频谱数量有很多;其二,光谱特征的空间可变性;其三,标记样本的高成本;其四,数据的质量。尤其地,频谱信道数量较多,标记训练样本数量较少,会造成的维数灾难问题,而且其训练结果会存在对训练数据集的过拟合问题。因此,高光谱图像的分类器的理想属性应能使其在处理大量特征,小规模的训练数据集和高度的空间可变性时能产生准确的地物图。

在遥感文献中,已经开发了许多有监督和无监督的分类器来处理多光谱和高光谱数据分类问题。监督方法如人工神经网络,很容易在处理大量的光谱带时效率低下,因此近年来,一般的基于核的方法和支持向量机(SVM)在高光谱图像分类问题中取得了非常好的结果。毫无疑问,基于核的分类器能够高效地处理大的输入空间,并在处理噪声样本中取得很好的鲁棒性。然而,所有监督方法的主要困难在于,学习过程在很大程度上取决于训练数据集的质量,这样的学习仅适用于同时拍摄的图像或在相同条件下拍摄的相同类别的图像。更糟糕的是,考虑到真实样本标签的成本非常高,训练集经常无法得到,或者数量非常少。 另一方面,无监督方法在多光谱和高光谱图像分类中已经展示出了很好的结果。非监督方法对于已标记的样本的数量并不敏感,因为其处理的是整个图像,但聚类后的集群与类之间的关系却不能得到保证。此外,通常进行初步特征选择/提取步骤以减少高输入空间维度,这是耗时的,与情景相关的,且需要先验知识。

在这种情况下,使用半监督分类器可以提高性能是很自然的。在半监督学习中,除了丰富的未标记数据外,该算法还提供一些可用的监督信息。半监督学习的框架非常有效,并在最近吸引了大量的研究,基本上,在文献中遇到了三种不同类型的SSL算法:

  1. 生成式模型,包括估计条件密度p(x | y),如有限混合模型的EM算法,已经广泛应用于遥感图像分类。
  2. 低密度分离算法,同时最大化已标记和未标记的样本的边际,如TSVM,最近已被应用于高光谱图像分类。
  3. 基于图的方法,其中每个样本将其标签信息扩散到其邻居,直到在整个数据集上实现全局稳定状态。

本文重点研究了基于图的方法,这些方法由于其具有坚实的数学背景,与核方法的联系,稀疏性,模型可视化的特点,以及在计算生物学,网页挖掘,文本分类等许多领域取得了良好结果而备受关注。

在本文中,我们介绍了一个半监督的基于图的方法,以前在[31]中提出,在高光谱图像分类的背景下,进一步改进该方法以解决由高光谱图像的特殊特征所产生的问题,即像素的高输入维数,低标记样本数量和光谱特征的空间可变性。为此,该方法具有以下特征:

  1. 核方法,因为所提出的方法是基于核的,高维度的样本可以得到高效的处理。
  2. 半监督的方法。 作为一种半监督的方法,图像中大量未标记的样本被利用来提高性能。
  3. 基于图形的方法。 该方法遵循基于图的方法,因此以自然的方式给出对标签样本的相对重要性。
  4. 基于背景的方法。我们通过引入一系列复合内核,将背景信息结合到分类器中,扩展该项工作。
  5. 快速的方法。最后,注意到该方法依赖于将大型核矩阵(用标记和未标记的像素一起构建)反转,我们使用Nystrom方法重新构造算法,以显着加快分类过程。

该方法在不适定即高维已标记样本的数量较少的分类问题中进行评估。当标签样本数量较少时,通过对所提供的分类图进行目视检查,在准确性和鲁棒性方面进行评估。此外,还特别关注计算成本和自由参数调整的问题。

该论文的其余部分安排如下,第二部分回顾了在半监督学习中图的方法和一致性假设的主要思想。后者引出了了第三节,在第三节中我们提出了半监督的基于图的复合核分类方法。第四部分讨论对比了这种方法的分类结果与不适定问题中的标准SVMs的分类结果,另外,在本节中,我们解决了自由参数调整和计算成本的问题。 最后,第五节包括一些关于进一步工作的结论性意见和指示。

第二部分:基于图的半监督学习

在半监督学习中关键问题是一致性假设,其意义为:(1)图中邻近的点很有可能拥有相同的标签;(2)同一结构下的点(通常是簇或流形结构)很有可能拥有相同的标签。在我们的这种情况下,邻近的点是指光谱相似的像素,因此该假设将被应用于高光谱图像像素的高维空间。这个论点类似于[20],[35] - [38],通常被称为集群假设[20],[37]。注意到第一个假设是基于邻近的点引出的,而第二个是基于全局引出的,传统的监督学习算法,如K-NN,通常都只依赖于第一个假设。

图1 [a]

为了阐述半监督学习下的一致性先验假设,我们先来观察根据两个交织在一起的卫星的图像生成的小数据集(见图1 [a]):每个点应该与其邻近的点相似,而且在一个卫星中的点应该比在另一个卫星中更加相似,分类的结果由结合高斯核函数的SVM(见图1[b])和K-NN给出(见图1[c]),但是,根据一致性的假设,这两个卫星应按图1[d]所示分类。各种半监督学习算法,如光谱方法[35,37,39],随机游走[38,40],graph mincuts [36]和TSVM[25]之间的主要区别在于,在于其实现一致性假设的方式。将这个假设形式化的一个原则性方法是设计一个分类函数,使其能够在由已知的标记点和未标记点所揭示的内在结构上足够平滑。为了构造这样一个平滑的函数,我们在这里提出一个简单的迭代算法,这个算法受到传播激活网络[41,42]和扩散核[43] - [45]的工作的启发,最近的半监督学习和 聚类[35],[37],[46],更具体的是朱等人的工作。[38]。 我们的方法的基调是让每个点迭代地将其标签信息传播给其邻居,直到达到全局稳定状态。

基于图的方法依赖于图表示的构造,其中顶点是(标记的和未标记的)样本,而边表示数据集中的样本之间的相似性(见图2)。通常情况下,图的方法利用图拉普拉斯算子,其定义如下:使图G=(V,E),其中V为节点集,E为边集。每个连接节点i和节点j的边都有所对应的权重Wij。权重矩阵W由已标记和未标记的样本构成,归一化的图的拉普拉斯矩阵定义如下:

L = I - D-1/2WD-1/2, (1)

其中D是一个对角矩阵,其对角元素为Dii =Sigma;j Wij,见[22](第11章)了解不同系列基于图的方法的更多细节。

此时,值得注意的是,预测包括对未标记节点进行标记,因此这些是本质上直接转换的分类器,即该图仅返回未标记样本的预测类标签,而不是在整个域上定义的判定函数。这种基于图的分类可以被看作是估计图上的函数F,其F应该符合平滑假设,也就是说,好的分类函数在相似点之间不应该有太大的变化,这个平滑假设可以通过空间和背景信息的集成来加强高光谱图像分类的问题,这将在下一节中进行描述。

第三节:复合核图分类

在本节中,我们将提出本文所倡导的基于图的方法的整个公式,我们首先介绍一般的图的方法,并在方法中引入一个完整的复合核函数族来整合空间(背景)和谱方法,最后,注意到这种方法的计算成本很高,因此我们建议使用Nystrom方法(结合Woodbury公式)来加快求解。

图2:图在小数据集上的分类,(a)中的两个带阴影的圆是最初的已标记的样本节点(plusmn;1),其余的白色节点代表未标记的样本。边的厚度代表由其所连接的两个节点之间的相似度。(b)图的方法根据带权的距离句对未标记的样本进行分类,不仅仅是根据最短路径,因为仅根据最短路劲会导致样本被错误地分类。两个集群(阴影部分)在直观上是正确的,即使通过(细弱)边缘连接

  1. 基于图的半监督方法
  2. 公式:给定N维输入空间中的像素数据集(N是频带或频谱信道的数量),X = {x1, . . ., xl, xl 1, . . ., xn}sub; RN和标签集L = {1, . . . , c},前l个点xi(ile;l)被标记为yiisin;L,剩下的点xu(1 1le;ule;n)是未标记的,半监督学习的目标是预测未标记点的标签。

令F表示具有非负项的ntimes;c矩阵的集合,矩阵F= [F1T, . . . , Fn T]Tisin;F对应于数据集X上的一个分类,用标签yi = argmaxjle;cFij标记每个点xi。我们可以将F理解为一个向量函数:X→Rc,对于每一个点xi都分配一个向量Fi,定义一个ntimes;c矩阵Yisin;F,若xi被标记为yi = j,则Yij = 1,否则Yij = 0。注意Y要与初始的标签保持一致,在每次迭代T中,算法可以总结如下:

1:边集E了表示为亲和矩阵W,常基于高斯函数定义为:

且当i=j时,Wii=0

2:构造传播矩阵

S=D-1/2WD-1/2 (3)

其中D时对角矩阵,其对角元素dii为矩阵W第i行的元素之和,注意这一步对应特征空间的标准化处理,当然,如果我们考虑由映射样本的点积形成的半定核核矩阵,W = lt;phi;(xi), phi;(xj)gt; = phi;(xi)Tphi;(xj),则经过标准化后的权重如下:

3:迭代传播函数直到收敛:

F(t 1) = alpha;SF(t) (1 minus; alpha;)Y

其中alpha;在(0,1)之间。

这三步应反复迭代直到收敛,若F*表示序列{F(t)}的极限,则每个点xi的预测标签是使用下式完成的:

收敛可得

(7)

因此最后获得的函数F*可以直接有计算获得,不需要进行迭代。

  1. Graph interpretation:该算法可以直观地从实验心理学的角度来理解激活网络[41,42],并解释为图的随机游动[47],第一步,所提出的方法可以表示为在X上定义的图G =(V,E),其中顶点集合V为是X,E为权重为W的边,第二步中,G的权重矩阵W是对称的且经过归一化的,这对于下面迭代的收敛是必需的。前两个步骤与谱聚类[46]完全相同,在第三步中,每一个样本接受来自邻近点的信息(标记传播项),且保留其原有的信息(初始化项)。

关于自定义的参数alpha;,其用于对标记传播项与初始化项的重要性进行折中,值得注意的是,由于亲和矩阵上的对角线上的元素都在第一步的时候被设置为0,样本不会进行自我强化。此外,由于S是一个对称矩阵,信息的传播是对称的。最后,每个无标记点的标签被设置为在迭代过程中它已经接收到最多信息的类别。

  1. 空间谱复合核

在标准的使用中,应注意到在以前所提出的基于图的方法只会使用到光谱的信息,在这里我们提出了一个复合核的工具箱,它考虑了空间和光谱部分之间的空间,光谱和交叉信息。为此,分别根据其光谱内容和其周围地域的一些特征提取,一个像素元素Xiisin;RN(N代表光谱带的数量)将会同时在频谱域,Xiwisin;RNw,和空间域,Xisisin;RNs,中被重新定义。这两种比分开的元素将形成两个不一样但可以很容易进行计算和组合的相似矩阵,此时,可以将频谱和空间专用的亲和度矩阵(分别为Womega;和Ws)进行求和,并在公式中引入空间特征和频谱特征(Womega;s和Wsomega;)之间的交叉信息。这种简单的方法产生了一个完整的高光谱图像分类组合方法,最初提出在[32]监督支持向量机的分类,我们现在将其扩展和应用在基于图的半监督分类上。 全文共23670字,剩余内容已隐藏,支付完成后下载完整资料


资料编号:[13283],资料为PDF文档或Word文档,PDF文档可免费转换为Word

原文和译文剩余内容已隐藏,您需要先支付 30元 才能查看原文和译文全部内容!立即支付

以上是毕业论文外文翻译,课题毕业论文、任务书、文献综述、开题报告、程序设计、图纸设计等资料可联系客服协助查找。