基于像素和对象特征的遥感图像支持向量机分类方法
Chun Liu, Liang Hong, Sensen Chu, Jie Chen
College of Tourism and Geography Science, Yunnan Normal University, Kunming,
GIS Technology Research Center of Resource and Environment in Western China of Ministry of Education, Kunming, China;
School of Geosciences and Info-Physics, Central South University
摘要
根据基于像素的多特征分类和地面过度平滑的“盐和胡椒”效应详细介绍了基于对象的图像分析,在本文中,一种方法,它融合了基于像素的功能和基于多尺度对象的功能提出了提高图像精度的特征分类。(1)首先,采用均值偏移算法进行分段图像获得过分割区域。多尺度通过合并超分割结果得到分割结果。分割尺度之间的关系并分析了各个尺度的分类精度,以及找到最佳比例。(2)其次,物体的光谱特征最佳尺度、基于像素的光谱特征和目标初始化分割尺度的谱特征是归一化的(3)最后,通过以下方法实现了基于像素和基于对象特征的分类方法:支持向量机(SVM)。实验结果证明我们的方法不仅能有效地减少基于像素的算法的“盐和胡椒”效果但是保持地面物体的完整性并保留细节。容易混淆的分类准确度(例如阴影与街道)也得到了改善。
关键词:高分辨率图像融合;多尺度;支持向量机
1 引言
近年来,许多高空间分辨率遥感卫星相继发射成功,成为地球空间信息的主要数据来源。随着遥感图像分辨率的显著提高,地面特征信息越来越丰富和细化,使得光谱差在类内越大,类间越小。这一现象广泛出现,同一物体光谱值不同,不同物体光谱特征相同,使得传统的基于像素的光谱分类面临巨大挑战。近年来,基于像素的光谱、纹理、几何等多种特征的遥感图像解释方法和基于对象的图像分析(OBIA)受到了国外的关注和研究。
针对传统的基于像素的多特征分类和基于对象的图像分析的优缺点,提出了一种将基于像素的光谱特征和基于对象的多尺度特征相结合的方法,以提高图像分类的准确性。首先,采用均值偏移算法对图像进行过分割;然后将分割结果合并成不同的尺度,得到多尺度的分割结果。分析了不同尺度对分类精度的影响,得出了最优尺度。将最优尺度的谱特征与基于像素的谱特征相结合,对多类型特征进行归一化。最后,利用支持向量机(SVM)实现了分类。选择高光谱高空间分辨率遥感图像数据集进行实验。通过上述方法与我们的方法的一系列对比实验,证明了我们的方法不仅能有效地降低基于像素的算法的噪声,而且能保持地面特征对象的完整性和细节的完整性。容易混淆的类别(如阴影与街道)的分类精度显著提高。
图1 遥感图像SVM分类流程图
2 研究区域和数据
研究区域是意大利北部帕维亚市的中心。纬度和经度坐标分别为北纬45°N和东经92°E。2002年7月8日上午10:30至中午12:00,由反射光学系统成像光谱仪(ROSIS)获取机载高光谱图像。谱带数为102,几何分辨率为1.3米。该图尺寸为1096times;715,将其分为9类典型的地面特征(水、树木、沥青、自挡砖、沥青、瓷砖、阴影、草地和裸地)。测试集和训练集。训练集和测试集中每节课图像中的选择点。这些数据集由帕维亚大学的P.Gamba教授提供。
(a)高光谱遥感图像 (b)测试集 (c)训练集
图2 PAVIA中心图像
3 方法与实验
(1)多尺度图像分割
基于对象的图像分析方法的核心技术是图像分割和特征空间聚类。遥感图像分割的质量直接影响到基于对象的图像分类的准确性。目前,遥感图像的分割算法主要有分水岭变换、模糊集理论[5]、数学形态学、小波变换、马尔可夫模型和均值漂移算法、分形网络演化算法(FNEA)等。
均值漂移(MS)算法是一种基于核密度梯度估计的无参数快速统计迭代算法,适用于聚类问题。与其他分割算法相比,均值偏移算法具有以下优点:1。它具
有成熟的理论基础;适用于相互独立的采样点之间的并行计算和迭代;带宽参数具有明确的物理意义;具有较强的抗噪声能力;单波段或多波段处理是在一个统一的框架下进行的。在上述分析的基础上,利用均值漂移算法对高分辨率遥感图像进行初始分割,得到初始分割对象。平均移位算法分割包含3个参数,空间域带宽、光谱域带宽,为了获得精确的目标边界,然后得到了帕维亚中心图像的初始分割结果。结果存储在区域邻接图(RAG)的数据结构中
表1 训练和测试设置的点数
类别 |
训练集中的点数 |
测试集中的点数 |
水 |
824 |
65971 |
树 |
820 |
7598 |
沥青 |
816 |
9248 |
自封砖 |
808 |
2685 |
沥青 |
808 |
7287 |
瓷砖 |
1260 |
42826 |
阴影 |
476 |
2863 |
草地 |
824 |
3090 |
裸露土壤 |
820 |
6584 |
。
下一步是基于初始分割结果实现多尺度区域合并。合并过程是根据相邻区域的均匀性和面积大小[14]。在多尺度区域合并过程中,不同尺度会产生不同的对象大小和数量。小尺度值时,目标量大,地面特征分割得更详细,但可能导致地面物体过分割,难以描述物体的整体特征;大尺度值时,地面物体的完整性较好,但可能造成一定的失范。AILS;当比例值太大时,可能会导致错误地分割对象的边界。因此,对于一个特定的特征或应用,选择一个合适的尺度来适当地反映对象的特征是非常重要的。本文将Pavia中心图像分割成5个尺度,尺度参数序列为[5 15 25 35 45],不同尺度下得到的一小部分分割结果如图3所示。
(a)尺度参数5 (b)尺度参数15 (c)尺度参数25 (d)尺度参数35 (e)尺度参数45
图3 多尺度分割局部表示
本文主要依据单尺度分割结果的分类精度来选择最优尺度。小尺度值时,目标量大,地面特征分割得更详细,但可能导致地面物体过分割,难以描述物体的整体特征;大尺度值时,目标量小,地面物体的完整性较好,但可能造成一定的失范。这里我们只考虑定义每个光谱带中每个物体的像素数字的平均值。图4显示了尺度、物体数量和整体精度之间的相关性分析。实验结果表
明,基于对象分类的总体精度在3级中最高。
(2)基于像素和基于对象的光谱特征融合
考虑到基于像素和基于对象的分类算法的优缺点,我们提出了一种将这两种算法融合在一起的方法。我们选择基于像素的光谱特征和基于目标的最佳尺度光谱特征作为多类型特征。多类型特征被规范化为[0.1],因此可以输入它们来支持向量机进行分类。为了进行比较,还进行了其他纹理特征的实验,如局部二值模式(lbp)和灰度共生矩阵(glcm)。
(3)基于支持向量机的分类
支持向量机(SVM)是一种基于统计学习理论的机器学习算法。其核心思想是通过非线性映射将样本投影到高维特征空间。以结构风险最小化(SRM)为原则,在高维特征空间中构造维数,并将其优化为分类平面。将分类风险的上界最小化,使未知样本的分类具有最佳的平均分类精度。近年来,支持向量机在遥感图像监督分类中得到了广泛的应用。与其他分类器相比,支持向量机的优势在于学习速度快,精度高,训练样本少,数据量大。现有实验表明,支持向量机可以克服高光谱图像分类中常见的休斯现象。在本文中,我们直接使用开源软件包libsvm来实现SVM分类。为了消除对多类型特征数据大数值差分类精度的影响,首先将多类型特征归一化到[0.1]的范围,然后输入到支持向量机。
(4)准确度评估
实验结束后,采用定性和定量相结合的方法对分类结果进行评价。对于定量方法,我们通过与测试数据逐像素对比,计算了混淆矩阵、总体精度(OA)和kappa系数。对于定性方法,我们在结果图上直观地区分地面特征的完整性和细节,以识别分类质量。4种不同特征组合下的分类图,它们仅基于像素,基于对象的比例为3,基于对象的比例为5,结合了基于像素和最佳比例的基于对象的特征。为了评价非并行支持向量机在遥感图像分类中的有效性,利用印度油松、C1、DAIS和SALINASA数据集进行了实验。Aviris数据集是使用机载可见/红外成像光谱仪(Aviris)传感器在印第安纳州西北部的一片松树上获取的。数据集由145个像素和145列的场景组成。在由Aviris传感器获取的220个光谱带中,有20个被噪声影响而被移除。实验中使用的训练和测试数据分别为4757和4588。第二个数据集flightline c1,数据集由飞机扫描仪flightline c1拍摄的图像生成。数据集有11414个培训数据和70588个测试数据,具有8个类和12个功能。另一个数据集由DAIS 7915机载成像传感器获取,图像大小为512像素x 512像素;具有3200次培训和3800次测试数据,具有8个SND 65级功能。最后一个数据集取自加利福尼亚州萨利纳斯山谷的图像,该图像由Aviris传感器采集。它由6个类组成,204个特性,其中5348个样本作为基本事实。
(a)仅使用基于像素的光谱特征;(b)使用比例1基于对象的光谱特征;(c)使用比例3基于对象的光谱特征;(d)使用比例5基于对象的特征;(e)同时使用基于像素和比例3基于对象的光谱特征
图4 使用不同方法的遥感图像分类图
表2 不同特征组合精度
标号 |
功能组合 |
OA(%) |
kappa系数 |
A |
象素 |
89.34 |
0.8564 |
B |
像素 LBP |
89.78 |
0.8622 |
C |
像素 GLCM |
89.56 |
0.8590 |
D |
质谱计1 |
91.07 |
0.8791 |
E |
质谱计2 |
91.12 |
0.8801 |
F |
质谱计3 |
92.14 |
0.8933 |
G |
质谱计4 |
92.05 |
0.8920 |
H |
质谱计5 |
91.28 |
0.8825 |
I |
像素 刻度尺3 |
92.46 |
0.8974 |
由于非并行支持向量机分类器被设计为二元分类器,采用一对一的方法对多类数据集进行分类,所有方法的参数都是通过网格搜索策略和5倍交叉验证得到的。对于所有数据集,为了将每种方法的灵敏度与使用的训练数据数量进行比较,训练数据的百分比将减少到原始大小的十分之一。为了保证鲁棒性,随机抽取训练样本。
4 结果与讨论
基于对象的分类结果在视觉上优于基于像素的分类结果。由于基于像素的分类图噪声太大或斑点太小,地面对象的连续性和完整性不满意;而基于对象的分类图具有更多的清晰对象,完
以上是毕业论文外文翻译,课题毕业论文、任务书、文献综述、开题报告、程序设计、图纸设计等资料可联系客服协助查找。