基于决策树方法的RS和GIS数据监测红树林外文翻译资料

 2022-12-27 15:29:58

英语原文共 11 页,剩余内容已隐藏,支付完成后下载完整资料


基于决策树方法的RS和GIS数据监测红树林

摘要:本文介绍了利用多时相的Landsat TM数据和辅助GIS数据识别珠江河口的红树林决策树方法。遥感可以用来获得红树分布的信息。然而,使用传统的方法可以发展,因为某些类型的土地覆盖(例如,农业用地和森林)具有相似的光谱行为和分布特征,导致红树林分类严重的混乱。本文开发了一个决策树学习方法集成Landsat TM遥感数据和辅助GIS数据(例如,数字高程模型和接近变量)来解决这个问题。分析表明,这种方法利用图像或辅助数据可以得到精确的红树林分类结果。使用这种决策树方法可以获得在珠江口的红树林三个时空地图。监测结果表明,在近几十年来,加强的人类活动使得红树林面积迅速下降。

关键词:变化监测,DEM,Landsat TM数据,珠江河口

0介绍

红树林是常绿小乔木,大面积生长在在热带、亚热带和温带的沿海地区的河流三角洲,潮间带的泻湖,河口和沿海系统(特利等人。1996、谢里丹和海斯2003)。红树林为人类提供了多种生态服务,如保护海岸免受台风伤害、污染物吸收和水净化等。他们还为不同的植物群和动物群的栖息地,包括许多稀有物种(白拉斯科等人。1996、莫里等人。2003、谢里丹和海斯2003)。然而,在过去的50年里全球大约有三分之一的红树林已经消失了,(阿郎奇2002)。中国也发生了大幅下降。例如,中国的一半以上的的红树林在广东省,在过去二十年三分之二的红树林已经消失(王和陈1998)。红树林的下降主要是由于在沿海地区大规模的填海工程,受海啸破坏,和快速的城市化(林勒维伯和德拉科德 2002)。红树林下降监测已成为许多国家的一个迫切需要(延森等人。1991、拉姆齐和延森1996,高1999瓦尼纳等人。1999、木亚提2000、普罗伊西侃等2000克瓦斯等人。李等。2002)

许多研究表明,在红树林监测方面,遥感技术相比于传统的野外调查方法仪器有很多优点(1995、布瑞恩和提摩太1996、格林等1998,克瓦斯等人.。2005,1999,阿基拉等。2003、平野等人。2003)。遥感技术可以获得关于交通不便的地区和极端环境的信息(瓦非萨等人。2006)。一些卫星传感器已被用于识别的红树林,包括TM、ETM (布瑞恩和提摩太1996),SPOT(富兰克林1993,帕萨库里尼等人。1999)、中巴地球资源卫星(李等人.。2002)、SIR(帕萨库里尼等人。1999)、ASTER(瓦非萨等人。2006),和IKONOS和QuickBird(王等人。2004)。

然而,许多这样的研究主要是基于有监督的分类(萨达尔等人。1995、佩德罗等人。1998、王某和陈某,1998,木亚提 2000,李等人。2002,王等。2004)。例如,加西亚等。(1998)将监督分类方法应用于陆地卫星遥感影像,对圣地亚哥墨西哥河口红树林植被进行评估。帕萨库里尼等人。(1999)用SPOT-XS和SIR-C雷达资料和监督分类的方法对马达加斯加红树林地图。王等。(2004)用米级卫星影像(IKONOS和QuickBird)和最大似然分类(MLC)来区分不同的物种,在巴拿马的加勒比海岸红树林的方法。监督分类是一种常见的解释遥感数据的方法,但它很大程度上依赖于用户的技能和训练,往往需要耗时的分析。

机器学习技术被越来越多地应用于遥感应用于湿地研究相关(黄和延森1997,何森等人。2002、科斯特纳等人。2003)。最近的研究表明,决策树,其中最流行的机器学习方法,可以准确、高效的土地覆盖分类基于遥感数据(斯旺和豪斯卡 1977、汉森等人。1996、1997和布朗德,菲尔德l,帝菲缌等人。1998、菲尔德等人。1999)。决策树学习算法可以直接从训练数据中生成分类规则,无需人工干预。此外,与许多其他的统计分析方法相比(如最大似然分类),决策树不依赖于对价值分配或从另一个变量的独立性假设(昆兰1993)。这对于附带的地理信息系统数据来说是非常重要的,因为它们通常有不同的值分布,并可能是高度相关的(延森2005)。在学习过决策树之后,规则集可以应用于多时间图像的分类。使用相同的规则集可以确保分类结果是不同时间的图像之间的比较,这应该在监测红树林变化的遥感数据的时间序列上比传统的方法是更有利。

本研究探讨了基于多时相TM数据的快速变化的决策树学习方法在中国珠江口红树林的适用性检测。我们采用的规则集来自2002至1995和1988的数据,以检测在该时期的红树林的变化。我们预计,决策树方法可以用多时相TM影像和GIS辅助数据提高红树林监测。

决策树算法

决策树是一种分类方法,在每一个分支(或节点)的基础上,将一个数据集划分成更小的子集,并将数据集划分为一个分类程序。树是由一个起始节点(根),一组内部节点(拆分),和一组终端节点(叶)。除了根,每个节点有一个父节点;和除叶,每个节点有两个或两个以上的子代节点(弗雷德和布兰迪 1997)。通过观察树,依次由树划分,每个观察最终将被分配一个类标签根据到达叶节点(布雷曼博士等1984,昆兰1986,徐等人。2005)。

许多算法是决策树学习,包括ID3(昆兰1986)、C4.5(昆兰1993)、车(布雷曼博士等人,1984)。C4.5(昆兰1993)是第一个决策树归纳的学习计划,已经得到了广泛的应用(摩诃兰德等人。1995、百里和里诺夫1997)。C5.0 Unix和Windows对应See5是最新版本的C4.5。See5是计划采用的研究。应用程序的能力,包括训练集构建的决策树和决策树的训练,翻译规则(昆兰1993,延森2005)。训练集包括一组样本,我们知道他们的属性值和类,他们属于。每个样品由一个属性类向量表示:[种_j,属_1,属_2,属_n,种_n ](昆兰1993)。训练集训练的决策树,即,确定在每个节点的属性和阈值。最广泛使用的这种测定方法是“信息增益率”从传播学理论,选择属性与最小熵是“分离”属性(昆兰1993)。图1a显示一个训练有素的决策树 T1和T2例根据属性A1的价值。下一步,设置分为子集T1 T3和类属性的值根据A2。这个过程一直持续到所有的子集找到它们的类(叶节点)。图1中的决策树有A1在根节点,属性和A2、A3和A4,在分裂节点的属性。T1、T2和T3的分支,可以看作是亚树。

制作决策树的过程经常遇到的一个问题是过度拟合。训练过程可以过度拟合树训练集,从而在实际分类中会出现信息和错误冗余,特别是当训练数据包含错误的时候(明格斯1989,弗莱德等人。1999)。“修剪”方法处理这样的问题,通过去除部分的树。修剪的一般过程是由叶或支行看看这将提高树的性能作为一个整体替换子树。决策树提供的功能来执行这样的修剪

研究区和数据来源

研究区为珠江口,研究的空间范围是北纬22°20rsquo;49rsquo;rsquo;-22°55rsquo;52rsquo;rsquo;和东经113°31rsquo;12rsquo;rsquo;-114°14rsquo;40rsquo;rsquo;(图2)。各种地貌栖息地存在于该地区,包括泥泞的海滩,沙滩,海岸边岩石海滩。各种红树植物出现在该地区,为众多的海洋和陆地植物和动物有利的生境。该地区也成为人口稠密,集中发展的地区,这已显著影响了当地的生态环境。

红树林的监测是基于三个时间TM影像,包括122列44行的数据在收购日期为1988年12月10日,1995年12月30日和2002年11月7日的影像,他们被当做辐射测量校正(水平1G)数据在数字号码(DN)值。DEM的数据,并从地理沿海信息也被用来作为输入属性到See5系统。潮汐资料被统计为参考日期。

图像预处理,包括辐射校正和几何校正。双方进行绝对和相对辐射校正。这种校正是必需的施加​​从一个图像导出到另外两个分类规则集。绝对辐射校正修正(如6S模型)的模型,使用像素值转换为辐射率和遥感反演。相对辐射校正装置,该像素值是有关相对于数字数水平而不联合起来。许多研究表明,这些修在分类和土地覆盖变化监测有很大的作用(宋2001年等,温格莱曼等。2001年,李等人。2004年,奥瑟夫等。2005年,罗德等2005)。简单直方图匹配在本研究中用于相对于辐射校正时使用。直方图匹配在概念上类似于直方图均衡,其延伸的图像的像素值,以匹配标准范围。它可以使用一个图像作为标准和关注的所有其它图像匹配到该图像的范围内。虽然简单,这种方法已被证明是有效的相对辐射校正(理查德和2006年贾)。在这项研究中,1988年和1995年TM图像的直方图被翻译到2002年TM图的范围内。

然后对图像进行修正,以满足空间使用地面控制点(地面控制点)的GIS地图。共有50个地面控制点跨越每个图像的整个区域,进行交互选择的大多数控制点分别为道路,河流,他们都是可以很容易就可以确定的交叉点,并且点有一个基本上均匀的分布。参照杰森等。1988年和杰森2005年整顿的Landsat TM的影像,在这项研究中使用的是整改一阶多项式模型。重采样使用最近邻算法,以保持数据的几何完整性(热切和1994 威尔克,1997 ERDAS,哈维和希尔2001年,坎贝尔,2002)。平均均方根误差(RMSE)为约0.5个像素。用于Landsat TM遥感图像的预处理的软件是ERDAS 图像。

理想的情况下获得的遥感图像都有类似潮汐的高度,这样的分类结果,可以更好地进行比较。幸运的是,基于该可用的潮汐信息(见表1),在该研究中所用的三个图像具有非常相似的潮汐高度。

除了红树林,在珠江口等主要土地覆盖类型也利用决策树方法三个TM影像识别。这提供了有关红树林动态上下文信息。表2列出了决策树确定的所有六种土地覆盖类型:1)红树林,2)农业用地,3)森林; 4)地表水,5)市区,6)休耕地。为了提高分类准确率,特别是减少红树林和农田之间的误判,我们实施了两个步骤。第一步只识别红树林,和第二步骤划分红树林和其它非红树林土地覆盖类型(图3)

方法

应用决策树方法

基于多时相TM影像和辅助GIS数据的决策树方法用于检测珠江口红树林的时间变化的过程由图4概括

使用See5生成分类规则

在决策树学习方法,遥感图像(即带)及配套的GIS数据作为属性,而类型的土地覆盖(即红树林,非红树林)的定义类的标签。属性与根节点和决策树的分割节点相关联,而类标签与叶节点相关联。以下的处理是使用See5实施。

准备样本集并确定属性

在这项研究中,2002年TM影像的实地调查将一共1000像素进行分级,得到样本数据集。样本组被分为两组:1)样品的80%被用作训练集和2)其他放入测试集。训练集用于训练和构造决策树,并且使用测试集用于测试构建树的准确性。

样品的属性分为两类:1)遥感数据,包括每一个TM频带的原始值和NDVI值和2)地理信息系统数据,包括仰角,邻近区域海岸线,和空间位置(坐标)。该类标签有两个可能的值:红树林由C1表示,非红树林由C2表示。

TM数据的七个波段是用于分类的基本属性。归一化植被指数(NDVI)也作为代表植被条件的主要属性之一。TM图像,NDVI计算如下(亚当斯等人。1995、汉森和士杰瑞 2003,马瑟2004):

(1)

在许多地方,规则完全基于TM数据将无法区分红树林从非红树林。在这项研究中,双属性,海拔和距离海岸线,根据现有的地理信息系统数据库和实地调查的数据,被用来提高分类的准确性。红树林受到地形因素的制约。实地调查发现,红树林没有分布在海拔10米以上。因此,数字高程模型(DEM)是用来排除非红树林像素具有相似的光谱特征与红树林的像素,但在海拔限制线。实地调查还发现,红树林湿地不可能被发现超过1公里的海岸线。将这一,海岸线被发现信息利用于TM影像,然后从每个像素的海岸线的距离的计算采用欧氏距离功能ARC/INFO网格(李和叶2004)。表3列出了用于生成决策树的属性所使用的属性。

生成决策树和转换规则

用See5决策树分类规则可以从样品的自动生成。然而,一个重要的参数,修剪速度,需要在执行的自动过程之前分配。在这项研究中,修剪率为25%,用于解决分类精度和决策树的大小之间的权衡。图5是See5决策树模型。这棵树的分类规则的一些例子如图4所示。表4显示了训练和测试数据的错误。对于这两个集合,生成的决策树有精度90%。

利用分类规则识别红树林时空变化

提取的分类规则,适用于从1988,1995,和2002(图4)(分类节)的TM图像。基于这些规则的红树林和非红树林像素分类使用ERDAS影像的知识工程与知识分类工具进行。将那三年的分类结果进行叠加红树林变化检测。

辅助地理信息系统数据的影响

红树林的生长需要一个特殊的生态环境,使得数据在有效距离的特定海岸线和高程分布,然而,我们的研究表明,海岸线距离和海拔红树林并不是他们自己确定的,这是因为不同的土地覆盖类型在这两个因素的影响下也会发生变化。图6g和6h显示的决策树结,是仅用这两个因素作为属性的结果。卫星图像数据通常准确区分植被从其他土地覆盖类型,如城市地表水。然而,仅用光谱数据将红树林与其他类型的森林分离是困难的(图6i)。将这两类数据整合会产生更好的结果(图6j)

其他土地覆盖类型分类

有的地区没有红树林利用ERDA掩膜功能首先提取。根据这些地

剩余内容已隐藏,支付完成后下载完整资料


资料编号:[31998],资料为PDF文档或Word文档,PDF文档可免费转换为Word

原文和译文剩余内容已隐藏,您需要先支付 30元 才能查看原文和译文全部内容!立即支付

以上是毕业论文外文翻译,课题毕业论文、任务书、文献综述、开题报告、程序设计、图纸设计等资料可联系客服协助查找。