英语原文共 13 页
用于卫星图像时间序列在线扰动检测的长短期记忆神经网络
摘要
卫星图像时间序列(satellite image time series,SITS)包含大量的时间信息。通过分析这种类型的数据,可以探索关注对象的变化模式。地球表面的自然变化相对较慢,呈现出明显的模式。一些自然事件(例如火灾,洪水,植物病虫害)和人类活动(例如砍伐森林和城市化)将扰乱这种模式,并在地球表面造成相对深刻的变化。这些事件通常被称为干扰。然而,生态系统的干扰不容易从SITS数据中检测到,因为SITS包含有关干扰,物候变化和遥感数据噪声的综合信息。本文提出了一种新的SITS在线干扰检测框架。该框架基于长期短期记忆(long short-term memory,LSTM)网络。首先,LSTM网络由历史SITS训练。然后,训练的LSTM网络用于预测新的时间序列数据。最后,将预测数据与实际数据进行比较,并且明显的偏差揭示了干扰。使用中等分辨率成像光谱辐射计的16天组合物的实验结果说明了所提出的在线干扰检测方法的有效性和稳定性。
关键词:长期短期记忆;递归神经网络;在线干扰检测;卫星图像时间序列;SITS
第1章 简介
近年来,长时间序列遥感数据的分析引起了研究人员的广泛关注,他们使用多时相遥感图像构建时间序列并使用时间序列分析方法进行变化检测[1]。时间序列分析是数据挖掘研究的重要方向,已成功应用于经济学,医学,气象学,语音识别和视频分析等多个领域[2-6]。在遥感领域,全世界的研究人员都在卫星图像时间序列(SITS)中动态监测自然物候,景观,灾害,农业和其他领域[7-10]。
根据他们的目标,SITS变化检测技术可分为两类[11]:(1)用于检测土地覆盖/使用类型变化的方法(2)用于检测由突发和意外事件引起的异常信息的方法。后者用于检测由突然和意外事件(例如,森林砍伐,火灾,植物病害和害虫)引起的突然变化,也称为扰动[12]。扰动检测依赖于检测时间序列曲线中的异常。根据时效性,有两种方法用于检测时间序列中的异常信息[13]:离线检测和在线检测。离线检测假定时间序列已经存在,并通过检测时间序列特征的变化来识别异常子系列。在线检测实现了以最小延迟检测异常的目标。因此,在线检测是实时或接近实时的检测。对于干扰检测,在线检测是有利的,因为在许多情况下,必须及时地检测异常,以便可以迅速采取对策(例如,对野火,洪水等的响应)。
用于在线变化检测的各种时间序列分析算法已成功应用于SITS。这些算法包括累积和(cumulative sum,CUSUM)[14],自回归积分移动平均值(autoregressive integrated moving average,ARIMA)[15],加权移动平均值(weighted moving average,EWMA)[16],支持向量机(support vector machine ,SVM)[17],随机森林( random forest,RF)[18],隐马尔可夫模型(hidden Markov model,HMM)[19],断点检测加性季节和趋势(break detection for additive season and trend,BFAST)等算法。
近年来深度学习蓬勃发展,这种方法越来越多地应用于时间序列分析[20]。深度学习使用多个处理层级联来学习具有不同抽象级别的数据的特征或表示[21]。深度学习很好地发现了非线性和高维数据中复杂结构的模式,没有或几乎没有先验假设。深度学习对异常值,缺失数据和噪声很有效[22]。在深度学习模型中,递归神经网络(recurrent neural networks,RNN)对时间序列分析具有更强的适应性,因为它们将序列的概念引入到网络单元的结构设计中[23]。然而,消失的梯度和爆炸梯度问题使得难以使用传统的RNN模型捕获长时间数据[24]。为克服这一困难,提出了具有特殊隐藏单元的LSTM网络,用于长时间学习时间序列[25]。记录长时间序列信息的能力使LSTM在各种领域取得了成功,例如语音识别,视频分析和生物学[26-28]。
LSTM也已应用于遥感领域。 Wu和Prased [29]在高光谱数据分类中应用了卷积RNN。 Rubwurm和Korner [30]基于LSTM从SITS中提取时间特征,并实现了出色的分类精度。 Lyu等人[31]提出了一种使用SITS的离线土地覆盖变化检测方法。利用LSTM的时间序列预测能力,You等人[32]提出了使用SITS进行作物产量预测的框架。预测方法适用于在线变化检测。然而,强大的LSTM模型在SITS中仍未充分利用在线干扰检测。
在本研究中,我们提出了一种基于LSTM的SITS在线干扰检测框架。利用SITS数据,我们使用历史时间序列训练LSTM网络,并使用训练的LSTM网络预测新数据。通过比较预测数据和实际数据,可以找到顺序的每像素异常警报。根据结果,可以实时评估干扰的时间和空间范围。拟议的框架适用于使用SITS数据的具有挑战性的森林火灾探测案例研究。实验结果表明,该方法可以实现优异的性能。
本文的结构如下:第二节对实验数据进行了描述,并详细介绍了基于LSTM的实验数据框架。第三节给出了实验结果。第4节地址对实验结果进行了讨论。结论见第5节。
第2章 材料和方法
在本节中,我们将详细介绍基于LSTM的SITS在线干扰检测框架。 首先,第2.1节描述了一个案例研究,用于帮助演示过程并测试我们框架的性能。 然后在2.2节中演示算法程序。
2.1案例研究
选择森林火灾数据集来验证我们的方法,因为森林火灾是一种典型的干扰。 案例研究是针对沂南河发生的灾难性火灾进行的。
林场位于中国黑龙江省128°30jE,48°40j附近(图2.1)。 大火于2009年4月27日开始。
图2.1 黑龙江省沂南河林场烧毁区域
图2.2显示了在三个时间点由Landsat Thematic Mapper(TM)波段4,波段3和波段2数据合成的林场的假彩色图像。图2.2a显示了火灾前林场的图像。图2.2b提供了火灾发生后大约一个月的森林农场的图像,其中有明显的火痕。图2.2c显示了火灾发生后大约五个月的林场图像。这些图像的色差是由成像条件的差异(例如,大气条件,太阳仰角,视角)引起的。图2.2所示的图像说明了森林火灾的过程。火灾造成严重破坏,森林火灾后植被迅速恢复。
用于测试我们框架的森林火灾的实验数据来自中等分辨率成像光谱辐射计(MODIS)土地产品MOD13Q1。该产品为最大植被指数的16天复合数据,空间分辨率为250米。在这项研究中,207个MOD13Q1图像用于2001年1月1日至2009年12月31日期间(每年23幅图像),h26v04的图块。使用这些数据计算全球环境监测指数(GEMI)[33]。所有数据都转换为Universal Transverse Mercator坐标系中52 N区域中的World Geodetic System 84椭球投影。通过堆叠这些图像,时间轴中的每个像素包含具有207个时间步长的GEMI时间序列。我们在每个时间序列上实现基于LSTM的干扰检测算法,并且从逐像素检测生成空间结果(燃烧区域图)。
图2.2 黑龙江省沂南河林场Landsat TM假彩色合成图像的三个时间点(火灾发生前后):( a)2008年8月8日(b)2009年5月23日(c)2009年9月12日
2.2 理论
在下文中,我们首先介绍LSTM(第2.2.1节)。 基于LSTM网络,我们的在线干扰检测框架包括培训(第2.2.2节),预测(第2.2.3节)和检测(第2.2.4节)。
2.2.1 长短期记忆
与传统的深度神经网络相比,RNN的改进在于它将隐藏层视为连续的复发层(图2.3,左)。 可以展开该结构以在对应于输入时间序列的离散时间步长处产生神经元分量序列的输出(图2.3右)。 通过这种架构,RNN具有很强的能力,可以捕获嵌入在输入的过去元素中的历史信息一段时间[34]。
图2.3 递归神经网络及其展开结构
图2.3显示了RNN的示意图。 向前传送记忆的过程可以用数学方式描述:
(2.1)
(2.2)
其中xt是输入向量,ht-1是RNN中的先前隐藏状态,ht是对应于xt的隐藏状态,ot是输出向量,W,U和V是权重矩阵,b表示偏向量,以及sigma;是激活函数。
RNN的体系结构使其能够基于当前时间步的输入数据对时间序列中的下一个时间步进行预测。然而,使用反向传播训练RNN长时间序列是具有挑战性的。每个时间步长的反向传播梯度的增长或收缩可以累积。这种积累导致梯度在许多时间步骤中爆炸或消失。引入长期短期记忆来克服这一挑战,以确保RNN具有长期记忆能力。长短期存储器允许网络使用称为LSTM单元的特殊隐藏单元长时间从输入捕获信息,而不是隐藏层中的简单RNN单元(图2.3中所示的绿色节点h)。
在这项研究中,我们使用[34]中描述的LSTM细胞。 LSTM单元的结构如图2.4所示。它包含遗忘门(ft),输入门(it),输入调制门(mt),输出门(ot),存储单元(ct)和隐藏状态(ht)。门通过以下方式计算:
(2.3)
(2.4)
(2.5)
(2.6)
其中xt是输入向量,ht-1是LSTM网络中的先前隐藏状态,W和U是权重矩阵,sigma;是逻辑sigmoid函数,tanh是双曲正切函数,b是偏置向量。 从这些门,存储单元(ct)和隐藏状态(ht)计算如下:
(2.7)
(2.8)
其中“·”表示两个向量的逐点乘法。 存储单元(ct)包含两部分:
由遗忘门(ft)调制的前一存储单元(ct-1)的信息,(2)由输入调制调制的当前输入(xt)和先前隐藏状态(ht-1)的信息门。遗忘门(f t)允许LSTM有选择地忘记其先前的记忆(ct-1)。 输入门(it)控制LSTM以考虑当前输入。 输入调制门(mt)调制输入门(it)的信息。 输出门(ot)控制存储器单元(ct)转移到隐藏状态(ht)。
图2.4 LSTM单元的结构
LSTM网络是由LSTM细胞组成的递归神经网络,能够在长期时间序列中学习波动模式,然后进行预测。
2.2.2 使用SITS训练LSTM
在本研究中,章节中描述的SITS用于训练LSTM网络。每对应于时间轴上的堆叠图像的像素的一维GEMI时间序列用于一次独立地训练一个LSTM网络。所有具有207个时间步长(从2001年1月1日到2009年12月31日)的SITS被分为两部分用于在线干扰检测:
(1)长历史时间序列,前184个时间步长(2001年1月1日至2008年12月31日)作为LSTM培训的输入,(2)测试时间序列与最后23个时间步骤(从2009年1月1日到12月31日) 2009)用于验证LSTM预测和检测异常。
在[35]中建议的基于滑动时间窗口的方法用于从单个历史SITS获得用于训练LSTM的多个样本。对于具有n个时间步长的时间序列(x1,x2,...,xn),假设时间窗口的大小是l(l lt;n),则第一个样本是输入子序列(x1,x2,..., xl)输出xl 1。时间窗口一次向前滑动一步以生成一个训练样本。时间窗口中的子序列(xt-1,...,xt-2,xt-1)对应于前一步的输出xt。因此,可以获得n-1 1个样本用于训练LSTM网络。对于本研究中的LSTM隐藏层,添加了辍学率为0.5的辍学层以防止过度拟合[36]。此外,均方误差(MSE)损失函数和均方根传播(RMSprop)优化器[37]用于LSTM训练。
2.2.3 基于训练LSTM的预测
根据上一节中描述的训练方法,LSTM一次只能一步预测数据。使用l步滑动时间窗口,将使用输入序列(xt-1 1,...,xt-1,xt)预测输出yt 1。
使用先前步骤的预测输出迭代地执行实现n个步骤的预测的策略,以将输入序列组成到下一步骤。因此,将使用输入序列(xt n-1,...,xt,yt 1,...,yt n-1)来预测输出yt n。
本研究中实现并比较了一步预
以上是毕业论文外文翻译,课题毕业论文、任务书、文献综述、开题报告、程序设计、图纸设计等资料可联系客服协助查找。