英语原文共 8 页,剩余内容已隐藏,支付完成后下载完整资料
利用光学卫星图像的海上监视
摘要:本文介绍了获得从高分辨率光学卫星图像(5X5像素)中实现小型船舶的自动检测实验结果的方法。这些图像是全彩SPOT 5卫星的图像,分辨率为每像素500米。我们的目标是在人工操作员最后确认之前自动获取目标列表。它将遵循三个步骤:第一个步骤是对候选对象的预先检测,第二个步骤是使用活动轮廓对每一个候选对象进行分割,第三个是对两个类别的候选对象进行分类:真实目标和假警报。前面两个阶段是基于贝叶斯原理,使用一个非常简单的图像模型,所以这个算法速度非常快。目前,该分类是经验性的,只是展示了由于检测目标的精确分割而得到的改进。最后,给出了一组图像的整体结果,尽可能接近操作条件,显示了该方法的有趣之处。提出了对大型舰船探测的扩展,作为该方法的一个自然推广。
1.简介
由于当前的政治安全问题,海事监视在当今经济中是一个高度关注的领域。它包括对碳氢化合物污染和海上交通的监测。考虑到大面积的观测和没有物质边界将它们分开的事实,遥感被认为是解决这些问题的主要方法之一。
本研究的重点是渔业活动的监测和船舶的检测。这一问题在过去十年中得到了深入的研究,但在大多数情况下,利用星载平台合成孔径雷达(SAR)图像的方法。已经为这种类型的图像开发了许多算法[1][2],并在[3]中有很好的技术研究进展。
雷达图像一个显著的优势在于它们的大气气象条件比可见光图像影响小,可以收集白天和黑夜。然而,它们容易受到高频噪音的污染,它们对海洋的状态和船只的反射率很敏感[4]。此外,他们的视觉判别是困难的,在大多数情况下,其分辨率低(约5m x 25m)。由于这些原因,非金属小目标的探测在SAR图像中是难以实现的任务[2]。相反,高分辨率的全色卫星光学卫星图像很少用于船只检测,但对任何人工操作者来说,它们的判别是容易的,目前的分辨率能检测涉及捕鱼活动的非常小的目标。此外,大多数船只所用的材料都是木头和复合材料,在光学图像中更为明显。
由于这些原因,nev@ntropic提出了一种基于两类图像的海上监视服务。它是基于软件欧申韦,使用该软件可以从渔船监控系统(VMS)获得能看到的光学图像,卫星图像,地图和数据。最后一部分是通过船上的信标发出的,以帮助监测他们的活动。
该系统的主要服务是图片解释,即分析图像并表示每艘船的大小和方向。VMS的信息可用于将合法活动的船舶与别的区分开来。
该软件有助于他看到每一帧的图像,标记目标和保存的信息在数据库中的船只。该数据库的内容然后转移到地方政府,可以从事适当的行动。
在这篇文章中,我们目前所取得的成果,在自动化的任务由图片解释执行。如前所述,许多算法存在于SAR图像中自动检测船只,但最先进的光学图像非常差。
这篇文章主要使用全彩SPOT 5图像。图像的分辨率为5m,大小约为10000 x 10000有用像素。请注意图像是地理参考。图1给出了这样一个图像的示例。
由于这些图像是地理参考的,我们可以假设海岸的位置是已知的。我们的应用程序只限于在可能的部分多云的大气条件下,以海为背景探测目标。
为了满足操作要求,整个方法必须足够快,即在标准计算机上处理这些图像如图2(1000 x 1000像素)要求在25分钟以内。显然,这种检测方法在用户定义的高检测概率时应该具有最低的虚警率。
由于计算时间是首要考虑的问题,我们选择避免对整个图像进行繁重的计算。相反,我们选择遵循一个经典的解决方案,即快速确定感兴趣区域(ROI)的列表。这一步是对潜在目标的预先检测。这一步骤在第二节中进行了说明。
算法的第二步是寻找潜在目标的形状。因此,我们开始对每个感兴趣区域进行分段。该算法在第三节中描述。
最后,我们为每一个潜在的目标提取一个特征向量,并将它们划分为不同的类别,即小型船只、较大的船只和假警报。这部分在第四节中介绍。
为了提供定量的结果,我们算法计算的每一步都使用大型图像数据库。这些测试的结果在第五节中给出。
2.预检测方法
我们最初的研究涉及小型船舶的监测。因此,感兴趣区域的检测基于小目标的检测。应该注意的是,这种检测方法对较大的船只有效,不过是算法的一个有趣的副产品。
图2展示了一些小目标。这些都是15到30米长的船,他们出现在图像大致为5x5像素方块。在图像中,形状可以根据现场的拍摄条件和形状的变化判断是否有船捕鱼(是否张开网)。因此,很难为我们的目标定义一个形状模型。此外,船舶的强度也会发生剧烈的变化。因此,唯一有用的和可靠的有关目标的信息是他们的大小(约5X5像素)。
在这样的背景下,我们选择修改SAR图像中的经典方法。它在雷达领域是众所周知的,并已成功地用于检测边缘的SAR图像[6][7],以及在嘈杂的图像和极化SAR数据检测目标[8]。在这里,我们将其应用于光学图像的情况。
它基于贝叶斯决策理论,使用一个滑动窗口,其中心将越过图像的每一个像素。这个窗口足够小,可以考虑到窗口中的背景是均匀的,并且足够大以捕获一个小目标和一些背景。
对于窗口的给定位置,我们只考虑两个假设和,分析窗口的内容。
bull; :窗口在背景之上,没有任何目标,相应的区域被标记为A(参见图3(a))。
bull; :目标位于窗口的中心,相应区域标注为。事实上,区域有研究目标的形状。区域是窗口内目标的外部。区域表示当目标位于窗口中心时的背景(参见图3(b))。
在前面的图中,区域给出目标的形状:一个像素的正方形。我们的目标是设计一个反应灵敏且对作用大对作用小的滤波器。当然,这两种假设并没有涵盖所有不同的案例:
bull; 目标可能不在窗口的中心位置。这是由滑动窗口越过每个像素的事实所掩盖的。因此,如果目标不在窗口的特定位置的中心位置,则窗口的闭合位置为假设H1是真的。滤波器对这个闭合位置的响应更强烈。
bull; 目标的形状可能不是完美的正方形。正如我们在结果部分中看到的,图2所示的形状可能的变化包含了该方法的健壮性。
贝叶斯理论包括计算每个假设的可能性。这些可以写成:
bull; :在假设下获得图片s的概率。
bull; :在假设下获得图片s的概率。
然后,如果似然比优于阈值t,则可以确定目标是否存在。
(1)
式(1)中,,。
这种计算需要一个统计模型来描述图像像素的强度分布。让我们假设背景在窗口内有恒定的反射率。让我们假设目标是一个恒定的反射率。然后,得到的图像是由未知意味着两个恒定区。这些变化是由于一些电磁噪声,可以被建模为高斯白噪声。
bull; 舰船上的像素强度被认为是由于加性噪声而导致的均值和方差不均的白高斯噪声的实现。
bull; 窗口中背景的像素强度被认为是一个均值未知且方差相同的白高斯噪声的实现。
为了讨论这个模型,图4给出了两种不同背景的直方图。背景具有高斯分布的假设并不是一个强有力的假设。然而,应该注意到,白噪声模型在理论上不适用于纹理背景。在这里,我们选择保留这个弱假设,结果将表明建立一个简单而健壮的算法不需要更精确的模型。
使用这个模型,我们可以得出:
bull; 对于区域的像素:
(2)
其中是噪声的方差,是区域的统计期望。
bull; 假设像素在区域R中是独立的,我们可以得到:
(3)
bull; 对式(3)取对数可得:
(4)
bull; 因此,似然比可以按如下计算:
(5)
正如之前所说,我们没有对目标和背景的反射率的任何信息。因此,参数是未知的。一个经典的解决方案是用极大似然估计(在这个例子中超过区域R的标准均值)来估计它们。现在,可以被它的估计值所取代。在这个阶段,我们得到的数量通常称为“广义似然比”。
经过几次计算后,终于得到了下面的公式:
(6)
其中是区域的像素数量,是区域的均值。
本文提出的算法,称为GLRT(广义似然比检验)如下:
bull; 对于每一个输入图像的像素:
- 根据式(6)计算“广义似然比”。
- 在输出值上设定一个阈值。
- 使用后处理消除多个目标的正反馈。
让我们来讨论窗口的位置,而窗口的位置不是窗口的中心。对于这些位置,滤波器的响应比正确的位置要低,但这种响应可能高于阈值。换句话说,每个目标都有多个正响应。因此,我们把每一组相互连接的正响应作为一个对象,并保持以最大响应为目标的像素。
此方法的唯一自由参数是滑动窗口的大小和用于决策的阈值。设置这些参数的值将在第五节讨论的,但为了说明该算法的性能,我们将在这里使用一个7x7滑动窗口和阈值为4800。
图5显示了一些典型例子的预检测结果。关于预检测算法结果的更精确的细节也将在第五节中找到。
请注意,此方法呈现恒定的虚警率[6]。这最后一个特性是处理各种空间光学图像采集之间变化情况的主要关心的地方。
3分割方法
如引言中所述,我们选择使用一些活动轮廓来对预先检测的目标进行分割。这些方法,由Kass和al[9]介绍,以适应单个物体的分割性。它包括在图像上使用可变形轮廓,称为蛇。蛇的变形是由能量最小化策略指导的。论文首先提出了一种利用样条函数控制的蛇,并将能量的定义重点放在图像边缘的研究上。
有关活动轮廓的所有工作大致可以分为两类:一类是在能量最小化的情况下工作,另一些是在控制蛇的方式上工作。已经做了一些非常有趣的工作来处理诸如孔或断开的对象等拓扑结构可能发生的变化。这导致了形状等级集[10]模型。
在我们的例子中,物体没有洞,也没有断开连接,因为它们要么是一艘船,要么是一小部分云。在云的情况下,我们对捕获整个云不感兴趣,但只对我们在方法的第一步发现的云的一部分感兴趣。因此,我们将遵循蛇的轮廓标准建模。在第三节中,我们将讨论我们使用的能量,以及最小化算法和形状建模的实现。
一些作者还建议将焦点放在物体的区域属性上,而不是其边缘的性质上,从而导致所谓的“基于区域的蛇”[12]。正如我们在下一节中看到的,我们提出的方法属于这一范畴。
由于用于检测的方法是一种非常简单和快速的算法,我们选择了跟上同一概念的分割部分。在本节中,我们知道潜在目标在哪里,但我们希望找到它的形状。基本上,这一观点首次被用于[12],并在[13]中推广。它包括测试形状的不同假设,以及找出哪一个最适合场景。我们稍微调整了能量和优化算法,但方法的核心与这些文件保持不变。在我们的例子中,每个预检测的目标,我们使用100x100像素子围绕这一目标,我们试图分割在两个区域:目标与背景。
统计模型与第二节相同:背景和目标由不同的白高斯噪声组成,但它们具有相同的标准偏差(见图6)。
我们仍然使用和的假设。对于,子图像仅有背景。我们只是修改为:对于,子图像是由两部分组成:一个形状和背景区域的子图像是的互补的目标。因此,我们可以测试目标的不同候选形状(参见图7)。
由于场景的统计模型与第二节相同,对数似然比具有相同的方程。各种形状的,我们如公式6的形式计算,并在此用新符号表示:
(7)
其中是候选形状内的估计平均数,是在中形状互补的子图像的估计平均值,是在整个子图像的估计平均值,,,是区域,,像素的数量。
这给出了对数似然比最大值的形状作为目标的真实形状。
我们可以注意到是所有候选形状的常数。在[13]中,作者只使用来区分候选形状。然而,引入给我们提供了一个规范化的可能性。事实上,由于这一测度的恒虚警性(CFAR),我们可以使用特定形状的输出值作为一个显著值,无论背景均值是多少。
在活动轮廓的形式中,蛇是以蛇的所谓能量最小化为指导的。在前面的讨论中,似然比必须最大化。因此,我们将把能量看成是似然比的对立物。
(8)
需要注意的是,在主动轮廓的术语,这种能量是一个外部的能量:它只有蛇和底层图像之间的匹配。
最开始关于蛇的出版物[9]还建议添加一些用户强加约束力的术语,这样蛇就可以接近某个形状的模型。其目的是获得细长或致密的物体或某些特定的曲率性质。这些术语称为内能。
我们提出的方法不使用任何内能。它不需要任何我们需要寻找的形状的模型。
考虑到可能的形状空间巨大,计算时间是一个主要关注的问题。这种计算时间的减少可以通过两种方式来完成:减少可能形状的空间,只测试其中的一小部分。第一部分只考虑多边形形状。这允许使用多边形的节点对形状进行非常简单的控制。然后,我们需要一个优化算法,将探索多边形形状的一小部分,将找到解决方案,最大限度地减少在[8]提出的能量。
我们使用的算法基本上是基于一个梯度下降和一个零温度的蒙特卡罗算法混合。蛇的节点被移动一个接一个,以改变候选形状,并更新形状,如果找到一个更好的候选对象,按照该算法:
- 是一个5x5像素的正方形,用四个节点描述;
- 计算;
- 选择一个新节点和连接到这个节点的路径,我们得到一个新的形状;
- 计算;
- 从步骤3迭代,直到找到解决方案或经过一定次数的迭代。
正如我们在第五节中看到的,如果算法在50次迭代中停止,就可以得到很好的结果。
应该注意的是,我们还在两个迭代之间添加了一个过程,即在两个连续的节点之间的距离太长时,创建一个节点,以便使其形状更精确。距离被认为太长的阈值被任意设置为10像素。
为了演示这种分割,我们在图8中显示了图5中所示的图像中预先检测到的一些目标的分割结果。
事实上,可以得到更精确的分割,但对于我们的当前目标,即检测小目标,这种快速分割在大多数情况下足以区分小目标和假警报。
4.实施细节和最后分类
如前所述,我们在这项研究中的
全文共8431字,剩余内容已隐藏,支付完成后下载完整资料
资料编号:[17358],资料为PDF文档或Word文档,PDF文档可免费转换为Word
以上是毕业论文外文翻译,课题毕业论文、任务书、文献综述、开题报告、程序设计、图纸设计等资料可联系客服协助查找。