基于LBP的无人机图像快速拼接算法外文翻译资料

 2022-08-08 15:54:36

英语原文共 14 页,剩余内容已隐藏,支付完成后下载完整资料


基于LBP的无人机图像快速拼接算法

摘要:无人机图像被广泛用于许多应用中,但是这些图像存在一些问题,例如这些图像的视野(FOV)小于传统航空图像的视野(FOV),并且它们的分辨率小于航空分辨率。为了解决这些问题,可以将这些具有小视图的图像拼接在一起,以增加视野和图像分辨率。图像拼接算法最重要的是找出这些分割图像之间的对应点。针对特征匹配任务提出了不同的方法,但是大多数方法都需要较长的计算时间,并且会产生很多错误的关联。因为局部二进制模式描述符(LBPD)为两个重叠图像中的检测到的关键点提供了良好而可靠的描述,因此可以使用两个LBPD之间的汉明距离来获得快速和良好的特征匹配。但是LBP方法依赖于插值技术,这就会导致错误的匹配结果,因此,在我们提出的算法中,我们将开发自适应的LBPD,以克服LBP技术的缺点。

关键字:无人机;图像拼接;Harris;A LBPDs

1介绍

多年来,甚至在数字计算机时代之前,图像拼接就已广为人知。 以前,由于首架飞机的飞行高度有限,并且需要大型照片来制作地图,通过山顶或气球上摄影制成的图像都是人工拼凑而成的,专业人员不得不从重叠的照片创建图像拼接[1]。但是在飞机技术的发明和发展之后,图像拼接技术的研究在许多研究领域都变得非常普遍,例如:航图,空间探索,遥感图像处理,医学图像分析等领域,这就是为什么图像拼接结束已成为近年来计算机图形学研究的重点。

图像拼接是由一系列图像制作生成的合成物,可以通过了解图像之间的几何关系来获得。这里的几何关系是与不同图像坐标系相关的一种坐标系[2]

构造图像拼接是计算机视觉,图像处理和计算机图形学领域的热门研究领域。多年以来,图像拼接已被用于各种应用,最为传统的应用直到现在还在被使用,即从重叠图像的集合中构建大型航空和卫星影像[3]

目前现代应用图像拼接的技术,包括:场景稳定,变化检测,视频压缩。图像拼接算法的良好性能主要取决于用于特征检测和匹配的所用技术的性能,这种技术将世界表示为一组空间定位的像素。当使用这种表示形式时,主要优点是表示形式紧凑,因此适合在大型环境中运行。综上所述,在我们研究中最关键的方法是检测和匹配重叠图像中的不变的和独特的的特征。

我们在本文中的贡献是,找到了一种由于失真而导致的光照条件和视野差的图面影像的解决方案,为了在特征匹配阶段使用它,我们还提出使用了带有现代二进制描述符(LBPD)的经典特征检测器,并采用LBP技术将其用于图像处理中。在本文中,我们将讨论在图像拼接领域中执行的一些工作(第2节);然后,我们将在(第3节)中陈述创建图像拼接所需的必要方法,并介绍LBP技术的一般框架(第4节)。我们的图像拼接算法将在第5节中介绍。获得的结果将在第6节中列出。最后,我们将得出一些结论(第7节)。

2相关工作

在文献[4]中,提出了一种新颖的快速策略来注册和拼接无人机数据(航空图像)。首先,通过减少标度空间中金字塔八度的总数,加快匹配过程。 其次,发布RANSAC(随机样本共识),消除不匹配的联系点。然后,引入光束法平差解决所有相机几何校准参数。最后,采用基于动态时间表的最佳接缝线搜索策略来解决飞机侧面观察引起的躲避问题。

[5]中,这项研究的目的是估计出将无人机图像精确地注册到Google卫星地图上且失真较小的单应性矩阵。它可以通过使用尺度不变特征变换技术(SIFT)在连续的无人机图像之间执行图像配准来获取。相比之下,由于质量不匹配,对于无人机到Google的图像注册是一项艰巨的任务。

Abdelkrim NEMRA的博士的项目于2010年在克兰菲尔德大学完成[6],为机载三维(3D)视觉实时定位和制图(VSLAM)技术提供了可靠的解决方案。这些解决方案是基于无人飞行器(UAV)上使用的Stereovision系统开发的。拟议的机载VSLAM使无人驾驶飞机能无需任何用户干预,构建未知环境的可靠地图,并将自己定位在该地图内。

3图像镶嵌的方法

3.1特征检测

特征的概念已被广泛使用,用以解决计算机视觉领域中的许多问题,例如图像配准和视觉跟踪。特征检测的主要特点是选择图像中的特殊部分并对它们进行所需的分析。最有需要的要素是点,因为它们的坐标可以直接用于确定注册图像的转换函数的参数[7,8]。在某些图像中,可能无法检测点特征。但是,可以检测到线或面。在这种情况下,特征点是从直线和面中得出的。例如,相应的线对的两个交点都可以产生相应的点。这些类型的图元是最理想的特征,因为它们很容易看到并且可以使用简单的检测器进行检测。

3.2特征匹配

一旦找到兴趣点,就可以通过建立所有图像对之间的对应关系(匹配)来识别重叠图像。这种匹配是针对图像的每个点,找到这些点在其他图像中的对应点,从而知道这些图像点是同一场景的真实地物点的3D投影。文献中提出了几种匹配方法。主要有基于相关性比较标准的已知方法,还有基于其他特征描述符之间的比较方法(基于描述符的匹配)和基于其他关注点跟踪的方法(光学流)[9]

3.3图像转换

在计算机视觉中,有许多情况可能需要估计某种图像转换方法是否可行。在我们的例子中,射影变换(单应性)是最适合我们目的的模型,我们需要一个转换模型来将两个重叠的图像彼此投影以创建图像拼接图,用于图像拼接。

在涉及多视图几何的许多应用中,估计两个视图之间的单应性是关键的一步。单应性存在于两个视图3D平面上的点的投影之间[6]

3.4图像变形

图像变形是根据源图像I(x,y)和目标图像I(x,y)之间的映射,将源图像失真成目标图像的行为。映射通常由函数I(x,y)= T(I(x,y))指定。

经过几何校正后对齐的图像,可能还需要进一步处理,以消除残留的失真和不连续性。由于不兼容的模型假设导致的配准错误,对齐的图像可能是不完善的。图像变形阶段可以分为两种方法:图像重投影和图像融合。

4改编的本地二进制模式描述符

4.1本地二进制模式

LBP(Local Binary Patterns,局部二进制模式)算法是一种二进制系统描述,它表示灰度图像像素点及其附近像素点的大小之间的关系,它最初被用于描述图像纹理信息。如今,研究人员提出了许多改进的LBP算法,因其计算复杂度简单以及局部比例照明不变性,已被应用于特征匹配,人脸识别等[10]

4.2改编的LBP功能描述符

原始LBP运算符使用十进制数字标记图像的像素,称为本地二进制模式或LBP代码,它们对每个像素周围的局部结构进行编码。因此,为了描述像素点,应将其与N个邻居进行比较。如果我们想在像素周围以圆形方式取大于8的N个邻居;需要完成许多插值[11],这可能会导致一些错误,因此,在我们的方法中,我们建议使用LBPDs以避免这些插值。创建ALBP描述符的过程总结如下:

(1)对于最近的8个邻域,应将其像素点的灰度值与中心像素点的灰度值进行比较。通过比较符号值,可以对这8个邻域像素点进行二值化,即如果像素点的灰度值大于中心像素点的灰度值,则灰度值将设置为1;如果像素点的灰度值小于中心像素点的灰度值,则灰度值将设置为0。

(2)对于第二个最近的8个邻域,使旧邻居像素和新邻居像素之间的距离设置为1个像素,我们重复步骤(1)中完成所有过程。

(3)对于第三个,第四个hellip;的N个最近的邻居,旧邻居像素和新邻居像素之间的距离为一个像素,我们重复步骤(1)。

(4)将从步骤((1)、(2)和(3))获得的所有8个二值化向量连接起来,得到N * 8的二值向量。

(5)进行二值化后,应将获得的八个邻域像素点的二值化灰度值乘以权重矩阵,如图1所示。

图1.创建LBP特征描述符的步骤(P = 8,R = 1)。

(6)八个值相加后的十进制数字为LBP = 1 2 4 16 =23。二进制矢量为LBP =(10110010)。

局部邻域定义为一组采样点,这些采样点在要标记的像素为中心的圆上均匀间隔开,并且为了处理不属于像素范围内的采样点,我们建议始终取八个不采样的像素。需要使用双线性插值进行插值,从而允许在邻域中使用任意半径和大量采样点[11-13]

图2显示了如何在每个步骤中仅取八个具有精确像素值的相邻像素,而不是取所有相邻像素和某些像素的内插值。

图2.不同点(P)和半径(R)值的LBPD。

对于附近的任何半径和任意数量的采样点,可以在等式中定义位于坐标(xc,yc)的像素的本地二进制模式代码。 如公式(1)为:

其中:

gc是中央像素。

gp是邻居像素。

P是周围像素的顺序。

4.3ALBP描述符的有效距离匹配

给定重叠图像中所有特征的二进制向量,我们可以有效地比较它们。与标准特征描述符不同,它们具有多种描述能力。对于分别来自图像i和i的两个特征点pij和pij,我们可以计算等式中定义的匹配距离。如公式(2)[11]

其中:

dham(a,b)是两个二进制向量a和b(,)之间的汉明距离。

如果将两个特征点进行比较,则它们之间的较小距离值是良好匹配能力的标志。尽管在理想情况下,匹配特征的二进制矢量应完全重合,但应保留一些松弛以避免二进制矢量中的噪声引起的不匹配。为此,我们将特征定义为,如果它们的匹配距离小于阈值tham,则能够匹配。

5基于LBP的图像拼接算法

实际上,可以采用几种算法和体系结构进行图像拼接。对于算法设计,可以使用SIFTS或SURF检测器代替哈里斯拐角检测器。算法的简单性是我们关注的主要内容之一。因此,我们选择了一个简单的拐角检测器(Harris)。下图(图3)显示了基本步骤,以构建我们的图像拼接系统。

图3.图像拼接构建的主要阶段

5.1特征检测

5.1.1哈里斯拐角探测器

Harris拐角检测器由Harris C和Stephens MJ于1988年提出,它是基于信号的局部自相关函数[14,15]。因此,拐角图像特征是离散的,可靠的和有意义的。他们参与了很长时间的计算机视觉应用。该检测器的基本思想是必须通过查看小窗口内的强度值并在任意方向上移动窗口来识别点。我们应该在特征表现上有很大的改变。

5.1.2哈里斯角点检测器算法

哈里斯角落探测器的算法如下:

1.计算图像的导数Ix和Iy,其中Ix和Iy是I(x,y)的偏导数。 通过有限差分计算偏导数

2.构造角图。

(a)计算每个像素的自相关矩阵:

(b)计算角度度量MSc:

其中:

bull;K是一个常数(通常为0.04)

bull;det(M)=lambda;1lambda;2= AB–C2

bull;trace(M)=lambda;1 lambda;2= A B

3.构造阈值拐角图:

bull;如果MSc(x,y)lt;阈值,则MSc(x,y)= 0

其中MSc(x,y)是像素(x,y)的拐角度量。

5.2特征匹配

5.2.1基于ALBP的特征匹配

从本地二进制描述符(LBD)的描述中可以明显看出,它们仅涉及简单的算术运算。此外,两个LBD之间的距离是使用汉明距离来测量的,汉明距离是简单的按位异或(XOR)指令[16]。因此,可以有效地实现LBD的计算和匹配。由于它们还具有良好的匹配性能,因此LBD在SIFT和SURF上越来越受欢迎:与FAST或Harris结合用于关键点检测,它们提供了快速有效的特征提取和匹配。

在我们的案例中,我们连接了一组8位LPBD,以获取具有更多信息的ALPBD,这些ALPBD有助于消除大多数错误关联。

5.2.2离散值剔除

使用所使用的特征匹配技术,我们已经验证了双向条件;如图4所示;为了消除成对的假匹配。

图4.正确匹配的双向条件。

5.3图像转换

5.3.1单应估计

已经提出了用于计算图像对之间的平面单应性的各种方法,但是它们一般分为两大类:第一,直接相关方法,通过使整个图像上的光度一致性最大化来计算单应性。第二,基于特征的方法。根据稀疏分布的点对点,对应关系来计算单应性。

毫无疑问,本文介绍的方法是使用基于特征的注册方法生成的。基于特征的技术在计算速度方面和与直接相关的同类技术相比,具有许多显着优势,它们为使用统计方法进行离散值剔除提供了范围[9]。平面单应性具有8个自由度。每个点对应关系为H的元素生成2个线性方程,

剩余内容已隐藏,支付完成后下载完整资料


资料编号:[257052],资料为PDF文档或Word文档,PDF文档可免费转换为Word

原文和译文剩余内容已隐藏,您需要先支付 30元 才能查看原文和译文全部内容!立即支付

以上是毕业论文外文翻译,课题毕业论文、任务书、文献综述、开题报告、程序设计、图纸设计等资料可联系客服协助查找。