英语原文共 32 页,剩余内容已隐藏,支付完成后下载完整资料
Homography 估计
by
Elan Dubrofsky
B.Sc.,卡尔顿大学,2007
摘要
这篇文章的目的是为读者提供一种单应性估计的处理方法,以及它在当今计算机视觉应用中的应用。该话题的动机是讨论单应性的各种情况估计是必需的和其他几何变换的概述从而将单应正确使用。 各种算法讨论了从最基本的线性算法到统计优化。 用于单应性估计的非线性算法改善旨在最小化的成本函数。 可靠的估计涵盖了关于异常对应的技术以及利用线条和圆锥等非点对应的算法。最后,提供了这方面公开可用软件的调查。
Elan Dubrofsky.dubroe@cs.ubc.ca
目录
致谢
我想表达我对我的合作导师,感谢Robert J. Woodham,因为他所有的援助与isvc论文这篇
论文才能发表。另外,我还要感谢我的另一位共同主管Jim Little。我们对这个话题和其他话题进行了有益的讨论。其他参与讨论这个话题的人还有David Lowe,Matthew Brown和Kenji Okuma。最后我要感谢Andreas Hofhauser指出我对许多有用的对于单应估计资源。
第一章
介绍
1.1什么是单应
图像中的2d点(x,y)可以表示为三维向量x=(x1;x2;X3)其中和。这称为一个点的齐次表示,它位于射影平面p 2上。单应是射影平面P 2点和线的可逆映射。此转换的其他术语包括直射,直射,和平面射影变换。Hartley和Zisserman [ 11 ]提供定义:单应是从P 2的可逆映射从而三个点在同一行上当且仅当它们的映射点也是共线的。他们还通过证明给出了代数定义。下面的定理:p 2-gt;P 2是一个射影如果存在一个非奇异3times;3矩阵H,任何一点P 2为代表的向量x,这是真的,它的映射点等于Hx。这告诉我们,为了计算单应映射xi对应x0足够计算3times;3单应矩阵H.
应该注意的是,H可以通过乘任意不改变射影变换的非零常数来改变。因此,H被认为是一个齐次矩阵,甚至只有8个自由度。虽然它包含9个元素。这意味着需要8个未知数。有待解决。
通常,homographies估计在图像图像中的对应关系中寻找特征。最常用的算法是使用点特征对应,尽管其他特性可以用。如直线或曲线。本文的第2章将讨论一些单应矩阵估计算法。
1.2与其他几何变换的关系
一个了解单应变换的好办法就是把它们放进其他几何变换中。单应矩阵变换
有8个自由度,还有其他使用3times;3矩阵但包含特定约束的更简单的转换来减少自由度。本节介绍单应和展示单应性可以被转变成这些简单转换的集合的层次结构。在[ 11 ]中有更详细的内容。
1.2.1等距
等距是保留欧氏距离变换。这表示一个图像中两个点之间的作为映射图像中对应点之间的距离是相同的。线和区域之间的夹角也是一样的。只有2D旋转和2D翻译,因此只有3自由度。等距可以写为:
其中R是一个2times;2旋转矩阵,T是一个翻译2向量,0T是2零行。
1.2.2相似变换
相似变换类似,除了它也包含各向同性的缩放。各向同性意味着尺度不变和遵循方向。
比例增加了额外的自由度,所以相似。变换包含4个整体的自由度。喜欢与等距,角度不该相变的影响。点之间的距离是不再不变,但在相似性下保持距离之比。转换,因为任何规模的变化抵消。相似变换可以写成:
其中s是标量,表示各向同性标度。
1.2.3仿射变换
仿射变换类似于相似变换,但不是单一的旋转和各向同性的缩放,而是由两个旋转和两个非同向的部分组成的。它包含两个以上的自由度和相似变换相比;一个用于确定缩放方向的角度和一个确定缩放参数的比率。非相似性变换,一种不保持距离比或线之间的角度仿射变换。但仍然有一些不变量,如一幅图像中的平行线在映射图像中保持平行,并且平行线段和区域长度的比率保持不变。仿射变换转换可以写成:
其中A是2times;2非奇异矩阵。
A可以分解为:
其中R(theta;)和R(phi;)旋转矩阵theta;和phi;分别与D
是对角矩阵:
lambda;lambda;1和2可以视为两个标度值。
矩阵是一个级联的phi;旋转,通过lambda;1缩放在X方向,Y方向的在lambda;2缩放,旋转minus;phi;后
另旋转theta;角。
1.2.4射影变换
最后我们来说射影变换或上面已经定义了的单应变换。射影变换是一个非奇异齐次坐标的线性变换。这一变换是非线性的非齐次坐标的,这使齐次坐标的使用如此有价值。射影变换与仿射变换相比,现在包含两个以上的自由度。矩阵有九个元素,只有它们的比值显著。上述仿射变换的不变量都不存在于射影中。如果一个图像上的三个点位于同一直线上,那么它们在另一个保持不变的情况下是共线的。射影变换可以写成:
其中v =(V1;V2)T。
仿射变换和射影变换之间的主要区别是矢量v,在仿射情况下是空的。这个向量负责
的是直射的非线性效应。关联是,从开始到A到处都是一样的随着图像中的位置在平面projectivities缩放而变化。同样地,一个转换线只依赖于原线的方向,而对于projectivities原有线路的平面上的位置也影响转换线方向。
投影变换可以分解为前面提到的变换的链:
这里HS代表一个相似变换,HA代表一个关联。
HP表示投射变换。A=SRU TVT和U是uppertriangular矩阵归一化为DET U = 1。
这个分解为有效,v不能等于0。如果s选择为正,则此分解是独一无二的。
1.2.5透视投影
到目前为止,这个层次结构已经处理了2D到2D(或平面到平面)转换。另一个被广泛研究的转变观点是投影是空间中三维点到二维点的投影。这是当照相机拍摄世界图像并显示时发生的投影图像平面上的结果。
透视投影可以以齐次坐标由3times;4摄像机矩阵P:
x = PX(1.8)
其中X是一个以类似3向量为代表的图像点
X是以类似4向量为代表的世界点。
摄像机矩阵P有11个自由度,这与
一个定义了一arbitraryscale的3times;4矩阵自由度数相同。这些自由度或参数可以分解成两个类别:5个内部参数和6个外部参数。5内部摄像机参数通常用矩阵k表示:
在这里,alpha;x和alpha;y代表摄像机的像素长度分别在x方向和y方向的尺寸(x0,y0是主要的;)
图像平面上的点和s是一个斜参数。
6外部参数与相机定位到世界坐标系,包括3个旋转(由3times;3矩阵R表示)
3翻译(由3向量T表示)。因此相机矩阵p可以表示为:
P = K [ R|T ](1.10)
Hartley和Zisserman [ 11 ]注意一些设想可以制造摄像机模型,以减少自由度的数目。
假设摄像机有正方形像素,因此在x中都有相同的尺度。y方向允许alpha;x=alpha;y=alpha;。在很多情况下S也可以设置为0。作出这些假设,透视投影将有有8个一个比一个远的9个自由度。
1.3在哪些情况下求解单应出现
很多情况下,计算机视觉可能需要估计单应性。在本节中,我将探讨其中的一些情况来显示说明单应性已经在实践中解决这些问题中的一些。而在情况介绍有很多重叠的部分,这部分的目的是引出2章,单应估计在许多计算机视觉领域中,确实是必需的。
1.3.1摄像机标定
相机标定是确定内在和外在相机的设置参数的过程。内在参数是那些特定的对镜头,如焦距、主镜头和镜头畸变。外部参数指的是摄像机的三维位置和方向以确定图像上出现的关系的系统并且它位于世界。摄像机的标定知识矩阵,通常称为k,是许多基本图像处理所必需的操作,如去除径向失真[ 9 ]。
张在[ 25 ]和Chuan et. al在[ 5 ]两个现有的方法来解决使用单应估计从不同角度拍摄同一平面图案的图像的内在的和外在的参数。为做到这个,他们利用H = K[Rt] ,H是单应矩阵,K为内部参数矩阵,R是旋转矩阵T是平移向量。
1.3.2三维重建
3D重建是计算机视觉中的目标所在根据场景图像重建场景结构和相机位置。其中一个非常有用的领域是在医学成像领域可以使用身体部位的多个图像(例如大脑)来创建一个被分析部分的3D模型[3],[8]。 Google地球[1]最近发布了一个新的更新,可以简单地从整个城市重建图片。解决单应性是三维重建的关键一步通常需要获得场景图像之间的映射。Wright et. al在[23]中使用圆锥对应来重构
全文共17225字,剩余内容已隐藏,支付完成后下载完整资料
资料编号:[14265],资料为PDF文档或Word文档,PDF文档可免费转换为Word
以上是毕业论文外文翻译,课题毕业论文、任务书、文献综述、开题报告、程序设计、图纸设计等资料可联系客服协助查找。