英语原文共 5 页,剩余内容已隐藏,支付完成后下载完整资料
MUSE:使用无偏尺度估计的稳健曲面拟合
詹姆斯V查尔斯米勒V斯图尔特
电子、计算机和系统工程学系的计算机科学。
摘要
尽管有许多成功的应用程序的健壮的统计,它们还没有完全适应许多计算机视觉问题。距离重构,特别是在非结构化环境中,需要一个强大的估计器,它不仅可以容忍较大的异常值,而且还可以容忍几个不连续的异常值,在图像区域中提取多个表面。
我们的新运算符,称为MUSE(最小无偏尺度估计值),通过客观函数的无偏估计来评估一个假设的拟合。MUSE从数据中提取出最适合的数据,将其目标函数最小化到一组假设的匹配上,并能从图像区域连续提取多个表面。在综合数据建模的基础上,对复杂范围数据进行了初步的实验研究。
1 简介
如果统计方法或估计器能够继续成功地运行,就会被认为是健壮的,因为数据偏离了估计器的目标分布。将此概念应用到回归分析中,一个健壮的拟合过程应该能够提取出一个良好的匹配,尽管有一部分数据被随机的异常值所破坏。健壮的操作符是许多计算机视觉应用程序的理想选择,因为传感器和低级处理算法都可以引入严重错误。事实上,在许多计算机视觉应用程序中,健壮的技术已经非常成功[8,15];然而,当目标是识别或提取带有随机异常值的单个信号时,就会取得最大的成功。
不幸的是,许多计算机视觉应用程序并不适合这种单一孤立对象的模型。例如,在距离重建中,使用鲁棒运算符来估计小图像窗口的表面参数。每个窗口都有可能包含来自多个表面的数据。这些表面可能在伪透明的情况下重叠,例如链环围栏;一个或所有的表面可能包含少于50%的区域数据。此外,当多个表面处于一个区域时,距离传感器可能会引入与不连续点对齐的随机离群值。重建精度要求所有表面区域提取,提取随机异常值被忽略,不适合跨接不连续(尤其是在逆向工程精度需要小规模的不连续性,即一步高度le;10sigma;)。
图3(a)和6(b)说明了范围数据的问题。在图3(a)中,两个相等大小的表面分别用8个台阶高度和10%的离群值来分离。因此,每个表面包含的数据少于50%。虽然不连续性和分割似乎很明显,但对于健壮的估计器来说,这种情况仍然存在问题。图6(b)显示了收件箱、几个硬纸盒和一个小花盆的实际范围数据,这些数据包含伪透明区域(通过收件箱的grates可见的背景表面)和大量的离群值(它们倾向于与不连续点对齐)。
标准的稳健回归技术[4,12]根本不是为了解决这些问题而设计的。它们的设计目的是提取一个表面,它的数据被异常值所破坏,而不是用于鲁棒地提取多个表面。虽然这些健壮的回归技术可以应用顺序的方式,从一个区域中提取第二个表面一旦内围层第一表面已被移除,等等,这些技术一开始就带有偏见的相干结构的数据来自多个表面,而是提取桥梁表面不连续[13]。这是所有表面时尤其明显包含少于50%的数据或当不连续的大小低于10sigma;。
即使是视觉社区开发的健壮的拟合技术也被复杂性所阻碍范围的场景。Hough变换的固定带技术[5],RANSAC [3], Roth和Levine[11]需要精确的先验噪声估计。我们最初的范围数据实验表明,噪声随深度、图像位置和表面材料的变化而变化,使得先验噪声估计有问题。此外,这些技术存在小尺度不连续的困难[13]。Stewart的MIN-PRAN运算符[14]容忍了范围图像中的大量异常值,并识别了完全由异常值组成的区域;但MINPRAN关于离群分布的假设并不足以提取多个表面。最后,Mirza和Boyer[10]、Leonardis等[7]和Darrell等[1]的表面生长技术被专门设计用于提取多个表面。然而,这些技术依赖于良好的种子匹配,通常使用健壮的估计器获得,因此容易受到上面讨论的问题的影响。
我们的操作人员的两个目标是能够提取包含不到50%数据的表面,并且能够检测小尺度的不连续性。首先,我们的目标函数是基于一系列无偏的稳健规模估计(适合残差的方差)的假设拟合。每个尺度估计sk是基于fit的k最小绝对剩余,而fit的代表性尺度估计是其sk值的最小值。对一组假设拟合的无偏度估计进行了比较,并提取了最小无偏估计量的拟合。
在假设的范围内和之间最小化无偏差尺度估计值,可以对异常值和大规模的不连续性产生鲁棒性。异常值的典型的大的残差产生大规模的估计。通过最小化给定匹配的代表规模估计不受离群值的控制。无偏估计规模比较适合大规模产生鲁棒性之间不连续(步骤山庄gt; 8sigma;)因为衔接配合的代表规模估计倾向于高估的真正规模。
其次,为了解决小尺度不连续,我们的操作人员可以比较不带偏见的尺度估计,以确定在区域2的不同子集上的假设。在这里,scale估计值被定位到假设fit定义的子区域,从而为被认为来自单个表面的数据创造了可能。这样的拟合会有一个比桥接匹配小的尺度估计,即使是小幅度的不连续。
本文的其余部分详细介绍了我们的新估计器,重点介绍了上面概述的两个特性,并展示了如何在序列表面提取算法中嵌入估计器。演示强调了健壮技术的开发,因此,该算法仅适用于在每个窗口中提取多个平面近似。一个完整的区间分割算法和更高阶的表面提取等待着未来的发展。
作为最后的初步说明,我们受到了启发,通过最近一项叫做ALKS[6]的相关技术来开发我们的新估计值[6]。虽然ALKS处理极端值的能力有限,因此不能直接与我们的新估计值相媲美,但它确实让我们看到了开发这个估计器的可能性。我们将在第3节中进一步讨论。
2 最小值的平方
我们首先回顾一下最小的平方数(LMS)[12]因为MUSE建立在LMS的计算技术及其对数据的方差估计的能力上。LMS在应用于一个孤立的信号时非常成功,但是当它呈现多个表面时,如果一个信号包含少于50%的数据,它就会失效。
LMS搜索一个假设的空间,使用一个基于中值平方剩余的目标函数。
其中C是一个常数,用来对特定的目标分布进行不偏置。如果留置高斯分布的数据,那么C = 1.4826(1 5 /(Nminus;p))[12],其中N是数据点的数量,1.4826的因素是平均残余的期望值的逆从标准化的高斯分布(单位方差),和(1 5 /(Nminus;p))纠正小点集。
3 MUSE目标函数
传统上,LMS被认为是最小化平方剩余。然而,LMS可以被等价地看作是最小化公式1中的无偏估计。从这两种观点来看,LMS都要求一个表面至少包含50%的区域数据。我们可以通过在LMS的规模估计和这个规模估计的使用情况下,通过利用低于50%的数据和估计精确匹配多面存在的方法来突破这一限制。
当所有的数据都来自于目标分布(即高斯误差)时,LMS的尺度估计是无偏的。少量的离群值会稍微增加估计的规模中值的平方剩余增加。超过50%的异常值会显著增加,因为中值的平方剩余是一个异常值。然而,一个有意义的尺度估计仍然可以用与中位数不同的秩序统计量来构造。这就维持了一个基于估计规模的目标函数;但是,如果没有先验知识,我们需要一种方法来比较假设的更低百分比的规模估计。
我们的新运算符是基于这种直觉的。对于任何假设,我们的操作员计算的规模从合适的无偏估计k(级)残差最小,所有可能的值的k,k 1le;le;Nminus;p(符合定义为随机选择p分有Nminus;p残差)。对所有可能k的最小尺度估计是假设拟合的代表值。该值用于比较不同的假设拟合,最佳拟合具有最小的尺度估计。内围层然后确定使用最佳适合的规模估计,sigma;̂,即这些点与r | |le;2.5sigma;̂。
3.1无偏尺度估计,sk。
从k中构造一个无偏估计。最小的绝对剩余是MUSE的关键。我们使用了与LMS相似的剩余归一化方法,但计算了一系列的规模估计,并结合它们来产生我们的规模估计sk。
给定一个剩余密度phi;(r;sigma;)-phi;是随机变量的密度具有零均值和标准差sigma;- r可以写成一个比例从标准化分布随机变量u(usim;phi;(u;1)和r =sigma;u)。给定的N个点从phi;(r,sigma;),k命令绝对剩余rk:N可以写成k命令绝对剩余的标准化分布、rk:N =sigma;uk:N。这导致了规模估计。
公式2将每个残差转化为一个假设的拟合,并将其转化为一个规模估计。创建一个规模第一k残差统计总结,我们可以计算的加权线性组合sk k值le;k,权重是由sk的协方差得到的。但是,排序绝对剩余会产生高度相关的sk变量。因此,通过任何加权线性组合来组合sk变量,并不会比单纯使用sk作为第一个k绝对剩余的规模估计值来产生更好的估计(在估计的方差方面)。
3.2MUSE不连续的情况
尽量减少无偏估计的规模。当数据由多个表面组成时,假设匹配的对象如图1所示。我们考虑了两个相等大小的表面之间的阶跃不连续,有单位方差的高斯误差,并且有10%的离群值。利用[13]中所开发的分析工具,我们计算出两个假设拟合的期望绝对残差——一个是不连续性的一个正确的拟合,另一个是不连续性的合适的桥接,并计算每个拟合的最小值。
对于中间和较大的步骤高度,正确的fit最小的sk小于桥接合体的最小sk,这意味着我们的新估计器应该选择一个正确的匹配,即使每个表面包含的数据小于50%。然而,缪斯仍然更喜欢在小台阶高度的桥接,因为它可以发现大量的数据紧密地围绕桥接合体。这个问题由第4节中提出的缪斯的扩展来解决。
最后,对于步高,正确的fit最小的sk几乎是一个经常过高的估计。它是一个常数,因为最小的sk从不直接依赖于55%的数据而不是正确的匹配。这是一个过高的估计,因为这55%间接地影响了inlie数据的规模估算,
图1:在不连续性的情况下,在一个合适的桥上,最小的sk的期望值是不连续性的,并且在不连续性的一侧是正确的。是真实的规模。
3.3在sk方差
从目标分布中得到的数据,从公式2中得到的N阶估计都是无偏的;然而,他们的变化能力有很大的不同。图2(a)显示了方差。
每个sk的N = 100个单位方差的高斯点。小k的注意,sk方法中的标准偏差,即,比任何给定的残差值都不同。
前几个sk的大方差影响了假设拟合的最小sk。在图2(b)中,我们绘制了E[分钟|k],给定剩余k对所有N残差产生最小刻度值,sk的期望值为。在前几次sk的大方差可能会导致最小的sk值被严重低估。
然而,sk和E[mins|k]的方差相对较快:s1的标准差约为s90的10倍,s10的标准差仅为s90的3倍。因此,我们可以提高我们的规模估计的稳定性——同时还能容忍一个较大的离群百分比,并且仍然提取不到50%的数据的表面——只是忽略了第一个10-15%的绝对剩余的规模估计。
0 |
10 |
20. |
30. |
Min sk的期望值。 (a)(b) 60 70年 80年 |
图2:(a) sk的标准偏差(b)给定绝对剩余k的预期最小值sk的经验图产生最小尺度估计值。
3.4纠正因最小化而产生的偏差
选择最小尺度估计作为代表。
假设拟合误差的假定值为估计低(图2(b),预期的最小值均小于真实的刻度值= 1)。为了比较假设拟合的最小尺度估计值,我们必须纠正这种偏差。
对假设拟合的不偏最小尺度估计是通过标准化最小sk来构造的,标准化因子是标准化分布中最小尺度估计值的期望值,因为最小值发生在绝对剩余k,即。
其中vk表示标准化分布的第k级估计值。E[minv|k]可以用动态规划算法(见[9])在O(N3)时间内计算,并存储在一个表中用于MUSE。
3.5提取多个表面
为了处理一个完整的范围图像,我们将其划分。图像进入小区域或窗口,允许MUSE从每个窗口顺序提取多个表面。处理每个窗口的步骤如下:
①确定随机抽样的数量需要提取下一个表面。
②对于每一个随机样本符合:
用最小的
④删除所有数据点在micro;sigma;̂theta;̂最佳的健康。⑤如果窗口包含另一个表面。
⑥完善规模估计该地区的适合使用点
在有足够小残差的窗口内,将每个区域的数据点分配到它具有最小归一化剩余的表面,
如果一个表面有足够的异常值,那么在识别的异常值上使用最小二乘法进行优化。
确定步骤①中随机抽样的数量取决于剩余的数据量,数据表面剩余的预计数量,和预期的异常值(见[14])。总的来说,假设正常的因素存储在查找表中,算法需要O(N logN)时间来分析每个假设的拟合。这一次与LMS相当。
步骤和关键在于区分数据的随机集合和具有底层表面结构的数据。我们正在寻求两种技术来解决这一需求。第一个利用了斯图尔特的MINPRAN运算符的优点[14]。第二次搜索数据以获得可靠的统计不对称。
3.6几个例子
图3显示了上述算法的四个步骤。对二维数据操作。场景包含一小步8sigma;的不连续,10%随机异常值,每个面都有不到50%的数据。多个表面被成功提取。
第3.2节预测缪斯在小幅度不连续的情况下并不总是适用于正确的表面。图4显示了一个类似于前一个数据集的数据集,但是第一个提取的表面是一个桥接合体,它将几乎所有的inliers合并到两个表面。
图3:(a)多个表面范围数据的阶梯高度异常值8sigma;和10%。(b)的第一表面提取。(c)去掉第一个表面的可能的异常后剩余的点。(d)最终的重建。已经确定了两个表面和它们的异常值。“x”标记没有分配到任何表面的点,因此是异常值。
<stro
剩余内容已隐藏,支付完成后下载完整资料</stro
资料编号:[464145],资料为PDF文档或Word文档,PDF文档可免费转换为Word
以上是毕业论文外文翻译,课题毕业论文、任务书、文献综述、开题报告、程序设计、图纸设计等资料可联系客服协助查找。