基于稀疏的图像通过字典学习和结构聚类进行去噪外文翻译资料

 2022-04-26 22:52:27

英语原文共 8 页,剩余内容已隐藏,支付完成后下载完整资料


基于稀疏的图像通过字典学习和结构聚类进行去噪

摘要

图像信号的稀疏性从何而来?局部和非局部图像模型对自然图像的规律性提供了互补的观点,前者试图构建或学习促进稀疏性的基函数字典;而后者通过聚类将稀疏性与图像源的自相似性联系起来。本文提出了一种统一上述两种观点的变分框架,并提出了一种基于簇基稀疏表示(CSR)的去噪算法。受l1优化成功的启发,我们提出了一个双标题的l1优化问题,其中正则化涉及字典学习和结构构造。提出了一种基于替代函数的迭代收缩解,用于求解双标题的l1优化问题,并给出了企业社会责任模型的概率解释。我们的实验结果显示了在常规纹理图像上比最新的去噪技术BM3D有令人信服的改进。CSR去噪的PSNR性能至少是可比性的,并且常常优于包括BM3D在内的其他竞争方案。

1.介绍

对于图像去噪问题的正则化有两种互补的观点:局部的和非局部的。在当地的观点,一个信号x⃗isin;Rn可以分解对n维基向量的集合在希尔伯特空间(也称为字典)Phi;isin;Rntimes;m,即x⃗ntimes;1 =Phi;ntimes;malpha;⃗mtimes;1,在alpha;⃗表示权重的向量。alpha;的稀疏特征可以由其l0-norm(凸)或更容易处理的l1范数计算[1]。这一系列的研究导致了基函数的构造(如脊波、轮廓线)和字典的自适应学习(如K-SVD[2]、随机逼近[3])。在非lcoal视图中,自然图像包含自重复模式。利用重叠斑块的自相似性,产生了一系列非局部图像去噪算法,如非局部平均[4]、BM3D[5]、

局部学习字典K-LLD[6],学习同步稀疏编码(LSSC)[7]。

其中,自BM3D出版以来,PSNR的表现一直是最先进的。尽管BM3D有令人印象深刻的表现,但对于它为何表现如此出色仍缺乏坚实的理解。此外,稀疏性(广泛用于低级视觉任务)和集群(用于中级视觉的常用工具)之间的微妙关系仍然难以捉摸;我们确实承认最近关于联合/小组稀疏[7]的努力,它试图阐明这个问题。在统一的理论框架下,将字典学习(如K-SVD)和结构聚类(如BM3D)这两类最有前途的思想联系起来似乎是可取的。

本文通过提出一种新的基于簇的稀疏表示(CSR)图像模型来实现上述目标。CSR模型背后的基本思想是将本地和非本地稀疏约束(分别与字典学习和结构聚类相关)视为对等的,并将它们合并到统一的变分框架中。新的正则化项可以看作是[7]中讨论的联合/群稀疏性的一种似是而非的形式。由于字典的酉性,我们可以证明这个新术语的空间域和转换域表示之间的等价性。此外,在压缩感知成功的启发下,我们提出用l1-范数来代替描述非局部稀疏性的l2范数,形成一个双标题l1优化问题。

针对上述双标题l1函数的函数[8]优化问题,提出了一个迭代收缩解。我们的结果进一步将[8]中的参数从一个正则化参数推广到一对正则化参数。这种泛化允许我们同时通过计算效率高的收缩运算符来实施局部和非局部稀疏约束。另外,我们借鉴了l1-optimization[9]的思想,对两个正则化参数和迭代正则化[10]进行自适应调整,进一步提高了CSR去噪性能。大量的实验结果表明,我们的CSR算法可以达到与其他领先的去噪技术(包括最先进的BM3D)竞争激烈(而且通常更好)的性能。

2.基于集群的稀疏表示(CSR)模型

我们首先建立图像与稀疏系数集合之间的联系,用来表示从图像X的空间位置i处选取的图像块[5]。得到如下公式:

= (2.1)

这里的表示一个矩形的窗口操作,在发生重叠的情况 下,这种基于块的表示是高度冗余的[6]。同时, 复原成可以用一个超定方程组来表示,得到下面的最小二乘解是很容易的。

这只不过是重叠块平均化策略的一个抽象。同时,对于给定的字典Phi;,每个图像块都与其稀疏系数有关。

(2.3)

将等式(2.3)带入到等式(2.2)中,我们可以得到

其中D是算子对偶于R。在图像去噪的背景下,可以构造出以下变分问题:

(2.5)

其中Y=X N是带噪图像,lambda;是标准拉格朗日乘子。对字典的设计学习以及求解上述凸优化问题的计算效率/鲁棒算法进行了广泛的研究。

稀疏系数并不是随机分布的。它们的位置不确定性往往与图像信号的非局部自相似性有关,这意味着利用这种位置相关约束实现更高稀疏性的可能性[7]。从这种解决强度和位置不确定性的角度来看,我们甚至可以将其与最初提出的“双变过滤”的想法联系起来。聚类代表了一种利用这种非线性约束的可行方法(因为它与位置相关)[8]。事实上,在文献中有大量的工具(例如,Kmean,KNN,光谱,图形切割)。然而,由于它们被视为不同层次(中间与低级)开发的工具,为了更深入地了解非局部自相似性如何促进稀疏性,我们建议研究以下成本函数:

其中,代表系数第k簇的质心.,公式(2.6)表示基于聚类的正则化项,加权系数是相对于的重新编码[9]。通过进一步的“压缩”,可以得到稀疏的表示(利用非局部自相似性的结果)。事实上,以前的工作,如BM3D和LSSC都是基于类似的考虑,关于聚类和稀疏,但他们的联系仍然松散。在我们的知识中,这是在统一的变分框架下将聚类和稀疏结合起来的第一个严格的数学公式。为了更好地理解新正则化项的意义,我们可以重写等式(3.14),如下所示:

其中,=即所有质心向量都以与相同的字典表示,由于的单一属性,我们有=,因此公式(3.14)可以归结为以下联合优化问题:

受压缩感知算法的启发,我们建议用L1范数代替新正则化项中的L2范数,得到如下公式:

3.迭代重加权和正则化l1最小化

本文的主要技术贡献之一是解决了公式中的双头优化问题。通过迭代算法交替更新和,借鉴替代函数的思想,我们导出了一个迭代收缩算子,用于更新和,即:

其中=,=(c是一个保证替代函数凸性的辅助参数),上标i表示迭代次数,下标j表示向量的第j项,因此,我们的结果表明,迭代收缩也适用于局部和非局部稀疏的两个正则化参数的情况,它在计算上的高效性使CSR模型得以完善。的更新遵循了与非局部均值去噪类似的过程(迭代重加权最小二乘法[可以提供更系统的解决方案,但在当前的实现中没有使用。)

迭代收缩的计算效率使我们可以改进CSR模型及其相关的优化算法。首先,我们借鉴了变分图像恢复和加权优化的思想,自适应地调整了两个正则化参数、[10]。在变分图像去噪中,正则化参数lambda;应与信噪比(SNR)成反比;在加权优化中提出的加权策略还表明,在压缩感知的情况下,新的权重与信号幅值成反比(因为没有噪声)。因此,我们采用了以下策略来更新、:

其中,是噪音方差,=-,和是两个预定义的常量(我们通常设置来强调非局部项)。

受最近工作的启发,我们建议更新恢复图像的算法:

此处表示正则化约束集上的投影,并且

是实现迭代正则化思想的算子,公式(3.22)的右式可以被看作是一个退化的Landweber算子(当模糊的内核退化为一个恒等算子时),是一个很小的正数,可以控制反馈给迭代的噪声量。经过三次迭代,我们选择手动终止该算法。

先输入一个原始图像,加入标准方差为20的高斯噪声得到一个含噪图像用K-SVD字典学习算法得到稀疏系数的表达式,同时构建冗余字典,然后用k-means算法思想更新冗余字典,并用PCA来进行降维。随后进行聚类得到图像的质心,再通过迭代正则化更新正则化参数,更新稀疏系数和聚类参数,最终输出完成去噪后的图像

①初始化:;

②外循环(字典学习):i=1,2,hellip;,I;

—通过K-means和PCA更新;

③内循环(结构聚类):j=1,2,hellip;,J;

—迭代正则化:;

—正则化参数更新:通过公式(12)获得,的新估计值;

—质心估计更新:通过KNN聚类获得的新估计值;

—图像估计更新:通过获得X的新估计值[11]

总结一下CSR模型,,我觉得它通过将字典学习参数和结构聚类参数统一到一个变分框架中,为理解稀疏性提供了一种新的方法。这种方法利用中的结构冗余,可望获得更高的稀疏性。理解的另一种方法是,它们是通过结构聚类来对进行更高级别编码的范例(从概念上类似于反卷积网络)。

4. CSR算法的贝叶斯解释

在这里我们给出了上述CSR去噪算法的贝叶斯解释。在小波阈值化的文献中,稀疏表示与贝叶斯去噪之间的联系已经建立起来。这种联系在过去的十年里对两种理论的发展都是有益的,因为它有助于调和确定性学派和概率学派之间的差异。正则化函数和先验分布在确定性和概率条件下的双重作用,已经证明了变分和贝叶斯图像去噪的等价性。因此,我们认为将上述连接从本地(基于字典的)扩展到非本地(基于集群的)框架是有用的。CSR的基本思想是假设我们可以将K个簇的质心作为稀疏系数的对等隐藏变量。这种想法本质上是为了认识到解决构成(与位置相关)图像信号的不确定性的重要性。因此,我们可以给出下面的最大后验(MAP)估计公式:

用贝叶斯公式,我们可以把式(3.1)改写成:

这两项分别对应于概率和先验分布。第一项很容易用Y=X W来描述,即

统计建模的艺术通常是指第二项的近似,例如,在独立同分布假设下,我们可以将分解成边际分布的乘积。放宽这种假设的一种方法是通过数据聚类进一步利用其结构约束

其中,定义了每个集群产生的偏差。这种基于聚类的差分预测可以看作是稀疏编码策略的另一层,因此与几乎是独立的。如果我们选择和都用独立分布的拉普拉斯分布来建模的话,可以得到以下先验模型:

将公式(3.3)和公式(3.5)带入公式(3.2),可以得到:

这相当于公式(6)设置,。概率设置还允许我们重新检查在确定性设置中所作的特定选择。例如,受非参数统计中的核密度估计技术(例如Parzen windows的启发)我们可以将公式(1)一般化为:

其中W表示一个非均匀加权算子,有利于靠近窗口中心的样本。因此,我们可以将式(3)的公式推广到加权最小二乘解:

在我们当前的实现中,W使用了一个高斯窗口(类似于非局部均值中的加权窗口)。

5. 试验指标

在对处理的图像中,人们往往更关注的是在人眼看来图像呈现一个怎样的效果,相对于处理前图像是否有变化?变化了多少?所以如何去模拟人类的视觉感受来对图像的质量评判给出一个标准就成了研究者的一个课题。后来SSIM算法就出现了,它是一种衡量人们对图像,视频的视觉上的主观感受的指标。自然图像的结构性一般都很高,尤其是在有相似的空间的情况下,这些图像中的像素之间往往存在着很强的关联。在人眼看来,这些像素之间的关联往往与物体的结构有关,带有描述物体的重要信息。结构相似性算法就是利用图像的这一特性实现从视觉效果上评价图像的质量

物体表面的的亮度与照度和反射系数有关。其中,物体的结构会影响物体的反射系数,而照度则与物体结构无关。想要将亮度与物体的结构信息联系起来,我们就要尽量减少照度对物体的影响。图像里物体的结构信息有两个定义,一个是物体的亮度,一个是对比度。然而亮度和对比度在一个场景中总是在变化的,为了解决这个问题,我们可以分别对图像局部进行处理从而得到更加精确的结果。书是的你家啊逆

在SSIM算法中,通过三种对比模块的测量对图像结构相似性进行描述,这三个模块分别为:亮度,结构,对比度。下面我们对这三个模块函数进行定义。

首先,对于离散信号,我们以平均灰度来作为亮度测量的估计:

亮度对比函数I(x,y)是关于,的函数。然后,由测量系统知道要把平均灰度值从信号中去除,对于离散信号,可使用标准差来做对比度估量值。

对比度对比函数C(x,y)就是,的函数。接下来信号被自己的标准差相除,结构对比函数被定义成和的函数。最后三个对比模块组合成一个完整的相似测量函数:

应该满足以下三个条件:

⑴对称性:=

⑵有界性:

⑶最大值唯一性:当且仅当时,。

下面定义三个对比函数。

亮度对比函数:

常数是为了避免接近0时造成系统的不稳定。特别的,我们选择,L为图像灰度级数,对于8-bit灰度图像,L=255,。公式(4.4)满足上述三个条件。

对比度对比函数:

常数,且。公式(4.5)依然满足上述三个条件。

结构对比函数:

其中

最后把三个函数组合起来,得到SSIM指数函数:

这里,用来调整三个模块间的重要性。为了得到简化形式,设

在局部求图像SSIM指数比全局计算SSIM指数在图像质量的评估上更有优越性,有四点原因。第一点,结构信息在图像的全局分布中是不均匀的;第二点,以人眼看物体的习惯,人们会把视线聚焦到目标物的一处,基于这一点,用局部处理方式更能适应人眼的观察效果。第三,图像的失真在整个空间也是不断变化的。第四,为了SSIM至少能够更好地服务于其他运用,因为通过局部处理可以得到图片空间质量变换的映射矩阵,这种矩阵在很多处理中都得到了应用。你啊是你发你

全文共12320字,剩余内容已隐藏,支付完成后下载完整资料


资料编号:[13226],资料为PDF文档或Word文档,PDF文档可免费转换为Word

原文和译文剩余内容已隐藏,您需要先支付 30元 才能查看原文和译文全部内容!立即支付

以上是毕业论文外文翻译,课题毕业论文、任务书、文献综述、开题报告、程序设计、图纸设计等资料可联系客服协助查找。