图像质量客观评价系统设计与实现外文翻译资料

 2022-03-11 22:22:55

英语原文共 13 页,剩余内容已隐藏,支付完成后下载完整资料


摘要:

现存的盲图像质量评估方法(BIQA)大多是观点感知法。他们与人对于图像的主观评分联系起来,以此学习回归模型达到预测测试图像的感知质量的目的。但是,这种观点感知法需要大量与人主观评分联系以及各种不同失真类型的训练样本。通过观点感知法学习的BIQA模型通常具有较弱的的普适性,因此在实际中适用性不强。相比之下,观点未知法不需要人的主观评分作为训练依据,因此更可能具有较好的皮实行。然而,较之观点感知法,至今为止观点未知法并未展现出更高的预测质量精确度。现在,我们致力于发展能与现存观点感知法相媲美甚至超过地观点未知BIQA法。通过整合多处来源的自然图像数据,我们从一个原始自然图像集中学习了图像块的多元高斯模型。使用已知的多元高斯模型,类巴特查里亚距离用于测量每副图像块的质量,然后通过平均池化得到整体质量分数。提出的BIQA方法不需要任何失真样本图像或是主观质量分数用于训练,然而大量实验证明了与最先进的观点感知BIQA法相比,其具有更好的质量预测表现。算法部分的MATLAB源代码已可供公开使用:

www.comp.polyu.edu.hk/sim;cslzhang/IQA/ILNIQE/ILNIQE.htm.

关键词:盲图像质量评估,自然图像数据,多元高斯

1.引言:

在许多应用中,如图像采集、传输、压缩、储存、增强等,若能够准确地评估输出图像的质量,这将是一个非常理想的目标。对图像的感知质量进行定量评价是现代图像处理和计算视觉研究中最具挑战性的问题之一。感知图像质量评价(IQA)方法分为两类:人的主观评价和模仿主观判断设计的客观评价的算法。虽然主观评价是图像质量的最终标准,但它费时、繁琐、昂贵,无法在需要实时评估图像或视频质量的系统中实现。因此,人们对开发客观的IQA方法越来越感兴趣,这种方法能够以符合人类主观感知的方式自动预测图像质量。

早期的无参考IQA (NR-IQA)模型通常是在假定图像质量受到一种或几种特定类型的失真:如屏蔽[1], [2]、振铃[3]、模糊[4],[5]或压缩[6]-[9]的影响下运行。因此,这种早期的NR-IQA方法基于假定的畸变类型的模型,为质量预测提取特定于失真的特征。因此,这些方法的应用范围相当有限。

最近对NR-IQA的研究集中在所谓的“盲图像质量评估”(BIQA)问题上,在这种情况下,对失真类型以往的认知是不可用的。大多数现有的BIQA方法都是“意见感知”,这意味着他们在一个由失真图像和相关主观评分[10]组成的数据集上进行训练。属于这类别的代表方法包括[11]-[18],并且它们共享一个类似的体系结构。在训练阶段,从失真图像中提取特征向量,然后回归模型习得如何将特征向量映射到相关的人类主观分数中去。在测试阶段,将一个特征向量从测试图像中提取出来,然后输入习得的回归模型中来预测其质量分数。在[11],Moorthy和Bovik提出了BIQA的两步框架,叫做BIQI。在BIQI中,给定一个失真图像后,首先提取场景统计数据,并用于将失真的图像明确地归类为n个失真方式中的一种;然后,使用同一组统计数据来评估特定失真类型的图像质量。遵循同样的模式,Moorthy和Bovik后来使用更丰富的自然场景特征,将BIQI延伸到了DIIVINE。BIQI和DIIVINE都假定测试图像中的失真类型已在训练数据库中出现过,但在许多实际应用中却不是这样。通过假设DCT特征数据会随图像质量变化而以一种可预测的方式变化,通过对DCT域中提取的基于对比度和结构特征的概率模型进行训练,Saad 等人[13]提出了一种称为BLIINDS的BIQA模型。Saad等后来将BLIINDS扩展到BLIINDS-II [14],使用更复杂的基于NSS的DCT特性。在[15]中,Mittal等人使用局部归一化亮度系数的场景统计量来量化由于存在失真而导致图像中可能的自然性损失,并将由此产生的BIQA模型称为BRISQUE。[16]中提出的模型提取了三组特征:基于自然图像、失真纹理和模糊/噪声的统计特征;对每个特征集进行了三种回归模型的训练,最后用加权组合来估计图像质量。

在[17]中,Ye等人提出了一个名为CORNIA的BIQA的无监督特性学习框架,该框架由以下主要步骤组成: 局部特征提取、码本构造、软分配编码、最大池化和线性回归。在[18]中,Li等人从质量测试图像中提取了四种特征:图像上计算的相位一致性的平均值[19],相位一致性映射的熵,图像的熵,图像的梯度。广义回归神经网络(GRNN)[20]用于训练该模型。在[21]中,Zhang和Chandler在空域和频域提取了图像质量相关的统计特征。在空间域中,利用对数导数统计方法对局部归一化像素和相邻像素对进行统计建模;在频域中,使用log-gabor滤波器[22]来提取图像的精细尺度。基于对涵盖了图像感知质量相关的重要结构信息的图像局部对比信息观察,在[23]中,Xue等人提出了利用局部图像梯度大小和高斯图像响应的拉普拉斯算子联合统计的BIQA模型。

以上讨论的观点感知的BIQA方法需要大量的带有人类主观分数的失真图像来学习回归模型,这导致它们具有较弱的普适性。在实践中,图像失真类型众多,图像可能包含多个相互作用的失真。收集足够的训练样本用于各种失真类型以及失真组合是相当困难的。如果在一组失真类型上训练的BIQA模型适用于包含不同失真类型的测试图像,预测的质量分数将是不可预测的,而且可能是不准确的。其次,现有的训练过的BIQA模型已经接受过训练,因此在某种程度上依赖于一个可用的公共数据库。当将一个模型应用到另一个数据库或真实的失真图像上时,图像质量预测的性能可能会较差(详见第六章-D)。

考虑到基于观点感知的BIQA方法的缺点,开发“观点未知”的IQA模型极具前景,因为它不需要训练失真图像和人主观评分的样本[10]。然而,虽然实现“观点未知”的BIQA目的很有吸引力,但是由于有限的可用信息,设计方法更具有挑战性。在这个方向上有一些突出的工作报告。在[24]中,Mittal等人提出了一种算法,该算法对大量原始图像块和失真图像块的统计特征进行了概率性语义分析。然后将发现的潜在质量因子应用到测试图像的图像块中,从而推断出质量分数。Mittal等[10]提出的自然图像质量评价模型(NIQE)模型从图像中提取一组局部特征,然后将特征向量与多变量高斯(MVG)模型相匹配。然后,通过MVG模型和从原始自然图像中学习的MVG模型的距离来预测测试图像的质量。然而,由于NIQE使用一个单一的全局MVG模型来描述一个图像,可用来更好地预测图像质量的有用的局部图像信息丢失了。在[25]中,Xue等人模拟了一个虚拟数据集,其中首先使用全引用IQA算法FSIM[26]来估计失真图像的质量分数。然后,BIQA模型将从由块聚合过程产生的数据集中习得。然而,这种“质量感知集群”(QAC)方法只能处理四种常见的失真类型;因此,与NIQE不同的是,QAC并不是一个“完全盲目”的BIQA法。

观点未知BIQA法有一个明显的特性,那就是它们有可能比它们的观点感知者更有可能具有更好的普适性,因为他们不依赖于那些失真图像训练样本和相关的主观图像质量评分。然而,到目前为止,没有任何一种观点未知法比现有的观点感知方法更能表现出出更好的图像质量预测能力。因此,调查是否有可能开发出一种比最先进的观点感知BIQA模型性能更佳的观点未知模型是非常有趣和重要的。

我们试图在本文中实现上述目标。人们普遍认为,失真图像的统计数据与原始图像的统计数据有很大的不同。我们使用不同种类的现存的和新的自然场景统计(NSS)特性,从原始的自然图像集中计算出这些特性,像NIQE一样,将提取的NSS特性与MVG模型相匹配。因此,这个MVG模型被设置为一个原始的参考模型,用来度量给定的测试图像质量。在测试图像的每个图像块上,最佳匹配的MVG模型会通过在线计算得出,然后与习得的原始MVG模型进行比较。通过取池化图像块得分的平均数后,可得出测试图像的整体质量分数。我们在大规模的公共基准数据库上进行了大量的实验,发现与最先进的基于观点感知的NR IQA模型相比,所提出的观点未知的方法具有更好的图像质量预测性能,尤其是在建立普适性能力基础上,一些重要的跨多个数据库测试中。

NIQE[10]给了我们工作灵感;不过由于一些原因,其性能优于NIQE。首先,在[10]中使用的两种NSS特征类型基础上,我们介绍了另外三种类型的质量感知特性。其次,我们并未选择使用单个的全局MVG模型来描述测试图像,而是将测试图像每个图像块的特征向量匹配到了相应的MVG模型,并以此计算了相应的局部质量分数。我们认为,在局部MVG模型中局部体现的多个仔细挑选的质量感知特性,会产生一个更全面地捕获局部失真工件的BIQA模型。我们指的是由俗称集成局部NIQE或IL-NIQE显著改进的“全盲”图像质量评估器。

在本文中最重要的部分是:我们证明了“全盲”的想法——未知IQA模型能够比基于感知的模型获得更可靠的图像质量预测性能。这样的模型和算法可以应用于大量的实际应用中。我们希望这些结果将激励IQA研究人员和图像训练工作者更深入地考虑到观点未知“完全盲目”的BIQA模型的潜力。为了可以使我们的结果具有可重复性,我们在网站上公开了关于IL-NIQE的Matlab源代码和相关的评价结果:www.comp.polyu.edu.hk/sim;cslzhang/IQA ILNIQE/ ILNIQE.htm。

本文的其余部分结构如下:第二章介绍了在IL-NIQE中使用的质量感知特性;第三章详细设计了新的BIQA指标IL-NIQE;第四章中展示了实验结果;第五章对全文进行了总结。

2.质量感知自然场景数据统计特征

研究结果表明,自然场景数据统计(NSS)是衡量失真图像质量退化程度的优秀指标[10]-[16]。因此,NSS模型在BIQA算法的设计过程中得到了广泛的应用。例如,广义高斯分布(GGD)的参数,有效地将自然图像小波系数和DCT系数作为特征进行质量预测[11]-[14]。在[16]中,采用复杂的锥形小波变换提取相似的NSS特征。所有这些基于BIQA方法的NSS模型都是采用观点感知法,并均通过学习回归模型以将提取的NSS特征向量映射到主观质量分数中去。

已有研究结果表明,图像质量失真被局部结构特征[27]定义为以下几类:对比[23], [26], [27],多尺度和多方向分解[21], [28],颜色[26]。考虑到这些因素,我们设计了一套合适且高效的NSS特性,以实现观点未知BIQA。为了描述结构失真,我们采用了两种不同类型的NSS特征(最初是在[10]中提出),分别由局部均值差和对比归一化(MSCN)系数的分布,以及相邻MSCN系数对乘积的分布中得来。为了更有效地定义结构失真以及捕获对比度失真,我们设置了质量感知梯度特性(参见第II章-C)。为了提取质量相关的多尺度和多方向图像属性,我们使用了log-Gabor滤波器,并从滤波器的响应中提取了统计特征(见第II章-D)。在计算尺中相对的颜色域中(见第II章- E),从图像强度分布中得到的统计特征将用于来描述颜色失真。总的来说,使用了五种不同类型特征。尽管所有特性在NSS文献中都有提及,已众所周知,但我们还是第一次将其用于全盲BIQA中。实验表明,新特性可以显著提高图像质量预测性能(详见第IV章 - E)。

A.归一化亮度数据

Ruderman[29]指出,自然灰度图像的局部归一化亮度符合高斯分布。这种归一化过程可以描述为:

i和j均为空间向量,且:

为局部图像均值和对比度,omega;= {omega;k l | k =minus;k,hellip;,K,l =minus;l,hellip;,L}定义了一个单元格高斯窗口。MSCN系数I(I, j)在没有明显质量失真的自然图像上被观测到跟随一个单位正态分布[29]。然而,当图像受到由常见失真引起的质量下降时,这种高斯模型就被破坏了。高斯模型中,{I(I, j)}的测量偏差表明了失真程度。如[10]和[15]中所示,我们使用均值为零的广义高斯分布(GGD)来对失真中的I(I, j)分布进行普适性更强的建模。与GGD相关的密度函数为:

其中的Gamma函数为:

参数alpha;和beta;都是在使用及时匹配基本方法后能可靠评估的高效的观点感知特征,该方法在[30]中被提及。

B.MSCN结果数据

如[10]和[15]中指出的,图像质量信息也与邻近的MSCN系数分配相关,尤其是I(i, j)I(i, j 1), I(i, j)I(i 1, j), I(i, j)I(i 1, j 1), 和I(i, j) I(i 1, j minus; 1)。在原始图像和失真图像中,这些都是遵循零模非对称GGD(AGGD)[31]后建模的结果

AGGD均值为:

参数(gamma;,beta;l,beta; r,eta;)均为有力的观点感知特征。通过四个方向提取这些特征,可以得到16个额外的新的参数。

图1:(a)参考图像

(a)的失真图像:(b)高斯模糊

(c)高度高斯模糊(d)小JPEG2K压缩

(e)高度JPEG2K压缩

C.梯度数据

图2 (a)由图1所示五幅图像计算的高斯平滑梯度分量的直方图

(b)由图1所示五幅高斯平滑图像计算的梯度大小的直方图

图像梯度是局部图像结构的详细描述以及图像局部质量的重要特征。我们发现,通过对图像引入失真,其梯度分量(偏导数)和梯度大小的分布均发生了变化。举例证明:图1显示了从TID2013数据集选取的5个图像[32]。图1(a)为参考图像,其他四种为四种失真情况:1(b)为高斯模糊,1(c)为严重高斯模糊,1(d)为小JPEG2K压缩,1(e)为严重JPEG2K压缩。在图1(b)、1(c)、1(d)和1(e)的图像中,记录的主观得分(MOS, 0到5)分别为4.6765、2.77

全文共12023字,剩余内容已隐藏,支付完成后下载完整资料


资料编号:[16689],资料为PDF文档或Word文档,PDF文档可免费转换为Word

原文和译文剩余内容已隐藏,您需要先支付 30元 才能查看原文和译文全部内容!立即支付

以上是毕业论文外文翻译,课题毕业论文、任务书、文献综述、开题报告、程序设计、图纸设计等资料可联系客服协助查找。