图像压缩技术:无损和有损算法综述。外文翻译资料

 2023-03-15 11:30:48

译文标题

关键词:图像压缩,JPEG2000,无损压缩,有损压缩

虽然网络带宽随着科技进步不断增大,但是新业务引入和现有业务扩大导致了更高的带宽需求,使数据压缩领域不断开展研究。研究的主要目标是在不大幅降低源的质量的前提下发展编码信息源(如语音、图像和视频)的技术,以减少表示一个源所需的比特数。

随着图像数据生成量的增多,图像压缩领域开展了大量研究。研究致力于使用最少的比特数表示图像,而不丢失其中的基本信息。图像主要包含三种类型的信息:冗余信息、不相关信息和有用信息。冗余信息是信息的确定性部分,图像的其他信息中可以不丢失地复制该信息。不相关信息是信息中除了感知意义的限制(即心理视觉冗余)外,包含诸多细节的部分。有用信息是信息中既不属于多余信息,又不属于不相关信息的部分。人们通常观察解压后的图像,因此,图像的保真度受人类视觉系统的能力和局限性的制约。

本文综述了各种图像压缩技术及其局限性、压缩率,并重点介绍了医学图像压缩的研究现状。

  1. 介绍

图像是重要代表。它们可以代表传输的电视-卫星画面的传输,医学影像或计算机画面的存储等等[190]。当对二维光强信号进行采样和量化以生成数字图像时,会产生大量的数据,这使可能数字化图像的尺寸过大,导致不切实际的存储或传输要求。图像压缩通过减少图像中的信息处理这个问题,从而使图像的传输或存储要求更符合实际。

由于算法不是实时执行的,图像压缩在传输中的应用受到实时性的限制,在存储中的应用较不严格。正因如此,不需要使用缓冲器匹配编码器的输出速率和通信信道的传输速率[1]

图像压缩方法有两种,无损和有损压缩。无损压缩中,压缩图像精准复制了原始图像。无损图像压缩具有广泛的应用,诸如在医疗[192-194]、商业文件的归档和放射线拍照这种丢失图像中任意信息就可能导致诊断错误的地方[2]。该方法在其他方面的应用有摄像系统图像的压缩[191]、纳米卫星热成像的存储和传输以及遥感应用[195],如森林火灾监测系统和土壤湿度测量系统[196]。有损压缩是图像压缩中最常见的方法,它在牺牲重构图像精确度的基础上增加压缩率,造成图像的部分信息丢失,压缩后的图像失真。压缩图像会产生失真,并且压缩算法效率的测量需要考虑失真、数据压缩能力和算法的实现复杂度[3,120,85]。有损图像压缩应用在图像的网络传输[197]和图像植被构建领域[198]。Kozhemiakin等人表明[199],无损压缩在广泛用来压缩遥感图像的同时实现了小压缩比,并提出了基于离散余弦变换的有损图像压缩技术。

1.1图像的数字表示

图像可以定义成一个二维(2D)函数,其中x和y是空间(或平面)坐标,在任意一对坐标上的振幅称为亮度、强度或灰度[4]。图像处理前,需要将它数字化。在数字图像中,i和j为整数值,如图1所示。

图1.图像数字化 (a)-连续 (b)-离散

要将连续调图像转换为数字格式,需要一个数字转换器。最常用的数字转换器是扫描仪和数码相机。数字转换器的两个功能是采样和量化。图2显示了转换步骤。

图2.连续调图像到数字图像的转换步骤 (a)扫描 (b)取样 (c)量化

灰度图像只测量光强,每个像素都是与亮度成比例的标量,它由Mtimes;N像素的矩阵表示。像素通常是8位无符号整数值,范围从0到255,可容纳256个灰度。图3给出了一个典型的例子。

图3.分辨率512times;512的典型灰度图像

根据三原色理论,可以用红、绿、蓝三原色的线性组合来模拟彩色图像,生成所谓的颜色模型。彩色图像测量光的强度和色度,每个颜色像素都是由颜色分量的矢量。常用的颜色模型有RGB(红、绿、蓝)、HSV(色调、饱和度、明度)、CMYK(青色、品红、黄、黑)等,用于印刷行业[5]。彩色图像由三个矩阵组成,代表每个像素在某个颜色空间中的坐标。由于每个矩阵由8位值组成,所以每个像素具有24位精度。这就是所谓的24位色。

出于存储目的,需要量化像素值。灰度图像的亮度通常量化为Z级,因此isin;{0,1,hellip;,Z-1}。如果Z的形式为2L,就表示图像每像素有L位。许多普通灰度图像是每像素8位,有256个不同的灰度等级。这是人类视觉系统能够识别的不同强度的大致界限[6]

彩色信号的编码在原则上与亮度信号的编码相同,研究人员已经做到了用微小变化(比特率增加了约10%)体现彩色图像与单色图像相比的视觉“增益”[7]

1.2数字图像压缩

数字图像压缩是多媒体处理领域的一个非常热门的研究课题。

一幅图像可以被压缩的原因如下:在一幅图像中,取自图像的相邻像素之间存在显著相关或冗余。这种相互关系被称为空间相关或冗余。对于从多个传感器获取的数据(如卫星图像),传感器图像之间存在较强的相关性或冗余度,它们称为或光谱冗余。因此,可以利用冗余信息完成图像压缩。如果在压缩之前删除冗余信息,就可以实现更有效的压缩。

图像压缩系统由压缩器和解压器两部分组成。压缩器由预处理阶段和编码阶段组成,而解压器由解码阶段和后处理阶段组成。压缩过程的系统视图如图4所示。编码之前,要执行预处理,为编码过程处理图像。预处理由随机数量的专用操作组成。在压缩文件被解码后,可以执行后处理,以消除压缩过程中产生的冗余部分。

图4.压缩系统模型 (a)压缩 (b)减压

如图5所示,压缩器部分可以进一步分解为几个阶段。预处理的第一阶段是数据简化。图像数据可以通过灰度和/或空间量化来减少或进行任意图像改进(例如,噪声去除)。预处理的第二阶段是映射,将原始图像数据映射到另一个更容易压缩数据的数学空间。下一个阶段是量化,它是编码过程的一部分,从映射阶段获取可能连续的数据,并将其转换为离散形式。

图5.压缩器[8]

编码的最后一个阶段是编码最终数据。压缩算法可能包含所有的阶段,也可能只包含其中的一个或两个阶段。

解压器可以进一步分解成如图6所示的阶段。解码过程分为两个阶段。第一阶段,解码器获取压缩文件,并通过将编码映射到原始量化值来反求原始编码。接下来,这些值将由一个阶段进行处理,该阶段执行逆映射以反转原始映射过程。最后,可以对图像进行后处理以增强最终图像的外观。

图6.解压器[8]

压缩算法的发展具有很强的专用性。在压缩的预处理阶段,要进行增强、去噪或量化等处理。预处理阶段通过消除应用程序产生的任何不相关信息,为编码过程准备图像。

映射过程很重要,因为图像数据往往高度相关。如果一个像素的值是已知的,那么相邻的像素值可能是相似的。通过找到给数据去关联的映射方程,可以消除这种类型的数据冗余。值得注意的是,量化过程是不可逆的,因此量化过程中可能会丢失一些信息。另外,由于不可逆,量化过程不存在逆过程,所以它没有出现在减压模型中。

任何图像压缩算法的编码阶段都很重要。编码器提供一对一映射;编码器将每个输入映射到唯一的输出,因此这是一个可逆过程。代码可以是等长代码(其中所有码字大小相同),也可以是具有可变长度码字的不等长代码。大多数情况下,不等长代码对数据压缩是最有效的,但在编码和解码阶段需要更多开销[8]

执行压缩过程后生成的简化文件称为压缩文件,用于重建图像,生成解压后的图像。原始文件(未压缩文件)和压缩文件的比值称为压缩比。压缩比由下式确定:

(1)

图像压缩的另一个术语是每像素比特。对于大小为Ntimes;N的图像,它的确定方式如下:

(2)

1.3.图像编码中的质量度量

有损压缩的主要问题之一是对压缩图像质量的评估[109,110]。因此,为了确定压缩算法的效率,我们需要量化差异。原始图像和重建图像之间的差异称为失真[9]。为了准确地确定哪些信息是重要的,且能评估图像质量,我们需要定义图像保真度准则。在失真较小的情况下,压缩算法的效率较高[9]。这意味着当原始图像和重建图像之间的差异很小时,重建图像的保真度或质量较高。

保真度准则可分为两类;客观保真度准则和主观保真度准则。客观保真度准则为我们提供了公式,用来衡量重建图像和原始图像的误差值[8]。客观保真度准则广泛使用,但运算结果不一定与人类感知相关。例如,由客观测量确定的低误差图像实际上可能看起来比高误差图像更糟糕。

退化的类型和程度取决于使用图像的情况。因为人类反应很难用数学方法建模,而且由于感知结果依赖主观判断,很难具有客观性;实验中,通过估算失真来确定重建图像和原始图像的质量差异。最简单和最常用的方法之一是使用f和g的差值。其最基本的形式是均方误差(MSE),通常用符号表示,是根据下列公式确定的[9,10]:

(3)

其中f和g为Mtimes;N大小的图像。MSE通常被称为量化误差方差。该测量值很实用,因为它算出了原始图像f在有损压缩过程中能量损失的平均值。

一个人在观察两幅受同类型退化影响的图像时,通常会认为MSE较小的图像更接近原始图像。MSE越小,图像越接近原始图像[102,60,128]。然而,在比较不同退化类型的图像时,MSE就会产生问题,MSE最小的图像似乎不一定最接近原始图像。在许多应用中,信噪比(SNR)用MSE表达,并且定义为:

(4)

其中,为原始图像的方差,为均方误差。信噪比用分贝(dB)来测量,它能很好地再现信号与噪声之比。

对质量更主观的定性测量是峰值信噪比(PSNR)。相比于图像均方值的误差,当人们对图像的峰值误差更感兴趣时,使用这种衡量方法。两幅像素为8位的图像间的PSNR确定如下:

(5)

一般情况下,如果b为每像素的比特数,则PSNR为:

(6)

从(5)和(6)中我们可以推断出,PSNR测量信号的强度与压缩产生误差的大小正相关。因此,PSNR越高,图像质量越好。

我们经常使用这些客观的衡量标准,因为他们很容易计算,且没有使用限制,但这些标准不一定与我们对图像的感知相关。如果我们的目标是获得视

剩余内容已隐藏,支付完成后下载完整资料


英语原文共 26 页,剩余内容已隐藏,支付完成后下载完整资料


资料编号:[596084],资料为PDF文档或Word文档,PDF文档可免费转换为Word

原文和译文剩余内容已隐藏,您需要先支付 30元 才能查看原文和译文全部内容!立即支付

以上是毕业论文外文翻译,课题毕业论文、任务书、文献综述、开题报告、程序设计、图纸设计等资料可联系客服协助查找。