英语原文共 5 页,剩余内容已隐藏,支付完成后下载完整资料
基于高效视频帧内编码技术的医学图像无损压缩
Victor Sanchez and Joan Bartrina-Rapesta
摘要:近来,HEVC标准的引入为图像存储和传输系统中医学图像压缩技术的改善提供了新的可能。在本文中,我们提出了对于显现解剖结构的灰度图像无损压缩技术的改善方法,这些图像以边缘数量庞大为特征。特别的,我们提出二选一的角度和平面预测模式,该模式基于一种定向性范围扩大的差分脉冲编码调制。我们还提出了一种差分脉冲编码调制解码处理的实现,该处理过程包含了HEVC的按组编码结构。不同医学图像的评估结果显示这种DPCM模式能够高效预测出这些医学图像数量巨大的边缘,成功实现了将图像大小压缩到原图75%的效果。
关键词:HEVC帧内编码, 医学图像, 无损压缩。
1.简介
在保证能够完美重建的前提下,无损压缩一直以来都被医学团队和信息技术团队视为降低图像存储空间和缩短传输时间的有效方法。随着图像存储和传输系统(PACS系统)的广泛应用,应当让任何一种压缩技术符合医学成像和传输(DICOM)标准。鉴于此,基于DICOM标准的许多压缩技术,例如JPEG2000和H.264/AVC,早就已经出现了。例如,第3部分介绍了在远程接入和三维医学图像可视化中JPEG2000和JPIP的运用。第4部分的工作展现了运用感兴趣区域编码技术和JPEG2000的可扩展性对数字钼靶X线图像进行压缩的一种方法。通过观察可以发现三维四维等高维图像的切片可以视为视频序列的帧,基于这种观察,作者在[5-7]中截取了与3D和4D图像压缩有关的H.264/AVC标准。
近来,高效视频编码标准的引入为PACS系统中医学图像压缩的方法改进创造了新的可能。与之前的H.264/AVC比较,高效视频编码技术(HEVC)在视频序列编码效率上已经展现出巨大的改进,在达到相同的视频感知效果的前提下,HEVC可以降低50%的编码比特率。与H.264/AVC类似,HEVC也采用两种编码模式,即帧间和帧内图片编码。在帧间图像编码技术中,不同帧以一个区块一个区块的方式为基础进行编码并通过能完成运动估计和补偿的暂时预测编码技术实现。对于帧内编码,编码在块与块的基础上通过在同一帧内进行空间数据的预测而实现。帧内编码技术不仅适合二维图像数据,而且适合三维图像数据,这便于能够随机访问3D图像的任何一个数据帧而不需要对其他三维数据进行解码,这便使得帧内编码技术非常适合运用于医学图像数据的处理。
在本文中我们重点关注HEVC的帧内编码过程,作为一种图像压缩技术,它具有重大的潜力并很可能在将来被DICOM所采用。我们特别注意显现解剖结构的医学灰度图像的无损压缩,例如磁共振图像,CT图像,X线血管造影图像。这些图像都因具有数量巨大的边缘而引起了人们对于压缩这些图像的兴趣。基于此并通过使用定向性加大的差分脉冲编码调制技术,我们提出了HEVC帧内编码的处理方法,并将此方法用于精确预测图像的边缘信息。为了保持HEVC的按块编码结构,我们还提出了一种能够满足解码端并行计算要求的差分脉冲编码调制帧内编码的技术。对于不同的磁共振图像,CT图像,X线血管造影图像,在与当下的HEVC帧内编码技术比较时,我们提出的方法显著提高了图像的压缩率。在与JPEG-LS和JPEG2000这两种兼容DICOM系统的技术比较时该方法也显现出来巨大的竞争力。
文章后面部分做如下安排。在第2部分,我们简单回顾HEVC帧内编码技术。在第3部分,我们阐述所提出的DPCM帧内编码处理技术并讨论其和先前工作的联系。结果展示在第4部分。第五部分对全文进行总结。
2.高效视频帧内编码(HEVC INTRA CODING)
HEVC编码的主要目的就是通过运用每一帧内仅有的信息,在块与块的基础上来预测其他帧图像,进而减小图像的信息量达到压缩的目的。原始帧数据与预测帧数据的差异定义为误差信号,信息量的减少正是通过对误差信号的处理而实现的。在无损压缩的事例中,任何影响数据帧完美重建的处理都忽略并且将误差信号直接反馈给熵编码器[10]。
HEVC帧内编码技术采用角度预测模式来模拟33种不同的方向图;采用DC和平面预测模式来产生平滑的表面,通过样本数据和块边界的自适应滤波来避免误差信号中伪影的引入[10]。图片1(a)展现了HEVC中关于角度预测模式的预测方向的问题。
图片1.(a)HEVC帧内编码技术。角度模式被分成了两组:竖直的和水平的。(b)为采用精度为1/32个像素的插值方法作为预测原则的例子。iFact是原始采样点Sxy和参考采样点b之间的距离。用于预测的参考采样点为:{R0,1,R0,2,hellip;R0,2N}—位于此表的左边,{R0,0,R1,0,hellip;R2N,0}—位于此表的上方。
对于所有的角度模式,基本的预测原则如图1(b)中所示。每个预测出来的采样点Px,y都是通过把其坐标(x,y)投射到参考横轴和纵轴上,参考横轴与纵轴运用选择好的预测方向,并且为采样点以1/32像素的精度插入一个数值。所以Px,y=[(32-iFact)*a iFact*b 16]gt;gt;5,当a和b是参考采样点时,表示一次向右的位移位操作,iFact是原始采样点Sxy和b点这间的距离。HEVC中所有的预测模式都用如图1(b)中所示的上和左的参考采样点设置方法。
据观察发现,在大多数自然意象的图片中,水平和竖直模式比其他方向的模式出现的更为频繁,HEVC帧内编码的各种角度模式就是基于此观察而设计的[10]。因此,接近水平或者竖直方向的模式数量比其他倾斜方向的模式要高。至于显现解剖结构的医学图像,由于图像中大量的边缘存在,其他的方向模式也频繁的出现。这将使得在这些图像中平滑的区域变得很少,因此,通过有限数量的参考采样点获得的预测值来进行估值将会使效率变低。基于以上结论,我们提出了一种定向性范围加大的DPCM预测模式。目标是通过在一个像素精度的水平上对相关数据进行插值进而改善图像边缘信息预测的质量。
3.文中提出的DPCM帧内编码
基于DPCM的帧内编码技术首次因采用单个采样点作为预测器的H.264/AVC的所有帧内预测模式在[12]中被提出来。后来[13]中的工作提出了将DPCM编码用于HEVC的角度模式,这不仅保持了同样的方向性范围并且改变了块编码结构的标准。在[14]中基于图像低复杂度无损压缩算法的预测方法被作为对误差信号的预处理方法而提出,并且此误差信号已经原始HEVC帧内编码技术处理。然而,这一步预处理过程在原处理基础上增加了一个额外的编码过程并且改变了HEVC的块编码结构。在这里的工作中,我们把DPCM技术运用于HEVC帧内编码的所有模式并且保持其块编码结构不变。特别地,我们还通过对角度预测增加可实现的方向性范围和采用单一模式来替代现有的平面预测模式使预测模式适合显示解剖结构的医学灰度图像。
图2的(a)—(b)描述了与所提出的DPCM角度模式有关的预测方向,图2(c)则体现了预测的原理。表1总结了响应的预测处理方法,需指出,文章中所提出的方法拥有1/4像素点的精确度而且涵盖更大范围的方向性,包括不大于/4弧度的角。对于每一个采样点Sxy对应的预测点Pxy,都会根据所用的预测模式并运用其周围的采样点来处理此预测点,这些临近的点位于{a,b,c,d,e,f,g,h,i}处。例如,对于模式23来说【见表1和图2(c)】,预测得到的采样点Pxy是根据位于其临近位置{e,f}l两个采样点计算出来的,如:P2.2=(e 3f)gt;gt;2,e=s1.1,f=s2.1。需指出,由于文章中所用方法不同于当前的HEVC帧内编码,所用模式产生的结果在所有方向中接近一个常数,这使我们能够在所有不同方向性下同等利用相邻像素之间的相关性来解决问题,并且对解释显现解剖结构的医学灰度图像通常具有不同的方向性而不仅仅是水平和竖直这一观察。
对于DC和平面模式,我们提出单独运用DPCM DC模式来计算位于{c,f}处的临近样点的平均,进而预测出当前采样点Sxy,就如图3中所示那样。这可以视为在采样水平上做角度预测的另一种方法。
3.1 所述模式的并行计算
文中所述的DPCM模式可能会改变HEVC的块编码结构,因为解码端要求样点必须顺序得到解码并且能为后面采样点的预测和重建所使用。为了解决这个问题,我们将解码端的所有模式用空域误差变换来替代,该变换只依赖于来自现有表格上方和下方的误差采样信号和参考采样信号。为了说明这一点让我们以所述的6-10模式来进行预测,此模式仅仅依赖位于{b,c}位置的临近采样点。对于一个44的阵列,采样点S1.1和S2.1在解码端的重建公式可以为:
图2.与所述DPCM角度模式有关的预测方向,(a)为竖直方向,(b)为水平方向,(c)为该角度模式的预测原理。无法用于预测的临近采样点用现有表格中的边缘采样点进行填充。位于临近表格中的e,g采样点等待被编码。
表1
表3:所述DPCM 的DC模式和对应的预测处理。
在44的阵列中,第一行的四个采样点可以运用如下的矩阵运算而得到:
(5)中的矩阵运算为所有依赖处于b或者c或者二者兼有的临近采样点进行的44阵列中第一行的样点重建建立了一个通用的表达式。例如如果我们使
Wb = 0 , Wc = 1, (5)就建立了对于模式10(完全水平)的表达式。对于44中余下行的重建也可以获得类似的表达,进而对于的阵列也同样如此。
虽然采用所述的DPCM模式需要对原始解码端进行变动,但是解码端能够采用像(5)中一样的矩阵运算实现并行运算。再者,这种矩阵表示法能够保持HEVC的块编码结构。值得注意的是与矩阵表示相关的各种处理过程可以通过字节的移位进而简化成加法和乘法运算,这将能大大降低算法复杂度。例如,在所述的模式8中,(5)中的采样点S2,1计算式如下。S2,1 = r2,1 wbr1,2 wcr1,1 (wbwb)R0,3 (2wbwc)R0,2 (wcwc)R0,1,式中wb = frac12;,Wc=1/2,S2.1可以表示为S2,1 = r2,1 r1,2gt;gt;1 r1,1gt;gt;1 R0,3gt;gt;2 R0,2gt;gt;1 R0,1gt;gt;2。
图4
4.实验结果
所述DPCM模式的编码效率在一些磁共振图像,CT图像和X线血管造影图像中得到检验,这些图像的特点总结于表2的第一列中。表中1和2包括了人类脊髓和膝盖的MRI矢状面序列,3中则列出了人类大脑的轴向序列。4-6包含了人类胸部的CT轴向序列,而7—9中则包含了关于人类心脏血管研究的X线序列。所述的所有的模式在不同大小的块大小下实现,其中最大的为3232。实验使用软件HM11.0和无损模式的Main-Still-Picture文件来实现。仅有帧内编码技术得到采用而变换和计算处理则被忽略。为了与上述文件相兼容,所有数据帧都通过加入零值子采样色度分量被编码为YUV4:2:0格式。这些色度分量不包括在最终比特率的计算中。我们将所提出的DPCM模式与HEVC帧内编码、【13】中所提及的方法和JPEG2000(J2K)和JPEG-LS两种与DICOM系统兼容的方法进行比较。对于JPEG2000,我们采用BOI【16】来实现,过程包括5水平的提升可逆小波变换空间和大小64times;64的代码块。对于JPEG-LS,我们采用重置时间间隔为64的HP实现方式【17】。
表2中所列的无损压缩率表现出文章中所述的DPCM模式在在与当前的HEVC帧内编码中,对于核磁共振图像来说节约的存储空间降低了15.4%,对于CT图像来说降低了8.96%。和【13】中所提及的同样基于DPCM技术的模式相比,我们的模式更进一步降低了比特率达4.5%,证实了运用在所有方向中模式为常数的范围增加的多方向的优点。所提出的模式与J2K和JPEG—LS相比,实验的结果与很具竞争力。
对于X线血管造影序列,由文章所述方法和【13】中的方法实现的编码效率仅降低了3.00%和1.64%。这些特殊的造影图像含有大量的噪声而且相邻像素之间经常有很大变化,这使得这些图像很难被很好的压缩【18】。总的说来,对于是12bpp数据的CT图像来说,所提出的模式能最好的降低其编码比特率
全文共8977字,剩余内容已隐藏,支付完成后下载完整资料
资料编号:[16311],资料为PDF文档或Word文档,PDF文档可免费转换为Word
以上是毕业论文外文翻译,课题毕业论文、任务书、文献综述、开题报告、程序设计、图纸设计等资料可联系客服协助查找。