图像压缩编码技术研究.doc

资源描述

图像压缩编码技术研究.doc

《图像压缩编码技术研究.doc》由会员分享，可在线阅读，更多相关《图像压缩编码技术研究.doc（65页珍藏版）》请在冰点文库上搜索。

图像压缩编码技术研究.doc

毕业论文（设计）

题目图像压缩编码技术的应用研究

学生姓名方超

学号20061341002

院系信息与控制学院

专业测控技术与仪器

指导教师陈海秀

二Ｏ一Ｏ年五月二十八日

摘要 1

一、绪论 1

1.1图像压缩编码的研究意义 1

1.2图像压缩编码的研究现状和发展 1

1.3本课题的主要工作 2

二、图像压缩编码概述 3

2.1图像压缩编码的必要性和可能性 3

2.2图像编码压缩方法分类 4

2.3图像编码质量的评价 5

2.3.1图像质量评价的客观准则 5

2.3.2图像质量评价的主观准则 6

三、无损压缩编码原理与实现及其性能对比 7

3.1霍夫曼编码 7

3.1.1霍夫曼编码的基本原理 7

3.1.2MATLAB实现霍夫曼编码 9

3.1.3霍夫曼编码压缩前后图像质量对比 10

四、有损压缩编码原理与实现及其性能对比 12

4.1预测编码 12

4.1.1DPCM编码的基本原理 12

4.1.2MATLAB实现DPCM编码 14

4.1.3DPCM编码压缩前后图像质量对比 18

4.2变换编码DCT 20

4.2.1离散余弦变换（DCT）基本原理 20

4.2.2MATLAB实现DCT编码 22

4.2.3变换编码DCT压缩前后图像质量对比 26

4.3小结 27

五、混合压缩编码原理与实现及其性能对比 27

5.1JPEG压缩编码标准 27

5.1.2MATLAB实现JPEG编码 28

5.1.3JPEG编码压缩前后图像质量对比 31

5.2小波变换压缩编码 32

5.2.1小波变化的基本原理 33

5.2.2MATLAB实现小波变换 34

5.2.3小波变换压缩前后图像质量对比 37

5.3小结 38

六、结论 39

参考文献 40

致谢 42

Abstract............................................................43

附录 44

图像压缩编码技术的应用研究

方超

南京信息工程大学信息与控制学院仪器科学与技术系，南京210044

摘要：

在满足一定图像质量的条件下，我们可以对图像的数据进行变换、编码和压缩,去除冗余数据来减少表示数字图像时所需要的数据量，以方便图像的存储和传输。

研究最佳的编码压缩的数学模型和方法，是人们不断追求的目标。

本文介绍了数字图像压缩技术的分类和基本原理，给出了霍夫曼编码、DPCM编码、DCT编码、JPEG编码和小波编码等几种方法对静止图像压缩的具体实现，并总结了各种方法的优劣和今后的发展趋势。

关键词：

静止图像；图像编码；图像压缩

一、绪论

1.1图像压缩编码的研究意义

以通信技术和计算机为主的信息技术高速发展，信息技术的广泛使用正在悄悄改变着人们的生活和生产方式。

在未来的信息世界中，大部分的信息是以数字化的方式来表示、存储和传输的，而在这些数字化信息中绝大部分是图像信息。

数字化的图像占的空间是非常大的，例如，一幅普通的未经压缩的图片大概要占到几兆的存储空间，仅仅1秒钟没有压缩的数字视频图像所占的存储空间将达到上百兆的字节，这对于目前存储空间和传输宽带来说是难以承受的。

为了能对图像信息进行有效的处理，对数字图像信息进行压缩是大势所趋。

数字图像压缩技术被广泛应用到多媒体、通讯、医学等各个领域，在未来的科技领域，它必然具有强大的生命力和无限的发展空间。

静止图像压缩不仅是各种媒体压缩和传输的基础，也是影响媒体压缩效果好坏的关键因素。

基于这种考虑，本文主要研究静止图像的压缩技术。

1.2图像压缩编码的研究现状和发展

图像数据是众多数据类型中的一种，也是数据压缩的一个关键部分，因为图像具有与文字、语音等其他数据不同的特点，所以需要特别加以研究。

图像压缩编码的目的是为了减少原始数据的数据量，即以最少的比特数来表示原来的图像，同时又要能保持原图像的质量，满足设定的要求。

压缩编码减少了数据的存储空间，这样无论是在数据传输还是在数据处理的时候都会给我们带来非常大的便利。

我们从信息源得到的数据是含有冗余数据的，如果去掉这些冗余数据，就可以使得数据量减少，而且数据之间也具有一定的相关性，如果去掉这些相关性，然后对数据进行恰当的编码，那么，也可以减少原始数据的数据量；如果再在一定的程度上损失一些关系并不是很大的数据，同样也能使原始数据的数据量减少。

信息论为数据的压缩提供了理论基础，信息论认为每个信源中都或多或少的含有自然冗余度，这些冗余度有的来自于信源本身的相关性，又有的来自于信源概率分布的不均匀性中。

只要能够找到改变概率分布不均匀性和去除相关性的相关方法和手段，就可以有效的实现数据的压缩。

图像压缩指的就是图像压缩编码，或者简称图像编码，在本论文的后面部分中，就不再区分几个概念，它们的含义都是相同的。

图像编码属于信源编码的范畴，真正从科学的角度上对图像编码进行研究的历史相对来说并不长，只有差不多六十年的时间。

对它的分类根据研究问题的出发点不同，可以有不同的分类方法。

从压缩的角度分类，可以分为无损压缩编码和有损压缩编码，有损压缩也可以称为统计压缩；从现有的具有实用性的编码方法来看，可以划分为三大类编码方法：

统计编码、预测编码和变换编码。

从技术发展的角度，Kunt提出过第一代、第二代图像编码的概念，他把1948年－1988年40年中研究的基于去除冗余度的编码方法称为第一代编码，如PCM、DPCM、DM、亚取样编码法等，变换领域的DFT、DCT、沃尔什－哈达玛（DWHT）变换编码等，以及以此为基础的混合编码法均属于经典的第一代编码法。

第二代编码方法多是80年代以后提出的新的编码方法，如金字塔编码、分形编码、基于神经网络的编码、小波变换编码、模型基编码、分形压缩等。

1991年，国际电报咨询委员会（CCITT）和国际标准化组织（ISO）联合组成的专家组，共同制定了静止图像的数码率压缩标准（1994年正式通过），即JPEG（TheJointPhotographicExpertGroup），它采用了DCT变换，而最近才提出的新的国际标准JPEG2000则已经采用了小波变换。

1.3本课题的主要工作

本课题为“图像压缩编码技术的应用研究”，首先对目前流行的多种图像压缩编码算法进行详细的分析，并给出多种编码算法对图像进行压缩的具体实现程序，为以后研究各种编码算法的优劣打下基础。

工作的重点是研究各种编码算法具体实现图像压缩是的优劣，具体从图像压缩前后的质量对比以及实现压缩所需要的时间两个方面进行比较。

为了实现以上目标，本文主要做了以下的工作：

（1）编译合适的程序，对于每种编码算法都编译对应的压缩程序，以期达到良好的压缩效果，为以后评比个压缩编码算法的优劣做准备。

（2）编译出用于图像压缩前后质量客观评定的程序，即求出压缩前后图片的PSNR（峰值信噪比），均方根误差（mse）,程序运行时间，图像压缩比。

（3）搜集图像压缩前后质量主观评定的数据，即把压缩前后的图片让观察者打分，根据图像压缩质量主观评定准则打分，然后根据公式给出每种编码的具体得分。

（4）从客观和主管两个方面来评定上述几种编码压缩方式的优劣。

二、图像压缩编码概述

20世纪30～40年代开始形成图像压缩编码的理论，1948年香农提出能使信源与信道匹配的香农编码，1949年香农在《有噪声时的通信》一文中提出了信道容量的概念和信道编码定理，为信道编码奠定了理论基础。

香农的编码定理告诉我们只要信息传输速率小于信道容量，就存在一类编码，使信息传输的错误概率可以任意小，即在不产生任何失真的前提下，通过合理的编码，对每一个信源符号分配不等长的码字，平均码长可以无限接近信源的熵。

在这个理论框架下出现了几种不同的无失真信源编码方法，如霍夫曼编码，算术编码，字典编码等，这些方法应用于一幅数字图像，压缩率一般不超过2。

随着科学技术的发展，人们对压缩率的要求越来越高，现在出现了更多的编码方法，主要有KTL编码，分形编码，模型编码，子带编码，基于小波的编码等。

2.1图像压缩编码的必要性和可能性

一方面，近年来计算机技术、微电子技术和和网络技术的迅猛发展为多媒体的发展创造了优越的条件，多媒体已经被人们广泛的应用于生活的各个领域。

多媒体是指文字、声音、图形和图像等各种媒体，它能比单纯文字传输更多、更生动的信息，与此同时他的数据量也比文字要大得多，例如一幅分辨率为1024×768、颜色24位的图像将占到2.3MB的存储空间，1秒钟没有任何压缩的数字视频图像需要上百兆字节的存储空间，这是目前的存储空间和传输宽带不能承受的。

采用数据压缩技术去除不必要的冗余数据以减少所需传输的数据量是必然的选择。

另一方面，图像数据中确实存在大量的冗余数据。

一般情况下，图像数据中可能存在着以下几种冗余：

①空间冗余（像素间冗余、几何冗余）：

这是图像数据中所经常存在的一种冗余。

在同一幅图像中，规则物体和规则背景（所谓规则是指表面是有序的而不是完全杂乱无章的排列）的表面物理特性具有相关性，这些相关性的光成像结果在数字化图像中就表现为数据冗余。

②时间冗余：

在序列图像（电视图像、运动图像）中，相邻两帧图像之间有较大的相关性。

③信息熵冗余：

也称为编码冗余，如果图像中平均每个像素使用的比特数大于该图像的信息熵，则图像中存在冗余，称为信息熵冗余。

④结构冗余：

有些图像存在较强的纹理结构，如墙纸、草席等图像，称之存在结构冗余。

⑤知识冗余：

有许多图像的理解与某些基础知识有相当大的相关性，例如人脸的图像有固定的结构，比如说嘴的上方有鼻子，鼻子的上方有眼睛，鼻子位于正脸图像的中线上等等，这类规律性的结构可由先验知识和背景知识得到，称此类冗余为知识冗余。

⑥心理视觉冗余：

人类的视觉系统对于图像场的注意是非均匀和非线性的，特别是视觉系统并不是对于图像场的任何变化都能感知，即眼睛并不是对所有信息都有相同的敏感度，有些信息在通常的视觉感觉过程中与另外一些信息相比来说并不那么重要，这些信息可认为是心理视觉冗余的，去除这些信息并不会明显地降低所感受到的图像的质量。

从信息论的观点上来看，用于描述图像信源的数据是由有效信息和冗余数据两个部分组成的。

去除冗余数据能够节省存储和传输中的数据，同时又不会损坏图像信源的有效信息。

在有些时候，是允许一定限度的失真的，例如人的眼睛对图像灰度分辨的局限性，监视器显示分辨率的限制等，然而这些失真并不妨碍图像的实际应用，利用这些也可以对图像信源作一定程度上的压缩。

数据压缩起源于人们对概率的认识。

当我们对文字信息进行编码时，如果为出现概率较高的字母赋予较短的编码，为出现概率较低的字母赋予较长的编码，总的编码长度就能缩短不少。

图像编码主要就是研究压缩数码率。

早期，对图像压缩的研究还仅局限于静止图像。

进入20世纪80年代以来，数字信号处理、计算机科学、多媒体技术和数字通信飞速发展，对图像编码的研究从静止图像扩展到了运动图像。

有关国际组织相继定义了一些算法和压缩标准，如由国际标准化组织（InternationalStandardOrganization,ISO）和国际电报电话协商委员会（ConsultativeCommitteeforInternationalTelegraphandTelephone,CCITT）组织的联合影像专家小组就提出了面向连续色调静止图像的DCT（DiscreteCosineTransform,离散余弦）编码，进一步推动了图像数据处理和编码压缩工作。

2.2图像编码压缩方法分类

1948年，奥立弗提出了第一个编码理论-脉冲编码调制（PulseCodingModulation,PCM）;

就在同一年，香农在其经典论文《通信的数学原理》中首次提出并建立了信息率失真函数的概念；1959年，香农进一步确立了码率失真理论。

以上工作奠定了信息编码的理论基础。

脉冲编码调制实际上就是连续模拟信号的数字采样。

PCM只是将模拟信号转换为数字信号，没有对信号进行任何压缩。

下文讨论的编码方式都是在多媒体模拟信号经过PCM编码后再进行的。

编码压缩方法有许多种，从不同的角度出发有不同的分类方法。

1.应用在多媒体中的图像压缩编码方法，从压缩编码算法原理上可分为3类：

①无损压缩编码种类。

l哈夫曼编码

l算术编码

l行程编码

lLempelzev编码

②有损压缩编码种类。

l预测编码：

DPCM，运动补偿

l频率域方法：

正交变换编码（如DCT），子带编码

l空间域方法：

统计分块编码，模型基编码

l基于重要性：

滤波，子采样，比特分配，向量量化

③混合编码。

l有JBIG，H261，JPEG，MPEG，小波等技术。

2.按压缩技术所依据和采用的数学理论和计算方法分类，可以分为统计编码、预测编码和变换编码。

①统计编码统计编码是根据消息出现概率的分布特性而进行的压缩编码,它有别于预测编码和变换编码。

这种编码的宗旨在于,在消息和码字之间找到明确的一一对应关系,以便在恢复时能准确无误地再现出来,或者至少是极相似地找到相当的对应关系,并把这种失真或不对应概率限制到可容忍的范围内。

常用的编码有：

霍夫曼编码（Huffman）、行程编码（Shannon－Famo）、算术编码等。

②预测编码它是利用空间中相邻数据的相关性,利用过去和现在出现过的点的数据情况来预测未来点的数据。

通常用的方法是差分脉冲编码调制（DPCM）和自适应差分脉冲编码调制（ADPCM）。

③变换编码该方法将图像光强矩阵（时域信号）变换到频域空间上进行处理。

在时域空间上具有强相关的信号,反映在频域上是某些特定的区域内能量常常被集中在一起,我们只需将主要注意力放在相对小的区域上,从而实现压缩。

一般采用正交变换,如离散余弦变换（DCT）、离散傅立叶变换（DFT）、Walsh-Hadamard变换（WHT）和小波变换（WT）,来实现压缩算法。

2.3图像编码质量的评价

对于编码压缩算法，应该有一个评价标准，能够对压缩后的图像质量给予正确的评价。

常用的评价标准有两种：

一种是客观准则；另一种是主观准则。

2.3.1图像质量评价的客观准则

客观准则是对压缩还原后的图像与原始图像的误差进行定量计算，一般是对整个图像或图像中一个指定区域进行某种平均计算，以得到均方误差。

设一个原始图像为{a（I,j）,0≤i≤M-1,0≤j≤N-1},相应的压缩后的还原图像为{a^（i,j），

0≤i≤M-1,0≤j≤N-1},误差图像为{e（i,j）=a（i,j）-a^（i,j）,0≤i≤M-1,0≤j≤N-1},那么均方误差表示为：

（2-1）

需要注意的是，标准误差不是测量值的实际误差，也不是误差范围，它只是对一组测量数据可靠性的估计。

标准误差小，测量的可靠性大一些，反之，测量就不大可靠。

进一步的分析表明，根据偶然误差的高斯理论，当一组测量值的标准误差为σ时，则其中的任何一个测量值的误差ε有68.3%的可能性是在（－σ，＋σ）区间内。

有时也会用均方根误差，它是（2-2）

更常用的是信噪比表示，它用分贝表示压缩图像的定量性能评价。

基本信噪比定义为：

（2-3）

另一信噪比的定义是首先对原始图像去均值，定义如下：

（2-4）

（2-5）

文献中最常用的是峰值信噪比（PSNR），设a=2-1,K是表示一个像素点用的二进制，那么：

PSNR=10lg（2-6）

在许多采集的视频序列和商用图像的应用中，常用K=8，直接将a=256代入到上式。

2.3.2图像质量评价的主观准则

对压缩图像质量的第二种评价准则是主观准则，他是选择一组评价者给待评图像进行打分，对这些主观打分进行平均获得一个主观评价分。

如表2-1所示的两种典型的评分标准。

表2-1对图像质量的主观评价标准

得分

第一种评价标准

第二种评价标准

非常好

感觉不到失真

好

感觉到失真，但没有不舒服的感觉

一般

稍有不舒服的感觉

较差

不舒服

差

非常不舒服的感觉

设每一种得分记为C,每一种得分的评分人数为n，则一个被称为感觉分MOS（meanopinionscore）的主观评价得分为：

（2-7）

例如，一幅图像的评分为4.5，这说明图像质量相当好。

评价图像压缩效果的另外一个重要指标是压缩比C，它指的是表示原始图像每像素的比特数同压缩后平均每像素的比特数的比值，也常用每像素比特值（bpp）来代表压缩效果。

本文采用客观准则和主观准则两种准则来评价编码压缩图像的质量。

三、无损压缩编码原理与实现及其性能对比

所谓无损压缩，是利用数据的统计冗余进行压缩，可完全回复原始数据而不引起任何失真。

这类方法广泛用于文本数据，程序和特殊应用场合的图像数据（如指纹图像，医学图像等）的压缩。

经常使用的无损压缩方法有香农（Shannon-Fano）编码，霍夫曼（Huffman）编码，行程（Run-length）编码，LZW（Lempel-Ziv-Welch）编码和算术编码等。

3.1霍夫曼编码

霍夫曼于1952年提出一种编码方法，该方法完全依据字符出现概率来构造异字头的平均长度最短的码字，有时称之为最佳编码，一般就叫作霍夫曼编码。

3.1.1霍夫曼编码的基本原理

将使用次数多的代码用长度较短的代码代替，而使用次数少的则使用较长的编码，并且确保编码的唯一可解性。

其最根本的原则是：

累计的（字符的统计数字×字符的编码长度）最小，也就是权值的和最小。

①霍夫曼编码的基本步骤

哈夫曼编码是一种无损压缩方法，其一般算法如下：

1）、首先统计信源中各符号出现的概率，按符号出现的概率从大到小排序；

2）、把最小的两个概率相加合并成新的概率，与剩余的概率组成新的概率集合；

3）、对新的概率集合重新排序，再次把其中最小的两个概率相加，组成新的概率集合。

如此重复进行，直到最后两个概率的和为l；

4）、分配码字：

码字分配从最后一步开始反向进行，对于每次相加的两个概率，给大的赋¨O"，小的赋¨1¨（也可以全部相反，如果两个概率相等，则从中任选一个赋¨O¨，另一个赋"l¨即可），读出时由该符号开始一直走到最后的概率和¨1¨，将路线上所遇到的¨O¨和¨l¨按最低位到最高位的顺序排好，就是该符号的霍夫曼编码。

②霍夫曼编码的特点

1）霍夫曼编码具有不唯一性。

2）霍夫曼编码对不同信源具有不同的编码效率。

3）霍夫曼编码的结果不等长，硬件实现有相当大的困难，而且误码传播严重。

4）一般情况下，霍夫曼编码的效率要比其他编码算法的效率高一些，是最佳变长码。

但霍夫曼编码依赖于信源的统计特性，必须先统计出信源的概率特性才能编码，这就限制了霍夫曼编码的实际应用。

如图3-1所示是一个霍夫曼编码的例子。

从图中可以看到，符号只能出现在树叶上，且任何一个字符的路径都不允许是另一个字符路径的前缀路径，这样，前缀编码就构造成功了。

这样一颗二叉树在数据结构中被称为霍夫曼树，经常用于最佳判定，它是最优二叉树，是一种带权路径长度最短的二叉树。

所谓树的带权路径长度，就是树中所有的叶节点的权值乘上其到根节点的路径长度（假如根节点为0层，叶节点到根节点的路径长度则为叶节点的层数）。

树的带权路径长度记作：

WPL=（+×+……×），N个权值W（i=1,2，…，n）构成一棵有N个节点的二叉树，相应的树节点的路径长度为L（i=1,2，…，n），霍夫曼得出的WPL值最小。

图3-1霍夫曼编码实例

在实际应用中，由于在霍夫曼编码之前需要知道信源数据符号（叶节点）的概率，给那些要求做实时编码的任务带来了麻烦。

因此，在目前的实时编码作业中，大多采用所谓的准可变字长码，例如，采用双字长编码，并且从短码集合中选出一个码子，作为长码字头，以保证码字的非续长特性。

另外，在数字图像通信中采用的三类传真机中的MH码，则采用了多字长VLC技术，它是根据一系列标准图像的统计分析出结果，预先在其IC芯片中做号码表，使得实际的编码解码作业简化为一个查表过程，从而确保了高速实时处理的需要。

3.1.2MATLAB实现霍夫曼编码

本文霍夫曼编码压缩图像的步骤如下：

①读入图像，并把它用矩阵表示。

②统计图像颜色的种数。

③统计各种颜色值出现的概率，并把它们按从大到小的顺序排列。

④进行霍夫曼编码的计算：

定义一个矩阵M，M矩阵的第一行，存放的是需要编码的各个颜色值出现的概率，并且按照从大到小排列顺序，然后再将第一行从后往前两两相加（即概率最小的两个数相加），

把相加得到的结果放到第二行，然后再将第二行重新进行排序，依此类推，一直到最后一行，这时最后一行只有两个概率，并且相加肯定为1。

⑤对M矩阵的数值进行霍夫曼编码：

首先建立N矩阵，用来存放编码的码字。

然后将字符0，赋给最后一行的第一小段，再将字符1，赋给最后一行的第二小段，在M矩阵中，由于每一行的最后两个数，都是这一行中概率最小的两个数，所以将倒数第二行的最后两个数进行相加，然后用相加的结果到倒数第一行中去寻找，肯定会在倒数第一行中找到一样的值，然后记录下来在倒数第一行中这个值的位置，再将这个在M矩阵中的位置对应到N矩阵中，

将N矩阵中的该位置的字符赋给倒数第二行的第二小段和第三小段，最后在给第二小段的后面赋字符0，给第三小段后面赋字符1，然后将在最后一行找到的那个数的左边的数，一一对应到上一行去，右边的数，向左串一位，再对应到上一行去，这样依此类推，那么在N矩阵的第一行，可以得到最后的编码。

实验程序见附录一

实验结果如下：

原始图像大小

NameSizeBytesClass

f0139x11115429uint8array

Grandtotalis15429elementsusing15429bytes

Elapsedtimeis14.123268seconds.

压缩图像大小

NameSizeBytesClass

f139x11115429uint8array

Grandtotalis15429elemen

展开阅读全文