基于小波变换的图像压缩系统的实现本科毕业设计论文 精品.docx
《基于小波变换的图像压缩系统的实现本科毕业设计论文 精品.docx》由会员分享,可在线阅读,更多相关《基于小波变换的图像压缩系统的实现本科毕业设计论文 精品.docx(53页珍藏版)》请在冰豆网上搜索。
基于小波变换的图像压缩系统的实现本科毕业设计论文精品
本科毕业设计(论文)资料
题目名称:
基于小波变换的图像
压缩系统的实现
学院(部):
计算机与通信学院
专业:
学生姓名:
班级:
指导教师姓名:
最终评定成绩:
湖南工业大学教务处
(2009届)
本科毕业设计(论文)
基于小波变换的图像压缩系统的实现
学院(部):
计算机与通信学院
专业:
通信工程
学生姓名:
班级:
指导教师姓名:
最终评定成绩:
2009年6月
毕业设计(论文)原创性声明和使用授权说明
原创性声明
本人郑重承诺:
所呈交的毕业设计(论文),是我个人在指导教师的指导下进行的研究工作及取得的成果。
尽我所知,除文中特别加以标注和致谢的地方外,不包含其他人或组织已经发表或公布过的研究成果,也不包含我为获得及其它教育机构的学位或学历而使用过的材料。
对本研究提供过帮助和做出过贡献的个人或集体,均已在文中作了明确的说明并表示了谢意。
作者签名:
日 期:
指导教师签名:
日 期:
使用授权说明
本人完全了解大学关于收集、保存、使用毕业设计(论文)的规定,即:
按照学校要求提交毕业设计(论文)的印刷本和电子版本;学校有权保存毕业设计(论文)的印刷本和电子版,并提供目录检索与阅览服务;学校可以采用影印、缩印、数字化或其它复制手段保存论文;在不以赢利为目的前提下,学校可以公布论文的部分或全部内容。
作者签名:
日 期:
摘要
随着计算机与数字通信技术的迅速发展,特别是网络和多媒体技术的兴起,大数据量的图像信息会给存储器的存储容量、通信信道的带宽以及计算机的处理速度增加极大的压力。
为了解决这个问题,必须进行压缩处理。
对图像编码和解码算法的研究,已经受到人们越来越多的关注,图像编码领域已经出现了许多成熟的算法,主要可分为像素编码、预测编码变换编码以及其他方法。
近几年来,随着小波变换的成熟,其在图像编码领域的应用越来越突出。
本论文主要研究基于小波变换的图像压缩技术,重点论述了图像编码技术部分,对其中的图像编码如差值脉冲编码,预测编码,离散余弦变换以及小波变换做了详细的分析,并详细论述了图像小波压缩模块的设计过程,最后通过实例对一些算法进行了具体的说明,设计了友好的图形用户界面,方便用户观察结果,更好的理解算法,基于小波变换的图像处理工具箱实现系统的主要功能,系统界面友好,交互性强。
关键词:
图像压缩技术,图像编码,压缩系统,小波变换,图形用户界面
ABSTRACT
Withtherapiddevelopmentofcomputeranddigitalcommunicationtechnology,largevolumeimagedatacanbringpressureinthememorycapacity,bandwidthofcommunicationchannelandcomputerprocessingspeed,tosolvetheproblem,datacompressisneeded.Moreandmorepeoplepayattentiononthestudyofimagecodeanddecodealgorithm.Essentially,imagecodeuselesssymbolstoexpressdatainformationasmoreaspossiblewithcertainandcombination.Thefieldofimagecodinghavebeenanumberofsophisticatedalgorithms,itcanbedividedintopixelcoding,predictivecodingtransformcoding,aswellasothermethods.Inrecentyears,wavelettransformaremoreandmoreprominentintheapplication,withthematurityofimagecoding.
Thepapermajorresearchemphasisontheimageencodingpartoftheimagecodingbasedonwavelettransformimagecompressiontechnology,suchasthedifferenceofpulsecoding,predictivecoding,discretecosinetransformandwavelettransformanalysisindetailanddiscussedindetailwaveletimagecompressionmoduleofthedesignprocess,andfinallythroughtheexampleofthealgorithmonsomespecificdetailsofthedesignofafriendlygraphicaluserinterface,user-friendlyobservation,abetterunderstandingofalgorithms,basedonwavelettransformimageprocessingtoolboxtoachievesystemmainfunction,thesystemuser-friendly,interactive.
Keywords:
imagecompressiontechnology,imagecoding,compressionsystem,wavelettransform,graphicaluserInterface
第1章绪论
1.1论文研究的背景及意义
在人类所接收到的全部信息中,有70%以上是通过视觉得到的。
和语音或文字信息相比,图像包含的信息量更大,更直观、更确切,因而具有更高的使用效率和更广泛的适应性,图像信息的处理、存储和传输在社会生活中的作用越来越突出。
然而图像经过采样和量化转换成数字信号后,其数据量的巨大已经成为多媒体技术发展中的一个非常棘手问题。
尽管随着科学技术的发展,海量存储技术、处理器的速度以及数字通信系统的性能迅猛发展,但高清晰度数字图像数据量对数据存储的能力和数据传输带宽的需求仍然超出了现有技术的能力。
同时,在某些图像通信场合下的传输受客观物理条件的限制,难以扩展。
例如在深海勘探中利用水声通信技术的水下视频传输,其水声信息所具有的通信带宽是极其有限的。
因此,只有对图像进行编码压缩处理,去除图像中大量的冗余信息,大大地压缩图像的数据量,使其适应数字通信信道和存储介质,才是目前解决这一矛盾的一个切实可行的途径。
静态图像编码技术的研究发展,对于动态图像编码技术有很大的借鉴作用,本文的研究集中于静态图像的编码技术。
小波变换编码技术是在二十世纪九十年代以后兴起的编码方法。
一方面,小波编码拥有传统编码的一些优点,能够很好消除图像数据中的统计冗余。
另一方面,小波变换多分辨率的变换特性提供了利用人眼视觉特性的良好机制,而且小波变换后的图像数据能够保持原图像在各种分辨率下的精细结构,为进一步去除图像中其他形式的冗余信息提供了便利。
因此,小波图像编码在图像编码领域被非常看好。
但目前,基于小波变换的图像编码国际标准尚不十分成熟,相应的由纯硬件实现的小波编码的算法相对于传统的基于DCT变换的编码方法来说,算法复杂度和灵活性都要大很多。
就算法本身而言,还存在着如何有效组织变换系数,应用人眼视觉特性、选取合适小波基等问题。
1.2论文的主要研究工作
图像压缩就是利用图像自身存在的相关性消减图像的各种冗余信息,保留对我们有用的信息。
小波变换技术以其良好的时间-频率局部特性和与人眼视觉特性相符的变换机制,在图像压缩领域获得了广泛的应用。
本论文的重点旨在利用小波变换去掉某些经过小波变换得到的细节分量值,因为人眼视觉特性,对一些细节不是很敏感,对重构图像也没多大的影响。
为此本文通过小波变换的提取图像的细节系数,对其进行量化,进而完成图像的压缩。
本文给出了小波变换和DCT变换的有效实现方法,并进行了编程试验。
本论文还作了以下工作:
简述小波的发展状况和小波变换的优势后,首先介绍了数据压缩基础知识,并简单论述了图像数据压缩的必要性和可能性,讨论了图像压缩分类及图像压缩编码的技术指标;其次从数学分析的角度研究了小波变换的理论基础、特点和性质,介绍了多分辨率分析技术;再次对小波变换在图像压缩中的应用进行了有益的探索,给出了基于小波的图像压缩的具体步骤及其流程图,详细地讨论了小波变换用于图像压缩系统时应考率的几个问题;最后,用了MATLAB编程实现了一个基于小波变换的图像压缩系统,并对各种小波基的特性进行了分析,在系统中选择了小波变换算法作为的图像编码方法。
1.3论文的结构
本文共分6章,各章的内容安排如下:
第1章绪论。
简要阐述了本论文的研究背景、意义、主要工作以及结构安排。
第2章介绍图像编码技术。
包括数据压缩系统组成、图像编码压缩的必要性、图像编码压缩的可行性、图像编码压缩的技术指标、图像数据压缩的方法,包括统计编码,预测编码,变换编码,子带编码,分形编码,模型基图像编码,块截断编码,神经网络图像编码等。
第3章对小波变换理论进行了介绍。
包括相关的数学背景、小波编码的流程、小波变换的性质等。
第4章基于小波变换的图像压缩。
对离散余弦变换(DCT)与离散小波变换(DWT)分别进行了研究,分析了DWT优于DCT的原因;并介绍了一些常用的小波基的特征以及小波变换的特点。
第5章系统的设计和实现。
通过编写程序结合图像界面的设计,把系统设计成友好的图形界面,通过系统的实现,能简单的达到图像压缩功能。
第6章总结与展望。
对本文的工作进行了总结,并探讨了可以继续深入研究的方向。
第2章图像压缩编码
2.1数字图像
图像是自然界景物的客观反映。
自然界的图像无论在亮度、色彩,还是空间分布上都是以模拟函数的形式出现的,无法采用数字计算机进行处理、传输和存储。
在数字图像领域,将图像看成是由许多大小相同、形状一致的像素(PictureElement简称Pixel组成)用二维矩阵表示。
图像的数字化包括取样和量化两个主要步骤。
在空间将连续坐标离散化的过程为取样,而进一步将图像的幅度值整数化的过程称为量化。
2.2图像编码技术
数据压缩就是以较少的数据量表示信源以原始形式所代表的信息,其目的在于节省存储空间、传输时间、信号频带或发送能量等。
其组成系统如图2.1所示。
图2.1数据压缩系统组成图
过程应尽量保证去除冗余量而不会减少或较少减少信息量,即压缩后的数据要能够完全或在一定的容差内近似恢复。
完全恢复被压缩信源信息的方法称为无损压缩或无失真压缩,近似恢复的方法称为有损压缩或有失真压缩。
2.2.1图像压缩编码的必要性与可行性
1.图像压缩编码的必要性
采用数字技术会使信号处理技术性能大为提高,但其数据量的增加也是十分惊人的。
图像数据更是多媒体、网络通信等技术重点研究的压缩对象。
不加压缩的图像数据是计算机的处理速度、通信信道的容量等所无法承受的。
如果将上述的图像信号压缩几倍、十几倍、甚至上百倍,将十分有利于图像的存储和传输。
可见,在现有硬件设施条件下,对图像信号本身进行压缩是解决上述矛盾的主要出路。
2.图像压缩编码的可能性
图像数据量大,同时冗余数据也是客观存在的。
在有些图像中可压缩的可能性很大。
一般图像中存在着以下数据冗余因素。
(1)编码冗余
编码冗余也称信息熵冗余。
去除信源编码中的冗余量可以在对信息无损的前提下减少代表信息的数据量。
对图像进行编码时,要建立表达图像信息的一系列符号码本。
如果码本不能使每个像素所需的平均比特数最小,则说明存在编码冗余,就存在压缩的可能性。
(2)空间冗余
这是静态图像存在的最主要的一种数据冗余。
同一景物表面上各采样点的颜色之间存在着空间连贯性,但是基于离散像素采样来表示物体颜色的方式通常没有利用景物表面颜色的这种空间连贯性,从而产生了空间冗余。
(3)时间冗余
时间冗余反映在视频图像中就是相邻帧图像之间有较大的相关性,一帧图像中的某物体或场景可以由其他帧图像中的物体或场景重构出来。
(4)结构冗余
有些图像的纹理区中图像的像素值存在着明显的分布模式,即存在着结构冗余。
(5)知识冗余
有些图像的理解与某些知识有相当大的相关性,这类规律性的结构可由先验知识和背景知识得到,该类冗余称为知识冗余。
(6)视觉冗余
事实表明,人类的视觉系统对图像场的敏感性是非均匀和非线性的。
然而,在记录原始的图像数据时,通常假定视觉系统是均匀和线性的,对视觉敏感和不敏感的部分同样对待,从而产生了比理想编码更多的数据,这就是视觉冗余。
通过对人类视觉进行大量实验,发现了以下的视觉均匀特性:
①视觉系统对图像的亮度和色度的敏感性相差很大,视觉系统对亮度的敏感度远远高于对色彩度的敏感度。
②随着亮度的增加,视觉系统对量化误差的敏感性降低。
这是由于人眼的辨别能力与物体周围的背景亮度成反比。
因此,在高亮度区,灰度值的量化可以更粗糙一些。
2.2.2图像压缩编码的技术指标
一般地,图像压缩应能做到压缩比大、算法简单、易于硬件和软件实现、压缩和解压实时性好、解压缩恢复的图像失真小等。
但这些指标对同一压缩方法很难统一,在实际系统中往往需要抓住主要矛盾,全面权衡。
下面介绍常用的图像压缩技术指标。
1.图像熵与平均码长
熵是指信源的平均信息量。
如果一幅图像像素的灰度级为
(I=1,2…M),
若
出现的概率为P(
),则图像的熵定义为:
(2.1)
图像熵表示像素灰度级集合的平均比特数。
熵的单位为比特/字符。
熵具有以下的性质:
(1)当M级灰度出现的概率相等时,即P(
)=1/M时,有最大熵值H(x)=
;
(2)在极端情况下,当
或
时,
,这表明确定性信号的熵值为0;
(3)随机性图像信号的熵非负,满足
(4)令M=2i则在各灰度等概率的情况下,
,
。
在不等概率的情况下,H(x)平均码字长度简称平均码长,是码字长度的数学期望,即
(2.2)
显然R(x)的单位也是比特/字符。
根据Shannon信息保持编码定理,要保持信源的全部信息就必须有
(2.3)
否则一定会产生信源的编译码失真。
2.图像冗余度与编码效率
从上面的分析可以看出,图像无损压缩码长以H(x)作为极限。
因此可以定义冗
余度r,
R=1-
(2.4)
将编码效率
(2.5)
可见,当平均码长接近H(x)时,冗余度下降至0,编码效率提高至l。
这正是编码追求的目标。
3.压缩比
压缩比是衡量数据压缩方法压缩程度的一个指标,反映了压缩效率。
通常,定义为压缩前图像每像素的码长与压缩后每像素码长的平均码长之比。
4.客观质量评价
传统的客观评价方法用恢复图像偏离原始图像的误差来衡量图像恢复的质量,最常用的方法有均方误差MSE(MeanSquaredError)、峰值信噪比PSNR(PeakSignal-to-NoiseRatio)及信噪比SNR(Signal-to-NoiseRatio)。
MSE的表达式如下:
(2.6)
其中,
分别表示原始图像和恢复图像(i,j)位置处的像素值,
PSNR本质上与MSE相同,其表达式为:
(2.7)
式(2.6)和(2.7)看起来来直观、严格,但用它们所求得的结果常与人们的主观视觉效果不一致。
这是因为均方误差和峰值信噪比是从总体上反映原始图像和恢复图像的差别,并不能反映一幅图像中少数像素点有较大灰度差别和较多像素点有较小灰度差别等各种情况。
显然,客观质量评价采用式(2.6)与式(2.7)对图像中所有像素点同样对待,不能全面反映人眼的视觉特性。
客观评价SNR(信噪比)指压缩前的图像信号方差
与解压缩后重建误差方差
的比值。
定义如下:
(2.8)
SNR越大,在压缩过程中引入的失真越小,图像质量越好。
5.主观质量评价
除了机器视觉,许多图像是为人类服务的,信宿实际上是人的眼睛,当然最终的评价标准是人的主观感觉。
主观评价结果可以用参与测试组全体组员的平均判分来统一衡量。
图像的主、客观两种评价之间存在着密切的联系。
但一般来说,客观评价高的主观评价也高,因此在图像的质量评价时,首先做客观评价,以主观评价为参考。
6.感兴趣区质量评价[1]
图像最终是供人看的,因此合理地评价图像质量的方法应充分遵循人眼视觉特性。
人们已经发现,人眼视觉具有一定的选择性。
人们在观察和理解图像时会不自觉地对其中某些区域产生兴趣。
对于一幅人的图像,人们通常注意人的脸区。
但对于一幅头肩图像,发型设计师除注意人脸区之外,可能更关注该人的发型。
为讨论问题的简化起见,我们假设分析图像中只有一个感兴趣区A1,其面积为S1,不感兴趣区A2的面积为S2,图像的总面积
。
视觉经验告诉我们,对于给定的一幅图像,人眼对其不同区域感兴趣的程度是不同的。
如头肩图像,人眼往往对人脸区(感兴趣区)的失真敏感,而对其余部位(不感兴趣区),则能允许存在较大的失真[2]。
对于感兴趣区,当其面积越来越小时,人眼对其失真就越来越敏感,也就是说,人眼对它的感兴趣程度大体上与其面积成反比。
当感兴趣区扩张至整幅图像时,人眼对它的感兴趣将降到最低,如同不感兴趣区。
对于不感兴趣区,感兴趣区对其兴趣程度有屏蔽作用。
当感兴趣区的面积较大时,随着感兴趣区面积的增大,人眼对不感兴趣区的兴趣将逐渐增强,而当感兴趣区域的面积较小时,随着感兴趣区面积的减小,尽管人眼对感兴趣区的兴趣越来越强,但由于不感兴趣区的不断扩大,使得观察者越来越不能忽视它的存在,也就是说人眼对不感兴趣的兴趣程度也越来越强。
在感兴趣区的面积等于零或者感兴趣区扩张至整幅图像的两种情况下,被测图像的失真对人眼视觉的影响可以近似认为等价的。
将上述视觉经验加以定量化,便可以实现对视觉兴趣性的定量测量。
2.2.3数据压缩方法
数据压缩的方法很多,而且人们还在不断在研究新的方法。
一般数据压缩按信息损失的程度来分类。
常见的有20多种常用数据压缩方法。
且这些方法在图像压缩中均有应用。
在无损压缩(LosslessCompression)中,Huffman编码和Shannon编码根据概率分布特性确定码长;游程编码根据连续灰度的游程来确定编码;算术编码随信源数据不断缩小的实数区间,然后用一个与实数对应的二进制码代表被编码的信息;轮廓编码根据相同灰度的区域边界线编码。
在有损压缩(LossyCompression)中,预测编码根据相邻像素相关性来确定后继像素的预测值,若用差值进行编码则可以压缩数据量;变换编码对原始图像进行正交变换,在变换域进行抽样达到压缩的目的;混合编码将两种编码方法结合起来,如将预测编码与变换编码相结合,以取得更好的效果。
在现代压缩编码方法中,分形编码利用宏观与微观的相似性来压缩数据量,可以获得极大的压缩比。
该方法压缩过程中的计算量很大,但解压缩很快,适用于图像数据的存储和重现。
模型基(model-based)编码也是一种新型压缩方法。
该方法在发送端利用已知且变化慢的场景得到数据量不大的模型参数,在接收端利用综合模型参数恢复原始图像。
1.统计编码
利用信源的统计特性进行码率压缩的编码方式称为熵编码,也叫统计编码。
常用的统计编码有两种:
变长编码(也称为哈夫曼编码)及算术编码。
(1)Huffman编码
1952年,哈夫曼提出变长编码方法:
对出现概率大的符号分配短字长的二进制码,对出现概率小的符号分配长的二进制码,得到符号平均码长是最短的码。
变长编码也称为最佳码方法。
哈夫曼编码的实施步骤如下:
第一步,将信息符号按其出现概率从大到小排列;
第二步,将两个最小概率组成一组,划成2个分支域,并标以0和l;再把2个分支域合并成1个分支域,标以两个概率之和:
第三步,找出概率和1.0到各信息符号的路径,记下各路径从右到左各分支域的0和1,即得到信息符号相应的码字。
理论上,这种编码方法是最佳的。
实际上,利用硬件实现时,出现概率的值不可能精确到小数后多少位,而最小存储单元为lbit,会引起概率匹配不准确及编码效率的下降。
(2)算术编码
算术编码和哈夫曼编码不同,不采用一个码字代表一个输入信息符号的办法,而采用一个浮点数来代替一串输入符号。
经算术编码后输出一个小于l,大于或等于0的浮点数,在解码端再进行正确、惟一地解码,恢复原符号序列。
2.预测编码
预测编码也称为差值脉冲编码调制(DPCM)。
在预测编码中所采用的主要是两大技术:
信号的最佳线性预测和最佳量化。
由图像的统计特性分析可知,图像相邻像素之间存在很强的相关性,因此可以用已知的前面几个像素的值进行预测。
而把实际的值与预测的差作为传输的对象。
当对预测的误差不进行量化时,即在不产生量化误差的条件下,也可用于无失真编码,获得更高的压缩比。
此外,还可以根据图像的内容采用不同的预测系数,减少预测误差,降低码率,即所谓的自适应预测。
或者利用人眼对差值大小所表现的不同的灵敏度,采用自适应量化技术。
3.变换编码
变换编码不是直接对空域图像信号编码,而是首先将空域图像信号映射到另一个空间(变换域),产生一组变换系数,然后对这些系数进行量化、编码、传输。
变换编码对静止和运动图像都适用。
常见的变换有离散傅里叶变[3](DFT)K.L变换[4][5]、离散余弦变换[6](DCT)等。
4.子带编码
子带编码[7]最初是用于语音编码,其基本思想是发信端利用数字线性滤波器将信号分离为高频和低频两个不同频带的信号,利用与各频率的统计特性相适配的编码进行编码,在接收端,经解码、内插、线性合成滤波器得到信号的恢复值。
子带编码具有子带内编码的噪声只限于子带内,而不会扩散到其他子带的特点,而且可以根据主观视觉特性,将有限的比特率在各个子带内做合理的分配,即实行噪声频谱成形技术,有利于提高图像的质量。
这些特点对实现所谓的多分辨率图像压缩编码很有利。
5.量化编码
量化编码又分为标量量化和矢量量化[8]。
对于经过映射变换后的数据,或者直接对PCM数据,一个数一个数的进行量化叫标量量化(SQ.ScalarQuantization):
若对这些数据分组,每组若干个数据作为一个矢量,然后以矢量为单位,逐个量化,称为矢量量化(VQ:
VectorQuantization)。
矢量量化是近年来图像、语音编码技术中颇为流行的一种新型量化编码方法,其关键问题在于设计一个优良的码本。
6.块截断编码(BTC:
BlockTruncationCoding)
BTC编码[9][10]是一种低复杂度图像编码方法。
它首先将图像分解成大小固定的互不重叠的块,然后对不同的二值量化器进行量化。
量化器的阈值与两个量化重建值由块的局部统计特性决定。
BTC具有编码速度块,算法简单的特点,但一般压缩比不高,且有块效应。
7.分形编码