ImageVerifierCode 换一换
格式:DOCX , 页数:149 ,大小:969.07KB ,
资源ID:22160795      下载积分:3 金币
快捷下载
登录下载
邮箱/手机:
温馨提示:
快捷下载时,用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)。 如填写123,账号就是123,密码也是123。
特别说明:
请自助下载,系统不会自动发送文件的哦; 如果您已付费,想二次下载,请登录后访问:我的下载记录
支付方式: 支付宝    微信支付   
验证码:   换一换

加入VIP,免费下载
 

温馨提示:由于个人手机设置不同,如果发现不能下载,请复制以下地址【https://www.bdocx.com/down/22160795.html】到电脑端继续下载(重复下载不扣费)。

已注册用户请登录:
账号:
密码:
验证码:   换一换
  忘记密码?
三方登录: 微信登录   QQ登录  

下载须知

1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。
2: 试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。
3: 文件的所有权益归上传用户所有。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 本站仅提供交流平台,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

版权提示 | 免责声明

本文(压缩编码在图像处理中的应用学位论文Word文档格式.docx)为本站会员(b****7)主动上传,冰豆网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知冰豆网(发送邮件至service@bdocx.com或直接QQ联系客服),我们立即给予删除!

压缩编码在图像处理中的应用学位论文Word文档格式.docx

1、2.6.3 分形编码 172.6.4 小波变换编码 172.7 图像压缩编码的国际化标准 172.7.1 图像压缩编码的国际标准化背景 172.7.2 图像编码国际标准化建议的特点及适用方向 18第3章 压缩编码在图像压缩中的应用研究 223.1 几种图像压缩编码的MATLAB实现示例 223.1.1 像素编码 223.1.2 预测编码 233.1.3 变换编码 233.1.4 其它编码 243.2 JPEG压缩标准 253.3 基于DCT的JPEG图像压缩编码理论算法 263.3.1 基于离散余弦变换(DCT变换)的JPEG编码方法 263.3.2 基于DCT的JPEG图像压缩编码算法的过程

2、表述 263.3.3 基于DCT的JPEG图像压缩编码步骤 273.3.4 DCT变换与小波变换的压缩性能比较 32第4章 基于DCT变换的JPEG压缩过程MATLAB实现 334.1 MATLAB简介 334.1.1 MATLAB软件 334.1.2 MATLAB中数字图像文件的读写 334.2 MATLAB仿真实现流程 354.3 MATLAB仿真结果分析 38结论 39参考文献 40附录 外文文献原文 41附录 外文文献译文 55附录 程序清单 66致谢 94第1章 绪论1.1 数字图像处理1.1.1 图像处理的概念1什么是图像?“图”物体透射或反射光的分布(图像场),是客观存在;“像”

3、人的视觉系统对接收在大脑中形成的图的印象或认识,是人的感觉;图像图和像的有机结合,既反映物体的客观存在,又体现人的心理因素;对客观存在物体的一种相似性的生动模仿或描述。2图像的表示一幅图像定义为一个二维函数f(x,y),这里x和y是空间坐标,在任何一对空间坐标(x,y)上的幅值f称为该点图像的强度或灰度。当幅值f为有限的、离散的数值时,称该图像为数字图像。数字图像由有限的元素组成,每个元素都有一个特定的位置和幅值,这些元素称为像素(图像元素或画面元素)。(1) 空间有界:L-xxL+x (1-1)L-yyL+y (1-2)(2) 亮度(点亮度)有限:0f(x,y)Bmax (1-3)图像的数学

4、表示:一幅图像所包含的信息首先表现为光的强度,即一幅图像可看成是空间各个坐标点上的光强度I的集合,其普遍数学表达式为:I=f(x,y,z,t) (1-4)式中(x,y,z)是空间坐标,是波长,t是时间,I是光点(x,y,z)的强度(幅度)。式(1-4)表示一幅运动的(t)、彩色/多光谱的()、立体的(x,y,z)图像。静止图像,与时间t无关;单色图像(也称灰度图像),波长为一常数;平面图像,则与坐标z无关。在每一种情况下,图像的表示可省略掉一维,即:静止图像:I=f(x,y,z,) (1-5)灰度图像:I=f(x,y,z,t) (1-6)平面图像:I=f(x,y,t) (1-7)而对于平面上的

5、静止灰度图像,其数学表达式可简化为:I=f(x,y) (1-8)运动图像可用静止图像序列表示,彩色图像可分解成三基色图像,三维图像可由二维重建。因此本文主要针对平面上的静止灰度图像进行论述。3数字图像处理的定义1:利用数字计算机或其它高速、大规模集成数字硬件,对从图像信息转换来的数字电信号进行某些运算或处理,以期提高图像质量或达到人们所要求的某些预期效果。(1) 对被噪声污染的图像去除噪声;(2) 对信息微弱的图像进行增强;(3) 失真图像的几何校正;(4) 从遥感图片中辨别农作物、森林、湖泊和军事设施等。4数字图像处理的目的对图像信息进行加工处理和分析,以满足人的视觉、心理需要和实际应用或某

6、种目的(如机器识别)的要求。着重强调在图像之间进行的变换,广义上泛指各种图像技术;狭义上指对图像进行各种加工处理,达到:改善人的视觉效果;为自动识别打基础;压缩编码等目标。5数字图像处理的内容和方法(1) 图像数字化:将非数字形式的图像信号通过数字化设备转换成数字图像,包括采样和量化。(2) 图像变换:对图像信息进行变换以便于在频域对图像进行更有效的处理。(3) 图像增强:增强图像中的有用信息,削弱干扰和噪声,提高图像的清晰度,突出图像中所感兴趣的部分。(4) 图像恢复(复原):对退化的图像进行处理,使处理后的图像尽可能地接近原始(清晰)图像。(5) 图像压缩编码:对待处理图像进行压缩编码以减

7、少描述图像的数据量。(6) 图像分割:根据选定的特征将图像划分成若干个有意义的部分,这些选定的特征包括图像的边缘、区域等。(7) 图像分析与描述:主要是对已经分割的或正在分割的图像各部分的属性及各部分之间的关系进行分析表述。(8) 图像识别分类:根据从图像中提取的各目标物的特征与目标物固有的特征进行匹配、识别,以作出对各目标物类属的判别。1.1.2 数字图像处理的应用阐述数字图像处理应用范围最简单的一种方法是根据信息源来分类。各类信息源及不同的应用领域产生各种不同的图像。1、 宇宙探测中的应用:主要是星体图片的获取、传送和处理。2、 通信方面的应用:图像信息传输、电视电话、卫星通信、数字电话等

8、。主要是压缩图像数据和动态图像(序列)传送。3、 遥感方面的应用:航空遥感和卫星遥感,地形、地质、资源的勘测,自然灾害监测、预报和调查,环境监测、调查等。4、 生物医学方面的应用:细胞分析、染色体分类、放射图像处理、血球分类、各种CT、核磁共振图像分析、DNA显示分析、显微图像处理、癌细胞识别、心脏活动的动态分析、超声图像成像、生物进化的图像分析等等。5、 军事公安方面的应用:a) 军事:军事目标的侦察和探测、导弹制导、各种侦察图像的判读和识别,雷达、声纳图像处理、指挥自动化系统等。b) 公安:现场实景照片、指纹、足迹的分析与鉴别,人像、印章、手迹的识别与分析,集装箱内物品的核辐射成像检测,人

9、随身携带物品的X射线检查等。6、 工业生产的应用:将CAD和CAM技术应用于磨具和零件优化设计和制造、印制板质量和缺陷的检测、无损探伤、石油气勘测、交通管制和机场监控、纺织物的图案设计、光的弹性场分析、运动工具的视觉反馈控制、流水线零件的自动监测识别、邮件自动分拣和包裹的自动分拣识别等。7、 天气预报:天气云图测绘、传输,气象卫星云图的处理和识别等。8、 考古:珍贵文物图片、名画、壁画的辅助恢复。9、 新领域:(1) 信息安全:信息隐藏与数字水印,指纹识别、虹膜识别和面部识别等;(2) 图像检索:基于内容的图像检测、识别与检索;(3) 体育运动:运动员动作的分析、评测及优化设计。1.2 图像数

10、据压缩的研究1.2.1 研究背景及意义近年来,随着计算机技术、现代通信技术、网络技术和信息处理技术的迅速发展,人们对各种信息的需求不断增长,尤其是图像和多媒体信息。未经处理的图像信号的数据量是巨大的,使得图像信息的传输,处理和存储都受到限制。因此,研究高效的图像数据压缩编码方法,即怎样处理、组织图像数据,在应用领域中的作用将是至关重要的,图像压缩编码技术已经成为多媒体及通讯领域中的关键技术之一。多媒体数据的数据量非常巨大,如果不进行压缩,就无法在计算机中存储和传输,也无法在多媒体信息系统中处理。对数据进行压缩的目的是减小存储容量和降低数据传输率,使得现有的PC机的指标与性能方面达到能够处理声音

11、和图像信息的要求,从而实现实时、快速、有效地处理、传输和存储数据。压缩的出发点是利用各种编码方法将数据冗余压缩到最小,并尽可能地减少失真,提高数据使用效率。在掌握数据压缩技术的基本原理与方法的基础上,研究数据压缩技术来实现更高的压缩比和压缩质量。图像数据压缩编码近年来在技术及应用方面都取得了很大进展,它的进步和完善深刻影响着现代社会的方方面面。在众多编码标准中,JPEG压缩算法实现简单,在很大的压缩范围内,都能得到很好的重建图像质量。用MATLAB做仿真实验,方法简单且误差小,很达程度的提高了图像压缩的效率和压缩精度。DCT变换是最小均方误差准则下得出的次最佳正交变换。 DCT具有算法简单,易

12、于硬件实现等优点,从而广泛应用于图像压缩领域。正是由于具有这些优点,JPEG压缩编码算法在图像压缩领域得到了越来越广泛的应用,尤其在较高比特率的传输条件下能取得令人满意的压缩效果。1.2.2 图像数据压缩的必要性进入21世纪,人类已步入信息社会,新信息技术革命使人类被日益增多的多媒体信息所包围,这也正好迎合了人类对要示提高视觉信息的需求。多媒体信息主要有三种形式:文本、声音和图像。从信息传输的发展史(电报、电话、传真、收音机、电视机直至现在的网络)可以看出,人们逐渐将信息传输的重点从声音转向图像,然而图像是三种信息形式中数据量最大的,这给图像的传输和存储带来了极大的困难。例如,一幅640480

13、分辨率的24位真彩色图像的数据量约为900kb;一个100Mb的硬盘只能存储约l00幅静止图像画面。对于如此巨大的数字图像数据量,如果不经过压缩,不仅超出了计算机的存储和处理能力,而且在现有的通信信道的传输速率下,是无法完成大量多媒体信息实时传输的,数字图像高速传输和存贮所需要的巨大容量已成为推广数字图像通信和最大障碍。因此,为了存储、处理和传输这些数据,必须进行压缩。图像压缩之所以能够进行压缩是因为原始图像数据是高度相关的,存在很大的数据冗余。数字图像包含的冗余信息一般有以下几种:空间冗余、时间冗余、信息熵冗余、统计冗余、结构冗余、视觉冗余以及知识冗余等。图像压缩算法就是要在保证图像一定的重

14、建质量的同时,尽可能多的去除这些冗余信息,以达到对图像压缩的目的。图象采样后,如果对之进行简单的8bit量化和PCM编码,其数据量是巨大的。以CIF(Common Intermediate Format)格式的彩色视频信号为例,若采样速率为25帧/秒,采样样点的Y、U、V分量均为8bit量化,则一秒钟的数据量为:(1-9)352288382560.83Mbit 要传输或存储这样大的数据量是非常困难的,必需对其进行压缩编码,在满足实际需要的前提下,尽量减少要传输或存储的数据量。虽然数字图象的数据量巨大,但图象数据是高度相关的。一幅图象的内部相邻象素之间,相邻行之间的视频序列中相邻图象之间有大量冗

15、余信息空间相关性和时间相关性,可以使用各种方法尽量去除这些冗余信息,减少图象的数据量。除了时间冗余和空间冗余外,在一般的图象数据中还存在信息熵冗余、结构冗余、知识冗余和视觉冗余。各种冗余就是压缩图象数据的出发点。图象编码的目的就在于采用各种方法去除冗余,以尽量少的数据量来表示个重建图象。1.2.3 图像数据压缩的可行性经研究发现,与音频数据一样,图像数据中存在着大量的冗余,原因在于原始图像数据是高度相关的。通过去除那些冗余数据可以节约文件所占的码字从而极大地降低原始图像数据量,解决图像数据量巨大的问题,达到数据压缩的目的。图像数据压缩技术就是研究如何利用图像数据的冗余性来减少图像数据量的方法。

16、因此,进行图像压缩研究的起点是研究图像数据的冗余性。1. 空间冗余。在静态图像中有一块表面颜色均匀的区域,在这个区域中所有点的光强和色彩以及色饱和度都相同,具有很大的空间冗余。这是由于基于离散像素采样的方法不能表示物体颜色之间的空间连贯性导致的。2. 时间冗余。电视图像、动画等序列图片,当其中物体有位移时,后一帧的数据与前一帧的数据有许多共同的地方,如背景等位置不变,只有部分相邻帧改变的画面,显然是一种冗余,这种冗余称为时间冗余。3. 结构冗余。在有些图像的纹理区,图像的像素值存在着明显的分布模式。例如,方格状的地板图案等,称此为结构冗余。如果已知分布模式,就可以通过某一过程生成图像。4. 知

17、识冗余。对于图像中重复出现的部分,我们可以构造出基本模型,并创建对应各种特征的图像库,进而使图像的存储只需要保存一些特征参数,从而可以大大减少数据量。知识冗余是模型编码主要利用的特性。5. 视觉冗余。事实表明,人的视觉系统对图像的敏感性是非均匀性和非线性的。在记录原始的图像数据时,对人眼看不见或不能分辨的部分进行记录显然是不必要的。因此,大可利用人的视觉的非均匀性和非线性,降低视觉冗余。6. 图像区域的相同性冗余。它是指在图像中的两个或多个区域所对应的所有像素值相同或相近,从而产生的数据重复性存储,这就是图像区域的相似性冗余。在以上的情况下,当记录了一个区域中各像素的颜色值,则与其相同或相近的

18、其他区域就不需要记录其中各像素的值。采用向量量化(Vector quantization)方法就是针对这种冗余性的图像压缩编码方法。随着对人的视觉系统和图像模型的进一步研究,人们可能会发现图像中存在着更多的冗余性,使图像数据压缩编码的可能性越来越大,从而推动图像压缩技术的进一步发展。允许图像有一定的失真也是图像可以压缩的一个重要原因,在许多应用场合,并不要求经过压缩后复原的图像和原始图像完全相同,而允许有少量的失真。只要这些失真并不被人眼所察觉,在许多情况下是完全可以接受的。这就个图像压缩提供了十分有利的条件。图像质量允许的失真越多,可以实现的压缩比就越大。这种有失真的压缩编码称为限失真编码。

19、第2章 图像压缩编码理论图象的数字化表示使得图象信号可以高质量地传输,并便于图像的检索、分析、处理和存储。但是数字图像的表示需要大量的数据,必须进行数据的压缩。因此图象压缩编码技术的研究显得特别有意义,也正是由于图象压缩编码技术及传输技术的不断发展、更新,推动了现代多媒体技术应用的迅速发展。2.1 模拟图像信号数字传输与存储的一般过程目前,模拟图像信号的数字传输与存储的一般原理如图2-1所示:图2-1 图像传输与存储原理其中图像压缩编码一般大致分为三个过程:采样、量化和编码过程。1. 采样图像在空间上的离散化称为采样。也就是用空间上部分点的灰度值代表图像,这些点称为采样点。采样需符合采样定理,

20、才能使图像不失真,即:Fs=2Fmax。2. 量化模拟图像经过采样后,在时间和空间上离散化为像素。但采样所得的像素值(即灰度值)仍是连续量。把采样后所得的各像素的灰度值从模拟量到离散量的转换称为图像灰度的量化。量化等级越多,所得图像层次越丰富,灰度分辨率高,图像质量好,但数据量大;量化等级越少,图像层次欠丰富,灰度分辨率低,会出现假轮廓现象,图像质量变差,但数据量小。量化可分为均匀量化和非均匀量化。均匀量化是简单地在灰度范围内等间隔量化。非均匀量化是对像素出现频度少的部分量化间隔取大,而对频度大的量化间隔取小。一般情况下,对灰度变化比较平缓的部分用比较多的量化级,在灰度变化比较剧烈的地方用比较

21、高的分辨率。一般,当限定数字图像的大小时,为了得到质量较好的图像可采用如下原则:(1)对缓变的图像,应该细量化,粗采样,以避免假轮廓。(2)对细节丰富的图像,应细采样,粗量化,以避免模糊(混叠)。3. 编码图像编码是将模拟图像信号转换成数字信号的一种技术。图像编码方法很多,图2-2就是其中的一种。图2-2 图像编码的一种方法图2-2中的图像编码包含:(1).PCM编码;(2).压缩编码。2.2 图像数据压缩原理和图像压缩系统构成2.2.1 图像数据压缩的基本原理由于图像数据之间存在着一定的冗余,所以使得数据的压缩成为可能。信息论的创始人Shannon提出把数据看作是信息和冗余度的组合。所谓冗余

22、度,是由于一副图像的各像素之间存在着很大的相关性,可利用一些编码的方法删去它们,从而达到减少冗余压缩数据的目的。为了去掉数据中的冗余,常常要考虑信号源的统计特性,或建立信号源的统计模型。对数字图像进行压缩通常利用两个基本原理2:(1)数字图像的相关性。在图像的同一行相邻像素之间、活动图像的相邻帧的对应像素之间往往存在很强的相关性,去除或减少这些相关性,也就去除或减少图像信息中的冗余度,即实现了对数字图像的压缩。(2)人的视觉心理特征。人的视觉对于边缘急剧变化不敏感(视觉掩盖效应),对颜色分辨力弱,利用这些特征可以在相应部分适当降低编码精度,而使人从视觉上并不感觉到图像质量的下降,从而达到对数字

23、图像压缩的目的。2.2.2 图像压缩系统的一般构成图2-3 图像压缩系统的一般构成信源编码:完成原始数据的压缩与编码。信道编码:为了抗干扰,增加一些容错、校验位,实际上是有规律地增加传输数据的冗余,以便于消除传输过程中增加的随机信号。信道:传输数据(信息)的手段。如Internet、广播、通讯、可移动介质等。信源数据编码与解码的模型如图2-4和图2-5所示:图2-4 信源编码模型映射器:减少像素冗余,如使用RLE编码。或进行图像变换。量化器:减少视觉心理冗余,仅用于有损压缩。符号编码器:减少编码冗余,如使用哈夫曼编码。图2-5 信源解码模型2.3 图象压缩的几种方法1、 统计和字典的压缩方法常

24、规程序和计算机熵的数据对于那些基于利用统计变种的压缩,效果很好,这些统计变种表现在单个符号的频率以及符号或短语字符串的频率等方面,而基于字典的系统实际上就是假扮统计程序。可是遗憾的是,这类压缩对于连续色调图象的作用并不是很好。这些程序的主要问题产生于这样的一个事实:照片图象的象素广泛地分布在整个范围。如果将图象中的彩色用频率分布画出,那么频率分布图中,没有我们在统计压缩的成功的情况下所看到的“尖峰”状,实际上,如果延长这个分布图,那么从类似于电视那样的生活图象源中得出的分布图会趋于平展。这意味着,每个象素代码彼此是大约相同的出现机会,决对不存在挖掘熵差的任何机会。基于字典的压缩程序的运行也有类

25、似的问题,基于扫描照片的图象决定没有任何类型的数据特征以产生相同的短语的多次出现。例如,一个栅格化的图象,类似房子墙边的垂直部分,在图片的许多连续的行中可能可以给出相似的字符串。但不幸的是,由于真实世界是变化多端的,每行中的相同的性能将彼此地略有不同,对于20个象素的一个字符串,其中的一两个象素会因扫描而彼此出现一步长的变化,虽然这些不同点小到人眼不能探测或对人眼不起作用,但他们毕竟妨碍了基于字典压缩的工作,对于这类压缩方法来说,字符串必须严格匹配,由于小的变化,而使匹配的字符串长度趋于很小,这就限制了压缩的效率。2、 有损压缩类似于音频数据,图形图象也同样有一个比常规计算机数据文件优越的地方

26、:在压缩/扩展的循环中,他们可以被略微改动,而不会影响用户的立即质量。如果仔细修改,那么各处象素的精确灰度可以完全不被注意地进行小的改变。由于计算机栅的图形图象通常来自对真实世界源的扫描,所有他们通常表达一个已经不完美的照片的表达或是不完美的其他打印接着的表达。没有改变图象基本性能的有损压缩程序应该是可行的。假设图形图象的有损压缩是可能的,那么它是如何实现的呢?研究人员最初试验了用于语音信号的同样的技术,如差分编码和自适应编码,虽然这些技术对图象有帮助,但并没有达到所希望的那么好,原因之一是音频数据和视频数据根本不同。用常规格式采样的音频数据是趋于反复的,声音,包括讲话,是由每次几秒的重复的正

27、弦波组成的。虽然计算机上DAC的输入流可能由许多不同的频率叠加在一起而成,但是正弦波通常产生反复的波形。音频反复的本性自然使他利于压缩,线性预言编码和自适应差分脉冲编码调制等技术就利于了这一点,因此将音频数据流压缩了50到95。但开始研究图形压缩时,人们也试图用相似的技术压缩数字化的图象,取得了一些成功。最初,研究人员进行栅格化数据流的压缩,如显示在电视机栅的数据。图形数据栅格化时,图形显示成一个象素流,每次一行地显示在屏幕上,从左到右,从上到下。这样,当完成一行时,图片的一个细片就画出了,直到整个屏幕填满。数字化时,象素可以使用从1位到24位,如今的图形常常使用8位来定义一个象素。3、 差分

28、调制差分调制依赖于模拟数据趋于“平缓”的变化,信号幅度上那个的大的跳变是例外,而不是常规。在音频数据中,只要信号的采样率一定程度地高于信息本身的最大的频率分量,那么大的跳变就不会产生。音频信号的差分调制通过编码一个样点与前一个样点的不同来利用这一个特点。例如,如果单频样点位8位,差分编码系统可能用4位来编码样点之差,这就将输入数据压缩了50。这种压缩方法中所产生的损失是来自于:使用标准的差分方法不可能总是精确地编码。信号的增长可能快于比编码的允许,或者,编码可能太粗而不能容纳下的差别,差分编码的有损性可以很好的处理,以产生出好的信号。当压缩图形数据时,差分调制有很多问题。首先,图形中的象素依赖

29、于平缓的增加或减少是不可靠的,一幅图中不同的分量间的明显界限是常有的事情。这意味着,使用差分编码的系统需要接受样点间的大的不同和小的不同。这就限制了压缩的效率。带有数据长结构的许多图象可以压缩的很好。长结构中的象素,彼此之间没有什么差别或差别很少;但时,带有突变部分的那些图象不可能压缩的很好。通常,图形图象的差分的编码似乎不产生非常强于最好的无损算法的压缩结果,他当然也不会产生所需要的、对压缩的数量级上的改进。4、 自适应编码自适应编码(常常于差分编码一同使用)根据前面看到的一些象素而对将要到来的一些象素的信息做预言。例如,如果一幅灰度级照片中的最新的十个象素的值都在45到50之间,那么自适应压缩系统可能预言,下一个象素很大可能也在这个范围中,之后,类似于霍夫曼或算术编码那样的基于熵的编码方案可能给将来到来的各种代码赋以概率值,可以代替地使用压缩扩展方法,将最细的粒度赋给最接近预言猜测的范围。2.4 图像压缩编码的分类图像压缩编码的方法目前有很多,其分类方法根据出发点不同而有差异。1

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1