胡君光06080201毕设2份Word格式.docx
《胡君光06080201毕设2份Word格式.docx》由会员分享,可在线阅读,更多相关《胡君光06080201毕设2份Word格式.docx(32页珍藏版)》请在冰豆网上搜索。
这些不同格式的数字图像文件都有着自己的特殊有点同时也有着自己的缺点,所以在运用图片的过程中便出现了其文件格式之间的相互转换,通过基于不同形式进行图像文件格式的相互转换最终得到自己最为适用的图像格式,而在众多形式中MATLAB无疑是其中的佼佼者。
MATLAB是一种高效的工程计算语言,在数值计算、数据处理、自动控制、图像处理、神经网络、小波分析、金融分析等方面有着广泛的应用。
MATLAB是一种向量语言,它非常适合于进行图像处理。
目录
前言1
1.概论4
2.数字图像处理5
2.1什么是数字图像5
2.2数字图像在计算机内的处理6
2.3数字图像处理概述8
3.数字图像文件格式9
3.1BMP格式9
3.2JPEG格式10
3.3TIFF格式12
3.4GIF格式14
3.5PCX格式15
3.6PNG格式16
4.MATLAB与数字图像处理17
4.1MATLAB概述17
4.2MATLAB的特点17
4.3MATLAB的主要功能18
4.4MATLAB在图像处理中的应用18
4.5图像基础统计分析19
4.5.1均值计算19
4.5.2标准差计算20
4.5.3方差计算21
4.6图像的载入与保存21
4.6.1图像的载入21
4.6.2图像显示22
4.6.3图像储存23
5.数字图像文件格式转化实现24
5.1数字图像文件格式转化原理24
5.2JPG格式与TIFF格式转化实现25
5.3JPG格式与BMP格式转化实现27
5.4JPG格式与GIF格式转化实现29
选定实验所需图片如图5-4-1所示(原图文件格式为jpg):
29
5.5JPG格式与PNG格式转化实现31
5.6数字图像文件格式优缺点比较33
结论与展望36
致谢38
参考文献39
1.概论
随着信息化时代的到来,数字化成为其中的主角,可以说信息化的实现是以信息化为前提的。
从计算机,互联网,数码相机,数字图像的处理便成了其中的不可或缺的技术,图像带来的冲击不可阻挡,无论是工作还是娱乐,无不与图像相关,而更高效的利用图像优点使其在工作娱乐中得到更突出的作用便成了人们所追求的,于是关于数字图像文件格式的研究及其转换便成为其中不可或缺的重要一环,本文旨在用MATLAB语言进行简单的数字图像转换实现及其相关有缺点研究,最后简介了论文组织结构。
2.数字图像处理
2.1什么是数字图像
所谓数字图像就是把传统图像的画面分割成如图2-1所示的被成为像素(pictureelement,简称pixel。
有时候也用pel这一简写词)的小的离散点,各像素的灰度值也是用离散值即整数值来表示的。
数字图像(digitalimagine)和传统的图像即模拟图像(picture)是有差别的。
图2-1数字图像
为了从一般的照片,景物等模拟图像中得到数字图像,需要对传统的模拟图像进行采样与量化两种操作(二者统称为数字化)[5]。
1.采样
采样(sampling)就是把在时间上和空间上连续的图像变成离散点(采样点,即像素)的集合的一种操作。
图像基本上是在二维平面上连续分布的信息形式要把它输入到计算机中,首先要把二维信号变成一维信号,因此要进行扫描(scanning)。
最常用的扫描方法是在二维平面上按一定间隔顺序地从上方顺序地沿水平方向的直线(扫描线)扫描,从而取出浓淡值(灰度值)的线扫描(Laster扫描)。
对于由此得到的一维信号,通过求出每一特定间隔的值,可以得到离散的信号。
对于运动图像除进行水平,垂直两个方向的扫描以外,还有进行时间轴上的扫描。
通过采样,如设横向的像素数为M,纵向的像素数为N,则画面的大小可以表示为“M*N”个像素。
2.量化
经过采样,图像被分解成在时间上和空间上离散分布的像素,但是像素的值(灰度值)还是连续值。
像素的值,是指白色-灰色-黑色的浓淡值,有时候也指光的强度(亮度)值或灰度值。
把这些连续的浓淡值或灰度值变为离散的值(整数值)的操作就是量化。
如果把这些连续变化的值(灰度值)量化为8bit,则灰度值被分成0-2552的256个级别,分别对应于各个灰度值的浓淡程度,叫做灰度等级或灰度标度。
在0-255的值对应于白-黑的时候,有以0为白,255为黑的方法,也有以0为黑,255为白0的方法,这取决于图像的输入方法以及用什么样的观点对图像进行处理等,这是在编程时应特别注意的问题。
但在只有黑白二值的二值图像的情形,一般设0为白,1为黑。
对连续的灰度值赋予量化级的,即灰度值方法有:
均匀量化(uniformquantization),线性量化(linerquantization),对数量化,MAX量化,锥形量化(taperedquantization)等。
3.采样、量化和图像细节的关系
上面的数字化过程,需要确定数值N和灰度级的级数K。
在数字图像处理中,一般都取成2的整数幂,即:
一幅数字图像在计算机中所占的二进制存储位数b为:
例如,灰度级为256级(m=8)的512×
512的一幅数字图像,需要大约210万个存储位。
随着N和m的增加,计算机所需要的存储量也随之迅速增加。
由于数字图像是连续图像的近似,从图像数字化的过程可以看到。
这种近似的程度主要取决于采样样本的大小和数量(N值)以及量化的级数K(或m值)。
N和K的值越大,图像越清晰。
2.2数字图像在计算机内的处理
设一幅图像f(x,y),我们若对它作等间隔的采样,在x,y方向上都取N个采样点,总共为N×
N个图像点。
每一像素f
(i,1=0,1,2,…N-1)就是
点的灰度值。
形成离散化了的坐标和灰度值可以用一个矩阵来表示,其行和列的交点标出图像的每个像素,该数字图像矩阵可表示为图2-2
图2-2数字图像矩阵
在计算机中对数字图像进行处理时,实质上就是在对量化后的矩阵进行处理。
从原理上将,传统的彩色图像分析是基于RGB色彩空间的,但是RGB空间是颜色显示空间,并不适合人的视觉特性,对目标物体的颜色模式描述复杂,各个分量之间冗余信息多,计算量大,而HSV空间通过对RGB颜色进行变换,能体现人眼辨别颜色特点。
在HSV空间,图像特征明显,易于进行边缘检测,分割和目标识别处理。
颜色可用明度、色调和饱和度来描述,人眼看到的任一颜色都是这三个特性的综合效果。
明度是光作用于人眼时所引起的明亮程度的感觉,它与被观察物体的发光强度有关,由于其强度不同,看起来可能亮一些或暗一些。
色调是当人眼看到一种或多种波长的光时所产生的彩色感觉,不同的波长产生不同的颜色感觉,如红、橙、黄、绿、青、蓝、紫等。
色调是彩色的最重要的属性,是彩色光在“质”方面的特征。
如某物体在白光下呈现绿色,是因为它仅反射了绿色光分量。
饱和度是指颜色的纯度,即掺入白色光的程度,饱和度的高低决定于彩色光中混入的白色光数量,白色光愈少,饱和度越高。
饱和度是彩色光在“量”的方面的特征。
人眼大概能识别128种不同的色调和130种不同的色泽(色饱和度级)。
2.3数字图像处理概述
数字图像处理的英文名称是”DigitalImageProcessing”。
通常所说的数字处理是指用计算进行的处理,因此也称计算机图像处理(ComputerImageProcessing)。
总的来说,数字图像处理包括以下几项内容:
(1)点运算
点运算主要是针对图像的象素进行加、减、乘、除等运算。
图像的点运算可以有效的改善图像的直方图分布,这对提高图像的分辨率以及图像的均衡都是非常有益的。
(2)几何处理
几何处理主要包括图像的坐标变换、图像的移动、缩小、放大、旋转、多个图像的配准以及图像的扭曲校正等。
几何处理是最常见的图像处理手段,几乎任何图像处理软件都提供了最基本的图像缩放功能。
(3)图像增强
图像增强的作用最主要是突出图像中最重要的信息,同时减弱或除去不重要的信息。
常用的方法有直方图增强和伪彩色增强等。
(4)图像复原
图像复原的主要目的是去除干扰和模糊,从而恢复图像的本来面目。
例如去除噪声复原处理。
(5)图像形态学处理
图像形态学是数学形态学的延伸,是一门独立的研究学科。
利用图像形态学技术,可以实现图像的腐蚀、细化和分割等效果。
(6)图像编码
图像编码研究属于信息论中信源编码的范畴,其主要宗旨是利用图像信息的统计特性及人类的视觉特性对图像进行高效编码,从而达到压缩图像的目的。
(7)图像重建
图像重建是一门新兴的数字图像处理技术,主要是利用采集的数据来重建出图像。
其主要算法有代数法、迭代法、傅立叶反投影法和使用最广泛的卷积反投影法等。
(8)模式识别
模式识别也是数字图像处理的一个新的研究方向。
当今的模式识别方法通常有三种:
统计识别法、句法结构模式识别法和模糊识别法。
本文所讨论的数字图像缩放技术主要是图像分辨率的变换,属于数字图像的几何处理的范畴。
3.数字图像文件格式
3.1BMP格式
BMP(Bitmap-File)图形文件是Windows采用的图形文件格式,在Windows环境下运行的所有图象处理软件都支持BMP图像文件格式。
Windows系统内部各图像绘制操作都是以BMP为基础的。
Windows3.0以前的BMP图片文件格式与显示设备有关,因此把这种BMP图像文件格式称为设备相关位图DDB(device-dependentbitmap)文件格式。
Windows3.0以后的BMP图像文件与显示设备无关,因此把这种BMP图像文件格式称为设备无关位图DIB(device-independentbitmap)格式(注:
Windows3.0以后,在系统中仍然存在DDB位图,像BitBlt()这种函数就是基于DDB位图的,只不过如果你想将图像以BMP格式保存到磁盘文件中时,微软极力推荐你以DIB格式保存),目的是为了让Windows能够在任何类型的显示设备上显示所存储的图像。
BMP位图文件默认的文件扩展名是BMP或者bmp(有时它也会以.DIB或.RLE作扩展名)。
DRM的基本原理就是通过对明文媒体的媒体文件进行加密,然后通过安全的技术手段把解密密钥及加密后的媒体文件传送给正确的用户终端。
为了对多样化的业务提供计费及管理的支持,DRM增加了授权环节。
用户终端需要获得授权才能使用解密密钥进行解密。
BMP是一种与硬件设备无关的图像文件格式,使用非常广。
它采用位映射存储格式,除了图像深度可选以外,不采用其他任何压缩,因此,BblP文件所占用的空间很大。
BMP文件的图像深度可选lbit、4bit、8bit及24bit。
BMP文件存储数据时,图像的扫描方式是按从左到右、从下到上的顺序。
由于BMP文件格式是Windows环境中交换与图有关的数据的一种标准,因此在Windows环境中运行的图形图像软件都支持BMP图像格式。
BMP位图文件包括4部分,即位图文件头结构(BITMAPFILEHEADER)、位图信息头结构(BITMAPINFOHEADER)、位图颜色表(RGBQUAD)和位图像素数。
如图3-1BMP位图文件的结构。
。
图3-1BMP位图文件的结构
3.2JPEG格式
JPEG是JointPhotographicExpertsGroup(联合图像专家组)的缩写,文件后辍名为"
.jpg"
或"
.jpeg"
,这个名称代表JointPhotographicExpertsGroup(联合图像专家小组)。
JPEG本身只有描述如何将一个影像转换为字节的数据串流(streaming),但并没有说明这些字节如何在任何特定的储存媒体上被封存起来。
.jpeg/.jpg是最常用的图像文件格式,由一个软件开发联合会组织制定,是一种有损压缩格式,能够将图像压缩在很小的储存空间,图像中重复或不重要的资料会被丢失,因此容易造成图像数据的损伤。
尤其是使用过高的压缩比例,将使最终解压缩后恢复的图像质量明显降低,如果追求高品质图像,不宜采用过高压缩比例。
但是JPEG压缩技术十分先进,它用有损压缩方式去除冗余的图像数据,在获得极高的压缩率的同时能展现十分丰富生动的图像,换句话说,就是可以用最少的磁盘空间得到较好的图像品质。
而且JPEG是一种很灵活的格式,具有调节图像质量的功能,允许用不同的压缩比例对文件进行压缩,支持多种压缩级别,压缩比率通常在10:
1到40:
1之间,压缩比越大,品质就越低;
相反地,压缩比越小,品质就越好。
比如可以把1.37Mb的BMP位图文件压缩至20.3KB。
当然也可以在图像质量和文件尺寸之间找到平衡点。
JPEG格式压缩的主要是高频信息,对色彩的信息保留较好,适合应用于互联网,可减少图像的传输时间,可以支持24bit真彩色,也普遍应用于需要连续色调的图像。
JPEG格式是目前网络上最流行的图像格式,是可以把文件压缩到最小的格式,在Photoshop软件中以JPEG格式储存时,提供11级压缩级别,以0—10级表示。
其中0级压缩比最高,图像品质最差。
即使采用细节几乎无损的10级质量保存时,压缩比也可达5:
1。
以BMP格式保存时得到4.28MB图像文件,在采用JPG格式保存时,其文件仅为178KB,压缩比达到24:
经过多次比较,采用第8级压缩为存储空间与图像质量兼得的最佳比例。
JPEG格式的应用非常广泛,特别是在网络和光盘读物上,都能找到它的身影。
目前各类浏览器均支持JPEG这种图像格式,因为JPEG格式的文件尺寸较小,下载速度快。
JPEG2000作为JPEG的升级版,其压缩率比JPEG高约30%左右,同时支持有损和无损压缩。
JPEG2000格式有一个极其重要的特征在于它能实现渐进传输,即先传输图像的轮廓,然后逐步传输数据,不断提高图像质量,让图像由朦胧到清晰显示。
此外,JPEG2000还支持所谓的"
感兴趣区域"
特性,可以任意指定影像上感兴趣区域的压缩质量,还可以选择指定的部分先解压缩。
在有些情况下,图像中只有一小块区域对用户是有用的,对这些区域,采用低压缩比,而感兴趣区域之外采用高压缩比,在保证不丢失重要信息的同时,又能有效地压缩数据量,这就是基于感兴趣区域的编码方案所采取的压缩策略。
其优点在于它结合了接收方对压缩的主观需求,实现了交互式压缩。
而接收方随着观察,常常会有新的要求,可能对新的区域感兴趣,也可能希望某一区域更清晰些。
JPEG2000和JPEG相比优势明显,从无损压缩到有损压缩可以兼容,而JPEG不行,JPEG的有损压缩和无损压缩是完全不同的两种方法。
JPEG2000即可应用于传统的JPEG市场,如扫描仪、数码相机等,又可应用于新兴领域,如网路传输、无线通讯等等。
JPEG(JointPhotographicExpertsGroup)是在国际标准化组织(ISO)领导之下制定静态图像压缩标准的委员会,第一套国际静态图像压缩标准ISO10918-1(JPEG)就是该委员会制定的。
由于JPEG优良的品质,使他在短短几年内获得了极大的成功,被广泛应用于互联网和数码相机领域,网站上80%的图像都采用了JPEG压缩标准。
然而,目前的JPEG静止图像压缩标准,具有中端和高端比特速率上的良好的速率畸变特性,但在低比特率范围内,将会出现很明显的方块效应,其质量变得不可接受。
JPEG不能在单一码流中提供有损和无损压缩,并且不能支持大于64×
64K的图像压缩。
同时,尽管当前的JPEG标准具有重新启动间隔的规定,但当碰到比特差错时图像质量将受到严重的损坏。
针对这些问题,自1997年3月起,JPEG图像压缩标准委员会开始着手制定新一代的图像压缩标准以解决上述问题。
2000年3月的东京会议,确定了彩色静态图像的新一代编码方式JPEG2000图像压缩标准的编码算法。
JPEG格式又可分为标准JPEG、渐进式JPEG及JPEG2000三种格式:
1.标准JPEG格式:
此类型图档在网页下载时只能由上而下依序显示图片,直到图片资料全部下载完毕,才能看到全貌。
2.渐进式JPEG格式:
渐进式JPG为标准JPG的改良格式,可以在网页下载时,先呈现出图片的粗略外观后,再慢慢地呈现出完整的内容(就像GIF格式的交错显示),而且存成渐进式JPG格式的档案比存成标准JPG格式的档案要来得小,所以如果要在网页上使用图片,可以多用这种格式。
3.JPEG2000格式:
新一代的影像压缩法,压缩品质更好,并可改善无线传输时,常因讯号不稳造成马赛克及位置错乱的情况,改善传输的品质。
此外,以往浏览线上地图时总要花许多时间等待全图下载,JPEG2000格式具有RandomAccess的特性,可让浏览者先从伺服器下载10%的图档资料,在模糊的全图中找到需要的部分后,再重新下载这部分资料即可,如此一来可以大幅缩短浏览地图的时间。
3.3TIFF格式
标签图像文件格式(TaggedImageFileFormat,简写为TIFF)是一种主要用来存储包括照片和艺术图在内的图像的文件格式。
它最初由Aldus公司与微软公司一起为PostScript打印开发。
TIFF与JPEG和PNG一起成为流行的高位彩色图像格式。
TIFF格式在业界得到了广泛的支持,如Adobe公司的Photoshop、Jasc的GIMP、UleadPhotoImpact和PaintShopPro等图像处理应用、QuarkXPress和AdobeInDesign这样的桌面印刷和页面排版应用,扫描、传真、文字处理、光学字符识别和其它一些应用等都支持这种格式。
从Aldus获得了PageMaker印刷应用程序的Adobe公司现在控制着TIFF规范。
术语“TaggedImageFileFormat”或者“TagImageFileFormat”在一些早期的TIFF规范中是作为副标题存在的。
目前的TIFF规范TIFF6.0不再使用这些术语,现在的名字仅仅叫做“TIFF”。
TIFF最初的设计目的是为了1980年代中期桌面扫描仪厂商达成一个公用的扫描图像文件格式,而不是每个厂商使用自己专有的格式。
在刚开始的时候,TIFF只是一个二值图像格式,因为当时的桌面扫描仪只能处理这种格式。
随着扫描仪的功能越来越强大,并且桌面计算机的磁盘空间越来越大,TIFF逐渐支持灰阶图像和彩色图像。
TIFF是TaggedImageFileFormat(标记图像文件格式)的缩写,此种文件格式是由Aldus和Microsoft公司为扫描仪和台式计算机出版软件开发的,是用来为存储黑白图像,灰度图像和彩色图像而定义的存储格式,现在己经成为出版多媒体CD-ROM中的一个重要文件格式。
虽然TIFF格式的历史比其它的文件格式长一些,但现在仍是使用最广泛的行业标准位图文件格式,这主要是由于TIFF格式的规格经过多次改进。
TIFF位图可具有任何大小的尺寸和分辨率。
在理论上它能够有无限位深,即:
每样本点1-8位、24位、32位(CMYK模式)或48位(RGB模式)。
TIFF格式能对灰度、J健、CMYK模式、索引颜色模式或RGB模式进行编码。
它能被保存为压缩和非压缩的格式。
几乎所有工作中涉及位图的应用程序,都能处理TIFF文件格式——无论是置入、打印、修整还是编辑位图。
TIFF的规范允许使用CMYK和RGB这两种颜色模式,即可将图像分成4种套印颜色,并且将分色前的图像保存为TIFF格式。
将TIFF格式文件置入页面版式设计或相似程序肘,就不要求做进一步的分色。
当印刷青色印版的时候,程序只是简单地拉住青色通道;
印刷红色印版的时候,只是简单地拉住品红色通道即可;
依次类推。
TIFF格式也可保存索引颜色位图,但是很少有人这么做。
对索引颜色图像,更多的时候是选择使用GIF格式。
TIFF格式可包含压缩和非压缩象素数据。
压缩方法(LZW)是非损失性的(图像的数据没有减少,即信息在处理过程中不会损失),能够产生大约2:
1的压缩比,可将原稿文件消减到一半左右。
TIFF格式现在的版本支持高分辨率颜色,它把一幅图像的不同部分分成块状,或者说是数据块。
对于每个块状部分,都保存了一个标志,其中提供了块状看起来是什么样的信息。
块状的优点是支持TIFF格式的软件包只需要保存当前显示在屏幕上的那部分图像。
而没有在屏幕上显示的图像部分还保存在硬盘上,等到需要时才装入内存。
当编辑一幅非常大的高分辨率图像时,这一特性就很重要。
在TIFF文件