数字图像基本变换毕业设计资料Word文档格式.docx

资源描述

数字图像基本变换毕业设计资料Word文档格式.docx

《数字图像基本变换毕业设计资料Word文档格式.docx》由会员分享，可在线阅读，更多相关《数字图像基本变换毕业设计资料Word文档格式.docx（26页珍藏版）》请在冰豆网上搜索。

数字图像基本变换毕业设计资料Word文档格式.docx

0文献综述

0.1本文的研究背景

当今社会是信息社会，各种媒体交互存在，而图像在其中又占据了重要的地位。

图像具有包容信息量大、直观、容易理解以及吸引人注意力等优点，是人们感知外部世界的最主要的载体，人们的生活和工作已经离不开图像。

图像有模拟图像和数字图像之分[1]。

模拟图像一般用摄像机、传统的照相机等获取，模拟图像大多可以用一个连续函数来描述，所以模拟图像处理也称为“连续图像处理”，其处理过程主要借助于光学、化学等技术方法和相应的设备，对图像进行加工和处理。

例如在暗房中对底片进行变形矫正、放大、遮拦、着色、虚化、浮雕化、剪裁等。

模拟图像处理精度较差，处理方式不够灵活，处理时间过长。

数字图像是用二进制来表示图像的，是离散的数据集，可以通过数码相机等数字设备来获取。

数字图像处理对象是数字图像，是由一组具有颜色、亮度等被称为像素的点组成的集合[2]。

数字图像的特点决定了数字图像处理的灵活性，并且以其强大的功能成为当今图像处理技术的主流。

由于以前获取的大部分都是模拟图像，如果想把这些模拟图像转化为数字图像，并用现在先进的数字图像处理技术进行处理，可以通过模数转化器（ADC）将模拟图像信号转换为数字图像信号存储到计算机中进行各种处理和显示，这称为模拟图像数字化，例如可以通过扫描仪把普通照片数字化并存储到计算机中。

通过模拟数字化可以将以前宝贵的模拟图像转化为数字图像，这样就可以利用现在多样的数字图像处理技术进行处理，避免了资源的浪费。

数字图像处理技术研究内容很多，包括以下几个方面：

图像变换、图像编码压缩、图像增强和复原、图像分割、图像描述、图像识别等。

数字图像处理具有再现性好、处理精度高、适用面广、灵活性高、成本低等优点。

数字图像的应用领域涉及到人类生活的方方面面，例如航天和航空领域、生物医学领域、通信工程、工业和工程、军事与安全、文化艺术等。

0.2国内外图像几何变换的研究现状

我们在处理图像时往往会遇到需要对图像进行几何变换的一些问题。

图像的几何变换时图像处理和图像分析的基础内容之一，它不仅提供了产生某些图像的可能，而且还可以使图像处理和分析的程序简单化，特别是图像具有一定的规律性时，一个图像可以由另一个图像通过几何变换来实现。

所以，为了提高图像处理和分析程序设计的速度和质量，开拓图像程序应用范围的新领域，对图像进行几何变换是十分必要的。

图像的几何变换不改变图像的像素值，而是改变像素所在的几何位置[3]。

从变换的性质分，图像的几何变换有图像的位置变换（平移、镜像、旋转）、图像的形状变换（放大、缩小、错切）等基本变换以及图像的复合变换等。

其中使用最频繁的是图像的缩放和旋转，不论照片、图画、书报，还是医学X光和卫星遥感图像都会用到这两项技术。

在图像几何变换中的平移、转置、镜像操作变换中，输出图像的每一个像素点在输入图像中都有一个具体的像素点与之对应。

但是，在缩放操作中，输出图像像素点坐标可能对应于输入图像上几个像素点之间的位置，这个时候就需要通过灰度差值处理来计算出该输出点的灰度值。

图像差值是图像超分辨处理的重要环节，不同的插值算法有不同的精度，插值算法的好坏也直接影响到图像的失真程度。

数字图像放大的方法多种多样，常用的有Dube、COK、bilinear、bicubie、KR和NEDI等等，KR、NRDI和Dube算法虽然放大效果优秀，但是算法复杂度高，很难在实时应用中使用，COV和bilinear等算法虽然较为简单，但是效果差，难以满足要求。

所以，如何在保证一定的放大效果的情况下降低图像放大算法的复杂度，使之在实时应用中得到使用，是数字图像处理领域的一个研究目标。

1引言

1.1数字图像概述

1.1.1数字图像

用计算机进行图像处理的前提是图像必须以数字格式存储，我们把以数字格式存放的图像称之为数字图像。

常见的各种照片、图片、海报、广告画等均属模拟图像，要将模拟图像数字化后生成数字图像，需要利用数字化设备。

目前，将模拟图像数字化的主要设备是扫描仪，将视频画面数字化的设备有图像采集卡。

当然，也可以利用数码照相机直接拍摄以数字格式存放的数字图像。

模拟图像经扫描仪进行数字化或由数码相机拍摄的自然景物图像，在计算机中均是以数字格式存储的。

既然是数字，计算机当然可以方便地进行各种处理，以达到视觉效果和特殊效果。

在计算机中，图像被分割成如下所示的像素（Pixel），各像素的灰度值用整数表示。

一幅

个像素的数字图像，其像素灰度值可以用

行、

列的矩阵

表示：

1.1.2数字图像处理

数字计算机最擅长的莫过于处理各种数据，数字化的图像可以看成是存储在计算机中的有序数据，当然可以通过计算机对数字图像进行处理。

我们把利用计算机对图像进行去除噪声、增强、复原、分割、提取特征等的理论、方法、和技术称为数字图像处理（DigitalImageProcessing）。

一般，图像处理是用计算机和实时硬件实现的，因此也称为计算机图像处理（ComputerDigitalImageProcessing）。

在日常生活中，图像处理已经得到广泛应用。

例如，电脑人像艺术，电视中的特殊效果，自动售货机钞票的识别，邮政编码的自动识别和利用指纹、虹膜、面部等特征的身份识别等。

在医学领域，很早以前就采用X射线透视、显微镜照片等来诊断疾病。

现在，计算机图像处理已成为疾病诊断的重要手段，用一般摄影方法不能获取的身体内部的状况，也能由特殊的图像处理装置获取，最具代表性的就是X射线CT（ComputerizedTomograph）。

数字图像处理的产生和迅速发展主要受如下三个方面的影响。

一是计算机的发展。

早期的计算机无论在计算速度或存储容量方面，难于满足对庞大图像数据进行实时处理的要求。

随着计算机硬件技术及数字化技术的发展，计算机、内存及外围设备的价格急剧下降，而其性能却有了大幅度提高。

过去只能用大型计算机完成的庞大处理，现在，在个人计算机上也能够轻而易举地实现。

二是数学的发展，特别是离散数学理论的创立和完善，为数字图像处理奠定了理论基础。

三是军事、医学和工业等方面应用需求的不断增长。

自20世纪20年代以来，图像处理首次应用于改善伦敦和纽约之间海底电缆发送的图片质量以来，经过几十年的研究与发展，数字图像处理的理论和方法进一步完善，应用范围更加广阔，已经成为一门新兴的学科，并在向更高级的方向发展。

如在景物理解和计算机视觉（机器视觉）方面，图像处理已由二维处理发展到三维理解或解释。

近几年来，随着计算机和各个相关领域研究的迅速发展，科学计算可视化、多媒体技术等研究和应用的兴起，数字图像处理从一个专门领域的学科，变成了一种新型的科学研究和人机界面的工具。

目前数字图像处理技术已成为计算机科学、信息科学、生物学、医学等学科研究的热点。

这是因为图像处理学科不仅可以促进人类的进步，还可以带来巨大的经济和社会效益。

1.2数字图像处理的特点及目的

1.2.1数字图像处理的特点

数字图像处理是利用计算机的计算功能，实现与光学系统模拟处理相同效果的过程。

数字图像处理具有如下特点：

（1）处理精度高，再现性好。

利用计算机进行图像处理，其实质是对图像数据进行各种运算。

由于计算机技术的飞速发展，计算精度和计算的正确性都毋庸置疑；

另外，对同一图像用相同的方法处理多次，也可得到完全相同的效果，具有良好的再现性。

（2）易于控制处理效果。

在图像处理程序中，可以任意设定或变动各种参数，能有效控制处理过程，达到预期处理效果。

这一特点在改善图像质量的处理中表现更为突出。

（3）处理的多样性。

由于图像处理是通过运行程序进行的，因此，设计不同的图像处理程序，可以实现各种不同的处理目的。

（4）图像数据量庞大。

图像中包含有丰富的信息，可以通过图像处理技术获取图像中包含的游泳的信息，但是，数字图像的数据量具大，一幅数字图像是由图像矩阵中的像素组成的，通常每个像素用红、绿、蓝三种颜色表示，每种颜色用8bit表示灰度级。

则一幅1024×

1024不经压缩的真彩色图像，数据量达3MB（即1024×

1024×

8bit×

3=24Mb）。

如此庞大的数据量给存储、传输和处理都带来巨大的困难。

如果精度及分辨率再提高，所需处理时间将大幅度增加。

（5）处理费时。

由于图像数据量大，因此处理比较费时。

特别是处理结果与中心像素邻域有关的处理过程花费时间更多。

（6）图像处理技术综合性强。

数字图像处理涉及的技术领域相当广泛，如通信技术、计算机技术、电子技术、电视技术等，当然，数学、物理学等领域更是数字图像处理的基础。

1.2.2数字图像处理的目的

一般来说，对图像进行加工和分析主要有如下三方面的目的：

（1）提高图像的视感质量，以达到赏心悦目的目的。

如去除图像中的噪声，改变图像的亮度、颜色，增强图像中的某些成份、抑制某些成份，对图像进行几何变换等，从而改善图像的质量，以达到或真实的、或清晰的、或色彩丰富的、或意想不到的艺术效果。

（2）提取图像中所包含的某些特征或特殊信息，以便于计算机分析，例如，常用作模式识别、计算机视觉的预处理等。

这些特征包括很多方面，如频域特性、灰度/颜色特性、边界/区域特性、纹理特性、形状/拓扑特性以及关系结构。

（3）对图像数据进行变换、编码和压缩，以便于图像的存储和传输。

1.3开发语言的选择

图形图像的处理的时间消耗较一般算法多，提高处理效率很有必要，因此选择合适的语言进行算法的描述显得尤为重要。

本文选择VisualC++，其主要优势在于以下三个方面：

（1）执行效率高。

C++的执行代码经过编译后生成的是汇编语言，它可以直接在处理器上运行，因此它的执行效率较高。

（2）较高的灵活度。

指针是C++的一种特殊的数据类型，能够获取和直接操纵地址，实现动态存储分配内存。

掌握指针就能更有效地使用内存空间，C++中指针的使用，很大幅度上提高了编程的灵活度。

（3）提高了内存使用效率。

对于图形图像数据的处理而言，大量信息的图像数据处理需要占用较大的内存，而计算机内存是有限的。

在相对有限的内存空间，必须更有效的使用才能比较好地完成数据处理运算。

由于C++语言支持对内存的直接分配和释放，提高了内存的使用效率，也大大提高了图像处理效率。

2数字图像处理的简介

2.1什么是数字图像

简单地说，数字图像就是能够在计算机上显示和处理的图像，根据其特性可以分为两大类——位图和矢量图。

位图通常使用数字阵列来表示，常见格式有BMP、JPG、GIF等；

矢量图由矢量数据库表示。

我们接触的最多的就是PNG图形。

我们可以将一幅图像视为一个二维函数f（x，y），其中x和y是空间坐标，而在x-y平面中的任意一对空间坐标（x，y）上的幅值f称为该点图像的灰度、亮度或强度。

此时，如果f、x、y均为非负有限离散，则称该图像为数字图像（位图）。

一个大小为M×

N的数字图像是由M行N列的有限元素组成的，每个元素都有特定的位置和幅值，代表了其所在行列位置上的图像物理信息，如灰度和色彩等。

这些元素称为图像元素或像素。

2.2数字图像的显示

不论是CRT显示器还是LCD显示器，都是由许多点构成的，显示图像时这些点对应图像的像素，显示器被称为位映像设备。

所谓位映像，就是一个二维的像素矩阵，而位图则采用位映像方法显示和存储的图像。

当一幅数字图像被放大后就可以明显看出图像是由很多方格形状的像素构成的。

2.3数字图像的分类

根据每个像素所代表信息的不同，可将图像分为二值图像、灰度图像、RGB图像以及索引图像等。

（1）二值图像

每个像素只有黑、白两种颜色的图像称为二值图像。

在二值图像中，像素只有0和1两种取值，一般用0来表示黑色，用1表示白色。

（2）灰度图像

在二值图像中进一步加入许多介于黑色和白色之间的颜色深度，就构成了

灰度图像。

这类图像通常显示为从最暗黑色到最亮的白色的灰度，每种灰度（颜色深度）成为一个灰度级，通常用L表示。

在灰度图像中，像素可以取0~L—1之间的整数值，根据保存灰度数值所使用的数据类型的不同，可能有256种取值或者

种取值，当k=1时即退化为二值图像。

（3）RGB图像

众所周知，自然界中几乎所有颜色都可以由红（Red，R）、绿（Green，G）、蓝（Blue，B）3种颜色组合而成，通常称它们为RGB三原色。

计算机显示彩色图像时采用最多的就是RGB模型。

对于每个像素，通过控制R、G、B三原色的合成比例则可决定该像素的最终显示颜色。

对于三原色RGB中的每一种颜色，可以像灰度图那样使用L个等级来表示含有这种颜色成分的多少。

例如对于含有256个等级的红色，0表示不含红色成分，255表示含有100%的红色成分。

同样绿色和蓝色也可以划分为256个等级。

这样每种原色可以用8位二进制数据表示，于是3原色总共需要24位二进制数，这样能够表示出的颜色种类数目为256×

256×

256=

，大约有1600万种，已经远远超过普通人所能分辨出的颜色数目。

未经压缩的原始BMP文件就是使用RGB标准给出的3个数值来存储图像数据的，称为RGB图像。

在RGB图像中每个像素都是用24位二进制数表示，故也称为24位真色彩图像。

（4）索引图像

如果对每个像素都直接使用24位二进制数表示，图像文件的体积将变得十分庞大。

举个例子，对一个长、宽各为200像素，颜色数为16的彩色图像，每个像素都用RGB3个分量表示，这样每个像素由3个字节表示，整个图像就是200×

200×

3=120kB。

这种完全未经压缩的表达方式，浪费了大量的存储空间，下面介绍一种更节省空间的存储方式：

索引图像。

同样还是200像素×

200像素的16色图像，由于这张图片中最多只有16种颜色，那么可以使用一张颜色表（16×

3的二维数组）保存这16种颜色对应的RGB值，在表示图像的矩阵中使用这16种颜色在颜色表中的索引（偏移量）作为数据写入相应的行列位置。

3VC++的图像处理简介

3.1位图文件及其C++操作

Windows操作系统中使用最多的图形文件格式就是位图格式，最常见的位图文件的扩展名为BMP。

BMP是英文Bitmap（位图）的简写，这种格式的特点是包含的图像信息较丰富，几乎不进行压缩，因此占用的磁盘空间较大。

3.1.1设备无关位图

Windows3.0以后的BMP位图文件格式与显示设备无关，因此把这种BMP位图文件称为设备无关位图（deviceindependentbitmap，DIB）。

DIB自带颜色信息，因此调色板管理非常简单。

现在，任何Windows操作系统的计算机都能够显示和处理DIB，它通常以BMP文件的形式被把保存在磁盘中。

3.1.2BMP图像文件数据结构

典型的BMP图像文件由以下4部分组成，如图3.1所示。

（1）位图文件头数据结构BITMAPFILEHEADER,包含BMP图像文件的类型、显示内容等信息。

（2）位图信息头数据结构BITMAPINFOHEADER，包含有BMP图像的宽、高、压缩方法以及定义颜色等信息。

（3）调色板，即颜色索引表。

（4）实际的位图数据。

1．位图文件BITMAPFILEHEADER结构

位图文件头BITMAPFILEHEADER的定义可以再MFCLibrary中找到，这部分文件头包含了文件的类型、大小以及设备无关位图的图像文件布局。

图3.1BMP文件的组成

Fig.3.1thecompositionofBMPfile

BITMAPFILEHEADER结构体长度固定，为14字节，其定义和描述如下：

typedefstructtagBITMAPFILEHEADER{

WORDbfType;

DWORDbfSize;

WORDbfReserved1;

WORDbfReserved2;

DWORDbfOffBits;

}BITMAPFILEHEADER,*PBITMAPFILEHEADER；

各个域的说明如下：

bfType：

指定文件类型，必须是0x424D，即字符串“BM”，也就是说所有“.bmp”文件的头两个字节都是“BM”。

bfSize：

指定文件大小，包括这14个字。

bfReserved1，bfReserved2：

为保留字，不用考虑。

bfOffBits：

为从文件头到实际的位图数据的偏移字节数，即下图中前三个部分的和。

2．位图信息头BITMAPINFOHEADER结构

BITMAPINFOHEADER结构体包含了设备无关位图关于颜色维度和色彩格式的信息，其定义和描述如下：

typedefstructtagBITMAPINFOHEADER{

DWORDbiSize；

LONGbiWidth；

LONGbiHeight；

WORDbiPlanes；

WORDbiBitCount；

DWORDbiCompression；

DWORDbiSizeImage；

LONGbiXPelsPerMeter；

LONGbiYPelsPerMeter；

DWORDbiClrUsed；

DWORDbiClrImportant；

}BITMAPINFOHEADER，*PBITMAPINFOHEADER

该结构的长度也是固定的，为40个字节。

biSize：

指定这个结构的长度，为40字节。

biWidth：

指定图像的宽度，单位是像素。

biHeight：

指定图像的高度，单位是像素。

biPlanes：

必须是1，不用考虑。

biBitCount：

指定表示颜色时要用到的位数，常用的值为1（黑白二色图）、4（16色图）、8（256色）、24（真彩色），新的“.bmp”格式支持32位色，这里就不做讨论了。

biCompression：

指定位图是否压缩，有效的值为BI-RGB，BI-RLE8，BI-RLE4，BI-BITFIELDS（都是Windows定义好的常量）。

要说明的是，Windows位图可以采用RLE4和RLE8的压缩格式，但用的不多。

今后所讨论的只有第一种不压缩的情况，即biCompression为BI-RGB的情况。

biSizeImage：

指定实际的位图数据占用的字节数。

biXPelsPerMeter：

指定目标设备的水平分辨率，单位是像素/米。

biYPelsPerMeter：

指定目标设备的垂直分辨率，单位是像素/米。

biClrUsed：

指定本图像实际用到的颜色数，如果该项为0，则用到的颜色数为2的biCompression次幂。

biClrImportant：

指定本图像中重要的颜色数，如果该值为0，则认为所有的颜色都是重要的。

3．调色板结构

有些位图需要调色板，有些位图，如真彩色图，不需要调色板，它们的BITMAPINFOHEADER后面直接是位图数据。

调色板实际上是一个数组，共有biClrUsed个元素（如果该值为0，则有2的biBitCount次幂个元素）。

数组中每个元素的类型是一个RGBQUAD结构，占4个字节，其定义如下：

typedefstructtagRGBQUAD

BYTErgbBlue;

BYTErgbGreen;

BYTErgbRed;

BYTErgbReserved;

}RGBQUAD;

其中：

rgbBlue：

该颜色的蓝色分量。

rgbGreen：

该颜色的绿色分量。

rgbRed：

该颜色的红色分量。

rgbReserved：

保留值。

4．实际位图结构

实际位图数据是一片连续的存储区域，其中保存着图像中每个像素的灰度（颜色）信息。

对于256色灰度图像，图像数据就是该像素的实际灰度，1个像素需要1个字节来表示；

对于索引图像，图像数据就是该像素颜色在调色板中的索引值；

而对于真色彩图，图像数据就是实际的RGB值，1个像素需要3个字节来表示。

3.2CImg类

CImg类的主要成员如表3.1所示。

CImg类拥有两个公有成员：

BITMAPINFOHEADER*m_pBMIH;

LPBYTE*m_lpData;

其中，m_pBMIH中保存的是图像的

展开阅读全文