西安交大数字图像处理第一次作业.docx
《西安交大数字图像处理第一次作业.docx》由会员分享,可在线阅读,更多相关《西安交大数字图像处理第一次作业.docx(22页珍藏版)》请在冰豆网上搜索。
西安交大数字图像处理第一次作业
数字图像处理第一次作业
姓名:
班级:
学号:
提交日期:
2015年3月13日
摘要
本次报告首先简单阐述了BMP图像格式及其相关数据结构,随后主要完成了作业要求中关于图像处理与计算的各项任务。
本次作业以Matlab2014为平台,通过对lena.bmp,elain.bmp图像文件的编程处理,分别得到了lena.bmp图像的8到1级灰度逐级递减显示,lena.bmp图像的均值和方差,通过近邻、双线性和双三次插值法对lena.bmp进行4倍放大后得到的2048×2048尺寸图像,和对lena.bmp、elain.bmp图像分别进行水平偏移变换和旋转变换后的图像及其4倍插值放大图像。
以上任务完成后均得到了预期的结果。
1.Bmp图像格式简介。
1.1BMP格式概述
BMP(全称Bitmap)是Windows操作系统中的标准图像文件格式,可以分成两类:
设备相关位图(DDB)和设备无关位图(DIB),使用非常广。
它采用位映射存储格式,除了图像深度可选以外,不采用其他任何压缩,因此,BMP文件所占用的空间很大。
BMP文件的图像深度可选lbit、4bit、8bit及24bit。
BMP文件存储数据时,图像的扫描方式是按从左到右、从下到上的顺序。
1.2BMP格式组成
典型的BMP图像文件由四部分组成:
(1)位图头文件数据结构,它包含BMP图像文件的类型、显示内容等信息;
(2)位图信息数据结构,它包含有BMP图像的宽、高、压缩方法,以及定义颜色等信息;
(3)调色板,这个部分是可选的,有些位图需要调色板,有些位图,比如真彩色图(24位的BMP)就不需要调色板;
(4)位图数据,这部分的内容根据BMP位图使用的位数不同而不同,在24位图中直接使用RGB,而其他的小于24位的使用调色板中颜色索引值。
1.3BMP格式对应数据结构
BMP文件由文件头、位图信息头、颜色信息和图形数据四部分组成。
1.3.1BMP文件头(14字节)
BMP文件头数据结构含有BMP文件的类型、文件大小和位图起始位置等信息。
其结构定义如下:
typedefstructtagBITMAPFILEHEADER
{
WORDbfType;//位图文件的类型,必须为BM(1-2字节)
DWORDbfSize;//位图文件的大小,以字节为单位(3-6字节)
WORDbfReserved1;//位图文件保留字,必须为0(7-8字节)
WORDbfReserved2;//位图文件保留字,必须为0(9-10字节)
DWORDbfOffBits;//位图数据的起始位置,以相对于位图(11-14字节)
//文件头的偏移量表示,以字节为单位
}BITMAPFILEHEADER;
1.3.2位图信息头(40字节)
BMP位图信息头数据用于说明位图的尺寸等信息。
typedefstructtagBITMAPINFOHEADER{
DWORDbiSize;//本结构所占用字节数(15-18字节)
LONGbiWidth;//位图的宽度,以像素为单位(19-22字节)
LONGbiHeight;//位图的高度,以像素为单位(23-26字节)
WORDbiPlanes;//目标设备的级别,必须为1(27-28字节)
WORDbiBitCount;//每个像素所需的位数,必须是1(双色),(29-30字节)
//4(16色),8(256色)16(高彩色)或24(真彩色)之一
DWORDbiCompression;//位图压缩类型,必须是0(不压缩),(31-34字节)
//1(BI_RLE8压缩类型)或2(BI_RLE4压缩类型)之一
DWORDbiSizeImage;//位图的大小(其中包含了为了补齐行数是4的倍数而添加的空字节),以字节为单位(35-38字节)
LONGbiXPelsPerMeter;//位图水平分辨率,每米像素数(39-42字节)
LONGbiYPelsPerMeter;//位图垂直分辨率,每米像素数(43-46字节)
DWORDbiClrUsed;//位图实际使用的颜色表中的颜色数(47-50字节)
DWORDbiClrImportant;//位图显示过程中重要的颜色数(51-54字节)
}BITMAPINFOHEADER;
1.3.3颜色表
颜色表用于说明位图中的颜色,它有若干个表项,每一个表项是RGBQUAD类型的结构,定义一种颜色。
RGBQUAD结构的定义如下:
typedefstructtagRGBQUAD{
BYTErgbBlue;//蓝色的亮度(值范围为0-255)
BYTErgbGreen;//绿色的亮度(值范围为0-255)
BYTErgbRed;//红色的亮度(值范围为0-255)
BYTErgbReserved;//保留,必须为0
}RGBQUAD;
颜色表中RGBQUAD结构数据的个数有biBitCount来确定:
当biBitCount=1,4,8时,分别有2,16,256个表项;
当biBitCount=24时,没有颜色表项。
位图信息头和颜色表组成位图信息,BITMAPINFO结构定义如下:
typedefstructtagBITMAPINFO{
BITMAPINFOHEADERbmiHeader;//位图信息头
RGBQUADbmiColors[1];//颜色表
}BITMAPINFO;
1.3.4位图数据
位图数据记录了位图的每一个像素值,记录顺序是在扫描行内是从左到右,扫描行之间是从下到上。
位图的一个像素值所占的字节数:
当biBitCount=1时,8个像素占1个字节;
当biBitCount=4时,2个像素占1个字节;
当biBitCount=8时,1个像素占1个字节;
当biBitCount=24时,1个像素占3个字节,按顺序分别为B,G,R;
Windows规定一个扫描行所占的字节数必须是4的倍数(即以long为单位),不足的以0填充。
2.把lena512*512图像灰度级逐级递减8-1显示。
(1)问题分析:
本题中对图像进行的操作是直接灰度变换。
首先利用imread函数读入
lena512.bmp,得到图像的灰度矩阵I,之后对灰度矩阵中的每个元素进行操作,即阵
列操作。
将灰度矩阵的每个元素值除以二,取整后将结果转换为无符号8位数,既得
到灰度级为7的图像,最后利用imshow函数输出显示图像。
同理可得到灰度级为6-1
的图像。
对应源程序lena.m
(2)MATLAB函数:
A=imread(‘filename’)
用imread函数读取图像文件,文件格式可以是TIFF、JPEG、GIF、BMP、PNG。
读进来的是一个二维数组,存放在矩阵A中。
调用格式:
A=imread(filename,fmt)
[X,map]=imread(filename,fmt)
imshow(A)
imshow是matlab中显示图像的函数。
调用格式:
imshow(I,n)
imshow(I,[lowhigh])
用指定的灰度范围[lowhigh]显示灰度图像I。
显示结果,图像中灰度值等于或低于
low的都将用黑色显示,而灰度值大于等于high的都显示为白色,介于low和high之
间的用其灰度级的默认值的中间色调显示。
(3)处理结果:
8灰度级:
7灰度级:
6灰度级:
5灰度级:
4灰度级:
3灰度级:
2灰度级:
1灰度级:
(4)结果分析:
对一幅512*512,256个灰度级的具有较多细节的图像,保持空间分辨率不变,仅将灰度级数依次递减为128、64、32、16、8、4、2,比较得到的结果就可以发现灰度级数对图像的影响。
前四张图灰度级数较高,图像基本看不出什么变化。
当灰度级数继续降低,则在灰度缓变区常会出现一些几乎看不出来的非常细的山脊状结构。
灰度级数越低,越不能将图像的细节刻画出来。
对比实验中处理过的图像,可以发现,虽然都是灰度图,但是灰度范围越大则图像显示出的色彩越丰富。
3.计算lena512图像的均值方差。
(1)问题分析:
首先通过imread()函数读入图像文件到灰度矩阵A中,然后利用
mean2()函数和std2()函数计算灰度矩阵(即图像)的均值和标准差,再由标准
差平方得到方差。
对应源程序:
lena2.m
(2)MATLAB函数:
mean2()
MATLAB中提供均值计算函数mean()和mean2()。
mean2(A),用于对整一个矩
阵求像素平均值。
调用格式:
u=mean2(A)
std2()
MATLAB中提供标准差计算函数std()和std2()。
调用格式:
s=std2(A)
(3)处理结果:
均值u=95.6564方差s^2=1.9273e+03
(4)结果分析:
经过MATLAB运算,得到图像lena512.bmp的均值约为95.6564,标准差约为43.9012,方差是标准差的平方,约为1927.3。
方差越大,图像的对比度越大,可以显示的细节就越多。
4.把lena图像用近邻、双线性和双三次插值法zoom到2048*2048。
(1)问题分析:
插值算法是估计在图象像素间的某个位置的像素的取值方法。
最近邻点插值法:
在待插像素的周围四邻像素中,距离待求插像素最近的像素灰度赋给待插像素。
该方法最简单,但校正后存在灰度不连续性,图像有明显锯齿状。
双线性插值算法:
双线性插值算法输出的图像的每个像素都是原图中四个像素(2×2)运算的结果,这种算法极大地消除了锯齿现象。
双三次插值算法:
双三次插值算法是上一种算法的改进算法,它输出图像的每个像素都是原图16个像素(16×16)运算的结果。
这种算法是一种很常见的算法,普遍用在图像编辑软件、打印机驱动和数码相机上。
本题先通过imread()函数读入图像文件,然后利用imresize()函数将图像分别利用三种插值方法放大到2048*2048。
对应源程序:
lena3.m
(2)MATLAB函数:
imresize()函数用于对图像做缩放处理。
调用格式:
B=imresize(A,[numrowsnumcols],method)
其中,numrows和numcols分别指定目标图像的高度和宽度。
显而易见,由于这
种格式允许图像缩放后长宽比例和源图像长宽比例不相同,因此所产生的图像有可能
发生畸变。
method参数用于指定在改变图像尺寸时所使用的算法,可以为一下几种:
'nearest':
这个参数也是默认的,即改变图像尺寸时采用最近邻插值算法;
'bilinear':
采用双线性插值算法;
'bicubic':
采用双三次插值算法;
(3)处理结果:
原始图像:
最近邻插值法:
双线性插值法:
双三次插值法:
(4)结果分析:
最近邻插值、双线性插值与双三次差值这三种方法之间的区别主要在于点周围像素序列的取法不同。
对于最近邻插值,输出像素的值指定为点所属像素的值,不考虑其他像素;对于双线性插值,输出图像的值是最近的2*2邻域内像素值得加权平均值;对于双三次差值,输出图像的值是最近的4*4邻域内像素值得加权平均值。
所以,双线性插值法花费的时间比最近邻法的要长一些,而双三次法花费的时间比双线性法的又要长一些。
但