西安交大数字图像处理第一次作业.docx

资源描述

西安交大数字图像处理第一次作业.docx

《西安交大数字图像处理第一次作业.docx》由会员分享，可在线阅读，更多相关《西安交大数字图像处理第一次作业.docx（22页珍藏版）》请在冰豆网上搜索。

西安交大数字图像处理第一次作业.docx

西安交大数字图像处理第一次作业

数字图像处理第一次作业

姓名：

班级：

学号：

提交日期：

2015年3月13日

摘要

本次报告首先简单阐述了BMP图像格式及其相关数据结构，随后主要完成了作业要求中关于图像处理与计算的各项任务。

本次作业以Matlab2014为平台，通过对lena.bmp,elain.bmp图像文件的编程处理，分别得到了lena.bmp图像的8到1级灰度逐级递减显示，lena.bmp图像的均值和方差，通过近邻、双线性和双三次插值法对lena.bmp进行4倍放大后得到的2048×2048尺寸图像，和对lena.bmp、elain.bmp图像分别进行水平偏移变换和旋转变换后的图像及其4倍插值放大图像。

以上任务完成后均得到了预期的结果。

1.Bmp图像格式简介。

1.1BMP格式概述

BMP（全称Bitmap）是Windows操作系统中的标准图像文件格式，可以分成两类：

设备相关位图（DDB）和设备无关位图（DIB），使用非常广。

它采用位映射存储格式，除了图像深度可选以外，不采用其他任何压缩，因此，BMP文件所占用的空间很大。

BMP文件的图像深度可选lbit、4bit、8bit及24bit。

BMP文件存储数据时，图像的扫描方式是按从左到右、从下到上的顺序。

1.2BMP格式组成

典型的BMP图像文件由四部分组成：

（1）位图头文件数据结构，它包含BMP图像文件的类型、显示内容等信息；

（2）位图信息数据结构，它包含有BMP图像的宽、高、压缩方法，以及定义颜色等信息；

（3）调色板，这个部分是可选的，有些位图需要调色板，有些位图，比如真彩色图（24位的BMP）就不需要调色板；

（4）位图数据，这部分的内容根据BMP位图使用的位数不同而不同，在24位图中直接使用RGB，而其他的小于24位的使用调色板中颜色索引值。

1.3BMP格式对应数据结构

BMP文件由文件头、位图信息头、颜色信息和图形数据四部分组成。

1.3.1BMP文件头（14字节）

BMP文件头数据结构含有BMP文件的类型、文件大小和位图起始位置等信息。

其结构定义如下：

typedefstructtagBITMAPFILEHEADER

{

WORDbfType;//位图文件的类型，必须为BM（1-2字节）

DWORDbfSize;//位图文件的大小，以字节为单位（3-6字节）

WORDbfReserved1;//位图文件保留字，必须为0（7-8字节）

WORDbfReserved2;//位图文件保留字，必须为0（9-10字节）

DWORDbfOffBits;//位图数据的起始位置，以相对于位图（11-14字节）

//文件头的偏移量表示，以字节为单位

}BITMAPFILEHEADER;

1.3.2位图信息头（40字节）

BMP位图信息头数据用于说明位图的尺寸等信息。

typedefstructtagBITMAPINFOHEADER{

DWORDbiSize;//本结构所占用字节数（15-18字节）

LONGbiWidth;//位图的宽度，以像素为单位（19-22字节）

LONGbiHeight;//位图的高度，以像素为单位（23-26字节）

WORDbiPlanes;//目标设备的级别，必须为1（27-28字节）

WORDbiBitCount;//每个像素所需的位数，必须是1（双色），（29-30字节）

//4（16色），8（256色）16（高彩色）或24（真彩色）之一

DWORDbiCompression;//位图压缩类型，必须是0（不压缩），（31-34字节）

//1（BI_RLE8压缩类型）或2（BI_RLE4压缩类型）之一

DWORDbiSizeImage;//位图的大小（其中包含了为了补齐行数是4的倍数而添加的空字节），以字节为单位（35-38字节）

LONGbiXPelsPerMeter;//位图水平分辨率，每米像素数（39-42字节）

LONGbiYPelsPerMeter;//位图垂直分辨率，每米像素数（43-46字节）

DWORDbiClrUsed;//位图实际使用的颜色表中的颜色数（47-50字节）

DWORDbiClrImportant;//位图显示过程中重要的颜色数（51-54字节）

}BITMAPINFOHEADER;

1.3.3颜色表

颜色表用于说明位图中的颜色，它有若干个表项，每一个表项是RGBQUAD类型的结构，定义一种颜色。

RGBQUAD结构的定义如下：

typedefstructtagRGBQUAD{

BYTErgbBlue;//蓝色的亮度（值范围为0-255）

BYTErgbGreen;//绿色的亮度（值范围为0-255）

BYTErgbRed;//红色的亮度（值范围为0-255）

BYTErgbReserved;//保留，必须为0

}RGBQUAD;

颜色表中RGBQUAD结构数据的个数有biBitCount来确定：

当biBitCount=1,4,8时，分别有2,16,256个表项；

当biBitCount=24时，没有颜色表项。

位图信息头和颜色表组成位图信息，BITMAPINFO结构定义如下：

typedefstructtagBITMAPINFO{

BITMAPINFOHEADERbmiHeader;//位图信息头

RGBQUADbmiColors[1];//颜色表

}BITMAPINFO;

1.3.4位图数据

位图数据记录了位图的每一个像素值，记录顺序是在扫描行内是从左到右，扫描行之间是从下到上。

位图的一个像素值所占的字节数：

当biBitCount=1时，8个像素占1个字节；

当biBitCount=4时，2个像素占1个字节；

当biBitCount=8时，1个像素占1个字节；

当biBitCount=24时，1个像素占3个字节,按顺序分别为B,G,R；

Windows规定一个扫描行所占的字节数必须是4的倍数（即以long为单位），不足的以0填充。

2.把lena512*512图像灰度级逐级递减8-1显示。

（1）问题分析：

本题中对图像进行的操作是直接灰度变换。

首先利用imread函数读入

lena512.bmp，得到图像的灰度矩阵I，之后对灰度矩阵中的每个元素进行操作，即阵

列操作。

将灰度矩阵的每个元素值除以二，取整后将结果转换为无符号8位数，既得

到灰度级为7的图像，最后利用imshow函数输出显示图像。

同理可得到灰度级为6-1

的图像。

对应源程序lena.m

（2）MATLAB函数：

A=imread（‘filename’）

用imread函数读取图像文件，文件格式可以是TIFF、JPEG、GIF、BMP、PNG。

读进来的是一个二维数组，存放在矩阵A中。

调用格式：

A=imread（filename,fmt）

[X,map]=imread（filename,fmt）

imshow（A）

imshow是matlab中显示图像的函数。

调用格式：

imshow（I,n）

imshow（I,[lowhigh]）

用指定的灰度范围[lowhigh]显示灰度图像I。

显示结果，图像中灰度值等于或低于

low的都将用黑色显示，而灰度值大于等于high的都显示为白色，介于low和high之

间的用其灰度级的默认值的中间色调显示。

（3）处理结果：

8灰度级：

7灰度级：

6灰度级：

5灰度级：

4灰度级：

3灰度级：

2灰度级：

1灰度级：

（4）结果分析：

对一幅512*512,256个灰度级的具有较多细节的图像，保持空间分辨率不变，仅将灰度级数依次递减为128、64、32、16、8、4、2，比较得到的结果就可以发现灰度级数对图像的影响。

前四张图灰度级数较高，图像基本看不出什么变化。

当灰度级数继续降低，则在灰度缓变区常会出现一些几乎看不出来的非常细的山脊状结构。

灰度级数越低，越不能将图像的细节刻画出来。

对比实验中处理过的图像，可以发现，虽然都是灰度图，但是灰度范围越大则图像显示出的色彩越丰富。

3.计算lena512图像的均值方差。

（1）问题分析：

首先通过imread（）函数读入图像文件到灰度矩阵A中，然后利用

mean2（）函数和std2（）函数计算灰度矩阵（即图像）的均值和标准差，再由标准

差平方得到方差。

对应源程序：

lena2.m

（2）MATLAB函数：

mean2（）

MATLAB中提供均值计算函数mean（）和mean2（）。

mean2（A），用于对整一个矩

阵求像素平均值。

调用格式：

u=mean2（A）

std2（）

MATLAB中提供标准差计算函数std（）和std2（）。

调用格式：

s=std2（A）

（3）处理结果：

均值u=95.6564方差s^2=1.9273e+03

（4）结果分析：

经过MATLAB运算，得到图像lena512.bmp的均值约为95.6564，标准差约为43.9012，方差是标准差的平方，约为1927.3。

方差越大，图像的对比度越大，可以显示的细节就越多。

4.把lena图像用近邻、双线性和双三次插值法zoom到2048*2048。

（1）问题分析：

插值算法是估计在图象像素间的某个位置的像素的取值方法。