图像处理期末考试整理.docx
《图像处理期末考试整理.docx》由会员分享,可在线阅读,更多相关《图像处理期末考试整理.docx(21页珍藏版)》请在冰豆网上搜索。
图像处理期末考试整理
数字图像处理与计算机视觉复习AceNirvana整理
第一章绪论
1.1前言
人类传递信息的主要媒介是语音和图像。
听觉信息20%,视觉信息>60%,其他(如味觉、触觉、嗅觉)<20%,“百闻不如一见”。
医学领域:
1895年X射线的发现。
1.2数字图像处理的起源
数字图像处理的历史可追溯至二十世纪二十年代。
最早应用之一是在报纸业,当时,引入巴特兰电缆图片传输系统,图像第一次通过海底电缆横跨大西洋从伦敦送往纽约传送一幅图片。
第一台能够进行图像处理的大型计算机出现在20世纪60年代。
数字图像处理的起源可追溯至利用这些大型机开始的空间研究项目,可以说大型计算机与空间研究项目是数字图像处理发展的原动力。
计算机断层是一种处理方法,在这种处理中,一个检测器环围绕着一个物体(或病人),一个X射线源,带有检测器的同心圆绕着物体旋转,X射线通过物体并由位于环上对面的相应的检测器收集起来,然后用特定的重建算法重建通过物体的“切片”的图像,这些切片组成了物体内部的再现图像。
计算机断层技术获得了1979年诺贝尔医学奖。
从20世纪60年代至今,数字图像处理技术发展迅速,目前已成为工程学、计算机科学、信息科学、统计学、物理、化学、生物学、医学甚至社会科学等领域中各学科之间学习和研究的对象。
如今图像处理技术已给人类带来了巨大的经济和社会效益。
不久地将来它不仅在理论上会有更深入的发展,在应用上亦是科学研究、社会生产乃至人类生活中不可缺少的强有力的工具。
1.3图像处理的应用意义
(1)图像是人们从客观世界获取信息的重要来源
人类是通过感觉器官从客观世界获取信息,即通过耳、目、口、鼻、手通过听、看、味、嗅和触摸的方式获取信息。
在这些信息中,视觉信息占60%~70%。
视觉信息的特点是信息量大,传播速度快,作用距离远,有心理和生理作用,加上大脑的思维和联想,具有很强的判断能力。
其次是人的视觉十分完善,人眼灵敏度高,鉴别能力强,不仅可以辨别景物,还能辨别人的情绪,由此可见,图像信息对人类来说是十分重要的。
(2)图像信息是人类视觉延续的重要手段
人的眼睛只能看到可见光部分,但就目前科技水平看,能够成像的并不仅仅是可见光,一般来说可见光的波长为0.38um~0.8um,而迄今为止人类发现可成像的射线已有多种,如:
gamma射线:
0.003nm~0.03nmx射线:
0.03nm~3nm紫外线:
3nm~300nm可见光:
300nm~800nm红外线:
0.8um~300um微波:
0.3cm~100cm无线电波:
100cm~。
(3)图像处理技术对国计民生有重要意义
图像处理技术发展到今天,许多技术已日趋成熟。
在各个领域的应用取得了巨大的成功和显著的经济效益。
如在工程领域、工业生产、军事、医学以及科学研究中的应用已十分普遍。
在工业生产中的设计自动化及产品质量检验中更是大有可为。
在安全保障及监控方面图像处理技术更是不可缺少的基本技术;至于在通信及多媒体技术中图像处理更是重要的关键技术。
因此,图像处理技术在国计民生中的重要意义是显而易见的。
1.4图像处理技术的分类
分为两类:
模拟图像处理、数字图像处理。
(1)模拟图像处理(AnalogImageProcessing)
模拟处理包括:
光学处理(利用透镜)和电子处理,如:
照相、遥感图像处理、电视信号处理等,电视图像是模拟信号处理的典型例子,它处理的是活动图像,25帧/秒。
优点:
模拟图像处理的特点是速度快,一般为实时处理,理论上讲可达到光的速度,并可同时并行处理。
缺点:
模拟图像处理的缺点是精度较差,灵活性差,很难有判断能力和非线性处理能力。
(2)数字图像处理(DigitalImageProcessing)
数字图像处理一般都用计算机处理,也称为计算机图像处理(ComputerImageprocessing)。
优点:
处理精度高,处理内容丰富,可进行复杂的非线性处理,有灵活的变通能力,一般来说只要改变软件就可以改变处理内容。
缺点:
处理速度还是一个问题,特别是进行复杂的处理更是如此。
一般情况下处理静止画面居多,如果实时处理一般精度的数字图像需要具有100Mips的处理能力;其次是分辨率及精度尚有一定限制,如一般精度图像是512×512×8bits,分辨率高的可2048×2048×12bits,如精度及分辨率再高,所需处理时间将显著的增加。
1.5数字图像处理的特点
(1)图像信息量大、数据量也大:
数字图像处理中,一幅图像的数据量比文本大得多。
(2)图像处理技术综合性强:
在数字图像处理中涉及的基础知识和专业技术相当广泛。
一般来说涉及通信技术、计算机技术、电子技术、电视技术,至于涉及到的数学、物理等方面的基础知识就更多。
当今的图像处理理论大多是通信理论的推广,只是把通信中的一维问题推广到二维,以便于分析,在此基础上,逐步发展自己的理论体系。
因此,图像处理技术与通信技术休戚相关。
(3)图像信息理论与通信理论密切相关:
图像信息论也属于信息论科学中的一个分支。
从当今的理论发展看,我们可以说,图像信息论是在通信理论研究的基础上发展起来的。
图像理论是把通信中的一维问题推广到二维空间上来研究的,也就是说,通信研究的是一维时间信息;图像研究的是二维空间信息;
1.6数字图像处理的主要方法及主要内容
处理方法:
空域法和变换域法
A、空域法:
这种方法是把图像看作是平面中各个像素组成的集合,然后直接对这一二维函数进行相应的处理。
空域处理法主要有两大类:
(1)、邻域处理法:
其中包括梯度运算(gradientAlgorithm)、拉普拉斯算子运算(Laplacianoperator)、平滑算子运算(Smoothingoperator)、卷积运算(Convolutionalgorithm)
(2)、点处理法:
如灰度处理(greyprocessing),面积、周长、体积、重心运算等等。
B、变换域法:
数字图像处理的变换域处理方法是首先对图像进行正交变换,得到变换域系数阵列,然后再施行各种处理,处理后再反变换到空间域,得到处理结果。
这类处理包括:
滤波、数据压缩、特征提取等处理。
数字图像处理的主要内容:
完整的数字图像处理工程大体上可分为如下几个方面:
①图像信息的获取;②图像信息的存贮;③图像信息的传送;④图像信息处理;⑤图像信息的输出和显示。
1、图像信息的获取(ImageInformationAcquisition)
主要是把一幅图像转换成适合输入计算机或数字设备的数字信号,这一过程主要包括摄取图像、光电转换及数字化等几个步骤。
图像获取的方法有
(1)电视摄像机
(2)扫描仪(3)遥感中常用的图像获取设备已有多种设备:
光学摄影:
摄像机、多光谱像机等。
红外摄影:
红外辐射计、红外摄像仪、多通道红外扫描仪。
MSS:
多光谱扫描仪。
微波:
微波辐射计,侧视雷达、真实空孔径雷达、合成孔径雷达(SAR)。
2、信息的存贮:
(ImageinformationStorage)
图像信息的突出特点是数据量巨大。
一般作档案存贮主要采用磁带、磁盘或光盘。
为解决海量存贮问题主要研究数据压缩、图像格式及图像数据库、图像检索技术等。
3、图像信息的传送:
(Imageinformationtransmission)
图像信息的传送可分为系统内部传送与远距离传送。
内部传送多采用DMA技术(DirectMemoryAccess)以解决速度问题,外部远距离传送主要解决占用带宽问题。
目前,已有多种国际压缩标准来解决这一问题,图像通信网正在逐步建立。
4、数字图像处理(DigitalImageProcessing)
数字图像处理概括的说主要包括如下几项内容:
①.几何处理(geometricalprocessing)②.算术处理(Arithmeticprocessing)③.图像增强(ImageEnhancement)④.图像复原(ImageRestoration)⑤.图像重建(ImageReconstruction)⑥.图像编码(ImageEncoding)⑦.图像识别(ImageRecognition)⑧.图像理解(ImageUnderstanding)
5、图像的输出与显示
图像处理的最终目的是为人或机器提供一幅更便于解译和识别的图像。
因此,图像输出也是图像处理的重要内容之一。
图像的输出有二种,一种是硬拷贝,另一种是软拷贝。
通常的硬拷贝方法有照相、激光拷贝、彩色喷墨打印等几种方法。
软拷贝方法有以下几种:
(1)CRT显示
(2)液晶显示器(LCD)(3)彩色等离子显示技术(PDP)(4)发光二极管显示器(LED)
1.7数字图像处理的应用
学科应用内容
物理、化学结晶分析、谱分析
生物、医学细胞分析、染色体分类、血球分类、X光照片分析、CT
环境保护水质及大气污染调查
地质资源勘探、地图绘制、GIS
农林植被分布调查、农作物估产
海洋鱼群探查、海洋污染监测
水利河流分布、水利及水害调查
气象云图分析等
通信传真、电视、多媒体通信
工业、交通工业探伤、铁路选线、机器人、产品质量监测
经济电子商务、身份认证、防伪
军事军事侦察、导弹致导、电子沙盘、军事训练
法律指纹识别、痕迹鉴定等
安全加密、信息隐藏、数字水印等
1.8图像处理与相关学科的关系
数字图象处理着重强调在图像之间进行变换,旨在对图像进行各种加工以改善图像的视觉效果。
计算机图形学试图从非图像形式的数据描述来生成(逼真的)图像。
计算机视觉是研究用计算机来模拟生物视觉功能的科学和技术。
它模拟人对客观事物模式的识别过程,是从图像到特征数据,对象的描述表达的处理过程。
第2章数字图像处理基础
2.1色度学基础
(1)三基色原理
人眼的视网膜上存在有大量能在适当亮度下分辨颜色的锥状细胞,它们分别对应红、绿、蓝三种颜色,即分别对红光、绿光、蓝光敏感。
由此,红(Red)、绿(Green)、蓝(Blue)这三种颜色被称为三基色。
根据人眼的三基色吸收特性,人眼所感受到的颜色其实是三种基色按照不同比例的组合。
则任一彩色C可表示为:
C=R+G+B
(2)颜色模型
各种表示颜色的方法,称做颜色模型。
目前使用最多的是面向机器(如显示器、摄像机等)的RGB模型。
(3)RGB模型
在三维直角坐标系中,用相互垂直的三个坐标轴代表R、G、B三个分量,并将R、G、B分别限定在[0,1],则该单位正方体就代表颜色空间,其中的一个点就代表一种颜色。
如下图所示。
其中,r、g、b、c、m和y分别代表红色(red)、绿色(green)、蓝色(blue)、青色(cyan)、品红(magenta)和黄色(yellow)
2.2人的视觉特性
A.人眼的构造与机理要点
人眼的机理与照相机类似:
(1)瞳孔:
透明的角膜后是不透明的虹膜,虹膜中间的圆孔称为瞳孔,其直径可调节,控制进入人眼内之光通量(照相机光圈作用)。
(2)晶状体:
瞳孔后是一扁球形弹性透明体,其曲率可调节,以改变焦距,使不同距离的图在视网膜上成象(照相机透镜作用)。
(3)视细胞:
视网膜上集中了大量视细胞,分为两类:
锥状细胞:
明视细胞,在强光下检测亮度和颜色;杆(柱)状细胞:
暗视细胞,在弱光下检测亮度,无色彩感觉。
其中,每个锥状视细胞连接着一个视神经末梢,故分辨率高,辨细节、颜色;多个杆状视细胞连接着一个视神经末梢,故分辨率低,仅分辨图的轮廓。
(4)人眼成象过程:
B.人眼的亮度感觉
(1)图像“黑”“白”(“亮”、“暗”)对比参数
对比度:
c=Bmax/Bmin相对对比度:
cr=(B-B0)/B0
(2)人眼亮度感觉范围
①总范围很宽(c=108)②人眼适应某一环境亮度后,范围限制,适当平均亮度下:
c=103,很低亮度下:
c=10
(3)同时对比度:
人眼对亮暗程度所形成的“黑”“白”感觉具有相对性,即按对比度c感觉物体亮度对比。
2.3图像数字化
怎样把图像用数字来表示呢?
通过图像数字化来实现。
所谓的图像数字化,是指将模拟图像经过离散化之后,得到用数字表示的图像。
图像的数字化包括了空间离散化(即采样)和明暗表示数据的离散化(即量化)。
A.采样:
是指将在空间上连续的图像转换成离散的采样点(即像素)集的操作。
由于图像是二维分布的信息,所以采样是在x轴和y轴两个方向上进行的。
一般情况下,x轴方向与y轴方向的采样间隔相同。
采样时的注意点是:
采样间隔的选取。
采样间隔太小,则增大数据量;太大,则会发生信息的混叠,导致细节无法辨认。
采样指标:
分辨率
(1)分辨率是指单位距离上像素的个数。
单位:
像素/英寸,像素/厘米
(如:
扫描仪的指标300dpi)(dotperinch)
(2)分辨率或者是指要精确测量和再现一定尺寸的图像所必需的像素个数。
单位:
像素*像素(如:
数码相机指标30万像素(640*480))
B.量化:
是将各个像素所含的明暗信息离散化后,用数字来表示。
一般的量化值为整数。
充分考虑到人眼的识别能力之后,目前非特殊用途的图像均为8bit量化,即采用0~255的整数来描述“从黑到白”。
在3bit以下的量化,会出现伪轮廓现象。
量化可分为均匀量化和非均匀量化。
1.均匀量化是简单地在灰度范围内等间隔量化。
2.非均匀量化是对像素出现频度少的部分量化间隔取大,而对频度大的量化间隔取小。
2.4数字图像表示形式和特点
数字图像的矩阵表示:
数字图像的特点:
1.信息量大
一幅遥感图像大小为1024*1024,每个像素用32bit表示,则容量为1024*1024*4byte=4Mbyte
2.占用频带宽
与语音信息相比,图像信息占用的带宽要大几个数量级。
如电视图像约为5.6MHZ,而语音仅为2KHz左右。
因此,处理的难度大,成本高。
这就对图像(频带)压缩提出了必须(很高)的要求。
3.像素间相关性大
(1)同幅内相邻像素间具有相同(或相近)灰度的可能性很大(r≥0.8);
(2)运动图像的相邻帧对应像素间相关性更大。
综上
(1)和
(2)说明,图像压缩的潜力(可能性)很大。
4.视觉效果的主观性大。
2.5本章小结
引入了三基色的概念,RGB颜色模型,将彩色图像用三个灰度图像表示出来。
从人的视觉特性入手,介绍了视觉成像特性,给出了图像数字化方法,包括采样和量化。
给出了数字图像的表示方法及数字图像的四大特点。
习题
1、什么是dpi,它的含义是什么?
2、30万(0.3M)、80万(0.8M)、300万(3M)、1200万(12M)像素的数码相机拍摄的图像的最大尺寸是多少(长宽比为4:
3)?
如果每个像素用24位真彩色进行存储,在不压缩的情况下,数据量是多大?
如果用300dpi的分辨率进行打印,打印出的照片有多大?
3、一张4英寸*6英寸的照片,用扫描仪进行扫描,如果扫描分辨率为100dpi,扫描得到的数字图像的尺寸是多少?
如果用300dpi的扫描分辨率呢?
第3章频域处理
3.1傅立叶变换基础
法国数学家傅立叶生于1768年,他对世人的最大贡献在于他指出任何周期函数都可以表示为不同频率的正弦和(或余弦和)的形式,每个正弦(或余弦)乘以不同的系数。
甚至非周期的函数(曲线是有限的情况下)也可以用正弦(或余弦)乘以加权函数的积分来表示。
一个恰当的比喻是将傅立叶变换比作一个玻璃棱镜,棱镜是可以将光分成不同颜色成分的物理仪器,每个颜色由光的频率(波长)决定;而傅立叶变换可看作“数学的棱镜”,将函数基于频率分成不同的成分。
分解信号的方法是无穷的,例如也还可以用方波或三角波,但分解信号的目的是为了更加简单地处理原来的信号。
为什么选正弦曲线?
一个正弦曲线信号输入后,输出的仍是正弦曲线,只有幅度和相位可能发生变化,但是频率和波的形状仍是一样的。
且只有正弦曲线才拥有这样的性质,正因如此我们才不用方波或三角波来表示。
傅立叶变换:
针对信号的的长度是无穷大的。
因为正余弦波被定义成从负无穷小到正无穷大。
计算机:
只能处理有限数据。
无法把一个长度无限的信号组合成长度有限的信号。
解决方法:
把长度有限的信号表示成长度无限的信号
(1)可以把信号无限地从左右进行延伸,延伸的部分用零来表示;
(2)可以把信号用复制的方法进行延伸,这样信号就变成了周期性离解信号。
傅里叶变换在数学中的定义是严格的。
设f(x)为x的函数,如果满足下面的狄里赫莱条件:
(1)具有有限个间断点;
(2)具有有限个极值点;
(3)绝对可积。
则有下列二式成立:
式中x是时域(空间域)变量,u为频率变量。
如令,则有
通常把以上公式称为傅里叶变换对。
函数f(x)的傅里叶变换一般是一个复量,它可以由下式表示:
或写成指数形式
把叫做的傅里叶谱,而叫相位谱。
3.2二维离散傅立叶变换(DFT)
3.2.1二维连续傅立叶变换
二维连续函数f(x,y)的傅里叶变换定义如下:
设f(x,y)是独立变量x,y的函数,且在上绝对可积,则定义积分
为二维连续函数f(x,y)的傅里叶变换,并定义
为F(u,v)的反变换。
F(x,y)和F(u,v)为傅里叶变换对。
3.2.2二维离散傅立叶变换
尺寸为M×N的离散图像函数的DFT
反变换可以通过对F(u,v)求IDFT获得
DFT变换进行图像处理时有如下特点:
(1)直流成分为F(0,0)。
(2)幅度谱|F(u,v)|对称于原点。
(3)图像f(x,y)平移后,幅度谱不发生变化,仅有相位发生了变化。
3.2.3二维离散傅立叶变换的性质
1.周期性和共轭对称性
周期性和共轭对称性来了许多方便。
我们首先来看一维的情况。
设有一矩形函数为,求出它的傅里叶变换:
幅度谱:
(a)幅度谱(b)原点平移后的幅度谱
DFT取的区间是[0,N-1],在这个区间内频谱是由两个背靠背的半周期组成的,要显示一个完整的周期,必须将变换的原点移至u=N/2点。
根据定义,有
在进行DFT之前用(-1)x乘以输入的信号f(x),可以在一个周期的变换中(u=0,1,2,…,N-1),求得一个完整的频谱。
推广到二维情况。
在进行傅里叶变换之前用(-1)x+y乘以输入的图像函数,则有:
DFT的原点,即F(0,0)被设置在u=M/2和v=N/2上。
(0,0)点的变换值为:
即f(x,y)的平均值。
如果是一幅图像,在原点的傅里叶变换F(0,0)等于图像的平均灰度级,也称作频率谱的直流成分。
(a)原始图像(b)中心化前的频谱图(c)中心化后的频谱图
2.可分性
离散傅里叶变换可以用可分离的形式表示
这里
对于每个x值,当v=0,1,2,…,N-1时,该等式是完整的一维傅里叶变换。
图二维DFT变换方法
二维变换可以通过两次一维变换来实现。
同样可以通过先求列变换再求行变换得到2DDFT。
3.离散卷积定理
设f(x,y)和g(x,y)是大小分别为A×B和C×D的两个数组,则它们的离散卷积定义为
卷积定理
【例】用MATLAB实现图像的傅里叶变换。
解:
MATLAB程序如下:
A=imread('pout.tif');%读入图像
imshow(A);%显示图像
A2=fft2(A);%计算二维傅里叶变换
A2=fftshift(A2);%将直流分量移到频谱图的中心
figure,imshow(log(abs(A2)+1),[010]);%显示变换后的频谱图
(a)原始图像(b)图像频谱
3.3频域滤波
频域处理法的基础是卷积定理。
它采用修改图像傅里叶变换的方法实现对图像的增强处理。
由卷积定理可知,如果原始图像是f(x,y),处理后的图像是g(x,y),而h(x,y)是处理系统的冲激响应,那么处理过程可由下式表示
其中*代表卷积
如果G(u,v),H(u,v),F(u,v)分别是分别是g(x,y),h(x,y),f(x,y)的傅立叶变换,那么上面的卷积关系可表示为变换域的乘积关系,即
式中,H(u,v)为传递函数。
在增强问题中,f(x,y)是给定的原始数据,经傅立叶变换可得到F(u,v)。
选择合适的H(u,v),使得由式
得到的g(x,y)比f(x,y)在某些特性方面更加鲜明、突出,因而更加易于识别、解译。
例如,可以强调图像中的低频分量使图像得到平滑,也可以强调图像中的高频分量使图像的边缘得到增强等等。
以上就是频域处理法的基本原理。
3.3.1低通滤波法
这种方法是一种频域处理法。
在分析图像信号的频率特性时,一幅图像的边缘、跳跃部分以及颗粒噪声代表图像信号的高频分量,而大面积的背景区则代表图像信号的低频分量。
用滤波的方法滤除其高频部分就能去掉噪声,使图像得到平滑。
滤除高频成分,保留低频成分。
常用的几种低通滤波器
(1)理想低通滤波器
一个理想的二维低通滤波器的传递函数由下式表示:
式中是一个规定的非负的量,叫做理想低通滤波器的截止频率。
D(u,v)是从频率颊的原点到(u,v)点的距离,即
理想低通滤波器传递函数径向剖面图
所谓理想低通滤波器是指以截频为半径的圆内的所有频率都能无损地通过,而在截频之外的频率分量完全被衰减。
理想低通滤波器可以用计算机模拟实现,但是却不能用电子元器件来实现。
理想低通滤波器在处理过程中会产生较严重的模糊和振铃现象。
这种现象正是由于傅立叶变换的性质决定的。
原因:
略
(2)巴特沃思(Butterworth)低通滤波器
一个n阶布特沃斯低通滤波器的传递函数由下式表示
式中为截止频率,D(u,v)的值由下式决定
布特沃斯低通滤波器又称最大平坦滤波器。
它与理想低通滤波器不同,它的通带与阻带之间没有明显的不连续性。
也就是说,在通带和阻带之间有一个平滑的过渡带。
通常把H(u,v)下降到某一值的1/2那一点定为截止频率。
上式中是把H(u,v)下降到原来值的时的D(u,v)定为截频点。
布特沃斯低通滤波器剖面图
布特沃斯低通滤波器的特点:
1)、由于有平缓的过渡带,图像将不会有振铃现象。
2)、模糊程度大大减小。
(3)指数低通滤波器
(4)梯形低通滤波器
用低通滤波器进行平滑处理可以使噪声减低到不显眼的程度,但是由于低通滤波器对噪声等成分滤除的同时,对有用高频成分也滤除,因此,这种去噪的美化处理是以牺牲清晰度为代价而换取的。
3.3.2高通滤波器
常用的几种高通滤波器:
(1)理想高通滤波器
一个理想的二维高通滤波器的传递函数由下式表示
式中是从频度平面原点算起的截止频率(或距离),D(u,v)仍然由下式决定
理想高通
滤波器传递函数径向剖面图
由图可见,理想高通传递函数与理想低通正好相反。
通过高通滤波正好把以D0为半径的圆内的频率成分衰减掉,对圆外的频率成分则无损地通过。
与理想低通一样,理想高通可以用计算机模拟实现,但不可能用电子元件来实现。
(2)巴特沃斯(Butterworth)高通滤波器
截止频率为D0的n阶布特沃斯高通滤波器的传递函数如下式表示
式中
布特沃斯高通滤波器传递函数径向剖面图
与低通滤波器一样,定H(u