昆明学院通讯技术专业Word文档格式.docx
《昆明学院通讯技术专业Word文档格式.docx》由会员分享,可在线阅读,更多相关《昆明学院通讯技术专业Word文档格式.docx(20页珍藏版)》请在冰豆网上搜索。
1.1数字图象处理发展概况………………………………………4
1.2数字图象处理发展主要研究的内容…………………………4
1.3数字图象处理主要的基本特点………………………………5
1.4数字图象处理的优点…………………………6
二数字图像处理基础知识………………………………7
2.1数字图象处理………………………………………7
2.2数字图象分析…………………………7
2.3数字图象理解…………………………………………………7
2.4数字图象处理、图像分析和图像理解的关系……………………………………………………7
2.5数字图象工程………………………………………8
2.6数字图像处理系统硬件结构…………………………8
2.7数字图象的分辨率……………………………………………9
2.8数字图象灰度直方图………………………………………10
三数字图像压缩………………………………………………14
3.1图像压缩技术概述………………………………………14
3.2图象数据压缩原理……………………………………15
四改进的像素标记算法…………………………………………16
4.1全图扫描……………………………………………………16
4.2扫描后的处理………………………………………17
五计算机模拟………………………………………………18
六结论…………………………………………………………18
参考文献……………………………………………………19
附录…………………………………………………………20
谢辞……………………………………………………………20
一数字图像处理概述
1.1数字图象处理发展概况
数字图像处理(DigitalImageProcessing)又称为计算机图像处理,它是指将图像信号转换成数字信号并利用计算机对其进行处理的过程。
数字图像处理最早出现于20世纪50年代,当时的电子计算机已经发展到一定水平,人们开始利用计算机来处理图形和图像信息。
数字图像处理作为一门学科大约形成于20世纪60年代初期。
早期的图像处理的目的是改善图像的质量,它以人为对象,以改善人的视觉效果为目的。
首次获得实际成功应用的是美国喷气推进实验室(JPL)。
他们对航天探测器徘徊者7号在1964年发回的几千张月球照片使用了图像处理技术,如几何校正、灰度变换、去除噪声等方法进行处理,并考虑了太阳位置和月球环境的影响,由计算机成功地绘制出月球表面地图,获得了巨大的成功。
随后又对探测飞船发回的近十万张照片进行更为复杂的图像处理,以致获得了月球的地形图、彩色图及全景镶嵌图,获得了非凡的成果,为人类登月创举奠定了坚实的基础,也推动了数字图像处理这门学科的诞生。
在以后的宇航空间技术,如对火星、土星等星球的探测研究中,数字图像处理技术都发挥了巨大的作用。
1.2数字图象处理
数字图像处理主要研究的内容有以下几个方面:
1)图像变换由于图像阵列很大,直接在空间域中进行处理,涉及计算量很大。
因此,往往采用各种图像变换的方法,如傅立叶变换、沃尔什变换、离散余弦变换等间接处理技术,将空间域的处理转换为变换域处理,不仅可减少计算量,而且可获得更有效的处理(如傅立叶变换可在频域中进行数字滤波处理)。
目前新兴研究的小波变换在时域和频域中都具有良好的局部化特性,它在图像处理中也有着广泛而有效的应用。
2)图像编码压缩技术可减少描述图像的数据量(即比特数),以便节省图像传输、处理时间和减少所占用的存储器容量。
压缩可以在不失真的前提下获得,也可以在允许的失真条件下进行。
编码是压缩技术中最重要的方法,它在图像处理技术中是发展最早且比较成熟的技术。
3)图像增强和复原的目的是为了提高图像的质量,如去除噪声,提高图像的清晰度等。
图像增强不考虑图像降质的原因,突出图像中所感兴趣的部分。
如强化图像高频分量,可使图像中物体轮廓清晰,细节明显;
如强化低频分量可减少图像中噪声影响。
图像复原要求对图像降质的原因有一定的了解,一般讲应根据降质过程建立"
降质模型"
,再采用某种滤波方法,恢复或重建原来的图像。
4)图像分割是数字图像处理中的关键技术之一。
图像分割是将图像中有意义的特征部分提取出来,其有意义的特征有图像中的边缘、区域等,这是进一步进行图像识别、分析和理解的基础。
虽然目前已研究出不少边缘提取、区域分割的方法,但还没有一种普遍适用于各种图像的有效方法。
因此,对图像分割的研究还在不断深入之中,是目前图像处理中研究的热点之一。
5)图像描述是图像识别和理解的必要前提。
作为最简单的二值图像可采用其几何特性描述物体的特性,一般图像的描述方法采用二维形状描述,它有边界描述和区域描述两类方法。
对于特殊的纹理图像可采用二维纹理特征描述。
随着图像处理研究的深入发展,已经开始进行三维物体描述的研究,提出了体积描述、表面描述、广义圆柱体描述等方法。
6)图像分类(识别)属于模式识别的范畴,其主要内容是图像经过某些预处理(增强、复原、压缩)后,进行图像分割和特征提取,从而进行判决分类。
图像分类常采用经典的模式识别方法,有统计模式分类和句法(结构)模式分类,近年来新发展起来的模糊模式识别和人工神经网络模式分类在图像识别中也越来越受到重视。
1.3数字图象处理主要的基本特点
1.目前,数字图像处理的信息大多是二维信息,处理信息量很大。
如一幅256×
256低分辨率黑白图像,要求约64kbit的数据量;
对高分辨率彩色512×
512图像,则要求768kbit数据量;
如果要处理30帧/秒的电视图像序列,则每秒要求500kbit~22.5Mbit数据量。
因此对计算机的计算速度、存储容量等要求较高。
2.数字图像处理占用的频带较宽。
与语言信息相比,占用的频带要大几个数量级。
如电视图像的带宽约5.6MHz,而语音带宽仅为4kHz左右。
所以在成像、传输、存储、处理、显示等各个环节的实现上,技术难度较大,成本亦高,这就对频带压缩技术提出了更高的要求。
3.数字图像中各个像素是不独立的,其相关性大。
在图像画面上,经常有很多像素有相同或接近的灰度。
就电视画面而言,同一行中相邻两个像素或相邻两行间的像素,其相关系数可达0.9以上,而相邻两帧之间的相关性比帧内相关性一般说还要大些。
因此,图像处理中信息压缩的潜力很大。
4.由于图像是三维景物的二维投影,一幅图象本身不具备复现三维景物的全部几何信息的能力,很显然三维景物背后部分信息在二维图像画面上是反映不出来的。
因此,要分析和理解三维景物必须作合适的假定或附加新的测量,例如双目图像或多视点图像。
在理解三维景物时需要知识导引,这也是人工智能中正在致力解决的知识工程问题。
5.数字图像处理后的图像一般是给人观察和评价的,因此受人的因素影响较大。
由于人的视觉系统很复杂,受环境条件、视觉性能、人的情绪爱好以及知识状况影响很大,作为图像质量的评价还有待进一步深入的研究。
另一方面,计算机视觉是模仿人的视觉,人的感知机理必然影响着计算机视觉的研究。
例如,什么是感知的初始基元,基元是如何组成的,局部与全局感知的关系,优先敏感的结构、属性和时间特征等,这些都是心理学和神经心理学正在着力研究的课题。
1.4数字图象处理的优点
1.再现性好。
数字图像处理与模拟图像处理的根本不同在于,它不会因图像的存储、传输或复制等一系列变换操作而导致图像质量的退化。
只要图像在数字化时准确地表现了原稿,则数字图像处理过程始终能保持图像的再现。
2.处理精度高。
按目前的技术,几乎可将一幅模拟图像数字化为任意大小的二维数组,这主要取决于图像数字化设备的能力。
现代扫描仪可以把每个像素的灰度等级量化为16位甚至更高,这意味着图像的数字化精度可以达到满足任一应用需求。
对计算机而言,不论数组大小,也不论每个像素的位数多少,其处理程序几乎是一样的。
换言之,从原理上讲不论图像的精度有多高,处理总是能实现的,只要在处理时改变程序中的数组参数就可以了。
回想一下图像的模拟处理,为了要把处理精度提高一个数量级,就要大幅度地改进处理装置,这在经济上是极不合算的。
3.适用面宽。
图像可以来自多种信息源,它们可以是可见光图像,也可以是不可见的波谱图像。
从图像反映的客观实体尺度看,可以小到电子显微镜图像,大到航空照片、遥感图像甚至天文望远镜图像。
这些来自不同信息源的图像只要被变换为数字编码形式后,均是用二维数组表示的灰度图像组合而成,因而均可用计算机来处理。
即只要针对不同的图像信息源,采取相应的图像信息采集措施,图像的数字处理方法适用于任何一种图像。
4.灵活性高。
图像处理大体上可分为图像的像质改善、图像分析和图像重建三大部分,每一部分均包含丰富的内容。
由于图像的光学处理从原理上讲只能进行线性运算,这极大地限制了光学图像处理能实现的目标。
而数字图像处理不仅能完成线性运算,而且能实现非线性处理,即凡是可以用数学公式或逻辑关系来表达的一切运算均可用数字图像处理实现。
二数字图像处理基础知识
2.1数字图象处理
1.对图像进行各种加工以改善图像的效果,为图像分析做准备。
它是图像到图
像的过程。
2.点运算:
灰度变换、阈值变换、灰度均衡等
3.几何变换:
移动、旋转、扭曲校正等。
2.2数字图象分析
对图像中感兴趣的目标进行检测和测量(特征提取),以获得客观的信息。
它
是图像到数据的过程。
边缘检测与提取、图像分割、几何测量、模板匹配等。
2.3数字图象理解
研究图像中各目标的性质和其相互关系,理解图像的含义。
字符识别(OCR)、产品质量检验(目检)、人脸识别、自动驾驶、医学图像
和地貌图像的自动判读理解等。
2.4数字图象处理、图像分析和图像理解的关系
2.5数字图象工程
s是图像理论、图像技术及其应用的新学科。
s数学、物理学、生理学、心理学、计算机科学是其基础;
s得到人工智能、神经网络、模糊逻辑、遗传算法等新理论与新技术的支持;
s和模式识别、计算机视觉、计算机图形学等专业相互交叉;
s其发展应用与工业自动化、医学、遥感、信息等领域不可分割。
2.6数字图像处理系统硬件结构
如下图:
2.7数字图象的分辨率
NTSC制:
768⨯576像素
PAL制:
640⨯480像素
图3.1为一园形物体照片,下面介绍将物体与背景分割开来的方法,和计算园形物
体形心及半径的方法。
图3.1一园形物体的图像
图3.2图3.1的灰度直方图(线性坐标)
2.8数字图象灰度直方图
是数字图像处理中一个最简单、最有用的工具。
它表示图象中具有每种
灰度级的像素的个数,反映图像中每种灰度出现的频率。
如图3.2所示,灰度直方图的横坐标是灰度级,纵坐标是该灰度级出现的频率,它是图像的最基本的统计特征。
最简单、有效的方法就是取双峰间谷底的灰度值为阈值,根据该阈值对图像进行分割,将物体与背景分离开来,然后再进行其它处理。
在实际情况下,图像常受到噪声等因素的影响,为了便于判定谷底位置,必须对直方图进行平滑。
采用低通滤波算法对直方图进行两次平滑,这样可以保证峰值位置误差较小。
图3.4为滤波后的结果。
图3.5是根据图3.4的阈值对图3.1进行阈值分割的结果。
即:
根据阈值将图像二值化,将物体和背景置为黑白两色。
对图像扫描一遍,灰度大于阈值的点置为255,即白色;
小于等于阈值的点置为0,即为黑色。
由于物体上有高光,所以二值化后,在黑色物体上会有小白点,如图3.5所示。
为了使形心计算的结果准确,我们必须将这些小白点填充为黑色。
结果见图3.6。
为了能理解计算形心的公式,先看一个简单的力平衡的问题。
如图3.6所示,一个质量忽略不计的刚性杆下有一支点,在支点两边分别在杆上放有6个质量均匀、尺寸相同、边长为L的正方体。
设正方体的重量为W,当杆平衡时,X=?
力矩平衡方程为:
6*W*X=W*0.5L+2*W*1.5L+3*W*2.5L
W*0.5L+2*W*1.5L+3*W*2.5L
X=--------------------------------------------------------=1.83L
X为即为右边物体在水平方向的重心位置。
均匀物体的重心和形心重合。
计算平面图形的形心公式如下:
图3.8是在物体上用白点根据形心和半径画了一个圆,该圆和物体吻合,半径R=
188.7个像素。
用图3.7的二值化图像上进行误差检查,最大正、负误差为0.4和1.5个像素,分别在352、231度处。
半径的最大误差<
0.8%,其中包括物体本身的不圆度和测量误差。
这个结果说明用以上方法进行阈值分割、形心计算的效果不错。
PDF
三数字图像压缩
3.1图像压缩技术概述
图像压缩就是减少表示数字图像时需要的数据量。
是指以较少的比特有损或无损地表示原来的像素矩阵的技术,也称图像编码。
在我们的生活中无论是普通人还是一些工作在科研领域的科技工作者,都会对数据信息进行传输与存储有所接触。
随着数字时代的到来,影像的制作、处理和存储都脱离了传统的介质(纸、胶片等),相比传统方式,数字图像有着传统方式无法比拟的优越性。
但是每种技术出现的同时,都有制约其发展的一面。
比如数字电视、遥感照片、由雷达、飞机等提供的军事侦察图像、可视电话、会议电视和传真照片,在教育、商业、管理等领域的图文资料、CT机、X射线机等设备的医用图像、天气云图等等,无论是利用哪种传输媒介进行传输的信息,都会都会遇到需要对大量图像数据进行传输与存储的问题。
而对大量图像数据进行传输要保证其传输的质量、速度等,对其进行存储也要考虑其大小容量等。
所以,要解决大量图像数据的传输与存储,在当前传输媒介中,存在传输带宽的限制,故在一些限制条件下传输尽可能多的活动图像,如何能对图像数据进行最大限度的压缩,并且保证压缩后的重建图像能够被用户所接受等问题,就成为研究图像压缩技术的问题之源。
图像数据之所以可以进行压缩,主要是因为一般原始图像数据是高度相关的,都含有大量的冗余信息。
图像压缩编码的目的就是消除各种冗余,并在给定的畸变下用尽量少的比特数来表征和重建图像,使它符合预定应用场合的要求。
3.2图象数据压缩原理
由于图像数据之间存在这一定的冗余,所以使得数据的压缩成为可能。
信息论的创始人Shannon提出把数据看作是信息和冗余度(redundancy)的组合。
所谓冗余度是由于一副图像的各像素之间存在着很大的相关性,可利用一些编码的方法删去它们,从而达到减少冗余压缩数据的目的。
为了去掉数据中的冗余,常常要考虑信号源的统计特性,或建立信号源的统计模型。
图像的冗余包括以下几种:
●空间冗余:
像素点之间的相关性;
●时间冗余:
活动图像两个连续帧之间的冗余;
●信息熵冗余:
单位信息量大于其熵;
●结构冗余:
区域上存在非常强的纹理结构;
●知识冗余:
有固定的结构,如人的头像;
●视觉冗余:
某些图像的失真是人眼不易觉察的。
对数字图像进行压缩通常利用两个基本原理:
一是数字图像的相关性。
在图像的同一行相邻象素之间,相邻象素之间,活动图像的相邻帧的对应象素之间往往存在很强的相关性,去除或减少这些相关性,也即去除或减少图像信息中的冗余度也就实现了对数字图像的压缩。
帧内象素的相关称做空域相关性。
相邻帧间对应象素之间的相关性称做时域相关性。
二是人的视觉心理特征。
人的视觉对于边缘急剧变化不敏感(视觉掩盖效应),对颜色分辨力弱,利用这些特征可以在相应部分适当降低编码精度而使人从视觉上并不感觉到图像质量的下降,从而达到对数字图像压缩的目的。
四改进的像素标记算法
首先定义下列数据变量,初值均为零:
Edge[ij[]边界标记数组,表示坐标为(,)的边界像素属于哪个目标;
Samel[i][]等价标记数组,表示像素标记Samel[i][1]和Samel[i¨
2]为一对等价标记;
Same2[i]标记处理数组,行数对应原标记值,放嚣归类类别号;
Same3[i]标记结果数组,行数对应原标记值,放置正确的目标值;
temp
kind
result
全图扫描中的最大目标标记值;
归类类别值;
结果目标值.
4.1全图扫描
对二值图像从左到右,从上到下扫描,一遇到目标边界像素即进行判断标记.这里边界像素指当前像素灰度值为“l”,并且它的8个领域_6中有一个或一个以上的像素的灰度值为“0”的像素.判断标记过程分两步.
第~步,先依次判断当前像素(i,)的左侧、左上侧、上侧像素和右上侧像素是否己标记,一旦遇到己标记则说明当前像素(i,)和这个己标记像素属于同一目标,赋予Edge[i][J.]相同的标记值,结束本像素
标记.如4个相邻像素均未标记则进入第二步.
第二步,当前像素右移一位,即变为(i,+1),进入一子循环,每次循环判断当前像素右上侧像素是否已标记,如己标记则赋予Edge[i][J]相同的标记值并跳出循环结束本像素标记,如当前像素右上侧像素未标记则右移一位像素继续判断,直到到达目标这~行像素的右侧边界,如此时才跳出循环说明像素(i,
)属于一新目标,则原最大目标标记值temp加1并赋予Edge[i][J],结束本像素标记.
像素标记算法的一个主要问题是对下凹即向上分叉图形的判断会使本属于一个目标的像素被标记不同的标记值.本文的方法是,先把同属一个目标的两目标值成对记录在一等价标记数组中,待全图扫描完毕后再对这一等价标记组数进行处理分析.记录是在每标记完一个边界像素后进行的,先判断它是否处于
~个下凹形状的底部.判断方法是看该像素和它右上方像素是否都是目标边界像素并且标记值不同,如成立则在数组Samel中成对依次按行记录下这两个等价标记值,以用于下面的处理.图1给出了一幅较复杂图像的实例,该图包含了像素标记中可能遇到的大多数情况,图中己把扫描后得到的非零Edge[i][.『]值
标在了对应像素上,且每个下凹的判断区域也已用粗方框标出,图2是扫描图1后得到的Samel数组.
4.2扫描后的处理
一次全图扫描后的处理是本算法的关键,处理过程分两步:
第一步:
归类.前面记录的等价标记数组只是记录了两两等价的情况,而实际上例如1和2等价,2和4等价,那么1、2、4标记值都等价,标以1、2、4的像素都属于同一目标,这一步的目的就是把同属一目标的标记值归成一类.这里需要补充的是,Same2数组是一个temp×
1维的数组,此数组第几行就对应原第几目标标记值的处理情况.如图3中的第一列,即为对应图1实例的Same2数组的初始情况(temp=9).针对扫描图1实例后得到的Samel数组,如图2,扫描完Samel的第一行后可知标记值3、2应属于同一物体,于是对应到Same2的第三行和第二行,因为Same2(3)=Same2
(2)=0,知它们还均未归类,则把它们都赋为kind=kind+1即为1;
同理扫描Samel的第二、第三行并改变Same2的对应值;
接着是Samel的第四行,因为Same2(3)=1、Same2(4)=2,说明两标记值都已归类但类别不同,由于两者等价所以它们应同属一类,于是把Same2中所有为2的改为1;
最后是Samel的第五行,Same2
(1)=0而Same2
(2)=1,说明标记值1还未归类而标记值2已归类,所以把Same2
(1)改为1.图3从左至右是Same2的具体变化情
况.第二步:
标以正确的目标值.经过上一步归类后,属于同一目标的像素标记值都已经归成.类,有几类就有几个带下凹的目标,再加上0的个数(不带下凹的目标个数)就是实际目标总数.顺次扫描Same2,遇0则说明以该行行号标示的目标为一没有下凹的目标,result加1赋予Same3的同一行,遇非零数字则看
它是否第一次出现,如是第一次出现则result加1并赋予Same3同一行,如Same2这一行的值不是第一次出现,则把前面具有相同数字那一行在Same3中同行的值赋予Same3的这一行.Same3最终结果如图4所示,最后一行的值4就是图像中所包含的正确目标总数.经检验完全符合实际情况
根据得到的正确目标值,可方便地进行一些后续处理.对全图扫描后得到的Edge[i][]进行必要的修正,就可以把由于下凹而错标的目标边界值纠正过来,从而得到完整正确的目标边界信息.据此可按不
同灰度勾勒出目标的单像素边界,还可根据以上处理得到的数据,统计出各个目标的实际面积、周长和质
心坐标等目标特征值.
五计算机模