数字图像处理答案Word格式文档下载.docx
《数字图像处理答案Word格式文档下载.docx》由会员分享,可在线阅读,更多相关《数字图像处理答案Word格式文档下载.docx(46页珍藏版)》请在冰豆网上搜索。
F(u)=∑f(x)exp(-j2πux/N),其中N是2的M(整数)次幂。
令f(2r)=f1(r);
f(2r+1)=f2(r),
则F(u)=∑f(2r)exp[-j2πu(2r)/N]
+∑f(2r+1)exp[-j2πu(2r+1)/N]
=∑f(2r)exp[-j2πu(2r)/N]
+exp(-j2πu/N)f(2r+1)exp[-j2πu(2r)/N]
=F1(u)+exp(-j2πu/N)F2(u)
因此,F(u)可以分为2个(N/2)长的序列的傅里叶变换。
若一直分下去,则最终被划分为两两一组,即快速傅里叶变换。
DISP3
1.
a.可分离性:
b.快速算法可行性:
首先证明一维情况下的快速算法FWT:
又由沃尔什变换的可分离性及其对称性,可知:
对于二维沃尔什变换W(u,v),可先针对x变量用FWT求出W(u,y),接着再针对y变量用FWT求出W(u,v)。
所以可知二维沃尔什变换是具有可行性的。
2.∵
∴
快速计算一个N点DCT可以通过2N点FFT实现:
①将x(n)补N个零点形成2N点序列x2N(n)点;
②用FFT求x2N(n)的DFT,得X2N(k);
③将X2N(k)乘以e-jkπ/2N,后取实部,得X2N’(k);
④对于奇异点,做如下处理:
这样,便完成N点FDCT的计算。
DISP4
1、试述直方图均衡化的增强原理。
直方图均衡化是最常见的间接接对比度增强方法之一。
直方图均衡化则通过使用累积函数对灰度值进行“调整”以实现对比度的增强。
直方图均衡化处理的“中心思想”是把原始图像的灰度直方图从比较集中的某个灰度区间变成在全部灰度范围内的均匀分布。
直方图均衡化就是对图像进行非线性拉伸,重新分配图像像素值,使一定灰度范围内的像素数量大致相同。
直方图均衡化就是把给定图像的直方图分布改变成“均匀”分布直方图分布。
直方图均衡化的基本思想是把原始图的直方图变换为均匀分布的形式,这样就增加了象素灰度值的动态范围从而可达到增强图像整体对比度的效果。
综上所述,直方图均衡可以达到增强图像的效果。
2、试述规定化直方图增强原理。
在实际应用中,希望能够有目的地增强某个灰度区间的图像,即能够人为地修正直方图的形状,使之与期望的形状相匹配,这就是直方图规定化的基本思想。
换句话说,希望可以人为地改变直方图形状,使之成为某个特定的形状,直方图规定化就是针对上述要求提出来的一种增强技术,它可以按照预先设定的某个形状来调整图像的直方图。
直方图规定化是在运用均衡化原理的基础上,通过建立原始图像和期望图像之间的关系,选择地控制直方图,使原始图像的直方图变成规定的形状,从而弥补了直方图均衡不具备交互作用的特性。
其增强原理是先对原始的直方图均衡化:
S=T(r),同时对规定的直方图均衡化:
v=G(z),由于都是均衡化,故令S=v,则:
z=G-1(v)=G-1[T(r)]。
DISP5
1、探讨图象平滑与图象锐化的异同点及它们的适用领域。
区别:
锐化处理的主要目的是突出图像中的细节或者增强被模糊了的细节,这种模糊不是由于错误操作,就是特殊图像获取方法的固有影响。
图象锐化是用于增强边缘,导致高频分量增强,会使图象清晰。
图像锐化处理的方法多种多样,其也包括多种应用,从电子印像和医学成像到工业检测和军事系统的制导,等等。
锐化主要使用基于二阶微分的图像增强——拉普拉斯算子。
图象平滑用于模糊处理和减小噪声,对图象高频分量即图象边缘会有影响。
模糊处理经常用于预处理,例如,在提取大的目标之前去除图像中一些琐碎的细节、桥接直线或曲线的缝隙。
通过线性滤波器和非线性滤波器的模糊处理可以减小噪声。
平滑滤波器的概念非常直观。
它用滤波掩模确定的邻域内像素的平均灰度值去代替图像每个像素点的值,这种处理减小了图像灰度的“尖锐”变化。
相同点:
都属于图象增强,改善图象效果。
2、探讨空域增强处理与频域增强处理的特点,比较其性能。
空域增强算法是图像增强技术的一种,直接对图像的象素(灰度值)进行处理,不需要进行变换。
常见的增强算子如锐化算子、高通算子、平滑算子等,可以完成图像的边缘提取、噪声去除等处理。
这里,采用空域法进行处理,其模型为:
f(x,y)-------增强函数h(x,y)-------g(x,y)
记为 g(x,y)=EH[f(x,y)]
式中 f(x,y)———代表待增强的图像;
h(x,y)———空域增强函数;
EH———增强操作。
空域变换增强根据对图像的每次处理是对单个像素进行的或是对小的子图像(模板)进行的,可分为2组:
基于像素(点)的和基于模板的。
在基于像素的处理(也叫点处理)中,增强过程对每个像素的处理与其他像素无关;
而模板处理则是指每次处理操作都是基于图像中的某个小区域进行的。
各种空域滤波处理根据功能又主要分成平滑的和锐化的目的。
平滑可用低通滤波器实现。
平滑的目的又可分应会受到很大影响,需要视每次试验的实际情况调整PID参数的值。
频域增强:
主要是在频域内对图像进行变换。
频率域增强算法的处理基础是傅立叶变换和滤波技术,主要有低通滤波(平滑)、高通滤波(锐化)、同态滤波等。
一般来说,图像的边缘和噪声都对应于傅立叶变换的高频分量,而低频分量主要决定图像在平滑区域中总体灰度级的显示,故被低通滤波的图像比原图像少一些尖锐的细节部分。
同样,被高通滤波的图像在图像的平滑区域中将减少一些灰度级的变化并突出细节部分.
在频域空间,图像的信息表现为不同频率分量的组合。
如果能让某个范围内的分量或某些频率的分量受到抑制而让其他分量不受影响,就可以改变输出图的频率分布,达到不同的增强目的。
频域空间的增强方法有两个关键:
1.将图像从图像空间转换到频域空间所需的变换(T)以及再将图像从频域空间转换回图像空间所需的变换
2.在频域空间对图像进行增强加工的操作(EH)
频域空间的增强方法三个步骤:
a.将图像从图像空间转换到频域空间(如傅里叶变换)
b.在频域空间对图像进行增强
c.将增强后的图像再从频域空间转换到图像空间
在频率域中进行增强的操作步骤:
(即上面的第2步)
a.计算需增强图像的傅里叶变换f(x,y)->
F(u,v)
b.将其与一个转移函数相乘F(u,v)*H(u,v)
c.再将结果傅里叶反变换以得到增强的图像G(u,v)->
g(x,y)
转移函数的设计要根据增强目的进行,其基本思路是要允许一定频率通过,限制或消减另外一些频率。
常用频域增强方法根据滤波特点,特别是消除或保留的频率分量可以分为:
1.低通滤波2.高通滤波3.带通和带阻滤波4.同态滤波
1、1920*1080、50帧/秒的高清彩色电视信号(8bit量化)用6Mbps的网络传输时,对应的压缩比是多少?
解:
1920×
1080×
50×
8×
3/(1024*1024)=2373Mbps
2373:
6=395:
1
2、简述三大图象编码技术各自的工作原理、特点。
并根据其各自特点,组合设计一种具有较高编码效率的图象压缩方法。
熵编码:
基于信号统计特性的编码技术,是一种无损编码。
在信源数据中出现概率越大的符号,编码以后相应的码长越短;
出现概率越小的符号,其码长越长,从而达到用尽可能少的码符表示信源数据。
常见的熵编码有行程编码、哈夫曼编码和算术编码。
预测编码:
根据数据在时间和空间上的相关性,利用已有样本对新样本进行预测,将样本的实际值与其预测值相减得到误差值,再对误差值进行编码。
通常误差值比样本值小得多,从而达到数据压缩的效果。
变换编码:
以某种可逆的正交变换把给定的图像变换到另一个数据/频率域,从而利用新的数据域的特点,用一组非相关数据(系数)来表示原图像,并以此来去除或减小图像在空间域中的相关性,将尽可能多的信息集中到尽可能少的变换系数上,使多数系数只携带尽可能少的信息,实现用较少的数据表示较大的图像数据信息,进而达到压缩数据的目的。
JPEG编码:
JPEG编码中DCT编码方式。
主要编码方法为:
1)数据分块:
对每个图象分割成不重叠的8*8像素块,每一个像素块称为一个数据单元。
2)DCT处理:
图象数据块分割后,以MCU为单位顺序将DU进行二维离散余弦变换。
得到64个系数代表了该图像的频率成分,其中,直流系数DC在左上角,其余的63个叫做交流系数AC
3)系数量化:
在DCT处理得到64个系数中,对直流分量和交流分量进行不同的量化,支流分量细量化,交流分量粗量化。
4)Z形扫描:
量化后,构成一个稀松矩阵。
为了保证低频分量先出现,高频分量后出现,以增加形成中连续“0”的个数,剩余63个元素采用Z型扫描。
。
——采用变换编码,把给定的图像变换到另一个数据/频率域,从而利用新的数据域的特点,将尽可能多的信息集中到尽可能少的变换系数。
5)DC系数编码:
对DC系数作差分编码,用前一数据块的同一分量的DC系数作为当前块的预测值,再对当前块的实际值与预测值的差值作哈夫曼编码。
——预测编码,根据数据空间上的相关性,将样本的实际值与其预测值相减得到误差值,再对误差值进行编码。
6)AC系数编码:
经过Z形排列的AC系数,更有可能出现连续0组成的字符串,从而对其进行行程编码有利于压缩数据。
——行程编码,用行程的灰度和行程的长度代替行程本身,去除像素冗余。
DISP9
1、当图象直方图呈双峰特性时,如何确定二值化的阈值?
当图象直方图呈单峰特性时,又
如何确定二值化的阈值?
当图象直方图呈双峰特性时,如下图,双峰的波谷最为分割阈值,也可以用求导的方法,来求出确切的值:
P(z)的导数等于0,且P(z)的二阶导为0既可求出.
阈值T=P(z)
图象直方图呈单峰特性时:
a
可以采用迭代算法:
1:
选择一个初始阈值T1;
2:
根据初始阈值T1将图像分割为G1和G2两部分。
G1包含所有小于等于T1的像素,G2包含所有大一等于T1的像素。
分别求出G1和G2的平均灰度值U1和U2.
3:
计算新的阈值T2=(U1+U2)/2
4:
如果|T2-T1|<
=T0(T0为预先设定的很小的正数),即迭代过程中前后2次的阈值很接近时,迭代完成,否则重复2,3步骤
b
也可以根据初始阈值所产生的二值图像来判断应该增加还是减少,并且多次判断,得到一个比较合适的阈值
2、试述轮廓追踪的基本原理和操作步骤。
轮廓跟踪的基本原理:
轮廓跟踪是二值图象中常用到的一种基本操作。
就拿给连接成分的标记来说,要计算机去识别这是一个连接成分,必须让它自动去把这个成分找出来,然后才能去标记或填充。
在医用图象处理,希望提取二值图象的区域形状特征,如区域轮廓形状、面积大小、周长……,也需要轮廓跟踪这一操作。
一个连通的像素集合R的轮廓定义为:
它至少有一个d-近邻不在R内的所有R中像素的集合。
注意的是
(1)定义中提出的判别条件是4-邻域,而不是8-邻域。
(2)定义中提出,4-邻域中至少有一个像素不在R内,不能没有。
(3)如果4-邻域均不在像素的集合R内时,可以分两种情况来考虑:
①如果它的8-邻域中的1,3,5,7方向中的任一个存在R内时,该像素可能构成轮廓像素。
②如果当前像素的4-邻域均不在R内,且1,3,5,7方向上的像素也不在R内,这是一种特殊情况,则当前像素为孤立点。
一个连接成分,总可以认为它存在一个封闭的轮廓。
因此,一个轮廓上的像素总可以有一条通路来跟踪它。
轮廓跟踪就是通过顺序找出边缘点来跟踪边界的。
轮廓跟踪的基本步骤:
若图象是二值图像或图像中不同区域具有不同的像素值,但每个区域内的像素值是相同的,则如下可以完成基于4连通域或8连通区域的轮廓跟踪。
步骤1:
首先按从上到下,从左到右的顺序扫描图像,寻找没有标记跟踪结束记号的第一个边界起始点Ao,Ao是具有最小行和列值的边界点。
定义一个扫描方向变量dir,该变量用于记录上一步中沿着前一个边界点到当前边界点的移动方向,其初始化取值为:
(1)
对4连通区域取dir=3
(2)
对8连通区域取dir=7
步骤2:
按逆时针方向搜索当前像素的3*3邻域,其初始搜索方向设定如下:
对4连通区域取(dir+3)mod4
对8连通区域,若dir为奇数取(dir+7)mod8,若dir为偶数取(dir+6)mod8
在3*3邻域中搜索到的第一个与当前像素值相同的像素便为新的边界点An,同时更新变量dir为新的方向值。
步骤3:
如果An等于第二个边界点A1且前一个边界点An-1等于第一个边界点A0,则停止搜索,结束跟踪,否则重复步骤2继续搜索。
步骤4:
由边界点A0、A1、A2、…、An-2构成的边界便为要跟踪的边界。
上述步骤是图像轮廓跟踪最基本的算法,它只能跟踪目标图像的内边界(边界包含在目标点集内),另外,它也无法处理图像中的孔和洞。
如果连接成分的内部存在有孔,根据要解决问题的需要对轮廓也需要标记时,那外轮廓跟踪一次,孔的轮廓也应跟踪一次,一般来说,如果外轮廓沿逆时针方向跟踪时,则内轮廓(孔轮廓)沿顺时针方向跟踪。
3、探讨二值图象细化的几种算法,并比较其优缺点。
二值图像细化的算法有:
中轴转换法:
它是用一个连接成分的中轴来代表该连接成分细化的结果。
所谓一个连接成分的中轴,可以这样来定义:
假定用R表示这个连接成分的像素集合,B是它的轮廓。
对集合R中的每一个像素X,寻找它在轮廓B上最近的近邻像素M,为像素X到B上的最小距离。
如果X有多余一个这样的近邻,它被认为是属于R中的中轴上的像素。
其优点是:
①形状简单的轮廓与中心轴大致相符。
其细化结果(连接成分的中轴)基本上反映了区域内部结构和轮廓形状;
②中轴的分叉处与轮廓外形无简单的对应关系。
缺点是轮廓上小的扰动,造成中轴线的变化很敏感,一般来说,由于连接成分多是无规则的,轮廓处存在凸、凹的可能性很大,这必将造成采用中轴转换法来反映轮廓形状的失真。
骨架法:
①
内切圆模型:
采用一个可任意改变直径大小的圆盘,连接成分由一系列的而这些最大圆盘来描述。
这些盘与连接成分的轮廓相切。
连接成分的骨架可以看成是这一系列最大内切圆盘圆心的连线。
优点是对轮廓小扰动的灵敏度有所降低。
缺点是
(1)受轮廓小扰动的影响并未消除;
(2)实施起来最大的困难是寻找它的圆心,往往要耗费很多的时间。
②
波前模型:
连接成分的轮廓可以考虑成波传播的某一瞬间的波前。
波前向区域内部传播,当它们第一次相遇时的交点就形成了骨架。
区域的初始轮廓就是某一瞬间的波前,经过时间后,向内传播的结果又构成新的波前,经过2,3…直到它们相遇时为止,骨架就形成了。
初始轮廓经过后形成新波前的过程,可以看成是轮廓上的像素向区域内收缩距离为1的过程,新的波前继续向内传播下一个,又可看成一个新的轮廓按8-邻域距离又向内移动1个像素。
其与内切圆模型相比较,计算速度要快很多。
③
固定轮廓上某特殊点的逐层收缩法:
采用波前模型,对某一类图形区域来说容易造成失真,如正方形区域。
而固定轮廓上某特殊点的逐层收缩法就是克服这一缺点,当逐层删除轮廓像素时,保留住轮廓像素中的某些特殊点,当删除过程结束后,最后的区域轮廓加上这些特殊点就组成了该区域的骨架。
优点是:
所寻求的该连接成分的骨架,在大多数应用中既能反映区域的额内部结构,又能反映出区域的轮廓特征。
但是缺点就是为了确定轮廓上的特殊点以及计算机如何去识别它们而做到保留它们,这将会大大增加算法的复杂性。
④
保留轮廓上多重像素的轮廓跟踪法:
迭代轮廓跟踪算法,检查轮廓上的像素是否是多重的,如果是,则保留它们作为区域的骨架像素。
逐层剥离,最后得到细化的骨架。
缺点是有可能会将区域的连接性破坏,因此常常可能保留轮廓上的某些非多重像素,
⑤
用像素的连接数来找骨架:
像素的连接数是刻画像素及其邻域的局部特征的一个参数。
由公式Nc=1时为端点、Sxk不为1时为边缘点,确定图象上各象素的去留,最后获得骨架。
缺点是运算速度极慢。
(3)直观细化法:
首先分析你要细化的对象及其细化的目的,按具体情况具体分析的原则去选择或设计一种方法,来达到你所要求的目的。
比如在处理光干涉图像处理中,只要找到干涉条纹图像的灰度值的极大值和极小值,有序地连接这些极值点就构成了一幅细化图像。
该方法优点是速度快,效果好。
Disp8
1、用频域的方法建立运动模糊退化模型(x,y两方向移动),求出退化系统传递函数。
运动模糊模型g(x,y)如上所示:
x,y两方向移动时:
令x0(t)=at/T,y0(t)=bt/T
则退化系统传递函数为
H(u,v)=
∫exp(-2jπ[ux0(t)+vy0(t)])dt
=T*sin(πab(u+v))*exp(-jπab(u+v))/(πab(u+v))
2、探讨参变量维纳滤波中g的作用,如何求得最佳的参变量g。
(1)参变量维纳滤波中g的作用是:
通过调整参变量g使得维纳滤波器可以根据不同的实际需要达到期望的效果。
(2)利用均方误差最小原则求解最佳的参变量g。
设维纳滤波器的输入为含噪声的随机信号。
期望输出与实际输出之间的差值为误差,对该误差求均方,即为均方误差。
因此均方误差越小,噪声滤除效果就越好。
为使均方误差最小,关键在于求冲激响应。
如果能够满足维纳-霍夫方程,就可使维纳滤波器达到最佳。
根据维纳-霍夫方程,最佳维纳滤波器的冲激响应,完全由输入自相关函数以及输入与期望输出的互相关函数所决定。
DISP7
1、简述JPEG编码的压缩原理,探讨如何选择量化表。
(1)把一幅图像分8×
8的子块按图中的框图进行离散余弦正变换(FDCT)和离散余弦逆变换(IDCT)。
在编码器的输入端,原始图像被聚分成一系列8×
8的块,作为离散余统正变换(FDCT)的输入。
在解码器的输出端,离散余弦逆变换(IDCT)输出许多8×
8的数据块,用以重构图像。
(2)对DCT系数F(u,v)需作量化处理。
量化处理是一个多到一的映射它是造成DCT编解码信息损失的根源。
在JPEG标准中采用线性均匀量化器。
量化表元素随DCT变换系数的位置而改变,同一像素的亮度量化表和色差量化表不同值,将输入的频谱值除以量化表相应位置的值后取整输出。
量化表的尺寸也是64,与64个变换系数一一对应。
量化表中的每一个元素值为1至255之间的任意整数,其值规定了对应位置变换系数的量化器步长。
在接收端要进行逆量化。
(3)对量化后的DC系数和行程编码后的AC系数进行基于统计特性的熵编码。
DC系数是64个图像采样平均值。
因为相邻的8×
8块之间有强的相关性,所以相邻块的DC系数值很接近,对量化后前后两块之间的DC系数差值进行编码,可以用较少的比特数。
DC系数包含了整个图像能量的主要部分。
经量化后的63个AC系数编码以“Z”字形行程扫描。
量化后编码的AC系数通常有许多零值,沿“Z”字形路径行进,可使零AC系数集中,便于使用行程编码方法。
63个AC系数行程编码和码字,可用两个字节表示。
量化表的选择
DCT变换后的频谱图的例子,直流成份,低频成份,高频成份在后面。
采用非均匀量化,对不太需要的成份进行粗量化,主能量进行细量化,使得图像的有效信息得到一定压缩。
主能量主要在直流成份及低频成份,位于在左上方,所以除数选择较小的,进行精量化;
而高频成份位于下面右下角部分,可以进行粗量化,这种粗量化的结果就是很多高频系数都量化为0。
亮度进行精量化的频带比色度来得宽.
2、简述MPEG编码的压缩原理,分析视频图像压缩与静止图像压缩在技术上的区别。
MPEG编码过程:
帧内的每一组RGB值转换成亮度和色度信号YCrCb组,I图象变换后进行宏块变换编码,最后进行熵编码,类似于JPEG编码;
而P/B图象经过YUV变换形成YCrCb组后,与参考帧(I图象)进行比较,然后对活动部分误码差项进行变换编码,加入活动矢量,进行熵编码。
为了降低时间冗余度,MPEG采用了帧间数据压缩、运动补偿和双向预测。
MPEG采用了三种图像——帧内图象I、预测图象P和双向预测图象B。
帧内图象指原始图象,预测图象则是指活动部分的图象,双向预测图象是由原始的和预测的图象插补得到的图象。
具有中等程序压缩的帧内图象,提供随机存取的进入点。
预测图象是参考“过去”的图象(帧内的或已预测的