数字图像处理部分课后习题参考答案newWord格式.docx
《数字图像处理部分课后习题参考答案newWord格式.docx》由会员分享,可在线阅读,更多相关《数字图像处理部分课后习题参考答案newWord格式.docx(17页珍藏版)》请在冰豆网上搜索。
支持交错(对于渐近式JPEG文件)。
JPEG广泛支持Internet标准。
缺点:
有损耗压缩会使原始图片数据质量下降。
当您编辑和重新保存JPEG文件时,JPEG会混合原始图片数据的质量下降。
这种下降是累积性的。
不适用于所含颜色很少、具有大块颜色相近的区域或亮度差异十分明显的较简单的图片。
是最常见的格式之一。
BMP:
Windows位图
Windows位图可以用任何颜色深度(从黑白到24位颜色)存储单个光栅图像。
Windows位图文件格式与其他MicrosoftWindows程序兼容。
它不支持文件压缩,也不适用于Web页。
从总体上看,Windows位图文件格式的缺点超过了它的优点。
为了保证照片图像的质量,请使用PNG文件、JPEG文件或TIFF文件。
BMP文件适用于Windows中的墙纸。
BMP支持1位到24位颜色深度。
BMP格式与现有Windows程序(尤其是较旧的程序)广泛兼容。
BMP不支持压缩,这会造成文件非常大,BMP文件不受Web浏览器支持。
GIF:
图形交换格式;
GIF图片以8位颜色或256色存储单个光栅图像数据或多个光栅图像数据。
GIF图片支持透明度、压缩、交错和多图像图片(动画GIF)。
PGIF透明度不是alpha通道透明度,不能支持半透明效果。
GIF压缩是LZW压缩,压缩比大概为3:
GIF文件规范的GIF89a版本中支持动画GIF。
GIF广泛支持Internet标准。
支持无损耗压缩和透明度。
动画GIF很流行,易于使用许多GIF动画程序创建。
很多QQ表情都是GIF的~
GIF只支持256色调色板,因此,详细的图片和写实摄影图像会丢失颜色信息
第四章
1.如下表:
pr(rk)、pz(zl)分别表示原直方图与规定直方图
一、对原直方图进行均衡化处理,得到映射关系rk→sk(第四列)
二、对规定直方图进行均衡化处理,得到映射关系zl→vl(第五列):
rk
pr(rk)
pz(zl)
sk=T(rk)
vk=G(zl)
rk=>
zl
规定化后的
直方图
r0
0.14
0.141/7
r0=>
z3
r1
0.22
0.363/7
r1=>
z4
r2
0.26
0.624/7
r2=>
z5
r3
0.17
0.19
0.796/7
0.19
r3=>
z6
0.14
r4
0.09
0.25
0.886/7
0.44
r4=>
0.22
r5
0.06
0.21
0.947/7
0.65
r5=>
z7
0.26
r6
0.04
0.24
0.987/7
0.89
r6=>
r7
0.02
0.11
1.007/7
1
r7=>
0.12
三、对于每个sk,迭代计算出满足下式的最小vl,得到映射关系sk→vl,再由rk→sk得到rk→vl,最后由zl→vl的逆变换vl→zl求出rk→zl的变换:
对k=0,l=3时,v3-s0=0.19-0.14>
=0,开始满足上式,于是有r0=>
z3
对k=1,l=3时,v4-s1=0.44-0.36>
=0,开始满足上式,于是有r1=>
z4
对k=2,l=3时,v5-s2=0.65-0.62>
=0,开始满足上式,于是有r2=>
z5
对k=3,l=3时,v6-s3=0.89-0.79>
=0,开始满足上式,于是有r3=>
z6
对k=4,l=3时,v6-s4=0.89-0.88>
=0,开始满足上式,于是有r4=>
对k=5,l=3时,v7-s5=1.00-0.94>
=0,开始满足上式,于是有r5=>
z7
对k=6,l=3时,v7-s6=1.00-0.98>
=0,开始满足上式,于是有r6=>
对k=6,l=3时,v7-s7=1.00-1.00>
=0,开始满足上式,于是有r7=>
直方图规定化结果如最后一列所示,规定化后的直方图与规定直方图基本一致。
2.
nk
sk
ps(sk)
560
0=>
920
1=>
3
0.143
1046
2=>
4
0.286
705
3=>
6
0.429
356
4=>
0.571
267
0.07
0.714
170
0.997/7
5,6,7->
7
0.857
72
0.13
3.
原图
3*3领域平均法
2
255
58
30
59
87
32
31
88
60
5
8
62
3*3中值滤波
4.2*m+1
5.
均值滤波:
把每个像素都用周围的8个像素来做均值操作。
可以平滑图像,速度快,算法简单。
但是无法去掉噪声,这能微弱的减弱它。
中值滤波:
常用的非线性滤波方法,也是图像处理技术中最常用的预处理技术。
它在平滑脉冲噪声方面非常有效,同时它可以保护图像尖锐的边缘。
8.为什么一般情况下对离散图象的直方图均衡化并不能产生完全平坦的直方图?
由于离散图象的直方图也是离散的,其灰度的累积分布函数是一个不减的阶梯函数。
如果映射后的图象仍能取到所有256级灰度,那一定是原图象没有任何改变,这种情况只可能发生在原图象的直方图已经是一条水平线的情况下。
一般情况下映射后所得到的图象只能取到少于256级灰度,这样在变换后的直方图中会有某些灰度级空缺,当然这些空缺应该均匀分布在0到255之间。
于是问题就变成了将原有的256个值,即各灰度的概率,按顺序分成n(n<
256)份,每份的概率总和应该相等。
显然这个问题是不一定有解的,因此我们只能找到一个近似解。
其结果就是最后得到一幅有空缺且不太平坦的直方图
9.不会发生变化,因为再次均衡化,所用的变换函数是首次均衡化后得到的增强图像的累积直方图,不会改变其结果。
10.
相同点:
都能减弱或消除傅立叶空间的某些分量,而不影响或较少影响其他分量,从而达到了增强某些频率分量的效果。
不同点:
平滑滤波器减弱或消除了傅立叶空间的高频分量,所以达到了增强低频分量,平滑图像中细节的效果。
锐化滤波器减弱或消除了傅立叶空间的低频分量,所以达到了增强高频分量,锐化图像中细节的效果。
:
两者效果相反,互为补充,从原始图像中减去平滑滤波器的结果得到锐化滤波器的效果,而从原始图像中减去锐化滤波器的结果则可得到平滑滤波器的结果。
第五章:
P105
1.
-2
水平模板
垂直模板
+45
-45
2.如下图,假设有四种角点:
-1
检测左上角
检测右上角
检测左下角
5.参见教材P83
第六章P141
2.一般地,按比例将原图像放大k倍时,如果按照最近邻域法则需要将
一个像素值添在新图像的k×
k的子块,如果放大倍数太大,按照这种方法
处理会出现马赛克效应。
为了提高几何变换后的图像质量,常采用线性
插值法。
该方法的原理是,当求出的分数地址与像素点不一致时,求出周
围四个像素点的距离比,根据该比率,由四个邻域的像素灰度值进行线
性插值
4.图像旋转之后,会出现许多的空洞点。
对这些空洞点必须进行填充处理,否则画面效果不好。
一般也称这种操作为插值处理。
最简单的方法是行插值方法或列插值方法:
列插值算法如下:
1找出当前列的最小和最大的非白点的坐标,记作(k1,j)、(k2,j)。
2在(k1,k2)范围内进行插值,插值的方法是:
空点的像素值等于上一点的像素值。
3同样的操作重复到所有列。
经如上的插值处理之后,图像效果就变得自然了
5.变换矩阵:
T=
0.70700.70700
-0.70700.70700
001.0000
本题图像共有16个像素,变换前的3×
16矩阵如下:
P0=
1234123412341234
1111222233334444
1111111111111111
变换后的3×
16矩阵:
P=T*P0
1234234434454456
0-1-1-210-1-1110-12110
变换结果如下图所示
X坐标
Y坐标
57
4,-2
2,-1
3,-1
59,57
4,-1
5,-1
1,0
3,0
4,0
56
6,0
1,1
2,1
3,1
4,1
61
59,61
5,1
1,2
2,2
3,2
4,2
1,3
2,3
3,3
4,3
1,4
2,4
3,4
4,4,
旋转后进行“行插值”
旋转后进行“列插值”
6.
f(221,396)=18,f(221,397)=45,f(222,396)=52,f(222,397)=36,试分别用最邻近插值法和双线性插值法,分别计算f(221.3,396.7)的值.
解:
设
1.已知点(221.3,396.7)的周围像素的灰度值,用最邻近插值法,求点(221.3,396.7)的灰度值,
∵221.3-221<
222-221.3且396.7-396>
397-396.7,即所求点离点(221.397)最近
∴f(221.3,396.7)=f(221,397)=45
2.双线性插值法,设x,y为所求点至点(221,396)的x,y坐标增量,如图所示:
f(x,396)=f(221,396)+x*(f(222,396)-f(221,396))
=18+34*x
f(x,397)=f(221,397)+x*(f(222,397)-f(221,397))
=45-9*x
f(x,y)=f(x,396)+y*(f(x,397)-f(x,396))
=18+34*x+y*(45-9*x-18-34*x)
=18+34x+27y-43xy
∴f(0.3,0.7)=38
7.
首先将原点平移到(100,260)
即
A=
10-100
01-260
001
然后旋转
B=
cos60-sin600
sin60cos600
然后在平移回来
C=
10100
01260
000
以上变换为复合变换矩阵T=C*B*A
注意是用的齐次坐标[x,y,1]'
=T[X0Y01]’
第七章:
1、图像的频域处理就是把图像从空间域变换到频域,分析图像的频谱特性,据此进行图像处理;
它的理论基础是:
“任何波形都可以用单纯的正弦波的加权和表示”
2.常用变换:
①傅里叶变换:
它是应用最广泛和最重要的变换。
它的变换核是复指数函数,转换域图像是原空间域图像的二维频谱,其“直流”项与原图像亮度的平均值成比例,高频项表征图像中边缘变化的强度和方向。
为了提高运算速度,计算机中多采用傅里叶快速算法。
②沃尔什-哈达玛变换:
它是一种便于运算的变换。
变换核是值+1或-1的有序序列。
这种变换只需要作加法或减法运算,不需要象傅里叶变换那样作复数乘法运算,所以能提高计算机的运算速度,减少存储容量。
其他还有余弦变换、正弦变换等也在图像处理中得到应用
3、不管是连续傅立叶变换还是离散傅立叶变换,变换域均反映了被变换域的频谱。
不同:
1)连续傅立叶变换,信号量和自变量均是连续的,而离散傅立叶变换,自变量和信号量均是离散的。
2)连续傅立叶变换,信号可以是无限长的,信号量也可以是无穷大;
而对于离散傅立叶变换,信号应该是有限长的,信号量也应该是有限值,
才能用计算机进行处理。
5、根据二维离散傅立叶变换的公式,有:
利用W的周期性,得:
W2=-W0,W4=W0,W6=-W0,
和W的对称性,得:
W3=-W1,W2=-W0,
则有:
(写到上式就可以了)
f=[0102;
0304;
0506;
0708]
p=[1111;
1-j-1j;
1-11-1;
1j-1-j]
第八章
1)膨胀的结果为半径为5*r/4的圆(图略)
2)膨胀的结果为边长为为3*r/2的正方形,在直角处用半径为r的内切圆弧连接
(图略)
3)为简化问题,设图像为等边三角形,则膨胀结果是边长为3*r/2和等边三角形,在夹角处以半径为r/4的圆弧连接
4)
a.腐蚀的结果为半径为3*r/4的圆(图略)
b.腐蚀的结果为边长为为r/2的正方形(图略)
c.为简化问题,设图像为等边三角形,则腐蚀结果是边长为0.134r的等边三角形
第九章
1、
x=imread('
baboon.bmp'
);
[mnk]=size(x);
y=uint8(zeros(m,n,k));
y(:
:
1)=x(:
1);
2)=x(:
3);
3)=x(:
2);
figure,imshow(x),title('
原图像'
figure,imshow(y),title('
交换绿蓝通道'
z=x;
z(:
3)=2*x(:
3)
fori=1:
1:
m
forj=1:
n
if(z(i,j,3)>
255)
z(i,j,3)=255
end
end
figure,imshow(z),title('
蓝色通道加倍'
2、
依题意,R=200,G=50,B=150
第十一章:
1.现有8个待编码符号M0,M1,……,M7,它们的概率分别为0.40,0.25,0.11,0.09,0.06,0.04,0.03,0.01,试求这一组符号的信号熵,利用哈夫曼编码求出这一组符号的编码,画出哈夫曼树,并计算平均码长和编码效率。
平均码长:
R=1*0.39+2*0.25+4*0.11+5*0.05+5*0.06+4*0.08+5*0.02+5*0.04=2.5
图像的熵H为:
编码效率:
η=H/R=2.43/2.5=97.2%
2.二分法香农-范诺编码方法。
其步骤如下:
1)首先统计出每个符号出现的概率;
2)从左到右对上述概率从大到小排序;
3)从这个概率集合中的某个位置将其分为两个子集合,并尽量使两个子集合的概率和近似相等,给前面一个子集合赋值为0,后面一个子集合赋值为1;
4)重复步骤3,直到各个子集合中只有一个元素为止;
5)将每个元素所属的子集合的值依次串起来,即可得到各个元素的香农-范诺编码。
码字
符号
出现概率
M4
0.39
0.39(0)
100
M7
0.25
0.61
(1)
0.36(0)
0.25(0)
101
M0
0.11