多媒体技术教程课后习题答案.docx

资源描述

多媒体技术教程课后习题答案.docx

《多媒体技术教程课后习题答案.docx》由会员分享，可在线阅读，更多相关《多媒体技术教程课后习题答案.docx（32页珍藏版）》请在冰豆网上搜索。

多媒体技术教程课后习题答案.docx

多媒体技术教程课后习题答案

《多媒体技术教程》

练习与思考题参考答案

林福宗

清华大学计算机科学与技术系

2008-2-10

linfz@

第1章多媒体技术概要

1.1多媒体是什么？

多媒体是融合两种或者两种以上媒体的一种人-机交互式信息交流和传播媒体。

使用的媒体包括文字、图形、图像、声音、动画和视像（video）。

1.2超链接是什么？

超链接（hyperlink）是两个对象或元素之间的定向逻辑链接，是一个对象指向另一个对象的指针。

建立互相链接的这些对象不受空间位置的限制，可在同一个文件、在不同的文件或在世界上任何一台连网计算机上。

1.3超文本是什么？

超文本是包含指向其他文档或文档元素的指针的电子文档。

与传统的文本文件相比，它们之间的主要差别是，传统文本是以线性方式组织的，而超文本是以非线性方式组织的。

这种文本的组织方式与人们的思维方式和工作方式比较接近。

1.4无损压缩是什么？

无损压缩是用压缩后的数据进行重构（也称还原或解压缩），重构后的数据与原来的数据完全相同的数据压缩技术。

无损压缩用于要求重构的数据与原始数据完全一致的应用，如磁盘文件压缩就是一个应用实例。

根据当前的技术水平，无损压缩算法可把普通文件的数据压缩到原来的1/2～1/4。

常用的无损压缩算法包括哈夫曼编码和LZW等算法。

1.5有损压缩是什么？

有损压缩是用压缩后的数据进行重构，重构后的数据与原来的数据有所不同，但不影响人对原始资料表达的信息造成误解的数据压缩技术。

有损压缩适用于重构数据不一定非要和原始数据完全相同的应用。

例如，图像、视像和声音数据就可采用有损压缩，因为它们包含的数据往往多于我们的视觉系统和听觉系统所能感受的信息，丢掉一些数据而不至于对图像、视像或声音所表达的意思产生误解。

1.6SGML是什么语言？

SGML语言的精华是什么？

HTML是什么语言？

HTML语言与SGML语言是什么关系？

（1）1986年国际标准化组织（ISO）采用的信息管理标准。

该标准定义独立于平台和应用的文本文档的格式、索引和链接信息，为用户提供一种类似于语法的机制，用来定义文档的结构和指示文档结构的标签。

（2）SGML的精华是把文档的内容与样式分开处理。

（3）HTML是用来创建超文本文档的标记语言，也是创建Web网页用的标记语言。

（4）HTML是SGML的一个子集。

1.7有人认为“因特网就是万维网”，这种看法对不对？

为什么？

（1）不对。

（2）因特网是专指全球范围内最大的、由众多网络相互连接而成的、基于TCP/IP协议的计算机网络；万维网是指分布在全世界所有HTTP服务器上互相连接的超媒体文档的集合。

1.8组成万维网的4个核心部分是什么？

（1）超文本传输协议（HTTP）；

（2）文档格式标准，包括HTML，XML，XHTML；

（3）执行HTTP协议的Web浏览器；

（4）执行HTTP协议的Web服务器。

1.9H.261~H.264和G.711~G.731是哪个组织制定的标准？

国际电信联盟（ITU）。

1.10MPEG-1，MPEG-2和MPEG-4是哪个组织制定的标准？

ISO/IEC，即国际标准化组织（ISO）/国际电工技术委员会（IEC）。

1.11因特网标准是哪个组织制定的标准？

因特网标准是ISOC（因特网协会或称互联网协会）协调的4个组制定的。

ISOC负责协调的4个组：

（1）因特网工程特别工作组（IETF）；

（2）因特网体系结构研究部（IAB）：

（3）因特网工程指导组（IESG）；（4）因特网研究特别工作组（IRTF）。

1.12HTML和XML语言是哪个组织制定的标准？

万维网协会（WorldWideWebConsortium,W3C）。

第2章无损数据压缩

2.1假设

是由3个事件组成的集合，计算该集合的决策量。

（分别用Sh，Nat和Hart作单位）。

2.2现有一幅用256级灰度表示的图像，如果每级灰度出现的概率均为

，

，计算这幅图像数据的熵。

=8（位），

也就是每级灰度的代码就要用8比特，不能再少了。

2.3现有8个待编码的符号

，它们的概率如练习_表2-1所示，计算这些符号的霍夫曼码并填入表中。

答案不唯一）。

练习表2-1

待编码符号

概率

分配的代码

代码长度（比特数）

0.4

0.2

000

0.15

001

0.10

011

0.07

0101

0.04

01000

0.03

010010

0.01

010011

2.4现有5个待编码的符号，它们的概率见练习表2-2。

计算该符号集的：

（1）熵；

（2）霍夫曼码；（3）平均码长。

练习表2-2

符号

概率

0.4

0.2

0.1

（1）熵

=-0.4×

（0.4）-2×0.2*

（0.2）-2×0.1

（0.1）

=0.4×1.3219+0.4×2.3219+0.2×3.3219=0.5288+-0.9288+0.6644=2.1220（位）

（2）编码树和霍夫曼码

练习图2-1编码树

编码表

符号

概率

霍夫曼码*

码长

所需位数

0.4

0.2

0.4

0.2

101

0.6

0.1

1001

0.4

0.1

1000

0.4

*代码分配不唯一

（3）平均码长

0.4+0.4+0.6+0.4+0.4=2.2（位/符号）

2.5使用算术编码生成字符串games的代码。

字符g,a,m,e,s的概率见练习表2-3。

练习表2-3

符号

概率

0.4

0.2

0.1

练习图2-2games的算术码

2.6你是否同意“某个事件的信息量就是某个事件的熵”的看法？

参考解答：

“信息量（informationcontent）是具有确定概率事件的信息的定量度量”，而“熵（entropy）是事件的信息量的平均值，也称事件的平均信息量（meaninformationcontent）”。

第3章数字声音编码

3.1音频信号的频率范围大约是多少？

话音信号频率范围大约是多少？

（1）Audio:

20~20000Hz

（2）Speech:

300~3400Hz

3.2什么叫做模拟信号？

什么叫做数字信号？

（1）幅度或频率发生连续变化的一种信号。

（2）以二进制代码形式表示有无或高低的一种信号。

3.3什么叫做采样？

什么叫做量化？

什么叫做线性量化？

什么叫做非线性量化？

（1）采样：

在某些特定的时刻对模拟信号进行测量的过程。

（2）量化：

幅值连续的模拟信号转化成为幅值离散的数字信号的过程。

（3）线性量化：

在量化时，信号幅度的划分是等间隔的量化。

（4）非线性量化：

在量化时，信号幅度的划分是非等间隔的量化。

3.4采样频率根据什么原则来确定？

奈奎斯特理论和声音信号本身的最高频率。

采样频率不应低于声音信号最高频率的两倍，这样就能把以数字表达的声音还原成原来的声音。

3.5样本精度为8位的信噪比等于多少分贝？

48分贝。

3.6声音有哪几种等级？

它们的频率范围分别是什么？

练习表3-1声音质量和数据率

质量

采样频率

（kHz）

样本精度

（bit/s）

单道声/

立体声

数据率（kb/s）

（未压缩）

频率范围

电话

单道声

64.0

200～3400Hz

11.025

单道声

88.2

20～15000Hz

22.050

立体声

705.6

50～7000Hz

44.1

立体声

1411.2

20～20000Hz

DAT

立体声

1536.0

20～20000Hz

3.7选择采样频率为22.050kHz和样本精度为16位的录音参数。

在不采用压缩技术的情况下，计算录制2分钟的立体声需要多少MB（兆字节）的存储空间（1MB=1024×1024B）

（22050×2×2×2×60）/（1024×1024）＝10.09MB

3.8什么叫做均匀量化？

什么叫做非均匀量化？

（1）均匀量化：

采用相等的量化间隔对采样得到的信号进行量化。

它是线性量化的另一种说法。

（2）非均匀量化：

采用非相等的量化间隔对采样得到的信号进行量化。

例如，对大的输入信号采用大的量化间隔，对小的输入信号采用小的量化间隔。

它是非线性量化的另一种说法。

3.9什么叫做m率压扩？

什么叫做A率压扩？

（1）在脉冲编码调制（PCM）系统中，一种模拟信号和数字信号之间进行转换的CCITT压（缩）扩（展）标准。

在北美PCM电话网中，使用m率压扩算法。

（2）在脉冲编码调制（PCM）系统中，一种模拟信号和数字信号之间进行转换的CCITT压（缩）扩（展）标准。

在欧洲电话网，使用A律压扩算法。

对于采样频率为8kHz，样本精度为13比特、14比特或16比特的输入信号，使用m律压扩编码或使用A律压扩编码，经过PCM编码器之后每个样本的精度为8比特，输出的数据率为64kbps。

3.10G.711标准定义的输出数据率是多少？

T1的数据率是多少？

T2的数据率是多少？

（1）G.711使用μ率和A率压缩算法，信号带宽为3.4kHz，压缩后的数据率为64kbps。

（2）T1总传输率：

1.544Mbps。

（2）T2总传输率：

6.312Mbps。

3.11自适应脉冲编码调制（APCM）的基本思想是什么？

根据输入信号幅度大小来改变量化阶大小的一种波形编码技术。

这种自适应可以是瞬时自适应，即量化阶的大小每隔几个样本就改变，也可以是音节自适应，即量化阶的大小在较长时间周期里发生变化。

3.12差分脉冲编码调制（DPCM）的基本思想是什么？

利用样本与样本之间存在的信息冗余度来进行编码的一种数据压缩技术。

这种技术是根据过去的样本去估算（estimate）下一个样本信号的幅度大小，这个值称为预测值，然后对实际信号值与预测值之差进行量化编码，从而就减少了表示每个样本信号的位数。

它与脉冲编码调制（PCM）不同的是，PCM是直接对采样信号进行量化编码，而DPCM是对实际信号值与预测值之差进行量化编码，存储或者传送的是差值而不是幅度绝对值，这就降低了传送或存储的数据量。

此外，它还能适应大范围变化的输入信号。

3.13自适应差分脉冲编码调制（ADPCM）的基本思想是什么？

ADPCM综合了APCM的自适应特性和DPCM系统的差分特性，是一种性能比较好的波形编码。

它的核心想法是：

（1）利用自适应的思想改变量化阶的大小，即使用小的量化阶（step-size）去编码小的差值，使用大的量化阶去编码大的差值；

（2）使用过去的样本值估算下一个输入样本的预测值，使实际样本值和预测值之间的差值总是最小。

第4章彩色数字图像基础

4.1什么叫做真彩色和伪彩色？

在一幅彩色图像中，每个像素值有R，G，B三个基色分量，每个基色分量直接决定显示设备的基色强度，这样产生的彩色称为真彩色。

例如用RGB5∶5∶5表示的彩色图像，R，G，B各用5位，用R，G，B分量大小的值直接确定三个基色的强度，这样得到的彩色是真实的原图彩色。

现在，通常把每个像素的颜色值用24位表示的颜色叫做真彩色。

24位表示的颜色总数：

224＝16777216种颜色。

4.2什么叫屏幕分辨率和图像分辨率？

查看你使用的计算机的所有屏幕分辨率。

（1）屏幕分辨率是显示设备再现图像的精细程度的度量方法；图像分辨率是图像精细程度的度量方法。

（2）在Windows的主界面下，单击鼠标器的右键→在弹出的菜单上点击“属性”→在弹出的“显示属性”窗口上点击“设置”按钮→然后点击“高级”按钮→在弹出的“默认监视器和…”窗口上点击“适配器”按钮→再点击“列出所有模式（L）…”按钮，就可看到你的计算机的所有屏幕分辨率。

4.3一个像素的RGB分量分别用3，3，2位表示的图像，问该幅图像的颜色数目最多是多少？

如果有一幅256色的图像，问该图的颜色深度是多少？

（1）256种；

（2）8位

4.4什么叫做γ校正？

在屏幕上显示用离散量表示的色彩时采用的一种色彩调整技术。

计算机显示器和电视采用的阴极射线管产生的光亮度与输入的电压不成正比，而是等于以某个常数为底，以输入电压为指数的数，这个常数称为γ，它的值随显示器的不同而改变，一般在2.5左右。

4.5什么叫做α通道？

它的作用是什么？

在每个像素用32位表示的图像表示法中的高8位，用于表示像素在一个对象中的透明度。

例如，用两幅图A和B混合成一幅新图New，新图的像素为：

Newpixel=（alpha）（pixelAcolor）+（alpha）（pixelBcolor）。

在计算机环境下，

通道可存储在帧缓冲存储器中的附加位平面上。

对于32位帧缓冲存储器，除高8位是

通道外，其余24位是颜色位，红、绿和蓝各占8位。

4.6PNG图像文件格式的主要特点是什么？

PNG用来存储灰度图像时，灰度图像的深度可多达16位，存储彩色图像时，彩色图像的深度可多达48位，并且还可存储多达16位的α通道数据。

4.7什么叫做图形（graphics）、图像（image）、位图（bitmap）和图形图像（graphicalimage）？

（1）图形：

按照数学规则用绘图软件（如AdobeIllustrator）或图形输入设备创建的图，如工程图和结构图。

（2）图像：

用像素值阵列表示的人物或场景的图。

（3）位图：

用像素值阵列表示的图。

（4）图形图像：

表示矢量图的位图。

第5章JPEG图像压缩与编码

5.1按照JPEG标准的要求，一幅彩色图像经过JPEG压缩后还原得到的图像与原始图像相比较，非图像专家难于找出它们之间的区别，问此时的最大压缩比是多少？

24:

5.2JPEG压缩编码算法的主要计算步骤是：

①DCT变换，②量化，③Z字形编码，④使用DPCM对直流系数（DC）进行编码，⑤使用RLE对交流系数（AC）进行编码，⑥熵编码。

假设计算机的精度足够高，问在上述计算方法中，哪些计算对图像的质量是有损的？

哪些计算对图像的质量是无损的？

参考解答：

算法名称

有损/无损

算法名称

有损/无损

①DCT变换

无损

④使用DPCM对直流系数（DC）进行编码

无损

②量化

有损

⑤使用RLE对交流系数（AC）进行编码

无损

③Z字形编码

无损

⑥熵编码

无损

5.3通过调查、试验和分析，把BMP，GIF，JPG和PNG格式的一些特性填入下表。

图像文件格式名称

BMP

GIF

JPG

PNG

有损还是无损压缩

无损

有损

无损

支持的最大颜色数

16777216

256

16777216

第6章颜色空间变换

6.1PAL制彩色电视使用什么颜色模型？

NTSC制彩色电视使用什么颜色模型？

计算机图像显示使用什么颜色模型？

（1）PAL制彩色电视：

YUV

（2）NTSC制彩色电视：

YIQ

（3）计算机图像显示设备：

RGB

6.2用YUV或YIQ模型来表示彩色图像的优点是什么？

为什么黑白电视机可看彩色电视图像？

（1）YUV表示法的优点：

①它的亮度信号（Y）和色度信号（U，V）是相互独立的，因此可以对这些单色图分别进行编码；②可以利用人眼的特性来降低数字彩色图像所需要的存储容量。

YIQ同样具有YUV的这两个优点。

（2）黑白电视能接收彩色电视信号的道理是利用了YUV/YIQ分量之间的独立性。

6.3在RGB颜色空间中，当R=G=B，且为任意数值时，问计算机显示器显示的颜色是什么颜色？

灰色

6.4在HSL颜色空间中，当H为任意值，S=L=0时，R，G和B的值是多少？

当H＝0,S=1,L＝0.5，R，G和B的值是多少?

（1）当H为任意值，S=L=0时，R=G=B=0

（2）当H＝0,S=1,L＝0.5时，R＝1，G＝B＝0

6.5打开Windows操作系统中的“画图”程序，在“编辑颜色”窗口中的红（R）、绿（G）、蓝（B）和色调（H）、饱和度（S）、亮度（L）对应显示上，如果设置R=G=B＝255，问H,S和L的值分别为多少？

分别改变R，G和B的值，观察H，S和L值的变化。

当R=G=B＝255时，H＝160，S=0，L=240。

（2）（略）

6.6什么是颜色空间？

对人、显示设备和打印设备，通常采用什么颜色参数来定义颜色？

（1）颜色空间：

表示颜色的一种数学方法，人们用它来指定和产生颜色，使颜色形象化。

（2）对于人来说，可以通过色调、饱和度和明度来定义颜色；对于显示设备来说，人们使用红、绿和蓝磷光体的发光量来描述颜色；对于打印或者印刷设备来说，人们使用青色、品红色、黄色和黑色的反射和吸收来产生指定的颜色。

6.7用MATLAB编写RGB到HSL和HSL到RGB颜色空间的转换程序：

rgb2hsl.m和hsl2rgb.m。

（略）

6.8用MATLAB编写Y'CbCr和R'G'B'[0,219]颜色空间的转换程序：

RGB2YCbCr.m和YCbCr2RGB.m。

（略）

第7章小波与小波变换

7.1写出矢量空间

的哈尔小波。

7.2写出4×4哈尔小波变换矩阵。

先写出：

，

（1）4×4哈尔小波变换矩阵：

（2）规范化的4×4哈尔小波变换矩阵：

7.3使用MATLAB中的多级一维小波分解函数例程（function）wavedec，对例7.2所示的函数作小波变换。

（略）

7.4使用规范化的小波变换算法，用MATLAB编写一个M文件，重新计算

的哈尔小波变换。

（略）

第8章彩色数字电视基础

8.1电视是什么？

电视制是什么？

世界上主要的彩色电视制有哪几种？

（1）电视是捕获、广播和接收活动图像和声音的远程通信系统；

（2）电视制（televisionsystem）是传输图像和声音的方法；（3）目前世界上使用的彩色电视制式主要有PAL，NTSC，SECAM三种，都是模拟彩色电视制式。

8.2隔行扫描是什么意思？

非隔行扫描是什么意思？

（1）在隔行扫描中，一帧画面分两场，第一场扫描总行数的一半，第二场扫描总行数的另一半。

电子束扫完第1行后回到第3行开始的位置接着扫，然后在第5、7、……，行上扫，直到最后一行。

奇数行扫完后接着扫偶数行，这样就完成了一帧（frame）的扫描。

隔行扫描要求第一场结束于最后一行的一半，不管电子束如何折回，它必须回到显示屏顶部的中央，这样就可以保证相邻的第二场扫描恰好嵌在第一场各扫描线的中间。

正是这个原因，才要求总的行数必须是奇数。

（2）在非隔行扫描中，电子束从显示屏的左上角一行接一行地扫到右下角，在显示屏上扫一遍就显示一幅完整的图像。

8.3电视机和计算机的显示器各使用什么扫描方式？

电视机通常使用隔行扫描；计算机的显示器通常使用非隔行扫描。

8.4在ITU-RBT.601标准中，PAL和NTSC彩色电视的每一条扫描线上的有效显示像素是多少?

720个像素

8.5S-Video信号是什么？

它的连接器结构什么样？

S-Video（SeparateVideo）是亮度信号（Y）和色度信号（C）分开录制和处理的一种电视信号。

S-Video是分量模拟电视信号和复合模拟电视信号的一种折中方案。

使用S-Video有两个优点：

（1）减少亮度信号和色差信号之间的交叉干扰。

（2）不须要使用梳状滤波器来分离亮度信号和色差信号，这样可提高亮度信号的带宽。

S-Video连接器的结构和外形可用搜索引擎的图片搜索功能找到。

注：

S-VHS和Hi-8摄像机以及盒式录像机（videocassetterecorder，VCR）使用这种技术，它比标准的VHS和8毫米格式的设备提供质量比较高的彩色图像。

在使用S-video技术的设备上，电视信号的输出除含有分离的亮度（Y）和色差信号（C）输出外，还有复合彩色全电视信号。

S-video设备与其他设备连接的连接器使用S-video连接器，而不是普通的RCA连接器。

有些电视图像卡和高档家用录像机（VCR）可以支持这种信号。

8.6对彩色图像进行子采样的理论根据是什么？

人的视觉系统所具有的两种特性。

一是人眼对色度信号的敏感程度比对亮度信号的敏感程度低，利用这个特性可以把图像中表达颜色的信号去掉一些而使人不易察觉；二是人眼对图像细节的分辨能力有一定的限度，利用这个特性可以把图像中的高频信号去掉而使人不易察觉。

子采样是压缩彩色电视信号的一种技术。

8.7图像子采样是在哪个彩色空间进行的？

在YCbCr颜色空间

8.8一幅YUV彩色图像的分辨率为720×576像素。

分别计算采用4:

2、4:

1和4:

0子采样格式采样时的样本数。

（1）4:

4这种采样格式不是子采样格式，它是指在每条扫描线上每4个连续的采样点取4个亮度Y样本、4个红色差Cr样本和4个蓝色差Cb样本，这就相当于每个像素用3个样本表示。

720×576×3＝1244160

（2）4:

2这种子采样格式是指在每条扫描线上每4个连续的采样点取4个亮度Y样本、2个红色差Cr样本和2个蓝色差Cb样本，平均每个像素用2个样本表示。

720×576×2＝829440

（3）4:

1这种子采样格式是指在每条扫描线上每4个连续的采样点取4个亮度Y样本、1个红色差Cr样本和1个蓝色差Cb样本，平均每个像素用1.5个样本表示。

720×576×1.5＝622080

（4）4:

0这种子采样格式是指在水平和垂直方向上每2个连续的采样点上取2个亮度Y样本、1个红色差Cr样本和1个蓝色差Cb样本，平均每个像素用1.5个样本表示。

720×576×1.5＝622080

8.9数字电视是什么？

数字电视（digitaltelevision/digitalTV，DTV）是用数据压缩技术和数字传输技术的远程通信系统

8.10在目前的数字电视传输方式中，有哪3种主要传输方式？

目前传输数字电视用得最多的方式是使用卫星、地面广播和电缆，用它们传输的电视分别称为地面数字电视（digitalterrestrialTV）、卫星数字电视（digitalsatelliteTV）和有线数字电视（digitalcableTV）。

8.11高清晰度电视（HDTV）是什么？

高清晰度电视（highd

展开阅读全文