多媒体通信技术基础第4版课后复习题.docx
《多媒体通信技术基础第4版课后复习题.docx》由会员分享,可在线阅读,更多相关《多媒体通信技术基础第4版课后复习题.docx(26页珍藏版)》请在冰豆网上搜索。
多媒体通信技术基础第4版课后复习题
第一章课后习题
1、请论述什么是多媒体和多媒体技术的基本特征?
多媒体技术的定义与特征
以数字化为基础,能够对多种媒体信息进行采集、编码、存储、传输、处理和表示,综合处理多种媒体信息,并使之建立起有机的逻辑联系,集成为一个系统并能具有良好交互性的技术。
多媒体技术的基本特征
多媒体的特征:
具有集成性、同步性和交互性。
其中,集成性包括多种媒体的集成和多种业务的集成;交互性包括人与人的交互和人——机交互。
能够通过计算机对视频数据进行操作,即交互性。
2、多媒体系统有哪几种主要的类型?
每一种类型中最关键的技术有哪些?
基本的多媒体系统除了以多媒体计算机为基础的独立商亭式系统外,通过网络提供业务的系统可以分为两大类:
一类是人与人之间交互的系统,如多媒体会议与协同工作、多媒体即时通信等;另一类是人机交互的系统,如多媒体信息检索与查询、视频点播等。
独立商亭式系统,凡是以一台多媒体计算机为核心的应用系统,都成为独立商亭式系统。
多媒体信息检索与查询(MIS),除可以根据关键字等对文本资料进行查询之外,同时具有对活动图像和声音的查询能力。
通信方式,MIS是点对点(信息中心对一个用户),或一点对多点(信息中心对多个用户)的双向非对称系统。
WWW技术意味着在超媒体原理下发展起来的一系列概念和通信协议。
Web代表了世界范围内由因特网相互连接起来的众多的信息服务器所构成的巨大数字化信息空间,也有学者称之为超空间。
伴随着视频和音频查询而发展起来的多媒体检索方式称为基于内容的检索,在其基础上发展起来的,找出具有同样“概念”或“事件”的图像或视频的更高级的查询方式称为基于语义的检索。
1.4.3多媒体会议与协同工作(1、会议室会议电视系统2、桌面或手持终端会议电视系统3、多媒体协同工作)
1.4.4多媒体即时通信,即时通信系统更完整的表述是出席与即时消息系统(IMS)
一个典型的IM系统包含两种基本服务:
出席服务和即时消息服务。
1.4.5视频点播(VOD)与直播:
在一个VOD系统中,负责按用户要求向用户传送节目数据流的设备称为视频服务器。
近年来,人们借助Web技术,提出了另一种实现视频点播的方案。
直播是将天线、卫星或电缆接收的电视节目,或者用户自拍的时频先传送到服务器,再由服务器利用前面所述的技术向众多用户推送。
3、网络融合已经取得什么样的进展?
还存在哪些困难?
答:
为了能在IP网上提供电话、电视和各种多媒体业务,进行工作的进展主要体现在两个方面:
一是增加核心网和接入网的带宽,为各种业务,特别是宽带多媒体业务提供充足的资源;二是设计有效的资源分配和管理机制,在有限的资源下,为不同的媒体提供不同的服务保障。
后者常称为服务质量(QoS)保障机制。
在核心网方面,技术趋势是网络控制和数据传输功能的分离。
在接入网方面,原本接入用户家庭的传送电话的双绞线和传送有线电视节目的同轴电缆,通过xDSL和电缆调制/解调等技术已经能够同时支持电话、电视、数据和各种多媒体业务;宽带的光纤直接接入用户也有很大发展。
近年出现的HTML5使得浏览器可以无需外部播放插件即可呈现音视频的播放;而正在兴起的WebRTC技术则进一步将支持声音、视频的实时通信能力纳入Web浏览器。
专有名词:
多媒体(DVI)、交互多媒体协会(IMA)、激光视盘(LVD)、多媒体信息检索与查询(MIS)、统一资源定位器(URL)、计算机支持的协同工作(CSCW)、多媒体协同工作(MMC)、出席与即时消息系统(IMS)、视频点播(VOD)、宽带综合业务数字网(B-ISDN)、服务质量(QoS)
复习题
一、填空题
1、多媒体技术由计算机、通信和广播电视三个原本各自独立领域的技术相互渗透、融合而形成。
(P1)
2(计算题)20世纪后期我国的模拟电视制式在一帧图像有625行,扫描逆程中占去约50行,出现在一幅画面上有效的扫描行数是576行左右。
电视画面的宽和高之比是4:
3,若要保证图像在水平方向上单位距离内可分辨的像素与垂直方向上相等,问:
(P2)
1)在图像水平方向上的像素数是多少?
2)将这样一幅单色的电视图像数字化,其采样点数应不少于多少?
3)根据三基色原理,一幅彩色图像由红、绿、蓝3幅单色图像组成,每秒钟要传送25幅彩色图像才能保证电视图像的连续性。
如果每一个像素采用8比特量化,一秒钟时间内需要传送的数据量为
4)若放映一部2小时的电影,则电影总数据量为
3、通常对时间敏感的声音、活动图像的数据称为实时数据,其他类型的数据称为非实时数据。
(P2)
4、非对称信道是指两条线路的信道带宽或数据率不相同。
(P3)
5、由用户向信息中心传送指令称为上行线,是低速率的;传送读取电视信号称为下行线,是高速率的。
(P3)
6、多媒体的特征:
集成性、同步性和交互性。
(P3)
7、多媒体技术最直接、最简单的表现形式是多媒体计算机。
(P5)
8、凡是以一台多媒体计算机为核心的应用系统,都称为独立商亭式系统。
(P5)
9、通过网络提供业务的系统可以分为两大类:
一类是人与人之间交互的系统,另一类是人机交互的系统。
(P5)
10、信息的非顺序(或称为非线性)的组织结构称为超文本,其中信息单元之间的链接称为超链,上述信息组织方式从文本扩展到其他媒体数据后称为超媒体。
(P6)
11、标准的超文本文件采用HTML格式。
超文本的数据交换和传递使用HTTP协议。
HTTP定义了客户端和服务器之间请求和应答的语言和规则。
(P6)
12、实现WWW用户端功能的软件称为浏览器,帮助用户过滤掉无用信息、尽快找到所需要的信息的专门软件,就是所谓的搜索引擎。
(P6)
13、MIS所涉及的两个重要技术问题是:
1、如何向用户提供丰富的信息和如何让用户快速、有效地查询与浏览这些信息;2、如何合理、有效地组织多媒体数据的存储和检索。
(P6)
14、伴随着视频和音频查询而发展起来的多媒体检索方式称为基于内容的检索,找出具有同样“概念”或“事件”的图像或视频的更高级的检索方式称为基于语义的检索。
(P7)
15、一个典型的IM系统包含出席服务和即时消息服务两种基本服务。
(P9)
16、出席服务有两类客户,一类为出席者,另一类称为观察者。
出席者向服务器上的出席服务提供自己的出席信息。
(P9)
17、在即时消息服务中,发送消息的一方称为发送者,接收消息的一方称为即时消息箱。
(P9)
18、在一个VOD系统中,负责按用户要求向用户传送节目数据流的设备称为视频服务器。
(P10)
二、选择题:
1、下面属于多媒体特征的是(D)
A、多样性、集成性、同步性
B、多样性、集成性、交互性
C、多样性、同步性、交互性
D、集成性、同步性、交互性
2、关于多媒体、多媒体协同工作、多媒体信息检索与查询、统一资源定位器、下列缩写与之对应的一项是(A)
A、DVI、MMC、MIS、URL
B、MMC、DVI、MIS、URL
C、DVI、MMC、URL、MIS
D、DVI、MIS、MMC、URL
3、关于计算机支持的协同工作、出席与即时消息系统、视频点播、宽带综合业务数字网,下列缩写与之对应的一项是(A)
A、CSCW、IMS、VOD、B-ISDN
B、IMS、CSCW、VOD、B-ISDN
C、CSCW、IMS、B-ISDN、VOD
D、CSCW、VOD、IMS、B-ISDN
4、下列关于出席者、观察者、订阅者表述正确的一项是(C)
A、出席者可以定期或不定期地向出席服务请求得到当前出席信息
B、订阅者可以定期或不定期地向出席服务请求得到当前出席信息
C、出席者向服务器上的出席服务提供出席信息
D、订阅者向服务器上的出席服务提供出席信息
第二章视觉特性和彩色电视信号
一、选择题
1、表示图像相邻区域或相邻点之间的亮度差别的是(B)。
A视觉阈B对比度C对比度灵敏度D掩蔽效应
2、在给定的某个亮度环境下,人眼刚好(以50%的概率)能够区分两个相邻区域的亮度差别所需要的最低对比度,称为临界对比度或(A)。
A视觉阈B视觉惰性C对比度灵敏度D掩蔽效应
3、人眼有一亮一暗的感觉时称为闪烁,闪烁感觉刚好消失时的重复频率叫做(C)。
A时间频率B空间频率C临界闪烁频率D脉冲重复频率
4、对于一般的运动物体,要保持画面中物体运动的连续性,要求每秒钟摄取的最少画面数约为(D)帧左右,即帧率要求为(D)Hz。
A46B24C48D25
5、取样结构为4:
2:
2,其表示的含义为(C)
A传送4个和2个亮度样値时,色差信号只传送2个样値
B每传送4*2个亮度样値时,每个色差信号只传送2个样値
C每传送4个亮度样値时,每个色差信号只传送2个样値
D每传送4个亮度样値时,每个亮度样値包括2个色差信号样値
二、填空题
1、临界对比度的倒数,称为对比度灵敏度。
2、人眼区分图像亮度差别的灵敏度与它附近区域的背景亮度(平均亮度)有关,背景亮度越高,视觉阈越高,灵敏度越低。
3、以长度为单位和以角度为单位的空间频率之间的转换公式为(
)
4、在通常的电影荧幕亮度下,人眼的临界闪烁频率为46Hz,所以在传统的胶片电影中,普遍采用每秒钟向银幕上投射24幅画面的标准,而在每幅画面停留的时间内,将投射光遮挡一次,得到每秒48次的重复频率。
5、任何一个复杂的亮度函数(图像),都可以通过傅氏分析将其分解成为一系列不同频率分量(正弦光栅)之和。
6、电子束从左到右的扫描,称为行正程扫描;从右回到左端,则称为行逆程。
7、传统电视常采用隔行扫描和逐行扫描的扫描方式。
8、彩色电视中,需要满足与黑白电视兼容,而且在不增加黑白电视所规定的信道带宽的条件下,同时传送亮度信号和两个色差信号。
解决方法是频谱交错。
9、常见的取样结构有4:
4:
4、4:
2:
2、4:
1:
1、4:
2:
0结构。
习题二
2-1什么叫空间频率?
在不涉及和涉及观察者的两种情况下,图像空间频率的高、低各与哪些因素有关?
答:
(1)不涉及观察者的情况下,空间频率的定义是:
物理量(如图像的亮度)在单位空间距离内周期性变化的次数,即
(周/米)
式中,
表示亮度信号在
方向的空间频率,
是空间距离变量,
表示亮度信号沿
方向的相位变化。
所以图像空间频率的高低与图像亮度信号沿某方向的相位变化和某方向上的空间距离变量有关。
(1)涉及观察者的情况下,空间频率的定义是:
从某一观察点来看,亮度信号在单位角度内周期性变化的次数。
即
(周/度)
式中,α为角度,
代表亮度信号在角度α内的相位变化。
所以图像空间频率的高低与图像亮度信号在某个角度内的相位变化和此角度的大小有关。
2-6在我国625行/帧,25帧/秒的隔行扫描的模拟电视制式下,行、场扫描正程时间与行、场总周期的比值约为
和
,屏幕宽高比
。
假设电视机屏幕上显示如右图所示的黑白正弦光栅图案,请你
(1)求出对应于该图像的电视信号的最高频率;
(2)当人在距离屏幕6H远处观看电视时,如果不断的改变屏幕上栅条的密集程度,当屏幕上有多少条光栅时人眼分辨的最清楚?
光栅增加到大约多少条时,人眼只能看到模糊一片?
(提示:
根基图2-4,分别取4周/度和50周/度为图中曲线的峰值点和截止点对应的横坐标位置。
)
答:
(1)电视图像信号的上限频率为
,其中
K为凯耳系数取0.7,
和
,
为每帧图像的总扫描行数,包括正程和逆程,本题为625.
为帧频率25.所以代入公式可得
(2)由题知,空间频率为
4周/度时,视觉的对比度灵敏度最高,即人眼对这些空间频率的分辨能力最强。
空间频率为
周/度时,人眼就很难分辨了。
所以可以得到两个方向上的空间截止频率
。
此时,屏幕上人眼分辨的最清楚时的光栅条数为
屏幕上人眼只能看到模糊一片时的光栅条数为
。
2-8画出在4:
1:
1格式中,亮度信号和两个色差信号取样后所形成的的矩阵的大小。
与4:
2:
0格式相比,对于每一帧图像,两种格式所产生的数据量是否相同?
垂直和水平分辨率是否相同?
答:
YUVYUV
411420
对每帧图像,两种格式的数据量是相同的。
而对色度信号的分辨率而言,水平方向上,4:
1:
1格式是4:
2:
0格式的一半,垂直方向上,4:
2:
0格式是4:
1:
1格式的一半。
对亮度信号的分辨率而言,4:
1:
1和4:
2:
0格式在水平和垂直方向上是一致的。
第三章
1下列哪种说法不正确(A)。
A预测编码是一种只能针对空间冗余进行压缩的方法。
B预测编码是根据某一模型进行的。
C预测编码需将预测的误差进行存储或传输。
D预测编码中典型的压缩方法有DPCM、ADPCM。
2最优正交变换是(C)
ADCT变换B差分变换CK-L变换D以上信息都不对
3下列哪些说法是正确的(B)。
(1)冗余压缩法不会减少信息量,可以原样恢复原始数据。
(2)冗余压缩法减少了冗余,不能原样恢复原始数据。
(3)冗余压缩法是有损压缩法。
(4)冗余压缩的压缩比一般都比较小。
A
(1)(3)B
(1)(4)C
(1)(3)(4)D(3)
4图像序列中的两幅相邻图像,后一幅图像与前一幅图像之间有较大的相关,这是(B)
A空间冗余B时间冗余C信息熵冗余D视觉冗余
5预测编码是在空间域(时间域)内进行的,是通过减小信源图像信息在时间上和空间上的相关性来达到数据压缩的目的;变换编码是在变换域(频率域)内进行的。
6预测编码是有损压缩编码,主要通过减小图像信息在时间上和空间上的相关性来达到数据压缩的目的。
7正交变换编码中,正交变换系数的能量主要集中在直流和低频区。
8运动估值的方法主要分为块匹配方法和像素递归方法。
9假设离散无记忆信源产生的随机序列包括X和Y,且X和Y相互独立,则联合熵H(X•Y)=H(X)+H(Y)。
10假设一个离散信源有5个符号,则当其熵值最大时,每个符号的概率是1/5。
11对于一个有m个符号的离散信源,其最大熵是log2m。
12假设每个消息的发出都是等概率的,则四进制脉冲所含信息量是二进制脉冲的2倍。
13简述上取样以及下取样。
由高取样率的样值去推算低取样率样点数值的技术,称为下取样。
由低取样率的样值去估计较高频率的取样点上的数值,称为上取样。
14简述三步法。
第一步,以待匹配块中心的同位像素为中心,在中心点和与其相距4个像素的8个邻域点上计算判决函数SAD值,取SAD值最小的点作为下一步搜索的中心;第二步,以该点为中心,对与中心相距2个像素的未搜索过的邻域点进行搜索;第三步,以上一步中SAD值最小的点为中心,对距离中心1个像素的未搜索过的邻域点进行搜索,最终找到最佳匹配位置。
15正交变换能否实现信息保持型编码?
为什么?
不能。
在编码阶段,对原始数据进行正交变换后得到的变换系数,保留那些能量集中的、方差大的分量系数进行量化,量化后的系数的熵编码是变换编码的编码数据。
在解码阶段,经过熵解码、反量化和反正交变换,得到是与原始数据不同的数据。
16简述Huffman编码的过程
1、排序:
按符号出现的概率从大到小进行排列。
2、赋值:
对最后的两个符号进行赋值,概率大的赋“1”,概率小的赋“0”(反之也成立)。
3、合并:
将上述最后的两个符号出现概率相加合成一个概率。
4、重新排序:
将合成后的概率与其它符号概率一起进行重新排序(从大到小)。
然后重复步骤2的内容,直至最后只剩下两个概率为止。
5、码字分配:
从最后一步开始反向进行码字分配,对最后两个概率中较大的赋“1”。
对较小的赋“0”(与第二过程中的规定相同)。
从而形成一个码字。
17正交变换编码与预测编码的不同。
不同之处在于,预测编码是在时间域或空间域进行的,变换编码是在变化域(频率域)进行的。
18离散余弦变换的性质。
(1)余弦变换是实数、正交。
(2)离散余弦变换可由傅里叶变换的实部求得。
(3)对高度相关数据,DCT有非常好的能量紧凑性。
(4)对于具有一阶马尔可夫过程的随机信号,DCT是K-L变换的最好近似。
19简述量化的定义。
量化是将具有连续幅度值得输入信号转换到只具有有限个幅度值的输出信号的过程。
20根据输出电平是否包括了零电平,可以将量化特性分为中平型和中升型。
21什么是劳依得—麦克思量化器。
如果输入信号的统计特性是已知的,则可以通过使均方量化误差达到最小来设计量化级数为N的量化器的输出电平y和判决电平x。
22
23经过充分洗牌后的一副扑克(含52张牌)
(1)任何一种特定排列所给出的信息量是多少?
(2)若从中抽取13张牌,所给出的点数都不相同时得到多少信息量?
(a)任一特定排列的概率都是(1/52!
),所以自信息量为log2(52!
);
(b)从52张牌中抽取13张牌,共有C5213种抽取方法。
而使得所给出的点数都不相同的抽取方法有413种。
所以事件“点数都不相同”的概率为413/C5213
自信息量为log2(413/C5213)
24某校入学考试中有1/4考生被录取,3/4考生未被录取。
被录取的考生中有50%来自本市,而落榜考生中有10%来自本市。
所有本市的考生都学过英语,而外地落榜考生中以及被录取的外地考生中都有40%学过英语。
(a)当已知考生来自本市时,给出多少关于考生是否被录取的信息?
(b)当已知考生学过英语时,给出多少有关考生是否被录取的信息?
(c)以x表示是否落榜,y表示是否为本市学生,z表示是否学过英语,x,y和z的取值为0或1。
试求H(X),H(Y/X),H(Z/XY)
解以x表示是否被录取(1表示被录取,0表示未被录取),y表示是否为本市学生(1表示本市学生,0表示非本市学生),z表示是否学过英语(1表示学过英语,0表示未学过英语),则
P(xyz=111)=(1/4)×(50%)×1=12.5%;
P(xyz=110)=(1/4)×(50%)×0=0;
P(xyz=101)=(1/4)×(50%)×(40%)=5%;
P(xyz=100)=(1/4)×(50%)×(60%)=7.5%;
P(xyz=011)=(3/4)×(10%)×1=7.5%;
P(xyz=010)=(3/4)×(10%)×0=0;
P(xyz=001)=(3/4)×(90%)×(40%)=27%;
P(xyz=000)=(3/4)×(90%)×(60%)=40.5%。
25
26图像量化时,如果量化级比较小会出现什么现象?
为什么?
答:
如果量化级数过小,会出现伪轮廓现象。
量化过程是将连续变化的颜色划分到有限个级别中,必然会导致颜色信息损失。
当量化级别达到一定数量时,人眼感觉不到颜色信息的丢失。
当量化级数过小时,图像灰度分辨率就会降低,颜色层次就会欠丰富,不同的颜色之间过度就会变得突然,可能会导致伪轮廓现象。
27什么是信息量和信息熵?
两者的用途是什么。
答:
信息量是指表示该符号所需的位数,考虑用 0 和 1 组成的二进制数码为含有n个符号的某条消息编码,假设符号 Fn 在整条消息中重复出现的概率为Pn,则该符号的信息量为En=-log2(Pn)。
信息熵就是平均信息量。
如果将信源所有可能事件的信息量进行平均,就得到了信息熵。
28图像的压缩有两类基本方法即无损压缩和有损压缩。
29数据压缩技术的三个主要指标是什么?
答:
数据压缩技术有三个主要指标,一是压缩前后所需的信息存储量之比要大;二是实现压缩的算法要简单,压缩、解压缩速度快,尽可能地做到实时压缩和解压缩;三是恢复效果要好,要尽可能地完全恢复原始数据。
30在数据压缩方法中,有损压缩具有(A)的特点
A. 压缩比大,不可逆 B.压缩比小,不可逆 C.压缩比大,可逆 D.压缩比小,可逆
第四章习题
一、选择题
1.相比于之字形扫描,在隔行扫描中应用交替扫描,其解码重建图像的峰值信噪比可提高C
A0.1B0.2C0.3D0.4
2.国际标准只规定已编码码流必须遵循的内容,以下哪个不正确D
A句法B语义C标准解码器D标准编码器
3.下面哪个说法是错误的D
A一个编码树单元CTU,它包含了一个亮度编码树块CTB和两个彩色CTB
B一个亮度CB和它对应的两个彩色CB构成一个编码单元CU
C一个亮度PB和两个彩色PB一起构成一个预测单元CU
D一个亮度TB和一个彩色TB一起构成一个预测单元TU
4.当编码器的输入是隔行扫描的图像时,由于相邻扫描行来自不同的场,如果在一场时间内物体的位置有明显的移动,垂直方向上的相关性会降低。
为了提高预测的准确性,以下哪种模式不正确D
A场图像的场间预测B帧图像的场间预测
C场图像的16×8预测D帧图像的16×8预测
5.下面不属于速率控制算法A
AP域速率控制BQ域速率控制C
域速率控制D
域速率控制
二、填空题
1.我们将视频编码的方法分为基于帧的编码和基于对象的编码两大类。
2.为了消除帧间冗余信息,编码器采用具有运动补偿的帧间预测。
3.量化器量化台阶的大小既影响编码器的输出码率,又影响编码器重建图像的质量
4.为了降低块效应引起的视觉不快,可以用一个低通滤波器来对解码后的重建图像进行平滑,此滤波器称为去块效应滤波器
5.要使解码器能够从码流中恢复原来出原来的视频序列,通常将码流按层次结构来组织,码流分为6个层次:
1.图像序列2.图像组3.图像帧4.条5.宏块6.块
6.H264支持4种预测模式:
水平、垂直、DC和平面模式
7.在H264中,量化后的残差信号采用基于上下文的自适应变长编码
8.H264的去块效应滤波器应用于宏块中4×4的水平和垂直边界,根据边界两侧的编码信息规定了5种边界强度BS,等级越高,意味着块效应失真可能越显著,需要更强的滤波。
9.与先前标准不同,H265还引入另外两种组合CTU方式,分别称为瓦片和波前并行处理WPP,其目的是支持编解码算法的并行处理
10.编码器所产生的码流其数据率一般是变化的,为了适应恒定速率信道要求,在编码器和信道之间需要设置一个缓冲器
11.速率控制的基本问题就是在尽可能的保证图像质量稳定条件下,使压缩码流的速率适应恒定速率信道的要求
12.速率控制的基本步骤:
1.目标比特分配2.按分配的比特数调整码率
三、解答题
1.当我们对整幅图像进行DCT变换时,由于图像各空间位置上细节的丰富程度不同,这种整体处理的方式效果不好,这种情况如何处理?
采用了将宏块再分成8×8的子块,对每个子块进行DCT,这种方法称为块DCT。
这种方法不仅便于每个子块根据各自图像特点进行独立处理,而且降低了运算量和对存储空间的要求
2.与MPEG-1相比,MPEG-2主要增加什么功能
1.处理隔行扫描的能力2.更高的色信号取样3.更精细的DCT系数量化和比例因子调节4.可伸缩性视频编码
3.简述基于上下文的自适应二进制算术编码CABAC主要步骤:
1.二值化2.选择上下文模型3.二进制算术编码4.概率模型的更新
4.简述H264特点:
1.SP/SI帧2.对传输错误的鲁棒性和对不同网络的适应性3.可伸缩性编码4.多视角编码
5.H265采用1/4像素精度的运动矢量进行具有运动补偿的帧间预测,其具有特色的地方是什么
1.使用多种形状和大小