多媒体重点.docx
《多媒体重点.docx》由会员分享,可在线阅读,更多相关《多媒体重点.docx(6页珍藏版)》请在冰豆网上搜索。
多媒体重点
1.多媒体和对媒体技术的定义、分类
答:
多媒体是融合两种或者两种以上媒体的人——机互动的信息交流和传播媒体;
多媒体的主要特点是多样性,集成性,交互性,实时性。
2.标准通用标记语言(SGML)可以用来定义文档结构和文档内容的标签。
超文本标记语言(HTML)是面向显示的标记语言。
虚拟现实造型语言(VRML)是创建含有三维交互对象的Web网页程序设计语言。
3.超文本:
是包含指向其它文档或者文档元素的指针的电子文档。
超文本系统:
是一种提供了复杂格式超文本的解释的软件系统,包括文本格式,图像,超级链接——一种文字间的跳转以提供某一个主题(关键词)的相关内容。
超媒体:
超文本+多媒体。
4.多媒体系统可分为四个层次:
基础、系统、服务和使用。
5.多媒体技术是利用计算机对文本、图形、图像、声音、动画、视频等多种信息综合处理、建立逻辑关系和人机交互作用的技术。
6.声音信号数字化的定义和步骤,在数字化过程中对声音质量的影响。
答:
定义——将具有一定幅度和频率的连续变化的模拟声音信号,通过A/D转换器以一定的频率对模拟信号截取一个振幅值,并用指定字长的二进制未来表示,从而将连续的模拟音频信号转变成能被计算机处理的离散的数字音频信号。
步骤:
采样(采样频率不应该低于声音信号最高频率的两倍,这样就能做到无损数字化)
(采样精度:
a.量化位数,b.信噪比)
量化(把采样得到的声音信号幅度转换成数字值)
对声音质量有关的重要因素是:
采样频率量化位数声道数
对声音质量的度量有两种基本的方法;一种是客观质量度量,另一种是主观质量度量。
7.人的听力范围:
20——20kHZ话音信号:
300——3kHZ
8.声音文件的数据量:
(采样频率×量化精度×声道数×时间)/8(采样频率–Hz,时间–秒,数据量–字节)
9.MIDI音频和波形音频的区别。
MIDI是指电子乐器数字接口
MIDI传输的不是声音信号,而是音符、控制参数等指令,
它指示MIDI设备要做什么,怎么做,如演奏哪个音符、多大音量等。
它们被统一表示成MIDI消息,波形音频传输的是模拟信号,也就是电信号
10.产生MIDI乐音的主要的两种方法。
一种是频率调制合成法,另一种是乐音样本合成法也称为波形表合成法。
11.声音音频编码的类别及其优缺点。
波形编译码器:
话音质量高,但是数据率也高;
音源编译码器:
数据率低,但是合成话音的质音有待提高;
混合编译码器:
数据率和音质介于以上二者之间。
12.脉冲编码调制技术(区分均匀量化,非均匀
如果采样相等的量化间隔对采样得到的信号做量化,那么这种量化称为均匀量化。
对输入信号进行量化时,大的输入信号采用大的量化间隔,小的输入信号采用小的量化间隔,这就是非均匀量化。
13.增量调制是一种预测编码技术,是PCM编码的一种变形(他是对实际的采样信号与预测的采样信号之差的极性进行编码)
当输入信号的变化速度超过反馈回路输出信号的最大变化速度时,就会出现斜率过载。
当输入信号与预测信号的差值接近零的区域,增量调制的输出出现随机交变的0和1,这种现象叫做粒状噪声,这是不能被消除的。
自适应增量调制根据输入信号的斜率的变化自动调整量化阶的大小,以使斜率过载和粒状噪声都减到最小。
自适应查分脉冲编码调制是一种根据输入信号幅度来改变量化阶大小的一种波形编码技术(一种是向前改变量化阶的前向自适应,另一种是后向自适应)。
自适应查分脉冲编码调制:
利用自适应改变量化阶的大小;使用过去的样本值估算下一个输入样本的预测值,使实际样本值和预测值之间的差值最小。
14.为什么进行多媒体数据压缩
因为一些多媒体数据占用内存比较大,压缩可以缩小文件内存,这样可以方便传递。
15.G.721、G.711和G.722等标准的压缩算法、压缩率、输出速率。
G.721:
输出是用4位表示的差分信号,他的采样频率是8KHZ,他的数据为32kb/s。
G.711:
采样频率为8KHZ,8位/样本,数据率为64kb/s
G.722:
音频信号宽带为7KHZ,数据率为64kb/s。
16.在声音数字化和压缩过程中影响声音质量的因素
采样频率量化位数声道数无损压缩(减少冗余,可逆)有损压缩(减少冗余和部分信息,减少的信息不可恢复)、
17.词典编码的基本思想。
P33
霍夫曼编码。
P28
算数编码。
P29
LZ77,LZSS,LZ78,LZW编码和LZW的译码。
P34—p42
18.图像的属性:
分辨率,像素深度等,真/伪彩色
屏幕分辨率:
衡量显示设备再现图像时所能达到的精细程度的度量方法。
图像分辨率:
图像精细程度的度量方法。
像素深度:
存储每个像素所用的位数。
真彩色:
RGB
伪彩色:
用查找出的R,G,B值产生的彩色称为伪彩色。
19.相加和相减混色模型以及应用的场合
显示彩色图像采用相加混色模型
打印彩色图像采用相减混色模型
20.图像的种类(矢量图,点位图,灰度图,彩色图)和特点
点位图的特点:
逼真,占用存储容量大,灵活性不好
矢量图的特点:
图形缩放后不变形,占用存储量小,灵活性好,表现能力具有局限性,对于复杂又不易于用数序方法描述的对象矢量图无能为力,显示速度比点位图慢。
灰度图:
只有明暗不同的像素而没有彩色像素组成的图像
彩色图:
有彩色像素组成的图像。
21.计算某种图像的数据量大小
文件字节数=图像分辨率*图像深度/8
22.JPEG压缩编码的步骤和每步的作用,其中每步采用的压缩算法及其特点。
P76
一种是采用离散余弦变换为基础的有损压缩算法,另一种是采用以预测技术为基础的无损压缩算法。
23.描述颜色的几个术语:
色调,饱和度,亮度;颜色空间;颜色度量体系。
色度:
色相,指颜色的外观,用于区别颜色的名称或者种类
饱和度:
相对于明度的一个区域的色彩,是指颜色的纯洁性,它可用来区别颜色明暗的程度。
亮度:
a.明度:
视觉系统对可见物体辐射或者发光多少的感知属性。
b.亮度:
是用反应视觉特性的光谱敏感函数加权之后得到的辐射功率。
颜色空间:
是表示颜色的一种数学方法,人们用它来指定和产生颜色,使颜色形象化。
颜色度量体系:
也叫做颜色制或者叫做颜色体制,实际就是人们组织和表示颜色的方法。
24.不同电视制式采用的颜色模型(PAL,NTSC,SECM)。
NTSC;正交幅度调制彩色电视制,图像的宽高比为4:
3,525条扫描线,隔行扫描,30帧每秒,视像带宽为4.2MHz,使用YIQ信号,色度信号采用正交幅度调制,声音用调频制,总的电视通道带宽为6MHz。
PAL:
逐行倒相彩色电视制,图像的宽高比为4:
3,625条扫描线,隔行扫描,25帧每秒,视像带宽为4MHz,使用YUV信号,色度信号采用正交幅度调制,声音用调频制,总的电视通道带宽为8MHz。
SECM:
顺序传送彩色与存储彩色电视制,图像的宽高比为4:
3,625条扫描线,25帧每秒(50场每秒),视像带宽为6MHz,色度信号采用频率调制,声音用调频制,总的电视通道带宽为8MHz。
全电视信号:
在彩色电视系统中把视频信号(图像信号),复合同步信号和复合消隐信号和在一起,形成全电视信号。
25.图像子采样定义和理论依据,为什么可以进行图像子采样
对彩色电视图像进行采样时,如果对色差信号使用的采样频率比对亮度信号使用的采样频率低,这种采样就叫做图像子采样。
依据是:
a.人眼对色度信号的敏感程度比对亮度信号的敏感程度低(去掉一些颜色信号不易察觉),b.人眼对图像细节的分辨能力有一定的局限性(去掉高频信号不易察觉)。
26.在不同子采样下,彩色图像的样本数
4:
4:
4YCbCr(4个亮度样本,2个红色样本,2个蓝色样本)
4:
2:
2YCbCr4:
1:
1YCbCr4:
2:
0YCbCr
一副YUV彩色图像的分辨率为720*576,分别采用4:
2:
2,4:
1:
1子采样格式时的样本数
4:
2:
2=》平均(4+4+2)/4=2720*576*2=》样本数1
4:
1:
1=》平均(4+1+1)/4=1.5720*576*1.5=》样本数2
27.MPEG是什么?
运动图像数据压缩主要根据
MPEG是在1988.5由国际标准化组织和国际电工委员会联合成立的专家组,专家组开发的标准成为MPEG标准。
a.亮度比色彩的敏感度高b.分辨率有上限。
28.MPEG1,MPEG2和MPEG4的特点和应用领域
MPEG2-PS主要应用于存储的具有固定时长的节目,如DVD电影,
MPEG2-TS主要应用于实时传送的节目,比如实时广播的电视节目。
MPEG-4是支持内容基的压缩编码方法,突破了MPEG-1、MPEG-2以矩形块处理图像的方法。
MPEG1和MPEG2用于运动图像数字压缩标准
MPEG4用于运动图像数字压缩标准和媒体应用。
它是对一副图像分割成不同的子块,他是基于内容基的编码方法。
MPEG2-TS和MPEG2-PS的区别:
后者只能传送只有固定的字长的文件;前者主要应用于实时传送的节目。
MPEG7旨在解决信息描述的标准问题。
它的具体做法就是加上元数据,便于检索和处理,他是对三个标准的补充。
MPEG21将不同的协议,标准等有机的结合起来,为多媒体信息的用户提供透明的应用和一个完整的平台。
MPEG声音压缩编码算法中的三个特性:
响度,音高和掩蔽效应。
29.听觉系统的感知特性、定义
声音的响度就是声音的强弱,用频率表示音高,一种频率的声音阻碍听觉系统感受另一种频率的声音的现象成为掩蔽效应。
(频域掩蔽(强盖弱),临界掩蔽(人耳刚可以感知的两种频率的声音的差别的范围),时域掩蔽(声音在相邻时间之间的掩蔽效应))
当声音弱到人耳刚可以听见时,称此时的声音强度为“听阈”,当声音强到使人耳感到疼痛,称此时的声音强度为“痛阈”。
30.心理声学模型的要点
a.考虑了听觉阈值的概念b.利用了听觉系统的掩蔽效应。
掩蔽效应是心理声学模型的基础。
31.MPEG1的声音压缩层次,如何利用人的听觉系统的特性
第一层:
仅利用频域掩蔽特性,典型的压缩比为4:
1,相应的数据率为384kbps,第二层利用频域掩蔽特性和时间掩蔽特性,典型的压缩比为(6:
1)~(8:
1),数据率为256~192kbps,第三层利用了频域掩蔽特性,时间掩蔽特性,和临界掩蔽特性,典型的压缩比为(10;1)~(12:
1),相应的数据率为128~112kbps,声音质量接近CD-DA。
32.TTS系统的概念及其应用场合
是使用计算机把文字转换为声音输出的过程,它的最终目标是使计算机像人一样输出清晰又自然的声音。
也就是可以阅读不同的语调。
33.MPEG的图像类型(3种电视图像对象(VO)的概念即MPEGVideo压缩算法中定义了三种图像)和特点
a.帧内图像I(为其他帧图像的编码和解码作参考)b.预测图像P(以在他之前出现的帧内图像作参考,对预测图像进行编码就是对他们之间的差值进行编码)c.双向预测图像B(在他之前和之后出现的帧图像作参考,对双向预测图像进行编码就是对帧内图像和预测图像的差值分别进行编码)
34.为尽量消除空间冗余和时间冗余,MPEG专家组为视像数据定义了数据结构,把视像片段看成是由一系列“静态”图像组成的视像序列把这个序列分成许多的像组,把像组的中的每一帧图像分成许多像片……
35.双向预测图像B的压缩编码算法:
帧内图像的I的数据量最大,而双向预测帧图像B的数据量最小。