《多媒体技术及其应用》期末考试新.docx
《《多媒体技术及其应用》期末考试新.docx》由会员分享,可在线阅读,更多相关《《多媒体技术及其应用》期末考试新.docx(16页珍藏版)》请在冰豆网上搜索。
《多媒体技术及其应用》期末考试新
《多媒体技术及其应用》考试复习
考试题型:
选择题、填空题、算法设计、简答题
一、选择题部分:
5题*3分/题=15分
1、颜色模型的应用范围
显示彩色图像的电视机和计算机显示器色彩显示原理主要基于图像的颜色模型。
颜色模型主要有HSV(面向用户,对应于画家的配色方法)、RGB(通常使用于彩色阴极射线管等彩色光栅图形显示设备中)、HSI、CHL、LAB、CMY(应用于印刷工业)等。
2、信息媒体的分类
根据国际电报电话咨询委员会(CCITT)的定义,媒体分为:
感觉媒体、表示媒体、展现媒体、存储媒体、传输媒体
其中,存储媒体和和传输媒体称为信息交换媒体。
根据时间在表示空间中的作用,媒体分为:
离散媒体、连续媒体
3、压缩编码标准(有损、无损的分类)
数据压缩的评价标准:
压缩比:
越大越好
数据质量:
数据失真越小越好
压缩与解压缩的速度:
速度越快越好
4、图像的基本属性描述
分辨率
显示分辨率:
指显示屏上能够显示出的像素数目。
图像分辨率:
指组成一幅图像的像素密度的度量方法。
像素深度,即像素的所有颜色分量的二进制位数之和,它决定了不同颜色(亮度)的最大数目。
或者确定灰度图像的每个像素可能有的灰度级数。
颜色空间,指彩色图像所使用的颜色描述方法,也叫颜色模型。
真彩色、伪彩色与直接色
真彩色是指在组成一幅彩色图像的每个像素值中,有R、G、B3个基色分量,每个基色分量直接决定显示设备的基色强度,这样产生的彩色称为真彩色。
伪彩色是指每个像素的颜色不是由每个基色分量的数值直接决定的,而是把像素值当做彩色查找表(CLUT)的表项入口地址,去查找一个显示图像时使用的R、G、B强度值,用查找出的R、G、B强度值产生的彩色称为伪彩色。
直接色是指每个像素值分成R、G、B分量,每个分量作为单独的索引值对它做变换。
也就是通过相应的彩色变换表找出基色强度,用变换后的得到的R、G、B强度值产生的彩色称为直接色,它的特点是对每个基色进行变换。
5、信息熵和信息编码的关系
若信息熵H,平均编码长度为L。
如果L远远大于H,则该编码为非最佳编码,说明编码中仍有数据冗余,可以进一步压缩;如果L小于H,证明是不可实现的。
所以,通常情况下,最佳编码应该满足L稍大于H。
6、MPEG-1、2、4、7的用途
MPEG-1:
数字电话网络上的视频传输,如非对称数字用户线路(ADSL)、视频点播(VOD)及教育网络,同时也用于多媒体的信息存储和Internet音频传输。
MPEG-2:
对音频、视频、码流合成、音视频控件方面进行大量的扩充
MPEG-4:
视频
MPEG-7:
数字化图书馆、多媒体目录服务、广播式媒体选择、多媒体编辑、教育、娱乐、新闻、旅游、医疗、购物、地理信息系统
7、多媒体数据库管理系统(MDBMS)体系结构P179
多媒体数据库系统的体系结构可分为层次结构和组织结构。
多媒体数据库的层次结构可分为媒体支持层、存取与存储数据模型层、概念数据模型层和多媒体用户接口层等4层。
图为层次结构示意图
多媒体数据库的组织结构可分为协作性、集中统一型、客户/服务器型和超媒体型等4种。
8、哪些是损编码、无损编码?
(参考题三)
9、关于MIDI的描述
MIDI即电子乐器数字接口。
用于在音乐合成器、乐器和计算机之间交换音乐信息的一种标准协议。
MIDI是音乐和计算机使用的标准语言,是一套指令(即命令的约定),不是声音信号,在MIDI电缆上传送的不是声音,而是发给MIDI设备或其他装置,让它产生声音或执行某个动作的指令。
产生MIDI音乐的方法有:
FM合成法、乐音样本(波形表)合成法。
MIDI是一种数字音乐的国际标准,MIDI文件存储的不是波形而是指令序列。
10、多媒体硬件原理
多媒体硬件系统是多媒体计算机实现多媒体功能的物质基础,任何多媒体信息的采集、处理和播放功能都离不开多媒体硬件技术的支持。
计算机系统中,为了对多媒体信息进行存储处理,需要先把音频信号、视频信号数字化,以数字形式存入计算机存储器中。
然后计算机软件才能对它们加以有效的处理。
但是,数字化的音频、视频数据量非常大,需要把它们进行压缩并存入大容量存储器;音频信号、视频信号的输入输出都是实时的,需要很快的速度,实现以上要求,必须有专用的多媒体硬件支持。
二、填空题部分:
5题*3分/题=15分
1、掩蔽效应:
时域掩蔽、频域掩蔽。
一种频率的声音阻碍听觉系统感受另一种频率的声音的现象称为掩蔽效应。
2、多媒体通信系统P325
计算机网络是多媒体通信的基础,电路交换网络和分组交换网络的融合是构造多媒体通信系统结构的出发点。
多媒体系统主要有网关、会务器和通信终端组成。
网关和会务器是多媒体通信系统的两个极其重要的组成部件。
3、动画的分类
按生成动画方式分为:
帧到帧动画、实时动画;
按运动控制方式分为:
关键帧动画、算法动画、基于物理的动画;
按变化的性质可分为:
运动动画(如景物位置发生改变)、更新动画(如光线、形状、角度、聚焦发生改变)。
4、仿射变换
旋转:
平移:
缩放:
5、采样定理
为了保证采样后的信号能真实的保留原始模拟信号的信息,采样信号的频率必须至少为原信号中最高频率成分的2倍。
6、MIDI声音的合成方法
一种是FM(FrequencyModulation)合成法,另一种是乐音样本合成法,也称为波形表(Wavetable)合成法。
此外,还有波表合成和物理模型合成法。
7、信息熵的概念、公式
信息熵是信息论中用于度量信息量的一个概念。
一个系统越是有序,信息熵就越低;反之,一个系统越是混乱,信息熵就越高。
所以,信息熵也可以说是系统有序化程度的一个度量。
信息熵
(i=1,……,n),即信息集N的平均信息量。
8、多媒体硬件原理
多媒体硬件系统是多媒体计算机实现多媒体功能的物质基础,任何多媒体信息的采集、处理和播放功能都离不开多媒体硬件技术的支持。
计算机系统中,为了对多媒体信息进行存储处理,需要先把音频信号、视频信号数字化,以数字形式存入计算机存储器中。
然后计算机软件才能对它们加以有效的处理。
但是,数字化的音频、视频数据量非常大,需要把它们进行压缩并存入大容量存储器;音频信号、视频信号的输入输出都是实时的,需要很快的速度,实现以上要求,必须有专用的多媒体硬件支持。
9、多媒体软件设计方法、步骤
软件从设计到完成可以用一种生命周期模型开描述,生命周期指的是软件开发的整个开发、使用、维护和报废的过程。
最主要且用的最多的软件开发模型是瀑布模型和螺旋模型,此外还有快速原型模型等方法。
软件开发阶段主要过程有:
(1)需求分析;
(2)应用系统结构分析(初步设计);
(3)建立设计标准和细则(详细设计);(4)准备多媒体数据;
(5)制作生成多媒体应用系统(编码与集成);
(6)系统的测试与应用。
其中软件测试应包括可靠性、可维护性、可修改性、效率及可用性等。
软件人机界面设计过程:
(1)界面风格的设计
(2)系统界面布局分析(3)打开界面的结构体系(4)文字的应用(5)色彩的选择(6)图形和图标的使用
人机界面设计过程遵循的原则:
(1)用户原则
(2)信息量最小原则(3)帮助和提示原则(4)媒体最佳组合原则(5)纠错原则(6)艺术性原则
设计步骤:
1.客户咨询2.上门拜访3.探讨分析4.提供制作方案5.签定合同6.成立专门项目小组7设.计制作8.修改9.技术合成10.测试版11.交付使用12.生产、包装
10、离散变换原理
离散余弦变换(DCT变换)可表示为:
其中
11、傅里叶变换概念
傅里叶变换时一种将信号从时域变换到频域的变换形式。
傅里叶变换公式
逆向傅里叶变换公式
12、人耳能够判别出声音到左右耳相对时差、声强(频差),能判别声音方向及由于空间使声音来回反射造成的特殊效果。
三、算法设计部分:
2题*10分/题=20分
1、Huffman编码
编码过程:
(1)对图像中出现的不同像素值进行概率统计,得到N个不同概率的信息符号。
(2)按符号出现的概率由大到小,由上到下排列。
(3)对两个最低概率符号分别以二进制0、1赋值。
(4)两最低相加后作为一个新符号的概率重新置入符号序列中。
(5)对概率按从大到小重新排列。
(6)重复2~5,直到只剩下两个概率符号的序列。
(7)分别以二进制0、1赋值后,以此为根节点,沿赋值的顺序的逆序依次写出该路径上的二进制代码,得到Huffman编码。
解码过程:
(1):
判断解码数据的类型选择与之对应的表。
(2):
进行码长的判断。
(3):
计算DHT地址。
(4):
从DHT表中读取数据。
(5):
若为DC数据需要进行DPCM解码。
2、LZW编码
(1)编码过程:
步骤1:
开始时的词典包含所有可能的根(Root),而当前前缀P是空的;
步骤2:
当前字符(C):
=字符流中的下一个字符;
步骤3:
判断缀-符串P+C是否在词典中
(1)如果“是”:
P:
=P+C//(用C扩展P);
(2)如果“否”
①把代表当前前缀P的码字输出到码字流;
②把缀-符串P+C添加到词典;
③令P:
=C//(现在的P仅包含一个字符C);
步骤4:
判断码字流中是否还有码字要译
(1)如果“是”,就返回到步骤2;
(2)如果“否”
①把代表当前前缀P的码字输出到码字流;
②结束。
(2)译码过程
步骤1:
在开始译码时词典包含所有可能的前缀根(Root)。
步骤2:
cW:
=码字流中的第一个码字。
步骤3:
输出当前缀-符串string.cW到码字流。
步骤4:
先前码字pW:
=当前码字cW。
步骤5:
当前码字cW:
=码字流中的下一个码字。
步骤6:
判断先前缀-符串string.pW是否在词典中
(1)如果“是”,则:
①把先前缀-符串string.pW输出到字符流。
②当前前缀P:
=先前缀-符串string.pW。
③当前字符C:
=当前前缀-符串string.cW的第一个字符。
④把缀-符串P+C添加到词典。
(2)如果“否”,则:
①当前前缀P:
=先前缀-符串string.pW。
②当前字符C:
=当前缀-符串string.cW的第一个字符。
③输出缀-符串P+C到字符流,然后把它添加到词典中。
步骤7:
判断码字流中是否还有码字要译
(1)如果“是”,就返回到步骤4。
(2)如果“否”,结束。
3、算术编码
给定事件序列的算术编码步骤如下:
(1)编码器在开始时将“当前间隔”[L,H)设置为[0,1);
(2)对每一事件,编码器按步骤(a)和(b)进行处理;
(a)编码器将“当前间隔”分为子间隔,每一个事件一个;
(b)一个子间隔的大小与下一个将出现的事件的概率成比例,编码器选择子间隔对应于下一个确切发生的事件相对应,并使它成为新的“当前间隔”;
(3)最后输出的“当前间隔”的下边界就是该给定事件序列的算术编码。
编码过程伪代码描述如下:
SetLowto0
SetHighto1
Whilethereareinputssymbolsdo
Takeasymbol
CodeRange=High–Low
High=Low+CodeRange*HighRange(symbol)
Low=Low+CodeRange*LowRange(symbol)
Endofwhile
OutputLow
算术码解码过程用伪代码描述如下:
getencodednumber
do
findsymbolwhoserangestraddlestheencodednumber
outputthesymbol
range=symbo.LowValue–symbol.HighValue
substractisymbol.LowValuefromencodednumber
divideencodednumberbyrange
untilnomoresymbols
四、简答题部分:
5题*10分/题=50分
1、声音的数字化(滤波、采样、量化、编码、混叠)。
采样:
曲线代表声波曲线,是连续变化的模拟量,时间轴以一种离散分段的方式来表示,并且波形以固定的时间间隔来测量其值。
量化:
本质是A/D转换,也可以看作是采样时间内测量模拟信息值的过程。
编码:
本质就是压缩,分为有有损压缩和无损压缩。
2、均匀量化及非均匀量化的原理和优点。
均匀量化是一种把输入信号的取值域等间隔分割的量化。
均匀量化的好处就是编解码的很容易,但要达到相同的信噪比占用的带宽要大。
非均匀量化是一种在输入信号的动态范围内量化间隔不相等的量化。
它与均匀量化相比,有两个主要的优点:
(1)当输入量化器的信号具有非均匀分布的概率密度时,非均匀量化器的输出端可以较高的平均信号量化噪声功率比;
(2)非均匀量化时,量化噪声功率的均方根值基本上与信号抽样值成比例。
因此,量化噪声对大、小信号的影响大致相同,即改善了小信号时的量化信噪比。
3、信息数字化的参数(量化位数、声道数、采样数等)解释。
声音信息:
采样频率:
是指1秒钟内的采样次数。
计算机音频处理中,常用的采样频率有11.025kHz、22.05kHz和44.1kHz。
量化位数:
是指描述每个采样点值的二进制数位。
常用的量化位数为8位和16位。
声道数:
又称为声音通道的个数,是指一次采样同时记录的声音波形个数。
随着声道数的增加,存储容量也相应增大。
图像信息:
采样频率:
采样点之间的间隔大小,采样频率越高,获取的样本就细腻逼真,图像的质量越高。
量化等级:
是指图像样本量化后每个采样点用多少位二进制数表示,它反映了采样的质量。
4、MPEG的概念及MPEG-1中的主要技术。
MPEG系列标准是由ISO/IEC共同制定的。
MPEG系列标准作为运动图像压缩编码国际标准具有良好的兼容性较高的压缩比(最高可达200:
1),而且数据损失小。
MPEG-1用于帧内压缩编码的主要技术有:
(1)基于8×8像素块的余弦变换DCT;
(2)量化器;(3)Z型扫描与行程长度编码;(4)熵编码;(5)信道缓存。
MPEG-1用于帧间压缩编码的主要技术有:
(1)运动估计;
(2)运动补偿。
5、图像滤波技术的作用及傅里叶变换。
滤波技术的作用:
(1)去噪;
(2)对信号做平滑;(3)可以把声音细节提取出来。
图像滤波频域操作:
傅里叶变换然后过滤频谱;
滤波空间操作:
通过滤波函数空间卷积;平滑或锐化;
6、简述滤波的基本原理。
对每个点的像素值计算,由该点本身灰度值以及领域内的其他像素值加权平均值所得,而加权平均的权系值由二维离散采样归并所得。
7、立体声原理及变调是如何实现的。
立体声原理:
人耳能够判别出声音到左右耳相对时差、声强(频差),能判别声音方向及由于空间使声音来回反射造成的特殊效果。
变调是如何实现的:
启动CoolEdit,载入需要处理的声音文件。
在菜单栏上单击Transform选择Time/Pitch中的Stretch命令,在Stretch对话框,选择PitchShift,这是固定音频时间长度的要点。
然后,通过Transpose下拉列表框进行调整,软件已经按音乐调子设好变调幅度了,可以半度半度地升调或降调,按下OK确认,开始喧染。
完成后,即可按播放键试听变调后的效果。
8、文—语转换系统结构及主要技术。
文—语转化系统结构
文语转换的目的是将计算机内存储的文本自动转换为声音输出,其主要技术是文字转换成语音的技术,文字以数字或代码形式表示的语言信息,由计算机合成后发出的语音,该过程包含很多高级的信息处理和发音器官复杂的生理控制。
文-语转换系统由发音器、发声的驱动器两部分组成。
9、JPEG基于DCT顺序编码模式的一般过程。
第一步:
颜色模式转换及采样;第二步:
DCT变换;第三步:
量化;第四步:
编码。
10、小波变换的算法基本思想。
小波变换编码技术的基本原理是对整幅图像进行变换,采用小波变换的本质是对一幅图像进行高通和低通滤波,对不同的频带上的图像部分可采用不同的量化技术进行量化。
其主要依据是变换后的各级分辨率的图像之间自相似的特点,采用逐级逼近技术来实现减少编码的数据量。
11、MPEG-4的体系结构与技术。
MPEG-4标准的体系结构有5个部分组成,分别是:
第一部分:
DMIF(多媒体传送整体框架),包括3个方面的技术,交互式网络技术,广播技术和磁盘技术。
第二部分:
缓冲区管理和实时识别。
第三部分:
音频编码。
第四部分:
视频编码。
第五部分:
场景描述。
12、图形填充算法、图形光照模型和光线跟踪法。
光照模型:
模拟物体表面的光照物理现象的数学模型。
有序边表算法
1.求出每一扫描线与多边形各边交点,把各交点坐标(xk,yk)存贮在表中;
2.按扫描线以及扫描线上交点x值递增顺序对该表进行排序。
如交点(x1,y1)和(x2,y2),当y1<y2或y1﹦y2而x1≤x2时,(x1,y1)将位于(x2,y2)的前面;
3.按(x1,y1)和(x2,y2)形式成对提取巳排序表的交点;
4.将每一对交点之间的象素置成填充的光强或颜色。
边填充法
1.取多边形的一条边;
2.求出每一扫描线与该边交点坐标(xk,yk);
3.将(xk,yk)右边的全部象素取补;
4.还有没处理的多边形边时转1,否则结束。
堆栈种子填充算法
1种子象素压入堆栈;
2当堆栈非空时做
(1)栈顶象素出栈;
(2)将出栈象素置填充色;
(3)检查每个与当前象素邻接的4连接象素,若其中有象素不为边界且没有设置成填充颜色,将该象素压入堆栈;
(4)转2
扫描线种子填充算法
扫描线种子填充算法适用于边界定义的区域。
算法如下:
1种子象素入栈;
2当堆栈非空时做
(1)栈顶象素出栈;
(2)沿扫描线对出栈象素的左右象素填充,直到遇到边界象素为止,即每出栈一象素,便对包含该象素整个区间填充;
(3)上述区间内最左最右的象素分别记为xLeft,xRight;
(4)在区间[xLeft,xRight]中检查与当前扫描线相邻的上下两条扫描线的有关象素是否全为边界象素或为已填充象素,若存在非边界未填充象素,则把每一区间最右象素取作种子入栈;
(5)转2
光线跟踪算法
光线跟踪过程可用二叉树(称光线跟踪树)表示。
逐个将相交点加入到二叉树中,树的左分支表示反射光线,右分支表示透射光线。
光线跟踪树最大深度可由用户选定,或由存储容量决定。
当树中一束光到达光源、背景或预定的最大深度时,停止跟踪。
在计算象素光强时,需从叶结点开始由底向上遍历相应二叉树,在树每个结点处,递归调用整体光照模型公式,累计光强贡献直到二叉树根结点。
光线跟踪法考虑来自环境的漫射、镜面反射和透射对物体表面产生的光强,其光照模型由Whitted提出:
I﹦I1﹢RsIs﹢RtIt其中,I1是不考虑环境影响,由简单光照模型计算的光强;Is是在镜面反射方向上来自其它物体的光强;It是在折射方向上来自其它物体的光强;Rs和Rt分别表示物体表面反射系数和透射系数。
此式也称整体光照模型。
综上,从视点到物体表面上任一点I为反射光强度Ie、漫反射光强度Id及镜面反射光强度Is总和,即I﹦Ie﹢Id﹢Is=kaIa﹢kdIl(N·L)﹢ksIl(R·V)n