多媒体技术与应用名词解释.docx

上传人:b****6 文档编号:7037462 上传时间:2023-01-16 格式:DOCX 页数:13 大小:33.54KB
下载 相关 举报
多媒体技术与应用名词解释.docx_第1页
第1页 / 共13页
多媒体技术与应用名词解释.docx_第2页
第2页 / 共13页
多媒体技术与应用名词解释.docx_第3页
第3页 / 共13页
多媒体技术与应用名词解释.docx_第4页
第4页 / 共13页
多媒体技术与应用名词解释.docx_第5页
第5页 / 共13页
点击查看更多>>
下载资源
资源描述

多媒体技术与应用名词解释.docx

《多媒体技术与应用名词解释.docx》由会员分享,可在线阅读,更多相关《多媒体技术与应用名词解释.docx(13页珍藏版)》请在冰豆网上搜索。

多媒体技术与应用名词解释.docx

多媒体技术与应用名词解释

1.媒体(Medium)

  在计算机领域中有两种含义,一是指用以存储信息的实体,如磁带、磁盘、光盘和半导体存储器;一是指信息的载体,如数字、文字、声音、图形和图像。

多媒体技术中的媒体是指后者。

2.多媒体(Multimedia)

  多媒体译自英文的"multimedia",multimedia是20世纪80年代初产生的一个英文名词。

1976年首次用到"MultipleMedia"一词,其中"Multiple"的意思是明确的,是"多"的意思,"Media"是"Medium"的复数形式。

多媒体是指多种媒体信息,如数字、文字、声音、图形、图像、视频和动画等。

到了80年代就把这两个词复合成"multi-media",用得多了之后就写成"multimedia"。

与multimedia对应的一词是monomedia,其中mono是"单一"的意思。

3.多媒体计算机技术(MultimediaComputing)

  计算机综合处理多种媒体信息:

文本、图形、图像、音频和视频,使多种信息建立逻辑连接,集成为一个系统并具有交互性。

  简单地说:

  

(1)计算机综合处理声、文、图信息;

  

(2)具有集成性和交互性。

4.CD-I(CompactDisc-Interactive)系统

  早期卓有成效的多媒体计算机系统之一。

由Philips/Sony公司研制开发,1986年4月在光盘国际会议首次公布和演示了基本的CD-I系统,受到好评,同时还公布了CD-ROM文件格式,这就是以后的ISO标准。

CD-I音频系统采用ADPCM压缩编码方法,CD-I视频子系统采用了一维DYUV编码、RGB5:

5:

5编码、CLUT(ColorLook-UpTable)编码及一维行程编码。

CD-I的图象是由四个图像平面组成:

一个彩色游标平面、两个全屏幕图像平面及一个背景平面。

在软件控制下,这些平面上的图可以按各种要求叠加生成一幅画面显示在光屏上。

5.DVI(DigitalVideoInteractive)系统

  RCA公司的戴维·沙诺夫研究中心(DavidSanaoffResearchCenterinPrinceton,NewJersey)于1983年开始了DVI技术的研究开发工作,在1987年3月第二次MicrosoftCD-ROM会议上,首次公布了DVI技术的研究成果,1988年10月Intel公司从GE公司买来了DVI技术,1989年Intel和IBM公司在国际市场上推出了DVI技术的第一代产品ActionMedia750,1991年又在美国comdex展示会上推出了第二代的DVI技术的产品ActionMedia750Ⅱ。

该产品荣获Comdex91最佳展示奖和最佳多媒体产品奖。

该产品采用了PLV(ProductLevelVideo)视频压缩编码算法;设计了两个专用芯片(82750PB象素处理器及82750DB显示处理器);设计制造了三块门阵电路:

82750LH主机接口门阵、82750LVVRAM/SCSI/capture接口门阵、82750LA音频子系统接口门阵;首次设计了视频音频引擎(AVE-AudioVideoEngine);开发了多媒体计算机软件系统:

AVSS(AudioVideoSub-System)和AVK(AudioVideoKernel)。

6.个人信息通讯中心(PIC-PersonalInformationCommunicationCentre)

  由于采用多媒体技术,使一台联网的计算机具有录音电话机、可视电话机、图文传真机、多媒体E-mail、立体声音响设备、电视机和录像机等多种功能,有人称其为个人信息通信中心。

它是现有PAC-PersonalActivityCentre和PDA-PersonalDigitalAssistant的发展方向。

7.彩色空间

  自然界常见的各颜彩色光都可以由红(R)、绿(G)、蓝(B)三种颜色光按不同比例相配而成,同样各种颜色也可以分解成红、绿、蓝三种色光,这就是色度学中最基本原理--三基色原理。

当然三基色的选择不是唯一的。

在多媒体计算机中常见的彩色空间如下:

  

(1)RGB彩色空间:

计算机的监视器的输入和电视机显示输出都需要RGB三个分量;

  

(2)YUV和YIQ彩色空间:

PAL制式彩色电视使用YUV彩色空间,Y是亮度,UV是色差信号,NTSC制式采用YIQ彩色空间,Y是亮度,IQ也是色差。

它们之间的关系是:

8.黑白全电视信号

  黑白全电视信号由三部分组成:

图像信号、复合消隐信号(行消隐和场消隐)和复合同步信号(行同步和场同步)。

从时间上看一行是64μs,正程是52.2μs,逆程(消隐)是11.8μs,其中有同步信号4.7μs,一帧是625行,40ms,分奇数场和偶数场。

从幅度上看,全电视信号峰峰值是1V,同步信号为100%,黑电平和消隐电平为70%,白电平为0%,图像信号介于白电平和黑电平之间,根据图像灰度而变化。

9.彩色全电视信号

  在现代彩色电视系统中,通常采用YUV彩色空间和YIQ颜色空间,Y为亮度信号,它可以和黑白全电视信号兼容,UV和IQ为色差信号。

我们以我国使用的PLA制式为例。

UV用副载波频率ωSC调制加到亮度信号Y上,最后形成彩色全电视信号,可用如下简化表达式:

10.离散时间振荡器(DTO-DiscreteTimeOscillitor)

  在数字锁相回路中用离散时间振荡器,可以改变振荡器振荡频率。

它的核心部件是加法器,加法器的输出通过一个寄存器反馈到加法器输入端,和另一个输入增量P相加,当和超过加法器最大值q时,产生溢出和进位,经过推导可以证明,增量P和进位的频率f。

成正比。

11.数字锁相

  采用数字电路原理使离散时间振荡器的振荡频率和输入频率一致。

数字锁相回路主要由数字式检相器、数字式滤波器、离散时间振荡器和数字式分频器组成。

12.数字解码

  彩色全电视信号数字化后,得到数字式彩色全电视信号,一路经过数字式彩色副载波陷波滤波器,得到数字式色差信号UV;再经过数字式UV解调电路,分别得到数字式U和V信号,这就是彩色全电视信号的数字解码。

13.彩色键联(ColorKey)

  视频获取器的视频信号和VGA卡计算机输出信号的合成是通过彩色键联信号完成的。

我们可以在计算机VGA卡定义一个显示窗口,再在这个窗口中定义一个彩色键联值,即某一个颜色,当在VGA卡中出现这个颜色时,在窗口中显示的是当时的视频信号信息,这样就将视频信号和VGA卡信号合成在一起。

14.查找表(LUT-LookUpTable)

  在多媒体计算机中利用查找表解决视频信号实时处理问题。

常用的有一维和二维查找表,它们是用ROM和RAM实现的函数变换,在我们课程中常遇到的sin/cos表、对数、反对数、求反、二值化及直方图均衡化都可用一维查找表实时实现,简单的乘法可以用二维查找表完成。

15.调色板(Pallette)

  调色板是显示技术中使用的一个查找表。

如在显示缓存中可以存颜色的代码(4位或8位),输出时通过调色板将颜色的代码转换成24位真彩色。

调色板可以用RAM实现,输入8位颜色代码,就是RAM的8位地址,每个存储器的字长是24位真彩色。

这样经过调色板就可以实现8位颜色代码到24位真彩色的转换。

16.图像文件格式

  数字式图形、图像及视频信息,都以文件的形式存储到计算机的存储器,我们希望能有国际标准的文件格式,但是目前还不全是,大多数是工厂或企业的标准。

通常将其分成两类,一类是静态图像文件格式;另一类是动态视频图像文件格式。

我们课件中介绍了六种静态图像文件格式:

GIF-GraphicsInterchangeFormat、TIFF-TagImageFileFormat、TGA-TagImageFileFormat、BMP-Bitmap、PCX和MMP及两种动态视频图像文件格式:

MGP和AVI。

17.数字音频

  将声音连续电压表示,经过离散化的采样和量化变成数字表示,称之为数字音频。

18.音频文件格式

  数字式音频信息都以文件的形式存储到计算机的存储器中,我们课件中给出了下述音频文件格式:

  文件扩展名   简要说明.

  PCMPCM    (脉冲码调制)

  VOCcreative  公司波形音频文件格式

  WAVMicrosoft 公司的波形音频文件格式.

  SNDNeXT    计算机的波形文件格式.

  AIFApple   计算机的波形文件格式.

  MID      MIDI文件格式.

  RMI      Microsoft公司的MIDI文件格式

19.音频编码国际标准

  国际电报电话咨询委员会(CCITT)和国际标准化组织(ISO)先后提出了系列有关音频编码的国际标准和建议。

1972年首先制定了G.71164Kbps(Aμ)→(Aμ)律PCM编码标准。

1984年又公布了G.721标准(1986年修订)。

它采用的自适应差值脉冲编码(ADPCM),数据率为32Kb/s。

针对宽带语音(50~7KHz),CCITT制定了G.722编码标准,它的数据率为64Kb/s。

之后又公布了G.723建议码率为5.3kb/s和6.3kb/s,G.726的码率为16kb/s。

CCITT于1990年通过了16-40kb/s镶嵌式ADPCM标准G.727。

CCITT在1992年和1993年分别公布了浮点和定点算法的G.728标准。

ISO的运动图像专家组(MPEG),为图像伴音制定了20KHZ带宽的128Kb/s标准。

20.AC-3

  美国杜比公司(Dolby)制定的环境立体声音频压缩编码标准,它在制定了AC-1和AC-2后又制定了AC-3。

AC-3采用了频谱分析技术,非线性子带带宽分配、动态时域/谱域带宽分配、心理声学模型和多声道耦合技术,具有很高的数据压缩率和很低的失真度。

杜比AC-3有完全独立的6个声道,全频带的左、右、中、左环绕、又环绕和一个低于120HZ的超低音,因此,又称为5.1声道。

21.文语转换系统 

  TTS-TexttoSpeech文语转换(TTS)是一种智能型的语言合成,它涉及到语言学、语音学、语音信号处理、心理学等多个领域。

它综合了多学科的研究成果,将文字转换成声音,解决计算机言语输出问题。

清华大学计算机系设计实现的汉语TTS系统Sonic主要由四个模块组成:

语言学处理、语音学处理、波形编辑合成和安装程序。

22.MIDI(MusicalInstrumentDigitalInterface)

  MIDI是乐器数字接口的缩写,它始建于1982年,MIDI泛指数字乐器接口国际标准。

标准的多媒体PC平台能够通过内部合成器或连到计算机端口的外部合成器播放MIDI文件。

MIDI标准规定了不同厂家的电子乐器与计算机连接的电缆和硬件。

它还指定了从一个装置传送数据到另一个装置的通信协议。

这样,任何电子乐器,只要有处理MIDI信息的处理器和适当的硬件接口都能变成MIDI装置。

MIDI间靠这个接口传递消息(massage),消息是乐谱(Score)的数字描述。

乐谱由音符序列、定时和合成音色(Patches)的乐器定义所组成。

当一组MIDI消息通过音乐合成芯片演奏时,合成器解释这些符号,并产生音乐。

23.语音识别

  语音识别是计算机将人发出的声音、字或短语转换成文字、符号或给出响应、作出回答。

口语是最自然的人机交互方式,让说话替代键盘输入汉字是中国人使用计算机者的愿望。

它正在变成现实,其技术基础就是语音识别和理解。

语音识别系统可分为大、中、小词汇量三种。

词汇量少于100的称为小词表语言识别;大于1000的称为大词表语音识别;中间称为中词表语音识别系统,语音识别系统也可按输入方式分成:

孤立词、连接词和连续词语音识别系统,也可按说话人分成特定人、限定人和非特定人语音识别系统。

24.量化数据

  压缩编码中的量化不是A/D变换后的量化,但是它是数据比特率下降最有力的方法。

它是以PCM码作为输入,经正交变换、差分或预测处理后,在熵编码之前,对正交变换系数、差值或预测误差以量化处理。

量化输入值的动态范围很大,需要以多的比特数表示一个数值,量化输出只能取有限个整数,称作为量化级,希望量化后的数值用较少的比特数便可表示。

每个量化输入被强行归一到与其接近的某个输出,即量化到某个级。

量化处理总是把一批输入量化到一个输出级上,所以量化处理是一个多对一的处理过程,是一个不可逆的过程,量化处理有信息丢失,或者说会引起量化误差(量化噪声)。

25.霍夫曼编码

  霍夫曼(Huffman)编码方法于1952年问世,现在广泛地用在各种数据压缩技术中,它是熵编码中最佳编码方法。

霍夫曼编码的理论依据是变字长编码理论。

在变字长编码中,编码器按输入信源符号出现的统计概率,给输出码字分配以不同的字长。

对于编码输入时,出现大概率的信源符号,赋以短字长的输出码字;对于编码输入时,出现的小概率信源符号,赋以长字长的输出码字。

可以证明,按照概率出现大小的顺序,对输出码字分配不同码字长度的变字长编码方法,其输出码字的平均码长最短,与信源熵值最接近,编码方法最佳。

26.行程编码

  行程编码(RunLengthCode)也称行程长度编码。

行程编码是无失真压缩编码方法。

行程编码原理是建筑在图像统计特性基础上。

对于黑白二值图像,由于图像的相关性,每一行扫描线总是由若干段连续的象素点和连续出现的白象素点构成。

黑(白)象素点连续出现的象素点数称行程长度,简称长度。

黑象素的长度和白象素的长度总是在交替发生,交替发生变化的频度与图的复杂度有关。

现在我们把灰度1(黑)和1的行程长度,或0(白)和0的行程长度组合,构成编码输入码元而进行编码,并按其出现的概率,分配以不同码长的码字。

大概率以短码;小概率以长码;同样道理,对于灰度图像或彩色图像,也可以将其灰度值(或彩色值)与其行程长度组合一起作为编码输入的码元进行编码。

27.预测编码

  预测编码(PredictiveCoding)是统计冗余数据压缩理论三个重要分支之一,它的理论基础是现代统计学和控制论,用预测编码可以减少数据时间和空间的相关性,它广泛地用于时间序列图像数据和语音数据的压缩编码。

预测编码的方法是从相邻象素之间有较强的相关性特点考虑,比如当前象素的灰度或颜色信号,数值上与其相邻象素总是比较接近,除非处于边界状态,那么,当前象素的灰度或颜色信号的数值,可用前面已出现的象素的值进行预测(估计),得到一个预测值(估计值),将实际值与预测值求差,对这个差值信号进行编码、传送,这种编码方法称为预测编码方法。

预测编码方法分线性预测和非线性预测编码两种。

28.变换编码

  变换编码不是直接对空域图像信号进行编码,而是首先将空域图像信号映射变换到另一个正交矢量空间(变换域或频域),产生一批变换系数,然后对这些变换系数进行编码处理。

其中关键问题是在时域或空域描述时,数据之间相关性大,数据冗余度大,经过变换在变换域中描述,数据相关性大大减少,数据冗余量减少,参数独立,数据量少,这样再进行量化,编码就能得到较大的压缩比。

目前常用的正交变换有:

傅立叶(Fouries)变换、沃尔什(Walsh)变换、哈尔(Haar)变换、斜(Slant)变换、余弦变换、正弦变换、K-L(Karhunen-Loeve)变换等。

29.K-L变换

  K-L(Karhunen-Loeve)是以统计特性为基础的最佳正交变换,也称为特征向量或主分量变换。

1933年霍特林(Hotelling)首先发现主分量变换技术,并对这种正交变换作了深入研究。

所以有人称K-L变换为霍特林变换。

  K-L变换的优点是:

  

(1)经过K-L变换后,所得Y向量,其平均向量为0,说明Y向量坐标系已移至直流分量为零的位置。

  

(2)Y向量的协方差矩阵为对角矩阵,对角线上的元素是Y向量的方差,左上角的值最大,右上角值最小。

非对角线上的元素是协方差,而协方差值均为零,说明Y向量之间的相关性很小。

K-L变换的缺点是计算过程复杂,变换速度慢。

30.DCT变换离散余弦变换(DCT--DiscreteCosineTransform)

  是傅里叶变换的一种特殊情况。

在傅里叶级数展开式中,被展开的函数是实偶函数时,其傅里叶级数中只包含余弦项,称之为余弦变换。

离散余弦变换的特性和K-L变换比较接近,但是DCT计算复杂性适中,又具有可分离特性,还有快速算法,所以被广泛地用在图象数据压缩编码算法中,如JPEG、MPEG-1、MPEG-2及H.261等压缩编码国际标准都采用了离散余弦变换编码算法。

31.JPEG

  国际电报电话咨询委员会(CCITT)和国际标准化委员会(ISO)联合组合一个图像专家组JPEG(JointPhotographicExpertsGroup),从1986年开始,多年来一直致力于研究连续色调、多级灰度、静止图像的数字图像压缩编码方法,并于1992年1月提出连续色调静止图像压缩编码国际标准ISO/IEC10918,现在它被广泛地应用在多媒体计算机、通信等各个领域。

基于离散余弦变换(DCT)的JPEG编码原理是:

将YUV彩色图片分成8*8块,对每个8*8块进行DCT变换,得到DCT系数采用JPEG给定或自己选定的量化表进行量化,得到DC和AC系数,对AC系数进行之字型扫描,对其进行行程编码和熵编码,这样就得到了JPEG压缩图像的数据。

最近几年JPEG组织又推出了基于小波变换(WaveletTransform)的JPEG-2000,它有更高的压缩比,较小的失真,现在它被成功地用在数码相机等产品中。

32.H.261

  国际电报电话咨询委员会CCITT的第XV研究小组于1984年组建了一个关于可视电话编码的特别小组,它的目标是建立一个传输率为m×384kbps(m=1,2,…,5)的视频编码标准。

后来经过充分的研究和论证,CCITT建议草案H.261可用于传输率在P×64kbps(P=1,2,…,30)的视听服务的视频编码器,终于于1990年12月完成并予通过,H.261成为正式的视频图像压缩编码的国际标准。

该标准主要用于采用综合业务数字网ISDN(IntegratedServiceDigitalNetwork)的各个领域,如可视电话和视频会议等。

H.261的压缩编码方法,帧内压缩编码方法与JPEG相似,不同的是它采用公用中间格式CIF(CommonIntermediateFormat)288*360和1/4公用中间格式QCIF(QuarterCommonIntermediateFormat)144*180,并采用帧间预测和运动估计进行帧间压缩。

33.MPEG(MPEG-1,2,4,7,21)

  MPEG(MovingPictureExpertsGroup)运动图像专家组,在国际标准化组织ISO/IEC的领导下,从1988年MPEG委员会开始活动,1990年提出一个MPEG标准草案,1991年底提出了用于数字存储媒体的位率为1.5Mbps的运动图像及其伴音的压缩编码方案,为ISO/IEC11172号建议,并于1992年正式通过,定名为MPEG-1。

此后于1993年11月在汉城会议(ISO/IECJTCI/SC29/WG11)上正式通过了ISO/13813,定名为MPEG-II标准。

MPEG1和MPEG2与JPEG和H.261有很多相似之处,它们也是采用了DCT、量化、行程编码和熵编码以及帧间预测和运动补偿。

MPEG组织于1993年开始制定MPEG-4,1999年提出草案,2000年制定了最终国际标准,它与MPEG1、2最大区别是采用了基于内容(Object-Based)压缩编码方法。

MPEG组织于1998年10月开始征集有关MPEG-7的建议,准备在2001年底正式制定出MPEG-7国际标准,它的正式名称叫作"多媒体内容描述接口",它将为各种类型的多媒体信息规定一种标准化的描述,这种描述与多媒体信息的内容本身一起,支持用户对其感兴趣的各种资料进行快速、有效地检索。

MPEG-21定义一个多媒体框架,解决电子内容(E-content)的传输等问题,1999年8月正式提出,1999年12月通过征集多媒体框架的技术报告(MultimediaFramework),2000年成立了MPEG-21工作组(WG)。

34.MPC

  多媒体个人计算机(MultimediaPC-MPC)并不是一个全新的个人计算机,它是在现有PC机基础上加一些硬件板卡及相应软件,使其具有综合处理声、文、图信息的功能,称之为MPC。

在交互式多媒体协会IMA(InteractiveMultimediaAssociation)兼容性计划指导下,由Philips、Microsoft、Tandy、NEC等14家著名厂商组成了多媒体市场协会,制定了多媒体个人计算机平台标准。

实际上存在两个MPC平台标准:

第一个是1991年11提出的。

建立在10MHZPC286AT基础之上,后来很快又修改为16MHZ386SX;第二个平台标准是1993制定的,这个标准定义了第二个MPC平台标准的最小系统功能,但是并不规定它的系统结构和组成。

这样有利于功能扩充和CPU的不断升级换代。

35.CD-RTOS

  CD-RTOS(CompactDiscRealTimeOperatingSystem)是由Philips和Sony公司研制开发的CD-I的光盘实时操作系统。

它源于高性能的OS-9时时操作系统,用68000汇编语言写成的,CD-RTOS是一个多任务实时操作系统,有模块化的结构,设备独立的I/O接口及能够处理多级树形结构的盘目录。

它由系统相关库、CD-RTOS核、管理程序及设备驱动程序四部分组成。

36.AVE

  Intel和IBM研制开发的Ⅱ型DVI系统,荣获了"Comdex91"最佳多媒体产品奖和最佳展示奖。

系统中首次引进视频音频引擎AVE(AudioVideoEngine)的概念。

AVE是由视频子系统、音频子系统、彩色键连子系统、视频音频总线、获取子系统、CD-ROM子系统及主机接口子系统七部分组成。

37.AVSS

  它是DVI系统中的软件系统,称之为视频音频子系统AVSS(AudioVideoSub-System)。

它可以在DOS支持下工作,最下层是驱动软件,一种是常驻内存的驱动器如视频驱动器、音频驱动器及多功能驱动器,一种是虚拟驱动器软件;第二层是库函数;最上层是应用层,它包括各种应用程序。

38.AVK

  它是Ⅱ型DVI系统的软件。

称之为视频音频核AVK(AudioVideoKernel),它可以在Windows环境下工作。

也可在不同操作系统支持环境下工作。

它具备多层模块化结构的特点,共分四层:

最下层是象素处理器微码子程序的集合,称之为"微码引擎";第二层是视频音频驱动器AVD(Audio/VideoDriver);第三层是视频音频库AVL(Audio/VideoLibrary);最上层是特定支撑环境层,它的功能是读写数据到主文件系统;把AVK集成到Windows支持的环境中。

39.MPACT

  MPACT是美国ChromaticResearch公司设计开发的多媒体处理器芯片,由其合作伙伴:

东芝、LG、SGS-Thomson等半导体厂商生产。

被1996年美国微处理器论坛(Micro-ProcessorForum)推荐为多媒体处理器(M

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 总结汇报

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1