计算机多媒体技术基础知识.docx
《计算机多媒体技术基础知识.docx》由会员分享,可在线阅读,更多相关《计算机多媒体技术基础知识.docx(15页珍藏版)》请在冰豆网上搜索。
计算机多媒体技术基础知识
计算机多媒体技术基础知识
计算机多媒体技术基础知识
一、媒体(media)
1.什么是媒体?
在计算机领域中的含义?
媒体概念(Media)
媒体是承载信息的载体,但在不同领域有不同说法。
仅在计算机领域就有几种含义:
(1)存储信息的媒体:
如磁带、磁盘、光盘等。
(2)传播信息的媒体:
如电缆、电磁波等。
(3)表示信息的媒体:
如数值、文字、声音、图形、图像、视频等。
我们这里将要讨论的是表示信息的媒体,即信息的存在形式和表现形式。
2.什么是多媒体?
关于多媒体的定义,现在有各种说法,不尽一致。
从字面理解,多媒体应是“多种媒体的综合”,事实上它还应包含处理这些信息的程序和过程,即包含“多媒体技术”。
多种媒体的综合.从狭义角度来看,多媒体是指用计算机和相关设备交互处理多种媒体信息的方法和手段;从广义来看,则指一个领域,即涉及信息处理的所有技术和方法,包括广播、电视、电话、电子出版物、家用电器等。
3.多媒体信息包括的信息种类?
(1)文本(Text):
包括数字、字母、符号和汉字。
(2)声音(Audio):
包括语音、歌曲、音乐和各种发声。
(3)图形(Graphics):
由点、线、面、体组合而成的几何图形。
(4)图像(1mage):
主要指静态图像,如照片、画片等。
(5)视频(Video):
指录像、电视、视频光盘(VCD)播放的连续动态图像。
(6)动画(Animation):
由多幅静态画片组合而成,它们在形体动作方面有连续性,从而产生动态效果。
包括二维动画(2D、平面效果)、三维动画(3D、立体效果)。
4.多媒体特性?
多媒体除了具有信息媒体多样化的特征之外,还具有以下三个特性:
(1)数字化:
多媒体技术是一种“全数字”技术。
其中的每一媒体信息,无论是文字、声音、图形、图像或视频,都以数字技术为基础进行生成、存储、处理和传送。
(2)交互性:
指人机交互,使人能够参与对信息的控制、使用活动。
例如播放多媒体节目时,可以人工干预,随时进行调整和改变,以提高获取信息的效率。
(3)集成性:
是将多种媒体信息有机地组合到一起,共同表现一个事物或过程,实现“图、文、声”一体化。
5. 多媒体的关键技术
多媒体技术实际是面向三维图形、立体声和彩色全屏幕画面的“实时处理”技术。
实现实时处理的技术关键,是如何解决好视频、音频信号的采集、传输和存储问题。
其核心则是“视频、音频的数字化”和“数据的压缩与解压缩”。
此外在应用多媒体信息时,其表达方法也不同于单一的文本信息,而是采用超文本和超媒体技术。
(1)视频、音频的数字化:
是将原始的视频、音频“模拟信号”转换为便于计算机进行处理的“数字信号”,然后再与文字等其它媒体信息进行叠加,构成多种媒体信息的组合。
(2)数据的压缩与解压缩:
数字化后的视频、音频信号的数据量非常之大,不进行合理压缩根本就无法传输和存储。
因此,视频、音频信息数字化后,必须再进行压缩才有可能存储和传送。
播放时则需解压缩以实现还原。
(3)超文本和超媒体技术
①超文本(Hypertext):
·传统的文本信息是按“线性结构”组织的,即按顺序排列,用户只能依次提取。
·超文本则采用“非线性的网状结构”来组织文本信息,各部分文本之间没有顺序、不分层次,但都有“指针”链接(Link)。
用户可以随心所欲地进行跳转,调用非常灵活。
所以超文本指的是使用链接方式连接相关文件的一项技术。
并且不限于文本文件。
②超媒体(Hypermedia):
·传统的信息媒体只是数字和文本,表现形式单调。
·超媒体概念除了针对文、图、声、像多种媒体信息之外,还包含必须采用超文本技术的要求。
所以超媒体指的是使用超文本方式链接文、图、声、像多种媒体文件的一项技术。
多媒体技术和多媒体计算机
一.什么是多媒体计算机(MultimediaPersonalComputer)
多媒体计算机是计算机将文字处理、图形图像技术、声音技术等与影视处理技术相结合的产物,它是90年代的又一次革命。
二.多媒体计算机的组成
多媒体硬件平台,软件平台,多媒体制作工具。
三.多媒体的应用
1.教育方面
2.商业方面
3.电子出版方面
4.家用多媒体
二、声音处理知识
1.声音类型?
波形声音(wave)、数字音乐(midi)。
Wav文件与mid文件的比较:
A:
存储空间方面:
前者大,后者小的多;
B:
修改方面:
前者不易,后者有响应的软件(CAKEWALK)
C:
播放效果受声卡影响程度:
前者受声卡不大,后者则受声卡质量影响很大。
D:
二着可以同时放音。
⑤受到几乎所有的图像浏览器的支持,所以大多数用户都可以看到网络上的GIF图像,而不必担心兼容性问题。
⑥是一种公开的图形文件格式,虽然仍然受到版权保护,不过对于个人用户是免费的。
(2)JPEG图文文件格式
另外一种十分流行的图形文件格式就是JPEG。
其目的是为了给摄影图像提供一种标准的"有损耗"压缩方案。
下面是JPEG图形文件格式的特性:
①使用有损耗的压缩方案,所以图像在压缩后会损失一些细节。
②支持大约1670万种颜色,可以很好地再现摄影图像,尤其是色彩丰富的大自然。
③JPEG格式的图像要比GIF格式的图像小,所以下载的速度要快一些。
④在图像的鲜明的边缘周围会损失细节,所以,他并不适用于包含鲜明对比图形或者文本的图像。
(3)PNG图形文件格式
PNG是专门为网络而准备的。
PNG格式既有GIF的优点,又有JPEG的优点,他是一种新的无损耗的文件格式,同时还避免了GIF自身具有的一些问题。
他的压缩技术比GIF好,并且支持的颜色种类也多于GIF,达到了1670万种。
目前,在Dreamweaver、MicrosoftExplore4.0,和NetscapeNavigator4.0及其更高版本都支持PNG图形格式。
(4)BMP图形文件格式
BMP文件格式也被称为位图格式,他在Windows操作系统上经常见到。
这些文件几乎完全没有压缩,体积极为庞大,所以下载极为费时。
所以,基于这个原因,目前只有Microsoft的InternetExplorer支持BMP文件。
所以用户最好不要使用BMP图形文件格式。
3.视频信号基本知识
几种常用的视频信号
由前所述,显示器显示图像时,使用的是RGB信号。
但考虑到视频信号的发射、传输等问题,以及某些设备的兼容性,经常使用的却是一些由RGB信号派生出来的其它视频信号。
现将几种常用的视频信号介绍如下:
①RGB信号:
是根据三基色原理,由光电转换器件直接生成的电信号,它具有最高的信号质量。
但在传输时会极大地增加带宽,从而提高设备成本,而且与黑白电视不兼容。
②YUV信号:
根据眼睛对亮度非常敏感,辨别能力强,而对颜色分辨能力差的特点,采用一个亮度信号(Y)和两个色差信号(U、V)去描述像素;并通过降低色差信号采样频率,达到频带宽度变小的目的,从而缓解对传输条件的苛求。
③Y/C信号:
即将U、V两个色差信号进一步合成为一个色度信号C。
但图像质量不如WV信号。
在视频设备上使用的S—Video接口便是这种信号。
④复合视频信号:
也称彩色全电视信号,是将Y、C信号再进行合成而得到的。
由于复合视频信号将所有的分量、同步信号和消隐信号都复合成为一个信号,所以容易产生串扰,是这些视频信号中图像质量最差的。
将RGB信号转换为YUV信号、Y/C信号以及复合视频信号的过程称为编码,而把它们还原成RGB信号的逆过程则叫解码。
视频信号的制式
当前国际流行的视频信号制式有三种:
PAL制、NTSC制和SECAM制。
在我国接触较多的是前两种。
①PAL制:
是我国采用的电视标准。
规定每秒25帧画面,每帧画面625行,分为两场显示(隔行扫描)。
即第一场画面扫描奇数行,第二场画面扫描偶数行,然后组合为一幅完整的图像。
PAL制以分辨率表示的图像大小规定为768×576。
②NTSC制:
是美国采用的电视标准。
规定每秒30帧画面,每帧画面525行,也分两场显示(隔行扫描),其图像大小为720×486。
由于PAL制与NTSC制的场扫描频率、行扫描频率以及其它处理完全不同,所以它们互不兼容。
③图像数据压缩哪两种?
有损压缩与无损压缩。
④主要图像压缩标准:
JPEG与MPEG.
作业:
1:
认真阅读教材,掌握基本知识。
2:
熟悉各类媒体文件类型。
Acdsee3.2的使用(bmp、gif、jpg)
超级解霸5.0的使用(mpg、dat、wav、mid、rmi、mp1、mp2、mp3)
2.1.2音频媒体的处理
在windows下可以处理的音频信息有三种类型:
来自自然界的声波、人工设计时电子数字音乐和CD唱片。
下面对这三种声音的处理过程、有关技术和其它相关知识进行介绍。
1.波形声音(WAVE)
波形声音是来自自然界的声波,通常由话筒采集,按声波波形的变化规律,转换成电子模拟信号,并记录下来(例如记录在磁带上)。
(1)声波的数字化技术
若要通过计算机处理或回放这些波形声音的模拟信号,必须先用模数转换器(ADC)把它们转换成数字信号,然后才可以进行处理或者存储;回放时,则须用数模转换器(DAC)把数字信号还原成波形声音的模拟信号,然后再回放。
这个过程就是声音的数字化技术。
声音的数字化技术是多媒体计算机中一项重要的基本技术。
(2)数据存储:
波形声音的模拟信号经ADC数字化后,可将数据存储到一个扩展名为.WAV的文件中。
该文件一般没有经过压缩处理,所以占用存储空间较大。
(3)波形声音数字化的技术参数
①采样频率(SamplingRate):
是一秒钟内对声波模拟信号采样的次数。
采样频率越高,声音保真度越好,产生的数据量也就越大,占用存储空间越多。
为此,按照对声音的不同要求,设置了三个标准,分别为语音效果、音乐效果、高保真效果。
②采样数据位数(SamplingData):
也称量化精度,是每个采样点二进制数据的位数,有8、12、16位之分。
此位数对声音的音质有重大影响,位数越多,还原的音质越细腻,占用存储空间越大。
③声道数(Channels):
有单声道、双声道(立体声)和多声道。
声道越多,数据量越大,空间感越强。
一个声音文件的数据量(存储容量)可用下面公式计算:
(采样频率×采样数据位数×声道数)/8=字节数/秒
2.数字音乐(MIDI)
(1)数字音乐的制作
数字音乐写成MIDI(MusicallnstrumentDigitalInterface),代表乐器数字接口,是数字音乐的一个国际标准。
人工创作的数字音乐被写在一个文件中,这些文件里的数据不是声波数字化的那种数据,而是一串指令。
其中包括音符、定时和多达16个通道的乐器定义。
对每个音符的信息又包括按键、通道号、持续时间、音量和力度等。
是纯粹符号化的音乐。
这类文件的扩展名是.MID。
(2)MIDI文件与WAV文件的比较
·MIDI文件占用存储空间小:
一小时高保真的立体声音乐,使用.MID格式存储约占用400KB;若用.WAV格式存储则占用600MB,相差1500倍。
·MIDI文件可以灵活处理:
在音序器的帮助下,用户可以任意改变音调、音色等属性,产生特殊效果。
WAV文件则很难做到。
·当播放WAV文件时,可同时播放MIDI音乐,从而产生配乐效果。
但两个WAV文件则不能同时播放。
·WAVE文件可以从任何声源录制生成,而且在各种计算机上的播放效果基本一致。
MIDI文件则无法得到自然界中的所有声音,而且播放效果还与合成器的质量有关,不同档次的声卡差异较大。
3.CD唱片
CD唱片对声音的生成、处理、还原方法与WAVE文件基本相同,也是通过数字采样技术制作的,但不生成.WAV文件,而是把采样数据直接写在光盘上。
它的规范是:
采样频率44.1xHz、采样数据16位、立体声。
因此能完全重现原来声音的效果。
4.声卡
声卡又称音效卡,是一块专用电路板,插入到主板的扩展槽中。
它是多媒体计算机接收、处理、播放各类音频信息的重要部件,也是多媒体计算机不可缺少的组成部分。
(1)声卡的基本功能
①录音、放音功能:
达到的采样标淮应是44.1KHz、16bit,立体声。
MIDI音乐功能:
应达到同时合成六种旋律乐器和两种打击乐器。
⑤混音输出功能:
能实现六种声源的混音输出,双声道。
④语音压缩、解压缩功能:
应兼容朋PCM(自适应差分脉冲编码调制)规范。
(2)声卡的选择
通常考虑下列因素:
①从声波采样位数来看,选择8位声卡,或是16位声卡。
现在基本选用后者。
②从立体声效果来看,选择双声道声卡,或是3D增强音效立体声声卡。
现在已出现具有杜比逻辑五声道解码性能的环绕声声卡,需要配置前后左右五个音箱。
③从收录、播放来看,选择半双工声卡,或是全双工声卡。
前者接收、播放不能同时进行;后者则可以。
利用全双工特性还能通过因特网(Internet)进行双方实时通话。
④从MIDI合成来看:
选择刚合成器声卡,或是波表合成器声卡。
若选用后者,还需进一步考虑使用软波表,还是硬波表:
波表中复音数量是32,还是64。
软波表强烈依赖CPU的速度,硬波表固化在芯片中,不依赖CPU。
复音数量多时,音效将更加自然逼真。
⑤从音频输出来看:
选择具有功率放大器的较好,能直接推动音箱。
⑥还要注意是否符合windows95支持的P&P插即用(PlugandP1ay)规范。
2.1.3图形、图像和视频
1.视觉媒体的分类
(1)按媒体信息生成方式分类
①主观图形:
指使用各种绘图软件制作的图片。
包括由点、线、面、体构成的图形(Graphics)和二维、三维动画(Animation)。
②客观图像:
由光电转换设备(摄像机、扫描仪、数码相机等)生成的具有自然明暗、颜色层次的图片。
包括图像(Image)和视频(Video)。
(2)按媒体信息存储方式分类
①位图(bitmap)图像:
按“像素”逐点存储全部信息,适用于各类视觉媒体信息。
这种存储方式占用存储空间很大。
②矢量(Vector)图形:
用“数学表达式”对图形中的实体进行抽象描述(即矢量化),然后存储这些抽象化的特征。
适用于图形和动画。
(3)按图像的视觉效果分类
①静态图像:
只是一幅图片。
包括图形和图像。
②动态图像:
由一组图片组成,依次连续显示。
包括动画和视频。
由上述各种分类可以看出:
图形和图像之间,图像和视频之间,视频和动画之间,都是既有联系,又有区别的一些概念,关键在于从哪个角度去看。
2.图形文件的格式
由于各种图形处理软件都有各自的处理方法,所以它们的文件存储格式各不相同。
了解这些图形文件的基本信息和存储格式,有助于对图形数据的应用和处理(文件压缩、文件格式转换等)。
(1)以位图方式存储的文件格式
主要有如下几种:
①PCX文件:
PCX格式是Z—soft公司为存储“PC画笔”(PCPaintbrush)软件包生成的图形而建立的。
由于它较早地使用位图方式存储图形,所以多数软件都可兼容。
它的压缩效率取决于图形结构和颜色数目,对于颜色较少、构造简单的图形效果较好。
②BMP文件:
BMP(Bitmap)格式是Microsoft公司专门为windows制订定的位图文件格式,也就是以前windows版本的DIB(DevicelndependentBitmap)格式。
除了windows环境下的软件之外,不能在非windows环境下使用。
③TIF文件:
TIF(TaglmageFileFormat)格式是A1dus和Microsoft公司为扫描仪和计算机的“出版软件”而制订的,是多媒体CD—ROM中的一种重要文件格式。
由于它与计算机硬件及操作系统无关,所以在国际上广为流行。
TIF格式可转换为BMP格式。
④GIF文件:
GIF(GraphicsInterchangeFormat)格式是CompuServe公司开发的文
件格式。
主要目的是为了在网上能够方便地进行图形传输和交换。
⑤TGA文件:
TGA格式是Truevision公司为支持它们的图形卡而制订的一种格式。
(2)以矢量方式存储的文件格式
①WMF文件:
WMF(windowsMetaFile)格式是Microsoft公司制定的图元存储格式。
文件使用矢量图形描述语言,占用存储空间要比值图存储方式小很多;显示时,利用编译程序再将文件内容转换成可见的图形,故又称矢量格式转换文件。
②DXF文件:
DXF(DrawingExchageFiles)格式是Autodesk公司为计算机辅助设计(CAD)制订的一种数据交换格式。
这种格式得到其它CAD程序的广泛支持,对于非CAD的工程绘图也有很大价值。
3.视频信号基本知识
(1)视频图像的由来
①颜色的产生:
根据三基色原理,将红(Red)、绿(Green)、兰(Blue)三种基本颜色进行不同比例的混合,便可组合出丰富多彩的所有颜色。
②图像的构成:
将一幅矩形画面均匀分割成有限的行和列,例如,640(列)×480(行)、l024(列)×768(行);则所有行、列的交叉位置便是所谓的“像素”点;给每个像素点赋予实际的颜色,便构成一幅图像。
③光电转换:
通过光敏器件CCD(电荷藕合器件)可以把一个像素点的颜色转换成包含有R、G、B三种信息成分的电信号。
④图像采集:
使用光电转换设备(摄像机、数码相机等),从第一行左端的第一个像素点开始,每行自左向右(称水平扫描,对应行频)、各行间自上向下(称垂直扫描,对应帧频),依次将全部像素点转换成有序的肌B电信号,并存储下来,便采集到一帧图像。
这一过程由扫描电路和其它辅助电路自动完成。
⑤图像显示:
通过与图像采集完全相同的扫描过程,控制显像管的电子枪依次有序地击打屏幕上的像素点:
同时按该像素点的RGB数值控制电子束的强度;当把屏幕上的像素点全部扫描一遍之后,便可看到复原的一帧图像。
⑥图像的稳定:
保持一定的水平和垂直扫描速度,使显示的图像一帧一帧地不断刷新,利用人眼的“视觉暂留”现象,便看到了稳定的图像。
如果每次刷新的各帧图像完全相同,这就是“静态图像”;如果每次刷新的各帧图像不相同,则是“动态图像”。
(2)
1.4视频媒体的处理
1.视频图像的数字化
无论是RGB信号,还是Yuv信号:
也不管PAL制,还是NTsC制;如果用计算机对它们进行处理,必须先要数字化。
视频图像数字化的方法及量化因素与音频信号相似。
视频图像数字化的典型做法是:
采用YW信号;按Y:
u:
V=4:
2:
2的比例关系设置三个分量的采样频率;三个分量的采样数据位都定为8bit,达到24位色标准。
2.图像数据的压缩
(1)数据压缩的几点考虑
①数据压缩的目的:
用最少的代码表示源信息,减少所占存储空间,并利于传输。
由数据压缩的思路:
将图像中的信息按某种关联方式进行规范化,改用这些规范化的据描述图像,以大量减少数据量。
例如,某个四边形为红色,这时只要保存四个顶点的坐标和红颜色代码就成了;又如在动态图像中,则可只记录运动部分的变化。
如此规范化之后,就不必存储每个像素的信息了。
(2)数据压缩的分类
①无损压缩:
也称冗余压缩法。
它去掉数据中的冗余部分,在以后还原时可以重新插入,即信息不丢失。
因此,这种压缩是可逆的。
但压缩比很小,仅为2:
1—5:
1。
②有损压缩:
其作法是在采样过程中设置一个门限值,只取超过门限的数据。
即以丢失部分信息达到压缩目的。
例如,把菜一颜色设定为门限值后,则与其十分相近的颜色便被视为相同,而实际存在的细微差异都被忽略了。
由于丢失的信息不能再恢复,所以这种压缩是不可逆的。
但利用人的视觉特性,使得解压缩后的图像看起来与原来图像“一样”。
这种方法的压缩比很大,但压缩比越大,图像质量越差,因此,两者要综合平衡。
(3)数据压缩方法的评价
①压缩比要大。
②压缩算法要简单。
也就是压缩、解压缩的速度要快。
最好能实时压缩、解压缩。
③还原效果要好,尽可能恢复原始图像。
3.主要的图像压缩标准
(1)JPEG(JointPhotographicsExpertsGroup)
JPEG是由国际标难化组织(ISO)和国际电报电话咨询委员会(CCITT)联合组织专家组制订的“静态图像压缩标准”,于1992年经ISO批准。
这一标准适用于黑白和彩色的照片、传真及印刷图片,可以支持很高的图像分辨率和量化精度。
(2)MPEG(MotionPictureExpertsGroup)
MPEG也是由ISO和CCITT联合专家组制订的,适用于“动态图像和伴音”的编码标准。
当初主要为了解决图像信息的传输问题,所以MPEG将最大数据传输率(MB亿)作为标准之一。
其意思是,一秒钟内的图像和伴音信息,压缩后的数据量应小于可传输的最大数据量,否则做不到实时传送。
先后推出的标准有MPEGl和MPEG2。
①MPEGl:
1991年11月提出,1992年批难。
已经公布的三部分是MPEG视频、MPEG音频、MPEG系统,第四部分“一致性检测”仍在制订中。
前三部分分别规定了视频压缩、音频压缩及多种数据流的复合与同步问题。
它们的任务是:
·将图像和伴音以可接受的还原质量压缩到1.5MB/S的码率。
·把视频和音频复合成一个单一的数据流。
·保证视频和音频同步。
②MPEG2:
1993年11月提出并批准。
MPEG2是MPEGl的升级,MPEG2标准主要适用于高清晰度数字电视。
其数据传输率可达4-10MB/S。
4.视卡及其类型
视卡又称视频卡,是一块专用电路板,插入到主板的扩展槽中。
它是多媒体计算机接收、处理、播放各种视频信号的重要部件,也是多媒体计算机不可缺少的组成部分。
根据其功能的不同,有多种产品和名称。
(1)视频采集卡
又称为视频捕获卡或视频输入卡。
视频采集是各种视卡应该具有的一项基本功能。
①采集过程:
对视频图像信号进行采样、量化,然后将数据存储到“帧存储器”。
②图像来源:
可以是摄像机、录像机、影碟机或光盘上的图像信号。
③主要性能和选择:
·采集方式:
分为单帧采集(静态图像)、连续采集(动态图像)。
·采样频率比:
指Y:
U:
V=4:
2:
2或4:
1:
1。
·存储方式:
可存入内存,或直接存到磁盘;可压缩后存储,或不压缩存储。
·采集分辨率:
可支持哪几种分辨率?
最高分辨率是多少?
·处理功能:
指对采集的图像能做哪些特技处理?
·输入插头:
除了RCA插头(俗称梅花插头)之外,是否有S—Video插头?
·总线标准:
是否PCI总线?
(EISA和VESA总线已被淘汰)。
(2)电视接收卡
俗称TV卡,将此卡插入扩展槽,就时在显示器屏幕上收看电视节目了。
TV卡是在采集卡的基础上增加一个“高频接收/调谐电路”来实现接收电视信号的,而电视的选台、调谐、搜索等控制功能全部由软件完成。
高档的Tv卡除了收看电视节目之外,也可以对电视节目进行采集和存储,以及某些特技处理。
出于我国电视使用的是P从制,所以W卡应与其配套。
(3)解压缩卡
俗称影碟卡,将此—卜插入扩展槽,就可在显示器屏幕上观看VCD节目了。
主要用于家庭娱乐和教育,曾风行一时。
使用解压缩卡对压缩图像进行解码的方式,称为“硬解压”。
当前由于Pentium微处理器的运算速度已能满足MPEGl标准算法的解码要求,因此使用“软解压”的用户越来越多了。
(4)压缩卡
压缩卡是为电子出版物或制作影视节目使用的,它们各有自己的国际标准。
电子出版物和VCD采用MPEG压缩标淮。
压缩比可高达l00:
1—200:
1。
目前大部分压缩卡符合MPEGl,随着新型DVD视盘的上市,符合肥EG2标准的压缩卡将越