多媒体复习.docx
《多媒体复习.docx》由会员分享,可在线阅读,更多相关《多媒体复习.docx(54页珍藏版)》请在冰豆网上搜索。
多媒体复习
多媒体技术概论
多媒体的定义:
通过计算机或者其他电子、数字处理手段传递的文本、图像、声音、动画和视频组合。
多媒体技术:
多媒体技术强调的是交互式综合处理多种媒体的技术。
从本质上看,它具有信息载体的多样性、集成性和交互性这3个主要特征。
超媒体(Hypertext)起源于超文本(Hypertext).超文本可以简单地定义为收集、存储和浏览离散信息,以建立和标识信息之间的关系的技术。
流媒体(StreamingMedia)其实是一种多媒体文件,其在网络上传输的过程中应用了流技术。
所谓流技术,就是把完整的影像和声音数据经过压缩处理后保存在网站的服务器上,用户可以边下载边获取信息,从而无须将整个压缩文件下载后再观看的网络传输技术.
数字声音
2.1声音信号数字化
2.1.1声音基础
1.声音
人们把发出声音的物体称为声源。
声源发出声音在空气中引起非常小的压力变化,这种空气的压力变化被耳朵的耳膜所检测,然后产生电信号刺激大脑的听觉神经,从而使人能感觉到声音的存在。
所以,自然界中声音是靠空气传播的。
各种声音一般都具有周期性强弱变化的特性,因而也使得输出的压力信号周期变化,人们将这种变化用一种图示的方法——正弦波来形象地表示。
2声音信号数字化
自然界的声音是一种模拟的音频信息,是连续量,而计算机只能处理离散的数字量。
如果要用计算机对音频信息进行处理,则首先要将模拟音频信号(如语音、音乐等)转换为数字信号。
由于数字化的声音易于用计算机软件处理,所以现在几乎所有的专业化声音录制器、编辑器都是数字的
将模拟声音数字化最早采用脉冲编码调制PCM(PulseCodeModulation)技术,它几乎是所有数字音频格式的始祖。
1939年,法国工程师AlecReeves发明了将连续的模拟信号变换成时间和幅度都离散的二进制码代表的脉冲编码调制信号的技术,并申请了专利。
PCM首先开始应用于电话系统,但一直到1962年,美国Bell实验室才为AT&T制成了国际上第一套商用PCM电话系统(T1系统),这标志着通信开始进入数字化。
以后的计算机发展更促进了通信的数字化,并逐步与通信相结合。
由于模拟声音信号非常复杂,PCM需要通过采样、量化、编码3个步骤将连续变化的模拟信号转换为数字信号
2.1.2声音信号数字化过程
1.采样(Sample)
“采样”就是对模拟信号每隔一个固定的时间间隔取一个样本值。
例如,在拍摄电影时,不必要也不可能用胶片把演员的连续动作全部拍摄下来,只是按一定的时间间隔拍摄一幅幅不连续的画面,每幅画面只是取出了演员动作在某一瞬间的“样子”,这就是“采样”。
只要采样的时间间隔足够短,如每秒采样不少于24幅,那么,在放映时,由于人的眼睛有视觉暂留的特性,在银幕上看到的就不是一幅幅不连续的画面,而是连续的动作了。
与此类似,要传输一个声音信号,不必像传送模拟信号那样把信号各个瞬时的声波幅度都连续地传送出去,而只需要每隔一定的时间间隔对信号取一个瞬时值(样本值)传送出去就可以了
2.量化(Quantize)
由于检测器的灵敏度有限和传输中噪声的干扰,没有必要传送一个个样本值的准确大小,只要按照允许的误差将样本大小进行量化分层近似即可。
将纵坐标上幅度的最大变化范围对应8位二进制数码分为28=256个层级,这个过程叫做“量化”。
图2.4上的模拟信号经过采样、量化,对应于时刻t1,t2,t3,t4,t5,t6,t7的样本就变成对应的“数字”。
显然,量化的二进制码的位数越多,则对原模拟信号反映的精度就越高,对于声音信号来说,记录的声音质量就越好。
用8位二进制编码,精度可达1/256,而用16位记录的声音质量又比8位记录的声音质量好得多。
当然,二进制码位数的多少受到技术上的限制,常用8位、12位、16位、24位、32位等。
同理,在相同量化位数的情况下,采样频率越高,声音效果也越好。
3.编码(Code)
经过采样,图2.4所示对应于时刻t1,t2,t3,t4,t5,t6,t7量化后的样本值用二进制的代码表示为01000000,01000000,000000110,01100000,11100000,11000000,01100000,并按一定规则顺序排列,这就是“编码”,这样就生成了以数字信号表示的信息。
在实际过程中量化和编码是同时进行的。
2.1.3声音数字化的主要参数
音频数字化有3个重要参数:
采样频率(SampleRate)、量化精度(Resolution)、声道数(Channels)。
下面分别介绍3个参数对音频数字化的影响。
1.采样频率
采样频率是指在1秒钟时间内采样的次数。
采样频率越高,声音保真度就越高,产生数据量也越多,所需的存储空间也越大。
音频采样频率的常见标准有11.025kHz,22.05kHz,44.1kHz,48kHz等。
2.量化精度
量化精度是指每个采样点所表示的数据位数。
不同的位数(精度)决定了不同的音质,位数越多,精度越高,对原始波形的模拟就越细腻,失真度也就越小。
同时,需存储数据量也越大。
量化精度通常有8位、16位、24位
3.声道数
立体声虽然满足了人们对左、右声道位置感体验的要求,但要达到好的效果,仅仅依靠两个音箱是远远不够的。
随着声音合成技术的发展,双声道立体声逐步向多声道环绕声发展。
早期运用了3个喇叭(两前一后)来达成,通常是配合电影的画面效果来模拟的,例如,画面中一架飞机从远处向你飞来,引擎呼啸声由远而近,让你感觉就好像身处飞机场一样。
往后便发展到4声道(两前两后)、DVD的6声道(5.1)、7声道(6.1)、8声道(7.1),以及电影院的10声道。
2.1.3声音文件和格式
2.1.3数字化声音的压缩与计算
声音的码率和声音文件大小
声音每秒的数据量称为声音的码率。
码率也称比特率,声音的码率就是每秒记录音频数据所需要的比特值,通常以kbps(千比特/秒)为单位。
CD中的数字音乐码率为1411.2kbps,而MP3音频的码率在112~128kbps时即可实现接近于CD的音质。
声音未经压缩时的码率可由下式算出:
声音的码率=采样频率×量化精度×声道数
声音数据量以Byte为单位,可由下式算出:
声音数据量=采样频率×(量化精度÷8)×声道数×时间
=(声音的码率÷8)×时间
例如,CD唱片的采样频率是44.1kHz,量化精度为16位,声道数为2(立体声),那么,根据上式计算出每分钟声音的数据量为44100×(16/8)×60×2≈10.09MB。
2.1.3声音文件的格式
(1)WAV
WAV是由微软开发的一种古老的音频文件格式,WAV格式是非常灵活的,它对音频流的编码没有硬性规定,除了PCM之外,几乎所有支持ACM(AudioCompressionManager)规范的编码都可以为WAV的音频流进行编码,如ADPCM,GSM,CCITT,G.723.1等,甚至也包括MP3格式。
虽然WAV文件可以存放压缩音频甚至MP3,但由于它本身的结构注定了它的用途是存放音频数据并用于进一步的处理,而不是像MP3那样用于聆听。
目前所有的音频播放软件和编辑软件都支持这一格式,并将该格式作为默认文件保存格式之一。
这些软件包括SoundForge,CoolEditPro,WaveLab等。
(2)MIDI
MIDI文件本身只是一堆数字信号而已,不包含任何声音信息,它记录的是在音乐的什么时间用什么音色发多长的音等。
正因为这样,通常的MIDI文件个头都非常小。
由于MIDI记录的并不是真正的声音,不同的声卡、软波表、硬件音源的音色是不相同的,所以相同的MIDI文件在不同的设备上播放会有不同的效果。
普通的MIDI文件许多播放器都支持,但要达到好的效果就必须安装软波表。
目前Microsoft已经在DirectX里面增加了软波表,并使之成为Windows系统的标准配置。
MIDI文件的编辑软件主要有CakeWalkPro、Sonar及国产的TT作曲家,MIDI在音乐创作中有着非常广泛的应用。
(3)MP3
MP3的名声之响绝对超过其他任何一种音频格式,因为它的应用范围早已经不仅限于计算机了。
MP3是MPEG—1AudioLayer3的简称,属于MPEG—1的派生音频方案。
MP3采用的是一种有损压缩方式,虽然并不是第一个进行有损压缩的音频编码,但它却是第一个实用的有损音频压缩方案。
在MP3之前,一般的音频编码即使以有损方式进行压缩最多达到4∶1的压缩比,而MP3可以实现12∶1的压缩比。
MP3使用的是知觉音频编码技术,它利用了人耳的特性,削减音频中人耳听不到的成分,同时尽可能地维持原来的声音质量,这是它实现高压缩比,保持较高音质的一个关键。
事实上,MP3在高码率时其音质与WMA这类音频格式相比,依然有着较明显的优势。
(4)RealAudio(RA)
RealAudio属于RealMedia的音频部分,它是流媒体行业中的霸主RealNetworks的产品,它采用流式传输方式,可以在非常低的带宽下(低达28.8kbps)提供足够好的音质让用户能在线聆听。
不过,由于RealMedia是从极差的网络环境下发展过来的,所以RealAudio的音质并不怎么样,在高码率时它要差于MP3。
尽管后来RealNetworks通过与SONY公司合作,利用SONY的ATRAC技术实现了高比特率的高保真压缩,但这些已经无法改变它在用户心目中音质差的印象。
这也是为什么许多音乐网站能够提供免费的RA音乐下载的一个重要原因,音质较差的音乐不用太多担心版权问题。
而且RA音乐的主要用途是在线聆听,它不适于编辑,编辑处理软件也非常少。
(5)WindowsMediaAudio(WMA)
为了挑战RealNetworks在流媒体领域的霸主地位,微软推出了WindowsMedia与其相抗衡,WindowsMediaAudio即WindowsMedia的音频部分。
最初的WindowsMediaAudio并不比RealAudio强多少,但随着WindowsMedia9技术的推出,WindowsMediaAudio已经可以令人刮目相看了。
微软声称,在只有64kbps的码率情况下,WMA可以达到接近CD的音质,WindowsMediaAudio的压缩技术中还拥有可变码率(VBR)、无损压缩技术,并支持多声道编码。
WMA还加入了DRM(DigitalRightManagement,数字版权管理)技术,可防止复制以保护版权。
2.2声音工具软件
1.Windows操作系统自带的“录音机”
在操作系统中选择“开始”→“程序”→“附件”→“娱乐”→“录音机”之后就调出如图2.13所示的窗口。
使用它可录音,做简单的声音编辑(如插入、删除等)(详见本书第二部分实验1数字声音)。
2.买声音卡时带的工具
如果你的计算机安装有声卡,一般来说都附带有声音工具。
例如,声霸(SoundBlaster)卡带有几种声音工具,通常要由用户自己安装。
其中,功能比较强的是WaveStudio,它的用户界面如图2.14所示。
3.网络上下载的工具
因特网上有许多站点提供试用的或者免费的声音工具。
如图2.15所示为提供下载试用的CoolEditPro工具的用户界面。
2.3MIDI
2.3.1MIDI规范与音乐合成
1.MIDI规范
MIDI是(MusicalInstrumentDigitalInterface,电子乐器数字接口)的缩写,是用于音乐合成器(MusicSynthesizers)、乐器(MusicalInstruments)和计算机之间交换音乐信息的一种标准协议。
从20世纪80年代初期开始,MIDI已经逐步被音乐家和作曲家广泛接受和使用。
MIDI是乐器和计算机使用的标准语言,是一套指令(即命令的约定),它指示乐器即MIDI设备要做什么,怎么做,如演奏音符、加大音量、生成音响效果等。
MIDI不是声音信号,在MIDI电缆上传送的不是声音,而是发给MIDI设备或其他装置,让它产生声音或执行某个动作的指令。
MIDI是由软件部分和硬件部分共同组成的系统规范,这个规范定义了MIDI设备间信号传送时电缆硬件接口和协议。
规范制定的目的是希望各厂商生产的乐器之间通过统一的MIDI交换信息及控制信号,来完成音乐的合成。
这样,任何电子乐器,只要有处理MIDI信息的处理器和适当的硬件接口都能变成MIDI装置。
2.音乐合成
FM合成法
音乐合成器的先驱RobertMoog采用了模拟电子器件生成了复杂的乐音。
FM合成器生成乐音的基本原理如图2.16所示。
它由5个基本模块组成:
数字载波器、调制器、声音包络发生器、数字运算器和D/A转换器。
数字载波器用了3个参数:
音调(Pitch)、音量(Volume)和波形(Wave);调制器用了6个参数:
频率(Frequency)、调制深度(Depth)、波形类型(Type)、反馈量(Feedback)、颤音(Vibrato)和音效(Effect);乐器声音除了有它自己的波形参数外,还有它自己的比较典型的声音包络线,声音包络发生器用来调制声音的电平,这个过程也称为幅度调制(AmplitudeModulation),并且作为数字式音量控制旋钮,它的4个参数Attack,Decay,Sustain,Release写成ADSR,这条包络线也称为音量升降维持静音包络线。
3.MIDI工具软件
国内使用最普遍的版本CakewalkProAudio9.0X的功能非常多,可提供64条音轨、256条虚拟轨和32位的实时效果处理,并改进了文件管理系统,使装备了CakewalkProAudio的计算机能够成为一台真正的多轨音频工作站。
有多个控制图标可供用户在不同形式下观看并编辑MIDI音序、五线谱和事件表等,如图2.28所示。
用鼠标可以控制MIDI的速度变化、调整力度或细调变音。
可以在音序中嵌入波形声音文件。
在Cakewalk中可使用16个MIDI接口设备,利用多媒体控制接口(MCI)可控制多媒体设备。
数字图像
3.1认识色彩
3.1.1色彩的来源
色彩是图像至关重要的组成部分,那么色彩是如何产生的呢?
色彩源于光。
1672年牛顿用三棱镜将太阳光(白光)分解成红、橙、黄、绿、青、蓝、紫(品红)顺序排列渐变的彩带,这种现象称为色散(Dispersion),如图3.1所示。
图3.1太阳光经过三棱镜后产生色散现象
3.1.2色彩的三要素
1.色调
光谱中各种颜色散发着色彩的原始光辉,它们构成了色彩体系中的基本色调,如图3.3所示。
在可见光光谱中,红、橙、黄、绿、青、蓝、紫每一种色调都有自己的波长和频率,人们给这些可以相互区别的颜色定出名称,当我们称呼到其中某一种颜色的名称时,就会有一个特定的色彩印象,这就是色调的概念。
图3.3光谱中的基本色调
2.亮度
(1)同一物体因受光不同会产生亮度上的变化。
照射的光越强,反射光也越强,看起来越亮。
显然,如果彩色光的强度降到使人看不到了,在亮度标尺上它应与黑色对应。
同样,如果其强度变得很大,那么亮度等级应与白色对应。
(2)强度相同的不同色光,亮度感不同。
在纯正光谱中,黄色的亮度最高,显得最亮;其次是橙、绿;再其次是红、蓝;紫色亮度最低,显得最暗。
(a)同一物体因受光不同会产生亮度上的变化
(b)强度相同的不同色光亮度感不同
图3.4亮度的两种特性
3.饱和度
饱和度(Saturation)是指颜色的纯度,或者说是指颜色的深浅程度,即掺入白光的程度。
对于同一色调的彩色光,饱和度越深颜色越鲜明,或越纯。
饱和度还和亮度有关,同一色调越亮或越暗越不纯。
如图3.5所示,在红色光中加进白光之后,相当于增加了光能,因而变得更亮了,但是它的饱和度却降低了,红色被冲淡成粉红色;若增加黑色光的成分,相当于降低了光能,因而变得更暗,其饱和度也降低了。
在某色调的彩色光中,掺入别的彩色光,会引起色调的变化,而掺入白光时仅引起饱和度的变化。
2.1图像的格式
1.矢量图与位图
矢量图是用一系列计算机指令来表示一幅图,如画点、画线、画曲线、画圆、画矩形等。
这种方法实际上是用数学方法来描述一幅图,然后变成许多的数学表达式,再编程,用语言来表达。
在计算显示图像时,也往往能看到画图的过程。
绘制和显示这种图的软件通常称为绘图程序(DrawPrograms)。
矢量图有许多优点。
例如,当需要管理每一小块图像时,矢量图法非常有效;目标图像移动、缩小、放大后不会失真,旋转、复制、属性的改变(如线条变宽变细、颜色的改变)也很容易做到。
相同的或类似的图像可以把它们当做图像的构造块,并把它们存到图库中,这样不仅可以加速画的生成,而且可以减小矢量图文件的大小。
然而,当图像变得很复杂时,计算机就要花费很长的时间去执行绘图指令。
此外,对于一幅复杂的彩色照片(如一幅真实世界的彩照),恐怕就很难用数学来描述,因此不用矢量法表示,而采用位图法表示,但图像放大后会失真。
2图像的格式
BMP格式
BMP是英文Bitmap(位图)的简写,它是Windows操作系统中的标准图像文件格式,能够被多种Windows应用程序所支持。
随着Windows操作系统的流行与多种Windows应用程序的开发,BMP位图格式理所当然地被广泛应用。
这种格式的特点是包含的图像信息较丰富,几乎不进行压缩,但由此导致了它与生俱来的缺点——占用磁盘空间过大。
所以,目前BMP在单机上比较流行。
BMP文件由4个部分组成:
位图文件头(Bitmap-FileHeader)、位图信息头(Bitmap-InformationHeader)、颜色表(ColorTable)和位图数据,
GIF格式
一个GIF文件的结构可分为文件头(FileHeader)、GIF数据流(GIFDataStream)和文件终结器(Trailer)3个部分。
文件头包含GIF文件署名(Signature)和版本号(Version);GIF数据流由控制标识符、图像块(ImageBlock)和其他的一些扩展块组成;文件终结器只有一个值为0x3B的字符(‘;’)表示文件结束。
表3.3显示了一个GIF文件的组成结构。
JPEG格式
JPEG是一种很灵活的格式,具有调节图像质量的功能,允许用不同的压缩比例对文件进行压缩,支持多种压缩级别。
压缩比率通常在10︰1到40︰1之间,压缩比越大,品质就越低;相反地,压缩比越小,品质就越好。
PSD格式
这是Adobe公司开发的图像处理软件Photoshop中自建的标准文件格式,它可以将所编辑的图像文件中的所有有关图层和通道的信息记录下来。
所以,在编辑图像的过程中,通常将文件保存为PSD格式,以便于重新读取需要的信息。
但是,PSD格式的图像文件很少被其他软件和工具所支持。
所以,在图像制作完成后,通常需要转换为一些比较通用的图像格式,以便于输出到其他软件中继续编辑。
另外,在用PSD格式保存图像时,图像没有经过压缩,当图层较多时,会占很大的硬盘空间,图像制作完成后,除了保存为通用的格式以外,最好再存储一个PSD格式的文件备份,直到确认不需要在Photoshop中再次编辑该图像。
由于Photoshop软件越来越广泛的应用,PSD格式也逐渐流行起来。
3.3图像处理工具软件
图像处理的工具软件很多,目前常用的有CorelSystems公司的PhotoPaint、Aldus公司的PhotoStyler、Adobe公司的Photoshop等。
在Windows环境下,这些图像应用软件在其功能上都具有一定的共性,包括:
(1)支持多种图像数据格式,具有图像编辑、变形变换、优化处理等功能。
(2)可选定某个区域进行裁剪、复制、粘贴、水平或竖直翻转、镜像、旋转、变形、透视等操作。
(3)具有不同的效果处理功能,包括可调亮度/对比度、去噪声、模糊、锐化等,还包括其他一些特技。
(4)具有一定的绘图功能。
不同的图像处理软件其基本功能是类似的,不同点主要在于功能的多少、实现功能的算法,以及窗口界面的使用等。
1.AdobePhotoshop
Photoshop是由美国Adobe公司于1990年推出的一个集图像扫描、编辑修改、图像制作、广告创意、图像合成、图像输入/输出于一体的专业图像处理软件。
AdobePhotoshop为美术设计人员提供了无限的创意空间,可以从一个空白的画面或从一幅现成的图像开始,通过各种绘图工具的配合使用及图像调整方式的组合,在图像中任意调整颜色、亮度/对比度、透明度,甚至轮廓;通过几十种特殊滤镜的处理,为作品增添变幻无穷的魅力。
2.AdobeIllustrator
作为Adobe公司图像处理软件Photoshop的姐妹软件,Illustrator是出版、多媒体和在线图像的工业标准矢量绘图软件。
Core公司的著名绘图软件CorelDraw和Macromedia公司的Freehand也属于矢量绘图软件。
Illustrator是目前市面上最强势、用途最广的矢量绘图软件,它几乎可以与QuarkXpress,PageMaker,InDesign,Photoshop,Dreamweaver,Flash等软件进行最完美的整合,这使得Illustrator能够应用于横跨平面、网页与多媒体设计的多种场合。
3.Matlab
Matlab是MathWorks公司开发的众多数学软件中最成功的一款,它在发展过程中不断拓宽应用范围,不断增强功能,曾于1997年被评为美国十大科技成果之一。
Matlab直接面向科学与工程计算,语言风格接近数学形式,因此比其他高级语言更加接近手工书写计算公式的思维方式,编写简单,效率较高。
Matlab的图形和图像操作功能很强。
在图形方面,它有一系列绘图函数,适合于线性坐标、对数坐标和极坐标等不同坐标显示,此外还能够绘制其他特殊的图形,如切片图、轮廓图、瀑布图、网眼图等。
对于图形中的各元素属性的控制也很容易,如颜色、线型、标注等。
文本
4.1文字的优点
提问:
问什么多媒体产品中文字是一个不可或缺的元素
对比其他几大元素的缺点
声音:
稍纵即逝
图像:
表意不明确
动画和视频:
无法快速浏览,无法跳跃或阅读
文字的优点:
表意明确,帮助记忆与理解
4.2文字在多媒体产品中的位置
(1)标题:
简明
(2)菜单:
按钮,表意明确
(3)导航栏:
表明当前的位置
(4)叙述和内容:
选择适合阅读的样式
4.3文字的属性
(1)字号
(2)字体:
实践并练习安装字体的方法:
c.windows/fonts
批量安装字体的方法
(3)字间距
(4)行间距
(5)粗体、斜体
(6)大小写
a提问密码最合适的组合安全性高:
包含大写、小写、数字.
bURL是否有大小写有
c域名是否有大小写没有
4.4文本设计的注意事项与文本设计的建议
(1)采用小字体时,应选用易读的字体,不应采用装饰性文字
(2)在同一项工作中,应采用尽可能少的字体,利用斜体和黑体调整字体的效果和尺寸
(3)对于文本块,应调整间距
(4)使字体的大小与传递信息的重要性成正比。
4.5思维导图
4.5.1定义
思维导图,又叫心智图,是表达发射性思维的有效的图形思维工具,它简单却又极其有效,是一种革命性的思维工具。
思维导图运用图文并重的技巧,把各级主题的关系用相互隶属与相关的层级图表现出来,把主题关键词与图像、颜色等建立记忆链接,思维导图充分运用左右脑的机能,利用记忆、阅读、思维的规律,协助人们在科学与艺术、逻辑与想象之间平衡发展,从而开启人类大脑的无限潜能。
思维导图因此具有人类思维的强大功能。
[1]
思维导图是一种将放射性思考具体化的方法。
我们知道放射性思考是人类大脑的自然思考方式,每一种进入大脑的资料,不论是感觉、记忆或是想法——包括文字、数字、符码、食物、香气、