第五六章 多媒体数据描述与压缩技术.docx
《第五六章 多媒体数据描述与压缩技术.docx》由会员分享,可在线阅读,更多相关《第五六章 多媒体数据描述与压缩技术.docx(21页珍藏版)》请在冰豆网上搜索。
第五六章多媒体数据描述与压缩技术
第五、六章多媒体数据描述与压缩技术
教学目的和要求:
1、了解:
图像文件、声音文件、视频动画文件的分类及应用领域
2、了解:
多媒体数据的基本描述,多媒体数据的压缩编码原理和国际标准
3、掌握:
实际应用中图像、声音、视频文件的压缩方法
教学重点和难点:
图像文件、声音文件、视频动画文件的描述与压缩,各类用件压缩的国际标准和应用领域。
教学方法与手段:
本章前半部分为理论知识,采用的主要方法是讲授法,后半部分涉及到实际应用的部分,采用演示法,课堂演示讲解各类媒体数据的压缩方法。
第一节静态图像文件
第二节动态图像文件
第三节声音文件
第四节数据压缩基本原理
第五节数据压缩算法
第六节图像、视频、声音的压缩
复习与作业要求:
本章涉及的理论知识较多,课后必须对相应的内容加以复习,尤其要复习各类媒体数据的描述方法,数据压缩的基本原理;作业要求能够根据实际需求,利用工具软件对各类媒体数据进行压缩。
考核知识点:
图像文件、声音文件、视频动画文件的描述与压缩,各类用件压缩的国际标准和应用领域,实际应用中各类数据的压缩方法
辅助教学活动:
课后学生可以从互联网获得各类媒体的压缩工具,练习对各类媒体数据进行压缩,从而掌握媒体数
据压缩的方法。
教学过程:
本章学习目标:
通过本章的学习,掌握多媒体信息是如何表示和处理的。
本章要点:
Ø文本、声音、图像、视频和动画等的计算机表示
Ø多媒体信息的数据与冗余
Ø多媒体数据压缩方法
Ø视频编码标准
在多媒体计算机系统中,计算机要存储、传输、处理包括数字、文本、图形、图像、声音、动画等多媒体信息。
我们可以看到多媒体计算机系统处理的媒体类型多样,同时其中不少媒体类型具有庞大的数据量,因此在不损失媒体质量的情况下,如何高效的表示和压缩数据成为非常紧迫的问题。
因此多媒体信息表示技术和压缩技术成为多媒体系统的关键技术。
5.1多媒体信息的计算机表示
多媒体系统包含的媒体元素有:
数字、文本、图形、图像、声音、动画等。
Word和WPS是目前国内使用的最广的字处理系统,分别由美国微软公司和我国金山软件公司出品
5.1.1文本的文件格式
文本是计算机文字处理程序的基础,也是多媒体应用程序的基础。
通过对文本显示方式的组织,多媒体应用系统可以使显示的信息更易于理解。
文本数据的获得必须借助文本编辑环境比如Word、WPS和Windows自带的写字版等应用程序。
常用的文本格式有.TXT、.RTF、.DOC、.DOT等。
.TXT被称为纯文本文件,它可以在各种应用程序中通用。
其他格式的文件往往都包含了排版信息等内容。
声音格式是指计算机储存声音的数字编码方式,一般声音格式分压缩格式如MP3、RA等或非压缩格式如MIDI、WAV等。
图5-1-1Word状态下的文本编辑
5.1.2声音文件基本格式
微软公司:
全球最大的软件开发商之一。
其主要产品是DOS/Windows操作系统和Office系统。
声音的数字编码方式非常多,不同的编码方式产生不同的数字音乐格式。
通常,不经过压缩处理的音乐文件其所占的存储空间都是相当大的。
比如一首长度为8分钟的CD音乐,声音质量为16位,44.1KHz,如不压缩其占用存储空间大小约为80MB;如把它压缩成MP3的格式,则只有8MB左右。
声音文件的格式有以下几种:
(1)、WAV格式
WAV格式是微软公司开发的一种声音文件格式,也叫波形声音文件,是最早的数字音频格式,被Windows平台及其应用程序广泛支持。
WAV格式支持许多压缩算法,支持多种音频位数、采样频率和声道,采用44.1kHz的采样频率,16位量化位数,因此WAV的音质与CD相差无几,但WAV格式对存储空间需求太大不便于交流和传播。
另外,大多数压缩格式都是在WAV格式的基础上对数据重新编码来实现存储与传输的。
这些压缩格式的声音信号在回放成声音时还要使用WAV格式。
WAV格式声音文件还可以用于手机铃声,如图5-1-2
图5-1-2WAV格式铃声
图5-1-3微软公司网址
Creative公司创建于1981年是世界多媒体及数码娱乐领域享有盛誉的领导厂商,
Creative公司中文网址。
(2)、VOC格式
VOC文件是Creative公司的波形音频文件格式,也是声霸卡(soundblaster)使用的音频文件格式。
每个VOC文件由文件头块(headerblock)和音频数据块(datablock)组成。
文件头包含一个标识版本号和一个指向数据块起始的指针。
数据块分成各种类型的子块。
如声音数据静音标识ASCII码文件重复的结果重复以及终止标志,扩展块等。
图5-1-4Creative公司(中国)
(3)、MIDI格式
MIDI是MusicalInstrumentDigitalInterface(乐器数字接口)的缩写。
它是由世界上主要电子乐器制造厂商建立起来的一个通信标准,以规定计算机音乐程序电子合成器和其它电子设备之间交换信息与控制信号的方法。
MIDI文件中包含音符定时和多达16个通道的乐器定义,每个音符包括键通道号持续时间音量和力度等信息。
所以MIDI文件记录的不是乐曲本身,而是一些描述乐曲演奏过程中的指令。
与波形文件相比,MIDI文件要小得多。
例如,同样半小时的立体声音乐,MIDI文件只有200KB左右,而波形文件(*.WAV)则要差不多300MB。
MIDI格式的主要限制是它缺乏重现真实自然声音的能力,因此不能用在需要语音的场合(这时要与波形文件合用)。
此外,MIDI只能记录标准所规定的有限种乐器的组合,而且回放质量受声音卡上合成芯片的严重限制,难以产生真实的音乐演奏效果。
近年国外流行的声音卡普遍采用波表法进行音乐合成,使MIDI音乐的质量大大提高(效果接近CD音质),但波表卡较贵。
Commodore公司的Amiga系统Commodore公司在1985年率先在世界上推出了第一个多媒体计算机系统。
在1989年秋美国的Comdex博览会上,Commodore公司向公众展示了Ami-ga系统。
图5-1-5MIDI键盘
(4)、CMF格式
与VOC一样,CMF文件(CreaiveMusicFile)也是随声霸卡一起诞生,CMF文件与MIDI文件非常相似,只是音色、效果上有些特色,专用于FM声卡,但其兼容性也很差。
图5-1-6创新声霸卡
(5)、MOD格式
MOD文件最初产生于Commodore公司的AMIGA型计算机,这种机器配置了一种称为PAULA的智能音乐芯片,能够以不同的采样率和音量在四个独立的通道同时播放。
PC机使用的MOD文件是移植过来的。
该格式的文件里存放乐谱和乐曲使用的各种音色样本,具有回放效果明确,音色种类无限等优点。
另外,值得一提的是MOD文件并不像波形和MIDI那样是PC机上使用的标准文件,它主要由一些业余音乐爱好者通过网络和BBS支持,所以PC机上用于播放MOD音乐的软件多数是分享软件或自由软件。
但它也有一些致命弱点,以至于现在已经逐渐淘汰,目前只有MOD迷及一些游戏程序中尚在使用。
(6)、MP3格式
MP3(MPEG-3)是将WAV声音数据进行特殊的数据压缩后产生一种声音文件格式。
MP3技术源于MPEG技术中的一部分,是专门用来压缩影像中的伴音的技术。
由于具有体积小,声音质量还行,制作和播放简单的特点,MP3是现在最流行的声音文件格式,因其压缩率大,在网络可视电话通信方面应用广泛。
MP3是一种数据音频压缩标准方法,全称MPEG1Layer3,是VCD影像压缩标准MPEG的一个组成部分。
图5-1-7MP3播放器
(7)、CD唱片
CD(又称CD-DA)唱片上存放的也是一种数字化声音,是以16位采样量化精度,44.1KHz频率采样的立体声存储的,可完全重现原始声音,它是我们介绍的几种声音格式效果最好的。
一般每张CD唱片可以存放74分钟高质量的音乐曲目。
图5-1-8CD唱片
5.1.3图像及图像文件格式
RGB颜色模式是指:
R代表红色;G代表蓝色;G代表绿色。
为了适应不同应用的需要,图像可以以多种格式进行存储。
例如Windows中的图像以.BMP或.DIB格式存储。
另外还有很多图像文件格式:
*.pcx,*.pic,*.tif,*.gif,*.tga和*.jpg等等。
此外还有一些专供排版和打印输出而设计的图像格式,如*.eps和*.wmf等。
不同格式的图像可通过工具软件来转换。
几种最常见的位图图像的文件格式如下:
(1)、PCX格式
PCX格式是ZSOFT公司在开发图像处理软件Paintbrush是开发的一种格式,存储格式从1位到24位,它是经过压缩的格式,占用磁盘空间较少。
PCX文件格式较简单,使用游程长编码(RLE)方法进行压缩,压缩比适中,适合于一般软件的使用,压缩和解压缩的速度都比较快,支持黑白图像、16色和256色的伪彩色图像、灰度图像以及RGB真彩色图像。
由于该格式出现的时间较长,并且具有压缩用全彩色的能力,所以PCX格式现在仍是十分流行。
图5-1-9ZSOFT公司网址
(2)、BMP格式
BMP是英文Bitmap(位图)的简写,它是Windows操作系统中的标准图像文件格式,多数图形图像软件,特别是在Windows环境下运行的软件,都支持这种文件格式。
BMP支持黑白图像、16色和256色的伪彩色图像以及RGB真彩色图像。
这种格式的特点是包含的图像信息较丰富,几乎不进行压缩,但由此导致了它一个非常大的缺点占用磁盘空间过大,应用受到一定的限制。
图5-1-10电脑启动的“能源之星”图标为BMP格式
(3)、GIF格式
GIF(GraphicInterchangeFormat)由美国联机服务商ComouServe开发,支持黑白图像、16色和256色的彩色图像,目的是能够在不同平台上交流使用,是因特网上重要的文件格式之一。
GIF采用IZW压缩,压缩比较高,文件长度比PCX约小1/5-1/2。
由于GIF格式的文件压缩率高,文件长度较小,支持小型动画,所以在互联网上倍受欢迎。
图5-1-11GIF格式文件
(4)、TIF格式
TIF(TagImageFileFormat)是Mac中广泛使用的图像格式,它由Aldus和微软联合开发,最初是出于跨平台存储扫描图像的需要而设计的。
它的特点是图像格式复杂、存贮信息多,同时是工业标准格式,支持所有图像类型。
该格式的图像文件分成压缩和非压缩两类,非压缩的文件独立于软硬件,有良好的兼容性。
压缩格式支持从RLE,LZW到JPEG等各种压缩方法。
TIFF现在也是微机上使用最广泛的图像文件格式之一。
通常,“分辨率”被表示成每一个方向上的像素数量,比如640x480等。
而在某些情况下,它也可以同时表示成“每英寸像素”(ppi)以及图形的长度和宽度。
比如72ppi,和8x6英寸。
图5-1-12TIF格式文件
(5)、JPG格式
JPEG也是常见的一种图像格式,其扩展名为.jpg或.jpeg,由联合照片专家组(JointPhotographicExpertsGroup)开发,可以用不同的压缩比例对这种文件压缩,其压缩技术十分先进,对图像质量影响不大,因此可以用最少的磁盘空间得到较好的图像质量。
由于它优异的性能,所以应用非常广泛,特别是在网络和光盘读物上,肯定都能找到它的影子。
目前各类浏览器均支持JPEG这种图像格式,因为JPEG格式的文件尺寸较小,下载速度快,使得Web页有可能以较短的下载时间提供大量美观的图像,JPEG同时也就顺理成章地成为网络上最受欢迎的图像格式。
图5-1-12JPG格式文件
(6)、PCD格式
PCD是KodakPhotoCD的缩写,文件扩展名是.pod,是Kodak开发的一种PhotoCD文件格式,其他软件系统只能对其进行读取。
PCD格式是Kodak公司的开发的电子照片文件存储格式,是Photo-CD的专用存储格式,一般都存在CD-ROM上,读取PCD文件要用Kodak公司的专门软件。
PCD文件中含有从专业摄影照片到普通显示用的多种分辨率的图像,所以都非常大。
由于Ph。
toCD的应用非常广,现在许多图像处理软件(如PhotoStyler和CorelDraw)都可以将PCD文件转换成其他标准图像文件。
XML英文:
extensiblemarkuplanguage,中文解释:
可扩展的标记语言
图5-1-13JPGKodak公司
(7)、PNG格式
W3C:
该组织在其Web站点上宣称:
“WWW协会的存在是为了发挥Web的全部潜力。
”它的目标就是开发每个人都能够使用的WWW规格。
PNG是20世纪90年代中期开始开发的图像文件存储格式,其目的是企图替代GIF和TIFF文件格式,同时增加一些GIF文件格式所不具备的特性。
1996年10月1日由PNG向国际网络联盟提出并得到推荐认可标准,并且大部分绘图软件和浏览器开始支持PNG图像浏览,从此PNG图像格式生机焕发。
流式网络图形格式(PortableNetworkGraphicFormat,PNG)名称来源于非官方的“PNG'sNotGIF”,是一种位图文件(bitmapfile)存储格式,读成“ping”。
PNG用来存储灰度图像时,灰度图像的深度可多到16位,存储彩色图像时,彩色图像的深度可多到48位,并且还可存储多到16位的α通道数据。
PNG使用从LZ77派生的无损数据压缩算法。
PNG的缺点是不支持动画应用效果,如果在这方面能有所加强,简直就可以完全替代GIF和JPEG了。
图5-1-14PNG格式文件
(8)、SVG格式
SVG,ScalableVectorGraphics的首字母缩写,含义是可缩放的矢量图形。
现在最火热的图像文件格式。
它是基于XML(ExtensibleMarkupLanguage),由WorldWideWebConsortium(W3C)联盟进行开发的。
它是种开放标准的矢量图形语言,可让你设计激动人心的、高分辨率的Web图形页面。
该软件提供了制作复杂元素的工具,如渐变、嵌入字体、透明效果、动画和滤镜效果,并且可使用平常的字体命令插入到HTML编码中。
SVG被开发的目的是为Web提供非栅格的图像标准。
SVG是种矢量图形格式,SVG提供了GIF和JPEG所不能提供功能优势:
1、放大用户可以任意放大图形显示,但不会牺牲锐利度、清晰度、细节等。
2、文字状态依然保留文字在SVG图像中保留可编辑和可搜寻的状态。
没有字体的限制,用户将会看到和他们制作时完全相同的画面。
3、小文件平均来讲,SVG文件比那些JPEG和GIF格式的文件要小很多,因而下载也很快。
adobe公司:
美国著名的图像类软件公司。
出品有photoshop、Premiere等软件
4、显示独立性SVG图像在屏幕上总是边缘清晰,并且可以使用你打印机的分辨率打印。
不论是300dpi,600dpi还是更高,你都不会体验到难看的锯齿的点阵效果。
5、超级颜色控制SVG提供一个16百万颜色的调板,支持ICC颜色描述文件,RGB,渐变和蒙版。
6、交互性和智能化因为SVG是基于XML的,它提供无可匹敌的动态交互性。
SVG图像可对用的动作通过高光显示、工具技巧、特殊效果、声音和动画进行反应和显示。
图5-1-15adobe公司SVG专业组
5.1.4视频与动画的文件格式
(1)、ASF格式
ASF是AdvancedStreamingFormat的缩写,字面意思是高级流格式。
它是Microsoft为了和RealMedia竞争而开发出来的一种可以直接在网上观看视频节目的文件压缩格式。
它的视频部分采用了先进的MPEG-4的压缩算法,音频部分采用了微软新发布的一种比MP3还要的压缩格式WMA,所以压缩率和图像的质量都很不错。
因为ASF是以一个可以在网上即时观赏的视频“流”格式存在的,所以它的图像质量比VCD差一点点并不出奇,但比同是视频“流”格式的RAM格式要好。
ASF的主要优点包括:
本地或网络回放、可扩充的媒体类型、部件下载、以及扩展性等。
ASF应用的主要部件是NetShow服务器和NetShow播放器。
有独立的编码器将媒体信息编译成ASF流,然后发送到NetShow服务器,再由NetShow服务器将ASF流发送给网络上的所有NetShow播放器,从而实现单路广播或多路广播。
Apple(苹果)公司:
美国著名的商业公司。
出品有:
QuickTime、MacOSX操作系统等.
图5-1-16微软WindowsMediaPlayer播放器
(2)、MOV格式
QuickTime(MOV)是Apple(苹果)公司创立的一种视频格式,在很长的一段时间里,它都是只在苹果公司的MAC机上运行。
后来才发展到支持W indows平台。
QuickTime文件格式支持25位彩色,支持领先的集成压缩技术,提供150多种视频效果,并配有提供了200多种MIDI兼容音响和设备的声音装置。
QuickTime能够通过Internet提供实时的数字化信息流、工作流、文件回放功能及自动速率选择功能。
此外,QuickTime还采用了一种称为QuickTimeVR的虚拟现实(VR,VirtualReality)技术,用户只需通过鼠标或键盘,就可以观察某一地点周围360度的景象,或者从空间任何角度观察某一物体。
QuickTime因具有跨平台、存储空间要求小等技术特点,得到业界的广泛认可,目前已成为数字媒体软件技术领域的事实上的工业标准。
图5-1-17苹果公司主页
图5-1-18苹果公司QuickTime播放器
(3)、AVI格式
Intel公司:
美国商业公司。
是全球最大的CPU等硬件厂商。
VideoforWindows所使用的文件称为Audio-VideoInterleaved(音频一视频交错),文件扩展名为.AVI,所以也简称为AVI文件或AVI格式。
显然AVI格式是微软公司推出的,其意思是将视频和音频信号混合交错地存储在一起。
AVI文件是目前较为流行的视频文件格式。
采用了Intel公司的lndeo视频有损压缩技术将视频信息与音频信息混合交错地存储在同一文件中,较好地解决了音频信息与视频信息同步的问题。
同时AVI文件格式兼容好、调用方便、图像质量好。
因此它应用广泛,是目前视频文件的主流。
比如一些电脑游戏、教育软件和多媒体光盘中,都有不少AVI文件。
AVI美中不足的是需要的存储空间大。
Macromedia公司:
美国软件公司。
出品有:
Authorware、Flash等软件。
图5-1-19Intel公司网址
(4)、SWF格式
SWF格式是由Macromedia公司的flash软件生成的矢量动画图形格式,这种格式的动画图像能够用比较小的体积来表现丰富的多媒体形式。
在图像的传输方面,不必等到文件全部下载才能观看,而是可以边下载边看,因此特别适合网络传输,特别是在传输速率不佳的情况下,也能取得较好的效果。
现实也是如此,SWF如今已被大量应用于WEB网页进行多媒体演示与交互性设计。
此外,SWF动画是其于矢量技术制作的,因此不管将画面放大多少倍,画面不会因此而有任何损害。
综上,SWF格式作品以其高清晰度的画质和小巧的体积,受到了越来越多网页设计者的青睐,也越来越成为网页动画和网页图片设计制作的主流,目前已成为网上动画的事实标准。
图5-1-20Macromedia公司网址
(5)、RM格式
RM格式是RealNetworks公司开发的一种新型流式视频文件格式,包括:
RealAudio、RealVideo和RealFlash。
RealAudio用来传输接近CD音质的音频数据,RealVideo用来传输连续视频数据,而RealFlash则是RealNetworks公司与Macromedia公司新近合作推出的一种高压缩比的动画格式。
RealMedia可以根据网络数据传输速率的不同制定了不同的压缩比率,从而实现在低速率的广域网上进行影像数据的实时传送和实时播放。
RM主要用于在低速网上实时传输音频和视频信息的压缩格式。
网络连接速度不同,客户端所获得的声音,图像质量也不尽相同,以声音为例:
对于14.4K/S网络连接速度,可获得调幅(AM)质量的声音;对于28.8K/S速度,则可以获得广播级的声音质量。
图5-1-22RealNetworks公司网址
VCD其实是VideoCompactDisk的缩写,就是一种压缩过的图像格式。
它是采用MPEG-1的压缩方法来压缩图像,解析度到达352*240﹙NTSC﹚或352*288﹙PAL﹚1.15Mb/sVideoBitRate,声音格式则采用44.1KHz取样频率,16Bit取样值,Stereo立体声,﹙在未压缩之前,这样的音频格式就是CD音质,也就是我们常常听的音乐CD的音质。
图5-1-23Reaplayer播放器
(6)、DAT格式
DAT不是程序设计中的数据文件格式,而是指VideoCD或KaraokeCD中的视频文件格式,也是基于MPEG压缩方法的一种文件格式。
当计算机配备视霸卡或软解压程序后,可利用计算机对该格式的文件进行播放。
图5-1-24豪杰公司网址
数字电视的清晰度分为三个等级:
普通清晰度电视(PDTV),其水平清晰度为200--300线;标准清晰度电视(SDTV),其水平清晰度为500--600线;高清晰度电视(HDTV),其水平清晰度为1000线以上,按照相关的标准定义,其分辨率为1920*1080,采用16:
9的屏幕比例。
图5-1-25超级解霸播放器
(7)、MEPG
MPEG是MotionPictureExpertsGroup的缩写,它包括了MPEG-1,MPEG-2MPEG-4,MPEG-7和MPEG-21。
MPEG采用有损压缩方法减少运动图像中的冗余信息从而达到高压缩比的目的,当然这些是在保证影像质量的基础上进行的。
MPEG压缩标准是针对运动图像而设计的,其基本方法是:
在单位时间内采集并保存第一帧信息,然后只存储其余帧相对第一帧发生变化的部分,从而达到压缩的目的。
MPEG的平均压缩比为50∶1,最高可达200∶1,压缩效率之高由此可见一斑。
同时图像和音响的质量也非常好,并且在微机上有统一的标准格式,兼容性相当好。
MPEG-1被广泛的应用在VCD的制作和一些视频片段下载的网络应用上面,可以说99%的VCD都是用MPEG1格式压缩的。
MPEG-2则是应用在DVD的制作方面,同时在一些HDTV(高清晰电视广播)和一些高要求视频编辑、处理上面也有相当的应用面。
MPEG-4是一种新的压缩算法,使用这种算法的ASF格式可以把一部120分钟长的电影(未视频文件)压缩到300M左右的视频流,可供在网上观看。
图5-1-26VCD
DVD的英文全名是DigitalVideoDisk,即数字视