多媒体计算机技术复习资料Word格式文档下载.docx-资源下载

多媒体计算机技术复习资料Word格式文档下载.docx

1、是利用计算机对文本、图形、图像、声音、动画、视频等多种信息综合处理、建立逻辑关系和人机交互作用的技术。多媒体信息处理的最终目标：能跨越各种不同的网络和设备，透明的、强化的使用多样媒体资源。多媒体系统关键技术分为：多媒体涉及的处理、存储、传输和多媒体输入输出技术。 1.3.1多媒体软件和硬件平台：实现多媒体系统的物质基础多媒体计算机软件和硬件系统组成：多媒体计算机硬件系统、多媒体核心系统软件、多媒体制作平台与工具、多媒体创作与编辑软件、多媒体应用系统1.3.2专用芯片:一种是固定功能的芯片，一种是可编程的处理器。处理音频和视频媒体：先要把音频和视频信号数字化，以数字信息的形式载入计算机存储器中，

2、再对其编辑处理。1.3.3数据压缩及编码技术PCM脉冲编码调制：1984 Oliver有效的压缩算法应考虑：媒体的种类、应用的对象、应用的要求以及采用的设备特性等因素。1.3.4多媒体同步多媒体数据进行综合处理时，不仅要考虑各种媒体相对的独立性，为了较好的信息表示效果，还要注意保持媒体之间在实践和空间上的相关性。为了定义不同媒体之间的相互关系，系统应准许用户规定不同媒体之间如何实现彼此之间的复合同步。多媒体信息的三种相互集成模式：1.制约式，指一种媒体的状态转移或激活影响到另一种媒体。2.协作式，指两种以上的媒体信息同时存在。3.交互式,指媒体上含有的信息变换成另一种媒体信息。1和2要求按事件

3、发生的顺序同步，属基本同步。1.3.5多媒体网络与分布式处理技术：多媒体信息处理能力必须与网络技术结合才能充分发挥。分布式处理技术的主要研究内容：如何在网络环境下将复杂任务分解，并借助于网络环境中的不同计算机完成任务。1.3.6信息组织与管理处理大批非规则数据的主要途径：一是扩展现有的关系数据，二是建立面向对象的数据库系统，以存储和检索特定信息。超媒体：一种新型（天然）的信息管理方法，一般采用面向对象的信息组织与管理形式管理。信息的组织将不再是线性的，而是按某种方式以非线性的形式进行存储、管理和浏览，这样，用户对信息的使用更加方便，更加灵活的信息检索形式。超文本和超媒体适合于表达多媒体信息。1

4、.3.7多媒体的数据存储：SAN存域网、服务器存储技术：直接连接存储技术DAS和存储网络技术（很高的安全性且动态扩展能力极强）。1.3.8虚拟现实（VR）技术：就是采用计算机就是生成一个逼真的视觉、听觉、触觉及嗅觉的感觉世界，用户可以用人的自然技能对这个生成的虚拟实体进行交互参考。VOXEL MAN虚拟人体：德国汉堡Eppendorf大学。1.3.9人机界面设计：其计算机系统必须能够采用自然语言或者足以表达信息的图像方式来回答用户的问题。其目的在于通过对用户需求的解释达到一种人机之间较好的通信能力，其研究方向为：1.文件的语言处理模式，包括语音识别和自然语言理解。2.手势分析和理解模式设计。

5、3.上述两点的通信融合，是对用户需求的互补。4.多模式环境中的对话管理，保证连续的对话过程。5.任务的优化图形表达，易于对象理解的方式。1.3.10高速多媒体通信技术：是指为满足新一代信息系统中实时多媒体信息传输的需求，网络带快1000Gbps以上，且服务质量控制（QoS），以适应不同媒体传输质量要求。骨干路由器的要求：至少1Gbps以上交换能力，单个端口速率甚至达到622Mbps1.4 多媒体技术的应用只要应用包括：1.音频视频流点播、2.电子出版物、3.医疗卫生、4.游戏与娱乐、5.计算机会议视频、6.多媒体展示盒信息查询系统、7.MIS管理信息系统与OA办公自动化系统、8.传媒和广告、9

6、教学管理系统.、10.移动卫星。1.5 多媒体技术的发展趋势：1.智能化，其目的在于实现人机的自然交互。2.三维化，重点在于将计算机视觉技术和图形技术的内容结合起来，实现增强实现技术。第2章多媒体计算机的组成2.1 概述。多媒体计算机系统的硬件组成：1.主机（CPU和主板）2.多媒体转接卡，3.多媒体外部设备，按功能分：音频视频输入设备、视频视频输出设备、人机交互设备、存储设备。2.2 常用的I/O设备：输入设备、输出设备、以及用于网络通信的通信设备。2.2.1 输入设备:1.手写板，分电阻压力板、电磁感应板、电容触控板。2.图像扫描仪，其性能参数为分辨率、灰度、色彩度、速度、幅度。3.触摸

7、屏，按介质工作原理分电阻式、电容式、红外线、声表面波。4.视频捕捉卡，模拟转数字信号。2.2.2 输出设备：1.CRT显示器，大致分两类，一是用于图像处理领域的图像显示器，二是用于图像处理领域的矢量方式图形显示器。按使用种类分存储型、随机扫描型、光栅扫描型。2.液晶显示器LCD，低电压、低功耗，MOS-IS可直接驱动，与系统驱动切合度好。液晶，指分子具有方向性的液体侧称为液态晶体。按技术性质分单纯矩阵驱动（TN、STN、FLCD、）和主动矩阵驱动（MIM、TFT、PD）3.等离子显示器PDP, 又称电浆显示器。4.背投电视，按投影种类分CRT、 LCD、 DLP L、COS。5.显卡，主要用于

8、对图形函数进行加速。其性能决定于显存的容量、显存的数据位与带宽、显存的速度。6.打印机，最传统的标准计算机输出设备。分点阵式打印机、激光打印机、喷墨打印机。2.2.3通信设备：1.调制调解器，作用是利用模拟信号传输线路传输数字信号。ADSL调制调解器的三种线路编码：抑制载波幅度和相位 CAP、离散多音复用 DMT、离散小波多音复用 DWMT。2.网卡，局域网中最基本的部件之一，主要作用是整理计算机上发往网线上的数据，并将数据分解为适当大小的数据包后在网络上发送出去。2.3 存储设备及存储技术 2.3.1存储设备（软盘、硬盘）2.3.2存储技术：1.NAS网络附加存储；2.SAN存储局域网；3

9、.DAS直接附加存储；4.IP存储；5.光存储器；6.虚拟存储，其好处是提高存储利用率，降低成本，简化管理并且具有开放性、扩展性、管理性方面的优势。2.4 USB设备：USB为通用串行总线，其优点在于：使用方便，可以热插拔、速度快、独立供电、支持多媒体、低成本。2.4.1 USB的硬件结构：采用四线电缆，信号定义由2条电源线和2条信号线组成。USB工作方式是基于令牌的总线，其主控制器广播令牌，总线上的设备检测令牌中的地址是否与自身相符，通过接收或发送数据给主机来响应。其通过支持悬挂与恢复操作来管理其总线电源。USB采用主机、集线器、功能设备来组成级联星形拓扑结构。2.4.2 USB的软件结构；

10、1.总线接口；2.USB系统，由主控制驱动程序、USB驱动程序、USB客户软件组成。USB主机的功能：检测链接和移除的USB设备；管理主机和USB设备；链接USB状态和活动统计；控制主控制器和USB设备间的电气接口。2.4.3USB的数据流传输方式：同步传输方式、中断传输方式、控制传输方式、批传输方式。2.5 数字摄像设备2.5.1CCD：CCD技术和结构主要考虑最佳的光学属性和图片质量，CCD传感器原理是以横竖线短阵形式排列，各像素点包含一个光电二极管和控制相邻电荷单元，光电二极管将光子转化为电子，聚焦的电子数量相应于光强度，并转换成各自独立的电荷包单元。CMOS传感器:采用标准硅处理方法

11、加工。2.5.2数字摄像头：主要参数是为最大分辨率、传感器像素、接口类型、色彩位数、感光器件、最大帧数。2.5.3数码相机：其特征为像素、镜头、快门。 2.5.4数字摄像机：性能决定于摄像机的镜头、光学变焦和数码变焦、静态图像存储和视频输出。第3章数字图像处理1.采样，时间上的离散化；2.量化，幅度上的离散化。3.1 信号处理基本术语3.1.1 采样：时间上的离散化，按照一定时间间隔t在模拟信息x（t）上逐点采取其瞬时值。量化：幅度上的离散化，振动幅值用二进制量化电平来表示。3.1.2 采样长度的选择与频率分辨率：采样长度为采样时间的长短。采样时，要保证能反映信号的全貌，瞬态信号包括整个瞬态

12、过程。3.1.3 DFT（离散傅里叶变换）和其逆变换IDFT的定义3.1.4 小波变换3.2 图像数据压缩基础3.2.1 色彩基本概念：色彩由色调、饱和度、亮度描述。色调是指某种颜色的性质和特点也就是颜色。饱和度指颜色色调的表现程度。亮度是指作用与物体表面的管线反射系数。真彩色：是指图像中的每个像素值都分成R、G、B三基色表示。2八次方的三次方为16兆种颜色。伪真色：每个像素是一个索引值或代码，查表后获取颜色。调配色：优于伪真色。显示深度与图像深度的关系：显示大于图像屏幕色彩能较为真实的反映图像文件的色彩效果；显示等于图像,调色板一致时较真实，不一致时失真；显示小于图像色彩失真。3.2.2 色

13、彩空间及其变换1.RGB颜色模式,红绿蓝。2.Lab颜色模式3.HSB颜色模式，基于人心里感受。4.YUV颜色模式。3.2.3 图像数据压缩的可能性：压缩的目的在于尽可能的消除数据冗余。冗余分类：1.统计冗余；2.信息熵冗余；3.结构冗余；4.知识冗余；5.视觉冗余。3.3 图像压缩算法：其指标包括压缩比、算法的复杂性和运算速度、失真度、无损编码、有损编码。3.3.1 信息熵编码：1.行程长度编码，也是游程编码，最简单之一；2.哈夫曼编码，常用方法之一；3.算术编码，其特点为信源符号的出现概率比较接近时，比哈夫曼编码高且实现比之复杂。3.3.2 字典编码：1.字典编码的思想，一是查找正在输入的

14、字符序列是否在以前输入出现过，有则用指针指向早期序列代替，二是创建短语字典,而后以索引号编码；2.LZW压缩算法，主要处理输入流、输出流、和一张字符表；3.LZW解压算法，3.3.3 预测编码：利用先前像素灰度信息，来预测当前像素灰度，把没有预测对的预测值与实际像素之间的差经过熵编码后发送接收端，接收端通过预测值和差值还原图像。其可分为线性和非线性预测编码。3.3.4 变换编码：是指将时域信号变换到频域信号进行处理的方法。波形编码：预测编码、变换编码、矢量量化编码、都属于波形编码。3.3.5模型编码：是利用计算机视觉和计算机图形学的知识对图像信号进行分析与合成3.3.6 混合编码：两种或以上的

15、编码方法对图像进行编码。如JPEG、MPEG3.4 常用图形、图像文件：计算机中的两种类型的图矢量图和位映图像。矢量图：用数学方法描述的一系列点、线、弧和几何形状，存放为矢量图格式。位映图像：也叫光栅图，由像素组成，存放为位图格式。矢量图与位映图像区别：矢量图是图形指令，大小与复杂度有关，越复杂执行的指令也多显示越慢，但易于编辑便于传播，表现力受限。位映图像是图像点阵数据，大小与色彩深度、图的尺寸有关，越大显示越慢，但表现丰富，编辑复杂文件大不利于传播。矢量图格式：.ps、.eps、.dpf、.ai、.swf、.svg、.wfm、.emf位映图像格式：BMP基本位图和GIF、PNG当中的部分编

16、码。3.4.1 BMP 文件格式：windows中采用的位映图像格式，尾名.BMP或.bmp。其由位图文件头数据结构、位图信息数据结构、位图阵列组成。3.4.2 GIF文件格式：以数据块为单位来存储图像，由表示图像图像的数据块、数据子块、显示图形图像的控制信息块组成，也就是GIF数据流。其采用LZW算法来压缩图像。3.4.3 PNG文件格式：为替代GIF、TIFF的位图格式。采用LZ77派生的无损算法。其定义了关键数据块即标准数据块和可选辅助数据块，其中关键数据块包括文件头数据块IHDR、调色板数据块PLTE、图像数据块IDAT、图像结束数据块IEND。PNG优缺点：其优点在于兼有GIF和JP

17、EG的色彩模式,既能把图片压缩到极限便于网络传播又能保留所有与图像品质有关的信息的解决方案，更优化的传输显示（交错模式，先显轮廓再显全图），其透明特性有利于减小文件便于传播，在所有系统中显示一样的图像不像GIF会变化。缺点在于PNG不能多张存储一个文件中形成GIF的动画效果，无损格式不便于有损压缩式文件减小，不支持CMYK模式即出版印刷模式。3.5 静态图形压缩标准3.5.1 JPEG：是国际标准化组织ISO和国际电话电报咨询委员会CCITT关于静止图像编码的联合专家组的缩写。该标准可用于自然景象或任意连续色调图像的数字数据的压缩编码和解码。JPEG标准的工作方式：1.顺序方式，图像被分成行列

18、的小块，从左到右从上到下的压缩与还原一次完成。2.渐进方式，先低于质量要求进行编码，然后再提高一次编码等级进行编码，只传输需要改善质量部分的信息，重复若干次知道得到质量要。解码时先解出低质量全图而后附加改善质量信息二次解码。解码随意终止适合网络环境。JPEG的基本系统算法过程：1.二维DCT变换；2.系数量化；3.编码模型与事件统一；4.熵编码；5.数据结构。JPEG渐进方式的实现：通过普选择法、逐次选择法、阶梯选择法组合来实现。JPEG的压缩效果：与被压缩图像特性有关。3.5.2 JPEG2000：同JPEG相比的优势在于压缩率高、无损压缩、渐进传输、感兴趣区域压缩。文件格式为LWF3.6

19、动态图形压缩标准3.6.1 MPEG标准概述：标准化的意义，只有实现标准化，才能带动集成电路的大量生产，大幅度降低视频压缩成本，解决不同厂商设备的通用性。3.6.2 MPEG-1标准：由MPEG-1的 systems、video、audio、conformance testing、software simulation五部分组成。MPEG数据流分层结构:运动图像序列、图片组、图片、块、宏块、图片切块。MPEG算法矛盾：满足随机访问最好算法是帧内编码，但此编码无法达到无损画质下高压缩比。所以采用预测和插值两种帧间编码技术。MPEG视屏算法的基础：基于16*16块的运动补偿缩减时间冗余，基于变换域

20、DCT的缩减空间冗余技术。1.缩减时间冗余：MPEG考虑内帧I、预测帧P、内插帧三种画面。因为一是考虑随机访问的重要性，二是运动补偿插值可以显著降低位速率，是应用最广泛的减少时间冗余的方法。2.缩减空间冗余：类似JPEG编码，采用混合编码、基于视觉加权的标量量化和行程编码等技术。其分三个阶段：一是基于DCT的正交阶段，二是对变换系数进行量化后把数据按Z形扫描顺序重组合，三十对变换系数按行程编码进行熵编码已达到进一步压缩目的。MPEG量化器设计主要考虑：视觉加权量化、帧内块和非帧内块的量化、可调整的量化器。3.6.3 MPEG-2标准：其制定出发点是保持通用性，使用广泛的应用良玉、比特率、分辨

21、率质量和服务。MPEG-2同MPEG1的区别在于：一是能够有效的支持电视的隔行扫描格式，二是支持可分级的可调视频编码。MPEG-2的9个组成部分：由MPEG-2的 systems、video、audio、conformance testing、software simulation、数字存储命令和控制扩展协议、先进声音编码ACC、系统解码器实时接口扩展标准、一致性控制测试。3.6.4 MPEG-4标准：是为了满足交互式多媒体应用的标准，跟高的灵活和可靠性。其主要用于可视电话、视频邮件、电子新闻等。其优点在于对传输速率要求较低，利用很窄的带快，可以通过帧内重建，压缩和传输数据以求最小的数据获

22、得最佳的图像。MPEG-4的三个最重要特征：基于内容的压缩、更高的压缩比和时空可伸缩性。MPEG-4同MPEG-1和MPEG-2的不同：MPEG-1、MPEG-2基于帧的规范，而MPEG-4基于媒体对象的规范，它管道了媒体对象的描述、表达、组织等问题3.6.5 MPEG-7标准：即多媒体内容描述接口，其主要提供图像信息检索解决方案，将对现有内容识别专用解决方案的有限的能力进行扩展，特别是包含更多的数据类型。MPEG-7的组成：MPEG-7的系统、描述定义语言、音频、视频、属性、参考软件、一致性。3.6.6 MPEG-21标准：其目的是希望定义一个包含各种多媒体的框架，从而使各种多媒体有机结合，

23、提供安全统一、跨平台、用于信息制作、发布、处理等功能的框架平台。MPEG-21的实质：就是关键技术的集成，通过集成环境对全球数字多媒体资源进行透明和管理。3.7 H.26X标准3.7.1 H.261标准：CCITT的第一个国际视频压缩标准，主要满足电视电话电视会议。3.7.2 H.263标准：其目的在于在现有的电话网上传输活动图像。其基于块的预测标差分编码系统。H.263标准的两种编码模式：1.帧内编码，仅包含帧本身的信息，从而每帧可以独立编码；2.帧间编码，只对帧间预测误差进行编码，从而极大消除时间冗余。H.263标准的可协商选择编码：1.无限制范围的运动矢量，、基于语法的算术编码方法、高级

24、预测和PB帧。H.263+中新增项：1.图像种类，有分级图像、增强的PB帧、用户定义的图像格式。2.编码模式，有先进的帧内码AIC、块效应消除滤波器DF、片结构SS、参考帧选择RPS、参考帧重采样RPR。3.7.3 H.264标准：其主要目标和特点在于，提高压缩编码效率、增强网络适应能力。H.264标准关键技术：1.分层设计VCL：分为视频编码层负责高效视频内容表示；网络提取层NAL：负责以网络所要求的恰当的方式对数据进行打包传送。2.高精度、多模式运动估计：H.264支持1/4、1/8像素精度的运动矢量。3. 4*4块的整数变换：对残差采用基于块的变换编码，但变换时整数操作不是实数运算。4.

25、统一的VLC：H.264中熵编码分两种，一种是对所有的待编码符号采用统一VLC（UVLC），一种是采用内容自适应的二进制算术编码CABAC5.帧内预测：不是在时间上，而是在空间域上进行的预测编码算法，可以消除相邻块之间的空间冗余，取得更有效的压缩。6.面向IP和无线环境：第4章音频信号和声卡4.1 音频编码基础声音，根据其内容可以分为波形声波、语音和音乐。波形声音，是数字化了的声音，包含所有的声音形式。音频信号，是指经过计算机处理过的离散化了的省略信号。4.1.1 声音信号的特点：1.声波是一种连续的波，连续性表现在，一是时间上的连续，二是幅度上的连续。声波具有普通波的特性，反射、折射、衍射

26、。2.声音的分类，按不同声音特性可分为不规则声音和规则声音。前者不包含任何信息的噪音，后者常分为语音、音乐、和音效。语音：是指具有语言内涵和人类约定俗成的特殊媒体。音乐：是规范的、符号化的声音。音效：是指人类熟悉的其他声音。3.声音的三要素，音调、音强、音色。4.1.2 音频信号处理的方法声音是连续模拟的信号，计算机要对声音时间轴和幅度两个方面进行离散化。采样：是指计算机对声音在时间轴上的离散化处理。是指计算机对声音在幅度上的离散化处理。4.1.3 音频文件的存储格式目前流行的种类：主要在计算机上的WAV格式，主要在UNIX工作站上的AU格式，主要在苹果机和SGI工作站上的AIFF和SND格式

27、，和目前PC机上流行的mr和mp3格式。WAV文件格式：称为波形文件格式。波形文件格式，支持存储各种采样频率和采样精度的声音数据支持声音数据压缩。RIFF文件格式：一种为交换多媒体资源而开发的资源交换文件格式，前面两个字段表示文件类型，其中最主要的两个块是，文件结构块（包含波形重要参数）和声音数据块（包含实际波形数据）。WAV外的常见音频格式：1.MP3，文件即采用MP3文件格式压缩的文件。2.AVI，一种符合RIFF文件规范的数以音频和视频文件格式。2.RM，由RealNetworks开发主要用于低速广域网上实时传输活动视频影像。4.1.4 声音质量的度量1.可以用声音信号的带宽来衡量，一次

28、为DAT CD FM AM 数字电话。2.另外两种基本方法：一是客观质量，主要使用信噪比来度量，建立在度量均方差基础上，特点是计算简单，但不能完全反映人对语言质量的感觉；二是主观质量，常用的方法有平均意见得分MOS法，其5个等级有若干参与测试者平分得出。3.数字语音通信语音质量分4类，广播质量、网络质量、通信质量、合成质量。4.2 音频信号压缩技术数字化的音频信号必须经过编码处理，以适应存储和传输的要求，并且在音频信号再生时得到做好的音质的声音。一般压缩技术分为，有损压缩和无损压缩，而按照压缩方案不同，又可分为时间域压缩、变换压缩、子带压缩以及多技术混合压缩。4.2.1脉冲编码调制，是概念上

29、最简单、理论上最完善的编码系统，是最早研制成功、使用最广泛的编码系统，但一时数据量最大的编码系统。声音数字化的两个步骤：一是采样，每隔一段时间间隔读一次声音的幅度；二是量化，把采样得到的声音信号幅度转化成数字值，可分为均匀量化和非均匀量化。4.2.2 增量调制DM增量调制DM是一种预测编码技术，是PCM编码的变形，PCM具有对任意变形进行编码的能力。DM对实际的采样信号与预测的采样信号之差的极性极性编码，将极性变成0和1这两种可能。增量调制孙然简单单有两个缺点：一是会出现斜率过载，二是会产生粒状噪声。4.2.3 自适应脉冲编码调制APCM其是一种根据输入信号幅度的均方根值的变化来改变量化的一种编码技术。改变量化阶大小的方法：一是前向自适应，二是后向自适应。4.2.4 差分脉冲编码调制DPCM是利用样本与样本之间存在的信息冗余来进行编码的一种数据压缩技术。其思想是根据过去的样本去估算下一个样本信号的幅度大小，这个值称为预测值，然后对实际信号值与与预测值之差进行量化编码从而减少了表示每个样本信号的位数。4.2.5 自适应差分脉冲编码调制ADPCM其综合

邮箱/手机：
温馨提示：	快捷下载时，用户名和密码都是您填写的邮箱或者手机号，方便查询和重复下载（系统自动生成）。如填写123，账号就是123，密码也是123。
特别说明：	请自助下载，系统不会自动发送文件的哦；如果您已付费，想二次下载，请登录后访问：我的下载记录
支付方式：
验证码：	换一换

账号：
密码：
验证码：	换一换
当日自动登录忘记密码？