多媒体物理技术Word文件下载.docx
《多媒体物理技术Word文件下载.docx》由会员分享,可在线阅读,更多相关《多媒体物理技术Word文件下载.docx(31页珍藏版)》请在冰豆网上搜索。
![多媒体物理技术Word文件下载.docx](https://file1.bdocx.com/fileroot1/2022-11/23/b9dff52b-275d-4c5a-b0aa-0bed709ac3c9/b9dff52b-275d-4c5a-b0aa-0bed709ac3c91.gif)
为了方便理解,我们教材中通过两个例子说明。
其中图a给出了数字音频、视频信息媒体的(记录/重放)传递过程。
图像和声音信息由摄像机捕获后,经过处理存储到磁带上或者直接通过有线或者无线信道传输出去。
这里所谓的处理是指对出入信号的变换和编码。
有线或者无线信道可以将直接捕获或者录像机重放的、已处理的音频、视频信息媒体传递到另一套录像设备中存储,或者直接由监视器将图像和声音信息重现出来。
信息在重现之前进行的处理应该是对传输信息的逆变换和解码。
图b给出的是计算机信息媒体的传递过程。
其中信息媒体(文字、图形、图像、动画、数据等)是由计算机软件生成的,可以存储在计算机存储设备(磁盘、光盘)中,由输入设备(鼠标、键盘等)通过各种类型的硬件设备和专业软件(统称为媒介)实现了捕获、处理、存储、传输和呈现。
按照国际电报电话咨询委员会的建议,将上述信息媒体及其在传递过程中用以处理的各类硬件设备和专业软件划分为以下5种类型。
(1)感觉媒体(PerceptionMedium):
指直接作用于人的感官,是人能直接产生感觉的媒体,如声音、图形、静止图像、动画、活动图像、文本、数据等。
(2)呈现媒介(PresentationMedium):
指感觉媒体和传输电信号之间转换的一些设备。
它又分为呈现设备和非呈现设备两类。
呈现设备一般看做输出显示媒介,譬如显示器、监视器、扬声器、打印机、投影仪等,非呈现设备一般看做输入显示媒介,譬如键盘、鼠标、扫描仪、话筒、摄像机等。
(3)再生媒体(RepresentationMedium):
为了有效地加工、处理和传输感觉媒体而人为研究、构造出来的一种媒体。
再生媒体一般需要研究开发出一些处理技术(包括硬件和软件)进行图像编码、声音编码、文本编码等。
从而能够有效地存储感觉媒体或将感觉媒体从一个地方传送到另一个地方。
传输、存储感觉媒体,这些经过加工、处理后的感觉媒体叫做再生媒体。
在多媒体技术中,传输和存储的一般都是再生媒体呈现媒体包括各种编码方式,如语言编码、文本编码、静止或运动的图像编码等。
(4)存储媒介(StorageMedium):
指用于存储再生媒体的物理介质,也称为存储介质。
存储媒介有磁盘、磁带、光盘、半导体芯片等。
(5)传输媒介(TransmissionMedium):
指用于传输再生媒体的物理介质,也就是通信的信息媒介。
这类媒介包括各种导线、光缆、电缆、电磁波等。
根据上述的例子,请考虑一个问题:
手机、电视机、计算机的组成和各项功能个属于什么媒体或者媒介。
同时,我们可以比较明确的界定信息、媒体和媒介三者的关系如下:
媒体是信息的载体,信息只有通过某一种媒体或几种媒体形式才能表达出来。
媒体包括了感觉媒体和再生媒体两个范畴。
媒介是用于存储、呈现或者传输媒体的设备或者物理介质。
媒介包括了我们前面所说的呈现媒介、存储媒介和传输媒介三个方面。
1.2了解多媒体问世前后的历史背景
多媒体最早起源于20世纪80年代中期。
1984年美国的Apple公司在研制Macintosh计算机时,为了增加图形处理能力,改善人机交互界面,创造性地使用了位映射(bimap)、窗口(Windows)、图符(Icon)等技术,这一系列改进所带来的图形用户界面(GUI)深受用户欢迎,同时鼠标作为交互设备的引入,配合GUI使用,大大地方便了用户的操作。
1985年,Microsoft公司推出了Windows,它是一个多任务的图形操作环境。
Windows使用鼠标驱动的图形菜单,是一个用户界面友好的多层窗口操作系统,为多媒体功能的实现和应奠定了良好的基础。
同年,美国Commodore公司首先推出世界上第一台多媒体计算机Amiga系统。
Amiga系统采用MotorolaM6800D微处理器作为CPU,并配置Commodore公司研制的三个专用芯片:
图形处理芯片、音响处理芯片和视频处理芯片。
Amiga有自己的操作系统,它能够处理多任务,并具有下拉菜单、多窗口、图符等功能。
1986年,荷兰Philips公司和Sony公司联合推出交互式紧凑光盘系统,同时公布了该系统所采用的CD-ROM光盘的数据格式,这项技术对大容量存储设备光盘的发展产生了巨大的影响,并经过国际标准化组织(ISO)的认可成为国际标准。
大容量光盘的出现为存储表示声音、文字、图形、视频等高质量的数字化媒体提供了有效地手段。
关于交互式视频技术的研究也引起了人们的重视。
197年,美国无线电公司RCA研究中心发布了交互式数字视频系统——DVI(DigitalVideoInteractive)系统,该系统以计算机技术为基础,用标准光盘来存储和检索静态图像、活动图像、声音等数据。
1990年在Intel公司和IBM公司的共同努力下,首次推出了DVI技术的第一代产品——ActionMedia750.此后,多媒体技术逐渐成熟,从以研究开发为重心转移到以应用为重心。
由于多媒体技术是一种综合性技术,它的产品实用化涉及到计算机、电子、通信、影视等多个行业技术协作,其产品的应用目标既涉及研究人员也面向普通消费者,涉及各个用户层次,因此标准化问题也就成了多媒体实用化的关键。
1990年10月,在Microsoft公司召开的多媒体开发工作会议上提出了MPC1.0标准。
1993年提出MPC2.0标准,1995年和1996年又相继推出了MPC3.0标准和MPC4.0标准。
随着应用要求的提高以及多媒体技术的不断发展,多媒体功能已经成为个人计算机的基本功能,并且不断涉及到社会生活的各个领域。
1.3认识多媒体和多媒体技术
一方面,多媒体是从视频和计算机两个领域的需求出发,按照各自的技术思路和商业目的,殊途同归的发展而来的,因此从不同的行业角度出发很难形成对多媒体的共识。
另一方面,多媒体技术从问世之日起,变一直伴随着一些相关定义在不断地发展和完善,因而使得当时有不少业内专家担心,给出的定义跟不上其内涵的变化。
因此,尽管多媒体这个专业名词在各个领域中已经成为一个炙热的焦点,但是至今仍然没有一个统一的严格定义。
目前,比较常见的几种定义模式如下:
多媒体技术是指能综合处理多种媒体信息,如文字、声音、图形、图像、动画等,使多种信息建立逻辑连接,并且集成为一个具有交互性的计算机系统。
多媒体技术是传统的计算机(如文本、图形、图像、动画等)与视频、音频相结合,且为了知识创造和表达的交互式应用的结合体。
”
多媒体技术是指能够同时获取、处理、编辑、存储和呈现两个以上不同类型信息媒体的技术,这些信息媒体包括文本、图像、图形、动画和活动图像等。
”换句话说,“多媒体技术提供了三种新的能力,即在通信中结合电视的音像能力、出版发行能力和计算机交互处理能力。
多媒体技术是基于计算机技术的综合技术,包括数字信号处理技术、音频和视频技术、计算机硬件和软件技术、人工智能和模式识别技术、通信和图像技术。
它是正处于发展过程中的一门综合性的高新技术。
从前两种描述中可形成对“多媒体”的认识:
多媒体必须是由计算机领域中的媒体与电视领域中的媒体互相结合的产物;
多媒体必须具有交互功能。
其中,计算机领域中的媒体包括数据(Data)、文本(Text)、图形(Graphic)和动画(Animation);
而电视领域中的媒体则包括视频图像(Video)、音频(Audio)和色彩(Chroma)。
计算机和电视领域各自都有许多种媒体,但是如果没有这两个领域的媒体结合,都不能称作为多媒体。
各种场合中所涉及的媒体及媒介:
场合
媒体
媒介
电视接收机
视频图像、音频和色彩
电磁波,电视总线
磁带录像机
音频、视频
磁带
计算机
数据、文本、图形和动画
显示器,硬盘,光盘
计算机网络
数据、文本、图形、图像、动画、音频、视频
计算机显示及存储硬件,通信网络
手机通信
音频、文本、图形和动画
无线通信网络,手机硬件
路边灯箱广告
文本、图形、图像
灯箱、平面画报
交互功能是计算机的一个基本属性,强调交互功能,实际是强调计算机在两者结合中的重要作用和地位。
它将更有效地为用户提供控制和使用信息的手段,也为多媒体技术的应用开辟了更加广泛的领域。
交互性不仅增加了用户对信息的理解,延长了信息的保留时间,而且交互活动本身也作为一种媒体加入了信息的组织过程,甚至可控制信息的穿破过程,从而可以使用户研究、学习自己感兴趣的东西,并获得新的感受。
从后两种描述中可形成对“多媒体技术”的认识:
●多媒体技术能够同时对计算机领域和电视领域中的媒体进行获取、处理、编辑、存储和呈现
●多媒体技术是一种基于计算机的综合技术,包括数字信号处理技术、音频和视频技术、计算机硬件和软件技术、人工智能和模式识别技术、网络通信技术等
综上所述,结合当今多内体技术网络化、智能化以及与艺术紧密结合的发展趋势,可以尝试吧多媒体技术定义为:
多媒体技术是以数字技术为基础,把通信技术、广播技术和计算机技术溶于一体,对文字、图形、图像、声音和视频等多种媒体信息进行存储、传输和控制,在不同媒体间建立逻辑连接,集成为一个具有交互性的系统,以提供丰富生动的艺术表现来改善人们使用媒体体验的一门综合性的信息技术。
多媒体技术的研究内容
根据前面的介绍,我们认定,多媒体技术是一种基于计算机的综合技术,之所以能够得到迅速发展,与其自身在各个领域的实践应用是密不可分的。
我们将它的应用总体上概括为三个方面:
(1)多媒体计算机图形与图像处理技术;
数字音频、视频处理技术;
(2)多媒体网络通信技术。
1.4.1多媒体计算机图形与图像处理技术
图形处理技术
图形处理技术包括二维平面及三维空间的图形处理两种。
早期的计算机图形处理技术主要集中于二维图形技术的研究,但是二维图形只能表现图形中各个部分简单的几何关系,无法表现出空间、位置、材质、明暗等接近自然的真实感效果,现在的研究重点集中于三维真实感图形技术的研究,以及对三维图形对象赋予运动属性后生成连线画面(动画)效果的研究。
目前图形处理的具体内容主要包括:
几何变换(如平移、旋转、缩放、透视和投影等);
曲线和曲面拟合;
建模或者造型;
隐线、隐面消除;
阴暗处理;
纹理产生;
配色等。
实际上为了显示的需要,特别是三维动画处理的需要,计算机三维图形处理技术最终还是要将用计算机数据描述的三维空间信息通过计算机转换成二维图像并显示到输出设备上。
在实现这一转换的过程中,显示卡中的图形加速芯片起到了至关重要的作用。
现在所有的显示芯片都能加速处理三维图形,提供实时和动态的三维图形应用支持,加速处理的3D效果,包括混合、灯光、纹理贴图、透视矫正、过滤、抗失真等。
因此,为了使3D图形处理软件更好的调用图形加速芯片的图形处理功能,三维图形处理技术中出现了各种图形处理接口程序3DAPI(ApplicationProgrammingInterface)。
数字图像处理技术
图像处理是指将客观世界中实际存在的物体映射成数字化图像,然后在计算机上用数学的方法对数字化图像进行处理。
图像处理的内容极为广泛,如放大、缩小、平移、坐标轴旋转、图像变化、图像识别、图像的选出与去除等等。
图形处理与图像处理的区别在于,图形处理着重研究怎样将数据和几何模型变成可视的图形,这种图形可以是虚幻的。
图像处理则是着重于将客观世界中原来就存在的物体映像处理成新的数字化图像,关心的问题是如何压缩数据、如何识别、提取特征、三维重建等。
二者之间的关系随着计算机技术的发展越来越紧密,利用真实感图形绘制技术可以将图形数据变成图像,利用模式识别技术也可以从图像数据中提取几何数据,把图像转换成图形,二者的区别也越趋模糊。
图形、图像处理中的虚拟现实技术
虚拟现实技术,顾名思义就是将并不存在的食物和环境,通过各种技术虚拟出来,让用户感觉到如同真实世界一样。
图形、图像处理中的虚拟现实技术是用计算机模拟三维环境,用户可以走进这个环境(用鼠标控制浏览方向),并且操纵场景中的对象,实现了在虚拟场景中的人机“可交互性"
。
1.4.2数字音频、视频处理技术
数字音频、视频技术特征:
在多媒体技术中的音频、视频技术采用的是全数字技术。
数字音频、视频处理技术的主要组成:
1.模拟音频、视频信号的数字化编码(模/数转换A/D)
A/D转换是将人所能接受的模拟音频、视频信号转换为计算机能够识别的数字信息,它是数字音频、视频处理技术中的基础
2.数字音频、视频信息的压缩编码(信源编码)
信源编码则是将数字化后的音频、视频信号的数据根据不同的应用,按照不同的标准及其算法进行压缩处理,从而达到降低码率的目的,它是数字音频、视频处理技术的关键。
3.数字音频、视频信息的存储与传输编码(信道编码)
信道编码是将压缩后的音频、视频数据根据存储与传输的介质不同进行相应的调制,使其符合该介质的要求或者达到提高频率资源利用率的目的;
信道编码的另一个作用就是对存储与传输的数据进行容错技术处理,以确保重放数据的准确性,因此信道编码是数字音频、视频处理技术的保证。
1.4.3多媒体网络通信技术
网络通信已成为社会生活中的一个重要组成部分
种类繁多的基于多媒体的网络服务
多媒体通信的研究领域:
标准系统产品应用服务
1.5多媒体技术的应用领域
1.5.1教育培训领域:
现代教育技术、远程教育技术
1.5.2电子出版领域:
多媒体技术给出版业带来了巨大的影响,其中近年来出现的电子图书和电子报刊就是应用多媒体技术的产物。
1.5.3娱乐:
譬如信息点播有桌上多媒体通信系统和交互电视ITV,目前常用的软件为PPStream。
1.5.4咨询服务领域:
利用多媒体技术可为各类咨询提供服务,如旅游、邮电、交通、商业、金融、宾馆等。
1.5.5多媒体网络通信领域:
计算机的交互性,通信的分布性和多媒体的现实性相结合,将构成继电报电话、传真之后的第四代通信手段。
图形与图像
通过前面一章的介绍,我们已经了解了:
1、图形与图像是人们感知世界的一种重要的、形象化的感觉媒体,是信息表述的重要形式之一;
2、多媒体计算机图形与图像处理技术在多媒体技术的应用领域中占有着非常重要的比重,利用计算机技术处理图形与图像已经成为多媒体技术的重要组成部分。
这也是我们今天将开始和大家介绍的基本内容——图形与图像的处理。
在图形与图像处理这一个章节中,我们重点将我大家介绍图形图像的基本概念、了解图形图像的处理、介绍图像图像处理软件(Photoshop)的应用、计算机动画原理以及计算机动画制作软件3DMAX的应用。
看到一副静态的图形图像而言,撇开计算机的问题,我们从感觉的角度出发首先关心的是它的形状、颜色、明暗程度等一些外在的信息属性,通过这些感觉这幅图像所要表达的具体的信息内涵。
而这一整幅图形图像在通过计算机生成、处理、传输和显示的过程中我们还得关心诸如分辨率、像素深度、文件大小等计算机技术的内在属性,这些内容是我们在图形图像的基本概念中首先要来讨论的问题。
图形与图像的基本概念
2.1.1图形与图像的颜色模型
对于图形图像而言,我们第一感觉得到的信息就是它的颜色问题。
引入到多媒体技术中,我们对于图形图像的颜色模型的建设中主要关心两个问题:
颜色的基本概念和颜色模型。
颜色的基本概念
(1)物体的颜色
为什么各种物体会表现出不同的颜色?
这是因为它们对光的吸收和反射的属性不同。
由你们的光学基础知识可知,光的色彩不同那么波长也是不一样的。
物体在接收到外界的光线照射时一般总是反射某一种波长的光,而吸收其他所有波长的光。
物体的颜色是由该物体所反射的光的波长来决定的。
譬如树叶之所以是绿色的,实际就是因为树叶只反射自然光中绿色波长的光,而将其他所有波长的光吸收了,当反射的绿光作用于人眼,我们也就看到了绿色的树叶。
这个时候如果说我们把自然光换为绿色以外的某种光来照射树叶,那么因为没有任何波长的光可以发射,对我们而言树叶就只能是黑色的。
所以说我们在观察和选择物体的颜色时,要注意环境光源对它的影响,在彩色显示器中,为了使颜色具有较好的还原度和真实感,通常采用类似自然光所为照明光源。
(2)颜色三要素
颜色信息对人的视觉反应,在计算机技术中可通过亮度、色调和色饱和度三个参量来表示。
其中,色调是指用来描述颜色的不同类别的物理量。
譬如赤、橙、黄、绿、青、兰、紫。
色饱和度:
描述颜色深浅程度的物理量。
按照某颜色混入白光的比例来表示。
比例少,颜色浓,比例少,颜色淡。
亮度:
描述色光的明暗强度的物理量。
色光由色调和色饱和度来决定,亮度是色光能量的描述,色光强则物体感觉明亮,相反则物体感觉暗淡。
(3)三基色原理
在多媒体技术中对于色彩处理非常重要的理论基础则是三基色原理。
三基色原理认为自然界中景物的绝大多数的彩色光能分解为互相独立的红(R)、绿(G)、蓝(B)三种基色光;
反之用互相独立的红、绿、蓝三种基色光以不同的比例混合,可模拟出自然界中绝大多数景物的彩色。
这也是彩色显示器工作的基本原理。
(4)像素(Pixel)
像素实际上就是组成图像的很小的可视点。
是计算机图形与图像中能被单独处理的最小基本单元。
每个像素点都有确定的色调、色饱和度和亮度。
2、颜色模型
颜色模型就是定量颜色的方法。
在不同的应用领域中,图形图像的颜色模型是不一样的。
这里我们主要和大家介绍两种最常见的:
彩色显示器所采用的RGB模型和打印机中采用的CMY模型。
(1)RGB模型
RGB模型也称为加色法混色模型。
它是以RGB三种基色光互相叠加来实现混色的方法,因而适合于显示器等发光体的显示。
其混色规律是:
以等量的红、绿、蓝基色光混合时,有
红+绿=黄色红+蓝=紫色
绿+蓝=青色红+绿+蓝=白色
三种基色光全无=黑色
加色法的混色规律可用图表示.
其配色方程描述:
F(物体颜色)=R(红色的百分比)+G(绿色的百分比)+B(蓝色的百分比)
⑵CMY模型
CMY模型(CyanMagentaYellow)是采用青、品红、黄色3种基本颜色按一定比例合成颜色的方法。
CMY模型又称为减色法混色模型,因为色彩的显示不是直接来自于光线的色彩,而是光线被物体吸收掉一部分之后反射回来的剩余光线所产生的,光线都被吸收时成为黑色,当光线都被反射时成为白色。
⑶YUV与YIQ模型
在彩色电视系统中不采用RGB颜色模型,而采用YUV或YIQ颜色模型表示彩色图像。
YUV颜色模型中,Y是亮度信号,U和V则是两个色差信号,分别传送红基色分量和蓝基色分量与亮度分量的差值信号。
其中亮度信号Y有效解决了彩色电视与黑背电视的兼容问题。
YIQ颜色模型的特性与YUV相近,Y表示亮度信号,I和Q也是色差分量,只是它们在色度矢量图中与U和V的位置不同。
⑷HSI颜色模型
HSI〔或HSL〕颜色模型用H、S、I三参数描述颜色特性,其中H定义颜色的波长,称为色调;
S表示颜色的深浅程度,称为饱和度;
I表示强度或亮度。
2.1.2图形与图像的基本属性
1.分辨率
分辨率是一个统称,分为显示分辨率、图像分辨率、打印分辨率和扫描分辨率等。
⑴显示分辨率
是指某一种显示方式下,显示屏上能够显示出的像素数目,以水平和垂直的像素数表示。
⑵图像分辨率
图像分辨率指数字化图像的大小,以水平和垂直的像素数表示。
如图像分辨率等于显示分辨率,则图像正好占据满屏;
小于则占据屏幕的一部分;
大于则产出屏幕显示范围。
⑶扫描分辨率与打印分辨率
在用扫描仪扫描图像时,通常要指定扫描的分辨率,用每英寸多少点(dotsperinch,DPI)表示。
打印分辨率是指图像打印时每英寸可识别的点数,也使用DPI(dotsperinch,每英寸点数)为衡量单位。
2.颜色深度
颜色深度是指图像中每个像素的颜色(或亮度)信息所占的二进制数位数,记作位/像素(b/p:
bitsperpixel)。
4bit:
VGA标准支持的颜色深度;
8bit:
多媒体应用中的最低颜色深度;
16bit:
其中15位中每5位表示RGB三种中的一种颜色,剩余一位表示图像的其他属性。
24bit:
用3个8位分别表示RGB这3种颜色,可生成16M种颜色,开始成为真彩色。
32bit:
用3个8位分别表示RGB这3种颜色,剩余的8位表示图像的其他属性。
3.文件的大小
图形与图像文件的大小(也称数据量)是指在磁盘上存储整幅图像所有点的字节数(Bytes),反映了图像所需数据存储空间的大小,可按下面的公式计算:
文件字节数=图像分辨率×
图像深度/8
4.真彩色、伪彩色与直接色
⑴真彩色(Truecolor)
真彩色是指在组成一幅彩色图像的每个像素值中,有R、G、B三个基色分量,每个基色分量直接决定显示设备的基色强度,这样产生的彩色称为真彩色。
⑵伪彩色(PseudoColor)
伪彩色图像是每个像素的颜色不是由每个基色分量的数值直接决定,而是把像素值当作彩色查找表(color-look-uptable,CLUT)的表项入口地址,去查找显示图像时使用的相应R、G、B