常用图像视频处理软件Word文档格式.docx
《常用图像视频处理软件Word文档格式.docx》由会员分享,可在线阅读,更多相关《常用图像视频处理软件Word文档格式.docx(55页珍藏版)》请在冰豆网上搜索。
视频信号的参数包括各种频率,有行频、场频、帧频。
行频是指每秒钟扫描多少行;
场频是每秒钟扫描多少场;
帧频是每秒钟扫描多少帧。
逐行扫描的一帧即为一个垂直扫描场。
电子束从显示屏左上角一行接一行地扫到右下角,扫描一遍就得到一幅完整的图像。
对于隔行扫描来说,一帧分为两场——奇数场和偶数场,即用两个垂直扫描场来表示一帧。
奇数场扫描中,电子束扫完第一行后回到第三行行首接着扫描,然后是第五、第七行,直到最后一行。
奇数行扫描完后扫描偶数行,就可以完成一帧的扫描。
对于摄像机和显示器屏幕,获取或者显示一幅图像都要扫描两遍才能得到一幅完整的图像。
隔行扫描先扫奇数,后扫偶数。
它对于分辨率要求不高的场合,例如电视的播放,是比较适合的;
对于分辨率要求较高的场合,则需要用逐行扫描。
逐行扫描和隔行扫描的示意图如图5-1,图5-2所示。
图5-1逐行扫描示意图
分辨率有两种,包括显示分辨率和图像分辨率。
显示分辨率是指显示器屏幕上能够显出的像素数目。
例如一般的多媒体计算机,要求的显示分辨率是640×
480。
即屏幕分为480行,每行显示640个像素。
屏幕能够显示的像素越多,显示分辨率也就越高,显示的图像质量也越高。
图像分辨率是指一幅图像所包含的像素数目,用它来衡量图像质量。
同样大小的一幅图,分辨率越高,其真实感越强。
图5-2隔行扫描示意图
下面具体介绍PAL制式和NTSC制式的各种指标。
PAL制式视频每帧625行,采用隔行扫描,行扫描频率是15,625Hz,场扫描频率是50Hz,帧速率为每秒钟25帧,每一行传送图像的时间是52.2微秒,其余11.8微秒是行扫描逆程时间,用来进行行同步和行消隐。
奇数场和偶数场每场312.5行,其中25行用来进行消隐,每帧有效的信号是287.5行。
NTSC制式视频每帧525行扫描,隔行扫描。
行扫描频率是15,750Hz,场扫描频率
是60Hz,帧速率为每秒钟30帧,每一场扫描262.5行。
5-1-3视频信号的格式
使用图形图像处理软件,会接触到RGB、YUV等信号格式。
这里具体讲述各种信号格式的概念,以及在Premiere中使用的视频信号格式。
RGB格式是根据三基色原理,用R、G、B3种信号代表自然界的红、绿、蓝3种基本色。
获取视频信号时,摄像机等设备得到的扫描信号,就是R、G、B信号。
电视机、显示器进行视频显示时,扫描电子束分为R、G、B3束,同时射到屏幕上的一点。
屏幕上有一层很薄的磷粉,这层磷粉可以发射出各种强度的红光、绿光和蓝光,合成后即得该点图像原先的色彩。
由于电视机的发展是从黑白电视机到彩色电视机,黑白电视机采用的视频格式是YUV格式,为了兼容,即黑白电视的节目彩色电视机也能进行播放,彩色电视机的视频格式也采用了YUV格式,而不是较为直接的RGB格式。
YUV格式是目前普遍采用的视频信号格式。
其中,Y代表亮度信号,控制图像点的亮度;
U、V代表两个色差信号,控制图像的色度。
U、V信号在传输过程中可以合成为一个色度信号C。
彩色全电视信号就是指把亮度信号Y和色度信号C再进一步合成后得到的信号,用它来进行视频的传输。
YUV信号与RGB信号之间的关系如下:
Y=0.39R+0.5G+0.11B
U=B-Y
V=R-Y
U、V信号合成为C信号的换算关系如下:
C=Usinωt+Vcosωt=Cmsin(ωt+Φ)
其中,ω为彩色负载波频率。
振幅为:
C=
相位为:
Φ=tg-1(V/U)
5-1-4视频信号的模数转换
PAL制式、NTSC制式都是模拟信号的制式。
计算机中处理的视频都是数字信号。
这就需要进行模拟/数字的转换,称为A/D转换。
如前所述,模拟信号是指在时间和幅度方向上都连续的信号;
数字信号是指在时间和幅度方向都离散的信号。
模拟/数字转换分为两步,第一步是把信号转换为时间方向离散的信号,而每一个离散信号在幅度方向连续;
第二步是把这样的信号转换为时间、幅度方向都离散的数字信号。
第一步过程称为采样,第二步过程称为量化。
采样是根据一定频率的时钟脉冲,获得该时刻的信号幅度值。
采样时的时钟频率称为采样频率,采样频率越高,效果越好,但需要的存储空间也越大。
采样获得的信号在幅度方向上是在一定范围内连续的值。
奈奎斯特采样定理描述了采样的频率应该满足的条件:
令f为所采样信号的最高变化频率,那么采样频率必须不低于2f,才可以正确地反映原信号。
其中,最低的采样频率2f称为奈奎斯特频率。
量化是把采样获得的信号在幅度方向上进一步离散化的过程。
在电压信号的变化范围内取一定的间隔,在这个间隔范围内的电压值都规定为某一个确定值,这样来进行量化。
例如,如果在计算机中用4比特编码来表示量化结果,则可以进行16级的量化。
把电压的变化范围平均划分为16级电平,每一级分别对应值0-15。
由于一般的视频信号都采用YUV格式,进行量化也是按照各个分量来进行。
人眼对于图像中色度信号的变化不敏感,而对亮度信号的变化敏感。
利用这个特性,可以把图像中表达颜色的信号去掉一些,而人眼不易察觉。
所以一般U、V信号都可以进行压缩,而整体效果并不差。
另外,人眼对于图像细节的分辨能力有一定的限度,从而可以把图像中的高频信号去掉而不易察觉。
利用人眼的这些视觉特性进行采样,就有了不同的采样格式。
不同的采样格式是指YUV3种信号的采样频率的比例关系不同。
它们的比例关系通常采用“Y:
U:
V”的表示形式,常见的采样格式有4:
4:
4,4:
1:
1,4:
2:
2,4:
0等。
●4:
4
没有对色度信号进行压缩的采样格式。
对每一个采样点,亮度Y、色差U和色差V各取一个样本。
每个像素用3个样本表示。
1
在4个连续的采样点上,取4个亮度Y的样本值,色差U和色差V各取一个样本,共6个样本,平均每个像素用1.5个样本表示。
2
在4个连续的采样点上,取4个亮度Y的样本值,色差U和色差V各取2个样本,共8个样本,平均每个像素用2个样本表示。
在水平和垂直方向上每两个连续的采样点上取2个亮度Y样本,一个U样本和一个V样本,平均每个像素用1.5个样本表示。
5-1-5颜色模式和像素深度
在使用图形图像处理软件过程中,会遇到“RGB”、“HSB”、“YUV”,“真彩色”、“高彩色”和“伪彩色”等名称。
下面讲述颜色模式和像素深度的概念和种类。
颜色模式包括RGB颜色模式、YUV颜色模式、HSB颜色模式、CMYK颜色模式等几种。
下面逐一进行介绍。
RGB颜色模式在4.1.3节中已经提到过。
Red(红)、Green(绿)、Blue(蓝)是自然界的三原色。
三基色原理是:
所有的颜色都可以由不同强度的红、绿、蓝3种颜色混合而成。
RGB颜色模式就建立在三基色原理的基础之上的。
YUV颜色模式在4.1.3小节也已经介绍过。
Y信号是亮度信号,U信号和V信号是色差信号。
RGB颜色模式与YUV颜色模式的转换关系见4.1.3小节。
在HSB颜色模式中,H(Hues)是色调信号,S(Saturation)是饱和度信号,B(Brightness)
是亮度信号。
这种颜色模式建立在人对颜色的心理感受的基础上,比较符合人的主观感觉。
在CMYK颜色模式中,C(Cyan)信号表示青色;
M(Magenta)信号表示洋红色;
Y(Yellow)表示黄色:
K(Black)信号表示黑色。
这一颜色模式建立在减色原理的基础之上,也称为相
减混色模型。
几种颜色的叠加可得到各种颜色。
像素的深度用存储每个像素所使用的位数来表示。
对于彩色图像,像素深度决定了每个像素可能具有的颜色数,不同的比特数最多能够表示的颜色数不同;
对于灰度图像,像素深度决定了每个像素可能具有的灰度级数,不同的比特数最多能够表示的灰度级数也不同。
真彩色:
是指在组成一幅彩色图像的每个像素值中,有R、G、B3个基色分量,每
个基色分量直接决定其基色的强度。
这样合成产生的彩色就是真实的原始图像的彩色。
用24位来表示一种颜色,即3种信号均用8位来表示,共能表示大约16.8兆种颜色。
而平时所说的32位真彩色,是在24位之外,还有一个8位的Alpha通道,表示每个像素的256种透明度等级。
高彩色:
指用16位来表示一种颜色,共能表示65536种颜色。
伪彩色:
指用8位来表示一种颜色,彩色图像的每个像素值不分R、G、B分量,而是把它作为索引进行彩色变换,即把它作为彩色查找表CLUT(Colorlook-uptable)的入口地址,查找出对应的RGB分量值,来产生彩色。
8位伪彩色共能表示256种颜色。
调配色:
是指把每个像素值的RGB分量作为单独的索引值分别进行变换,通过相应
的彩色变换表分别找出基色强度,用这样变换后得到的RGB强度值产生的彩色。
5-1-6视频质量的等级
视频按照其质量来划分,可划分为不同的级别。
没有统一的划分标准,一般划分为5
个等级,分别为高清晰度电视等级、演播质量数字电视等级、广播质量等级、VCR质量
等级和视频会议质量等级。
●高清晰度电视等级:
是指达到高清晰度电视质量的视频等级。
高清晰度电视在不同的国家采用不同的图像分辨率和帧速率的组合,主要包括:
高分辨率和高帧速率:
分辨率为1920X1080,帧速率为每秒60帧。
高分辨率和一般的帧速率:
分辨率为1920X1080,帧速率为每秒30帧或者24帧。
增强分辨率和一般帧速率:
分辨率为1280X720,帧速率为每秒30帧或者24帧。
高清晰度电视采用的长宽比为16:
9。
一般的高清晰度电视质量指的是高分辨率和高帧速率格式。
●演播质量数字电视等级:
是80年代中期出现的,国际电信联盟(ITU)推荐对广播电视信号进行数字编码。
这样对电视演播技术进行了标准化,为将来数字电视信号的传输提供了参考,从而形成了ITUCCIR-601建议,它是一系列兼容的标准的集合。
●广播质量等级:
是向常规电视演播服务中加入数字技术而形成的视频质量等级。
常规电视演播服务以模拟传输为基础,是基于载体的调制而不是位的传输。
其中,数字电视摄像机可以用来捕获视频信号,带来数字视觉的效果。
但在传输之前,必须转化为模拟形式来进行载波调制。
现在的电视机能把接收到的模拟信号转换为数字信号,存储在类似于计算机显示器的数字帧缓冲器里,来进行扫描显示。
这样的视频就是广播质量电视等级的视频。
●VCR质量等级:
是视频具有VHS质量的录像机放映广播质量节目时具有的质量。
分辨率是PAL制式广播质量电视的一半。
●视频会议质量等级:
又称为低速电视会议质量。
数据传输率约为128Kbps。
它的分辨率是电视广播质量的四分之一,帧速率为每秒5-10帧。
5-1-7音频采样和量化
与视频信号一样,音频信号同样要经过从模拟音频到数字音频的转换过程,即采样和量化过程,才能在计算机中进行存储和处理。
音频数据的采样和量化有其自身的特点。
采样频率要考虑到人耳的听觉频率范围。
人耳能听到的声音的最低频率是20kHz,最高频率是20000kHz。
音频的最大带宽是20kHz,采样的频率在40kHz~50kHz范围内:
量化的比特数要求比较多。
采样频率和量化的比特数越高,声音的质量越好。
5-1-8音频质量的等级
度量声音质量有两种基本方法,一种是度量声音客观质量,一种是度量声音主观质量。
度量声音客观质量使用的主要指标是信号/噪声比SNR(Signal-to-NoiseRatio)。
度量声音主观质量采用的方法是平均判分法MOS(MeanOpinionScore),这种方法就好比唱歌比赛中的评委打分,对于每种有代表性的声音,都由每位评委进行评分,最后取平均分。
在数字声音系统中,通常用声音信号的带宽来衡量声音的质量。
常见的声音质量分为以下4个等级:
●CD质量:
即CD(CompactDisc)音响光盘质量。
它也就是常说的超级高保真质量,声音频带最宽,是声音质量的最高等级。
●FM质量:
FM即频率调制(PrequencyModulation)。
●AM质量:
AM即幅度调制(AmplitudeModulation)。
●数字电话质量:
它的声音频带较窄。
5-1-9图像、视频和音频文件的各种格式
在使用各种图形图像处理软件过程中,会见到各种各样的图像、视频、音频的文件格式。
这一小节中,将简单介绍各种文件格式,以便于用户查阅和使用。
一、图像文件格式
●GIF:
图形交换格式(GraphicsInterchangeFormat),是CompuServe公司在1987年开发的一种压缩的8位图像文件格式。
采用基于LZW(Lempel-ZivWalch)算法的无失真压缩技术和变长代码,多用于网络传输。
一系列的GIF文件可以合成为一个动画文件,称为动画GIF。
●JPG:
使用JPEG静止图像压缩编码技术而形成的一类图像文件格式。
●BMP:
最初是由Windows操作系统的附件中的画笔(Paint)所支持的图像的格式,现在可以被多种图形图像处理软件所支持并使用。
它是一种位图格式,有单色位图、16色位图、256色位图、24位真彩色位图等几种。
●PSD:
Adobe公司的图像处理软件Photoshop中使用的图像文件存储格式。
保留了Photoshop制作过程中的各个层次的图像信息。
●FLM:
Premiere输出的一种图像格式。
可以在Photoshop中进行处理。
●FLC和.FLh:
是Autodesk公司开发的动画文件格式。
●TGA:
由Truevision(美国)公司于1984年定义的用来存储彩色图像的格式,并且进行了扩充。
TGA格式采用游程编码(RLE)对图像数据进行无失真编码,是主要用于现在计算机生成的数字图像向电视图像转换的一种数字化图像格式。
其主要技术特点是按照行来进行压缩和存储。
●TIF:
TIFF(TaSImageFileFormat)是由Aldus和Microsoft公司为扫描仪和台式计算机出版软件开发的图像文件格式。
定义了黑白图像、灰度图像和彩色图像的存储格式。
是完全开放的、非常灵活的图像文件存储格式,格式可长可短,与操作系统平台以及软件无关,扩展性好。
●WMF:
Windows图元文件(Windowsmetafile)格式。
●DXF:
Drawing-Exchangefiles,是Autodesk公司的AutoCAD软件中使用的图像文件格式。
●PC:
Lotusl-2-3产生的图像文件格式。
●PCX:
即PCPaintbrushlmages格式。
Z-soft公司为存储画笔软件产生的图像而建立的图像文件格式,是位图文件的标准格式。
●PCD:
PhotoCD格式。
二、视频文件格式
●AVI:
即AudioVideoInterleaved。
是VideoforWindows的影视文件存储格式。
其特点是播放的视频文件的分辨率不高,帧速率小于30帧/秒或者25帧/秒。
●MMM:
即MicrosoftMultimediaMovie的动画文件格式。
●MOV:
QuickTimeforWindows格式。
●MPG:
MPEG格式。
●QT:
●RM:
是ProgressiveNetworks公司的RealVideo格式。
三、音频文件格式
●MID:
数字合成音乐文件。
文件不存储声音波形,而是存储要发给MIDI装置的产生某种声音的指令。
文件较小,容易编辑,适合用作背景音乐。
●WAV:
Windows记录的声音文件格式。
●RA:
即RealAudioclip。
是ProgressiveNetwork公司的RealAudioPlayer或者RealPlayer播放的文件格式。
文件的压缩比较大,声音质量也高。
●PCM:
即PulseCodeModulation。
用脉冲编码调制方式记录的声音文件格式。
●IFF:
Amiga公司的声音文件。
●AU:
Sun和Mac的声音文件。
●AIF:
即AudioInterchangeFileFormat(AIFF)格式声音文件。
是Apple公司和SGI公司的声音文件。
●VOC:
Creative公司Soundblaster声卡的声音文件。
●SND:
NeXT计算机的声音文件格式。
5-2图像处理软件photoshop6.0的介绍
本章将首先浏览Photoshop6.0的工具箱、菜单、控制面板和与之相配套的快捷键,目的是让读者对Photoshop6.0的概貌有一个基本了解。
5-2-1工具箱
Photoshop的工具箱提供了选择、描绘、查看和图形编辑等常用的工具。
在默认情况下,Photoshop工具箱位于窗口的右侧,如果没有,可以单击窗口菜单(Window)下的显示工具箱(ShowTools)命令。
单击工具箱中的图标就可以选取相应的工具。
在一些图标的右下角有一个很小的三角形,这说明它还有与此工具类型相同的隐藏工具。
用鼠标按住可见工具图标,即可显示隐藏工具子菜单,在子菜单内稍微拖动鼠标至要选取的工具上,被选取的工具变亮,松开鼠标即选取了这件工具。
要快速选择一种工具,在键盘上按该工具的快捷键即可,也可以使用快捷键“Shift+字母”。
Photoshop工具箱所有工具的名称如下:
选取工具箱中的工具还有其它方法。
按住Alt键并单击可见工具图标,图标将在这个位置处的可见工具与隐藏工具之间循环切换(矩形选取工具处只有矩形选取工具和椭圆选取工具相互切换,钢笔工具处只有钢笔工具、手绘钢笔工具和磁性钢笔工具相互切换)。
对大多数工具进行选择时,鼠标指针与工具图标相符,这是默认的标准工具指针。
选框、直线和渐变指针的默认显示为“十”字线。
每个默认指针都有不同的热点,即效果或操作开始的位置。
默认指针也可以切换为精确指针,对于大多数工具来说,精确指针显示为“十”字线。
而对于磁性套索和磁性钢笔工具来说,其精确指针则显示为圆圈“0”,表示套索或钢笔的宽度。
使用绘画工具,还可以将指针显示为某一大小的画笔形状。
对于非常小的画笔,画笔形状周围有四个点,表示更高的精度。
要更改一些工具指针的外观,按CapsLock键。
再次按CapsLock键可以恢复到原始设置。
5-2-2菜单栏
Photoshop6.0主窗口中的菜单栏为所有的操作提供菜单控制。
这些菜单可以方便地管理整个主窗口的布局,配置Photoshop环境,获得在线帮助等等。
Photoshop6.0菜单栏与其它Windows程序的菜单栏没有什么区别,相对于Photoshop5.0的菜单只在相应的菜单下增加了一些新选项。
一、文件(File)菜单
文件(File)菜单中包括以下命令:
1.新建(New)用于建立新文件,在该对话框中可以设定文件名和宽高尺寸等信息。
2.打开(Open)用于打开图形文件,在该对话框中可以选择路径及文件格式。
3.以……格式打开(OpenAs)用于打开未知格式的图形文件。
4.打开最近的(OpenRecent)用于打开最近打开过的4个文件,这一功能原来位于文件菜单的最下端。
5.关闭(Close)关闭当前的图形文件,若当前的图形已经修改,在关闭图形时将出现对话框,询问是否保存当前的修改。
若保存当前的修改,则单击Yes,否则单击No。
6.存储(Save)用于存储当前正在编辑的图形文件,若该图形文件在打开后没有修改过,则此命令在File菜单下以反相显示,处于不可用状态。
7.另存储为(SaveAs)把当前正在编辑的图形文件,另存为一个图形文件,原来的图形文件不变。
8.存储为网页(SaveforWeb)把当前正在编辑的图形文件存储为网页。
9.恢复(Revert)将你编辑过但未存盘的图形文件恢复到未编辑时的状态。
10.置入(Place)AdobePhotoshop中可以引入其它程序设计的矢量图形文件,如Adobelllustrator图像处理软件设计的AI格式的文件。
该命令就是用于在当前图形文件中放置EPS和AI格式的矢量图形文件。
11.导入(1mport)该命令项主要用于对扫描仪等输入设备进行选择和管理,允许你将从扫描仪和数字摄像机获取的数字化图形直接导入到Photoshop中。
12.输出(Export)该命令项允许将Photoshop中编辑的图形文件输出到其它配套程序中去。
例如,输入到Adobelllustrator中,输出成Gif格式的文件等。
13.工作流管理(ManageWorkflow)工作流管理是Adobe公司提出的新概念,多个用户借助于工作流可以通过网络协作完成设计任务。
14.自动操作(Automate)此命令的使用同Action面板是相互联系的,可以根据在Action面板中所录制的操作对相同目录下的图像文件进行同样的处理,使其达到相同的效果。
在子菜单中提供了批处理(Batch)、生成Droplet程序(CreateDroplet)、格式转换(ConditionalModeChange)、图标目录(ContactSheetll)、调整尺寸(Fitlmage)、多页PDF文档转换成PSD文件(Multi-PagePDFtoPSD)、图片包装(PicturePackage)和网络图片画廊(WebPhotoGallery)等功能。
15.文件信息(Filelnfo)此命令项将调出“文件信息”对话框。
在对话框中可以为当前图形文件加入一定的文字注释内容。
在位置下拉式列表框中,可以选择不同的选项,为图片加上不同方面的注释内容。
在加入完毕后,单击“保存”按钮存盘,它将存成以.FFO为后缀的文件。
当再次使用时,可以单击“载入”按钮,将所有文件信息再次调入进行编辑。
用该命令可以为图像添加说明文字(Caption)、关键字(Keywords)、代码(Categeties)、作者资料(Credits)、文件来源资料(Origin)和文件版权资料