数字视频信号源的编码器和解码器的设计说明Word文档下载推荐.docx
《数字视频信号源的编码器和解码器的设计说明Word文档下载推荐.docx》由会员分享,可在线阅读,更多相关《数字视频信号源的编码器和解码器的设计说明Word文档下载推荐.docx(11页珍藏版)》请在冰豆网上搜索。
在压缩的过程中要丢失一些人眼和人耳所不敏感的图像或音频信息,而且丢失的信息不可恢复。
几乎所有高压缩的算法都采用有损压缩,这样才能达到低数据率的目标。
丢失的数据率与压缩比有关,压缩比越小,丢失的数据越多,解压缩后的效果一般越差。
此外,某些有损压缩算法采用多次重复压缩的方式,这样还会引起额外的数据丢失。
(2)无损压缩编码方式:
无损压缩也即压缩前和解压缩后的数据完全一致,多数的无损压缩都采用RLE行程编码算法。
2.2数字视频压缩编码的标准
常用名称
制定机构
发布日期
标准编号
标题
典型应用领域
H.261
ITU-T
1990年
ITU-TH.261
运动图像编码标准
可视和会议电视,窄宽ISDN
MPEG-1
ISO/IEC
1991年
ISO/IEC11172
运动图像和伴音的通用编码第2部分视频
VCD等
JPEC
1992年
ITU-TT.81
ISO/IEC10918
静止图像编码
数码相机、图像库等
MPEG-2
1994年
ITU-TH.262
ISO/IEC13818-2
数字电视传输等
H.263
1995年
ITU-TH.263
多媒体通信等
MPEG-4
2000年
ISO/IEC14496-2
基于对象的视/音频编码第2部分视频
网络/视音频等
JPEG2000
ISO/IEC15444-3
图像库、数字电影等
H.264/AVC
MPEG-4-10
2003年
ITU-TRec.H.264
ISO/IEC14496-10
高级视频编码
数字电视、多媒体通信等
VC-1
SMPTE
2006年
SMPTE421M
电视压缩视频格式和解码处理
数字电视等
AVS
中国国家标委会
GB/T20090-2006
先进视/音频编码第2部分视频
数字电视、网络视频等
表1.数字视频压缩编码标准
3MPEG-2概述
MPEG-2制定于1994年,设计目标是高级工业标准的图象质量以及更高的传输率。
MPEG-2所能提供的传输率在3-10Mbits/sec间,其在NTSC制式下的分辨率可达720X486,MPEG-2也可提供并能够提供广播级的视像和CD级的音质。
MPEG-2的音频编码可提供左右中及两个环绕声道,以及一个加重低音声道,和多达7个伴音声道(DVD可有8种语言配音的原因)。
由于MPEG-2在设计时的巧妙处理,使得大多数MPEG-2解码器也可播放MPEG-1格式的数据,如VCD。
同时,由于MPEG-2的出色性能表现,已能适用于HDTV,使得原打算为HDTV设计的MPEG-3,还没出世就被抛弃了。
(MPEG-3要求传输速率在20Mbits/sev-40Mbits/sec间,但这将使画面有轻度扭曲)。
除了做为DVD的指定标准外,MPEG-2还可用于为广播,有线电视网,电缆网络以及卫星直播(DirectBroadcastSatellite)提供广播级的数字视频。
MPEG-2的另一特点是,其可提供一个较广的围改变压缩比,以适应不同画面质量,存储容量,以及带宽的要求。
对于最终用户来说,由于现存电视机分辨率限制,MPEG-2所带来的高清晰度画面质量(如DVD画面)在电视上效果并不明显,到是其音频特性(如加重低音,多伴音声道等)更引人注目。
3.1系统的定义
MPEG-2系统是将视频、音频及其它数据基本流组合成一个或多个适宜于存储或传输的数据流的规,如图1所示。
由图2可见,符合ITU-R.601标准的、帧次序为I1B2B3P4B5B6P7B8B9I10数字视频数据和符合AES/EBU标准的数字音频数据分别通过图像编码和声音编码之后,生成次序为I1P4B2B3P7B5B6I10B8B9视频基本流(ES)和音频ES。
在视频ES中还要加入一个时间基准,即加入从视频信号中取出的27MHz时钟。
然后,再分别通过各自的数据包形成器,将相应的ES打包成打包基本流(PES)包,并由PES包构成PES。
最后,节目复用器和传输复用器分别将视频PES和音频PES组合成相应的节目流(PS)包和传输流(TS)包,并由PS包构成PS和由TS包构成TS。
显然,不允许直接传输PES,只允许传输PS和TS;
PES只是PS转换为TS或TS转换为PS的中间步骤或桥梁,是MPEG数据流互换的逻辑结构,本身不能参与交换和互操作。
由系统的定义,可知MPEG-2系统的任务。
系统的要点是根据数字通信信息量可以逐段传输的机理,将已编码数据流在时间上以一定重复周期结构分割成不能再细分的最小信息单元,这个最小信息单元就定义为数据包,几个小数据包(DataPacket)又可以打包成大数据包(DataPack)。
用数据包传输的优点是:
网络息可占用不同的连接线路和简单暂存;
通过数据包交织将多个数据流组合(复用)成一个新的数据流;
便于解码器按照相应顺序对数据包进行灵活地整理。
从而,数据包为数据流同步和复用奠定了基础。
因此,MPEG-2系统规不仅采用了PS、TS和PES三种数据包,而且也涉及PS和TS两种可以互相转换的数据流。
显然,以数据包形式存储和传送数据流是MPEG-2系统的要点。
为此,MPEG-2系统规定义了三种数据包及两种数据流。
图2.MPEG-2系统框图
3.2MPEG-2的型和级
MPEG-2按照不同的型和不同的级的组合,有20种组合方式,但是在实际应用中只有其中的11种组合可以应用。
MPEG-2型和级的定义及其组合如图表3所示,表中越是右上方的编码档次越高,MPEG-2标准规定,凡是能解码某一组合点上比特流的解码器,必须能解码其左方和下方组合点上的比特流,这是MPEG-2标准所要求的解码兼容性能。
型profile
级level
简单型SP
主型MP
信杂比可级
SNRP
空间可分级
SSP
高型HP
高级(HL)
1920×
1080×
30
25
——
MPHL
——
HPHL
全部层
底层
高1440级
(H1440L)
1440×
MPH1440L
SSPH1440L
HPH1440L
主级(ML)
720×
480×
576×
SPML
(无B帧)
MPML
SNPML
HPML
低级(LL)
352×
248×
MPLL
SNPLL
图表3.MPEG-2的型和级
3.3MPEG-2的编码码流分为六个层次
从上至下依次为:
视频序列层(Sequence),图像组层(GOP:
GroupofPicture),图像层(Picture),像条层(Slice),宏块层(MacroBlock)和像块层(Block)。
除宏块层和像块层外,上面四层中都有相应的起始码(SC:
StartCode),可用于因误码或其它原因收发两端失步时,解码器重新捕捉同步。
因此一次失步将至少丢失一个像条的数据。
(1)序列指构成某路节目的图像序列,序列起始码后的序列头中包含了图像尺寸,宽高比,图像速率等信息。
。
(2)序列层下是图像组层,一个图像组由相互间有预测和生成关系的一组I、P、B图像构成,但头一帧图像总是I帧。
GOP头中包含了时间信息。
(3)图像组层下是图像层,分为I、P、B三类。
PIC头中包含了图像编码的类型和时间参考信息。
(4)图像层下是像条层,一个像条包括一定数量的宏块,其顺序与扫描顺序一致。
MPML中一个像条必须在同一宏块行。
(5)像条层下是宏块层。
MPEG-2中定义了三种宏块结构:
4:
2:
0宏块4:
2宏块和4:
4宏块,分别代表构成一个宏块的亮度像块和色差像块的数量关系。
(6)宏块层之下是像块层,像块是MPEG-2码流的最底层,是DCT变换的基本单元。
MPML中一个像块由8x8个抽样值构成,同一像块的抽样值必须全部是Y信号样值,或全部是Cb信号样值,或全部是Cr信号样值。
另外,像块也用于表示8x8个抽样值经DCT变换后所生成的8x8个DCT系数。
3.4MPEG-2编码器原理
图4.MPEG-2压缩编码原理框图
MPEG-2图像压缩的原理是利用了图像中的两种特性:
空间相关性和时间相关性。
一帧图像的任何一个场景都是由若干像素点构成的,因此一个像素通常与它周围的某些像素在亮度和色度上存在一定的关系,这种关系叫作空间相关性;
一个节目中的一个情节常常由若干帧连续图像组成的图像序列构成,一个图像序列中前后帧图像间也存在一定的关系,这种关系叫作时间相关性。
这两种相关性使得图像中存在大量的冗余信息。
如果我们能将这些冗余信息去除,只保留少量非相关信息进行传输,就可以大大节省传输频带。
而接收机利用这些非相关信息,按照一定的解码算法,可以在保证一定的图像质量的前提下恢复原始图像。
一个好的压缩编码方案就是能够最大限度地去除图像中的冗余信息。
(1)MPEG-2中编码图像被分为三类,分别称为I帧,P帧和B帧
①I帧图像采用帧编码图(ICP)
利用了单帧图像的空间相关性,而没有利用时间相关性。
I帧主要用于接收机的初始化和信道的获取,以及节目的切换和插入,I帧图像的压缩倍数相对较低。
I帧图像是周期性出现在图像序列中的,出现频率可由编码。
器选择特点是:
数据量最大;
帧中等程度压缩;
无运动预测,可采用自相关性,即帧相邻像素、相邻行的亮度、色度信号都具有渐变的空间相关性,可作静止图像处理,无条件传送;
图像可随机进入压缩图像数据序列,进行编码。
②P帧图像采用前向预测编码图(PCP)
P帧图像采用前向时间预测,可以提高压缩效率和图像质量。
P帧图像中可以包含帧编码的部分,即P帧中的每一个宏块可以是前向预测,也可以是帧编码。
P图的特点是:
本身是前I图或P图的前向预测(FP-ForwardPrediction)结果,也是产生下一个P图的基准图像;
高编码效率,与I图相较,可提供更大的压缩比;
前一个P图是下一个P图补偿预测的基准,如果前者存在误码,则后者会将编码误差积累起来、传播下去。
③B帧图像采用双向预测编码图
目前对B图有两种趋同的理解:
其一,B图是同时以前面的I图或P图和后面的P图或I图为基准进行运动补偿预测所产生的图像,称为双向预测编码图。
其二,由于帧序列相邻帧画面间的运动部分具有连续到时间相关性,可将当前画面看成是前一画面某一时刻图像的位移,当然位移方向及幅值在帧各处未必相同,只要用前面最近时刻的I图或P图及代表运动的位移信息,便可预测出当前图像,称为前向预测(FP)。
值得注意的是,由于B帧图像采用了未来帧作为参考,因此MPEG-2编码码流中图像帧的传输顺序和显示顺序是不同的。
4数字视频压缩解码
4.1MPEG-2解码
图5.MPEG-2解码框图
由图5可见,接受到的码流经过TS流解复用和视/音频PES包解复用后输出视频基本流(ES)和运动矢量(MV)。
ES经饭量化(IQ)和反DCT(IDCT)后输出重建的宏块差值△MB。
解码框图中没有复杂的运动估计电路,它直接用码流中传输来的运动矢量(MV)进行运动补偿,从帧储存器中读出匹配宏块MB0,在加法器中与宏块差值△MB相加,还原出相应的P、B图像块。
在帧重排得到一组GOP解码图像后,重排成编码时输入显示图像的原始序列。
由于编码器中都有帧重排,结果使显示图像比原始图像产生一定的延时,相对于声音编码会导致画面滞后于声音,故需相应的延时补偿。
MPEG-2中编码与解码电路不是一一对应的,编码复杂,解码简单。
因为解码所需的许多参数如运动预测值和量化矩阵等都在传输码流中以规定的句法元素格式提供给接收端,由解码器直接使用就可以。
因此,不同厂家的设计人员可以设计制造各具特点的编解码器,它们可能各有差异,然而,任一个解码器应该对任何编码器给出的码流都能正确地解码。
4.2MPEG-2视频压缩方案中包含以下关键技术环节
(1)余弦变换DCT
DCT是一种空间变换,在MPEG-2中DCT以8x8的像块为单位进行,生成的是8x8的DCT系数数据块。
DCT变换的最大特点是对于一般的图像都能够将像块的能量集中于少数低频DCT系数上,即生成8x8DCT系数块中,仅左上角的少量低频系数数值较大,其余系数的数值很小,这样就可能只编码和传输少数系数而不严重影响图像质量。
(2)量化器
量化是针对DCT变换系数进行的,量化过程就是以某个量化步长去除DCT系数。
量化步长的大小称为量化精度,量化步长越小,量化精度就越细,包含的信息越多,但所需的传输频带越高。
不同的DCT变换系数对人类视觉感应的重要性是不同的,因此编码器根据视觉感应准则,对一个8x8的DCT变换块中的64个DCT变换系数采用不同的量化精度,以保证尽可能多地包含特定的DCT空间频率信息,又使量化精度不超过需要。
DCT变换系数中,低频系数对视觉感应的重要性较高,因此分配的量化精度较细;
高频系数对视觉感应的重要性较低,分配的量化精度较粗,通常情况下,一个DCT变换块中的大多数高频系数量化后都会变为零。
(3)之型扫描与游程编码
DCT变换产生的是一8x8的二维数组,为进行传输,还须将其转换为一维排列方式。
有两种二维到一维的转换方式,或称扫描方式:
之型扫描(Zig-Zag)和交替扫描,其中之型扫描是最常用的一种。
由于经量化后,大多数非零DCT系数集中于8x8二维矩阵的左上角,即低频分量区,之型扫描后,这些非零DCT系数就集中于一维排列数组的前部,后面跟着长串的量化为零的DCT系数,这些就为游程编码创造了条件。
游程编码中,只有非零系数被编码。
一个非零系数的编码由两部分组成:
前一部分表示非零系数前的连续零系数的数量(称为游程),后一部分是那个非零系数。
这样就把之型扫描的优点体现出来了,因为之型扫描在大多数情况下出现连零的机会比较多,游程编码的效率就比较高。
当一维序列中的后部剩余的DCT系数都为零时,只要用一个“块结束”标志(EOB)来指示,就可结束这一8x8变换块的编码,产生的压缩效果是非常明显的。
(4)熵编码
量化仅生成了DCT系数的一种有效的离散表示,实际传输前,还须对其进行比特流编码,产生用于传输的数字比特流。
简单的编码方法是采用定长码,即每个量化值以同样数目的比特表示,但这种方法的效率较低。
而采用熵编码可以提高编码效率。
熵编码是基于编码信号的统计特性,使得平均比特率下降。
游程和非零系数既可独立的,也可联合的作熵编码。
熵编码中使用较多的一种是霍夫曼编码,MPEG-2视频压缩系统中采用的就是霍夫曼编码。
霍夫曼编码中,在确定了所有编码信号的概率后生产一个码表,对经常发生的大概率信号分配较少的比特表示,对不常发生的小概率信号分配较多的比特表示,使得整个码流的平均长度趋于最短。
(5)信道缓存
由于采用了熵编码,产生的比特流的速率是变化的,随着视频图像的统计特性变化。
但大多数情况下传输系统分配的频带都是恒定的,因此在编码比特流进入信道前需设置信道缓存。
信道缓存是一缓存器,以变比特率从熵编码器向里写入数据,以传输系统标称的恒定比特率向外读出,送入信道。
缓存器的大小,或称容量是设定好的,但编码器的瞬时输出比特率常明显高于或低于传输系统的频带,这就有可能造成缓存器的上溢出或下溢出。
因此缓存器须带有控制机制,通过反馈控制压缩算法,调整编码器的比特率,使得缓存器的写入数据速率与读出数据速率趋于平衡。
缓存器对压缩算法的控制是通过控制量化器的量化步长实现的,当编码器的瞬时输出速率过高,缓存器将要上溢时,就使量化步长增大以降低编码数据速率,当然也相应增大了图像的损失;
当编码器的瞬时输出速率过低,缓存器将要下溢出时,就使量化步长减小以提高编码数据速率。
(6)运动估计
运努估计使用于帧间编码方式时,通过参考帧图像产生对被压缩图像的估计。
运动估计的准确程度对帧间编码的压缩效果非常重要。
如果估计作的好,那么被压缩图像与估计图像相减后只留下很小的值用于传输。
运动估计以宏块为单位进行,计算被压缩图像与参考图像的对应位置上的宏块间的位置偏移。
这种位置偏移是以运动矢量来描述的,一个运动矢量代表水平和垂直两个方向上的位移。
运动估计时,P帧和B帧图像所使用的参考帧图像是不同的。
P帧图像使用前面最近解码的I帧或P帧作参考图像,称为前向预测;
而B帧图像使用两帧图像作为预测参考,称为双向预测,其中一个参考帧在显示顺序上先于编码帧(前向预测),另一帧在显示顺序上晚于编码帧(后向预测),B帧的参考帧在任何情况下都是I帧或P帧。
(7)运动补偿
利用运动估计算出的运动矢量,将参考帧图像中的宏块移至水平和垂直方向上的相对应位置,即可生成对被压缩图像的预测。
在绝大多数的自然场景中运动都是有序的。
因此这种运动补偿生成的预测图像与被压缩图像的差分值是很小的。
4.3声音图像要同步显示
由于时分多路复用中的位时隙、路时隙、帧之间具有严格的时间关系,这就是同步。
区分各路信号以此为据。
为了恢复节目,先对ES进行解码。
声音、图像信号的重现需要同步显示,从而要求收发两端数据流要达到同步。
为此,MPEG-2系统规通过在数据中插入时间标志来实现:
SCR或PCR为重建系统时间基准的绝对时标;
在有效PS和TS产生前,已插入PES的DTS和PTS为解码和重现时刻的相对时标。
4.4数字图像质量的主观评价
主观评价的条件包括:
评价小组结构,观察距离,测试图像,环境照度和背景色调等。
评价小组由一定人数观察人员构成,其中专业人员与非专业人员各占一定比例。
观察距离为显示器对角线尺寸的3-6倍。
测试图像有若干具有一定图像细节和运动的图像序列构成。
主观评价反映的是许多人对图像质量统计评价的平均值。
总结
本次课程设计让我对现代电视机原理有了更进一步的熟悉,主要了解了数字电视的优点和发展概况,掌握数字电视的基本组成。
熟悉视频压缩编码的各种方法,掌握MPEG-2编码器原理和视频压缩解码原理。
实际操作和课本上的知识有很大联系,但又高于课本,应该把课本上所学到的知识和实际联系起来。
通过课程设计,不但巩固了所学知识,也使我们把理论与实践从真正意义上结合起来,增强了学习的兴趣,考验了我们借助互联网络搜集、查阅相关文献资料,和组织材料的综合能力。
致
通过本次课程设计,我学到了很多新的知识,让我了解到理论和实践是分不开的,同时也发现了自己的不足。
在设计过程中,老师在百忙中对我的设计进行了指导。
老师首先细致地为我解题;
当我迷茫于众多的资料时,他又为我提纲挈领、梳理脉络,使我确立了本文的框架。
感老师对我的课程设计不厌其烦的细心指点。
我才能更快更准确地完成。
在以后的学习中,只有把所学的理论知识与实践相结合起来,从理论中得出结论,从而提高自己的实际动手能力和独立思考的能力。
而且我还从老师那里学到了严谨、务实、认真的工作态度和极强的敬业精神。
我再次为老师的耐心付出表示感。
参考文献
[1].秀华.现代电视机原理[M].高等教育,2008.
[2].裴昌辛.电视原理与现代电视系统[M]..电子科技大学,1997.
[3].坚勇.电视原理与接收技术[M].:
国防工业,2007.
[4].达.数字电视技术[M].:
电子工业,2007.
[5].解玉琢.MPEG-2运动图像编码国家标准及MPEG的新进展[M].:
清华大学,2002.