多媒体视频压缩技术综述.docx
《多媒体视频压缩技术综述.docx》由会员分享,可在线阅读,更多相关《多媒体视频压缩技术综述.docx(72页珍藏版)》请在冰豆网上搜索。
多媒体视频压缩技术综述
论文题目多媒体视频压缩技术综述
指导教师
姓名
时间2012-02-29
摘要
本论文首先系统地介绍了视频压缩编码的基本原理和方法,以及各国际标准化组织提出的压缩标准;其次分析了JPEG和MPEG-4的主要技术,据此提出MPEG-4简单框架编码器的软件实现方案,给出流程图,在VC++环境下用C语言程序实现了JPEG压缩及MPEG-4简单框架的视频压缩功能,采用测试序列验证无误,并对两种标准的压缩比进行试验对比,突出压缩的关键技术为DCT和运动估计算法;接着深入研究了DCT变换、运动估计和补偿算法并进行了优化改进,给出了用于快速匹配块的自适应十字模式搜索算法,并给出了对各种块匹配估计算法的仿真结果。
然后详细介绍了TI公司TMS320C6711DSP的软硬件特性,并在此基础上提出系统的硬件实现方案。
接着介绍了基于系统软硬件环境的移植问题和优化方法,并针对算法移植和仿真过程中的问题进行了说明。
最后就课题设计过程中研究的结果予以总结,并阐述了以后课题研究的要点。
关键词:
视频压缩编码MPEG-4DCT运动估计/补偿技术TMS320C6711
Abstract
Inthisthesis,anintroductiontovideocompressionprincipal,methodsandcentralinternationalvideocodingstandardsisdonefirstly.ThenanalyzingthecoretechniquesofJPEGandMPEG-4andproposingaschemeofMPEG-4SPencoder,thecodingfunctionofJPEGandMPEG-4isachievedinCsuccessfullywithtestsequence;Thencomparethecompressedratiooftwostandards,pointoutthekeyofcompressionisDCTandMotionEstimationalgorithm.Afterwards,studyingtheDCT/MotionEstimation/MotionCompensationalgorithmindetailandgivinganadaptiveroodpatternsearchforfastBlock-Matchingmotionestimation.Thenthesimulationofseveralmotionestimationalgorithmsbasedblock-matchingisgiven.Accordingly,aschemeofaDSP-basedvideocompressionsystemisputforward,withthefeaturesofTI’sTMS320C6711DSP.Atlast,thetransplantandoptimizationareconsideredonthebasisofsoftandhardenvironments,alsothesimulationprocess.
Intheend,thesummarizationaboutthestudyresultisgiven;meanwhile,thefutureresearchpointisprospected.
Keywords:
VideocompressionMPEG-4DCTME/MCTMS320C6711
目录
摘要.............................................................I
ABSTRACT........................................................III
第一章绪论......................................................1
1.1研究背景....................................................1
1.2视频数据压缩的必要性和可行性.................................2
1.3国内外研究现状...............................................3
1.3.1视频压缩的发展历史.........................................3
1.3.2视频压缩的研究现状.........................................3
1.4研究内容和结构安排...........................................5
第二章视频压缩编码原理及JPEG压缩实现............................7
2.1视频压缩编码的基本原理.......................................7
2.2视频压缩编码技术概述.........................................7
2.2.1空域冗余和变换编码..........................................7
2.2.2时域冗余和运动补偿预测.....................................8
2.2.3熵编码......................................................9
2.3JPEG静态压缩算法研究及实现..................................10
2.3.1算法描述与比较.............................................10
2.3.2JPEG编码实现及压缩结果比较................................15
2.3.3小结......................................................17
第三章MPEG-4视频压缩编码算法研究与软件实现....................18
3.1MPEG-4视频编码器的数据结构..................................18
3.2MPEG-4基于VOP的编码原理....................................19
3.2.1形状信息编码.............................................20
3.2.2运动信息编码.............................................20
3.2.3纹理信息编码.............................................20
3.3MPEG-4编码器算法分析及实现.................................21
3.3.1MPEG-4SP级视频所支持的图像格式..........................22
3.3.2MPEG-4SP级编码器结构....................................23
3.3.3MPEG-4SP级编码器的系统流程..............................23
3.3.4MPEG-4SP级编码器实现....................................26
3.3.5实验结果..................................................28
第四章MPEG4编码器软件关键算法的研究及改进.....................30
4.1DCT算法研究...............................................30
4.2DCT快速实现算法-查找表法...................................31
4.3运动估计算法研究.............................................32
4.3.1初始搜索点的选择..........................................33
4.3.2块匹配准则................................................34
4.3.3块匹配估计算法............................................35
4.3.3.1全搜索运动估计算法.....................................35
4.3.3.2三步搜索运动估计算法...................................35
4.3.3.3新的三步搜索(NTSS)算法.................................36
4.3.3.4简单搜索算法...........................................37
4.3.3.5四步搜索(4-StepSearch,4SS)算法........................37
4.3.3.6菱形搜索法(DS).......................................38
4.3.3.7自适应十字模式搜索算法.................................40
4.4仿真结果.....................................................41
第五章MPEG-4视频编码器硬件设计及软件仿真.......................46
5.1引言.........................................................46
5.2TMS320C6711DSP介绍..........................................46
5.2.1TMS320C6711的CPU结构....................................46
5.2.2EMIF接口.................................................48
5.2.3EDMA控制器................................................49
5.2.4HPI接口...................................................49
5.3系统硬件设计方案..............................................50
5.4基于TMS320C67XX的软件开发....................................51
5.4.1基于C67xx开发环境的优化编程...............................52
5.4.2基于C67XX硬件特征的优化措施...............................53
5.5MPEG-4算法在TMS320C6711中的仿真..............................54
5.5.1DSP算法移植关键点的分析...................................55
5.5.2优化调试中的问题及解决....................................56
5.6本章小结......................................................57
第六章结束语.....................................................58
致谢..............................................................61
参考文献..........................................................63
第一章绪论
对图像压缩编码的研究始于50年代,迄今已有五、六十年的历史。
随着计算机和信息网络的发展,人们对信息的需求越来越丰富,尤其是多媒体技术已经渗入人们生活的方方面面,成为人类获得信息的最主要载体。
人们渴望通过各种技术能够在任何时候任何地方方便快捷地获得语音、图像及视频等多媒体信息,因此多媒体信息的计算、存储和传输等也成为人们近年来的研究热点。
图像编码也得到了相应的发展,并且它的地位越来越重要。
本章首先将阐述视频压缩的研究背景及可行性,接着介绍国内外的研究现状,最后给出本论文的内容安排及组织结构等。
1.1研究背景
20世纪90年代,多媒体技术随着人类进入信息时代而得到了迅猛的发展,大信息量的音、视频数据被广泛使用,如常见的VCD、DVD等都是将大量的音视频数据经过处理后供用户使用的。
作为多媒体与网络领域的交叉学科,流媒体技术的应用和研究随着Internet得到了迅速的发展。
视觉信息给人们直观生动的形象,视频传输得到了人们广泛的关注,数字视频的压缩编码技术是Internet视频传输中的关键技术之一。
高清晰度电视(HDTV)是21世纪世界电视领域的发展方向,是一个集数字视频、数字音频、数据和交互式业务于一身的数字传输系统;它使人们能够在家中收看到有影院效果的电视节目并且实现对电视节目的点播。
网络电视(IPTV)是通过电信宽频IP网络传输电视节目的一种电视业务,它能根据用户的选择配置多种多媒体服务功能。
通过IPTV业务,用户可以得到高质量数字媒体服务,可以自由选择带宽IP网的视频节目,实现媒体提供者和媒体消费者的实质性互动。
第三代移动通信技术(3G)开创了无线通信与因特网、视频融合的新时代,而无线视频和无线IP业务必将成为未来无线移动通信业务新的增长点。
压缩技术为这些发展提供一种解决方案,信息的压缩可以节省存储空间、节省CPU处理时间和网络传输时间。
1.2视频数据压缩的必要性和可行性
众所周知,人类所获取的信息有70%来自于视觉,视觉信息因为具有直观性、形象性、确切性、高效率和应用广泛等优点,在多媒体信息中占有重要地位。
但是数字化了的未压缩视频信号的数据量之大是惊人的,如:
Ø用于可视电话QCIF:
176×144×3/2×8×30≈9.1Mbps
Ø用于视频会议CIF:
352×288×3/2×8×30≈37Mbps
Ø用于DVD、SDTV高质量视频流:
720×480/576×3/2×8×60/50≈124Mbps
Ø而用于传输通信的网络带宽是非常有限的:
ØLAN:
10/100Mbps
ØGPRS/CDMA:
(9.06~13.4~15.6~21.4)Kbps/(64~144~384)Kbps
Ø用于存储信息的存储媒质容量也是非常有限的:
ØCD-ROM:
650MB
ØU盘:
512MB
从以上列举的例子可以看出,数字化信息的庞大数据量给存储器的存储容量、通信干线的信道传输率以及计算机的速度都增加了极大的压力。
单纯用扩大存储器容量、增加通信干线的传输率的办法来解决这一问题是不现实的。
数据压缩技术是一个行之有效的方法,通过数据压缩手段把信息数据量降下来,以压缩形式存储和传输,既节约了存储空间,又提高了通信干线的传输效率,同时也使计算机实时处理视、音频信息,保证播放高质量的视、音频节目成为可能。
同时,上述数据压缩过程不仅是必要的而且也是可能的,原因是:
首先,原始图像数据是高度相关的,存在很大的冗余度(如空间冗余、时间冗余、统计冗余、人眼视觉冗余、结构和知识冗余等)。
通过压缩编码去相关,即可以通过减少视频序列间的相关性,用较少的比特数来表示视频内容,降低视频内容中的冗余,从而实现对视频的压缩。
其次,允许图像编码有一定的失真也是视频可以压缩的一个重要原因。
在许多应用场合,并不要求压缩后的图像复原后和原图完全一致,而是允许有一定的失真。
因为这些失真可以利用人的视觉特性,在图像变化不被觉察的条件下减少量化信号的灰度级之类,来提高数据压缩比。
与此同时,视频数据压缩技术的飞速发展也有硬件方面的原因。
随着高速的数字信号处理器(DSP)、超大规模集成电路(VLSI)、超高速集成电路(VHSIC)以及大容量静态/动态存储器的出现,使复杂的算法不再停留于理论阶段,实现了实时地处理更高分辨率和更精美的画质。
1.3国内外研究现状
1.3.1视频压缩的发展历史
传统的压缩编码是以Shannon信息论为出发点,它以经典的集合论为基础,用统计概率模型来描述信源。
编码实体是象素或象素块。
但它未考虑信息接收者的主观特性及事件本身的具体含义、重要程度和引起的后果。
这种基于数据统计、以消除视频数据相关冗余为目的的技术被称为第一代视频编码技术。
压缩编码的发展历程实际上是以Shannon信息论为出发点,不断完善的过程。
第一代视频编码技术并没有考虑信息接收者的主观特性、视频信息的具体含义和重要程度等,只是力图去除数据冗余。
20世纪80年代后期,相关学科的迅速发展和新兴学科的不断出现为图像编码的发展注入了新的活力。
许多学者结合模式识别、计算机图形学、计算机视觉、神经网络、小波分析和分形几何等理论探索图像编码的新途径。
M.Kunt于1985年提出利用人眼视觉特征的第二代图像编码技术,1988年M.Barnsley提出基于迭代函数(IFS,IteratedFunctionSystem)的分形图像编码技术,1989年S.Mallat、I.Faubeche将小波分析理论应用于图像编码,90年代初发展起来基于模型的图像编码方法,即为现在的MPEG-4编码技术。
第二代编码方法充分利用了计算机图形学、计算机视觉、人工智能与模式识别等相关学科的研究成果,为视频(图像)压缩编码开拓出了广阔的前景。
但是由于第二代编码方法增加了分析的难度,所以大大增加了实现的复杂性。
从当前发展情况来看,第二代编码方法仍处于深入研究的阶段。
1.3.2视频压缩的研究现状
20世纪90年代,在国际标准化协会ISO(InternationalStandardizationOrganization)、国际电子学委员会IEC(InternationalElectronicsCommittee)、MPEG(MovingPictureExpertsGroup)和国际电信联合会ITU(InternationalTelecommunicationUnion)等国际组织的领导下,视频数据压缩领域涌现出许多重要的标准。
MPEG的有MPEG-X标准,ITU-T的有H.26X标准。
通常情况下,H.26X系列标准侧重于视频信息的数据压缩效率,以调整该系统在特定的码率下的传输,而MPEG-X标准则倾向于控制视频编码质量。
MPEG是ISO和IEC(国际电工委员会)的一个工作组,始建于1988年,为音视频压缩制订了以下标准:
-MPEG-1,于1992年为工业级标准而设计,其应用主要面向音视频的存储和回3放,适用于不同宽带的设备,如CD-ROM.Video-CD等。
-MPEG-2,制订于1994年,其目标是为了保障高级工业标准的图像质量以及更高的传输率,可适用于HDTV,还可用于为广播、有线电视网、电缆网络以及卫星转播提供广播级的数字视频。
-MPEG-4,1998年12月正式发布,旨在为视、音频数据的通信、存取与管理提供一个灵活的框架及一套开发的编码工具,它用在64Kbps以下的低速率视、音频编码十分有效。
作为第一个面向对象的视频编码标准,MPEG-4的出现具有很强的历史意义。
它的应用广泛,可应用于以下场合:
实时监控;极低比特率下的移动多媒体通信;基于存储和检索的多媒体系统;Internet/Intranet上的视频流与可视游戏;基于面部表情模拟的虚拟会议;DVD上的交互多媒体应用;基于计算机网络的可视化合作实验室场景应用;演播室和电视的节目制作等。
有关MPEG-4的更详细的情况将在第三章中作阐述。
-MPEG-7,MPEG-21,要解决的问题是对日益庞大的图像和声音信息的管理和迅速检索。
VCEG是ITU-T的一个工作组,负责为视频信号在无线电网络和计算机网络的传输制订标准,VCEG制订了H.26X系列。
JVT(JointVideoTeam)是由ITU-T/VCEG(VideoCodingExpertsGroup)和ISO/MPEG两个组织的专家组成的。
他们联合提出了一套最新的国际视频编码标准,ITU-T叫它H.264,ISO叫它MPEG4的Part10。
这套标准的官方名字就是AVC(AdvancedVideoCoding).AVC的设计在编码增益、实现的复杂度和耗费提供了一种新的平衡,使得视频压缩的应用范围更广泛。
图1.1展示了两大国际标准化组织的工作进展图。
H.264是新一代数字视频压缩格式,它能提供连续、流畅的高质量图像。
图1.1进展
国内方面,国家信息产业部科学技术司于2002年6月批准成立了数字音视频编4解码技术标准工作组(简称AVS工作组)。
该工作组的任务是:
面向我国的信息产业需求,联合国内企业和科研机构,制(修)订数字音视频的压缩、解压缩、处理和表示等共性技术标准,为数字音视频设备与系统提供高效经济的编解码技术,服务于高分辨率数字广播、高密度激光数字存储媒体、无线宽带多媒体通讯、互联网宽带流媒体等重大信息产业应用。
1.4研究内容和结构安排
本设计中首先是研究JPEG和MPEG-4标准,熟悉其基本思想、整体框架以及关键技术,深入剖析网上提供的MPEG-4编码器的实现代码,并在VC++6.0的环境下使用纯软件实现JPEG和MPEG-4SP级视频压缩。
其次是熟悉系统硬件结构和软件开发环境CCS2.0的使用,在CCS2.0中仿真软件功能。
最后将Window平台下C版本的视频编码器原型移植到DSP开发环境CCS2.0中仿真,调试程序模块,并总结软件移植的一些思想,为后一步视频压缩算法的选择及优化提供了测试平台。
在算法方面,通过对car样本进行灰度DCT压缩、JPEG和MPEG-4的试验,给出同一压缩质量的压缩比,感性的感受到DCT和运动估计补偿对提高压缩比的重要性。
于是单独有一章讨论视频压缩编码的核心技术——DCT和运动估计块匹配算法。
介绍DCT