数字视频水印和相关理论基础.docx

上传人:b****5 文档编号:28111310 上传时间:2023-07-08 格式:DOCX 页数:41 大小:952.82KB
下载 相关 举报
数字视频水印和相关理论基础.docx_第1页
第1页 / 共41页
数字视频水印和相关理论基础.docx_第2页
第2页 / 共41页
数字视频水印和相关理论基础.docx_第3页
第3页 / 共41页
数字视频水印和相关理论基础.docx_第4页
第4页 / 共41页
数字视频水印和相关理论基础.docx_第5页
第5页 / 共41页
点击查看更多>>
下载资源
资源描述

数字视频水印和相关理论基础.docx

《数字视频水印和相关理论基础.docx》由会员分享,可在线阅读,更多相关《数字视频水印和相关理论基础.docx(41页珍藏版)》请在冰豆网上搜索。

数字视频水印和相关理论基础.docx

数字视频水印和相关理论基础

第1章绪论

1.1课题研究背景

随着社会的不断进步和信息技术的不断发展,各种形式的多媒体数字作品纷纷以网络形式发表,然而数字作品的便利性和不安全性是并存的,它可以低成本、高速度地被复制和传播,这样就为创造者和使用者都提供了很大的便利,但这些特性也容易被盗版者所利用,数字水印技术的研究就是在这种应用要求下迅速发展起来的。

视频信息中包含着较多不同于图像的特殊信息,这些特殊信息大大影响了传统的数字水印技术在视频水印方面的应用。

随着目前数字视频产品等多媒体信息的大量使用,市场上也迫切需要对数字视频产品进行加密保护。

然而由于水印嵌入时必须考虑到如何更好地与视频编码结合起来,而视频编码又因为不断的发展而会发生变化,新发展的一些视频编码关键技术可能会限制水印的嵌入技术的于这些原因,使得在数字视频产品中要嵌入合适的水印难度比较大;而另一方面针对于视频的更加精确的人眼视觉模式还没有完全地建立起来,没有一个很好的标准在视频中找一个较好的区域进行水印的嵌入,因此在数字视频产品中嵌入水印的方法选择上受到了较大的限制。

也正因为还有很多技术上的工作没有得到很好的解决,而数字视频水印技术又将应用于越来越多的地方,这就给研究工作带来许多的机遇,同时也更是一种挑战。

Caronni于1993年最早提出了“数字水印”的概念,该概念的提出引起了学术界、电子出版界的极大兴趣,之后该技术被广泛地应用于图像、音视频等其他数字媒体。

因为它在隐含标注、版权保护、真伪鉴别和秘密通信等领域有着广泛的应用前景,因此成为一个日益重要的研究领域。

1.2研究的目的与意义

研究数字视频水印技术的目的与意义在于可以有效的实现网络环境中数字视频作品的版权保护和认证,面对人类社会的数字化时代,在网络交流日益普及和电子商务逐渐启动的今天,数字视频作品的版权保护和认证问题及数字信息的安全传输问题是在人们面前需要迫切解决的问题。

而数字视频水印技术将是解决这类问题的一种最有效和最有潜力的技术,多媒体数字水印系统软件的开发具有显著的经济效益和社会效益,对于规范数字化市场,促进信息产业的健康持续发展极为重要的意义。

数字水印技术的发展虽然已经有二十余年的历史,对数字产品的版权保护成为一个新的信息安全问题。

之前对数字信息和数据的保护一直使用的传统手段是加密技术。

但是加密技术存在比较明显的缺陷,就是它只能在传输数据的过程中起到保护作用,在数据被接收或解密之后就不再具备保护作用了,所以加密技术只能够满足有限的要求。

并且取得了长足的进步,但是水印技术还没有成为数字内容安保体系中的有效组成部分,数字水印技术面临的难题是各种各样的攻击手段。

比如几何攻击,包括旋转、平移、缩放、扭曲、剪裁等,即使是很小程度上的几何攻击,也可能会改变空间位置的同步关系,对于很多算法来说,一旦破坏了载体和水印的同步性,就很难正确提取出水印信息。

比如共谋攻击,几个非法用户联合起来就能够去除载体中的水印信息,而躲过检测者的跟踪。

因此,数字水印是一个正在发展的课题,重难点就在于怎样提高数字水印的鲁棒性。

今后,数字水印技术的研究将着重于如何完善数字水印理论以及提高数字水印算法鲁棒性、安全性等性能,研究其不可见性和鲁棒性以及在应用中的抗攻击能力之间的平衡等方面。

设计出强安全性、高鲁棒性的数字水印系统和算法是当前水印技术领域急需解决的问题。

最初对数字水印技术的研究主要集中在图像水印方面。

最近几年来,因为数字视频产品的大量出现,对数字视频产品进行版权保护的需求日益强烈,基于数字视频的水印技术研究成为水印技术研究的一大热点。

由于视频数据占据的内存容量都比较大,所以通常我们都是采用压缩数据格式进行交流传播或者存储,这就使得基于压缩标准的压缩视频水印技术研究成为了视频水印研究的一个重点。

1.3研究现状分析

数字视频水印的发展基本上与图像水印的发展同步的,从提出图像水印的概念开始,数字视频水印的概念也随之提出,随着几年的DVD等视频产品的普及,反而对数字视频水印产品的要求更为迫切,数字视频水印研究是数字水印研究的一个热点。

密码学,纠错编码,信息论,扩频通信,信号处理等已经充分运用到视频水印系统,现有的视频水印技术从嵌入策略上可以分为三类:

第一类:

水印直接嵌入到原始视频流中,然后进行视频编码。

如:

空域,变换域。

此类方案的优点是:

水印嵌入的方法比较多,原则上数字水印方案均可以应用于此。

缺点是会增加视频码流的数据比特率,经压缩后会丢失水印,降低视频质量,对于已压缩的视频,需要先进行解码,然后嵌入水印后再重新编码。

第二类:

水印嵌入到编码阶段离散余弦(DCT)域中的量化系数中。

此类方案的优点是水印仅嵌入在DCT系数中,不会增加视频流的数据比特率,易设计出抵抗多种攻击的水印,但缺点是会降低视频的质量,因为一般它也有一个解码、嵌入、再编码的过程。

第三类:

水印直接嵌入到压缩比特流中。

此类方案的显著优点是没有解码和再编码的过程,因而不会造成视频质量的下降,

同时计算复杂度低。

缺点是由于压缩比特率的限制而限定了嵌入水印的数据量的大小。

1.4本文主要研究内容

本文是基于扩频的数字视频水印技术研究,以鲁棒性视频水印技术为研究对象,以提高水印的不可见性和鲁棒性为研究目的。

通过查阅国内外大量关于数字水印的文献资料,总结分析视频水印的特征以及视频水印的特殊要求,在对视频水印相关概念和技术进行学习和总结后,主要完成了以下工作:

(1)研究了视频水印的主要特征,分析了视频水印所特有的特征,学习了扩频通信的原理,研究了水印的生成过程。

学习了压缩标准以及结合压缩标准嵌入水印的算法。

研究了人眼视觉模型。

(2)由于视频的I帧的离散余弦变换DCT的直流系数DC是一个始终在视频系统中存在并且很鲁棒的参数,就是将扩频调到后的水印信息加到I帧的DCT的直流系数中,在DCT的直流系数DC上加入水印。

通过缩小放大攻击,放大缩小攻击,裁剪攻击,噪声攻击四种攻击类型进行仿真,并通过IDCT变换提取水印,通过实验观察这种方法的抗攻击性。

(3)通过人类视觉系统模型的学习,以及压缩标准和扩频技术的学习。

在此基础上提出了基于扩频的自适应视频水印算法,详细介绍了算法的基本思想及设计步骤,基于扩频的自适应视频水印处理算法对视频的图像进行分块,同时考虑帧内和帧间的信息,根据运动信息和区域复杂度对视频的图像块进行分类和处理。

通过分析,人的研究对于运动物体的感知略于对静止物体的感知,对快速运动的场景分辨略于快速运动,这样使得水印嵌入的位置自适应于人类视觉系统。

通过嵌入不同强度的水印,对比提取出水印的抗攻击性。

最后通过四种类型的攻击进行仿真。

实现与基于扩频的DCT域数字视频水印的对比。

1.5本文结构

本文主要通过5个章节进行介绍,分别如下:

第一章首先介绍了基于扩频的数字视频水印技术的研究背景,研究意义和研究目的,最后对数字视频水印技术研究现状进行分析。

第二章主要对数字视频水印进行介绍,包括数字视频水印的特征,分类及数字视频水印的特殊性。

最后对数字视频水印技术进行概述。

第三章主要为基于扩频的数字视频水印技术的相关理论基础,包括扩频原理,m序列,数字视频水印的生成过程。

以及对DCT,MPEG,人眼视觉性能和水印攻击类型进行介绍。

第四章首先对基于扩频的DCT视频水印技术的实现过程进行介绍。

最后通过攻击实验仿真并对结果进行分析。

第五章首先对基于扩频的自适应视频水印技术的实现过程进行介绍。

最后通过加入不同强度的水印进行仿真,并通过攻击实验仿真对实验结果分析。

最后进行文章总结。

1.6本章小结

本章的主要内容为概述部分。

简要介绍了本文的研究背景,本文的研究意义和研究目的,并对数字视频水印技术研究现状进行分析,在此基础上提出了本文相应的研究内容以及本文的结构。

第2章数字视频水印和相关理论基础

数字视频水印顾名思义就是加载在数字视频上的水印,主要是对数字视频作品进行版权保护,从而确保版权所有者的合法利益。

在现实生活中,数字视频己成为大众生活中不可或缺的娱乐方式,而相应的版权保护技术尚未发展成熟,这就使得以数字水印为重要组成部分的数字产品版权保护技术的应用研究更为迫切。

为了保护版权可以在数字视频内容中嵌入水印信号,以此作为版权保护的依据。

视频水印从实现算法来说与静止图像水印并无根本的区别,许多图像水印的算法都可以直接移植到视频水印中去。

视频水印与图像水印最大的区别就是可用的信号空间,也就是能嵌入的水印数据容量。

对于图像而言,嵌入水印数据容量是十分有限的。

这使得许多研究者在图像水印中尽量应用HVS模型,在不牺牲图像质量的前提下,嵌入一个稳健性尽量好的水印,且总希望能嵌入更多的水印信息。

对于视频而言,可用的信号空间就大的多,水印数据可以分散到连续的画面上,对单幅画面隐藏水印信息的容量要求不高。

但值得注意的是,视频水印算法在多数情况下有实时性的要求,即能处理连续的帧序列,因此算法还必须具有时间上的有效性,有效性以不影响视频的正常播放质量为前提。

因为视频水印可以根据视频本身的数据连续性来适应水印数据的大小,所以从水印容量的角度来看,数字视频是隐藏大量水印信息的最佳载体。

但由于空间域掩蔽效应等特性在内的更为精确的人眼视觉模型尚未完全建立,使视频水印技术相对于图像水印技术发展滞后,同时现有的标准视频编码格式又造成水印技术引入上的局限性。

另一方面,由于一些针对视频水印的特殊攻击形式(如帧重组、帧删除、帧间组合等)的出现,为视频水印提出一些区别于静止图像水印的独特要求。

2.1数字视频水印的介绍

2.1.1视频水印的主要特征

由于数字视频是连续播放的,相邻画面之间内容有高度的相关性,并且还存在动态编解码的过程。

因此视频水印与图像水印在某些要求上有明显的不同,它还有一些图像水印不具备的特征,但总的特征可以概括为:

⑴安全性。

即水印被嵌入视频后,非授权人不能将其删除掉。

只要不知道确定的参数,即使知道水印算法也不能将水印移除。

⑵稳健性。

视频水印应该能抵抗无意或故意的攻击,这些攻击包括信号叠加、滤波、剪切、编码、压缩、模数转换和回放等。

视频信号嵌入水印后不会影响到计算复杂度。

计算复杂度的核心是确保水印的实时性和可操作性。

计算复杂度越低,水印的可实用性越强,但必须要保证水印有合乎要求的稳健性。

⑶视频速率的恒定性。

即水印加入后不能增加视频比特流的速率,必须服从传输信道规定的带宽限制。

如果嵌入水印后增加了播放的速率,解码出的声音和视频图像则有可能不同步,引起失真,这是应当避免的。

⑷同步检测机制。

提取水印时应有严格有效的同步检测机制来确保水印的正确恢复。

在进行水印算法设计时,就必须考虑到要有准确可靠的同步提取和同步丢失检测及再次同步的机制。

⑸快速嵌入/检测:

因为视频的数据量大而且有实时性的要求,所以算法必须在很短的时间内完成。

⑹盲检测。

水印检测原则上不能用原始视频数据,这是因为在检测时使用原始视频会大大增加运算复杂度,而且利用原始视频来检测水印也是不现实的。

⑺水印容量:

对于视频水印,我们规定水印容量为在单位时间内嵌入水印信息的数据量。

通常我们要求能够有尽量高的嵌入水印速率。

一个水印系统能够嵌入水印信息的最大理论值可以从信息论的角度计算出来。

2.1.2视频水印的分类

可以从不同的角度对数字视频水印进行分类。

我们知道,数字视频水印的提取过程与图像水印的提取过程有很大的不同,图像水印的提取过程是静态的,而视频水印的提取过程在时间上是连续的,它是在连续帧上进行提取的,提取出的水印可以是文字、图像、连续语音信号和同时可播放的视频信号,因此可以根据嵌入视频水印的内容不同将其分类。

1)按嵌入域分类,主要可分为空域(时域)方法及变换域(频率域)方法。

空域替换法是用待嵌入的信息替换载体信息的冗余部分,一种简单的方法就是变换域方法就是在宿主的某个变换域,如小波域中嵌入信息,除了静止图像上变换域中嵌入水印的优点外,还能很好地与视频压缩标准兼容。

2)按载体的数据域分类,包括基于原始视频方法和基于压缩视频方法。

基于原始视频的水印算法,是对未经编码的视频流数据进行处理,在原始视频中嵌入水印。

基于压缩视频的水印算法,则与某种视频压缩标准如常见的MPEG-1,MPEG-2,MPEG-4相结合,在编码视频中嵌入水印。

在压缩视频中嵌入和提取水印,既可以在视频编解码器中进行,也可以作为单独的模块,直接在编码视频流上进行。

前者需要修改视频编解码过程,在编码器中加入水印嵌入和提取功能,适用于可以直接介入视频编码过程的情况。

例如:

采用自己的编码器,对摄像头捕获的原始视频流进行编码。

后者不需要修改视频编码器,但是需要对编码视频流进行分析,在压缩码流中找出需要嵌入水印的数据并完成水印的嵌入,适用于不能直接介入视频编码的过程,而只能得到视频流情况:

在第三方制作的视频流中嵌入版权信息。

在压缩域内的水印嵌入(直接在压缩比特流中插入水印)优势在于水印嵌入程序可以处理压缩的视频流,它与未压缩的视频流相比具有较低的数据率。

水印嵌入以后也不必再进行重新压缩,这对于实时水印嵌入技术来说是非常重要的。

为了在压缩域中嵌入水印,水印嵌入程序必须分析视频流以识别水印嵌入所需的合适的结构,并修改压缩流以嵌入水印。

采用块运动补偿视频压缩技术进行压缩处理过的水印流,部分原因是大多数现代视频压缩标准(包括H.261,H.263+,MPEG-l,MPEG-2,以及部分MPEG-4均采用块运动补偿技术以充分利用视频中的时间和空间冗余信息。

这些压缩技术的共同特征包括:

离散余弦变换,以块和宏块为单位进行编码以及运动矢量。

当然,一些图像采用帧内编码(不使用时间预测编码),而一些图片则使用一个预先解码的图片作为预测器进行编码。

从技术特性来看,这两种方法还可作进一步的细分:

(1)基于原始视频水印方法:

按嵌入域分,一些方法直接在原始视频数据中嵌入水印,如Hartuang和Kalker称为空域法。

另一些方法先对原始视频数据进行某种变换,如DCT变换,小波变换,或傅立叶变换,然后在变换域中嵌入水印,称为频域法。

(2)基于压缩视频水印方法:

按嵌入位置分,一些在变换系数上嵌入水印,这些方法主要是借鉴了图像的频域水印技术;另一些方法在运动向量中嵌入水印。

频域水印有三种处理方法:

第一种方法,将视频流看作一个三维信号,其中两维在空间上,一维在时间上,对其进行3维变换,然后进行水印处理。

第二种方法,将视频流看成是静态图像的序列,采用图像水印技术进行处理,因此有很多文献声称它们的算法适合视频序列。

第三种方法,按块进行频域变换,由于视频编码标准中也是按块进行频域变换,因此这种方法大都是和视频编码器相结合进行,属于压缩视频水印。

目前,许多学者普遍认为变换域水印具有更好的稳定性,因此人们对视频水印的研究大多数相对集中于后者,如视频采用MPEG-2,MPEG-4压缩编码处理都是在变换域中进行的。

3)按密钥分类,如嵌入和提取采用相同的密钥,则称其为对称水印,否则为非对称水印。

4)按水印的特性分类可以将数字水印分为鲁棒水印,脆弱水印和半脆弱水印。

5)按水印的可见性分为可见性水印和不可见性水印。

现在一般研究不可见性水印。

2.1.3视频水印的特殊性

除了具有一般数字水印技术所具有的特征以外,由于数字视频不仅仅是一个在规则间隔时间内显示的图像序列,可能影响水印技术的一些视频特征包括:

(1)连续帧之间具有很大的空间相关性。

多数情况下,连续的视频帧不是相互独立的,相反具有较大的相似性。

由于帧之间存在大量的数据冗余和以及帧内冗余,视频水印很容易遭受盗版攻击,包括帧平均、帧丢失、帧交换、静态分析等等。

(2)在所有帧中嵌入相同的水印可能会不安全,因为攻击者可能会掌握大量有关水印结构的知识去估计和删除水印。

(3)嵌入水印一定不能显著地增加带水印视频流的数据率,特别是在带宽资源非常有限的场合。

(4)现场对内容进行水印标记,嵌入复制控制信息和嵌入指纹进行内容跟踪等都要求嵌入实时水印。

其它的一些应用如检测版权保护信息和假冒视频产品的认证,也要求实时水印检测。

由于视频的上述特殊性质,它对视频水印方案的设计还有如下一些特殊的要求:

(1)实时处理性,水印嵌入和提取应具有低复杂度。

然而不同的应用有不同的要求。

如果水印用于审计追踪,每个接收端都必须提取水印,则水印提取应该容易。

如果为不同的接收者嵌入身份标识,水印处理在大量的分布视频序列上进行,因此为了考虑水印上所有可能的攻击,水印提取可能比较复杂,而水印嵌入在这种情况下复杂度应该低。

(2)随机检测性,可以在视频的任何位置,短时间内检测出水印。

随即检测性比实时性具有更严格的要求:

一个水印方案是实时的,但是如果只能从视频的开始位置按播放顺序一步一步检测出水印,则不具有随机检测性。

如果跳转到视频的任何一个位置,也能够检测出水印,则具有随机检测性。

(3)与视频编码标准相结合,视频数据由于其数据量极大,在存储传播中通常要对其进行压缩,现在最常用的视频压缩编码标准是MPEG-1,MPEG-2和MPEG-4。

如果在压缩视频中嵌入水印,很显然要与视频的压缩编码标准相结合。

如果是在原始视频中嵌入水印,由于水印嵌入是利用视频的冗余数据来携带信息,而视频压缩编码标准则需要去除视频中的冗余数据,如果不考虑视频压缩编码标准而盲目地嵌入水印,则嵌入的水印很可能在编码过程中就完全丢失了。

(4)盲检测和较强的鲁棒性,使用原始宿主信息,更有利于检测和提取水印信息。

但是,检测用到的原始宿主信息容易暴露给恶意的攻击者。

而且在某些应用中并不能获得原始的宿主信号。

即使能够获得原始的宿主信号,也因为数据量巨大,使用原始的宿主信号也是不现实的。

对于视频数据来说,这一点表现得尤为突出。

因此,除了极少数的方案外,目前主要研究的视频水印技术是盲视频水印技术。

对于视频数据还存在特有的处理和攻击方法,必须保证视频水印方案对这些攻击和处理的鲁棒性。

对视频的任何处理,只要没有将视频破坏到失去使用价值的地步,都应该不会破坏所嵌入的水印。

(5)无意和有意攻击,采用各种压缩编码标准如MPEG-1,MPEG-2,MPEG-4等对视频进行编码,在NTSC,PAL,SECAM和通常的电影标准格式之间转换所带来的帧速率和显示分辨率的改变,以及屏幕高宽比的改变、帧删除、帧插入、帧重组等视频编辑处理、A/D、D/A转换,如录制在模拟录像带时,在帧转换中可能给视频带来的影响,包括低通滤波,添加噪声,对比度的几何改变以及几何失真等。

Hartung等将水印攻击分为四类:

简单攻击,检测失效攻击,混淆攻击和移去水印攻击。

在视频上的攻击也基本属于这四类组成。

对于单个视频帧,基于静态图像的攻击一般来说仍然有效。

对于连续的帧,有统计平均和统计共谋攻击。

平均攻击是针对局部连续的帧求平均,以消除水印。

这种攻击对于在各帧中嵌入随机的,水印独立的方案比较有效。

在共谋攻击中,从单个的帧中估计出水印,并在不同的场景中求平均以取得较好的精确度,接着从每帧中减去估计的水印。

这种攻击对于在所有帧中嵌入相同的水印方案有效。

因此必须考虑视频的各种可能的攻击处理,来实现较好的水印。

从上面介绍可以看出视频数字水印与静止图像数字水印技术的差异:

(1)可用信号空间不同。

对于静止图像,空间非常有限,这就促使许多研究者利用HVS模型,使水印到达可视门限而不影晌图像质量。

而对视频水印来说,信号空间非常大,但视频水印经常有实时或接近实时的限制,与静止图像水印相比,降低复杂度的要求更重要。

在某些情况下,甚至不能如静止图像那样充分使用基于HVS的模型。

一个好的视频水印的要求:

必须考虑帧间信息,以能抵抗帧平均,帧剪切等攻击,可以把水印信息分布在连续的几幅帧中,而且应该能从一个短序列中恢复全部信息。

(2)对于静止图像,水印的主要应用在于说明作品的所有者,给出版权标识。

而数字视频的情况有所不同,一部影视作品的版权所有者是无需质疑的,视频作品的每个拷贝中都应该用一个唯一的水印,防止非法拷贝。

(3)复杂度:

在某些应用中,水印嵌入和检测的复杂度是不对称的。

水印嵌入应当复杂,以抵抗各种可能的攻击,而水印提取和检测基于实时应用应当简单。

(4)压缩域处理:

视频数据可以通过压缩的形式存储。

如在VOD服务器上,基于复杂度要求,更易将水印加入压缩后的视频码流中,如果解码后加入水印再进行编码,计算量将相当大。

(5)码率恒定:

加入水印不应增加视频流码率。

因此,当前的图像水印算法还不能很好地保护视频数据。

如果在视频的每一帧中嵌入固定的图像水印则容易引起维持统计和视觉可见性的问题。

2.1.4视频水印技术概述

Arena等人提出了水印直接嵌入在MPEG-2比特流中的方案,从而避免了将水印嵌入在像素域中所必需的将视频码流解码与再编码的繁重运算。

Hatinkaos和Kundu,提出了一个依赖于内容的空间嵌入视频水印方案。

这一视频水印算法基于以下两个关键思想:

统计不可见性与设置内容同步。

Mobasser提出了一个应用直接序列扩展频谱模型的视频水印方案。

一段视频是由一些帧组成的,而每一帧可以看作是由数个比特面组成的,这样,这段视频就可以看作是在时间轴上的以比特面为单位的一维序列。

一个{0,1}m一序列作用于这个一维序列,大部分比特面保持不变,而有少数比特面的更改并不能影响视觉效果,这些位置就是用来嵌入水印的。

Kutter提出了在运动矢量中嵌入水印的方案,将水印嵌入在幅度值大且相对变化小的运动矢量中。

在MPEG压缩算法中,运动补偿预测技术用于减少帧间的时间冗余度,只有预测到有误差的图像才被编码。

在MPEG视频序列中,大部分的帧是运动补偿预测编码帧,所以,在运动矢量中隐藏水印信息可以更有效的利用视频比特流中的信息。

国内学者张志强提出了一种在MPEG-1和MPEG-2压缩视频流中嵌入可视水印的方案。

可视水印不同于不可见水印,它是通过在图像表面半透明的显示版权信息来防止盗版。

2.2相关理论基础

2.2.1MPEG压缩视频标准简要介绍

为了节约数据存储空间和便于传输,视频的主要存在模式是压缩格式的,因此视频水印也在很大程度上是与压缩编码标准紧紧联系在一起的。

当今视频压缩的国际标准包括MPEG-I,MPEG-2,MPEG-4,ITU-T的H.261和H.263等,都采用混合编码。

他们的基本编码思想是运动补偿预测和基于块的变换编码。

在MPEG压缩标准中,数据流是以多路复合流的格式存储和传输的。

多路复合流由音频流和视频流复合组成。

多路复合流的基本单位时包,而一个包由三个组组成。

组分为视频组和音频组,在此只介绍视频组。

它采用分层的语法定义,每一层包括一个或多个从属层。

由于视频流被分成多个图片组,每个组包含特征相近的一些图像帧的集合,帧又被分成画面,再分成宏块。

画面内编码的基本单位是宏块,一个宏块由6个8*8像素块构成:

四个亮度块Y0,Y1,Y2,Y3,一个色度块U,一个色度块V。

注意,四个亮度块覆盖的画面区域与每个色度块覆盖的画面区域是相同的,原因是由于色度信息的信息量比亮度信息少,为了提高数据压缩率而对色度信息作了适合人类视觉系统灵敏度的亚采样。

MPEG视频压缩编码的目的是为了在保持较好画面质量的同时获得较高的压缩比。

由于在编码过程中不能保持精确的像素值,所以该算法是有失真的,视频压缩的最优性能依赖于高质t画面、高压缩比与数据流读取三者之间矛盾的折衷。

原始视频信号的数据量非常大,不利于存储和传输,所以视频信号需要进行数据压缩。

为了获得高压缩比,就必须有效的去掉视频在时域和空域上的冗余。

MPEG-2采用基于块的运动补偿以减少时域冗余。

运动补偿用于对当前画面作相对于前一幅画面的因果预测,对当前画面作相对于后一幅画面的非因果预测,或作相对于前、后画面的差补预测。

对每一个8*8像素的画面区域均定义一个运动矢量,以保证能有效恢复画面。

用DCT变换对差值信号(即预测误差)作进一步压缩,以消除空域冗余:

然后以一个不可逆的过程对DCT系数量化,删去不太重要的信息;最后,

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 成人教育 > 自考

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1