MPEG4音频数字版权保护关键问题的研究.docx
《MPEG4音频数字版权保护关键问题的研究.docx》由会员分享,可在线阅读,更多相关《MPEG4音频数字版权保护关键问题的研究.docx(359页珍藏版)》请在冰豆网上搜索。
MPEG4音频数字版权保护关键问题的研究
MPEG4音频数字版权保护关键问题的研究
MPEG一4音频数宁版权慊护关键问题的卅f究:
摘要
摘要
MPEG一4音频编码标准具有基于对象编码、允许用户交互等特性,随着网络技术,特别是3G/4G无线通讯网络的发展,与MPEG一4音频相关的应用将拥有更加广阔的发展空间。
网而,MPEG。
4音频数字版权保护成为当前非常重要的研究课题。
本文探讨了MPEG一4音频应用中的数字水印技术和版权保护机制,对MPEG一4音频数字版权保护中的扩频水印、多模式和多水印等问题进行了深入的研究,取得了以下研究成果:
(1)基于音频时域的扩频水印技术:
基于变换域的扩频水印一般都具有较高的时空复杂性,很难达到MPEG一4音频数字版权保护的实时性要求。
并且当扩频水印与量化编码在相同的频域上实现时,音频编码算法有可能破坏嵌入的水印消息而使之检测刁i到。
此外,语音和音频具有不同的声学特性,应浚采用不同的技术保证水印信号的不可感知性。
因此,可以抵御量化噪声、裁剪等攻击的、鲁棒的、不可见的音频扩频水印算法研究是MPEG一4音频数字版权保护最基本的关键问题。
本文在详细讨论扩频水印的嵌入和提取、非对称扩频水印和公开检测扩频水印的基础上,提出了一种基于音频时域的扩频水印技术。
该方案利用冗余同步和同步码增强其抵御同步攻击的能力,同时依据语音和音乐不同的声学特性,分别采用线性预测分析和心理声学模型以实现水印信号的不可感知性。
Stirmark音频攻击[z04]、量化攻击的测试结果表明该方案可以抵御滤波、加入噪声、数据压缩等攻击。
(2)融合编码算法的量化水印技术:
MPEG.4音频标准集成了多种编码工具集来满足不同应用的需求,为每一种编码工具定义与之相适应的量化水印模式是MPEG.4音频版权保护最基本的需求,即多模式(multi—scheme)问题∽】。
多种水印模式的存在给水印性能的分析带来必然的困难,如何从统一的角度看待和分析这些不同的量化水印模式,是多模式问题的另一方面。
本文将量化水印看作一种基带传输系统,利用基带传输的技术和理论(如码型)提出了与MPEG.4多种自然音频编码相融合的量化水印模式阳】,包括AAC量化水印、TwinVQ量化水印和SGVQ量化水印。
通用音频编码量化水印的信道容量和自然语音编
码量化水印的信号失真测试结果表明本文提出的算法是十分有效的,实现了水印技术与
编码算法的紧密结合。
理论分析表明:
将量化水印视作一种基带传输系统,有利于鲁棒性、信道容量和不可感知性三者之间的权衡与控制等。
(3)多水印模型:
基于数字水印的MPEG一4音频数字版权保护需要在同一媒体对象中同时嵌入多个独立的水印信息,或者在不同的媒体对象中嵌入不同的版权信息,即多水印(multi—watermark)问题雠1。
多水印的应用必然会存在相互之间的矛盾冲突以及对传统的单水印模式的冲击,如何利用网络信息论、通讯理论等建立合理的多水印模型来控制相互之间的矛盾冲突、优化水印嵌八和检测算法是MPEG.4音频版权保护不容忽视
MPEG一4音额数字版权保护关键问题的研究:
摘要
的关键『U题。
本文针对MPEG.4音频版权保护中的多水印问题,提出了四种网络水印模型,即串扰水印信道、广播水印信道、并行水印信道和多址接入水印信道等,并对它们进行了严格的理论描述和分析,包括系统描述、定义、容量分析和典型应用等方面。
这些模型在移动数字权益管理中的应用分析表明其对于系统设计的优化作用,即依据模型中给出的多水印消息传递的理论极限值,以保证数字媒体价值传递链中所有合法参与者的权益以及最大化网络水印信道的总数据传输率为目标,设计水印方案的嵌入和检测算法,从而使得版权保护机制更加合理和完善。
关键词:
版权保护,数字水印,音频水印,扩频水印,量化水印,永印理论,多水印
StudiesonCopyrightProtectionofMPEG-4Audio:
Abstract
StudiesonCopyrightProtectionofMPEG一4AudioLiuShuChang(ComputerApplicationTechnology)DirectedByLiJinTao
Therewillbemoreandmoredigitalaudioapplications,withthedevelopmentof3G/4Gwirelessnetworking.MPEG一4audiowillbecomethemainaudiocodingstandardoftheseapplications,becauseofitsfreedomprovidingforthenetworkendusers.Likeasothertypeofmultimedia,thecopyrightprotectionandmultimediaauthenticationproblemsmustbetakenintoaccountduringitsaimedInternetormobileapplications.Thisdissertationaimsatsomekeyproblems,namedmulti—scheme,multi—watermarkissues,ofdigitalwatermarking
techniquesandcopyrightprotectionframeworkforMPEG一4audio.Theworksandefforts
mattheauthorhasdonearebrieflydescribedaSfollows.
(1)Spread-spectrumaudiowatermarkingintimedomain:
Modemdigitalwatermarkingtechnologyhasalreadyexperiencedthedevelopmentmorethentenyears,andspread—spectrumwatermarkingoccupiesthesignificantpositionduringthisevolution.Based
onthedetaileddiscussionaboutthealgorithmsofwatermarkembeddinganddetection,
asymmetricspreadspectrumwatermarkingandapublicdetectspreadspectrumwatermarkingschemes,wepresentaspreadspectrumaudiowatermarkinginthetimedomain,whichincludesredundancysynchronizationtoresistsomeattacks,psychoacousticmodelorlinearpredictiveanalysistorenderthewatermarksignalimperceptible.
(2)QuantlzationwatermarkingschemesforMPEG-4Audio:
MPEG-4Audiointegratesmanydifferenttypesofaudiocoding.Asfarasweknow,therearenocurrentwatermarkingmethodsCanbefitforallkindsofcodingtools,todefinethemostsuitable
.watermarkingschemeforeachofthemaccordingtoitscharacteristicsisthebasicassignmentresearchincopyrightprotectionofMPEG-4Audio.Thisproblemisnamedmulti-schemecoexistence.
Inthisdissertation,theQuantizaionWatermarldng(QW)extendedlyreferstoallthewatermarkingschemesthatachievewatermarkembeddingduringquantizationprocess.OurresearchindicatesthatQWCanbemodeledasdigitalbasebanddatacommunication.ThespecificdesignsforMPEG-4naturalsound(musicandspeech)codingandsometheoreticanalysesaboutitsrate—distortion—robustnessperformancedemonstratefundamentalprinciplesbehindourproposedwatermarkingtechnique.
(3)Multiplewatermarkingsystem:
ThesameMPEG·4audiocodingstreammaybedividedintomorethanoneaudioobject,thisleadstOthemulti—ownershipidentificationscenario.sincedifferentobjectcouldbelongstodistinctproducers,Andatthesametime,manyactorsareinvolvedintheIntemetdistributionofMPEG一4audio,suchascomposer,artist,contentprovider,andsubscriber.Inordertoprotecttherightsandinterestsofallactors
IH
StudiesOllCopyrightProtectionofMPEG一4Audio:
Abstract
mentionedabove,onepossiblesolutionistoembeddifferentwatermarksonthedifierentpositionsordomains.Here,Wecalledthismulli-watermarkcoexistence.Thefollowingquestionofmulti··schemeandmulti··watermarkismutualconflictsbetweendistrictwatermarkings.Howtodealwiththeconflicts,andtOanalyzeandstretchthecapacityofthemultiplydatahidingtechnologiesistheunignoredproblemfortheresearchoncopyrightprotectionofMPEG-4Audio.
Fromtheviewpointofinformationcommunication,multiplewatermarkingisaformofdatatransmission,inwhichmultipleindependentwatermarkmessagesaresent
simultaneouslyfromembedderstodetectorsviaanetwork—watermarkingchannel.Basedon
themultipleuserinformationtheory,fourvaluablemultiplewatermarkingmodelsincludinginterferencewatermarkingchannel,broadcastingwatermarkingchannel,parallel
watermarkingchannelandmulti-accesswatermarkingchannel,alegivenindetailfrom
systemdescription,definitions,channelcapacityetc.
Keywords:
Copyrightprotection,Digitalwatermarking,Audiowatermarking,
Spread-spectrumwatermarking,Quantizationwatermarking,Watermarkinggame
Multiplewatermarking
声明
本人声明所呈交的论文是我个人在导师指导下进行的研究工作及取得的研究成果。
就我所知,除了文中特别加以标注和致谢的地方外,论文中不包含其他人已经发表或撰写过的研究成果。
与我~同工作的同志对本研究所做的任何贡献均已在论文中作了明确的说明并表示TN意。
作者签名:
寺临、易日期:
200写,呵、,7
关于论文使用授权的说明
中国科学院计算技术研究所有权处理、保留送交论文的复印件,允许论文被查阅和借阅;并可以公布论文的全部或部分内容,可以采用影印、缩印或其它复制手段保存该论文。
作者签名滂喝导师签名:
秀群份隰砌”.,r
MPEG-4音频数字版权保护关键问题的研咒:
符0说删
符号说明
下面列出本文中常用的符号规定:
口大写字母一,y,表示随机变量,小写字母x,Y,表示确定性变量(或者相应随机变量Ⅳ,】,,的实现),草体字母工,丫,表示变量耿值的符号集合;
口x”,y“,或者x,y,表示随机向量(Ⅳl,x2,,爿。
),(_,匕,,K),,则x“,y”,或者工,Y,表示向量(xI,x2,,x。
),(Yl,y2,,少。
),,且分别属于集合Z,彳,的笛号尔积工”,f”,,即X“∈Ⅳ”,Y”∈f“,。
在水印问题的讨论中,若无特殊说明,一般情况下【35】
口c表示宿主信号(host/coversignal),w表示待嵌入的水印信号(watermarksignals),^表示水印密钥(watermarkkeys);
口水印信号嵌入之后,得到隐秘信号s=co’‘,(stego/watermarkedsignal),其中。
表示某种水印嵌入运算,可以是简单的代数加法,或者复杂的非线性运算等各种可能的处理;
口隐蔽信号s可能会受到许多有意的或是无意的攻击,用一表示攻击所带来的噪声信号,,表示攻击之后的接收信号,=JoH(receivedsignal),其中0表示某种水印攻击运算;
口水印检测算法从接收信号,中提取出水印信号w’。
第一章引言
第一章引言
MPEG一4音频编码标准具有基于对象编码、允许用户交互等特性,随着网络技术,特别是第三/四代无线通讯网络的发展,与MPEG.4音频相关的应用将拥有更加广阔的发展空间。
因而,MPEG一4音频数字版权保护成为当前非常重要的研究课题。
论文探讨了MPEG一4音频应用中的数字水印技术和版权保护机制,对MPEG一4音频数字版权保护中的扩频水印、多模式和多水印等问题进行了深入的研究。
本章介绍了论文的研究背景,重点分析了MPEG.4音频数字版权保护所面临的主要
问题,及研究意义,并简要介绍了论文的主要工作和贡献。
1.1论文的研究背景和意义数字化技术和网络技术的发展,使得制作、复制、传播和消费数字媒体的成本变得
越来越低,它是目前许多研究课题最直接的驱动力量。
例如基于内容的多媒体信息检索
和多媒体数据挖掘旧l,因为普通人面对浩瀚的信息海洋时,不知哪些是自己所需要的信息、哪些是所喜爱电影和音乐。
再如知识工程和多媒体数据库【”】,因为合理有效地组织、管理和使用日益增多的多媒体数据远比生产这些数据重要的多;其次很多专业知识也逐渐以图像、视频和音频等形式进行存储和传递。
还有移动电子商务和无线增值业务,因为移动设备计算能力的提高以及第三代无线网络所带来的带宽,促使Intemet网络概念的延伸以及各种Internet应用向无线网络的迁移。
数字版权保护当然也与无处不在的数字媒体有密不可分的关系,如何有效地保证内容生产者、消费者、以及发行商的合法权益,防止非法盗版的发生;当版权出现争议时,又如何进行裁决等是信息安全、信息隐藏、网络安全、数字图书馆ll”、以及版权法等领域的研究热点。
基于水印技术的数字版权保护方案已经成为信息安全和信号处理领域研究中非常重要的方向,几个重要的学术会议,MultimediaandSecurityWorkshopatACMMultimedia、ElSecurityandWatermarkingofMultimediaContents、WorkshoponInformationHiding、InternationalWorkshoponDigitalWatermarking等;以及各种国际期刊关于数字媒体保护的专刊,即SignalProcessing,1998,66(3)、ProceedingsoftheIEEE,1999,87(7)、SignalProcessing,2001,81(6)、IEEETransactionsonSignalProcessing,2003,51r4)等【2001都是最好的见证。
然而由于人类听觉系统(HumanAudioSystem,HAS)的敏感度高于人类视觉系统(HumanVisualSystem,HVS),使得音频保护的研究远落后于图像/视频保护技术。
随着第三/四代无线通讯网络的发展,与音频相关的技术拥有更加广阔的发展空间,数字音频保护与音频分析、检索、理解I”,”l~样,已经得到越来越多的重视,这正是论文选题的重要原因之一。
MPEG一4音频编码标准,综合了许多不同类型的音频编码算法,从自然声音到合成
MPEG·4音频数宁版杖性护关键问题的研究
声音、从可懂的语音到高质量多通道的音乐、从传统的音频数据内容到具有交互性的虚拟现实内容,MPEG一4音频通过标准化一些成熟的编码工具.形成了完美灵活的交互式的音频编码和合成框架结构,它可以应用蓟所有需要高质量的声音压缩、合成和控村的应用领域中,如电话、视频会议、实时监控等㈣122,幢51,MPEG.4音频的广泛应用使得数字版权保护的研究迫在眉睫。
论文从MPEG-4音频本身的特点出发,主要探讨MPEG一4音频应用中的数字水印技术和版权保护机制。
重点包括融合编码的量化水印、扩频水印、多水印理论等。
该课题具有多方面的研究意义:
首先,对数字水印和版权保护研究的促进作用
尽管版权保护问题已经得到人们的重视,数字水印技术方面也取得了不少研究成果,并且也存在一些商业化产品,如mp3Stego(202J;和一些工业论坛,如SDMIt‘80t“i。
但数字版权保护还没有达到预期的目标,一方面因为普通用户还没有认识到数字版权保护的重要性,或者已经习惯了盗版行为的存在;更重要的原因是多数水印技术以特定的应用为背景,很难抵御各种各样的攻击,从丽削弱了人们对水印技术的信任。
任何事物的发展都应是一个螺旋上升的过程,版权保护也是在攻击和反攻击的过程中不断地完善和改进。
论文以MPEG一4音频为研究对象,讨论多种音频水印技术在版权保护中的应用模式和理论分析,目的是形成一个完整的音频数字版权保护机制,这些研究成果同样适用于其它数字媒体类型。
其次,对MPEG.4应用的促进作用
MPEG.4于199】年5月首次提出,1993年7月正式启动,经过世界各地数百名研究人员和工程师的共同努力,于1999年1月形成国际标准.并在2000年上半年推出完全向后兼容的MPEG.4Version2,目前MPEG一4的工作仍在继续。
基于对象的编码方式、灵活的用户交互、以及多样的可扩展性是MPEG一4最明显的特点,但是基于对象的编码方式的前提是编码对象是分割开来的,例如对于一段有音乐背景的场景对话,要实现MPEG一4的对象编码,必须将音乐背景与场景对话分割开来。
虽然音频、视频和图像的对象分割问题所面临的困难限制和影响了MPEG-4的应用,但是这并没有限制其它方式的应用。
例如上面的例子,可以分别录制背景音乐和场景对话,然后再用不同的编码工具(如分别用AAC和CELP)和对象复合工具实现编码祁台成。
但这在版权方面就产生如下的问题:
第~,不同的对象其版权可能不同;第二,同一种水印技术不一定适用于所有的对象类型。
第三,用户不一定使用所有的对象。
因此就需要多种版权信息采用不同的技术嵌入到不同的对象中,和/或在同~对象中同时嵌入不同的版权信息,这是论文研究的出发点。
尽管论文的研究成果对于对象分害6这个难于逾越的鸿淘本身没有什么贡献,但是数字版权保护研究对MPEG一4音频应用的促进作用是不容忽视的。
第三,对其它标准的作用
MPEG(MovingPictureExpertGroup)的重要地位.以及时整个多媒体通讯产业的
第一章0I占
推动作用越来越明显。
除了MPEG—I、MPEG.2和MPEG一4外,MPEG.7(MultimediaContentDescriptionInterface)和MPEG-21(MultimediaFramework)是MPEG组织『F在研究和制定的国际标准。
这些MPEG系列标准之间存在着密切的关系,尤其是MPEG.4和MPEG.2l中都涉及到了知识产权管理和保护(IntellectualPropertyManagementandProtection,IPMP)。
这种相关性,使得MPEG.4音频保护的研究成果对MPEG其它标准的作用成为一种必然。
第四,对多媒体通信的作用
数字化技术的发展,计算机、通信和广播电视三个原本各自独立的领域相互渗透和融合,形成了多媒体技术。
多媒体技术的应用与发展,又反过来进一步加速了这三个领域的融合,使数字多媒体通信成为通讯技术发展的主要方向【I”。
数字多媒体通信的发展一方面依赖于网络能传输高质量的多媒体内容,另外一方面是多媒体内容合法性的保障,即网络安全和网络QoS的支持。
数字版权保护是网络安全中的重要研究内容,它的发展和成熟将决定着多媒体通信网络的用户数目。
1.2MPEG.4音频版权保护的主要问题MPEG.4音频本身是一种框架结构,将多种声音编码技术集成在一起,包括自然语