ImageVerifierCode 换一换
格式:DOCX , 页数:17 ,大小:24.69KB ,
资源ID:10568409      下载积分:3 金币
快捷下载
登录下载
邮箱/手机:
温馨提示:
快捷下载时,用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)。 如填写123,账号就是123,密码也是123。
特别说明:
请自助下载,系统不会自动发送文件的哦; 如果您已付费,想二次下载,请登录后访问:我的下载记录
支付方式: 支付宝    微信支付   
验证码:   换一换

加入VIP,免费下载
 

温馨提示:由于个人手机设置不同,如果发现不能下载,请复制以下地址【https://www.bdocx.com/down/10568409.html】到电脑端继续下载(重复下载不扣费)。

已注册用户请登录:
账号:
密码:
验证码:   换一换
  忘记密码?
三方登录: 微信登录   QQ登录  

下载须知

1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。
2: 试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。
3: 文件的所有权益归上传用户所有。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 本站仅提供交流平台,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

版权提示 | 免责声明

本文(信源编码数据压缩课程课后题与答案第二章.docx)为本站会员(b****8)主动上传,冰豆网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知冰豆网(发送邮件至service@bdocx.com或直接QQ联系客服),我们立即给予删除!

信源编码数据压缩课程课后题与答案第二章.docx

1、信源编码数据压缩课程课后题与答案第二章信源编码Assignment of CH21、(a)画出一般通信系统结构的组成框图, 并详细说明各部分的作用或功能;信源 信源编码 信道编码 调制噪声 信道传输信宿 信源解码 信道解码 解调图 1、一般数字通信系统框图各部分功能:1、信源和信宿:信源的作用是把消息转换成原始的电信号;信宿的作用是把复原的电信号转换成相应的消息。2、信源编码和信源解码:一是进行模 /数转换,二是进行数据压缩,即设法降低信号的数码率;信源解码是信源编码的逆过程。3、信道编码和信道解码:用于提高信道可靠性、减小噪声对信号传输的影响;信道解码是信道编码的反变换。4、调制和解调:将信

2、息调制为携带信息、适应在信道中传输的信号。数字解调是数字调制的逆变换。5、信道:通信的通道,是信号传输的媒介。(b)画出一般接收机和发射机的组成框图,并分别说明信源编解码器和信道编解码器的作用;高频振荡器 高频放大 调制 高频功放天线信号音频功放图 2、一般发射机框图(无线广播调幅发射机为例)天线信号放大器 混频器 解调器 音频放大器信号本地振荡器图 3、一般接收机框图(无线广播调幅发射机为例)信源编解码器作用:它通过对信源的压缩、扰乱、加密等一系列处理,力求用最少的数码最安全地传输最大的信息量。 信源编解码主要解决传输的有效性问题。信道编解码器作用:使数字信息在传输过程中不出错或少出错,而且

3、做到自动检错和尽量纠错。信道编解码主要解决传输的可靠性问题。(c)信源编码器和解码器一般由几部分组成,画出其组成图并给以解释。信源编码器时频分析 量化 熵编码信道传输时频分析 反量化 熵解码信源解码器图 4、信源编解码器框图时频分析部分: 信源编码器对信源传送来的信号进行一定方法的时域频域分析,建立一个能够表达信号规律性的数学模型, 从而得知信号中的相关性和多余度,分析出信号数据中可以剔除或减少的部分 (比如人感知不到的高频率音频信号或者看不见的色彩信号等等) ,以决定对后续数据的比特分配、 编码速率等处理问题。量化部分:根据时频分析的结果,为了更加简洁地表达利用该模型的参数,减少精度,采取相

4、应量化方法对信号进行量化,减小信号的多余度和不相关性,也达到了减小数据量的目的, 如果没有此步骤, 则可以实现信源的无损压缩。 反量化是其逆过程。熵编码部分:采取相应的熵编码方式,对量化后的量化数据进行无失真的码字分配,尽可能紧凑地压缩码流, 同时力求编码能忠实地再现模型参数的量化符号,是一种无失真的压缩编码。熵解码是其逆过程。2、( a)用具体事实说明为什么要进行数据压缩和信源编码?以一部电影为例:假如一部 24 帧/秒的高清电影时长为 90 分钟,分辨率为19201080,每个像素点采用 8bit 位编码( 256 全彩色),那么每帧上的信息量就为 1920 1080 8/1024=15.

5、8Mb,每分钟有 2460=1440 帧, 90 分钟就有129600 帧,所以这部电影的总信息量为 12960015.8/1024 48000Gb。这是一个很恐怖的数据量, 所以为了更加快速和便携地对多媒体信息进行传输, 充分地利用目前有限的存储空间, 提高信道利用率,让多媒体信息能够广泛普及和传播,就必须对信源进行数据压缩与信源编码。(b)为什么能够进行进行数据压缩和信源编码?图 5、数据压缩方向:多余度与不相关性如图 5 所示,该图表明了信源可以进行数据压缩和信源编码的两大原因(多余度和不相关性)和编码的总体方向和目标。 原因之一是信源中有大量的多余度,如一幅图片或电影中存在大面积的纯色

6、模块, 那么这些模块中就存在着大量的多余度,也就给了我们可以进行数据压缩的空间和方向;原因之二是信源中存在着不相关性, 例如在被麦克风或镜头所采集到的声音视频信息中, 就存在着人类所感知不到的频率和色域, 这些部分的有无对人类收听和观看多媒体信息没有影响,即这些人类感知的不到的信息在某些情况下是多余的,可以进行数据压缩的。(c)数据压缩和信源编码的性能主要从那几个方面来衡量?一、信号质量:客观度量与主观度量对数据压缩和信源编码性能的判定, 很大程度上取决于对处理后信号质量的评价,其实也就是对波形逼真度 (或失真度)的测量,这既可以通过客观度量 (如信噪比)也可以用主观度量(如平均评分)来评价。

7、客观度量包括 MSE(包括 NMSE、PMSE)这样的准则来度量波形失真,和用 SNR(包括 NSNR、PSNR)准则来衡量编码器的性能;主观度量主要是人为的评定,包括二元判决、主观 SNR、平均判分( MOS)、等偏爱度曲线和多维计分等,图像视频用各国各地区的主观测试分级标准来评分, 语音质量由 5 级质量 MOS 判分或者 PESQ标准判定。二、比特率单从数据压缩的角度来说, 比特率常常是体现一个实际编码系统或理论压缩算法技术水平的最主要的指标。三、复杂度信号压缩系统的复杂度是指为实现编解码算法所需的硬件设备量, 典型地可用算法的运算量及所需的存储量来度量。四、通信时延随着算法复杂度的提升

8、,信号样本数增加,处理的时延也会有所提升,而取决于不同的通信环境,对通信时延一般都有不同的要求。五、编码和数字通信系统的性能空间将信号质量、编码效率、系统复杂度和通信时延抽象为一个 4 维空间,任何数据压缩信源编码系统设计都要考虑到空间内的性能取舍。 一般来说, 信号质量和时延决定了一个信息传输系统所能提供的 QoS,而codec的效率和复杂度则关系到系统的经济指标。3、( a)试用信息量和信源熵的概念解释和说明信源多余度和进行无失真编码的基本原理;首先我们知道数据熵的含义是一组数据的混乱度,用 H 表示,公式为:nH = p log p i 2 i i 1在一组二进制信源中, 我们通过计算可

9、以得知, 只有当所有码字出现概率等概时,信源熵的值最大, 例如:当信源 P= p1, p2, ,p4 = 1/4, 1/4, 1/4, 1/4 时,H=2;当 P= p1, p2, , p4 = 1/2, 1/6, 1/6, 1/6 时,H=1.7925。也就是说,一组数据的总比特数大于等于码数与信源熵的乘积, 这时我们就可以发现信源数据中存在多余度。所以可以发现信源数据可压缩(含有多余度)的条件是信源码不等概。再来看信源多余度的定义:nR I p Hi ii 1当信源等概发送时,此时的 H 与平均码长相等,即 R=0,没有多余度,而当不等概发送时, R 必大于 0,这就代表了信源信号必有可以

10、进行数据压缩的空间,而熵 H 就代表了最佳压缩码长。这也告诉我们采取适当的压缩编码方式,只要编码码长在最佳压缩码长之上,就可以实现无失真编码。(b)常用的无失真编码算法由那些?常用的无失真压缩编码有:霍夫曼编码、算术编码、游程编码、二进制信源编码、基于字典的编码、 LZW 编码、完全可逆的小波分解 +统计编码等等。4、信源符号集合为 a, b,且 P(a)=0.8, P(b)=0.2;(a)如果对信源进行单字符 Huffman 编码,计算平均编码长度试多少?如果对双码字信源进行单字符霍夫曼编码,则a为 0,b 为 1。所以平均码长亦为 1。(b)如果对信源进行双字符 Huffman 编码,即信

11、源可视为 aa, ab, ba, bb,计算这时的平均编码长度试多少?由题: P(aa)=0.8 0.8=0.64P(ab)=0.8 0.2=0.16P(ba)=0.2 0.8=0.16P(bb)=0.2 0.2=0.04霍夫曼编码如下:aa:0ab:10ba:110bb:111所以平均码长为: L=0.64+0.16 2+0.16 3+0.04 3=1.565、有信源A, C, G, T, 且 P(A)=0.5, P(C)=0.3, P(G)=0.15, P(T)=0.05, 试用图示解释消息“ CAT ”算术编码和解码的过程。“CAT”的算术编码示意图如下所示:编码方向1 0.5 0.5

12、0.3575A A0.5C C T0.2GT0.500.2 0.35 0.35解码方向图 6、消息“ CAT” 算术编码过程6、试用互信息的概念解释有失真编码的基本原理。我们知道信号 X 与 Y 的互信息量可以表示为:I (X;Y) H (X ) H (X |Y)所谓的无失真编码,可以理解为 X=Y ,即我们得到解码器的输出 Y 时,就可以确定信源信号为 X;而在有失真编码中,当我们得到了输出 Y,不一定能确定信源信号就是 X,存在一定的不确定性。 而这不确定的平均值即为条件熵 H(X|Y )。当解压缩后得到输出数据,这时原始数据或信息虽可能与其不同,但是在某种使用情形中输出与输入已经“足够接

13、近”,并可以在允许的误差内使用,也就是条件熵 H(X|Y )足够小时,这种情况下就可以进行有失真编码。在有失真编码中,我们可以将编码码长设定在最佳码长(即信源熵)之下,进一步缩减平均码长,在不严重影响通信系统效果的前提下减小传输数据量。7、如何解释或理解率失真定理?它在有失真编码领域有何指导意义?率失真理论是对于一个给定的信源分布与失真度量, 在特定的码率下能达到的最小期望失真,或者说为了满足一定的失真限制,最小描述码率可以是多少。率失真曲线可以最直白地表明其含义:图 7、率失真曲线横坐标 D 代表失真度,纵坐标率失真函数 R(D)表示编码的最低速率。从图中可以看出,随着失真度 D 逐渐增大,

14、允许的编码最低速率也在逐渐降低,也就是表明在某个失真度标准下,我们的编码速率不能低于相应的 R(D),同时 R(D)速率也是最佳的编码速率,可以实现最短的编码码长;当失真度为 0 时,就变成了无失真编码,这时纵坐标 R(D)表示在无失真最佳编码长度(信源熵H)下的编码速率。率失真理论为有失真信源编码的性能提供理论极限和比较标准, 对具体编码方法的研究有方向指导作用: 在设计数据压缩有失真算法时, 我们希望将算法的性能曲线尽可能地向率失真函数靠拢,靠得越近,证明算法的效率和性能越好。8、(a)标量量化与矢量量化的区别是什么?各自的优缺点可以从那几个方面进行比较?按照量化的维数分, 量化分为标量量

15、化和矢量量化。 标量量化是一维的量化,一个幅度对应一个量化结果。 而矢量量化是二维甚至多维的量化, 两个或两个以上的幅度决定一个量化结果。以二维情况为例,两个幅度决定了平面上的一点。而这个平面事先按照概率已经划分为 N 个小区域,通过码书对应着一个输出结果。由输入确定的那一点落在了哪个区域内, 矢量量化器就会输出那个区域对应的码字。矢量量化的好处是引入了多个决定输出的因素, 并且使用了概率的方法,一般会比标量量化效率更高。标量量化是维数为 1 的矢量量化,一个 P 维最佳矢量量化器性能总是优于 P个最佳标量量化器。 在相同的编码速率下, 矢量量化的失真更小; 而相同的失真条件下,矢量量化的码速

16、率更低;矢量量化的复杂度更高。标量量化和矢量量化有各自的优缺点,适应于不同的应用环境,主要由各自的量化精度、量化级、量化维度和量化效率来决定最终的量化误差。(b)对频带宽度为 8kHz 的宽带语音信号采用 16kHz 采样、每个样点用 16bit表示,则其原始编码速率是多少?由题可知,原始编码速率 V=16000 16/1024=250Kb/s。(c)如果对上述信源进行每个样点用 8bit 标量量化,则其编码速率是多少?由题可知,编码速率为 V=160008/1024=125Kb/s。(d)如果对上述信源进行每个样点用 8 维矢量量化,码书尺寸为 1024 个码矢量,则其编码速率是多少?由题可

17、知, 每个 8 维矢量有 8 个标量数据, 占 8 个bit;每秒 16000 个采样点每个样点采取 8 维矢量量化, 即每秒需要传输 16000 个 8bit 码字的匹配信息; 码书长度为 1024(2 的十次方),每个码字需要 10bit 数据来传输匹配数据,故编码速率 V=10 16000/1024=156.25Kb/s。9、结合图示,解释预测编码的基本原理,并说明为什么预测编码可以进行数据压缩。预测编码是根据离散信号之间存在着一定关联性的特点, 利用前面一个或多个信号预测下一个信号进行, 然后对实际值和预测值的差 (预测误差)进行编码。如果预测比较准确, 误差就会很小。 在同等精度要求

18、的条件下, 就可以用比较少的比特进行编码, 达到压缩数据的目的。 预测编码中典型的压缩方法有脉冲编码调制(PCM)、差分脉冲编码调制 (DPCM)、自适应差分脉冲编码调制 (ADPCM )等。下图为 DPCM 的流程示意图:图 8、差分脉冲编码调制流程图由图可以看出,没有对信源输入进行独立的编码,而是先根据前一个抽样值计算出一个预测值 ,再取当前抽样值和预测值之差进行编码,此差值称为预测误差。因为相关性强, 抽样值和预测值会非常接近, 预测误差的可能取值范围比抽样值变化范围小。 所以可用少几位编码比特来对预测误差编码, 从而降低其比特率。这是利用减小多余度的办法, 降低了编码速率, 这也是可以

19、进行数据压缩的原因。10、(a)变换编码为什么可以进行数据压缩?变换编码不是直接对空域图像信号进行编码, 而是首先将时域信号映射变换(利用 DCT、DFT 变换等方式)到另一个正交矢量空间,产生一批变换系数,然后对这些变换系数进行编码处理, 它在降低数码率等方面取得了和预测编码相近的效果。变换编码是一种间接编码方法, 其中关键问题是在时域或空域描述时,数据之间相关性大, 数据冗余度大, 经过变换在变换域中描述, 数据相关性大大减少,数据冗余量减少,参数独立,数据量少,这样再进行量化,编码就能得到较大的压缩比,故可以采用变换编码对信源进行数据压缩。(b)什么是正交变换,什么是双正交变换?正交变换

20、是保持图形形状和大小不变的几何变换,包含旋转、轴对称及两者变换的复合。定义: n 级实矩阵 A,如果有 AA=E ,则称 A 为正交矩阵。正交变换是线性变换的一种,它从实内积空间 V 映射到 V 自身,且保证变换前后内积不变。因为向量的模长与夹角都是用内积定义的, 所以正交变换前后一对向量各自的模长和它们的夹角都不变。 在有限维空间中, 正交变换在标准正交基下的矩阵表示为正交矩阵,其所有行和所有列也都各自构成 V 的一组标准正交基。双正交关系指的是两组基之间各对应向量之间具有正交性, 但每一组向量之间并不一定具有正交关系。在信号的正交处理中,就是用输入信号与正交矩阵相乘,即 y=Tx,其中 T

21、为正交矩阵。正交变换的好处在于不改变信号的能量,即:2 2y = x而且正交变换在信号处理中不放大噪声信号:图 9、信号正交变换示意图(c)在信源编码中常用的变换编码有那些,分别适用于什么信源?变换编码中常用的方法主要有 KLT(卡-洛变换) 、DCT(离散余弦变换) 、WDCT(修正的离散余弦变换)、 DFT(离散傅里叶变换 )、WHT(Walsh Hadama变换)、 HrT(Haar 变换)、WT(小波变换)等。其中 KLT (卡-洛变换)是一种最优的算法,可以最优化地是实现能量的集中,但是本身不存在快速算法,应用起来困难,不易实现,所以不适用于信源编码系统。DCT(离散傅里叶变换 )方

22、法是目前应用较为广泛的方法,它具有较好的能量压缩特性和易实现性,所以经常被用于图像处理使用,用于对图像 (包括静止图像和运动图像 )进行有损数据压缩。WDCT(修正的离散余弦变换) 方法利用窗函数实现了消除直流突跳的效果,故主要应用于 MP3,AC-3 和AAC 的音频压缩等方面。WT(小波变换)它的主要特点是通过变换能够充分突出问题某些方面的特征,在高频处进行时间细分, 低频处进行频率细分, 能自动适应分析信源信号时的要求,故其主要应用于图像压缩编码领域,具有压缩比高、压缩速度快、压缩后保持信号与图象的特征不变、传递中可以抗干扰等诸多优点。11、解释子带编码的一般性原理?常用的子带滤波组有那

23、些?子带编码是一种以信号频谱为依据的压缩编码方法,常用于音频压缩编码。它将信号分解成不同频带分量来去除信号相关性, 再将分量编码得到一组互不相关的码字合并在一起后进行传输。 它通过引入一组滤波器组, 将信源信号在频域上分成一个个子带信号, 然后对子带信号进行量化、 编码, 并合成一个总的码流传送给接收端。在接收端,先把码流分成与原来的各子带信号相对应的子带码流,然后解码、将频谱搬至原来的位置,最后经带通滤波、相加得到重建的信号。子带编码可以利用人对不同频率信号的感知灵敏度不同的特性, 在人的听视觉不敏感的部位采用较粗糙的量化, 在敏感部位采用较细的量化, 以获得更好的主观视听效果。 例如, 语

24、音的基音和共振峰主要集中在低频段, 因此可分配较多的比特来表示其样值;而对出现摩擦音和类似摩擦噪声的高频段可以分配较少的比特,从而可以充分地压缩语音数据。常用的子带滤波器组有 QMF(正交镜像滤波器组)、 CQF(共轭正交滤波器组)、应用于小波变换的 M 通道正交滤波器组等等。12、(1)感知编码为什么可以用于信源编码 ;感知编码就是利用了人耳听觉的心理声学模型或人眼视觉的心理视觉模型的特性,将信源信号中凡是人耳感觉不到、 人眼观察不到的部分不编码不传送的一种编码技术。 比如在音频信源编码中, 感知就是根据绝对听觉门限和听觉掩蔽效应,在编码过程中保留人耳可以听到的部分, 而放弃人耳听不到的部分

25、, 它既不会影响信源信号的传输质量, 同时又大大减小了信源数据量和传输码率, 故可以应用于数据压缩和信源编码。(2)查找资料,试说明感知编码在语音、音频、图像和视频编码中的应用?在语音和音频方面, 感知编码主要应用在 MPEG 系列标准里, 比如 MPEG-1和 MPEG-2 等等,其在 MP3 格式中就有较为经典的应用。它通过心理声学模型被应用在各种压缩编码标准之中,作为一个数据压缩和信源编码的流程模块。在图像视频方面,感知编码主要应用于 H.264、H.265 和 AVC 等标准中。对目前利用人类视觉系统中的亮度、 对比敏感度、 中心凹等视觉感知特性的单视点图像视频编码方法进行分析并指导该领域的数据压缩编码技术。

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1