数字音视频复习提纲含详细回答.docx

资源描述

数字音视频复习提纲含详细回答.docx

《数字音视频复习提纲含详细回答.docx》由会员分享，可在线阅读，更多相关《数字音视频复习提纲含详细回答.docx（18页珍藏版）》请在冰豆网上搜索。

数字音视频复习提纲含详细回答.docx

数字音视频复习提纲含详细回答

音视频复习提纲

1、音频的英文是什么？

音频一般分为哪三类？

Audio；分类：

语音、音乐和其它声音（声响、环境声、音效声、自然声）。

2、声音是一种什么样的波？

与水波有何区别？

一般用哪两个物理量来描述？

声音（sound）是一种纵向压力波，其客观物理属性主要有振幅和频率，而其主观感知特性则有响度、音调和音色等。

3、人类听觉的频率范围是什么？

语音的频率范围又是什么？

20Hz—20KHz；300Hz～3000Hz。

4、模拟信号与数字信号的区别在哪里？

如何将音频信号数字化？

模拟信号（analogsignal）：

在时间和幅度上都是连续的信号；

数字信号（digitalsignal）：

时间和幅度都用离散的数字表示的信号。

将音频信号数字化，实际上就是对其进行采样和量化。

即：

数字化=采样+量化。

5、如何确定无损数字化的采样频率？

按Nyquist采样定理语音和音乐之无损数字化的采样频率各是多少？

当采样频率不低于声音信号最高频率的两倍时，可把以数字声音信号无损地还原成原来的模拟声音信号，这叫做无损数字化（losslessdigitization）。

fs≥2f或Ts≤T/2

按Nyquist采样定理——采样频率不低于声音信号最高频率的两倍；2*3kHz=6kHz、2*20kHz=40kHz。

6、MIDI的英文原文与中文译文各是什么？

与波形数据相比MIDI有哪些优点？

MIDI=MusicalInstrumentDigitalInterface（电子乐器数字接口）是乐器和计算机之间交换音乐信息所使用的一种标准协议。

优点：

生成的文件比较小，因为MIDI文件存储的是命令，而不是声音波形；

容易编辑，因为编辑命令比编辑声音波形要容易得多。

7、MIDI音乐生成方法有哪两种？

它们各有什么特点？

方式：

调频（FM=frequencymodulation频率调制）合成法：

把几种乐音的波形用数字来表达，并且用数字计算机而不是用模拟电子器件把它们组合起来，通过数模转换器（DAC=digitaltoanalogconvertor）来生成乐音。

乐音样本合成法，也称为波形表（Wavetable）合成法：

把真实乐器发出的声音以数字的形式记录下来，播放时改变播放速度，从而改变音调周期，生成各种音阶的音符。

特点：

调频：

FM合成器由5个基本模块组成：

数字载波器、调制器、声音包络发生器、数字运算器和数模转换器。

通过改变合成器的参数，可以生成不同的乐音，例如：

改变数字载波频率可以改变乐音的音调（音高）；改变数字载波的幅度可以改变声音的音量。

波形表：

乐音样本的采集相对比较直观；

所需要的输入控制参数比较少；

产生的声音质量比FM合成方法产生的声音质量要高。

或者：

特点：

调频：

简单便宜，有些失真；

波形：

比调频法所产生乐音更逼真，但较贵。

8、声卡的多音色和复音的含义是什么？

多音色（muti-timbral）：

合成器能够同时播放几种不同乐器的声音；

多音调（复音）：

指合成器一次能够同时播放的音符（note）数。

9、声卡有哪些功能和指标？

功能：

录制与播放、编辑与合成、MIDI与音乐合成和文语转换与语音识别。

指标：

采样率、量化精度、声道数、MIDI性能（合成方法[FM/波表]、复音与音色数目）、插卡接口（ISA/PCI/USB）。

10、窄带和宽带音频信号各指什么？

窄带（3.4kHz）的话音信号和宽带（20kHz）的其他音频信号（传统音乐7kHz，电子音乐/自然声/环境声/效果声20kHz）。

11、话音编码有哪三类？

它们各有什么特点？

分类：

波形编译（waveformcodecs）；

音源编译（参数编译）（sourcecodecs）；

混合编译（hybridcodecs）。

特点：

波形编译：

这种编译码器的复杂程度比较低，数据速率高（一般在16kb/s以上），质量相当高。

低于这个数据速率时，音质急剧下降。

音源编译：

根据对声音形成机理的分析，构造话音生成模型，该模型以一定精度模拟发话者的发声声道；接收端根据该模型还原生成语音。

混合编译：

成功地将波形编码和参数编码两者的优点结合起来，既利用了语音产生模型，通过对模型参数进行编码，减少被编码对象的动态范围和数据量，又使编码过程产生接近原始语音波形的合成语音，以保留说话人的各种自然特征，提高了语音质量。

混合编码器在4kb/s~16kb/s速率段能够得到高质量的合成语音。

12、PCM、DPCM、ADPCM的英文原文与中文译文各是什么？

PCM、DPCM、ADPCM编码的含义是什么？

PCM：

PulseCodeModulation，脉冲编码调制；

DPCM：

differentialPCM，差分脉冲编码调制；

ADPCM:

adaptiveDPCM，自适应差分脉冲编码调制。

含义：

PCM：

概念上最简单、理论上最完善的编码系统，是最早研制成功、使用最为广泛的编码系统，但也是数据量最大的编码系统。

它仅仅是对输入信号进行采样（每隔一段时间间隔读一次声音的幅度）和量化（把采样得到的声音信号幅度转换成离散数字值）。

DPCM:

对预测的样本值与原始的样本值之差进行编码。

ADPCM：

DPCM编译码器对幅度急剧变化的输入信号会产生比较大的噪声，改进的方法之一就是使用自适应的预测器和量化器。

13、μ律与A律有什么共同点和不同点？

共同点：

编译码器简单，延迟时间短，音质高。

但不足之处是数据速率比较高，对传输通道的错误比较敏感。

不同点：

A律（A-Law）压扩主要用在欧洲和中国大陆等地区的数字电话通信中。

A为确定压缩量的参数，它反映最大量化间隔和最小量化间隔之比。

A律压扩的前一部分是线性的，其余部分与μ律压扩相同。

或者：

μ律（m-Law）压扩主要用在北美和日本等地区的数字电话通信中。

m为确定压缩量的参数，它反映最大量化间隔和最小量化间隔之比，通常取100≤m≤500。

由于m律压扩的输入和输出关系是对数关系，所以这种编码又称为对数PCM。

14、给出差分编码与自适应编码的思路。

语音的参数编码原理。

差分编码：

如果样本的预测值与样本的实际值比较接近，它们之间的差值幅度的变化就比原始话音样本幅度值的变化小，因此量化这种差值信号时就可以用比较少的位数来表示差值。

自适应编码：

①利用自适应的思想改变量化阶的大小，即使用小的量化阶（step-size）去编码小的差值，使用大的量化阶去编码大的差值；

②使用过去的样本值估算下一个输入样本的预测值，使实际样本值和预测值之间的差值总是最小。

参数编码：

参数编码根据对声音形成机理的分析，构造话音生成模型，该模型以一定精度模拟发话者的发声声道；接收端根据该模型还原生成语音。

15、语音的混合编码原理：

既利用了语音产生模型，通过对模型参数进行编码，减少被编码对象的动态范围和数据量，又使编码过程产生接近原始语音波形的合成语音，以保留说话人的各种自然特征，提高了语音质量。

混合编码器在4kb/s~16kb/s速率段能够得到高质量的合成语音。

16、mp3属于哪个国际标准的哪一部分

MP3全称是动态影像专家压缩标准音频层面3（MovingPictureExpertsGroupAudioLayerIII）。

它是在1991年由位于德国埃尔朗根的研究组织Fraunhofer-Gesellschaft的一组工程师发明和标准化的。

17、Dualchannel/Stereo/Jointstereo区别

Dualchannel：

由两个单声道组成，两个声道编码时不考虑相关性，每个声道的码率为音频总码率的一半。

E.gina128kbitsfileeachchanneslwoudletake64kbits。

Stereo：

由两个或多个相互独立的声道组成，每个声道的码率根据其各自编码信息量大小而定。

人耳听到时能对音源位置进行定位。

E.Grightuse48kbitsandleftuses96kbitsina128kbitsfile。

不会计算双声道之间的资料相关性，但是会协调分配双声道的资料流量，自动分配较多的Bit给复杂的声道使用。

Jointstereo：

也是由两个声道组成，但编码时兼顾了这两个声道的共同信息量，比Stereo的压缩率更高。

在这个压缩模式下，LAME会利用双声道之间的资料相关性进行演算。

左右声道资料类似时，会利用M/S（Mid/Side）编码技术，计算中央声道（L+R）和两侧声道差异（L-R）的值，并且会分配较多的Bit给中央声道，增加资料记录频宽。

18、电视广播经历了那几个发展阶段？

黑白电视TV模拟彩色电视CTV（无线卫星有线）数字电视DTV高清晰电视HDTV

19、世界上现行的模拟彩色电视制式有哪些？

它们分别是什么国家在什么时候制定的？

使用范围怎样？

20、给出各种彩色电视制式的扫描参数。

NTSC:

525（480）/30（60）；PAL、SECAM：

625（575）/25（50）。

21、为什么模拟电视要隔行扫描？

为什么它们的扫描行数必须是奇数？

为了防止对画面的闪烁感；隔行扫描要求第一场结束于最后一行的一半，不管电子束如何折回，它必须回到显示屏顶部的中央，这样就可以保证相邻的第二场扫描恰好嵌在第一场各扫描线的中间。

正是这个原因，才要求总的行数必须是奇数。

22、彩色电视采用的是什么颜色表示法？

有什么优点？

用Y、C1、C2彩色表示法分别表示亮度信号和两个色差信号；

优点：

①Y和C1、C2是独立的，因此彩色电视和黑白电视可以同时使用，Y分量可由黑白电视接收机直接使用而不需做任何进一步的处理。

②可以利用人的视觉特性来节省信号的带宽和功率，通过选择合适的颜色模型，可以使C1、C2的带宽明显低于Y的带宽，而又不明显影响重显彩色图像的观看。

23、给出HDTV的英文原文和中文译文。

HDTV：

High-DefinitionTeleVision；高清晰度电视。

24、HDTV与普通彩电的主要区别有哪些？

（HDTV定义）

图像质量大于1000线（似16mm电影）、环绕立体声、宽高比为16:

9或5:

3（似宽银幕电影）的电视；普通电视的图像质量只有5百多线、单声道或立体声、宽高比为4:

3。

25、HDTV的扫描线数是普通彩色电视的多少倍？

总信息量（像素数）又是多少倍？

HDTV的扫描线数是普通彩色电视的2倍左右，加上宽高比增加，所以总信息量（像素数）为普通彩电的5倍左右

26、HDTV一定是数字的吗（举例说明之）？

数字电视有哪些好处？

HDTV不一定是数字的，日本的HDTV方案MUSE是模拟的。

1）一个PAL制式频道可以传输8~10套压缩后的标准分辨率DTV信号，频道增加了，有条件的可开通四五百套节目，还可以加密保护.

2）图像更清晰，音质更高，观众可以通过机顶盒在普通电视机上欣赏到DVD视频效果、CD音频效果的标准清晰度电视节目.

3）功能巨大丰富，数字电视除了提供现有的电视广播节目外，还能提供许多新业务，如视频点播、上网浏览和其他信息服务。

27、现行的各种HDTV方案有一个什么共同点？

（源编码）

基于MPEG-2标准。

28、中国HDTV标准的最高图像分辨率与宽高比是多少？

（1920*1152）（5:

3）。

29、视频与电视有什么区别？

视频（video）技术研究的是与电视有关的各种设备、产品和信息等，包括录像设备和技术，录像制品，如录相带、视频光盘VCD/DVD等。

人们所收看的电视信号，实际上包括了视频和音频两个部分。

这里的视频是指电视画面的图像信息，而不包含电视中伴音。

多媒体中所说的视频主要指组成电视画面的系列图像信息。

30、视频信息处理主要包括哪些部分？

采集编辑应用。

31、常见的视频文件格式有哪些？

AVI、MPEG、DivX、MOV、ASF、WMF、RM、RMVB。

32、数字视频有哪些优点？

可用计算机来处理和播放视频信号；

行随机存储使视频的检索变得很方便；

视频和在网络上传输数字视频都不会造成质量下降；

各种数字信号的数据压缩方法进行视频压缩；

很容易进行非线性电视编辑。

33、模拟彩电的数字化标准及其代号是什么？

ITU-RBT.601标准（CCIR601/ITU-RBT.601）

34、计算PAL/NTSC制彩色电视信号的视频信号，数字化之后的数据量

或者

亮度（Y）:

864样本/行×625行/帧×25帧/秒×10比特/样本≈135兆比特/秒（PAL）

Cr（R-Y）:

429样本/行×625行/帧×25帧/秒×10比特/样本≈68兆比特/秒（PAL）

Cb（B-Y）:

429样本/行×625行/帧×25帧/秒×10比特/样本≈68兆比特/秒（PAL）

总计:

27兆样本/秒×10比特/样本=270兆比特/秒

实际上，在荧光屏上显示出来的有效图像的数据传输率并没有那么高

亮度（Y）:

720×480×30×10≈104Mb/s（NTSC）

720×576×25×10≈104Mb/s（PAL）

色差（Cr，Cb）:

2×360×480×30×10≈104Mb/s（NTSC）

2×360×576×25×10≈104Mb/s（PAL）

总计:

　～207Mb/s

如果每个样本的采样精度由10比特降为8比特，彩色数字电视信号的数据传输率就降为166Mb/s

35、该标准采用的是什么颜色空间？

各个分量的含义是什么？

用8位二进制数表示BT.601的Y‘CbCr和R’G‘B’，而R‘G’B‘颜色空间使用相同数值范围[0,219]的分量信号

R'G'B'和Y'CbCr两个彩色空间之间的转换关系用下式表示：

Y=0.299R+0.587G+0.114B+16

Cr=（0.500R-0.4187G-0.0813B）+128

Cb=（-0.1687R-0.3313G+0.500B）+128

YCbCr空间；Y:

亮度、Cb:

兰色差、Cr:

红色差。

36、该标准推荐的子采样是什么格式？

MPEG-1/2的子采样格式有什么相同和不同？

2或者4:

1；MPEG-1:

0；MPEG-2：

0；采样格式为MPEG-2的4:

0的YCbCr空间样本位置。

与MPEG-1的4:

0相比，MPEG-2的子采样在水平方向上没有半个像素的偏移。

或者：

2；4:

0——四点的几何中心/前列中心。

37、该标准的数字化参数（有效扫描参数）是多少？

或者：

720像素/行×480行/帧×30帧/秒（60I）13.5MHz（NTSC）

720像素/行×576行/帧×25帧/秒（50I）13.5MHz（PAL/SECAM）

38、给出CIF的中英文含义与扫描参数。

QCIF及SQCIF与它是什么关系？

公用中分辨率格式（CIF=CommonIntermediateFormat）；

1/4公用中分辨率格式（QCIF=Quarter-CIF）

子1/4公用中分辨率格式（SQCIF=Sub-QCIF）

39、标准的采样数据率是多少？

有效的采样数据率又是多少？

NTSC：

标准：

525行/帧,30帧/秒；

有效：

在每场的开始部分保留20扫描线作为控制信息，因此只有485条线的可视数据，实际传送图像的行数为480行。

PAL：

625行（扫描线）/帧，25帧/秒（40ms/帧）；

有效：

每一场的312.5行扫描中，有25行作场回扫，不传送图像，传送图像的行数每场只有287.5行，因此每帧只有575行有图像显示。

或者：

270Mb/s；166Mb/s。

40、MPEG-1（VCD）的扫描参数与采样数据率是多少？

数据传输率与压缩比各是多少？

或者：

352×240×30×8×1.5≈30Mb/s（NTSC）、

352×288×25×8×1.5≈30Mb/s（PAL）；

1.15Mb/s；30/1.15≈26:

1；

41、MPEG-2（DVD）的扫描参数与采样数据率是多少？

数据传输率与压缩比各是多少？

720×480×30×8×1.5≈124Mb/s（NTSC）、

720×576×25×8×1.5≈124Mb/s（PAL）；

4.1Mb/s；124/4.1≈30:

1。

42、给出AVI的中英文含义与用处。

它的英文全称为AudioVideoInterleaved，即音频视频交错格式。

用处：

可以将视频和音频交织在一起进行同步播放。

这种视频格式的优点是图像质量好，可以跨多个平台使用，但是其缺点是体积过于庞大。

43、MPEG的含义是什么？

它是由哪两个组织联合成立的？

英文全称为MovingPictureExpertGroup，动态图像专家组。

ISO（国际标准化组织）和IEC（国际电工委员会）。

44、已经公布的MPEG标准有哪些？

给出它们的含义与主要应用领域。

目前MPEG格式有三个压缩标准，分别是MPEG-1、MPEG-2、MPEG-4、MPEG-7和MPEG-21。

标准

含义

应用

MPEG-1

低分辨率数字视频编码标准

VCD

MPEG-2

高分辨率数字视频编码标准

DVD、HDTV

MPEG-4

分辨率可变的视听对象编码标准

可视电话、电视会议、网络流媒体、移动视频通信

MPEG-7

多媒体内容描述标准

基于内容的多媒体信息检索

MPEG-21

多媒体框架标准

用于不同多媒体系统的集成

45、除了MPEG标准外，还有什么视频编码的国际标准？

它们之间有关系吗？

AVI、DivX、MOV、ASF、WMF、RM、RMVB、

46、MPEG-1的视频图像采用的是什么格式？

其扫描参数是多少？

MPEG-1采用源输入格式SIF，有352*288*25；352*240*30。

47、MPEG-1/2有什么区别与联系？

主要应用各是什么？

区别于联系：

MPEG-2可以说是MPEG-1的扩充，因为它们的基本编码算法都相同。

但MPEG-2增加了许多MPEG-1所没有的功能，例如增加了隔行扫描电视的编码，提供了位速率的可分级能功能。

主要应用：

MPEG-1：

CD-I、VCD；MPEG-2：

HDTV、DVD。

48、给出MPEG-2中的配置（Profiles）和等级（Levels）的含义。

配置含义：

每种配置定义一套新的算法，

等级含义：

而每一个等级指定一套参数范围（如图像大小、帧速率和位速率）。

49、MPEG-4与MPEG-1/2的主要区别在哪里？

虽然都是视频编码，但MPEG-4基于对象，而MPEG-1/2基于像素。

它可利用很窄的带度，通过帧重建技术，压缩和传输数据，以求使用最少的数据获得最佳的图像质量。

目前MPEG-4最有吸引力的地方在于它能够保存接近于DVD画质的小体积视频文件。

另外，这种文件格式还包含了以前MPEG压缩标准所不具备的比特率的可伸缩性、动画精灵、交互性甚至版权保护等一些特殊功能。

（XX）

首次把编码对象从图像帧拓展到具有实际意义的任意形状的视频对象，从而实现从基于像素的传统编码向基于对象和内容的现代编码的转变。

（课本）

MPEG-4视频算法的核心是支持基于内容（content-based）的编码和解码功能，也就是对场景中使用分割算法抽取的单独的视听对象进行编码和解码。

50、MPEG-7/21与MPEG-1/2/4的主要区别是什么？

MPEG-1/2/4为视频编码标准，而MPEG-7/21则是针对多媒体系统与应用。

MPEG-7并不是一个视频压缩标准，它是一个多媒体内容的描述标准。

MPEG-21致力于为多媒体传输和使用定义一个标准化的、可操作的、自动化的开放框架。

MPEG-21标准实际上就是一些关键技术的集成。

51、ITU制定的视频编码标准有哪些？

其中的H.262与MPEG-2共同作为ISO/IEC13818标准；

其他标准有：

H.26x视频编码、H.32x系统、H.22x混合、H.24x控制等H系列标准，G.723音频标准和T.120数据标准等。

52、H.264标准用到了哪些新技术？

帧内预测、帧间预测与运动补偿、多参考帧、去块效应滤波器和增加图像帧类型。

53、H.264基本的编码框架？

混合编码器。

54、中国数字电视国标是？

DTMB

55、AVS的优势

相比于MPEG-2标准，AVS的编码效率提高2～3倍,并且实现方案简洁。

AVS的算法与H.264/AVC的类似，但是做了很多简化和修订，目的是为了规避国外的各种高收费专利。

56、MPEG视频数据流的结构

57、连续帧图像压缩的基本思想

（1）基于如下基本假设：

在各连续帧之间存在简单的相关性平移运动。

一个特定画面上的像素量值：

1）可以根据同帧附近像素来加以预测，被称为：

帧内编码技术。

2）可以根据附近帧中的像素来加以预测，被称为：

帧间编码技术。

（2）通过减少帧间图像数据冗余，来达到减少数据量、压缩连续帧图像体积的目的。

（3）将连续帧图像序列，分为参考帧和预测帧，参考帧用静止图像压缩方法进行压缩，预测帧对帧差图像进行压缩。

（4）由于帧差图像的数据量大大小于参考帧的数据量，从而可以达到很高的压缩比。

58、帧间运动补偿预测编码中的块匹配法的快速搜索方法有哪些？

三步法、正交搜索法、共轭方向法、二维对数法等。

59、MPEG定义的三种图像

帧内图像I（intra），预测图像P（predicted）和双向预测图像B（bidirectionallyinterpolated）。

60、变换编码（TransformerCoding）的基本思想

为消除图像数据的空间相关性，将原始数据通过正交变换映射到另一个表示空间（数学域，如频域），使数据在新的空间上尽可能相互独立，而能量集中，并且使图像数据在变换域上最大限度地不相关。

61、统计编码的基本思想

根据信息码字出现的概率分布特性，寻找概率与码字长度间的最优匹配，以此进行信息压缩，即为统计编码。

62、常用的统计编码有哪些？

霍夫曼编码、游程编码、算术编码。

63、霍夫曼编码实例

64、游程编码实例：

字符串AAABCDDDDDDDDBBBBB，可以编码为3ABC8D5B。

65、算术编码基本原理：

根据信源出现不同符号序列的概率的不同，把（0，1）区间划分为互不重叠、宽度恰好是各符号序列的概率的子区间。

信源发出的不同符号序列将与各子区间一一对应，每一个符号序列都可以用对应子区间内的任意一个实数表示，这个数就是该符号序列所对应的码字。

66、小波变换编码的基本思想：

把图像进行多分辨率分解，分解成不同空间、不同频率的子图像，然后再对子图像进行系数编码。

67、分形编码基本思想：

利用分形来描述几何形状，其中的不规则细节可以以不同的尺度和角度重复出现，这些尺度和角度可以用分形变换加以描述。

68、H.264/AVC的帧间预测和运动补偿与传统的MPEG编码的最大区别？

支持多种块结构的预测、且精确到1/4亮度像素、增加了图像帧的类型、使用多帧预测。

69、H.264/AVC的块编码用到的新技术

整数变换、哈达玛（Hadamard）变换、熵编码（CAVLC、CA

展开阅读全文