各种音频编码方式的对比.docx
《各种音频编码方式的对比.docx》由会员分享,可在线阅读,更多相关《各种音频编码方式的对比.docx(10页珍藏版)》请在冰豆网上搜索。
各种音频编码方式的对比
各种音频编码方式的对比
WindowsMediaPlayer做其强大的后盾,所以一经推出就赢得一片喝彩。
ADPCM(自适应差分PCM)
类型:
Audio
制定者:
ITU-T
所需频宽:
32Kbps
特性:
ADPCM(adaptivedifferencepulsecodemodulation)综合了APCM的自适应特性和DPCM系统的差分特性,是一种性能比较好的波形编码。
它的核心想法是:
①利用自适应的思想改变量化阶的大小,即使用小的量化阶(step-size)去编码小的差值,使用大的量化阶去编码大的差值;
②使用过去的样本值估算下一个输入样本的预测值,使实际样本值和预测值之间的差值总是最小。
优点:
算法复杂度低,压缩比小(CD音质>400kbps),编解码延时最短(相对其它技术)
缺点:
声音质量一般
应用领域:
voip
版税方式:
Free
备注:
ADPCM(ADPCMAdaptiveDifferentialPulseCodeModulation),是一种针对16bit(或者更高?
)声音波形数据的一种有损压缩算法,它将声音流中每次采样的16bit数据以4bit存储,所以压缩比1:
4而压缩/解压缩算法非常的简单,所以是一种低空间消耗,高质量声音获得的好途径。
LPC(LinearPredictiveCoding,线性预测编码)
类型:
Audio
制定者:
所需频宽:
2Kbps-4.8Kbps
特性:
压缩比大,计算量大,音质不高,廉价
优点:
压缩比大,廉价
缺点:
计算量大,语音质量不是很好,自然度较低
应用领域:
voip
版税方式:
Free
备注:
参数编码又称为声源编码,是将信源信号在频率域或其它正交变换域提取特征参数,并将其变换成数字代码进行传输。
译码为其反过程,将收到的数字序列经变换恢复特征参量,再根据特征参量重建语音信号。
具体说,参数编码是通过对语音信号特征参数的提取和编码,力图使重建语音信号具有尽可能高的准确性,但重建信号的波形同原语音信号的波形可能会有相当大的差别。
如:
线性预测编码(LPC)及其它各种改进型都属于参数编码。
该编码比特率可压缩到2Kbit/s-4.8Kbit/s,甚至更低,但语音质量只能达到中等,特别是自然度较低。
CELP(CodeExcitedLinearPrediction码激励线性预测编码)
类型:
Audio
制定者:
欧洲通信标准协会(ETSI)
所需频宽:
4~16Kbps的速率
特性:
改善语音的质量:
①对误差信号进行感觉加权,利用人类听觉的掩蔽特性来提高语音的主观质量;
②用分数延迟改进基音预测,使浊音的表达更为准确,尤其改善了女性语音的质量;
③使用修正的MSPE准则来寻找“最佳”的延迟,使得基音周期延迟的外形更为平滑;
④根据长时预测的效率,调整随机激励矢量的大小,提高语音的主观质量;
⑤使用基于信道错误率估计的自适应平滑器,在信道误码率较高的情况下也能合成自然度较高的语音。
结论:
①CELP算法在低速率编码环境下可以得到令人满意的压缩效果;
②使用快速算法,可以有效地降低CELP算法的复杂度,使它完全可以实时地实现;
③CELP可以成功地对各种不同类型的语音信号进行编码,这种适应性对于真实环境,尤其是背景噪声存在时更为重要。
优点:
用很低的带宽提供了较清晰的语音
缺点:
-
应用领域:
voip
版税方式:
Free
备注:
1999年欧洲通信标准协会(ETSI)推出了基于码激励线性预测编码(CELP)的第三代移动通信语音编码标准自适应多速率语音编码器(AMR),其中最低速率为4.75kb/s,达到通信质量。
CELP码激励线性预测编码是CodeExcitedLinearPrediction的缩写。
CELP是近10年来最成功的语音编码算法。
CELP语音编码算法用线性预测提取声道参数,用一个包含许多典型的激励矢量的码本作为激励参数,每次编码时都在这个码本中搜索一个最佳的激励矢量,这个激励矢量的编码值就是这个序列的码本中的序号。
CELP已经被许多语音编码标准所采用,美国联邦标准FS1016就是采用CELP的编码方法,主要用于高质量的窄带语音保密通信。
CELP(Code-ExcitedLinearPrediction)这是一个简化的LPC算法,以其低比特率著称(4800-9600Kbps),具有很清晰的语音品质和很高的背景噪音免疫性。
CELP是一种在中低速率上广泛使用的语音压缩编码方案。
MPEG-1audiolayer1
类型:
Audio
制定者:
MPEG
所需频宽:
384kbps(压缩4倍)
特性:
编码简单,用于数字盒式录音磁带,2声道,VCD中使用的音频压缩方案就是MPEG-1层Ⅰ。
优点:
压缩方式相对时域压缩技术而言要复杂得多,同时编码效率、声音质量也大幅提高,编码延时相应增加。
可以达到“完全透明”的声音质量(EBU音质标准)
缺点:
频宽要求较高
应用领域:
voip
版税方式:
Free
备注:
MPEG-1声音压缩编码是国际上第一个高保真声音数据压缩的国际标准,它分为三个层次:
--层1(Layer1):
编码简单,用于数字盒式录音磁带
--层2(Layer2):
算法复杂度中等,用于数字音频广播(DAB)和VCD等
--层3(Layer3):
编码复杂,用于互联网上的高质量声音的传输,如MP3音乐压缩10倍
MUSICAM(MPEG-1audiolayer2,即MP2)
类型:
Audio
制定者:
MPEG
所需频宽:
256~192kbps(压缩6~8倍)
特性:
算法复杂度中等,用于数字音频广播(DAB)和VCD等,2声道,而MUSICAM由于其适当的复杂程度和优秀的声音质量,在数字演播室、DAB、DVB等数字节目的制作、交换、存储、传送中得到广泛应用。
优点:
压缩方式相对时域压缩技术而言要复杂得多,同时编码效率、声音质量也大幅提高,编码延时相应增加。
可以达到“完全透明”的声音质量(EBU音质标准)
缺点:
应用领域:
voip
版税方式:
Free
备注:
同MPEG-1audiolayer1
MP3(MPEG-1audiolayer3)
类型:
Audio
制定者:
MPEG
所需频宽:
128~112kbps(压缩10~12倍)
特性:
编码复杂,用于互联网上的高质量声音的传输,如MP3音乐压缩10倍,2声道。
MP3是在综合MUSICAM和ASPEC的优点的基础上提出的混合压缩技术,在当时的技术条件下,MP3的复杂度显得相对较高,编码不利于实时,但由于MP3在低码率条件下高水准的声音质量,使得它成为软解压及网络广播的宠儿。
优点:
压缩比高,适合用于互联网上的传播
缺点:
MP3在128KBitrate及以下时,会出现明显的高频丢失
应用领域:
voip
版税方式:
Free
备注:
同MPEG-1audiolayer1
MPEG-2audiolayer
类型:
Audio
制定者:
MPEG
所需频宽:
与MPEG-1层1,层2,层3相同
特性:
MPEG-2的声音压缩编码采用与MPEG-1声音相同的编译码器,层1、层2和层3的结构也相同,但它能支持5.1声道和7.1声道的环绕立体声。
优点:
支持5.1声道和7.1声道的环绕立体声
缺点:
-
应用领域:
voip
版税方式:
按个收取
备注:
MPEG-2的声音压缩编码采用与MPEG-1声音相同的编译码器,层1、层2和层3的结构也相同,但它能支持5.1声道和7.1声道的环绕立体声。
AAC(AdvancedAudioCoding,先进音频编码)
类型:
Audio
制定者:
MPEG
所需频宽:
96-128kbps
特性:
AAC可以支持1到48路之间任意数目的音频声道组合、包括15路低频效果声道、配音/多语音声道,以及15路数据。
它可同时传送16套节目,每套节目的音频及数据结构可任意规定。
AAC主要可能的应用范围集中在因特网网络传播、数字音频广播,包括卫星直播和数字AM、以及数字电视及影院系统等方面。
AAC使用了一种非常灵活的熵编码核心去传输编码频谱数据。
具有48个主要音频通道,16个低频增强通道,16个集成数据流,16个配音,16种编排。
优点:
支持多种音频声道组合,提供优质的音质
缺点:
-
应用领域:
voip
版税方式:
一次性收费
备注:
AAC于1997年形成国际标准ISO13818-7。
先进音频编码(AdvancedAudioCoding--AAC)开发成功,成为继MPEG-2音频标准(ISO/IEC13818-3)之后的新一代音频压缩标准。
在MPEG-2制订的早期,本来是想将其音频编码部分保持与MPEG-1兼容的。
但后来为了适应演播电视的要求而将其定义成为一个可以获得更高质量的多声道音频标准。
理所当然地,这个标准是不兼容MPEG-1的,因此被称为MPEG-2AAC。
换句话说,从表面上看,要制作和播放AAC,都需要使用与MP3完全不同的工具。
HR
类型:
Audio
制定者:
飞利浦
所需频宽:
8Kbps
特性:
以增加GSM网络容量为目的,但是会损害语音质量;由于现在网络频率紧缺,一些大的运营商已经在大城市密集地带开通此方式以增加容量。
优点:
系统容量大
缺点:
语音质量差
应用领域:
GSM
版税方式:
按个收费
备注:
HR半速率,是一种GSM语音编码方式。
FR
类型:
Audio
制定者:
飞利浦
所需频宽:
13Kbps
特性:
是一般的GSM手机的通信编码方式,可以获得达到4.1左右Qos的语音通信质量(国际电联规定语音通信质量Qos满分为5)
优点:
语音质量得到了提高
缺点:
系统容量降低
应用领域:
GSM
版税方式:
按个收费
备注:
FR全速率,是一种GSM语音编码方式
EFR
类型:
Audio
制定者:
飞利浦
所需频宽:
13Kbps
特性:
用于GSM手机基于全速率13Kbps的语音编码和发送,可以获得更好更清晰的语音质量(接近Qos4.7)需要网络服务商开通此项网络功能,手机才能配合实现。
优点:
音质好
缺点:
需要网络服务商开通此项网络功能,且系统容量降低
应用领域:
GSM
版税方式:
按个收费
备注:
EFR增强型全速率,一种GSM网络语音的编码方式。
GSM-AMR(AdaptiveMulti-Rate)
类型:
Audio
制定者:
飞利浦
所需频宽:
8Kbps(4.75Kbps~12.2Kbps)
特性:
可以对语音进行替换和消音,平滑噪音,支持间断式传输,对语音进行动态侦查。
能在各种网络条件下提供优质的语音效果。
优点:
音质出色
缺点:
-
应用领域:
GSM
版税方式:
按个收费
备注:
GSM-ASM是一种广泛使用在GPRS和W-CDMA网络上的音频标准。
在规范ETSIGSM06.90中对GSM-AMR进行了定义。
AMR语音编码是GSM2+和WCDMA的默认编码标准,是第三代无线通讯系统的语音编码标准。
GSM-AMR标准基于ACELP(代数激励线性预测)编码。
它能在广泛的传输条件下提供高品质的语音效果。
EVRC(EnhancedVariableRateCoder,增强型可变速率编码器)
类型:
Audio
制定者:
美国Qualcomm通信公司(即高通)
所需频宽:
8Kbps或13Kbps
特性:
支持三种码率(9.6Kbps,4.8Kbps和1.2Kbps),噪声抑制,邮件过滤。
能在各种网络条件下提供优质的语音效果。
优点:
音质出色
缺点:
-
应用领域:
CDMA
版税方式:
按个收费
备注:
EVRC编码广泛使用于CDMA网络。
EVRC标准遵循规范TIAIS-127的内容。
EVRC编码基于RCELP(松弛码激励线性预测)标准。
该编码可以以Rate1(171bits/packet),Rate1/2(80bits/packet)或是Rate1/8(16bits/packet)的容量进行操作。
在要求下,它也能产生空包(0bits/packet)。
QCELP(QualCommCodeExcitedLinearPredictive,受激线性预测编码)
类型:
Audio
制定者:
美国Qualcomm通信公司(即高通)
所需频宽:
8k的语音编码算法(可工作于4/4.8/8/9.6Kbps等固定速率上,而且可变速率地工作于800Kbps~9600Kbps之间)
特性:
使用适当的门限值来决定所需速率。
QCELP是一种8k的语音编码算法(可以在8k的速率下提供接近13k的话音压缩质量)。
这是一种可变速率话音编码,根据人的说话特性(大家应该能够体会我们日常的沟通和交流时并不是一直保持某种恒定的方式讲话,有间断、有不同的声音频率等都是人的自然表达)而采取的一种优化技术。
优点:
话音清晰、背景噪声小,系统容量大
缺点:
不是Free
应用领域:
CDMA
版税方式:
每年支付一笔使用权费用
备注:
QCELP,即QualcommCodeExcitedLinearPredictive(Qualcomm受激线性预测编码)。
美国Qualcomm通信公司的专利语音编码算法,是北美第二代数字移动电话(CDMA)的语音编码标准(IS95)。
这种算法不仅可工作于4/4.8/8/9.6kbit/s等固定速率上,而且可变速率地工作于800bit/s~9600bit/s之间。
QCELP算法被认为是到目前为止效率最高的一种算法,它的主要特点之一,是使用适当的门限值来决定所需速率。
门限值随背景噪声电平变化而变化,这样就抑制了背景噪声,使得即使在喧闹的环境中,也能得到良好的话音质量,CDMA8Kbit/s的话音近似GSM13Mbit/s的话音。
CDMA采用QCELP编码等一系列技术,具有话音清晰、背景噪声小等优势,其性能明显优于其他无线移动通信系统,语音质量可以与有线电话媲美。
无线辐射低。