第2章--数字音频处理(第二次课)PPT文件格式下载.ppt-资源下载

第2章--数字音频处理(第二次课)PPT文件格式下载.ppt

1、人对声音频率的感觉表现为音调的高低，在音乐中称为音高。音调正是由频率所决定的。,2.1概述,音乐中音阶的划分是在频率的对数坐标（20log）上取等分而得的。如表所示，20log261=48.3，20log293=49.3等。,2.1概述,谐波与音色：no称为基波o的n次谐波分量（n就是高次谐波的方次，n o就是基波o的n次谐波），也称为泛音。音色是由混入基音的泛音所决定的。幅度与音强：信号的幅度是从信号的基线到当前波峰的距离。幅度决定了信号音量的强弱程度。幅度越大，声音越强。一般用动态范围定义相对强度：动态范围20log（信号的最大强度/信号的最小强度）（dB）,2.1概述,音宽与频带：频带宽

2、度，也称为带宽，它是描述组成复合信号的频率范围。客观上，通常用频带宽度、动态范围、信噪比等指标衡量音频信号的质量。音频信号的频带越宽，所包含的音频信号分量越丰富，音质越好。动态范围越大，信号强度的相对变化范围越大，音响效果越好。,CD-DA数字音乐、FM广播、AM广播和电话的带宽,10 20 50 200 3.4,K 7K 15K 22K f（Hz）,电话,AM,广播,CD,DA,FM,广播,图,2.3,几种音频业务的频带宽度,10 20 50 200 3.4K,7K 15K 22K f（Hz）,电话,AM,广播,CD,DA,FM,广播,图,2.3,几种音频业务的频带宽度,2.1概述,声音的质

3、量可以通过信噪比来度量。信噪比（SNR，Signal to Noise Ratio）是有用信号与噪声之比的简称，定义为：信噪比越大，声音质量越好。,2.2数字音频的获取,2.2.1采样2.2.2量化2.2.3数字音频的技术指标2.2.4数字音频的文件格式,音频信息处理结构框图,2.2.1采样,图2.5 模拟信号的采样,所谓采样就是在某些特定的时刻对模拟信号进行取值，如上图所示。采样的过程是每隔一个时间间隔在模拟声音的波形上取一个幅值，把时间上的连续信号变成时间上的离散信号。,2.2.1采样,采样时间间隔称为采样周期t，其倒数为采样频率fs=1/t。一般来讲，采样频率越高，则在单位时间内计算机得

4、到的声音样本数据就越多，对声音波形的表示也越精确，声音失真越小，但用于存储音频的数据量越大。根据奈奎斯特定理，只有采样频率高于声音信号最高频率的两倍时，才能把数字信号表示的声音还原为原来的声音。,2.2.2量化,每个采样值在幅度上进行离散化处理的过程称为量化。量化可分为均匀量化和非均匀量化。均匀量化是把将采样后的信号按整个声波的幅度等间隔分成有限个区段，把落入某个区段内的样值归为一类，并赋于相同的量化值。以8bit或16bit的方式来划分纵轴为例，其纵轴将会被划分为28个和216个量化等级，用以记录其幅度大小。,均匀量化,2.2.2量化,非均匀量化是根据信号的不同区间来确定量化间隔。对于信号值

5、小的区间，其量化间隔也小；反之，量化间隔就大。量化会引入失真，并且量化失真是一种不可逆失真，这就是通常所说的量化噪声。,模拟信号经过采样和量化，形成一系列离散信号。这种数字信号可以以一定方式进行编码，形成计算机内部存储运行的数据，经过编码后的声音信号就是数字音频信号。,2.2.3数字音频的技术指标,衡量数字音频的主要指标包括：采样频率量化位数通道（声道）个数数据传输率是计算机处理时基本参数。未经压缩的数字音频数据传输率可按下式计算：数据传输率=采样频率量化位数声道数,2.2.3数字音频的技术指标,例:假定语音信号的带宽是50 Hz10kHz，而音乐信号的是15Hz 20 kHz。采用奈奎斯

6、特频率，并用12bit表示语音信号样值，用16bit表示音乐信号样值，计算这两种信号数字化以后的比特率以及存储一段10分钟的立体声音乐所需要的存储器容量。解：语音信号：取样频率210kHz20kHz；比特率=20k12240 kbit/s 音乐信号：取样频率220kHz40kHz；比特率40kl6bit/s21280kbits（立体声-双声道）所需存储空间1280k 600896MB,2.2.4数字音频的文件格式,WAV文件格式简介 WAV是Microsoft Windows提供的音频格式。这个格式是目前通用音频格式，它通常用来保存一些没有压缩的音频。目前所有的音频播放软件和编辑软件都支持这一

7、格式。WAV文件由三部分组成：文件头（标明是WAV文件、文件结构和数据的总字节数）、数字化参数（如采样频率、声道数、编码算法等），最后是实际波形数据。一般来说，声音质量与其WAV格式的文件大小成正比。,WAVE（Waveform Audio File Format）文件是多媒体中使用的声音文件格式之一,它以RIFF格式为基础,每个WAVE文件的头四个字节为“RIFF”。WAVE文件的扩展名为“.WAV”。,WAVE 文件格式,WAVE 文件格式,Format 块,Sound 数据块,RIFF WAVE Chunk,WAVE文件由文件头和数据两部分组成。,最小的 WAVE文件结构 _|RIFF

8、WAVE Chunk|groupID=RIFF|riffType=WAVE|_|Format Chunk|ckID=fmt|_|_|Sound Data Chunk|ckID=data|_|_ _|,RIFF WAVE 块头,块标志 RIFF块大小（32-bits）Wave类型标志 WAVE,The Format（fmt）Chunk格式块（fmt）是WAVE文件必选项，描述波形文件的基本参数，如采样率、位分辨率以及通道数等。#define FormatID fmt/*chunkID for Format Chunk.*/typedef struct ID chunkID;long chunkS

9、ize;short wFormatTag;/*currently PCM*/unsigned short wChannels;/*num of channels*/unsigned long dwSamplesPerSec;/*sample rate in Hz*/unsigned long dwAvgBytesPerSec;/*xxx Bytes/s*/unsigned short wBlockAlign;/*1/2/4-8/16 mono/stereo*/unsigned short wBitsPerSample;/*bits in a sample*/*根据 wFormatTag不同,可

10、以有附加字段.*/FormatChunk;,Data Chunk数据块包含实际的波形数据：#define DataID data/*chunk ID for data Chunk*/typedef struct ID chunkID;unsigned char waveformData;DataChunk;,Offset Description-Offset Contents-0 x00 chunk id RIFF0 x04 chunk size（32-bits）0 x08 wave chunk id WAVE0 x0C format chunk id fmt 0 x10 format chu

11、nk size（32-bits）0 x14 format tag（currently PCM）0 x16 number of channels 1=mono,2=stereo0 x18 sample rate in Hz0 x1C average bytes per second-,-Offset Contents-0 x20 number of bytes per sample 1=8-bit mono 2=8-bit stereo or 16-bit mono 4=16-bit stereo 0 x22 number of bits in a sample 0 x24 data chunk

12、 id data 0 x28 length of data chunk（32-bits）0 x2C Sample data-,2.2.4数字音频的文件格式,MP3文件格式简介 MP3是第一个实用的有损音频压缩编码技术。在MP3出现之前，一般的音频编码即使以有损方式进行压缩，能达到4:1的压缩比例已经非常不错了。但是，MP3可以实现12:1的压缩比例。衡量MP3文件的压缩比例通常使用比特率来表示。通常比特率越高，压缩文件就越大，但音乐中获得保留的成分就越多，音质就越好。,2.2.4数字音频的文件格式,MIDI 文件格式简介 MIDI最初应用在电子乐器上用来记录乐手的弹奏，以便以后重播。随着在电脑

13、里面引入了支持MIDI合成的声音卡之后，MIDI才正式地成为了一种音频格式。MIDI的内容除了乐谱之外还记录了每个音符的弹奏方法。,2.2.4数字音频的文件格式,各种文件格式与WAV格式之间可以进行转换。最简单的方法就是使用WINAMP。只要WINAMP能播放某种格式的音乐，就可以通过它的Output Plugin中的Disk Writer Plugin 来输出为WAV文件。目前WINAMP支持的格式包括：VOC、WAV、MID、MP3、MP2、MP1、CD、IT、XM、S3M、STM、MOD、DSM、FAR、ULT、MTM、669、AS、WMA、MJF。,2.3音频信号压缩编码,2.3.1概

14、述2.3.3音频数据的标准,为什么要进行语音编码？,随着对音质要求的增加，信号频率范围逐渐增加，要求描述信号的数据量也就随之增加，从而带来处理这些数据的时间和传输、存储这些数据的容量增加，因此多媒体音频压缩技术是多媒体技术实用化的关键之一。,2.3.1概述,根据解压后数据是否有失真可以将音频压缩分为无损压缩（无失真压缩）和有损压缩（有失真压缩）。无损压缩的压缩效率低，但是可以无失真地重现原始数据。无损压缩的压缩效率较高，但有数据丢失。,2.3.1概述,音频信息编码技术主要可分为三类。波形编码：这种方法主要基于语音波形预测，它力图使重建的语音波形保持原有的波形状态。常用的波形编码技术有增量调制（DM）、自适应差分脉冲编码调制（ADPCM）、子带编码（SBC）和矢量量化编码（VQ）等等。,2.3.1概述,波形编码的特点是在高码率的条件下获得高质量的音频信号，适用于高保真度语音和音乐信号的压缩技术。它的优点是编码方法简单、易于实现、适应能力强、语音质量好等，缺点是压缩比相对来说较低，需要较高的编码速率。,2.3.1概述,参数编码：参数编码的方法是将音频信号以某种模型表示，再抽出合适的模型参数和参考激励信号进行编码；声音重放时，再根据这些参数重建即可。显然参数编码压缩比很高，但计算量大。它主要用于在窄带信道上提供4.8kb/s以下的低速语音通信和一些对延时要求较宽的应用场合（如卫星通

邮箱/手机：
温馨提示：	快捷下载时，用户名和密码都是您填写的邮箱或者手机号，方便查询和重复下载（系统自动生成）。如填写123，账号就是123，密码也是123。
特别说明：	请自助下载，系统不会自动发送文件的哦；如果您已付费，想二次下载，请登录后访问：我的下载记录
支付方式：
验证码：	换一换

账号：
密码：
验证码：	换一换
当日自动登录忘记密码？