郑州大学优秀毕业论文---数字化音频领域的未来.doc

上传人:b****2 文档编号:1645960 上传时间:2022-10-23 格式:DOC 页数:23 大小:457KB
下载 相关 举报
郑州大学优秀毕业论文---数字化音频领域的未来.doc_第1页
第1页 / 共23页
郑州大学优秀毕业论文---数字化音频领域的未来.doc_第2页
第2页 / 共23页
郑州大学优秀毕业论文---数字化音频领域的未来.doc_第3页
第3页 / 共23页
郑州大学优秀毕业论文---数字化音频领域的未来.doc_第4页
第4页 / 共23页
郑州大学优秀毕业论文---数字化音频领域的未来.doc_第5页
第5页 / 共23页
点击查看更多>>
下载资源
资源描述

郑州大学优秀毕业论文---数字化音频领域的未来.doc

《郑州大学优秀毕业论文---数字化音频领域的未来.doc》由会员分享,可在线阅读,更多相关《郑州大学优秀毕业论文---数字化音频领域的未来.doc(23页珍藏版)》请在冰豆网上搜索。

郑州大学优秀毕业论文---数字化音频领域的未来.doc

郑州大学优秀毕业论文

数字化音频领域的未来

Thefutureofdigitalaudiofield

学号:

学生姓名:

专业:

电子信息工程

指导教师:

提交时间:

2012.4.1

摘要

随着数字信号处理技术的日益推进,IT领域的科技成果越来越普遍的应用于视音频领域并大大的推动了视音频科技的进步,传统的模拟视音频产品如今逐渐退出,采用数字化技术及其相应产品已呈不可抵挡的趋势。

数字化的视音频产品必将涉及将类比信号转换成数字信号后加以传输的问题。

而在这种转换的过程中需要做大量的数学运算,因此必须选择运算快速的微处理器才能完成实时(real-time)的数位信号处理。

而市面上的微处理有成百上千种,各有其特色及对应的应用场合,DSP以其特有的优势更加适合于完成上述任务。

关键词:

数字化音频DSP多媒体

ABSTRACT

Alongwiththedailyadvancementofdigitalsignalprocessingtechnology,scientificandtechnologicalachievementsinthefieldofITisbecomingmoreandmorecommonusedinaudiofieldandgreatlypushtheprogressoftheaudiotechnology,traditionalanalogaudioproductsnowgraduallyexit,usingdigitaltechnologyanditscorrespondingproductsisatrendwhichcannotresist.Digitalaudioproductswillinvolvethetransmissionproblemofwhenanalogysignalisconvertedintodigitalsignals.Andinthiskindofconversionofprocessneededtodoalotofmathematicaloperation,sowemustchooseoperationquickmicroprocessortocompletereal-timedigitalsignalprocessing.Andthemicroinmarkethashundredsofkinds,eachhaveitscharacteristicsandcorrespondingapplications,DSP,withitsspecialadvantagesisbecomingmoresuitabletoaccomplishthesetasks.

Keywords:

digitalaudioDSPmultimedia

目录

第一章绪论 4

1.1模拟音频数字化的过程 4

1.2数字化音频领域的未来 6

第二章数字音频协议与芯片功能介绍 10

2.1TDM数字音频协议 10

2.2在基于AD1941时分复用多通道数字音频处理模块设计 11

2.3音频处理模块编写 13

第三章多媒体中数字化音频技术的应用 14

3.1计算机音乐的应用现状 14

第四章数字化音频的未来-DSP 18

4.1DSP的优势 18

4.2DSP技术的发展趋势 22

第五章结论 23

致谢 23

第一章绪论

1.1音频数字化的概念

从字面上来说,数字化(Digital)就是以数字来表示,例如用数字去记录一张桌子的长宽尺寸,各木料间的角度,这就是一种数字化。

跟数位常常一起被提到的字是模拟(Analog/Analogue),模拟的意思就是用一种相似的东西去表达,例如将桌子用传统相机将三视图拍下来,就是一种模拟的记录方式。

两个概念:

1、分贝(dB):

声波振幅的度量单位,非绝对、非线性、对数式度量方式。

以人耳所能听到的最静的声音为1dB,那么会造成人耳听觉损伤的最大声音为100dB。

人们正常语音交谈大约为20dB。

10dB意味着音量放大10倍,而20dB却不是20倍,而是100倍(10的2次方)。

2、频率(Hz):

人们能感知的声音音高。

男性语音为180Hz,女性歌声为600Hz,钢琴上C调至A调间为440Hz,电视机发出人所能听到的声音是17kHz,人耳能够感知的最高声音频率为20kHz。

将音频数字化,其实就是将声音数字化。

最常见的方式是透过脉冲编码调制PCM(PulseCodeModulation)。

运作原理如下。

首先我们考虑声音经过麦克风,转换成一连串电压变化的信号,如图一所示。

这张图的横座标为秒,纵座标为电压大小。

要将这样的信号转为PCM格式的方法,是先以等时距分割。

我们假设用每0.01秒分割,则得到图二。

图一

图二

我们把分割线与信号图形交叉处的座标位置记录下来,可以得到如下资料,(0.01,11.65),(0.02,14.00),(0.03,16.00)、(0.04,17.74)…..(0.18,15.94)、(0.19,17.7),(0.20,20)。

由于我们已经知道时间间隔是固定的0.01秒,因此我们只要把纵座标记录下来就可以了,得到的结果就是11.6514.0016.0017.7419.0019.8920.3420.0719.4418.5917.4716.3115.2314.4313.8913.7114.4915.9417.7020.00这一数列。

这一串数字就是将以上信号数字化的结果。

在以上的范例中,我们的采样频率是100Hz(1/0.01秒)。

其实电脑中的.WAV档的内容就是类似这个样子,文件头中记录了采样频率和可容许最大记录振幅,后面就是一连串表示振幅大小的数字,有正有负。

常见CD唱盘是以PCM格式记录,而它的采样频率(SampleRate)是44100Hz,振幅采样精度/数位是16Bits,也就是说振幅最小可达-32768,最大可达+32767。

CD唱盘是以螺旋状由内到外储存资料,可以存储74分钟的音乐。

CD唱盘的规格为什么是44.1kHz、16Bits呢?

关于44.1kHz这个数字的选取分为两个层面。

首先人耳的聆听范围是20Hz到20kHz,根据NyquistFunctions,理论上只要用40kHz以上的采样频率就可以完整记录20kHz以下的信号。

那么为什么要用44.1kHz这个数字呢?

那是因为在CD发明前硬盘还很贵,所以主要将数字音频信号储存媒体是录像带,用黑白来记录0与1。

而当时的录像带格式为每秒30张,而一张图又可以分为490条线,每一条线又可以储存三个取样信号,因此每秒有30*490*3=44100个取样点,而为了研发的方便,CD唱盘也继承了这个规格,这就是44.1kHz的由来。

在这里我们可以发现无论使用多么高的采样精度/数位,记录的数字跟实际的信号大小总是有误差,因此数字化无法完全记录原始信号。

我们称这个数字化造成失真称为量化失真。

数字化的最大好处是资料传输与保存的不易失真。

记录的资料只要数字大小不改变,记录的资料内容就不会改变。

如果我们用传统类比的方式记录以上信号,例如使用录音带表面的磁场强度来表达振幅大小,我们在复制资料时,无论电路设计多么严谨,总是无法避免杂讯的介入。

这些杂讯会变成复制后资料的一部份,造成失真,且复制越多次信噪比(信号大小与噪音大小的比值)会越来越低,资料的细节也越来越少。

如果多次复制过录音带,对以上的经验应该不陌生。

在数字化的世界里,这串数字转换为二进制,以电压的高低来判读1与0,还可以加上各种检查码,使得出错机率很低,因此在一般的情况下无论复制多少次,资料的内容都是相同,达到不失真的目的。

那么,数字化的资料如何转换成原来的音频信号呢?

在计算机的声卡中一块芯片叫做DAC(DigitaltoAnalogConverter),中文称数模转换器。

DAC的功能如其名是把数字信号转换回模拟信号。

我们可以把DAC想像成16个小电阻,各个电阻值是以二的倍数增大。

当DAC接受到来自计算机中的二进制PCM信号,遇到0时相对应的电阻就开启,遇到1相对应的电阻不作用,如此每一批16Bits数字信号都可以转换回相对应的电压大小。

我们可以想像这个电压大小看起来似乎会像阶梯一样一格一格,跟原来平滑的信号有些差异,因此再输出前还要通过一个低通滤波器,将高次谐波滤除,这样声音就会变得比较平滑了。

从前面的内容可以看出,音频数字化就是将模拟的(连续的)声音波形数字化(离散化),以便利用数字计算机进行处理的过程,主要包参数括采样频率(SampleRate)和采样数位/采样精度(Quantizing,也称量化级)两个方面,这二者决定了数字化音频的质量。

采样频率是对声音波形每秒钟进采样的次数。

根据这种采样方法,采样频率是能够再现声音频率的一倍。

人耳听觉的频率上限在2OkHz左右,为了保证声音不失真,采样频率应在4OkHz左右。

经常使用的采样频率有11.025kHz、22.05kHz和44.lkHz等。

采样频率越高,声音失真越小、音频数据量越大。

采样数位是每个采样点的振幅动态响应数据范围,经常采用的有8位、12位和16位。

例如,8位量化级表示每个采样点可以表示256个(0-255)不同量化值,而16位量化级则可表示65536个不同量化值。

采样量化位数越高音质越好,数据量也越大。

反映音频数字化质量的另一个因素是通道(或声道)个数。

记录声音时,如果每次生成一个声波数据,称为单声道;每次生成二个声波数据,称为立体声(双声道),立体声更能反映人的听觉感受。

除了上述因素外,数字化音频的质量还受其它一些因素(如扬声器质量,麦克风优劣,计算机声卡A/D与D/A(模/数、数/模)转换芯片品质,各个设备连接线屏蔽效果好坏等)的影响。

综上所述,声音数字化的采样频率和量化级越高,结果越接近原始声音,但记录数字声音所需存储空间也随之增加。

可以用下面的公式估算声音数字化后每秒所需的存储量(假定不经压缩):

存储量=(采样频率*采样数位)/8(字节数)

若采用双声道录音,存储量再增加一倍。

例如,数字激光唱盘(CD-DA,红皮书标准)的标准采样频率为44.lkHz,采样数位为16位,立体声,可以几乎无失真地播出频率高达22kHz的声音,这也是人类所能听到的最高频率声音。

激光唱盘一分钟音乐需要的存储量为:

44.1*1000*l6*2*60/8=10,584,000(字节)=10.584MBytes

这个数值就是微软Windows系统中WAVE(.WAV)声音文件在硬盘中所占磁盘空间的存储量。

由MICROSOFT公司开发的WAV声音文件格式,是如今计算机中最为常见的声音文件类型之一,它符合RIFF文件规范,用于保存WINDOWS平台的音频信息资源,被WINDOWS平台机器应用程序所广泛支持。

另外,WAVE格式支持MSADPCM、CCIPTALAW、CCIPT-LAW和其他压缩算法,支持多种音频位数,采样频率和声道,但其缺点是文件体积较大,所以不适合长时间记录。

因此,才会出现各种音频压缩编/解码技术的出现,例

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 工程科技 > 材料科学

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1