基于DSP的实时语音处理系统的设计.docx

上传人:b****5 文档编号:8565419 上传时间:2023-01-31 格式:DOCX 页数:31 大小:248.66KB
下载 相关 举报
基于DSP的实时语音处理系统的设计.docx_第1页
第1页 / 共31页
基于DSP的实时语音处理系统的设计.docx_第2页
第2页 / 共31页
基于DSP的实时语音处理系统的设计.docx_第3页
第3页 / 共31页
基于DSP的实时语音处理系统的设计.docx_第4页
第4页 / 共31页
基于DSP的实时语音处理系统的设计.docx_第5页
第5页 / 共31页
点击查看更多>>
下载资源
资源描述

基于DSP的实时语音处理系统的设计.docx

《基于DSP的实时语音处理系统的设计.docx》由会员分享,可在线阅读,更多相关《基于DSP的实时语音处理系统的设计.docx(31页珍藏版)》请在冰豆网上搜索。

基于DSP的实时语音处理系统的设计.docx

基于DSP的实时语音处理系统的设计

 

摘要·································································Ⅲ

ABSTRACT·····························································Ⅳ

1绪论

1.1语音处理研究状况······················································1

1.2语音处理的硬件基础和应用··············································4

2系统硬件部分概述

2.1DSP系统设计概述······················································6

2.2系统的总体构成·······················································7

2.3硬件系统核心芯片的选择···············································8

2.4实时语音处理的基本要求···············································9

3设计部分

3.1设计目的和要求·······················································10

3.2设计原理·····························································10

3.3设计内容·····························································11

3.3.1理论依据··························································11

3.3.2信号特征分析······················································11

3.3.3方案设计··························································11

3.3.4方案论证··························································12

3.3.5器件选型(硬件电路的设计)·········································13

4软件设计

4.1DSP软件开发工具和编程特点··········································25

4.2软件设计···························································26

4.3DSP初始化··························································27

4.4音频采集程序·······················································30

4.5TMS320VC5402的并行引导装载分析和设计·······························32

总结与致谢·····························································34

参考文献·······························································35

附录··································································36

 

摘要

提出一个基于TMS320VC5402的音频信号采集与处理系统。

介绍了该系统的总体方案和硬软件设计。

讨论了模/数(A/D)和数/模(D/A)转换电路的设计方法以及如何利用TMS320VC5402的多通道缓冲同步串口(McBSP)和PCM1800及PCM1744芯片接口来实现音频信号的采集和输出。

实验证明:

所设计的基于DSP的硬件和软件系统是一个很好的音频信号采集与处理系统。

关键词:

多通道缓冲同步串口;音频信号;TMS320VC5402;采集与处理

 

DSP-basedreal-timevoiceprocessingsystem

Abstract

Abstract:

ATMS320VC5402-basedaudiosignalacquisitionandprocessingsystem.Describesthegeneralschemeofthesystemandthehardwareandsoftwaredesign.Discussedtheanalog/digital(A/D)anddigital/analog(D/A)convertercircuitdesignandhowtouseTMS320VC5402multi-channelsynchronousserialportbuffer(McBSP)andthePCM1800andPCM1744chipinterfaceforaudiosignalacquisitionandOutput.Experimentalresultsshow:

thedesignedDSP-basedhardwareandsoftwaresystemisagoodaudiosignalacquisitionandprocessingsystem.

Keywords:

Simultaneousmulti-channelbufferedserialport;audiosignal;TMS320VC5402;acquisitionandprocessing

1绪论

1.1语音处理的研究状况

语音是人类进行信息交流最直接、最方便、最有效的工具,语音信号是携带语音信息的语音声波。

在信息化时代,人们也期望用这种最便捷的信息交流工具和各种信息存储、处理的设备和终端进行信息交互。

语音信号处理研究如何能更加有效地产生、传输和获取语音信息的一门学科。

它涉及数字信号处理、语言学、语音学,生理学、心理学、模式识别以及人工智能等多个学科的知识,是信息技术学科中发展最为迅速的一个领域。

语音信号处理内容非常广泛,它包含语音识别语音合成,此外还有语音压缩编码、语音理解、说话人识别、语音增强等各个分支,总的来说语音信号处理包含了语音信号的数字表示方法,语音信号处理的各种方法和技术以及语音处理理论和技术在各个领域中的实际应用。

语音信号的处理最早可以追溯到1874年电话的发明,电话的理论基础是尽可能不失真地传送语音波形。

直到1939年Dudley发明声码器,通道声码器技术取代了“波形原则”的处理方法,它的理论基础认为语音是由人的声带振动产生的声源(载波)受到不断变化的声道的控制(调制)而产生的,这一概念就是以后迅速发展起来,并广泛应用到各种理论研究和应用实际过程中的语音参数模型的雏形,由此人们开始了语音合成和语音压缩编码的研究。

上个世纪60年代中期数字信号处理的方法和技术取得突破性进展,主要是快速傅立叶变换算法的成功应用。

出现了第一台以数字计算机为基础的孤立词语音识别器,随后又成功研制出第一台有限连续语音识别器。

70年代初,Flanagan出版的重要著作《语音分析合成和感知》,奠定了数字语音处理的系统理论基础。

与此同时,倒谱分析技术和线性预测技术在语音处理中得到成功应用,微电子和集成电路技术取得新的进展,高性价比的微处理器芯片和性能优异的专用信号处理芯片不断问世,再次推动了

语音信号处理技术的发展和应用。

语音识别ASR以语音为研究对象,它是语音信号处理的一个重要研究领域,是模式识别的一个分支,涉及到生理学、心理学、语言学、计算机科学以及信号处理等诸多领域,甚至还涉及到人的体态语言(如人在说话时的表情、手势等行为动作可帮助对方理解),其最终日标是实现人与机器进行自然语言通信,让人机交互界面更加自然和容易使用。

语音识别是语音处理中的难点,对它的研究开始的比较晚,但它的一些研究方法和结果可以运用到另外的研究分支中去,因此也是语音处理研究中的重点。

1952年贝尔实验室的Davis等人首次研制成功能识别十个英语数字的特定人孤立数字识别系统,该系统的成功研制标志着人们开始语音识别的研究工作。

此后很长的时间里,语音识别的研究方法主要是用特殊的硬件获取语音信号的特征参数,再在计算机上进行模板匹配和判决,由于受当时计算机技术和信息处理理论的限制,语音识别一直未取得突破性进展。

直到上个世纪70年代,动态时间归正技术(DTW)算法、线性预测分析技术(LPC)理论、LPC频谱分析、隐马尔可夫模型(HMM)、人工神经元网络(ANN)、矢量量化(V-Q)等理论,并在语音识别中成功运用,开创了语音识别研究的新局面,语音识别系统的识别率得到了显著的提高。

此后语音识别系统由原来的特定人小词汇量孤立词的系统发展到能进行非特定人、大词汇量、连续语音识别。

1988年美国卡内基-梅隆大学运用VQ和HMM技术研制出了非特定人、大词汇量、连续语音识别系统.SPHINX系统,它可以理解由1000个单词构成的4200个句子,是语音识别历史的一个里程碑。

我国语音识别理论研究和应用起步较晚,但由于汉语具有音节种类较少的特点,汉语是单音节语言,汉语中音节数只有400个,加上音调才1200个,词是由音节组合成,

便予以音节识别为基础实现大词汇的语音识别,因此,进展较快。

清华大学、中国科学院声学所和西安电子科技大学相继成功研制出无限词汇的汉语听写机。

四达公司在90年代初推出首批汉语听写机之后,与哈尔滨工业大学合作研制出具有自然理解能力的新产品。

模识科技公司PattekASR中文语音识别产品,它面向不同计算平台和应用,具有国际先进水准,是我国第一个拥有完全自主知识产权的语音识别技术产品。

模识科技公司此次推出的产品具有识别率高、对环境噪声和不同口音适应能力强、系统占用资源少等特点,PattekASR对方言的识别率在95%以上。

只要对现有的手机、家电、电话总机稍作改装,就可以用语音命令上网查阅资料、控制电视、接通电话分机,国外一些著名的大公司纷纷加大对汉语语音识别研究的投入。

进入上个世纪90年代,随着多媒体时代的来临,语音识别系统由实验室走向实用。

许多发达国家和一些公司如美国、日本、韩国以及IBM、Apple、AT&T、NTT等著名公司都为语音识别系统的实用化开发研究投以巨资,其中语音识别软件的发展最为迅速。

语音识别软件是语音识别理论和计算机技术相结合的产物。

IBM公司于1997年开发汉语ViaVoice语音识别系统,次年又开发出可以识别上海话、广东话和四川话等地方口音的语音识别系统ViaVoice‘98,平均识别率可达到95%。

该系统对新闻语音识别具有较高的精度,是目前具有代表性的汉语连续语音识别系统。

IBM宣布,为增强网络浏览和语音电子邮件的功能,将推出其新一代语音识别软件。

可使用户通过语音,而不是使用键盘来浏览网络、切换应用程序、执行命令、口授邮件和文本文件等操作。

Microsoft也在语音识别研究领域进行了投资,其开发的windowsxp语音识别技术,可以在包括word在内的所有应用程序的文本信息的区域——记事本、InternetExplorer地址栏和OutlookExpress——内使用口述输入方式,来替代传统的键盘、鼠标按钮输入方式。

SpeechWork公司的代表产品SpeechWork6,利用该产品,用户可以在没服务人员介入的情况下,用自然语言同系统进行信息交互.完成诸如旅游预约、股票交易、银行服务、订票服务等。

市场上还出现了语音识别电话、语音识别记事本等产品,如美国VPTC公司的VoiceOrganizer和法国的Parrot等。

语音合成是最早被研究的语音处理分支,它研究的主要内容是让人们通过听觉来获取以其他形式表示的信息。

最早的语音合成是用机械的方式模拟人的发声过程而产生声音。

1939年Dudley发明的声码器,用电子线路产生语音的声源,并构成滤波器模拟声道的滤波作用。

现代的语音合成都是基于计算机技术的语音处理过程。

由D.Klatt设计的串、并联混合,是语音合成研究中最具代表性的工作。

20世纪90年代末,日本的一些研究学者提出一种少样本、不等长语音拼接合成技术—PS0LA,该方法来源于利用短时傅立叶变换重构信号的叠接相加法。

当前汉语语音合成系统中,合成效果较好的都是采用波形拼接的合成技术,文本--语音转换系统(TTS)是语音合成的一个重要应用形式。

语音合成的应用领域十分广泛,如:

自动报警、报时、车站机场广播、电话查询业务以及各种电子出版物的语音朗读等。

语音压缩编码是伴随语音的数字化而产生的,它的研究和语音合成一样起源于1939年Dudley发明的声码器,若简单地由连续语音信号抽样量化得到的数字语音信号传输和存储,就会占用太多的信道资源和存储空间。

研究表明语音信号中含有大量的冗余信息,如何采用各种编码技术,在保证尽量少的失真并具有一定的可懂度和自然度的情况下,减少语音信号的冗余度,成为语音压缩编码的主要内容。

最早研究和使用的编码方法是不依赖语音产生模型假定,以PCM和ADPCM为代表的波形编码技术,它的编码数率较高,一般在16kb/s~64kb/s,具有语音音质高、抗躁能力强的特点。

1974年,LPC编码首次用于分组语音通信,传输数率达到3.5kb/s,实现了低速的编码。

一些以LPC以及由其改进和演变的混合编码为代表的基于模型假定的编码方法,可以更大程度上减少语音信号的冗余度,使低速率传输、存储语音信息成为可能。

美国在1980年公布了一种2.4kb/s的线性预测编码技术后,于1988年又公布一个4.8kb/s的码激励线性预测编码(CELP)语音编码算法,随后欧洲也推出了16kb/s的规则脉冲激励(RELP)线性预测编码算法。

这些语音编码算法具有较好的可懂度和自然度。

随着对低速率语音编码算法研究的深入和计算机网络技术的迅速发展,语音信号经过压缩后在互联网上以数据包的形式传输,就形成了IP电话,它用VOIP技术实现的通过TCP/IP网络以不同于传统的电话网来传输语音信号。

由此衍生出在网络环境下的语音识别和语音压缩编码,成为语音处理新的发展方向。

20世纪90年代,针对不同的应用,国际电联和一些地区标准协会制定一系列语音压缩编码标准,如数码率为5.3-6.4kb/s的G.723.1,以及数码率为8kb/s的G.729.等,这些标准的制订保证了应用在通信网中的各种语音编码具有良好的兼容性。

语音处理的研究取得很大的成绩,一些应用也取得突破性的进展,有很多有关的研究成果已实现商品化生产并投放市场,取得较好的经济效益和社会效益。

一些信息科学中的新出现的理论和处理方法引入语音处理的研究中,如小波分析、分形理论以及语音信号的非线性处理方法。

由于语音本身和应用环境的复杂多变,语音处理系统的性能还是有很多不尽人意的地方,用它来解决实际问题还是有很多困难,如无限词汇汉语合成中连续语流中各基音轮廓的平滑过渡问题,语音识别系统的适应性差,主要体现在对环境依赖性强,高噪声环境下语音处理的进展缓慢。

1.2语音处理的硬件基础和应用

绝大多数语音信号数字处理系统有很高的实时性要求,要对输入的语音信号做出快速的反应,因此系统工作在实时方式(在线方式)下,就对系统所采用硬件的性能要求很高,包括处理速度和存储容量等。

语音处理所要完成的任务越来越复杂,处理效果的要求不断提高,语音处理算法也随之日益复杂,它会要求语音处理器件以及其辅助器件在几十个毫秒或更短的时间内处理、存储大量的语音数据。

需要语音处理器的运算速度达到10—20MIPS,在应用中会根据任务的要求不同处理速度甚至要达到50MIPS。

语音识别与合成等领域对处理系统的内存容量往往要求达到若干MB。

实时语音信号数字处理系统通常以两种方式实现:

第一种是用一台计算机作为主机,插上一块或若干块数字信号处理板来构成,后者由通用或专用的数字信号处理器芯片(DSP芯片)及相应的存储芯片、接口芯片和语音信号的转换芯片组成。

第二种则由专用或通用的DSP芯片及其它辅助芯片构成一个独立工作的系统。

前者通常称为非脱机工作系统,用于语音识别、合成、增强或模拟实验中。

后者称为脱机工作系统,用于编码、小词汇表识别与合成等场合。

通用DSP芯片的出现及其性能价格比的迅速提高为各种实用化语音信号处理系统的应用实现提供了硬件基础。

自从1980年以来,DSP芯片得到了迅猛发展,很多运算速度达到几MIPS。

生产DSP芯片的公司有80多家,其中以美国的TI公司为代表,出产了一系列种类齐全可用于不同行业的DSP芯片,一些型号的芯片的运算速度和功能完全满足实时语音信号处理的要求,本文在硬件系统中采用TI公司的TMS320VC5402通用DSP处理芯片。

随着微电子集成技术的发展,很多公司相继研制出了专用的语音处理芯片。

语音处理芯片外接一些控制器,构成一个语音处理系统就可完成特定的语音处理任务。

如TI公司、Votrax公司、ISD公司等生产的语音存储与再生芯片,以ISD公司的ISD系列芯片为代表。

语音合成芯片有TI公司的TMS5220,语音识别芯片有东芝公司的T6658A,语音编码芯片有DigitalVoiceSystem.1nc推出的AMBE-1000以及美国国家半导体公司生产的CMX639。

 

2系统硬件部分概述

本章首先对DSP系统进行介绍,围绕以TMS320C5402为核心,给出一个DSP系统硬件部分的设计方案,重点分析了系统各组成模块的功能,给出了具体实现方法。

2.1DSP系统设计概述

一个数字信号处理系统是电子技术、信号处理技术与计算机技术相结合的产物。

其设计通常分为两个方面的内容:

信号处理部分和非信号处理部分。

信号处理部分包括系统的输入和输出、数据的编排和处理、各种算法的实现、数据结果的显示和传输等;非信号处理部分包括电源、硬件结构、成本、体积、可靠性和可维护性等。

一个应用系统的设计大致可分为7个部分:

(1)确定系统性能指标

(2)信号分析

(3)核心算法模拟与验证

(4)DSP芯片和系统外围器件的选型

(5)硬件设计和调试

(6)软件设计和调试

(7)系统集成与测试

下面对每个部分的内容给予简要的说明:

(1)确定系统性能指标:

它主要根据用户对应用系统的要求,给出系统级的技术要求和相关说明。

这些要求和说明包括处理的项目和方式、处理系统的所有性能指标(包含系统非信号处理的性能)以及系统的测试和验证方式等。

(2)信号分析:

这部分主要定义输入/输出信号的类型,即将分析的信号是随机或确定信号,模拟信号或数字信号,是一维还是多维信号。

分析信号的频率范围和系统的带宽,估计信号的最大和最小电平,是否需要进行预处理。

确定输出信号使用的方式、数据的吞吐率和对实时性的要求。

信号分析的结果是进行信号处理算法设计的基础。

(3)核心算法模拟和验证:

在这部分依据第1部分提出的要求和第2部分对信号分析的结果,对不同类型的信号和要求的处理方式确定相应的算法。

在编写信号处理算法时,首先可利用一些软件如MATLAB,对其进行仿真计算,保证算法的正确性,还要结合系统的硬件资源考虑这些算法程序的可行性,如系统的处理能力、存储容量、工作速度等。

(4)DSP芯片和系统外围器件的选型:

在选择系统所要用到的器件前,需要先分析系统数据吞吐率、存储容量以及输入/输出带宽,它们决定了系统使用的主控处理器和一些外围器件,如DSP芯片的处理速率、和外围器件进行数据交互的速率、存储器空间的大小,扩展存储器件的工作速度和容量等,根据分析的结果选择满足系统性能要求的DSP芯片、信号转换芯片、逻辑控制器件和接口以及外部扩展存储器芯片。

(5)硬件设计和调试;硬件设计主要包括数据和程序存储器的配置、数据交互通道的设计、控制和显示电路设计、电源转换电路设计和其他外围扩展器件的硬件接口电路设计。

以DSP芯片为核心的信号处理系统,可分成2大类。

一类是DSP器件处从属地位,受主机控制,主要完成数据的处理并将结果返回给主机工作。

另一类是系统在上电后独立运行自成一个系统,系统所有的控制和处理工作都由DSP器件完成。

这类系统利用了DSP器件的自举引导功能,将存储在外部的存储芯片的控制和处理程序引导加载到DSP的程序空间,使系统按预定方式工作。

系统的硬件设计是软件设计的基础。

(6)软件设计与调试:

用DSP汇编语言或C语言或两者混合使用编写系统和各种应用程序,软件设计包括系统软件和信号处理(一般应用)软件。

系统软件根据实际需要可包括系统控制软件、人机接口、数据输入,输出管理以及和主机的接口等。

信号处理软件主要是编写一些信号处理算法的程序,完成特定的处理功能。

DSP系统和主机的接口主要用高级语言编写。

软件设计和初步的调试是结合一些开发工具和开发环境来完成的。

大多数DSP器件都提供了完善的开发环境,CCS(CodeComposefStudio)是本次设计中所用到的DSP开发环境,它是一种TI公司推出的为开发TMS320系列DSP系统的集成开发环境。

(7)系统集成与测试:

完成上述工作,就剩系统的集成和实际的功能测试。

DSP系统,涉及到电子电路、各种硬件和软件等各个方面,设计的系统能否达到预期的要求还有待实际测试和检验

典型的DSP系统它的输入信号可以是电信号、声音信号、物理信号、化学信

号、连续信号、数字信号、强信号、弱信号。

在前向通道中,经过滤波和采样,

然后通过A/D信号变换成为数字比特流。

根据香浓采样定律,采样频率至少必须

是输入信号最低频率2倍。

DSP芯片系统可由一个DSP处理器和外围总线组成,也可以由多个DSP处理器组成,这完全取决于DSP处理器的要求。

DSP芯片系统的主要任务是将前向通道输出的信号按照一定的算法进行处理,然后将处理的结果以数据流的形式输给后向通道。

2.2系统的总体构成

声音信号经A/D转换器采样变成PCM数据,由串口输入DSP芯片内按语言处理算法高速处理。

处理结果可由LCD显示出来,或输入到D/A转换器中转换成模拟信号,经出扬声器还原成声音信号。

为了适合处理,在语音信号处理之前,先对输入的语音信号进行放大。

DSP芯片构成本系统的控制和处理核心,由它来协调各功能模块的工作,利用其快速的运算能力完成语音信号的运算。

考虑到需要存放语音处理数据和程序,有必要扩充存储器。

用闪速存储器存放语音处理程序和主控制程序。

用CPLD实现系统的逻辑控制和DSP芯片的I/O空间的扩展。

2.3硬件系统核心芯片的选择

本系统采用了TI公司于1999年10月推出的一款定点数字信号处理器TMS320C5402,作为系统的主控芯片。

美国德州仪器(11)公司子1982年推出通用可编程DSP芯片以来,DSP技术获得突破性发展,已从最初只用于实时大数据量的处理,发展到其应用已覆盖全球各行各业。

近年来,随着低价格、高性能DSP芯片的出现,DSP已越来越多地被应用于高速信号采集、语音处理、图像分析处理等领域中,并且其优越性日益突显。

当前业界中应用最广泛的是TI公司的TMS320系列的DSP芯片,其中TMS320VC5402(简称VC5402),主要的特点如下:

操作速率达100MIPS,

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 幼儿教育 > 少儿英语

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1