基于DSP的语音信号处理系统设计文档格式.docx
《基于DSP的语音信号处理系统设计文档格式.docx》由会员分享,可在线阅读,更多相关《基于DSP的语音信号处理系统设计文档格式.docx(22页珍藏版)》请在冰豆网上搜索。
信号处理是Matlab重要应用的领域之一。
本设计针对现在大部分语音处理软件内容繁多、操作不便等问题,采用MATLAB7.0综合运用GUI界面设计、各种函数调用等来实现语音信号的变频、傅里叶变换及滤波,程序界面简练,操作简便,具有一定的实际应用意义。
关键字:
Matlab,语音信号,傅里叶变换,信号处理
Abstract
Speechsignalprocessingistostudytheuseofdigitalsignalprocessingtechnologyandknowledgeofthevoicesignalvoiceprocessingoftheemergingdisciplineisthefastestgrowingareasofinformationscienceoneofthecoretechnology.Transmissionofinformationthroughthevoiceofhumanity'
smostimportant,mosteffective,mostpopularandmostconvenientformofexchangeofinformation..
Digitalsignalprocessing(DigitalSignalProcessing,DSP)istheuseofcomputerorspecialprocessingequipment,todigitalformofsignalacquisition,transformation,filtering,estimation,enhancement,compression,recognitionprocessing,inordertogettheneedsofthepeopleofthesignalform.
Matlablanguageisadataanalysisandprocessingfunctionsareverypowerfulcomputerapplicationsoftware,soundfileswhichcanbetransformedintodiscretedatafiles,thenuseitspowerfulabilitytoprocessthedatamatrixoperations,suchasdigitalfiltering,Fouriertransform,whendomainandfrequencydomainanalysis,soundplaybackandavarietyofmaprendering,andsoon.Itssignalprocessingandanalysistoolkitforvoicesignalanalysisprovidesaveryrichfeaturefunction,useofthesefunctionscanbequickandconvenientfeaturescompletevoicesignalprocessingandanalysisandvisualizationofsignals,makescomputerinteractionmoreconvenient.MatlabSignalProcessingisoneoftheimportantareasofapplication.
Thedesignofvoice-processingsoftwareformostofthecontentarenumerous,easytomaneuverandsoon,usingMATLAB7.0comprehensiveuseGUIinterfacedesign,variousfunctioncallstovoicesignalssuchasfrequency,amplitude,Fouriertransformandfiltering,theprograminterfaceconcise,simple,hassomesignificanceinpractice.
Keywords:
Matlab,VoiceSignal,Fouriertransform,SignalProcessin
1绪论
1.1课题的背景与意义
通过语音传递信息是人类最重要、最有效、最常用和最方便的交换信息的形式。
语言是人类持有的功能。
声音是人类常用的工具,是相互传递信息的最主要的手段。
因此,语音信号是人们构成思想疏通和感情交流的最主要的途径。
并且,由于语言和语音与人的智力活动密切相关,与社会文化和进步紧密相连,所以它具有最大的信息容量和最高的智能水平。
现在,人类已开始进入了信息化时代,用现代手段研究语音信号,使人们能更加有效地产生、传输、存储、获取和应用语音信息,这对于促进社会的发展具有十分重要的意义。
让计算机能听懂人类的语言,是人类自计算机诞生以来梦寐以求的想法。
随着计算机越来越向便携化方向发展,随着计算环境的日趋复杂化,人们越来越迫切要求摆脱键盘的束缚而代之以语音输人这样便于使用的、自然的、人性化的输人方式。
作为高科技应用领域的研究热点,语音信号采集与分析从理论的研究到产品的开发已经走过了几十个春秋并且取得了长远的进步。
它正在直接与办公、交通、金融、公安、商业、旅游等行业的语音咨询与管理。
工业生产部门的语声控制,电话、电信系统的自动拨号、辅助控制与查询以及医疗卫生和福利事业的生活支援系统等各种实际应用领域相接轨,并且有望成为下一代操作系统和应用程序的用户界面。
可见,语音信号采集与分析的研究将是一项极具市场价值和挑战性的工作。
我们今天进行这一领域的研究与开拓就是要让语音信号处理技术走入人们的日常生活当中,并不断朝更高目标而努力。
语音信号采集与分析之所以能够那样长期地、深深地吸引广大科学工作者去不断地对其进行研究和探讨,除了它的实用性之外,另一个重要原因是,它始终与当时信息科学中最活跃的前沿学科保持密切的联系,并且一起发展。
语音信号采集与分析是以语音语言学和数字信号处理为基础而形成的一门涉及面很广的综合性学科,与心理、生理学、计算机科学、通信与信息科学以及模式识别和人工智能等学科都有着非常密切的关系。
对语音信号采集与分析的研究一直是数字信号处理技术发展的重要推动力量。
因为许多处理的新方法的提出,首先是在语音信号处理中获得成功,然后再推广到其他领域。
1.2国内外研究现状
语音信号的采集与分析作为一个重要的研究领域,已经有很长的研究历史。
但是它的快速发展可以说是从1940年前后Dudley的声码器(vocoder)和potter等人的可见语音(VisibleSpeech)开始的。
1952年贝尔(Bell)实验室的Davis等人首次研制成功能识别十个英语数字的实验装置。
1956年Olson和Belar等人采用8个带通滤波器组提取频谱参数作为语音的特征,研制成功一台简单的语音打字机。
20世纪60年代初由于Faut和Steven的努力,奠定了语音生成理论的基础,在此基础上语音合成的研究得到了扎实的进展。
20世纪60年代中期形成的一系列数字信号处理方法和技术,如数字滤波器、快速博里叶变换(FFT)等成为语音信号数字处理的理论和技术基础。
在方法上,随着电子计算机的发展,以往的以硬件为中心的研究逐渐转化为以软件为主的处理研究。
然而,在语音识别领域内,初期有几种语音打字机的研究也很活跃,但后来已全部停了下来,这说明了当时人们对话音识别难度的认识得到了加深。
所以1969年美国贝尔研究所的Pierce感叹地说“语音识别向何处去?
”。
到了1970年,好似反驳Pierce的批评,单词识别装置开始了实用化阶段,其后实用化的进程进一步高涨,实用机的生产销售也上了轨道。
此外社会上所宣传的声纹(VoicePrint)识别,即说话人识别的研究也扎扎实实地开展起来,并很快达到了实用化的阶段。
到了1971年,以美国ARPA(AmericanResearchProjectsAgency)为主导的“语音理解系统”的研究计划也开始起步。
这个研究计划不仅在美国园内,而且对世界各国都产生了很大的影响,它促进了连续语音识别研究的兴起。
历时五年的庞大的ARPA研究计划,虽然在语音理解、语言统计模型等方面的研究积累了一些经验,取得了许多成果,但没能达到巨大投资应得的成果,在1976年停了下来,进入了深刻的反省阶段。
但是,在整个20世纪70年代还是有几项研究成果对语音信号处理技术的进步和发展产生了重大的影响。
这就是20世纪70年代初由板仓(Itakura)提出的动态时间规整(DTW)技术,使语音识别研究在匹配算法方面开辟了新思路;
20世纪70年代中期线性预测技术(LPC)被用于语音信号处理,此后隐马尔可夫模型法(HNMM)也获得初步成功,该技术后来在语音信号处理的多个方面获得巨大成功;
20世纪70年代未,Linda、Buzo、Gray和Markel等人首次解决了矢量量化(VQ)码书生成的方法,并首先将矢量量化技术用于语音编码获得成功。
从此矢量量化技术不仅在语音识别、语音编码和说话人识别等方面发挥了重要作用,而且很快推广到其他许多领域。
因此,20世纪80年代开始出现的语音信号处理技术产品化的热潮,与上述语音信号处理新技术的推动作用是分不开的。
20世纪80年代,由于矢量量化、隐马尔可夫模型和人工神经网络(ANN)等相继被应用于语音信号处理,并经过不断改进与完善,使得语音信号处理技术产生了突破性的进展。
其中,隐马尔可夫模型作为语音信号的一种统计模型,在语音信号处理的各个领域中获得了广泛的应用。
其理论基础是1970年前后,由Baum等人建立起来的,随后,由美国卡内基梅隆大学(CMU)的Baker和美国IBM公司的Jelinek等人将其应用到语音识别中。
由于美国贝尔实验室的Babiner等人在20世纪80年代中期,对隐马尔可夫模型深人浅出的介绍,才使世界各国从事语音信号处理的研究人员了解和熟悉,进而成为一个公认的研究热点,也是目前语音识别等的主流研究途径。
进入20世纪90年代以来,语音信号采集与分析在实用化方面取得了许多实质性的研究进展。
其中,语音识别逐渐由实验室走向实用化。
一方面,对声学语音学统计模型的研究逐渐深入,鲁棒的语音识别、基于语音段的建模方法及隐马尔可夫模型与人工神经网络的结合成为研究的热点。
另一方面,为了语音识别实用化