语音识别特征提取算法的研究及实现.pdf

上传人:b****2 文档编号:3211852 上传时间:2022-11-20 格式:PDF 页数:66 大小:5.37MB
下载 相关 举报
语音识别特征提取算法的研究及实现.pdf_第1页
第1页 / 共66页
语音识别特征提取算法的研究及实现.pdf_第2页
第2页 / 共66页
语音识别特征提取算法的研究及实现.pdf_第3页
第3页 / 共66页
语音识别特征提取算法的研究及实现.pdf_第4页
第4页 / 共66页
语音识别特征提取算法的研究及实现.pdf_第5页
第5页 / 共66页
点击查看更多>>
下载资源
资源描述

语音识别特征提取算法的研究及实现.pdf

《语音识别特征提取算法的研究及实现.pdf》由会员分享,可在线阅读,更多相关《语音识别特征提取算法的研究及实现.pdf(66页珍藏版)》请在冰豆网上搜索。

语音识别特征提取算法的研究及实现.pdf

西北大学硕士学位论文语音识别特征提取算法的研究及实现姓名:

惠博申请学位级别:

硕士专业:

计算机软件与理论指导教师:

冯宏伟20080619摘要语音信号具有很强的时变特性,在较短的时间间隔中语音信号的特征可看作基本保持不变,这是语音信号处理的一个重要出发点。

语音识别率的高低,也都取决于语音信号特征提取的准确性和鲁棒性。

因此,语音信号特征提取在语音信号处理应用中具有举足轻重的地位。

论文首先研究了语音识别的基本知识,主要包括语音识别的原理;语音信号处理的基本知识;各种语音识别和训练的方法。

在此基础上本文完成的工作有:

l、着重研究了目前使用广泛的美尔频率倒谱系数(MFCC)参数,以24维MFCC参数为例,采用增减分量的方法分析了高阶参数缺失对识别率的影响,找出了对噪音不敏感的高阶MFCC参数,在识别率变化不大的情况下对24维MFCC参数进行了优化组合。

2、使用VC+根据动态时间规整(DTW)模型实现了一个连接数字串语音识别系统,并进行了实验分析。

系统的组成模块和语音识别系统的基本构成模型一致。

在实现时选用了美尔频率系数(MFCC)。

3、实验过程中发现了汉语数码易于混淆的问题,在模板训练方法和参考模板两方面做了改进,提出了使用多对特征矢量序列进行鲁棒性训练和进行声韵母分割来构造参考模板的方法。

4、最后本文研究了汉语连续语音识别中的声学建模方法,给出了识别汉语易混淆词的方法。

本文通过对实际语音识别系统各个部分的实验和研究,为进一步开发实用性语音识别系统的工作做了基础性的工作。

关键词:

语音识别端点检测美尔频率倒谱系数动态时间规整TheResearchofFeatureExtractionAlgorithmForSpeechRecognitionAndTheRealizationAbstractSincethespeechsignalshavestrongtimevariance,itisanimportantspringboardofspeeChsignalprocessingthatthevoicingfeaturesCallonlybeconsideredinvariableinlittletimeintervalTherateofspeechrecognitiondependsontheaccuracyandrobustnessofvoicefeatureextractionSo,extractthevoicingfeaturesofspeechsignalplayanimportantroleinspeechsignalprocessingFirst,thepaperfocus011fundamentalsofspeechrecognition,including:

principleofspeechrecognition,basicknowledgeofspeechsignalprocessing,andallkindsofmethodsofspeechtrainingandrecognitionBasedonthebasictheories,thepaperhasmostworksasfollow:

1、ThepaperfocusonMFCCwhichwidelyused,as24一dimensionalMFCCtermsexample,analysistheimpactoflackingofhighMFCCtermsonspeechrecognitionratesbychangingthenumberoftheterms,findoutthehightermswhichnotsensitivetonoisesaregiven,andoptimizethe24一dimensionalMFCCtermsunderrecognitionrateschangeisnotbigsituation2、UseVisualC+60toimplementafigurestringspeechrecognitionsystemwhichbasedonDTWmodel,andmakesanexperimentonthissystemThesystemisconsistentwiththemodelofthespeechrecognitionsystemThepaperselectMelFrequencyCepstmmCoefficient(MFCC)asfeatureterms3、Inexperiment,itfindsthattheChinesedigitaleasytoconfuse,intwoaspects,trainingandreferencetemplate,wehavemadeimproved,andpresentawayofusemorevectorsequencestorobusttrain,andamethodbydividingtheinitialandfinalintotwosegments,andconstructareferencetemplate4、Finally,thepaperresearchesacousticsmodelingmethodofChineseIIcontinuousspeechrecognition,andindicatesthemethodtorecognizethewordwhicheasilyconfusedinChinesewordsThroughtheexperimentandresearchoftheactualspeech-recognitionsystem,itcarriesoutthefundamentalandexploringresearchforthefurtherapplicationofspeech-recognitionsystemKeywords:

Speech-recognition,Endpointdetection,MFCC,DTWIII西北大学学位论文知识产权声明书本人完全了解西北大学关于收集、保存、使用学位论文的规定。

学校有权保留并向国家有关部门或机构送交论文的复印件和电子版。

本人允许论文被查阅和借阅。

本人授权西北大学可以将本学位论文的全部或部分内容编入有关数据库进行检索,可以采用影印、缩印或扫描等复制手段保存和汇编本学位论文。

同时授权中国科学技术信息研究所等机构将本学位论文收录到中国学位论文全文数据库或其它相关数据库。

保密论文待解密后适用本声明。

学位论文作者签名:

鏖廛指导教师签名:

妒8年z月7日砌莎年石月驴日西北大学学位论文独创性声明本人声明:

所呈交的学位论文是本人在导师指导下进行的研究工作及取得的研究成果。

据我所知,除了文中特别加以标注和致谢的地方外,本论文不包含其他人已经发表或撰写过的研究成果,也不包含为获得西北大学或其它教育机构的学位或证书而使用过的材料。

与我一同工作的同志对本研究所做的任何贡献均已在论文中作了明确的说明并表示谢意。

学位论文作者签名:

霪何砂心年么月7日第一章绪论11语音识别技术及其应用语音是人类交流信息最自然、最方便、最有效的手段。

随着电子计算机技术的广泛应用,如何利用语言的这一特点让人简单、快速、准确、方便的使用计算机,使计算机能更好的为人类服务,成为人类努力追求的目标。

“阿里巴巴与四十大盗”的故事说明让机器能听懂人说话,执行人的口头指令,是人类古已有之的理想。

语音识别简单的说,就是让计算机能听懂人说的话,并做出相应的反应。

语音识别技术的研究广泛的涉及到声学、语言学、语音学、生理科学、数字信号处理、通信理论、电子技术、计算机科学、模式识别和人工智能等众多学科,因此一个识别效果良好的语音识别系统,需要考虑包括说话人的心理状态、输入设备、说话环境多方面的因素。

语音识别的应用范围极为广泛,可应用于各行各业,如医疗卫生服务、语音拨号、智能玩具、智能家居、宾馆服务、军事监听、股票交易、翻译系统、汽车导航、信息网络查询、工业控制等等。

语音识别广泛涉及声学、语言学、语音学、生理科学、数字信号处理、通信理论、电子技术、计算机科学、模式识别和人工智能等众多学科,是一门新兴的交叉学科。

语音识别系统就其不同要求可以分为一下几类:

根据对说话人说话方式的要求,可以分为孤立词语音识别系统,连接词语音识别系统以及连续语音识别系统;根据对说话人的依赖程度可以分为特定人和非特定人语音识别系统;根据词汇量的大小,可以分为小词汇

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 考试认证 > IT认证

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1