ImageVerifierCode 换一换
格式:PDF , 页数:66 ,大小:5.37MB ,
资源ID:3211852      下载积分:3 金币
快捷下载
登录下载
邮箱/手机:
温馨提示:
快捷下载时,用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)。 如填写123,账号就是123,密码也是123。
特别说明:
请自助下载,系统不会自动发送文件的哦; 如果您已付费,想二次下载,请登录后访问:我的下载记录
支付方式: 支付宝    微信支付   
验证码:   换一换

加入VIP,免费下载
 

温馨提示:由于个人手机设置不同,如果发现不能下载,请复制以下地址【https://www.bdocx.com/down/3211852.html】到电脑端继续下载(重复下载不扣费)。

已注册用户请登录:
账号:
密码:
验证码:   换一换
  忘记密码?
三方登录: 微信登录   QQ登录  

下载须知

1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。
2: 试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。
3: 文件的所有权益归上传用户所有。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 本站仅提供交流平台,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

版权提示 | 免责声明

本文(语音识别特征提取算法的研究及实现.pdf)为本站会员(b****2)主动上传,冰豆网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知冰豆网(发送邮件至service@bdocx.com或直接QQ联系客服),我们立即给予删除!

语音识别特征提取算法的研究及实现.pdf

1、西北大学硕士学位论文语音识别特征提取算法的研究及实现姓名:惠博申请学位级别:硕士专业:计算机软件与理论指导教师:冯宏伟20080619摘要语音信号具有很强的时变特性,在较短的时间间隔中语音信号的特征可看作基本保持不变,这是语音信号处理的一个重要出发点。语音识别率的高低,也都取决于语音信号特征提取的准确性和鲁棒性。因此,语音信号特征提取在语音信号处理应用中具有举足轻重的地位。论文首先研究了语音识别的基本知识,主要包括语音识别的原理;语音信号处理的基本知识;各种语音识别和训练的方法。在此基础上本文完成的工作有:l、着重研究了目前使用广泛的美尔频率倒谱系数(M F C C)参数,以2 4 维M F

2、C C参数为例,采用增减分量的方法分析了高阶参数缺失对识别率的影响,找出了对噪音不敏感的高阶M F C C 参数,在识别率变化不大的情况下对2 4 维M F C C 参数进行了优化组合。2、使用V C+根据动态时间规整(D T W)模型实现了一个连接数字串语音识别系统,并进行了实验分析。系统的组成模块和语音识别系统的基本构成模型一致。在实现时选用了美尔频率系数(M F C C)。3、实验过程中发现了汉语数码易于混淆的问题,在模板训练方法和参考模板两方面做了改进,提出了使用多对特征矢量序列进行鲁棒性训练和进行声韵母分割来构造参考模板的方法。4、最后本文研究了汉语连续语音识别中的声学建模方法,给出

3、了识别汉语易混淆词的方法。本文通过对实际语音识别系统各个部分的实验和研究,为进一步开发实用性语音识别系统的工作做了基础性的工作。关键词:语音识别端点检测美尔频率倒谱系数动态时间规整T h eR e s e a r c ho fF e a t u r eE x t r a c t i o nA l g o r i t h mF o rS p e e c hR e c o g n i t i o nA n dT h eR e a l i z a t i o nA bs t r a c tS i n c et h es p e e c hs i g n a l sh a v es t r o n g

4、t i m ev a r i a n c e,i ti sa ni m p o r t a n ts p r i n g b o a r do fs p e e C hs i g n a lp r o c e s s i n gt h a tt h ev o i c i n gf e a t u r e sC a l lo n l yb ec o n s i d e r e di n v a r i a b l ei nl i t t l et i m ei n t e r v a l T h er a t eo fs p e e c hr e c o g n i t i o nd e p e

5、 n d so nt h ea c c u r a c ya n dr o b u s t n e s so fv o i c ef e a t u r ee x t r a c t i o n S o,e x t r a c tt h ev o i c i n gf e a t u r e so fs p e e c hs i g n a lp l a ya ni m p o r t a n tr o l ei ns p e e c hs i g n a lp r o c e s s i n g F i r s t,t h ep a p e rf o c u s0 1 1f u n d a

6、m e n t a l so fs p e e c hr e c o g n i t i o n,i n c l u d i n g:p r i n c i p l eo fs p e e c hr e c o g n i t i o n,b a s i ck n o w l e d g eo fs p e e c hs i g n a lp r o c e s s i n g,a n da l lk i n d so fm e t h o d so fs p e e c ht r a i n i n ga n dr e c o g n i t i o n B a s e do nt h eb

7、 a s i ct h e o r i e s,t h ep a p e rh a sm o s tw o r k sa sf o l l o w:1、T h ep a p e rf o c u so nM F C Cw h i c hw i d e l yu s e d,a s2 4 一d i m e n s i o n a lM F C Ct e r m se x a m p l e,a n a l y s i st h ei m p a c to fl a c k i n go fh i g hM F C Ct e r m so ns p e e c h r e c o g n i t

8、i o nr a t e sb yc h a n g i n gt h en u m b e ro ft h et e r m s,f i n do u tt h eh i g ht e r m sw h i c hn o ts e n s i t i v et on o i s e sa r e g i v e n,a n do p t i m i z et h e2 4 一d i m e n s i o n a lM F C Ct e r m su n d e rr e c o g n i t i o nr a t e sc h a n g ei sn o tb i gs i t u a

9、t i o n 2、U s eV i s u a lC+6 0t oi m p l e m e n taf i g u r es t r i n gs p e e c h r e c o g n i t i o ns y s t e mw h i c hb a s e do nD T Wm o d e l,a n dm a k e sa ne x p e r i m e n to nt h i ss y s t e m T h es y s t e mi sc o n s i s t e n tw i t ht h em o d e lo ft h es p e e c h r e c o g

10、 n i t i o ns y s t e m T h ep a p e rs e l e c tM e lF r e q u e n c yC e p s t m mC o e f f i c i e n t(M F C C)a sf e a t u r et e r m s 3、I ne x p e r i m e n t,i tf i n d st h a tt h eC h i n e s ed i g i t a le a s yt oc o n f u s e,i nt w oa s p e c t s,t r a i n i n ga n dr e f e r e n c et

11、e m p l a t e,w eh a v em a d ei m p r o v e d,a n dp r e s e n taw a yo fu s em o r ev e c t o rs e q u e n c e st or o b u s tt r a i n,a n dam e t h o db yd i v i d i n gt h ei n i t i a la n df i n a li n t ot w os e g m e n t s,a n dc o n s t r u c tar e f e r e n c et e m p l a t e 4、F i n a l

12、 l y,t h ep a p e rr e s e a r c h e sa c o u s t i c sm o d e l i n gm e t h o do fC h i n e s eI Ic o n t i n u o u ss p e e c h r e c o g n i t i o n,a n di n d i c a t e st h em e t h o dt or e c o g n i z et h ew o r dw h i c he a s i l yc o n f u s e di nC h i n e s ew o r d s T h r o u g ht h

13、 ee x p e r i m e n ta n dr e s e a r c ho ft h ea c t u a ls p e e c h-r e c o g n i t i o ns y s t e m,i tc a r r i e so u tt h ef u n d a m e n t a la n de x p l o r i n gr e s e a r c hf o rt h ef u r t h e ra p p l i c a t i o no fs p e e c h-r e c o g n i t i o ns y s t e m K e y w o r d s:S p

14、 e e c h-r e c o g n i t i o n,E n d p o i n td e t e c t i o n,M F C C,D T WI I I西北大学学位论文知识产权声明书本人完全了解西北大学关于收集、保存、使用学位论文的规定。学校有权保留并向国家有关部门或机构送交论文的复印件和电子版。本人允许论文被查阅和借阅。本人授权西北大学可以将本学位论文的全部或部分内容编入有关数据库进行检索,可以采用影印、缩印或扫描等复制手段保存和汇编本学位论文。同时授权中国科学技术信息研究所等机构将本学位论文收录到中国学位论文全文数据库或其它相关数据库。保密论文待解密后适用本声明。学位论文作者签

15、名:鏖廛指导教师签名:妒8 年z 月7 日砌莎年石月驴日西北大学学位论文独创性声明本人声明:所呈交的学位论文是本人在导师指导下进行的研究工作及取得的研究成果。据我所知,除了文中特别加以标注和致谢的地方外,本论文不包含其他人已经发表或撰写过的研究成果,也不包含为获得西北大学或其它教育机构的学位或证书而使用过的材料。与我一同工作的同志对本研究所做的任何贡献均已在论文中作了明确的说明并表示谢意。学位论文作者签名:。霪何砂心年么月7 日第一章绪论1 1 语音识别技术及其应用语音是人类交流信息最自然、最方便、最有效的手段。随着电子计算机技术的广泛应用,如何利用语言的这一特点让人简单、快速、准确、方便的使

16、用计算机,使计算机能更好的为人类服务,成为人类努力追求的目标。“阿里巴巴与四十大盗”的故事说明让机器能听懂人说话,执行人的口头指令,是人类古已有之的理想。语音识别简单的说,就是让计算机能听懂人说的话,并做出相应的反应。语音识别技术的研究广泛的涉及到声学、语言学、语音学、生理科学、数字信号处理、通信理论、电子技术、计算机科学、模式识别和人工智能等众多学科,因此一个识别效果良好的语音识别系统,需要考虑包括说话人的心理状态、输入设备、说话环境多方面的因素。语音识别的应用范围极为广泛,可应用于各行各业,如医疗卫生服务、语音拨号、智能玩具、智能家居、宾馆服务、军事监听、股票交易、翻译系统、汽车导航、信息网络查询、工业控制等等。语音识别广泛涉及声学、语言学、语音学、生理科学、数字信号处理、通信理论、电子技术、计算机科学、模式识别和人工智能等众多学科,是一门新兴的交叉学科。语音识别系统就其不同要求可以分为一下几类:根据对说话人说话方式的要求,可以分为孤立词语音识别系统,连接词语音识别系统以及连续语音识别系统;根据对说话人的依赖程度可以分为特定人和非特定人语音识别系统;根据词汇量的大小,可以分为小词汇

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1