语音识别资料下载.pdf

上传人:b****2 文档编号:16120531 上传时间:2022-11-20 格式:PDF 页数:55 大小:791.28KB
下载 相关 举报
语音识别资料下载.pdf_第1页
第1页 / 共55页
语音识别资料下载.pdf_第2页
第2页 / 共55页
语音识别资料下载.pdf_第3页
第3页 / 共55页
语音识别资料下载.pdf_第4页
第4页 / 共55页
语音识别资料下载.pdf_第5页
第5页 / 共55页
点击查看更多>>
下载资源
资源描述

语音识别资料下载.pdf

《语音识别资料下载.pdf》由会员分享,可在线阅读,更多相关《语音识别资料下载.pdf(55页珍藏版)》请在冰豆网上搜索。

语音识别资料下载.pdf

语音识别按任务的不同可以分为四个方面:

说话人识别说话人识别关键词检出关键词检出语言辨识语言辨识连续语音识别连续语音识别语音识别技术的语音识别技术的困难困难:

(1)语音信号具有时变性;

(2)目:

(2)目前没有模型能完全描述发音模型;

(3)方言或口音会降低前没有模型能完全描述发音模型;

(3)方言或口音会降低语音识别率、背景噪音、口语等问题。

语音识别率、背景噪音、口语等问题。

信息科学与工程学院信息科学与工程学院宁波大学宁波大学宁波大学宁波大学NingboUniversityNingboUniversity信息科学与工程学院信息科学与工程学院宁波大学宁波大学宁波大学宁波大学NingboUniversityNingboUniversity第第11讲讲语音识别技术语音识别技术语音识别原理框图语音识别原理框图预处理与预处理与数字化数字化模式匹配模式匹配特征提取特征提取参考模参考模式库式库后处理后处理结果结果识别识别训练训练语音输入语音输入信息科学与工程学院信息科学与工程学院宁波大学宁波大学宁波大学宁波大学NingboUniversityNingboUniversity信息科学与工程学院信息科学与工程学院宁波大学宁波大学宁波大学宁波大学NingboUniversityNingboUniversity第第11讲讲语音识别技术语音识别技术一个完整的语音识别系统可大致分为四部分:

一个完整的语音识别系统可大致分为四部分:

(1)语音信号的预处理语音信号的预处理

(2)语音特征提取语音特征提取(3)声学模型与模式匹配(识别算法声学模型与模式匹配(识别算法)(4)语言模型与语言处理语言模型与语言处理语音识别系统的分类(见下表):

语音识别系统的分类(见下表):

按发音方式分按发音方式分按词汇量大小分按词汇量大小分按说话人分按说话人分从识别方法分从识别方法分信息科学与工程学院信息科学与工程学院宁波大学宁波大学宁波大学宁波大学NingboUniversityNingboUniversity信息科学与工程学院信息科学与工程学院宁波大学宁波大学宁波大学宁波大学NingboUniversityNingboUniversity第第11讲讲语音识别技术语音识别技术分类依分类依据据语音的语音的发音方发音方式式说话说话人人词汇量词汇量的大小的大小识别的方法识别的方法应用场应用场合合动态时间规整动态时间规整(DTW)孤立词孤立词语音识语音识别系统别系统特定人特定人语音识语音识别系统别系统小词汇量小词汇量(10-100)矢量量化矢量量化(VQ)命令识别命令识别等等连接字连接字语音识语音识别系统别系统中词汇量中词汇量(100-500)隐马尔可夫模型隐马尔可夫模型(HMM)文字记录文字记录等等连续语连续语音识别音识别系统系统大词汇量大词汇量(500以上以上)隐马尔可夫模型隐马尔可夫模型(HMM)、人工、人工神经网络神经网络(ANN)语音理解语音理解等等非特定非特定人语音人语音识别系识别系统统类别类别语音识别系统的分类语音识别系统的分类信息科学与工程学院信息科学与工程学院宁波大学宁波大学宁波大学宁波大学NingboUniversityNingboUniversity信息科学与工程学院信息科学与工程学院宁波大学宁波大学宁波大学宁波大学NingboUniversityNingboUniversity第第11讲讲语音识别技术语音识别技术?

11-2语音识别的应用语音识别的应用未来未来10年内,语音识别技术将进入年内,语音识别技术将进入工业工业、家电家电、通信通信、汽车电子汽车电子、医疗医疗、家庭服务家庭服务、消费电子产消费电子产品品等各个领域。

等各个领域。

-语音打字机语音打字机-数据库检索数据库检索-特定的环境所需的语音命令特定的环境所需的语音命令信息科学与工程学院信息科学与工程学院宁波大学宁波大学宁波大学宁波大学NingboUniversityNingboUniversity信息科学与工程学院信息科学与工程学院宁波大学宁波大学宁波大学宁波大学NingboUniversityNingboUniversity第第11讲讲语音识别技术语音识别技术Sony于于2005年发布年发布PSP语音识别器语音识别器TALKMAN信息科学与工程学院信息科学与工程学院宁波大学宁波大学宁波大学宁波大学NingboUniversityNingboUniversity信息科学与工程学院信息科学与工程学院宁波大学宁波大学宁波大学宁波大学NingboUniversityNingboUniversity第第11讲讲语音识别技术语音识别技术可通过语音命令控制菜单操作可通过语音命令控制菜单操作紫光听写大师紫光听写大师信息科学与工程学院信息科学与工程学院宁波大学宁波大学宁波大学宁波大学NingboUniversityNingboUniversity信息科学与工程学院信息科学与工程学院宁波大学宁波大学宁波大学宁波大学NingboUniversityNingboUniversity第第11讲讲语音识别技术语音识别技术?

11-3基于基于DTW的语音识别的语音识别基于基于DTW的识别系统的识别系统-适用于孤立词的识别适用于孤立词的识别优点优点:

系统比较稳定:

系统比较稳定应用场合应用场合:

命令识别:

命令识别实际应用实际应用:

语音控制玩具,语音控制门锁:

语音控制玩具,语音控制门锁信息科学与工程学院信息科学与工程学院宁波大学宁波大学宁波大学宁波大学NingboUniversityNingboUniversity信息科学与工程学院信息科学与工程学院宁波大学宁波大学宁波大学宁波大学NingboUniversityNingboUniversity第第11讲讲语音识别技术语音识别技术算法的提出算法的提出:

简单的讲,输入模板与相应的参考:

简单的讲,输入模板与相应的参考模板直接做比较存在缺点。

模板直接做比较存在缺点。

假设参考模板的特征序列假设参考模板的特征序列,输入语输入语音特征矢量音特征矢量,IJ实际:

实际:

把时间规整和距离测度的计算结合起来的把时间规整和距离测度的计算结合起来的一种非线性规整技术,是一种匹配算法。

一种非线性规整技术,是一种匹配算法。

12,IXxxx=L12,JYyyy=L信息科学与工程学院信息科学与工程学院宁波大学宁波大学宁波大学宁波大学NingboUniversityNingboUniversity信息科学与工程学院信息科学与工程学院宁波大学宁波大学宁波大学宁波大学NingboUniversityNingboUniversity第第11讲讲语音识别技术语音识别技术设时间规整函数为:

设时间规整函数为:

C=c

(1),c

(2),c(N)c(n)=(i(n),j(n)表示第表示第n个匹配点对,是由参考模个匹配点对,是由参考模板的第板的第i(n)个特征矢量与待测模板的第个特征矢量与待测模板的第j(n)个特征个特征矢量构成的匹配点对。

矢量构成的匹配点对。

信息科学与工程学院信息科学与工程学院宁波大学宁波大学宁波大学宁波大学NingboUniversityNingboUniversity信息科学与工程学院信息科学与工程学院宁波大学宁波大学宁波大学宁波大学NingboUniversityNingboUniversity第第11讲讲语音识别技术语音识别技术DTW算法通过局部优化的方法实现算法通过局部优化的方法实现加权距离和最加权距离和最小小,即,即为为加权函数加权函数,需考虑两个因素:

,需考虑两个因素:

根根据据第第n对对匹配点前一步局部路径的走向来选取匹配点前一步局部路径的走向来选取;

考考虑虑语音各部分给予不同权值语音各部分给予不同权值,以加强某些区别,以加强某些区别特征。

特征。

()()()()1,minnjnNCnnyWDijW=?

Ninn=1dxnW信息科学与工程学院信息科学与工程学院宁波大学宁波大学宁波大学宁波大学NingboUniversityNingboUniversity信息科学与工程学院信息科学与工程学院宁波大学宁波大学宁波大学宁波大学NingboUniversityNingboUniversity第第11讲讲语音识别技术语音识别技术动态时间规整过程动态时间规整过程(Wn=1)J14121086422468101214161820I信息科学与工程学院信息科学与工程学院宁波大学宁波大学宁波大学宁波大学NingboUniversityNingboUniversity信息科学与工程学院信息科学与工程学院宁波大学宁波大学宁波大学宁波大学NingboUniversityNingboUniversity第第11讲讲语音识别技术语音识别技术需对时间规整函数需对时间规整函数C作某些限定,以保证不违背语音作某些限定,以保证不违背语音信号各部分特征的时间顺序。

信号各部分特征的时间顺序。

单调性单调性:

起点和终点约束起点和终点约束:

一般要求:

一般要求连续性连续性:

一般规定不允许跳过任何一点,即:

一般规定不允许跳过任何一点,即最大规整量不超过某一极限值最大规整量不超过某一极限值,最简单情形:

,最简单情形:

还需设计局部路径的约束还需设计局部路径的约束()()()()1,1njnjnini()()()()JNjINiji=,111()()()()11,11njnjnini()()为窗宽MMnjni,信息科学与工程学院信息科学与工程学院宁波大学宁波大学宁波大学宁波大学NingboUniversityNingboUniversity信息科学与工程学院信息科学与工程学院宁波大学宁波大学宁波大学宁波大学NingboUniversityNingboUniversity第第11讲讲语音识别技术语音识别技术三种典型的局部约束路径三种典型的局部约束路径(a)(c)(b)信息科学与工程学院信息科学与工程学院宁波大学宁波大学宁波大学宁波大学NingboUniversityNingboUniversity信息科学与工程学院信息科学与工程学院宁波大学宁波大学宁波大学宁波大学NingboUniversityNingboUniversity第第11讲讲语音识别技术语音识别技术定义一种最小定义一种最小累计失真函数累计失真函数,表示到匹配,表示到匹配点对(点对(i,j)为止的前面所有路径中最佳路径的)为止的前面所有路径中最佳路径的累计匹配距离。

累计匹配距离。

DTW算法的具体步骤:

(约束路径算法的具体步骤:

(约束路径a,区域为平,区域为平行四边为例)行四边为例)(),gij

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 经管营销 > 企业管理

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1