ImageVerifierCode 换一换
格式:PPT , 页数:44 ,大小:7.51MB ,
资源ID:15562123      下载积分:3 金币
快捷下载
登录下载
邮箱/手机:
温馨提示:
快捷下载时,用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)。 如填写123,账号就是123,密码也是123。
特别说明:
请自助下载,系统不会自动发送文件的哦; 如果您已付费,想二次下载,请登录后访问:我的下载记录
支付方式: 支付宝    微信支付   
验证码:   换一换

加入VIP,免费下载
 

温馨提示:由于个人手机设置不同,如果发现不能下载,请复制以下地址【https://www.bdocx.com/down/15562123.html】到电脑端继续下载(重复下载不扣费)。

已注册用户请登录:
账号:
密码:
验证码:   换一换
  忘记密码?
三方登录: 微信登录   QQ登录  

下载须知

1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。
2: 试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。
3: 文件的所有权益归上传用户所有。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 本站仅提供交流平台,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

版权提示 | 免责声明

本文(现代测试技术语音识别技术PPT文档格式.ppt)为本站会员(b****2)主动上传,冰豆网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知冰豆网(发送邮件至service@bdocx.com或直接QQ联系客服),我们立即给予删除!

现代测试技术语音识别技术PPT文档格式.ppt

1、振幅成正比,振幅越大,强度越大。对于数字音频信号,音质的好坏与数据采样频率和数据位对于数字音频信号,音质的好坏与数据采样频率和数据位数有关。数有关。音质与声音还原设备有关。音质与信号噪声比音质与信号噪声比(SNR)(SNR)有关。有关。5.1 引言中国石油大学信息与控制工程学院n声音文件声音文件数字化的音频文件主要分为数字化的音频文件主要分为4 4类:类:波形音频文件。一种最直接的表达声波的数字形式,波形音频文件。一种最直接的表达声波的数字形式,文件扩展名是文件扩展名是“.wav.wav”。MIDIMIDI音频文件。一种计算机数字音乐接口生成的数音频文件。一种计算机数字音乐接口生成的数字描述音

2、频文件,扩展名是字描述音频文件,扩展名是“.mid.mid”。CD-DACD-DA音频文件。标准激光盘文件,扩展名是音频文件。标准激光盘文件,扩展名是“.cda.cda”。压缩音频文件。在数字音频领域,一种压缩音频文件。在数字音频领域,一种MP3MP3格式的压缩格式的压缩音频文件很流行,该格式的文件简称音频文件很流行,该格式的文件简称MP3MP3文件。文件。5.1 引言中国石油大学信息与控制工程学院n获取声音获取声音获得获得CDCD中的声音中的声音 录音录音声音转换声音转换 转换成计算机能够处理的数字化声音,这就转换成计算机能够处理的数字化声音,这就是是“采样采样”。可以使用。可以使用Easy

3、 CD-DA ExtractorEasy CD-DA Extractor、CoolEditCoolEdit等音频处理软件对音频进行编辑和处理。等音频处理软件对音频进行编辑和处理。要录制音质好的声音,有两个途径:使用性能优良的录音设备;采用较高的采样频率。可以使用采用较高的采样频率。可以使用WindowsWindows系统自带的系统自带的“录音机录音机”进行进行录音。录音。声音的转换只能从高质量向低质量进行,如果要进一步处理,声音的转换只能从高质量向低质量进行,如果要进一步处理,可采用可采用CoolEdit(Adobe AuditionCoolEdit(Adobe Audition)工具软件。)

4、工具软件。5.1 引言中国石油大学信息与控制工程学院二、语音通信二、语音通信人与人之间、人与机器之间的语音信息处理过程人与人之间、人与机器之间的语音信息处理过程人与人之间的语音通信人与人之间的语音通信(人人)行行动动意意图图说话方说话方收听方收听方语语言言形形成成发发音音收收听听认认识识理理解解传输系统传输系统(编码、解码编码、解码)空间传播空间传播文文本本解解析析语语音音合合成成语语音音识识别别文文章章输输入入(机器机器)语语音音理理解解计计算算机机处处理理应答文生成应答文生成:第一类人机:第一类人机 语音通信问题语音通信问题:第二类人机:第二类人机 语音通信问题语音通信问题5.1 引言中国

5、石油大学信息与控制工程学院n计算机模拟人类交流信息的过程计算机模拟人类交流信息的过程:(1)(1)将大脑产生的思想转换成语言将大脑产生的思想转换成语言(2)(2)将语言转换成相应的语音将语言转换成相应的语音(3)(3)识别表达语言的语音内容识别表达语言的语音内容(4)(4)理解语音所表达的语言意义理解语音所表达的语言意义自然语言生成自然语言生成自然语言理解自然语言理解语语 音音 合合 成成语语 音音 识识 别别5.1 引言中国石油大学信息与控制工程学院第二节第二节 语音识别技术概述语音识别技术概述 5.2 语音识别技术概述中国石油大学信息与控制工程学院一、语音识别技术一、语音识别技术 语音识别

6、(语音识别(Speech RecognitionSpeech Recognition)主要指让机器听懂)主要指让机器听懂人说的话,即在各种情况下,准确地识别出语音的内容,人说的话,即在各种情况下,准确地识别出语音的内容,从而根据其信息,执行人的各种意图。从而根据其信息,执行人的各种意图。n语音识别是研究如何采用数字信号处理技术自动提取以及语音识别是研究如何采用数字信号处理技术自动提取以及决定语音信号中最基本、决定语音信号中最基本、最有意义的信息的一门新兴的最有意义的信息的一门新兴的边缘学科。边缘学科。n语音信号处理学科的一个分支。语音信号处理学科的一个分支。5.2 语音识别技术概述中国石油大学

7、信息与控制工程学院n从广义上讲,语音识别也包括了对说话人的识别,其主从广义上讲,语音识别也包括了对说话人的识别,其主要内容是提取语音信号中有关个人特征的信息、即语音要内容是提取语音信号中有关个人特征的信息、即语音的个性特征(如:音律特性等),在这里专指有意义、的个性特征(如:音律特性等),在这里专指有意义、有内容的识别。有内容的识别。n语音识别所涉及的学科领域:信号处理、物理学(声学)语音识别所涉及的学科领域:信号处理、物理学(声学)、模式匹配、通信及信息理论、语言语音学、生理学、模式匹配、通信及信息理论、语言语音学、生理学、计算机科学(研究软硬件算法以便更有效地实现用于识计算机科学(研究软硬

8、件算法以便更有效地实现用于识别系统中的各种方法)、心理学等。别系统中的各种方法)、心理学等。一、语音识别技术一、语音识别技术5.2 语音识别技术概述中国石油大学信息与控制工程学院二、语音识别的重要性二、语音识别的重要性 n计算机语音识别是计算机语音识别是智能计算机系统的重要特征智能计算机系统的重要特征。这一技。这一技术的应用将从根本上改变计算机的人机界面,从而对计术的应用将从根本上改变计算机的人机界面,从而对计算机的发展以及推广应用产生深远的影响。算机的发展以及推广应用产生深远的影响。n基于基于电话电话的语音识别技术,使计算机直接为客户提供的语音识别技术,使计算机直接为客户提供 金金融证券和旅

9、游等方面的信息查询及服务成为可能,进而融证券和旅游等方面的信息查询及服务成为可能,进而成为电子商务进展中的重要一环成为电子商务进展中的重要一环(Voice-Commerce)(Voice-Commerce)。n语音识别技术作为语音识别技术作为声控产业声控产业,必将对编辑排版、办公自,必将对编辑排版、办公自动化、工业过程和机器操作的声控技术起到重大的推进动化、工业过程和机器操作的声控技术起到重大的推进作用。因此可以预言,语音技术必将对工业、金融、商作用。因此可以预言,语音技术必将对工业、金融、商业、文化、教育等诸方面事业产生革命性的影响。业、文化、教育等诸方面事业产生革命性的影响。5.2 语音识

10、别技术概述中国石油大学信息与控制工程学院三、语音识别的基本原理三、语音识别的基本原理5.2 语音识别技术概述中国石油大学信息与控制工程学院构词规则构词规则同音字判决同音字判决语法语义语法语义背景知识背景知识预处理预处理声学参数声学参数分析分析测度估计测度估计失真测度失真测度语音库语音库判决判决专家知识库专家知识库训练训练识别识别结果结果反反混混叠叠失失真真滤滤波波器器预加重器预加重器端点检测端点检测噪声滤波器噪声滤波器欧氏距离欧氏距离似然比测度似然比测度语音信号语音信号 输入输入语音识别的基本原理框图语音识别的基本原理框图5.2 语音识别技术概述中国石油大学信息与控制工程学院n语音识别基本原理

11、中的相关概念语音识别基本原理中的相关概念训练训练(Training)(Training):预先分析出语音特征参数,制作语音模板:预先分析出语音特征参数,制作语音模板(Template)(Template)并存放在语音参数库中。并存放在语音参数库中。识别识别(Recognition)(Recognition):待识语音经过与训练时相同的分析,得到:待识语音经过与训练时相同的分析,得到语音参数,将它与库中的参考模板一一比较,并采用判决的方语音参数,将它与库中的参考模板一一比较,并采用判决的方法找出最接近语音特征的模板,得出识别结果。法找出最接近语音特征的模板,得出识别结果。失真测度失真测度(Dis

12、tortion Measures)(Distortion Measures):在进行比较时要有个标准,:在进行比较时要有个标准,这就是计量语音特征参数矢量之间的这就是计量语音特征参数矢量之间的“失真测度失真测度”。主要识别框架主要识别框架:基于模式匹配的动态时间规整法:基于模式匹配的动态时间规整法(DTW:Dynamic(DTW:Dynamic Time Warping)Time Warping)和基于统计模型的隐马尔柯夫模型法和基于统计模型的隐马尔柯夫模型法(HMM:Hidden Markov Model)(HMM:Hidden Markov Model)等。等。5.2 语音识别技术概述中国

13、石油大学信息与控制工程学院三、语音识别技术分类三、语音识别技术分类分类原则分类原则分类结果分类结果按识别器的类型按识别器的类型孤立单词识别孤立单词识别连续单词识别连续单词识别连续语音识别连续语音识别按识别器对使用者的适按识别器对使用者的适应情况应情况特定人语音识别特定人语音识别非特定人语音识别非特定人语音识别按语音词汇表的大小按语音词汇表的大小有限词汇识别有限词汇识别(100,100-1000,1000100,100-1000,1000)无限词汇识别无限词汇识别5.2 语音识别技术概述中国石油大学信息与控制工程学院四、语音识别应用举例四、语音识别应用举例n嵌入式语音识别:嵌入式语音识别:智能玩

14、具:语音对话娃娃、语音声控机器人智能玩具:语音对话娃娃、语音声控机器人智能家电:语音识别台灯、语音识别插座智能家电:语音识别台灯、语音识别插座智能手机:语音拨号智能手机:语音拨号n电话语音识别:电话语音识别:语音电话簿:电信增值语音电话簿:电信增值智能语音总机:企业应用智能语音总机:企业应用5.2 语音识别技术概述中国石油大学信息与控制工程学院嵌入式语音识别嵌入式语音识别n嵌入式语音识别:5.2 语音识别技术概述中国石油大学信息与控制工程学院语音对话娃娃语音对话娃娃序号序号问句问句应答句应答句1 1你好你好3 3条条2 2你叫什么名字?你叫什么名字?3 3条条3 3你从哪里来你从哪里来?3 3

15、条条4 4你会什么你会什么?1 1条条5 5背首诗背首诗1515首诗首诗6 6讲个故事讲个故事6 6个故事个故事7 7我要听笑话我要听笑话4 4个笑话个笑话8 8唱首歌唱首歌5 5首歌曲首歌曲9 9来首英文歌来首英文歌5 5首英文首英文歌歌1010你喜欢玩什么?你喜欢玩什么?5 5条条1111你好可爱你好可爱3 3条条1212我很喜欢你我很喜欢你3 3条条5.2 语音识别技术概述语音声控机器人语音声控机器人问句问句回答回答前进前进前进前进后退后退后退后退左转左转左转左转右转右转右转右转跳舞跳舞跳舞跳舞5.2 语音识别技术概述中国石油大学信息与控制工程学院五、语音识别技术现实难度五、语音识别技术现实难度n连续语音的连续语音的分割分割比较困难;比较困难;n每一个基本的声学识别基元(如音素)受前后音素发音方

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1