ImageVerifierCode 换一换
格式:PPTX , 页数:28 ,大小:5.13MB ,
资源ID:15553685      下载积分:3 金币
快捷下载
登录下载
邮箱/手机:
温馨提示:
快捷下载时,用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)。 如填写123,账号就是123,密码也是123。
特别说明:
请自助下载,系统不会自动发送文件的哦; 如果您已付费,想二次下载,请登录后访问:我的下载记录
支付方式: 支付宝    微信支付   
验证码:   换一换

加入VIP,免费下载
 

温馨提示:由于个人手机设置不同,如果发现不能下载,请复制以下地址【https://www.bdocx.com/down/15553685.html】到电脑端继续下载(重复下载不扣费)。

已注册用户请登录:
账号:
密码:
验证码:   换一换
  忘记密码?
三方登录: 微信登录   QQ登录  

下载须知

1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。
2: 试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。
3: 文件的所有权益归上传用户所有。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 本站仅提供交流平台,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

版权提示 | 免责声明

本文(从语音识别到言语识别PPT文档格式.pptx)为本站会员(b****2)主动上传,冰豆网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知冰豆网(发送邮件至service@bdocx.com或直接QQ联系客服),我们立即给予删除!

从语音识别到言语识别PPT文档格式.pptx

1、言语人类交流过程中使用的语言。一个简单的例子早上起床看了一下表嗯.9点了.9点了?.9点了!言语中含有丰富的信息,并非简单的文字可以描述。同样的一个词或一句话,可以通过不同的韵律形式表达出截然不同的情感。语音识别&言语识别言语识别:把言语转成上述复杂言语符号信息的过程。语音识别:传统意义上的把言语转成文本的过程。王晓波&王小波?PART TWO02语音识别的发展过程5个发展过程,6种关键技术和4个重要模型。五个发展过程(根据识别的结果来看)“”这五个发展过程是从识别的结果来看的。当然语音识别的发展过程还可以从其他角度来看。ABCD音素识别:1952年美国电话电报公司贝尔实验室的戴维斯等人开发了

2、Audrey系统。音节识别:1956年,普林斯顿大学RCA实验室的奥尔森等人采用同样的技术实现了10个单音节的识别。单词识别:1970年以后,研究的热点主要集中在孤立词识别和连接词识别上。连接词识别:连接词语音识别和连续语音识别也是交叉进行的两个阶段。E连续语音识别:1975年前后,Dragon系统实现了第一个真正意义上的连续语音识别。从识别的对象来看特定-泛型从识别的对象看,语音识别经历了特定人语音识别、非特定人语音识别两个阶段。李开复从识别的语种来看特定-泛型从识别的语种看,语音识别经历了单语种语音识别和多语种语音识别两个阶段。多语种又分成独立语种-混合语种。从识别的环境和词汇量来看实验-

3、实战从识别的环境看,语音识别经历了安静实验室环境、平稳噪声环境、复杂噪声环境等阶段。从识别的词汇量看,语音识别经历了小词汇量、中词汇量、大词汇量、海量词汇量等阶段。PART THREE03言语识别的关键技术5个发展过程,6种关键技术和4个重要模型。1.声学特征提取技术共振峰发音的舌位语音识别领域产生了很多特征提取算法和改进算法。这些特征主要分为语音学特征、发音机理特征、感知机理特征和几何学特征。2.区别特征提取技术使类间方差与类内方差的比值最大化3.区分度模型训练技术随机量的概率分布是很难测定的,一般只能测得其各种均值(如数学期望、方差等)或已知某些限定条件下的值(如峰值、取值个数等),符合测

4、得这些值的分布可有多种、以至无穷多种,通常,其中有一种分布的熵最大。选用这种具有最大熵的分布作为该随机变量的分布,是一种有效的处理方法和准则。这种方法虽有一定的主观性,但可以认为是最符合客观情况的一种选择。在投资时常常讲不要把所有的鸡蛋放在一个篮子里,这样可以降低风险。4.大规模声学模型训练技术利用深度神经网络拿更多的语音数据来对识别模型进行训练5.大规模语言模型训练技术利用加权有限状态机网络6.大规模解码技术“解码速度有三倍以上的提升。原因在于,状态数从几千个降到了几十个,减小了网络复杂度”PART FOUR04言语识别的重要模型5个发展过程,6种关键技术和4个重要模型。1.隐马尔科夫模型知

5、道骰子有几种(隐含状态数量),每种骰子是什么(转换概率),根据掷骰子掷出的结果(可见状态链),我想知道每次掷出来的都是哪种骰子(隐含状态链)。2.多元文法模型“这是昨天从这棵树上掉下来的苹果。”“这是昨天的树”“树上掉下苹果”3.有限状态机限种已确定的状态(已投入多少钱),根据不确定的输入(每次投面值不同的钱),在这几种状态中来回转换。4.深度神经网络深度神经网络的出现使得识别错误率下降了30%以上。PART FIVE05当下与未来我们正在走进言语识别时代。科大讯飞中国最大的智能语音技术提供商,在智能语音技术领域有着长期的研究积累,并在中文语音合成、语音识别、口语评测等多项技术上拥有国际领先的成果。苹果Siri移动互联网是语音识别技术实用化的催化剂,通过移动互联网收集的语音,各个机构的语音识别性能迅速得到提升。待解决的问题&展望克服噪声环境、语音语调识别率语境、语义等深层次信息的挖掘THANKYOU!

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1