一种基于网格方法控制鼠标定位的语音识别解决方案.ppt

上传人:b****3 文档编号:2732160 上传时间:2022-11-10 格式:PPT 页数:16 大小:1.82MB
下载 相关 举报
一种基于网格方法控制鼠标定位的语音识别解决方案.ppt_第1页
第1页 / 共16页
一种基于网格方法控制鼠标定位的语音识别解决方案.ppt_第2页
第2页 / 共16页
一种基于网格方法控制鼠标定位的语音识别解决方案.ppt_第3页
第3页 / 共16页
一种基于网格方法控制鼠标定位的语音识别解决方案.ppt_第4页
第4页 / 共16页
一种基于网格方法控制鼠标定位的语音识别解决方案.ppt_第5页
第5页 / 共16页
点击查看更多>>
下载资源
资源描述

一种基于网格方法控制鼠标定位的语音识别解决方案.ppt

《一种基于网格方法控制鼠标定位的语音识别解决方案.ppt》由会员分享,可在线阅读,更多相关《一种基于网格方法控制鼠标定位的语音识别解决方案.ppt(16页珍藏版)》请在冰豆网上搜索。

一种基于网格方法控制鼠标定位的语音识别解决方案.ppt

1、语音识别技术介绍、语音识别技术介绍2、语音鼠标光标控制、语音鼠标光标控制3、网格法提出与实现、网格法提出与实现4、研究展望、研究展望计算机语音人机交互研究计算机语音人机交互研究一一种基于网格方法控制鼠标光标定种基于网格方法控制鼠标光标定位的解决方案位的解决方案计算机学院计算机学院王军王军2010年年5月月1、语音识别技术介绍、语音识别技术介绍1.1语音识别是让机器听懂人的说话,并准确地识别出语音的内容和执行相应操作的技术.使用针对应用程序输入的语音识别使用针对应用程序输入的语音识别1.2SAPI5.1的工作原理语音识别引擎:

语音识别引擎的内部驱动程序可以识别语音并将其转换为文字。

API使得应用程序和语音引擎之间高度紧密的结合。

SAPI可以实时处理各种语音引擎在底层工作中的细节。

SAPI的两种基本类型是文本合成语音(TTS)引擎和语音识别(SR)引擎。

TTS可以将文本中的字符或文档合成为语音并“说”出来。

而SR则可以把人说话的语音转换为易读的字符或文档。

微软微软SpeechSDK结构图结构图2、语音鼠标光标控制、语音鼠标光标控制2.1基于语音识别的光标控制类型基于语音识别的光标控制类型目目前前有有两两种种语语音音控控制制鼠鼠标标的的模模式式:

目目标标导导向光标控制和方向导向光标控制。

向光标控制和方向导向光标控制。

1)目目标标导导向向光光标标控控制制中中,用用户户需需要要用用语语音音给给出出具具体体目目标标名名称称或或者者位位置置,比比如如图图标标、菜菜单单、或或者者屏屏幕幕区区域域名名称称,然然后后给给出出执执行行的命令如的命令如“单击单击”等。

等。

2)方向导向光标控制又分为非连续控制)方向导向光标控制又分为非连续控制的和连续控制的两种,对于非连续的情的和连续控制的两种,对于非连续的情况用户要同时说明方向和距离,如命令况用户要同时说明方向和距离,如命令“左左8厘米厘米”那么光标就向左移动那么光标就向左移动8厘米。

厘米。

而对于连续的情况用户先说明方向如而对于连续的情况用户先说明方向如“向左向左”,光标就向左移动,直到用户再,光标就向左移动,直到用户再说说“停止停止”,光标就停止运动。

,光标就停止运动。

2.2目前语音控制鼠标的缺陷对于大的目标而言,这种语音控制鼠标控制没有对于大的目标而言,这种语音控制鼠标控制没有什么问题,如果目标区域比较小,将会增加使用什么问题,如果目标区域比较小,将会增加使用者的难度,比如当光标移动到矩形时喊者的难度,比如当光标移动到矩形时喊“停停”,光标会继续移动一小段才停,这时光标可能已经光标会继续移动一小段才停,这时光标可能已经越过了目标矩形。

这种情况和语音识控制中存在越过了目标矩形。

这种情况和语音识控制中存在的延时有关,每次用户发出语音命令到命令被执的延时有关,每次用户发出语音命令到命令被执行都有一个过程,首先使用者说出语音命令是需行都有一个过程,首先使用者说出语音命令是需要时间的,而且语速快的人和语速慢的人说同样要时间的,而且语速快的人和语速慢的人说同样的命令花的时间不同;另外语音识别引擎成功识的命令花的时间不同;另外语音识别引擎成功识别一个语音命令也需要一个时间。

所以语音控制别一个语音命令也需要一个时间。

所以语音控制鼠标在控制过程中必然存在延时。

鼠标在控制过程中必然存在延时。

3、网格法提出与实现、网格法提出与实现3.1网格法原理网格法原理3.2网格法实现关键算法实现思想(网格识别)关键算法实现思想(网格识别)通过观察总结可知,网格序号和通过观察总结可知,网格序号和Top值、值、Left值之值之间有一定逻辑关系。

用语法表示为:

间有一定逻辑关系。

用语法表示为:

bleft=Form1.Width/3btop=Form1.Height/3m=(n-1)3/m为(为(n-1)与)与3的商取整,的商取整,其中其中n为网格序号为网格序号k=(n-1)Mod3)/k为(为(n-1)与)与3求模后的余求模后的余数部分,其中数部分,其中n为网格序号为网格序号Form1.Left=k*bleft/网格识别后窗体网格识别后窗体Left的值的值Form1.Top=m*btop/网格识别后窗体网格识别后窗体Top值值4、研究展望、研究展望网格法控制鼠标光标定位的实现不光在语音控制计算机这一方面有很好的使用价值,也可在其他领域推广,如在军事应用方面,在战斗机作战时飞行员的双手可能都处于忙碌状态,当要在屏幕上定位射击目标时可通过网格法语音识别来精确定位。

在生活领域,在汽车驾驶时,人在驾驶过程中使用GPS导航仪时也可通过网格法来定位导航目标。

这些都是由于网格法在定位的准确性和快速性来决定的,在未来的研究中,网格法必定会越来越多的应用于人们的生活中来为我们服务。

Thankyou!

展开阅读全文
相关资源
猜你喜欢
相关搜索
资源标签

当前位置:首页 > 经管营销 > 企业管理

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1