科大讯飞产品分析报告V10.docx
《科大讯飞产品分析报告V10.docx》由会员分享,可在线阅读,更多相关《科大讯飞产品分析报告V10.docx(8页珍藏版)》请在冰豆网上搜索。
科大讯飞产品分析报告V10
科大讯飞产品分析报告-V1.0
科大讯飞语音云产品分析报告
或第三方角色。
MSP系统主要包括语音应用接口(SpeechProgrammingInterface,SPI)、客户端(MobileSpeechClient,MSC)、服务器(MobileSpeechServer,MSS)和基础支撑(MSPInfrastructure)四个层次,这四个逻辑层从用户到服务器操作系统底层,共同构成了完整的MSP系统架构。
应用接口是MSP系统提供的开发接口,集成开发人员应关注这些接口的定义、功能和使用方法。
MSC负责实现这些接口,同时封装了网络通讯、音频编解码(AudioCodec)、语音检测(VAD)、协议解析(MSSP)等功能,同时为了便于开发和使用,系统在这一层提供了一系列高效、易用的工具。
MSS提供语音服务的服务端实现,使用服务端的识别引擎提供语音功能,同时提供管理和维护功能;基础支撑层是MSP的服务基础,负责提供适合云计算架构的负载均衡、并行计算、数据存储等功能。
1产品功能
实现可面向移动2G/3G网络及互联网提供语音服务的服务器,在语音服务平台ISP基础上为移动终端应用程序提供多路并发的语音合成、语音识别、语音听写功能,通过架设在互联网的语音应用服务器,用户可以随时随地获得高质量的语音服务。
实现基于移动终端以及桌面平台的语音应用客户端,提供统一的语音应用开发接口,通过该接口用户可以方便、快速地开发语音应用;同时,MSP也将开放一些基于移动以及桌面平台的语音应用,用于展示MSP语音服务平台的功能和使用方法,让用户直接体验到最新的语音技术。
2产品优势
2.1用户方
1)保持最新,为让用户体验最好的语音合成、最准确的语音识别技术,科大讯飞将以最快的速度推出最新的研究成果,;
2)顺畅体验,为让用户可以随时随地享受顺畅的语音服务,语音云客户端对资源的开销极低,;
3)个性化,为更好服务每个用户,讯飞语音云保存每个用户的个性化数据。
2.2开发方
1)易用,提供可视化控件,覆盖Android、iPhone、Symbian、WindowsMobile等常见智能操作系统,并提供demo程序和源码,使得语音应用集成时间缩短到几个小时;
2)全面,通过语音云开发网站您可以获得开发、调试、评估、调优等全方位的技术支持和点对点的技术服务;
3)容量大,讯飞语音云支持超大规模的用户访问,不必担心由于用户规模的扩张而服务能力不足;
4)费用低,语音应用开发接口现在可供任何组织和个人免费使用,在您的应用规模高于百万级之后,才需要支付非常低廉的费用。
3相关产品介绍
3.1讯飞语点
3.1.1概述
讯飞语点是款Android应用,可以用语音控制打电话、发短信、搜索地图、查时刻表、查航班等,类Siri中文语音助手。
3.1.2功能介绍
1、语音识别打电话
讯飞语点绝非那些早期手机中的语音拨号功能所能相提并论的,讯飞语音其实已经将语音控制功能落实到了日常的实用功能中,形成了一个语音控制的平台。
用户在讯飞语点主界面下,选择“点击说话”直接说出:
“呼叫***电话”或者是“帮我给***打电话”,那么讯飞语点就开始运行,识别用户的语音输入,搜索联系人,最后将电话拨出。
当然,讯飞语点对语音进行识别的过程很重要,如果用户在点击说话之后,没有进行语音录入,那么讯飞语点将会提示“没有听到声音”,录入语音之后,电话即可正常拨出电话。
2、语音控制发短信
在讯飞语点主界面下的六个功能标签中,我们看到“发短信”按钮,点击发短信,系统将提示用户说话录音,用户需要说出类似“给***发短信”,就可以进入信息编辑界面。
这是用户使用讯飞语点来发送短信息的其中一个方式。
在进入讯飞语点发短信功能之后,短信息内容的编辑,用户可以使用手机上的输入法来进行输入,当然讯飞语点这里提供了一个更加快捷、直接的输入方式,就是用户只需说话,语点即可将您的说话内容转换为文字信息输入信息编辑器中。
3、通过语音搜索APP
讯飞语点在打开手机系统中各个应用时,都表现得比较轻松,并不需要用户等待多长时间。
另外还有一种情况就是,当用户不具体说出需要寻找的是哪一款APP应用时,同样可以进入到讯飞语点为用户提供的APP搜索平台进行查找。
4、说一句话就能找到网页
上网搜索功能项其实是属于讯飞语点的聊天功能其中一部分。
讯飞语点将XX为标准搜索平台,并内置入浏览器功能,用户无需做任何的手动跳转即可实现,从讯飞语点到浏览器界面的相互转换,这是通过讯飞语点来进行上网搜索的最大亮点。
5、歌曲精准搜索
另外,喜欢听歌的朋友,还可以使用讯飞语点在线搜歌听歌,软件内置了音乐播放器,音乐来源为“联通沃音乐”。
科大讯飞正在与联通合作布局人机交互,语音查询功能可以在生活中给我们提供很多帮助。
搜索讯飞语点的音乐功能,只需用户发出“***的歌曲”的语音指令,讯飞语点即可在线搜索相关歌曲,歌曲是来源于“联通沃音乐”。
选择点击喜欢的音乐即可播放。
6、其他功能简介
打电话
打电话给张三/给张三打电话/帮我接通张三的电话/呼叫XXX
发短信
发短信给张三/发短信给老大我马上就到/发短信给XXX,查询余额/回复王五的短信
联系人
把张三的号码发给李四/新建联系人张三,号码是XXXX/张三的号码是多少?
提醒
提醒我9点开会/8点半提醒我给爸爸打电话/半小时后提醒我去开会/周六早上8点提醒我买家具/每天早上八点提醒我起床
音乐
来一首飞得更高/我想听刘德华的歌/我想听甜蜜蜜/播放汪峰的飞得更高
打开应用
打开相机/启动愤怒的小鸟
搜索应用
下载讯飞输入法/搜索新浪微博/下载水果忍者
餐饮美食
附近有什么好吃的/北京西直门附近的川菜馆/附近有没有肯德基/附近有没有火锅店
火车航班
从广州去北京的航班/查询明天从北京到上海的火车/有没有明天到广州的航班/6月15号成都回广州的飞机票
查询天气
北京的天气怎么样?
/查询上海的天气/广州明天会下雨吗?
查询股票
查一下科大讯飞的股票/查询中国移动的股票/查询002230的股票
地图导航
北京西直门怎么走/北京西站的位置/广州天河广场在哪
上网搜索
打开新浪网搜索科大讯飞/XX一下今年高考作文
听新闻
我想听新闻/最近有什么热门的新闻/播放最近的新闻
翻译
翻译很高兴认识你/汉堡包多少钱一个英文怎么讲/一会见的英文怎么说
聊天
给我讲个笑话吧/2乘以2加上3等于多少/鱼香肉丝怎么做?
/介绍一下美国
3.2讯飞输入法
3.2.1概述
讯飞语音输入法是由科大讯飞推出的一款手机输入法,是全球首款基于“云计算”方式实现的智能语音输入法。
软件集语音、手写、键盘输入于一体,不仅具有强大的语音识别效果,而且可以在同一界面实现多种输入方式平滑切换,符合用户使用习惯,大大提升了手机输入速度,使用更加方便快捷。
3.2.2功能介绍
1、语音
首款“云计算”智能语音输入法,采用全球领先的智能语音技术,语音流式识别,边说边识别。
2、手写
在键盘上直接手写,笔画顺序随意组合,竖屏叠写,长句手写也能一气呵成,横屏连写,写完左边写右边。
3、键盘
拼音/英文/字母独立面板,通过底部滑动切换键盘,九宫格式表情、标点、数字、网络符号面板,自动记忆自造词。
3.3讯飞口讯
3.3.1概述
讯飞口讯是一款基于“云计算”方式实现的手机听写软件,可以将语音转换为文字后通过短信/邮件/微博进行发送。
3.3.2功能介绍
1、语音转换
通过软件进行录音,后经云服务将语音转换成文字。
2、发短信
将转换好的文字带到短信拟稿界面,选择联系人后即可发送。
3、发邮件
将转换好的文字带到邮件拟稿界面,选择联系人后即可发送。
4、分享
将转换好的文字通过选择的“新浪微博”、“腾讯微博”、“网易微博”、“开心网”进行发送。
5、复制
将转换好的文字复制到剪切板,可以在其他应用程序中使用。
4产品对我方的价值
通过语音是人传达信息给系统的最简单途径,而且采用语音控制对操作人员专业水平、操作要求也大大降低。
因此,将语音控制与现有业务进行结合具有实际意义和应用前景。
4.1运营模式
将语音云与现有业务进行结合,通过语音将用户操作指令传达给业务系统,使应用更加智能化,更方便操作。
4.2可行性分析
集团原来与科大讯飞信息科技股份有限公司有战略性合作关系,我们可以直接使用他们的语音云,并且往后他们会为我们搭建移动的语音云,可以免费使用。
4.2.1产品推广
语音作为最直接的沟通、操作手段,在接下来生活、工作上必定会越来越被广泛使用,我们可以对其先进行研究,并且有集团与讯飞公司合作的契机,研发自有的语音产品。
例如:
家庭智能--通过语音控制家电,灯、空调、热水器,不需要到固定的位置去操作;
将其与OA、定位、无线城市移动版系统结合,实现快速查询、定位;
语音点餐,通过语音实现点餐功能,适用于人多,密集的地方,如医院,餐馆、学校、图书馆、商场等,即卫生又方便;
数据分析和数据筛选根据你所说的查询条件自己帮你查出来,而不用你去选一堆的条件;
汽车语音控制可以让车主在行车过程中,利用语音对车内设备进行控制,避免出现分神操作车内设备导致交通事故;
另外语音支付、语音转账、语音电视、语音控制游戏等。