科大讯飞产品分析报告V10.docx

上传人:b****5 文档编号:3117110 上传时间:2022-11-17 格式:DOCX 页数:7 大小:177.07KB
下载 相关 举报
科大讯飞产品分析报告V10.docx_第1页
第1页 / 共7页
科大讯飞产品分析报告V10.docx_第2页
第2页 / 共7页
科大讯飞产品分析报告V10.docx_第3页
第3页 / 共7页
科大讯飞产品分析报告V10.docx_第4页
第4页 / 共7页
科大讯飞产品分析报告V10.docx_第5页
第5页 / 共7页
点击查看更多>>
下载资源
资源描述

科大讯飞产品分析报告V10.docx

《科大讯飞产品分析报告V10.docx》由会员分享,可在线阅读,更多相关《科大讯飞产品分析报告V10.docx(7页珍藏版)》请在冰豆网上搜索。

科大讯飞产品分析报告V10.docx

科大讯飞产品分析报告V10

 

科大讯飞语音云产品分析报告

 

1概述

在传统通信计算模式下,语音的处理方式多是通过单个通信终端完成,例如我们熟悉的等通信终端;在云计算技术背景下,语音的格式转换、区分等操作完全在“云”端执行。

语音云,就是采用云计算的方式来执行语音操作,利用云速度快,准确度高的特性,实现快速的语音应用。

关注语音云的厂商主要有安徽“科大讯飞”公司和北京“云知声”。

科大讯飞的语音云MSP〔iFLYMobileSpeechPlatform〕在10年十月举行发布会。

通过MSP,移动互联网的终端用户可以随时随地的使用语音服务。

产品介绍

2系统架构

2.1网络拓扑图

MSP系统部署在互联网上,通过运营商的三网接入,无论是传统的互联网终端还是移动互联网终端都能够通过网络获得语音服务。

MSP在互联网上建立多个云服务中心,每个服务中心能够独立提供稳定的互联网语音服务,云服务中心之间自动同步数据。

通过这种机制,用户可以获得高度可用、流畅的语音功能支持。

2.2系统功能图

上图蓝色区域为MSP系统的实现范围,浅色区域是与MSP密切相关的组件或第三方角色。

MSP系统主要包括语音应用接口〔SpeechProgrammingInterface,SPI〕、客户端〔MobileSpeechClient,MSC〕、服务器〔MobileSpeechServer,MSS〕和基础支撑〔MSPInfrastructure〕四个层次,这四个逻辑层从用户到服务器操作系统底层,共同构成了完整的MSP系统架构。

应用接口是MSP系统提供的开发接口,集成开发人员应关注这些接口的定义、功能和使用方法。

MSC负责实现这些接口,同时封装了网络通讯、音频编解码〔AudioCodec〕、语音检测〔VAD〕、协议解析〔MSSP〕等功能,同时为了便于开发和使用,系统在这一层提供了一系列高效、易用的工具。

MSS提供语音服务的服务端实现,使用服务端的识别引擎提供语音功能,同时提供管理和维护功能;基础支撑层是MSP的服务基础,负责提供适合云计算架构的负载均衡、并行计算、数据存储等功能。

3产品功能

实现可面向移动2G/3G网络及互联网提供语音服务的服务器,在语音服务平台ISP基础上为移动终端应用程序提供多路并发的语音合成、语音识别、语音听写功能,通过架设在互联网的语音应用服务器,用户可以随时随地获得高质量的语音服务。

实现基于移动终端以及桌面平台的语音应用客户端,提供统一的语音应用开发接口,通过该接口用户可以方便、快速地开发语音应用;同时,MSP也将开放一些基于移动以及桌面平台的语音应用,用于展示MSP语音服务平台的功能和使用方法,让用户直接体验到最新的语音技术。

4产品优势

4.1用户方

1)保持最新,为让用户体验最好的语音合成、最准确的语音识别技术,科大讯飞将以最快的速度推出最新的研究成果,;

2)顺畅体验,为让用户可以随时随地享受顺畅的语音服务,语音云客户端对资源的开销极低,;

3)个性化,为更好服务每个用户,讯飞语音云保存每个用户的个性化数据。

4.2开发方

1)易用,提供可视化控件,覆盖Android、iPhone、Symbian、WindowsMobile等常见智能操作系统,并提供demo程序和源码,使得语音应用集成时间缩短到几个小时;

2)全面,通过语音云开发网站您可以获得开发、调试、评估、调优等全方位的技术支持和点对点的技术服务;

3)容量大,讯飞语音云支持超大规模的用户访问,不必担忧由于用户规模的扩张而服务能力不足;

4)费用低,语音应用开发接口现在可供任何组织和个人免费使用,在您的应用规模高于百万级之后,才需要支付非常低廉的费用。

5相关产品介绍

5.1讯飞语点

5.1.1概述

讯飞语点是款Android应用,可以用语音控制打、发短信、搜索地图、查时刻表、查航班等,类Siri中文语音助手。

5.1.2功能介绍

1、语音识别打

讯飞语点绝非那些早期中的语音拨号功能所能相提并论的,讯飞语音其实已经将语音控制功能落实到了日常的实用功能中,形成了一个语音控制的平台。

用户在讯飞语点主界面下,选择“点击说话”直接说出:

“呼叫***”或者是“帮我给***打”,那么讯飞语点就开始运行,识别用户的语音输入,搜索联系人,最后将拨出。

当然,讯飞语点对语音进行识别的过程很重要,如果用户在点击说话之后,没有进行语音录入,那么讯飞语点将会提示“没有听到声音”,录入语音之后,即可正常拨出。

2、语音控制发短信

在讯飞语点主界面下的六个功能标签中,我们看到“发短信”按钮,点击发短信,系统将提示用户说话录音,用户需要说出类似“给***发短信”,就可以进入信息编辑界面。

这是用户使用讯飞语点来发送短信息的其中一个方式。

在进入讯飞语点发短信功能之后,短信息内容的编辑,用户可以使用上的输入法来进行输入,当然讯飞语点这里提供了一个更加快捷、直接的输入方式,就是用户只需说话,语点即可将您的说话内容转换为文字信息输入信息编辑器中。

 

3、通过语音搜索APP

讯飞语点在打开系统中各个应用时,都表现得比较轻松,并不需要用户等待多长时间。

另外还有一种情况就是,当用户不具体说出需要寻找的是哪一款APP应用时,同样可以进入到讯飞语点为用户提供的APP搜索平台进行查找。

 

4、说一句话就能找到网页

上网搜索功能项其实是属于讯飞语点的聊天功能其中一部分。

讯飞语点将XX为标准搜索平台,并内置入浏览器功能,用户无需做任何的手动跳转即可实现,从讯飞语点到浏览器界面的相互转换,这是通过讯飞语点来进行上网搜索的最大亮点。

 

5、歌曲精准搜索

另外,喜欢听歌的朋友,还可以使用讯飞语点在线搜歌听歌,软件内置了音乐播放器,音乐来源为“联通沃音乐”。

科大讯飞正在与联通合作布局人机交互,语音查询功能可以在生活中给我们提供很多帮助。

搜索讯飞语点的音乐功能,只需用户发出“***的歌曲”的语音指令,讯飞语点即可在线搜索相关歌曲,歌曲是来源于“联通沃音乐”。

选择点击喜欢的音乐即可播放。

6、其他功能简介

打给张三/给张三打/帮我接通张三的/呼叫XXX

发短信

发短信给张三/发短信给老大我马上就到/发短信给XXX,查询余额/回复王五的短信

联系人

把张三的号码发给李四/新建联系人张三,号码是XXXX/张三的号码是多少?

提醒

提醒我9点开会/8点半提醒我给爸爸打/半小时后提醒我去开会/周六早上8点提醒我买家具/每天早上八点提醒我起床

音乐

来一首飞得更高/我想听刘德华的歌/我想听甜蜜蜜/播放汪峰的飞得更高

打开应用

打开相机/启动愤怒的小鸟

搜索应用

下载讯飞输入法/搜索新浪微博/下载水果忍者

餐饮美食

附近有什么好吃的/北京西直门附近的川菜馆/附近有没有肯德基/附近有没有火锅店

火车航班

从广州去北京的航班/查询明天从北京到上海的火车/有没有明天到广州的航班/6月15号成都回广州的飞机票

查询天气

北京的天气怎么样?

/查询上海的天气/广州明天会下雨吗?

查询股票

查一下科大讯飞的股票/查询中国移动的股票/查询002230的股票

地图导航

北京西直门怎么走/北京西站的位置/广州天河广场在哪

上网搜索

打开新浪网搜索科大讯飞/XX一下今年高考作文

听新闻

我想听新闻/最近有什么热门的新闻/播放最近的新闻

翻译

翻译很高兴认识你/汉堡包多少钱一个英文怎么讲/一会见的英文怎么说

聊天

给我讲个笑话吧/2乘以2加上3等于多少/鱼香肉丝怎么做?

/介绍一下美国

5.2讯飞输入法

5.2.1概述

讯飞语音输入法是由科大讯飞推出的一款输入法,是全球首款基于“云计算”方式实现的智能语音输入法。

软件集语音、手写、键盘输入于一体,不仅具有强大的语音识别效果,而且可以在同一界面实现多种输入方式平滑切换,符合用户使用习惯,大大提升了输入速度,使用更加方便快捷。

5.2.2功能介绍

1、语音

首款“云计算”智能语音输入法,采用全球领先的智能语音技术,语音流式识别,边说边识别。

2、手写

在键盘上直接手写,笔画顺序随意组合,竖屏叠写,长句手写也能一气呵成,横屏连写,写完左边写右边。

3、键盘

拼音/英文/字母独立面板,通过底部滑动切换键盘,九宫格式表情、标点、数字、网络符号面板,自动记忆自造词。

5.3讯飞口讯

5.3.1概述

讯飞口讯是一款基于“云计算”方式实现的听写软件,可以将语音转换为文字后通过短信/邮件/微博进行发送。

5.3.2功能介绍

1、语音转换

通过软件进行录音,后经云服务将语音转换成文字。

2、发短信

将转换好的文字带到短信拟稿界面,选择联系人后即可发送。

3、发邮件

将转换好的文字带到邮件拟稿界面,选择联系人后即可发送。

4、分享

将转换好的文字通过选择的“新浪微博”、“腾讯微博”、“网易微博”、“开心网”进行发送。

5、复制

将转换好的文字复制到剪切板,可以在其他应用程序中使用。

6产品对我方的价值

通过语音是人传达信息给系统的最简单途径,而且采用语音控制对操作人员专业水平、操作要求也大大降低。

因此,将语音控制与现有业务进行结合具有实际意义和应用前景。

6.1运营模式

将语音云与现有业务进行结合,通过语音将用户操作指令传达给业务系统,使应用更加智能化,更方便操作。

6.2可行性分析

集团原来与科大讯飞信息科技股份有战略性合作关系,我们可以直接使用他们的语音云,并且往后他们会为我们搭建移动的语音云,可以免费使用。

6.2.1产品推广

语音作为最直接的沟通、操作手段,在接下来生活、工作上必定会越来越被广泛使用,我们可以对其先进行研究,并且有集团与讯飞公司合作的契机,研发自有的语音产品。

例如:

家庭智能--通过语音控制家电,灯、空调、热水器,不需要到固定的位置去操作;

将其与OA、定位、无线城市移动版系统结合,实现快速查询、定位;

语音点餐,通过语音实现点餐功能,适用于人多,密集的地方,如医院,餐馆、学校、图书馆、商场等,即卫生又方便;

数据分析和数据筛选根据你所说的查询条件自己帮你查出来,而不用你去选一堆的条件;

汽车语音控制可以让车主在行车过程中,利用语音对车内设备进行控制,防止出现分神操作车内设备导致交通事故;

另外语音支付、语音转账、语音电视、语音控制游戏等。

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 法律文书 > 判决书

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1