ImageVerifierCode 换一换
格式:DOCX , 页数:15 ,大小:935.77KB ,
资源ID:12674029      下载积分:3 金币
快捷下载
登录下载
邮箱/手机:
温馨提示:
快捷下载时,用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)。 如填写123,账号就是123,密码也是123。
特别说明:
请自助下载,系统不会自动发送文件的哦; 如果您已付费,想二次下载,请登录后访问:我的下载记录
支付方式: 支付宝    微信支付   
验证码:   换一换

加入VIP,免费下载
 

温馨提示:由于个人手机设置不同,如果发现不能下载,请复制以下地址【https://www.bdocx.com/down/12674029.html】到电脑端继续下载(重复下载不扣费)。

已注册用户请登录:
账号:
密码:
验证码:   换一换
  忘记密码?
三方登录: 微信登录   QQ登录  

下载须知

1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。
2: 试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。
3: 文件的所有权益归上传用户所有。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 本站仅提供交流平台,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

版权提示 | 免责声明

本文(XX语音智能转录一体化解决方案用于审讯场景.docx)为本站会员(b****3)主动上传,冰豆网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知冰豆网(发送邮件至service@bdocx.com或直接QQ联系客服),我们立即给予删除!

XX语音智能转录一体化解决方案用于审讯场景.docx

1、XX语音智能转录一体化解决方案用于审讯场景智能语音转录一体化解决方案1 项目概述 11.1 项目背景 11.2 市场分析 11.3 应用场景 12 方案介绍 22.1 产品目标 22.2 产品架构 22.3 产品特性 33 产品功能 33.1 笔录模版 33.2 审讯笔录 33.3 笔录校对 43.4 回放录像 43.5 光盘直刻操作 53.6 硬盘录像、回放操作 63.7 硬盘数据导出 83.8 光盘数据导入至硬盘 94 核心技术 94.1 技术简介 94.2 工作原理 105 配置与部署 115.1 推荐配置 115.2 系统部署 111项目概述1.1项目背景随着信息化时代的到来,海量语音

2、的获取和存储能力愈发强大,基于语音转写的实际场景,会存在需要大量的人力投入、工作效率不高、语音数据应用质量和效果不高的情况,并且结合各大单位机构的办公现状,当前会议记录、出稿的准确性和时效性要求高,人员工作压力大,传统的人工整理方式已经很难满足要求。当前各类型会议,特别是重大、大型会议,介于信息安全等因素,需要指派内部专职人员全程记录,会后还要花费大量的时间反复回听录音、编辑会议纪要。很多重要会议具备时间长、信息量大、纪要输出严等特点,这对会议记录人员提出更高要求,会议记录和整理的工作强度大,且仍可能存在信息遗漏或会议思想理解偏差等问题,亟需得到解决。基于以上背景,智能语音转录一体化解决方案应

3、运而生,实现了以符合安全要求的方式将发言语音内容实时转换成文字和将历史语音记录并转换成文字。该系统具有以下技术特点:一是语音转文字准确率高,中文标准普通话的转写准确率平均可达90%;二是数据安全和保密性强,采用私有云和终端一体机的方式部署,可有效避免会议内容和信息的外泄和灵活响应实际使用需求;三是可针对发音人口音和应用领域进行定制优化,持续提升转写效果;四是人工辅助产出语音结果,实现快速校稿并发布。智能语音转录一体化解决方案发布至今,已在多家企事业单位形成应用示范,基本覆盖了政府、企业、教育、公检法、医疗等行业,取得了良好的落地成效。1.2市场分析政府、事业单位、教育和中大型企业由于信息流动范

4、围较大,很多决策信息需要及时地向相关人员传达,怎样更好更快地对会议中发言信息进行记录整理,成为智能化办公建设道路中的一项挑战,同时也给我们带来了机会。在公检法领域,在做笔录或审讯时均需采集双方的录音,一方面用于存证分析,另一方面提高人工整理的准确率和办案效率。在医疗领域,医生每天需要录入大量的电子病历信息,像口腔门诊和超声检查时往往不再方便去打字,急需用一种更加便捷的方式来即时快速的记录患者信息,语音录入代替传统键盘的解决方案应运而生。1.3应用场景1.3.1 办公会议智能语音转录一体化解决方案中的会议转写服务,可以选定不同类型会议的模板,在会议过程中将多人的发言内容按角色实时转写成文字,最终

5、保存会议,日后可追溯浏览录音及文字。上述同样可适用于法院庭审场景1.3.2 审讯对话智能语音转录一体化解决方案中的审讯笔录服务,办案人可以在讯问过程中将双方的对话内容实时转写成文字,最后获取关键信息或快速成稿。2方案介绍2.1产品目标智能语音转录一体化解决方案是采用“端”的架构,为特定企业或机构提供各种语音转写相关的产品服务,并最终形成一整套“软+硬”的智能解决方案。2.2产品架构智能语音转录一体化是基于的语音识别(ASR)技术、语音合成(TTS)技术开发的一种智能应用系统,该系统将用户的语音转化为文本并准确理解用户的业务需求,辅助信息的记录共享与决策。智能语音转录一体化的设计理念是:系统由多

6、个模块组成,模块之间高内聚低耦合,易用性强。图1【智能语音转录一体化架构图】1、审讯人和被审讯人:分为审讯人和被审讯人两种角色2、麦克风: 语音采集设备,根据距离可分为远讲或近讲,根据佩戴方式可分为鹅颈式、领夹式、手持式或盒子,建议根据实际使用需要选择。3、音频处理器:负责接入麦克风,对声音进行编解码,将音频传输到语音转写服务器中,部分情况也可由电脑独立完成。4、语音精灵:负责语音转写和语音合成服务。5、终端设备:便携式语音识别音视频主机。6、客户端软件:安装在书记员电脑的软件产品,可根据实际场景区分,如语音输入,单人转录,双人讯问,多人会议(包括庭审),录音转写等。2.3产品特性智能辅助:将

7、语音转写成文字,辅助记录者完成语音信息的即时记录与分享需求。场景适配:针对特定用户特定使用场景进行模型和人机交互的全方位匹配。简易部署:产品集成化程度高,适应现场环境,简便快捷。定制模型:针对特定行业领域进行真实场景化的模型优化训练,提高识别准确率。软硬结合:语音前端与后端的软硬件结合,保证最终输出结果达到最佳效果。3产品功能3.1笔录模版可根据案件需要新增、修改、删除笔录模板,可以将一个模板设为默认模板,选其中一个模板单击“设为默认模板”后,审讯时自动以默认模板作为笔录模板。3.2审讯笔录在未审讯界面双击排期进入审讯界面,如果存在默认模板,则自动打开默认模板,作为该次笔录的模板也可以点击打开

8、模板,从本地选择一个文档作为该案件的笔录模板后开始审讯,审讯结束后,点击结束审讯结束此次审讯,途中也可以点击暂停审讯。3.3笔录校对结束审讯后排期在笔录校对列表中,单击选中再点击修改,可以修改、完善案件信息。在笔录校对列表中选中该案件,双击进入笔录校对界面;校对的过程中发现记录错误的可以在里面进行修改。点击右侧的回放菜单可以查看案件信息、播放案件录像、查看重点标记。3.4回放录像点击本地录像回放,笔录系统会根据当前所打开的笔录进行录像、案件信息关联回放,可以导出的案件或联动设备刻录时的光盘内的笔录。 3.5光盘直刻操作1、按直刻终端前面板上的“开/关”键将直刻终端开启;(需要等待硬盘加载可以看

9、到硬盘容量再对设备进行操作)2、按直刻终端前面板上的“进/出仓”键将光驱仓门打开,放入两张DVD+R的空白光盘并关闭光驱仓门,等待直刻终端对放入的光盘检测、格式化;(如图2.10)3、按直刻终端前面板上的“刻录选时”键选择刻录时长;(每按一次时间增加1小时,1-24小时循环)4、按直刻终端前面板上的“光盘直刻”键开始光盘直刻并联动硬盘录像备份;(如图2.11)5、按两次直刻终端前面板上的“停止光盘”键停止光盘直刻,进行封盘并联动停止硬盘录像备份; 3.6 硬盘录像、回放操作1、按直刻终端前面板上的“硬盘录像”键开始硬盘录像;2、再按直刻终端前面板上的“硬盘录像”键停止硬盘录像;3、用鼠标打开U

10、I操作菜单“硬盘回放”弹出回放框选择需要回放的视频双击; 3.7 硬盘数据导出1、用鼠标打开UI操作菜单“硬盘回放”;2、选择需要导出的视频文件在前面的勾选上;3、选择导出路径;4、点击备份,等待数据导出完成; 3.8 光盘数据导入至硬盘1、将需要导入的光盘放入设备光驱;(左为光驱一、右为光驱二)2、用鼠标打开UI操作菜单“硬盘回放”;3、选择导入输入源(光驱一或光驱二)至硬盘; 4核心技术4.1技术简介4.1.1语音识别技术简介语音识别是将一大段的语音转写成文字,让机器记录下来。4.1.2 语音合成技术简介语音合成是将文本转化成语音,让机器像人类一样能说会道。4.2工作原理语音识别工作原理如

11、图2所示:图2【语音识别工作原理】语音信号通过音频采集设备进入系统后,首先进入预处理阶段。预处理包括端点检测和噪声消除等环节,端点检测环节对输入的音频流进行分析,自动删除音频中静音或非人声等无效部分,保留有效语音。噪声消除环节滤除背景噪声,满足用户在不同环境下使用需求。经过预处理后的语音信号进入特征提取阶段,对语音信号进行分析处理,去掉与语音识别无关的冗余信息,获得影响语音识别的重要信息,同时对语音信号进行压缩。从说话人的语音信号中提取出说话人的声学特征。提取到的特征信号通过训练算法训练后,建立起声学模型和语言模型。为语音特征信号的匹配提供匹配依据。 声学模型的设计与语言发音特点密切相关,识别

12、时,将输入的语音特征同声学模型进行匹配,得到最佳的识别结果。声学模型单元(字发音模型、半音节模型或音素模型)对语音训练数据量大小、系统识别率,以及灵活性有较大的影响。通过声学模型的优化,可以良好的识别出方言和地区口音。语言模型针对系统使用的语言进行设计,包括语义结构、语法规则、语言的数学描述模型等方面,在大词汇量的语音识别系统中具有不可替代的作用,当识别时遇到多音字等容易导致歧义的结果时,语言模型可以根据语言学模型、语法结构、语义学进行判断纠正,输出正确的结果。进行语音识别时,特征信号通过声学模型进行发音处理,通过语言模型对语义、语法进行处理,经解码器找出最大概率符合该信号的字串,输出结果,传

13、递给自然语言理解单元。自然语言理解单元经过意图理解,找出最大概率符合规则的答案,予以输出。5配置与部署5.1推荐配置4.1.1 软件环境智能语音转录一体化需要配置恰当的软件运行环境,包括但不限于:操作系统Red Hat Enterprise Linux Server Release 6.2CentOS 6.5Suse11sp1 x86_64, kernel:2.6.32JDKJDKJDK 1.7服务器Apache-Tomcat 8.0.11数据库Oracle 11.2.0 XERedis 3.2.1表1. 软件基本要求列表4.1.2 硬件环境智能语音转录一体化具有硬件占用资源低的特点,建议最低的硬件配置如下:服务器名硬件配置会议&询问笔录多功能一体机1.会议&询问笔录多功能一体机(32G版):智能语音识别多用途一体设备,实现会议内容实施转写(普通话),实时编辑,会议模板定制,可支持4路麦克风(标配2支鹅颈麦克风),分角色转写记录内容。2. 会议&询问笔录多功能一体机(128G版) :智能语音识别多用途一体设备,实现会议内容实施转写(普通话),实时编辑,会议模板定制,可支持4路麦克风(标配2支鹅颈麦克风),分角色转写记录内容。表2. 硬件基本要求列表5.2系统部署详见智能语音转录一体化_部署手册。

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1