基于sopc声纹识别技术.docx

资源描述

基于sopc声纹识别技术.docx

《基于sopc声纹识别技术.docx》由会员分享，可在线阅读，更多相关《基于sopc声纹识别技术.docx（12页珍藏版）》请在冰豆网上搜索。

基于sopc声纹识别技术.docx

基于sopc声纹识别技术

北京联合大学

基于sopc技术的

声纹识别系统的研究

姓名：

学号：

班级：

辅导老师：

第一章绪论

1.1课题概论

1.1.1课题研究背景及现状

随着计算机技术地不断发展,信息时代步伐地不断前行,基于生物特征的

识别技术成为了当前众多领域的热门研究对象,在军事、医疗、司法和区域安

全认证等方面体现尤为突出,突出的应用价值和广泛的适用范围是生物特征识

别技术的主要竞争优势所在。

在这个高速发展的信息时代,传统的身份认证技术已经肝始慢慢地受到了

限制,这就意味着近年来生物特征识别技术一词在人们的日常生活中已然不再

陌生。

传统的身份识别技术在使用上之所以有较大的局限性,主要是因为它的

识别是基于一些物体凭证的,如户口本、居民身份证、驾驶证、会员卡、字迹

等一些用于证实合法身份的具体凭证。

但这些凭证往往在有些特殊的时候会受

到不小的限制,因为这些凭证除了可以通过一些不法手段假造获取之外,还存

在着凭证用时过久失效,丢失或者是被不法分子盗取后用于从事一些违法事件

等一系列问题。

这就迫使人们通过计算机技术来鉴定身份的这一发展态势骤然

升温,这类身份识别技术的出现不仅能解决许多之前传统识别技术无法克服的

难题,而且其便利性和鉴别的准确性也让传统的识别技术望尘莫及。

指纹识别技术、人脸识别技术、声纹识别技术以及虹膜识别技术是当前国

际上最为热点的且研究力度最大的几种生物特征识别技术[1]。

在对人类个体特征

鉴别方面,这几种计算机生物识别技术都有着自己独特的优势,但由于人类个

体特征的多元化,这些现代的识别技术也不能分别做到面面俱到,各自都还存

在着一些缺点和不足,所以这类目前看似很成熟的技术,仍然有着研究和发展

的空间。

语言作为一种最为普通且最为方便的交流方式,而且每个人发出的声音的

特征点是各不相同的,个体身份的鉴别就可以通过这一生理特征的不同来实现。

语言声音的唯一性加大了不法者故意模仿和伪造的难度,也保证了身份识别鉴

定的高安全性和可靠性。

其实在上个世纪的30年代就有了声纹识别技术,这段时期语谱图的发明标

志着最早声纹识别技术的诞生。

随着信息技术的不断进步,人类语言的自动化

识别得以实现。

早期实现说话人识别的主要任务提取并选择合适的系统有效参

数。

一般语音的参数存在着两种不同的特性,即线性与非线性,对这两种特性

的参数分别以何种方式匹配并进行处理,是近40年来声纹识别系统的重点讨论

及研究对象。

欧洲电联于上世纪90年代末,最先提出了声纹识别技术与网络技

术相结合的概念,并于同年在通信网络架构上实现了这项识别技术。

就我国现阶段在声纹识别领域的研究而言,可以说是近年来最热门的研究

方向之一,尤其在国内高校中,对声纹识别的重点研究已经推向了一个新的高

潮。

但总体来看,由于我国在声纹识别领域的研究较其它一些发达国家较晚,

取得的研究成果和发展的成熟程度还存在较多不足之处,还存在着很大的研究

和发展空间。

这几年对声纹识别着重进行的研究主要是在算法优化与设计方法上,加上

许多半导体工艺的不断进步和各种新型高速运算处理器的诞生,声纹识别系统

的实现平台也有了更多更好的选择。

如现在较多用于嵌入式系统发的几种高

速处理器ARM、DSP和FPGA都能在声纹识别领域的发展上体现出它们的强大,

基于这些处理器的声纹识别系统也将更大程度的体现出它的高稳定性、有效性、

可靠性及便利性。

1.1.2研究的目的与意义

信息技术的不断高速发展为声纹识别技术提供了更多更好的研究平台,尤

其在嵌入式平台上开发的声纹识别系统得到了社会的大量关注和广泛的应用。

这种识别技术实现的根本原理是依据说话人生理上的语音特点,并通过相关算

法对这些特点进行具体化操作,得出具有特点表征意义的参数值,再将特征值

与库中的声音模板进行吻合度测试,最终通过测试结果自动做出其身份合法性

的判断。

众所周知,人的语音发声是由人体的多个发音器官同时工作,相互配

合产生的,每一个发音器官的细微动作都会使发出的声音变得不同[2],如图1.1

所示。

所以每个人的声音特点是独一无二的,即使是对某种声音去刻意地模仿,

也不可能做到完全一致,这点也充分说明了声纹识别是一种安全性能极高的应

用技术。

声纹识别技术的实现涉及到许多相关算法,为算法的高效实现选择一个合

适的承载平台是非常重要的。

SOPC作为一种可以在片上对硬件进行灵活编程的

技术,对FPGA的逻辑资源具有充分的编辑和支配能力,再加上NiosII软核处理

器的嵌入特性,更让以SOPC为平台的系统开发有了灵魂。

尤其是定制专用指令

这一硬件处理解决方案的提出,使得复杂度极高或运算量极大的算法也能得以

高效实现,这也是SOPC较其它嵌入式开发技术而言最大的优势体现。

而计算量

较小的系统任务则可以通过常用的软件处理方式完成,这种软硬结合,取长补

短的设计方法,为满足系统功能的设计要求提拱了良好的发环境。

为了研究一个在噪声环境下仍然能够保持高可靠性和高有效性的声纹识别

系统,本课题选用SOPC为系统发平台,综合考虑SOPC结构特点和相关识

别算法特性,为部分算法的实现提供基于SOPC技术的改进措施,以保证噪声

环境下系统识别的准确性和响应的快速性。

1.2涉及的相关技术概述

1.2.1SOPC技术概述

可编程片上系统（SystemOnProgrammableChip,SOPC）,通过这种技术的

可编程性可以灵活的设计完成一个满足用户要求的电子系统。

片上系统（System

OnChip,SOC）技术的円益成熟,已在半导体行业的应用中占据了大半份额,在

可编程的片上系统问世之前,SOC基本上还是通过专用集成电路（Application

SpecificIntegratedCircuit,ASIC）这一技术实现的。

ASIC是一种全定制的集成电路,它是为满足特定的功能要求和技术参数而

专门设计的,这种集成电路的制造周期较长且所需成本较高,制成后内部电路

结构不能修改。

体积小、理想的电路性能和高集成度是全定制集成电路的几大

优势和特点[3]。

而现场可编程门阵列（FieldProgrammableGateArray,FPGA）作

为目前最常用的半定制集成电路,它的制造工艺和结构特点与全定制集成电路

存在着较大的差异,这也决定了二者面向的市场需求也大不相同。

所谓半定制就是将电路器件制作成一个半成品,FPGA在出厂时,内部的门

阵列实际上都是由单元门电路加工而来,后期用于应用发时,再由发人员

对其内部的门阵列进行连接设计,搭建出用于实现特定系统功能的应用电路,

图1.2较清晰地展示了FPGA的内部资源及其结构。

半定制集成电路具有生产周

期短,造价低,用作系统开发时易修改等特性。

但总的来说,全定制集成电路

在半导体行业兴起的早期,所占的市场份额远远大于半定制集成电路。

随着半导体行业的不断发展,高精度半导体工艺也让芯片的集成度大大提

高,再加上由于如今信息技术的不断加速,使得很多用户对产品的研发周期给

予了很大的压力,哪种产品的面市时间短、产品设计的灵活性高,用户就更倾

向于用这样的产品做系统开发,由此,近年来半定制集成电路所占的市场份额

发生了明显的变化,所以目前FPGA已经具备了非常强劲的市场竞争力。

将SOC

技术交予可编程逻辑器件（ProgrammableLogicDevice,PLD）实现,这一思想是

由Altera公司最早提出的,从此在嵌入式开发领域才出现了SOPC的概念。

PLD

和SOC技术的融合造就了基于SOPC技术的应用与开发,这一新的技术既解决

了ASIC工艺产品的价格昂贵的问题,也使得基于SOPC技术的系统开发具有很

强的灵活性。

可以说SOPC将PLD和SOC各自的设计特性及优点集于一身,主要体现在

以下几个方面:

1）内部集成了高速的、小容量的RAM;

2）至少包含一个嵌入式处理器内核;

3）片内具有大量的IP核资源;

4）庞大的半导体集成度;

5）完善的编程接口和调试接口。

同年,软核处理器Nios也由Altera公司发布,这是一种精简指令集处理器,

这也是首款专门为优化可编程逻辑而设计的可配置内核。

而Niosn作为目前最

新的软核版本,秉承了Nios软核处理器的指令集,且具有良好的指令兼容性。

在开发设计任何一个系统的前期,开发环境的选择往往是设计人员首先需

要熟悉的,JT?

发环境的优劣主要体现在它的功能全面性和易操作性上,无疑选

择好的开发环境对开发一个高效的系统会带来许多帮助,对系统的开发质量和

开发周期都会有着积极的影响。

SOPC系统的开发工作也一样,也需要一个良好

的开发环境,作为Altera公司自主研发的的配套开发软件QuartusII,其中的SOPC

Builder就是一个不错的选择,它为SOPC系统的建立与设计提供了一个非常丰

富的图形操作界面,并且较传统的片上系统构建而言,SOPCBuilder可以根据

设计中所描述的CPU、存储器件以及外围功能设备之间的关系,效率极高地将

它们搭建起来,形成一个高可靠性的SOPC系统图1.3所示的是通过SOPC

Builder完成系统开发的设计步骤

1.2.2声纹识别技术概述

通过说话者发出的语音特点来自动判断其身份的一项技术,称为声纹识别

技术,一般有声纹辨别和声纹确认两种识别方案。

声纹辨别即可以辨认说话人

的声纹信息是否在说话人的声纹信号集中,以此判断当前说话人是否为合法用

户之一,如果是合法用户,则可以确定当前具体是哪个用户;声纹确认则是在

说话人的声纹信号集中只存有仅有的一位合法用户,在每次的说话人识别判断

中确定当前说话人是否为合法用户。

声纹识别的实质主要包括以下三个过程的内容[5]:

1）在进行特征提取时获取语音特征的过程;

2）进行训练时建立语音信息模板或模型的过程;

3）身份识别时有效语音特征匹配与判决输出的过程。

从采集到的说话人语音信号中获取可以表征说话人声纹特点的特征参数,

这一阶段叫做特征提取,在此阶段中要尽量多而准确地提取说话人的声纹特征

参数。

特征提取之后,还要将提取出来的参数进行有效地选择,参数选择过程

对整个系统设计来说非常的重要,它将直接影响到识别效果的好坏。

系统的整个识别过程中,最重要的一个步骤则是建立模型和模式匹配,建

立模型这一过程实际上是在训练阶段完成的,而模式匹配则是在识别阶段完成

的。

特征提取、建立声纹模板和模式匹配这些都是实现声纹识别系统必不可少

的关键技术,所以如何选择合适的算法来满足这些技术要求显得十分重要。

马

尔可夫模型、矢量量化和人工神经网络模型是当前主要的几种建模方式[6],针对

不同的设计环境,应选择合适的建模方法。

目前,如何提高系统的鲁棒性是目

前声纹识别的一大重点关注与研究方向。

1.3技术难点与需解决的关键问题

1.3.1课题的技术难点

经过近80年的发展,目前已在声纹识别领域取得了巨大研究成果。

从本课

题研究的重点入手,无论从声纹识别的有关算法还是整个识别的系统构架搭建

来看,仍然存在着以下技术难点:

1）很难寻到一种复杂度低且可靠性高的声纹特征参数。

分离语音信号中的

语音特征和声纹特征是声纹识别系统的发过程中非常关键的一个步骤,而二

者的分离是要通过特征参数来完成的,但就目前为止,还没有找到一种很合适

的特征参数能够很好地解决此类问题。

2）受到噪音污染的说话人语音信号。

由于声纹识别系统的应用场合可能是

非静态的,如果在噪声环境下,语音信号在采集过程中则极易被污染,给信号

采集和后续的特征提取工作会带来不小的麻烦。

3）在SOPC平台上实现系统架构。

为了保证系统的识别效果,选用合适的

相关算法并根据其特点进行得当的优化,是在嵌入式平台上实现声纹识别系统

的根本要求,而在嵌入式开发平台上为算法的高效实现制定合理的改进方法,

正是本课题研究的重点及难点所在。

再加上SOPC在速度和资源方面的限制,

那么这也给声纹识别系统实现高执行速度与识别精度的要求提高了不小的难

度。

所以,选择声纹特征参数,处理受到噪声污染的语音信号以及如何在SOPC

平台上实现性能良好的声纹识别系统,是本课题研究的主要技术难点。

1.3.2课题需解决的关键问题

任何一个声纹识别系统,都包括为各位合法用户创建与之对应的包含表征

其各自声音特性的模型这一必要任务。

那么,特征参数的得当选择,语音模型

的合理构建,在SOPC开发平台上完成性能优越的识别系统设计,这些都是本

课题必须重点考虑的问题。

故为高效地实现系统功能,应主要从系统结构的搭

建以及相关识别算法的选择与优化下手,具体须解决以下几个问题:

1）选取具有良好可识别性能且有一定鲁棒性的语音特征向量,才能做好语

音信号的预处理和特征提取。

2）选择合适的特征参数去建立声纹识别模板,且选择合适的语音建模算法

和识别算法以保证系统的识别精度。

3）在保证识别精度和速度的前提下,在SOPC上实现相应的算法。

4）人机交互接口是声纹识别系统必不可少的设计环节之一,予以合理的设

计则可实时地采集并有效地处理说话人的语音信号。

1.4论文章节安排

本论文主要分为5章:

第1章绪论。

主要概述了本课题研究的背景与现状及目的与意义,简略介

绍了当前SOPC技术和声纹识别技术的发展与现状,也提出了本次课题研究的

技术难点与要解决的关键问题有哪些。

第2章声纹识别理论基础及系统设计方法。

主要讲述了声纹识别系统的工

作原理,并就系统的实现提出了合理的设计方法。

第3章SOPC声纹识别系统的功能需求与系统构建。

针对本次研究的识别

系统需求进行了全面分析和功能制定,提出并讨论了实现系统功能所需的技术

重点,并对系统的设计流程做了总体上的规划。

第4章噪声环境下的识别算法研究与实现。

重点研究了有关声纹识别的相

关算法,并对其进行选择与优化,通过对处理方法合理的改进让算法的实现变

得既可靠又高效。

3.2声纹识别系统功能设计

图3.2基于SOPC的声纹识别系统总体架构示意图

如图3.2所示的系统总体架构是切实根据功能要求搭建的。

其实这整个系统

设计方案都是围绕着两个问题来做的:

一是相关算法的改进与实现,二是如何

合理地设计系统所需的人机交互接口模块。

各功能模块的功能实现,都是在

NiosII嵌入式软核的支配和控制下完成的。

如上图所示,本课题研究一个具有双

NiosII处理器的SOPC系统,主处理器以把握全局的功能模块工作为主,也分管

码书生成算法的实现,而从处理器则主要负责特征提取算法实现的工作,这样

可以为主处理器分担不小的工作量,主从处理器可以通过存储器共享完成数据

传输。

这种两个处理器分工协作的系统模式,使得声纹识别系统在复杂环境下

的识别精度和响应速度得以保证。

从系统的工作流程看,按先后顺序可以分为三个阶段:

1）语音信号采集与特征提取阶段;

2）语音码书的生成阶段;

3）发声者的身份判决阶段。

系统架构图中已表述得很明显,第一阶段是由主、从处理器配合着完成的,

但特征提取的算法实现主要由从处理器完成。

第二、三两个阶段的任务则全部

是由主处理器负责完成的。

主处理器的工作按其响应需求可分为三类[34]:

1）对响应的实时性要求较高的系统任务。

如语音的采集,码书生成的适应

度计算等等,所以需要选用高优先级别的中断处理方式与此类系统任务对应;

2）对响应的实时性要求一般的系统任务。

如主、从处理器之间的数据通信,

其对响应的快速性要求没有第一类那么高,也就是说处理这种任务时可以允许

有短时间的响应延迟,所以可以选择优先级别较低的中断处理方式与此类系统

任务对应;

3）对响应的实时性要求较低的系统任务。

如采用液晶屏显示输出结果,在

执行此任务时,系统允许有较长时间的响应延迟,所以对于这种系统任务可以

不用到中断处理方式,一般来说用查询方式就可以完成此类工作。

3.3声纹识别系统工作流程设计

系统机后,首先系统自动进行初始化,然后开启模式选择状态,提供三

个可选的系统模式:

用户登记、用户识别、删除用户信息。

其中删除用户信息

（擦出管理）的作用是:

由于存储设备的空间是有限的,所以不能无限制地存

放用户信息,因此在达到设置的合法用户数上限时,系统就必须删去一些已经

3.4本章小结

本章主要介绍了这个声纹识别系统的具体功能要求,并针对这些功能重点

讨论了系统的整个工作流程设计方案。

确定了SOPC系统中双NiosII软核的设

计结构,通过主、从处理器的协同作业,不仅使逻辑资源得以充分利用,最主

要的是,通过这种设计方法可以很好地解决系统功能的根本所需。

展开阅读全文