ImageVerifierCode 换一换
格式:DOCX , 页数:21 ,大小:1,014.04KB ,
资源ID:3525722      下载积分:12 金币
快捷下载
登录下载
邮箱/手机:
温馨提示:
快捷下载时,用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)。 如填写123,账号就是123,密码也是123。
特别说明:
请自助下载,系统不会自动发送文件的哦; 如果您已付费,想二次下载,请登录后访问:我的下载记录
支付方式: 支付宝    微信支付   
验证码:   换一换

加入VIP,免费下载
 

温馨提示:由于个人手机设置不同,如果发现不能下载,请复制以下地址【https://www.bdocx.com/down/3525722.html】到电脑端继续下载(重复下载不扣费)。

已注册用户请登录:
账号:
密码:
验证码:   换一换
  忘记密码?
三方登录: 微信登录   QQ登录  

下载须知

1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。
2: 试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。
3: 文件的所有权益归上传用户所有。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 本站仅提供交流平台,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

版权提示 | 免责声明

本文(matlab语音识别系统源代码最新版.docx)为本站会员(b****5)主动上传,冰豆网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知冰豆网(发送邮件至service@bdocx.com或直接QQ联系客服),我们立即给予删除!

matlab语音识别系统源代码最新版.docx

1、matlab语音识别系统源代码最新版mat I ab语音识别系统(源代 码)最新版冃录一、 设计任务及要求 二、 语音识别的简单介绍语者识别的概念 特征参数的提取 用矢量量化聚类法生成码本2.12.22.3.43.2代码说明 3.2.1函数mfcc -3.2.2函数disteu3.2.3函数vqlbg3.2.4 函数 test -3.2.5 函数 testDB3.2.6函数train3.2.7 函数 melfb四、演不分析 五、心得体会 附:GUI程序代码函数关系2. 4VQ的说话人识别 三、算法程序分析3.155.66 788.9.11、设计任务及要求用MATLAB实现简单的语音识别功能;具

2、体设计要求如下: 用MATLAB实现简单的数字9的语音识别功能语音识别的简单介绍提取的特征参数进行分类,产生不同码字所组成的码本。 用VQ方法计算平均失真测度(本系统在计算距离d时, 判断说话人是谁。基于VQ的说话人识别系统,矢量量化起着双重作用。在训练阶段,把每一个说话者所 在识别(匹配)阶段,我们 采用欧氏距 离测度),从而语音识别系统结构框图如图1所示。图1语音识别系统结构框图2.1语者识别的概念 语者识别就是根据说话人的语音信号来判别说话人的身份。语音是人 的自然属性之一,由于说话人发音器官的生理差异以及后天形成的行为差异,每个人的语 音都带有强烈的个人色彩,这就使得通过分析语音信号来

3、识别说话人成为可能。用语音来 鉴别说话人的身份有着许多独特的优点,如语音是人的固有 的特征,不会丢失或遗忘;语 音信号的采集方便,系统设备成本低;利用电话 网络还可实现远程客户服务等。因此,近 几年来,说话人识別越来越多的受到人们的重视。与其他生物识别技术如指纹识别、手形 识别等相比较,说话人识 別不仅使用方便,而且属于非接触性,容易被用户接受,并且在 已有的各种生 物特征识别技术中,是唯一可以用作远程验证的识别技术。因此,说话人识 别的应用前景非常广泛:今天,说话人识别技术己经关系到多学科的研究领域,不同领域 中的进步都对说话人识别的发展做出了贡献。说话人识别技术是集声学、语言学、计算机、

4、信息处理和人工智能等诸多领域的一项综合技术,应用需求将十分广阔。在吃力语音信号 的时候如何提取信号中关键的成分尤为重要。语音信号的特征参数的好坏直接导致了辨别 的准确性。2.2特征参数的提取对于特征参数的选取,我们使用mfcc的方法来提取。MFCC参数是 基于人的听觉特性利用人听觉的屏蔽效应,在Mel标度频率域提取出来的倒谱特征参 数。MFCC参数的提取过程如下:1.对输入的语音信号进行分帧、加窗,然后作离散傅立叶变换,获得频谱 分布信 息。设语音信号的DFT为:X 1 j 2 nkXa (k) X (n) e s 0 k N 1 (1)nl其中式中x(n)为输入的语音信号,N表示傅立叶变换的

5、点数。2再求频谱幅度的平方,得到能量谱。3.将能量谱通过一组Mel尺度的三角形滤波器组。中心频率为f(ni),ni=l,2, 3, , M本系统取M=100。我们定义一个有M个滤波器的滤波器组(滤波器的个数和临界带的个数相近),采用的滤 波器为三角滤波器,4.计算每个滤波器组输出的对数能量。XI2(=)S(m) ln( IXa(k) p Hn (k),其中H m (k)为三角滤波器的频率响应5.经过离散弦变换(DCT)得到MFCC系数。MlC(n) S (m) cos ( n(m 0. 5 / m), (3) mo0 n N 1MFCC系数个数通常取20- 30,常常不用0阶倒谱系数,因为它反

6、映的是频谱 能量,故 在一般识別系统中,将称为能量系数,并不作为倒谱系数,本系统选取20阶倒谱系数。2.3用矢量量化聚类法生成码本我们将每个待识的说话人看作是一个信源,用一个码本来表征。码本是从该说话人 的训练序列中提取的MFCC特征矢量聚类而生成。只要训练的序列足够长,可认为这个 码本有效地包含了说话人的个人特征,而与讲话的内容无关。本系统采用基于分裂的LBG的算法设计VQ码本,Xk(k 1,2, , K )为训练序 列,B为码本。具体实现过程如下:1.取提取出来的所有帧的特征矢量的型心(均值)作为第一个码字矢量Bio2.将当前的码本Bm根据以下规则分裂,形成2m个码字。BmBm(l )Bm

7、 Bra(1 )(4)其中m从1变化到当前的码本的码字数,e是分裂时的参数,本文e =0.013.根据得到的码本把所有的训练序列(特征矢量)进行分类,然后按照下面两个公式计算训练矢量量化失真量的总和D以及相对失真(n为迭代次数,初始ri=O,de前的码书就是二8, B为当前的码书),若相对失真小于某一阈值e ,迭代设计好的量化失真量结束,当2ni个码字的码书,转5。否则,转下一步。K呦)mind (Xk,B)k15)对失真:B(n 1) B n6)&n4. 重新计算各个区域的新型心,得到新的码书,转3 05重复2 , 3和4步,直到形成有M个码字的码书(M是所要求的码字数) 其中 D0=100

8、00o2.4 VQ的说话人识别设是未知的说话人的特征矢量X1, K , Xi,共有T帧是训练阶段形成的码书,表示 码书第m个码字,每一个码书有M个码字。再计算测试者的平均量化失真D,并设置一 个阈值,若D小于此阈值,则是原训练者,反之则认为不是原训练者。D 1/Tj imind (xj, Bm)ImM(7)三、算法程序分析在具体的实现过程当中,采用了 mat lab软件来帮助完成这个项冃。在mat lab中 主要由采集,分析,特征提取,比对几个重要部分。以下为在实际的操作中,具体用到得 函数关系和作用一一列举在下面。3.1函数关系主要有两类函数文件Train, m和Test, m在Train,

9、 m调用Vqlbg. m获取训练录音的vq码本,而Vqlbg. m调用mfcc.m获 取单个录音的mel倒谱系数,接着mfcc. m调用Melfb.m 将能量谱通过一组Mel尺度的三角形滤波器组。在Test, m函数文件中调用Disteu. m计算训练录音(提供vq码本)与测试 录音 (提供mfcc)mel倒谱系数的距离,即判断两声音是否为同一录音者提供。Disteu. m调 用mfcc. m获取单个录音的mel倒谱系数。mfcc.m调用Melfb.m 将能量谱通过一组Mel尺度的三角形滤波器组。3.2具体代码说明3. 2. 1 函数 mffc:function r = mfcc(s, fs)

10、=floor (1 - n) / m) + 1; % 沿- 8方向取整1 :n1:nbFrame =s(j - 1) * m) + i): % 对矩阵 M 赋值h = hamming(n) : %力H hamming窗,以增加音框左端和右端的连续性 M2 = diag(h) * M:for i = 1:nbFrame frame (:, i) = fft(M2(:, i): %对信号进行快速傅里叶变换FFTendt = n / 2;tmax = 1 / fs:n,m = melfb(20, n, fs) ; %将上述线性频谱通过Mel频率滤波器组得到Mel频谱, 下面在将其转化成对数频谱n2

11、= 1 + floor(n / 2);z = m * abs(frame(l:n2, :) 2r = det (log (z) ; %将上述对数频谱,经过离散余弦变换(DCT)变换到倒谱 域, 即可得到Mel倒谱系数(MFCC参数)3.2.2 函数 disteu-计算测试者和模板码本的距离function d = disteu(x, y) M, N二 size(x) ; % 音频 X 赋值给【M, N M2, P = size(y): %音频y赋值给【M2, P】 辻(M M2)error C不匹配! )两个音频时间长度不相等 end d = zeros(N, P);辻(N P)%在两个音频时

12、间长度相等的前提下 copies = zeros (1,P);for n = 1:Nd(n, :) = sum(x(:, n+copies) - y) . 2, 1);endelsecopies = zeros (1, N);for p = 1:Pd(:,p) = sum(x - y(:, p+copies) . 2, 1);end%成对欧氏距离的两个矩阵的列之间的距离endd = d0 5;3.2.3 函数 vqlbg 该函数利用矢量量化提取了音频的vq码本function r = vqlbgCd, k)设定disp(msg); end endn, code);=1 :n %数据库中每一个说

13、话人的特征%找出文件的路径3.2.5函数testDB这个函数实际上是对数据库一个查询,根据测试者的声音,找相应 的文件,并且给出是谁的提示 function testmsg 二 testDB(testdir,nameList=* 1,,,2,,3,,4,,5,,6,%这个是我们要识别的9个数for kfile = sprintf C %ss%d. wav*,testdir, k);s, fs = wavread(file):对找到的文件取mfcc变换V = mfcc(s, fs): distmin 二 inf: kl = 0;for 1 = 1:length(code) d 二 disteu(

14、v, codel) ; dist = sum(min(d, , 2) / size (d, 1);这里和test函数里面一样但多了一个具体语if dist distmin distmin = dist;% 者的识别 kl = 1:endendmsg=nameListkl msgbox(msg);end 3. 2. 6 函数 train-该函数就是对音频进行训练,也就是提取特征参数 function code = train (traindir, n)k = 16; % number of centroids requiredfor i = l:n %对数据库中的代码形成码本file = spr

15、intf C %ss%d. wav*, traindir, i) ; disp(file); s, fs = wavread(file): v 二 mfee(s, fs): %codei = vqlbg(v,k) : %话人的VQ码本end3. 2.7 函数 melfb确定矩阵的滤波器n,function m = melfb(p, fs) fO = 700 / fs;fn2 = floor (n/2);Ir = logd + 0. 5/fO) / (p+1);% convert to fft bin numbers with 0 for DC term bl 二 n * (fO * (exp(

16、0 1 p p+1 * Ir) -D);直接转换为FFT的数字模型bl = floor (bl(1) + 1:b2 = ceil(bl(2):b3 = floor (bl (3);b4 = min(fn2, ceil (bl (4) - 1:pf = logd + (bl:b4)/n/f0) / Ir: fp = floor (pf);pm = pf - fp;r = fp (b2:b4)b2:b4l+fp(l:b3); c =l:b3 + 1:四、演示分析我们的功能分为两部分:对已经保存的9个数字的语音进行辨别和实时的判断说 话人说的是否为一个数.在前者的实验过程中,先把9个数字的声音保存

17、成wav的格 式,放在一个文件夹中,作为一个检测的数据库.然后对检测者实行识别,系统给出 提示是哪个数字.中,实时的录取一段说话人的声音作为模板,提取mfcc特征参 数,随后紧接着进行遇着识別,也就是让其他人再说相同的话,看是否是原说话者.在第二个功能实验过程及具体功能如下:先打开Mat lab使Current Directory为录音及程序所所在的文件夹再打开文 件“ enternT,点run运行,打开enter界面,点击“进入”按钮进入系统。(注:文件包未封装完毕,冃前只能通过此方式打开运行。)(如 下图figurel )W enterSpeaker Recognition System

18、Group 10figurel在对数据库中己有的语者进行识别模块对数据库中已有的语者进行识别语音库录制模板选择载入语音库语音个数-录音-test语者判定选择载入语音库语音个数;点击语音库录制模版进行己存语音信息的提取;点击录 音-test进行现场录音;点击语者判断进行判断数字,并显示出来。在实时语者识別模块实时录制模板中,接着点击“实时录制模板”,把新的模板提取特征值。随点击实时录制模板上的“录音-train ”按钮,是把新语者的声音以wav格式存 放在”实时模板”文件夹后点击实时语者识别模板上的“录音-train ”按钮,是把语者的声音以wav格式存放 在”测试”文件夹中,再点击实时语者识别

19、”,在对测得的声音提取特征值的同时, 和实时模板进行比对,然后得出是否是实时模板中的语者。另外面板上的播放按钮都是播 放相对应左边录取的声音。想要测量多次,只要接着录音,自动保存,然后程序比对音频就可以。退出只要点击 菜单File/Exit ,退出程序。程序运行截图:fig. 2 )运行后系统界面n Urtlodj File Help五、心得体会实验表明,该系统能较好地进行语音的识别,同时,基于矢量量化技术(V Q)的 语音识别系统具有分类准确,存储数据少,实时响应速度快等综合性能好的特点矢量量化技术在语音识别的应用方面,尤其是在孤立词语音识别系统中得到很好的应 用,特别是有限状态矢量量化技术

20、,对于语音识别更为有效。通过这次课程设计,我对语音识别有了更加形象化的认识,也强化了 MATLAB 的应用,对将来的学习奠定了基础附:GUI程序代码function varargout = untitled?(varargin)the exist!ng% UNTITLED2 M-file for untitled2.fig% UNTITLED2, by itself, creates a new UNTITLED2 or raises % singleton*.% H = UNTITLED2 returns the handle to a new UNTITLED2 or the handle

21、to% the existing singleton*.% UNTITLED2( CALLBACK*, hObject, eventData, handles, . .) calls the local% function named CALLBACK in UXTITLED2. M with the given input arguments.% UNTITLED2(PropertyValue,) creates a new ENTITLED? or raises the% existing singleton*. Starting from the left, property are%

22、applied to the GUI before untitled2_0peningFunction gets called.unrecognized property name or invalid value makes property applicationstop. All inputs are passed to untitled2_0peningFcn*See GUI Options on GUIDES Tools menu. Choose GUI allows only oneSee also: GUIDE, GUIDATA, GUIHANDLESCopyright 2002

23、-2003 The MathWorks, Inc.Edit the above text to modify the response to help untitled2Last Modified by GUIDE v2. 5 08-Jun-2010 23:58:57Begin initialization code 一 DO NOT EDIT gui_Singleton = 1;gui_Singleton* , gui_Singleton,gui_OpeningFcngui_OutputFcngui_LayoutFcngui_Callback*if nargin & ischar(varar

24、gin1)gui_State. gui_Callback = str2func (varargin1);,untitled2_OpeningFcn,untitled2_OutputFcn,J【,);endif nargout var ar gout 1: nar gout J = gui_inainfcn (gui_State, varargin :)elsegui_mainfcn(gui_State, varargin:);end % End initialization code 一 DO NOT EDIT % Executes just before untitled? is made

25、visible, function untitled2_0peningFcn(hObject, eventdata, handles, varargin)% This function has no output args, see OutputFcn.% hObject handle to figure % eventdata reserved 一 handles structure with handles and user data (see untitled2 (see hObject;% Update handlesto be defined in a future version

26、of MATLAB % GUIDATA) % varargin command line arguments to VARARGIN) % Choose default command line output for untitled2 handles, output =structureguidata (hObject, axesl3);handles);/ J 1 / 1 tag, Qf axesl2axes(indobjk imshowX 3.imshowC 1, jpg ); jpg axes (findobj( , 、% UlIT makes untitied2 wait for u

27、ser response (see UI RESUME)% uiwait(handles, figurel);% Outputs from this function are returned tothe command line, function varargout =untitled2_0utputFcn(h0bject, eventdata, handles)% varargout cell array for returningoutput args (see VARARGOUT);% hObject handle to figure% eventdata reserved 一 to

28、 be defined in a futureversion of MATLAB % handles structurewith handles and user data (see GUIDATA)% Get default command line output from handles structure varargout1 = handles.output;% Executes on button press in pushbuttonl.function pushbuttonl_Callback(hObject, eventdata, handles)% hObject handl

29、e to pushbuttonl (see GCBO)% eventdata reserved 一 to be defined in a future version of MATLAB % handles structurewith handles and user data (see GUIDATA) Channel_Str=get(handles. popupraenuS, String);Value)Channel_Number=str2doub1e(Channel_Strget(handles. popupmenu3, );global moodle;% Executes on bu

30、tton press in pushbutton2.function pushbutton2_Callback(hObject, eventdata, handles)% handglobal datal;global moodle ;test (测试 , 1, moodle) %e U eio ?6 ?i 2a% function Open_Callback(hObject, eventdata, handles)% hObject handle to Open (see GCBO)% eventdata reserved 一 to be defined in a future version of MATLAB% handles structure with handles and user data (see GUIDATA)filename, pathnarae=uigetfile( ) file=get(handles, edits, filename, pathname

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1