基于MFCC的说话人识别的研究.docx

资源描述

基于MFCC的说话人识别的研究.docx

《基于MFCC的说话人识别的研究.docx》由会员分享，可在线阅读，更多相关《基于MFCC的说话人识别的研究.docx（35页珍藏版）》请在冰豆网上搜索。

基于MFCC的说话人识别的研究.docx

基于基于MFCC的说话人识别的研究的说话人识别的研究本科学生毕业论文（设计）题目（中文）:

基于MFCC的说话人识别的研究（英文）:

TheresearchofspeakerrecognitionbasedonMATLAB姓名学号院（系）电子工程系专业、年级电子信息工程级指导教师湖南科技学院本科毕业论文（设计）诚信声明本人郑重声明：

所呈交的本科毕业论文（设计），是本人在指导老师的指导下，独立进行研究工作所取得的成果，成果不存在知识产权争议，除文中已经注明引用的内容外，本论文不含任何其他个人或集体已经发表或撰写过的作品成果。

对本文的研究做出重要贡献的个人和集体均已在文中以明确方式标明。

本人完全意识到本声明的法律结果由本人承担。

本科毕业论文（设计）作者签名：

二年月日毕业论文（设计）任务书课题名称：

基于MFCC的说话人识别的研究学生姓名：

系别：

电子工程系专业：

电子信息工程指导教师：

2013年5月8日湖南科技学院本科毕业论文（设计）任务书1、主题词、关键词：

MFCC；说话人识别；特征提取;MATLAB。

2、毕业论文（设计）内容要求：

1）总体论述基于MFCC的说话人识别研究意义。

2）提出系统设计任务，设计系统框架。

3）设计提取特征参数，识别模型匹配。

4）对说话人识别进行仿真实验。

5）实验效果及结论。

3、文献查阅指引：

1白俊梅，张世磊，张树武，徐波.噪声环境下的鲁棒性说话人识别J.合肥：

中国科技大学博士论文,2007:

1-22高端声纹识别技术的研究与应用.and,Comparisonofparametricrepresentationsformonosyllabicwordrecognitionincontinuouslyspokensentences.IEEETrans.ASSP,1980（28）:

357-3664陶利.说话人识别技术的研究D.北京：

华北电力大学，2007.5李经智.说话人识别系统的研究及DSP实现.哈尔滨：

哈尔滨工程大学.20097董恩清,万东辉,周亚同，蔡毓.基于短时能量和噪声谱自适应估计的语音激活性检测方法J.模式识别与人工智能,2004,17

（2）：

227-231.8甄斌,吴玺宏,刘志敏,迟惠生.语音识别和说话人识别中各倒谱分量的相对重要性.北京大学学报（自然科学报），第37卷，第3期，2001年5月.9李昱,林志谋,黄云鹰,卢贵主.基于短时能量和短时过零率的VAD算法及其FPGA实现J.电子技术应用,2006,9:

110-113.10quantizationapproachtospeaker&.,1987.4、毕业论文（设计）进度安排：

（1）市场需求分析；

（2）收集、整理资料、书籍、文献；（3）整理资料，撰写论文，定好初稿；（4）说话人识别的设计与评价；（5）提取MFCC程序的设计；（6）修改，制板，测试，定稿，装订，答辩。

教研室意见：

负责人签名：

注：

本任务书一式三份，由指导教师填写，经教研室审批后一份下达给学生，一份交指导教师，一份留系里存档。

论文（设计）题目基于MFCC的说话人识别的研究作者姓名熊冰峰所属系、专业、年级电子工程系电子信息工程专业2009年级指导教师姓名、职称谭永宏预计字数10000开题日期一、课题目的和意义说话人识别技术利用语音信息可以进行身份鉴定，例如缉拿电话诈骗案罪犯，法庭中根据电话录音信息做身份确认，电话语音跟踪，为用户提供防盗门开锁功能。

同时在互联网可用于声音拨号，电话银行，语音E-mail，数据库访问等。

说话人识别系统利用MFCC参数和VQ识别模型，准确识别说话人是谁，并不注重语音信号中的语义内容，而是希望从语音信号中提取出代表个人身份的个性信息。

现在随着时代的发展，人类已开始进入了信息化时代，用现代手段研究说话人识别系统，使人们的日常生活工作更加有效率，这对于促进社会的发展具有十分重要的意义。

二、课题主要内容（提纲）及拟解决的关键问题1绪论2说话人识别技术的概述3说话人识别的主要技术4基于MATLAB的说话人识别结论拟采用的思路和方法1特征提取利用MFCC参数。

2识别模型采用VQ模型，提高研究效率。

3查阅国内外最新资料，开拓视野，对已有的成果加以分析利用。

4虚心向导师和同学学习，不断积累知识，再运用所学知识，完成论文完成期限和采取的主要措施：

1-7周：

对课题进行可行性分析，并根据课题搜集资料，查阅相关知识，熟悉掌握相关技术，理解毕业设计任务。

第8-9周：

设计出基本框架及模块。

10-14周：

编程，实现仿真的功能。

15-16周：

检查及完善。

撰写和修改毕业论文，准备论文答辩。

2、主要措施:

（1）通过有效途径查阅相关文献资料，引证参考已有的研究成果，确定论文研究主题。

（2）与指导老师和同学进行多层次多方面的交流探讨，提炼观点，吸收建议。

主要参考文献：

1白俊梅，张世磊，张树武，徐波.噪声环境下的鲁棒性说话人识别J.合肥：

中国科技大学博士论文,2007:

1-22高端声纹识别技术的研究与应用.and,Comparisonofparametricrepresentationsformonosyllabicwordrecognitionincontinuouslyspokensentences.IEEETrans.ASSP,1980（28）:

357-3664陶利.说话人识别技术的研究D.北京：

华北电力大学，2007.5李经智.说话人识别系统的研究及DSP实现.哈尔滨：

哈尔滨工程大学.20097董恩清,万东辉,周亚同，蔡毓.基于短时能量和噪声谱自适应估计的语音激活性检测方法J.模式识别与人工智能,2004,17

（2）：

110-113.10quantizationapproachtospeaker&.,1987.指导教师意见：

指导教师签名：

教研室意见：

签名：

年月日开题报告会纪要时间地点三教610与会人员姓名职务（职称）姓名职务（职称）姓名职务（职称）李春树教授谭永宏副教授廖朝阳副教授杨熙讲师李小武讲师李艳芳副教授会议记录摘要：

问题一、论文的研究意义是什么？

答：

利用语音信息可以进行身份鉴定，例如缉拿电话诈骗案罪犯，法庭中根据电话录音信息做身份确认，电话语音跟踪，为用户提供防盗门开锁功能。

同时在互联网可用于声音拨号，电话银行，语音E-mail，数据库访问等。

总体来说，说话人识别应用非常广泛，给社会带来了很大的经济效益，所以，说话人识别的研究具有很好的应用前景。

问题二、说话人识别和语音识别有什么区别？

答：

说话人识别本质是特殊的一类语音识别，但其目的不是识别说话人讲的内容，而是识别该说话人的身份。

它不关注语音信号的语义内容，而是从语音信号中提取出说话人的个性因素。

问题三、论文会提取什么特征参数？

答：

论文将会选用美尔倒谱系数（MFCC）作为特征参数，它是说话人识别算法中最常用的参数，它能反映的是美尔频率与赫兹频率的非线性的对应关系。

这个参数利用了人耳的感知特性，对不同频率的语音具有不同的感知能力。

会议主持人：

记录人：

年月日指导小组意见负责人签名：

年月日系部意见负责人签名：

年月日湖南科技学院毕业论文（设计）中期检查表毕业论文（设计）题目基于MFCC的说话人识别的研究学生姓名熊冰峰学号2324系别电子工程系专业电子信息工程指导教师谭永宏检查日期2013年4月3日指导教师检查情况记载及修改意见：

1.论文的基本思路比较清晰，但逻辑性不强。

2.全文的目录、摘要、内容没有协调一致。

3.论文中的表格和流程图要按照格式来排版。

4.仿真实验分析不够清楚，要抓取主要内容。

5.参考文献要按照格式来标注，在正文中引用的位置上做好标记。

6.图和表在文章正文中一定要有说明，而且图表要在文字分析的下面，表题在表上面，图题要在图下面。

签名：

注：

此表用于指导教师在学生毕业论文（设计）初稿完成后对学生执行任务书情况进行中期检查时用，由指导教师填写。

湖南科技学院毕业设计（论文）指导过程记录表毕业论文（设计）题目基于MFCC的说话人识别的研究学生姓名熊冰峰学号2324专业班级电子信息工程电信0903班指导教师谭永宏职称副教授系（教研室）电子信息工程指导过程记录指导内容记录

（一）选题、查阅资料指导：

根据自己所学专业和特长，选一实用性强，能做简易模型且有一定深度，能学以致用的题目。

1、到图书馆查找和借阅与选题有关的文献和资料；2、从网上检索和下载与选题有关的文献和资料。

学生签名：

20年月日指导教师签名：

20年月日指导内容记录

（二）论文开题指导：

1、题目应该简短、明确、有概括性；2、摘要是各个章节内容的浓缩，应做到简练、准确；3、关键词应采用能覆盖论文主要内容的通用词条；4、正文一般应包括绪论、论文主体及结论等部分；5、结论是毕业论文的总结，要求精炼、准确地概述全文的主要观点。

学生签名：

20年月日指导教师签名：

20年月日指导内容记录（三）设计指导：

1、根据自己的设计要求，编写程序，在网上多查相关的资料；2、做说话人识别仿真实验前，确认系统设计的正确性；3、进行仿真实验结果分析，要有清晰的思路和详细叙述。

学生签名：

20年月日指导教师签名：

20年月日指导内容记录（四）设计指导：

明确系统实现功能，设计总体框图，进行说话人识别仿真实验。

学生签名：

20年月日指导教师签名：

20年月日指导过程记录指导内容记录（五）论文写作指导：

主体的内容应包括以下几个方面：

1、毕业论文总体方案设计与选择的论证；2、对本研究内容进行较全面、客观的理论阐述，应着重指出本研究内容中的创新、改进与实际应用之处；3、论文应推理正确，结论清晰，无科学性错误。

学生签名：

20年月日指导教师签名：

20年月日指导内容记录（六）论文中期检查指导：

1、加强对选题核心思想的理解；2、规范论文文句，减少主观语句的使用；3、图片的大小要规范。

4、框图文字太小。

学生签名：

20年月日指导教师签名：

20年月日指导内容记录（七）论文修改指导：

1、字数太多，将器件说明类语句压缩；2、按照毕业论文的标准格式排版。

3、参考文献按照学校的毕业论文撰写规范写，同时在正文中出现的位置以上标的形式标出，要有1篇以上外文参考文献。

4、结论部分要精简，减少主观语句。

学生签名：

20年月日指导教师签名：

20年月日指导内容记录（八）论文答辩指导：

1、制作一个能反映论文主要内容，可放映510分钟的PPT演示文稿，作答辩陈述用；2、掌握研究内容的实际意义、创新、改进和特色之处，设计原理、工作过程等主要内容。

3、演示实物突出自己的设计创新点。

学生签名：

20年月日指导教师签名：

20年月日答辩小组组长意见（对情况是否属实做出意见）组长（签名）：

20年月日注：

本表与毕业论文一起装订存档。

湖南科技学院本科毕业论文（设计）评审表论文题目基于MFCC的说话人识别的研究作者姓名熊冰峰所属系、专业、年级电子工程系电子信息工程专业2009年级指导教师姓名、职称谭永宏、副教授字数10000定稿日期中文摘要本文实现的说话人识别系统，主要是对说话人识别的特征参数的提取和识别模型的匹配，进行深入的研究。

首先,对说话人识别进行了概述，给出了说话人识别的系统框架。

然后就是如何实现说话人识别的问题，这个过程可分为两个部分：

第一个是语音特征参数美尔倒谱系数（MFCC）的提取，主要包括了对语音信号进行预处理过程，特征参数求取过程，而且重点分析了双门限端点检测。

第二个就是矢量量化（VQ）模型匹配的过程，主要包括训练阶段和识别阶段：

训练阶段主要是生成每一个说话人一一对应的码本，采用经典的LBG算法，识别阶段的任务是把输出矢量利用有色图表现出来，每个矢量元素数值大小转化为不同的颜色，那么就可以直观地看出最相似的有色图，即可以辨别出待识别人是谁。

在MATLAB软件这个平台下，获得了较好的实验仿真效果。

实验表明，MFCC参数具有很好的鲁棒性，能够达到准确识别说话人身份的目的。

关键词（3-5个）MFCC；说话人识别；特征提取；MATLAB英文摘要Theimplementationofspeakerrecognitionsystemmainlydiscussesthefeatureextractionofthespeakerrecognitionandrecognitionmodels.Firstofall,thispaperhasabriefintroductionofspeakerrecognitionandbringsasystemframeofspeakerrecognition.Thentheissueishowtocarryoutthesystemofspeakerrecognition.Thisprocesscontainstwosections:

thefirstoneisthefeatureextractionofspeechparameterMFCC.Itcontainstheprocessofpreprocessing,featureextractionandalsohasaemphasisoftheaccurateendpointdetectingalgorithmofdoublethreshold.ThenthesecondworkistheprocessofVQmodelsmatching.Itconsistsoftrainphaseandrecognitionphase.TrainphaseistocreatethespecialcodebookforeachspeakerwithadoptingLBGalgorithm.Recognitionphaseistorepresenttheoutputvectorwithacolorfulimagesothatwecanrecognizewhichisthemostsimilarimagefromcodebook,soweachievethepurposeofidentification.UndertheplatformofMATLAB，thisexperimenthasobtainedperfectsimulationeffect.Asaresultoftheexperiment,theparameterMFCChasawonderfulrobustnesswhichcanreachthepurposeofspeakerrecognitionidentificationaccurately.关键词（3-5个）MFCC；Speakerrecognition；Featureextraction;MATLAB.指导教师评定成绩评审基元评审要素评审内涵满分指导教师实评分选题质量25%目的明确符合要求选题符合专业培养目标，体现学科、专业特点和教学计划的基本要求，达到毕业论文（设计）综合训练的目的。

理论意义或符合本学科的理论发展，有一定的学术意义；对经济建设和社会发展的应用性研究中的某个理论或方法问题进行研究，具有一定的实际价值。

实际价值选题恰当题目规模适当，难易度适中；有一定的科学性。

能力水平40%查阅文献资料能力能独立查阅相关文献资料，归纳总结本论文所涉及的有关研究状况及成果。

综合运用知识能力能运用所学专业知识阐述问题；能对查阅的资料进行整理和运用；能对其科学论点进行论证。

研究方案的设计能力整体思路清晰；研究方案合理可行。

研究方法和手段的运用能力能运用本学科常规研究方法及相关研究手段（如计算机、实验仪器设备等）进行实验、实践并加工处理、总结信息。

外文应用能力能阅读、翻译一定量的本专业外文资料、外文摘要和外文参考书目（特殊专业除外）体现一定的外语水平。

论文质量35%文题相符较好地完成论文选题的目的要求。

写作水平论点鲜明；论据充分；条理清晰；语言流畅。

写作规范符合学术论文的基本要求。

用语、格式、图表、数据、量和单位、各种资料引用规范化、符合标准。

论文篇幅10000字左右。

实评总分成绩等级指导教师评审意见：

指导教师签名：

说明：

评定成绩分为优秀、良好、中等、及格、不及格五个等级，实评总分90100分记为优秀，8089分记为良好，7079分记为中等，6069分记为及格，60分以下记为不及格。

评阅教师评定成绩评审基元评审要素评审内涵满分评阅教师实评分选题质量25%目的明确符合要求选题符合专业培养目标，体现学科、专业特点和教学计划的基本要求，达到毕业论文（设计）综合训练的目的。

理论意义或实际价值符合本学科的理论发展，有一定的学术意义；对经济建设和社会发展的应用性研究中的某个理论或方法问题进行研究，具有一定的实际价值。

选题恰当题目规模适当，难易度适中；有一定的科学性。

能力水平40%查阅文献资料能力能独立查阅相关文献资料，归纳总结本论文所涉及的有关研究状况及成果。

综合运用知识能力能运用所学专业知识阐述问题；能对查阅的资料进行整理和运用；能对其科学论点进行论证。

研究方案的设计能力整体思路清晰；研究方案合理可行。

研究方法和手段的运用能力能运用本学科常规研究方法及相关研究手段（如计算机、实验仪器设备等）进行实验、实践并加工处理、总结信息。

外文应用能力能阅读、翻译一定量的本专业外文资料、外文摘要和外文参考书目（特殊专业除外）体现一定的外语水平。

论文质量35%文题相符较好地完成论文选题的目的要求。

写作水平论点鲜明；论据充分；条理清晰；语言流畅。

写作规范符合学术论文的基本要求。

用语、格式、图表、数据、量和单位、各种资料引用规范化、符合标准。

论文篇幅10000字左右。

实评总分成绩等级评阅教师评审意见：

评阅教师签名：

说明：

湖南科技学院本科毕业论文（设计）答辩记录表论文题目基于MFCC的说话人识别的研究作者姓名熊冰峰所属系、专业、年级电子工程系电子信息工程专业2009年级指导教师姓名、职称谭永宏、副教授答辩会纪要时间2012年05月18日地点3教610答辩小组成员姓名职务（职称）姓名职务（职称）姓名职务（职称）李春树教授谭永宏副教授李艳芳副教授杨熙讲师李小武讲师廖朝阳副教授答辩中提出的主要问题及回答的简要情况记录：

问题一、为什么选择MFCC作为特征参数？

答：

Mel频率倒谱系数MFCC是说话人识别算法中比较常用的参数，这个参数利用了人耳的感知特性，人耳对不同频率的语音具有不同的感知能力。

利用MFCC，作出说话人识别系统，可以较好的反映说话人的行为特征和生理特征。

问题二、为什么选择VQ识别模型？

答：

VQ是一种极其重要的信号压缩方法，广泛应用于图像信号压缩、语音信号压缩等领域。

在语音信号数字处理的许多重要研究课题中，特别是低速语音编译码器和语音识别的研究中，VQ都起着非常重要的作用。

问题三、仿真是如何实现识别功能的？

答：

实验一共选择三个说话人参与说话人识别系统的实验，分别为说话人甲，说话人乙，说话人丙。

把每个人说话者所提取的特征训练生成码本。

选择一人去进行语音识别测试，用同样的方法从待识别的语音中提取矢量序列，与先前生成码本进行模型匹配，以最小失真的参考模型作为判决对象，从而判断说话人是谁会议主持人：

记录人：

年月日答辩小组意见评语：

评定等级：

负责人（签名）：

年月日系学位委员会意见评语：

论文（设计）最终评定等级：

负责人（签名）：

系部（公章）年月日校学位委评语：

评定等级：

负责人（签名）：

年月日员会意见基于的说话人识别的研究摘要说话人识别作为生物特征识别技术的一种，因其应用的方便灵活的特点，逐渐被人们所重视，并对其理论进行了深入的研究。

无论是在说话人识别领域还是在语音识别领域，说话人特征的识别一直是人们研究的热点。

本文将采用语音特征提取和模式匹配的方法实现说话人识别技术。

本文实现的说话人识别系统，主要是对说话人识别的特征参数的提取和识别模型的匹配，进行深入的研究。

首先,对说话人识别进行了概述，给出了说话人识别的系统框架。

然后就是如何实现说话人识别的问题，这个过程可分为两个部分：

第一个是语音特征参数美尔倒谱系数（MFCC）的提取，主要包括了对语音信号进行预处理过程，特征参数求取过程，而且重点分析了双门限端点检测。

第二个就是矢量量化（VQ）模型匹配的过程，主要包括训练阶段和识别阶段：

在MATLAB软件这个平台下，获得了较好的实验仿真效果。

实验表明，MFCC参数具有很好的鲁棒性，能够达到准确识别说话人身份的目的。

【关键词】MFCC说话人识别特征提取MATLABTheResearchofSpeakerRecognitionBasedonMFCCAbstractAsakindofbiologicfeatureidentificationtechnology,speakerrecognitiontechnologyhasbeenmorevaluedbypeoplebecauseofitsconvenientandflexiblefeatures.Peoplehaveadeepresearchinitstheories.Whetherinspeakerrecognitionorspeechrecognitionfield,voicerecognitionfeatureshavebeenahottopic.Thispaperwilladoptthemethodofvoicefeatureextractionandmodelmatchingtospeakerrecognitiontechnology.Theimplementationofspeakerrecognitionsystemmainlydiscussesthefeatureextractionofthespeakerrecognitionandrecognitionmodels.

展开阅读全文