ImageVerifierCode 换一换
格式:DOC , 页数:23 ,大小:718KB ,
资源ID:15505897      下载积分:3 金币
快捷下载
登录下载
邮箱/手机:
温馨提示:
快捷下载时,用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)。 如填写123,账号就是123,密码也是123。
特别说明:
请自助下载,系统不会自动发送文件的哦; 如果您已付费,想二次下载,请登录后访问:我的下载记录
支付方式: 支付宝    微信支付   
验证码:   换一换

加入VIP,免费下载
 

温馨提示:由于个人手机设置不同,如果发现不能下载,请复制以下地址【https://www.bdocx.com/down/15505897.html】到电脑端继续下载(重复下载不扣费)。

已注册用户请登录:
账号:
密码:
验证码:   换一换
  忘记密码?
三方登录: 微信登录   QQ登录  

下载须知

1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。
2: 试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。
3: 文件的所有权益归上传用户所有。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 本站仅提供交流平台,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

版权提示 | 免责声明

本文(基于语音的疲劳度检测算法研究Word文档下载推荐.doc)为本站会员(b****3)主动上传,冰豆网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知冰豆网(发送邮件至service@bdocx.com或直接QQ联系客服),我们立即给予删除!

基于语音的疲劳度检测算法研究Word文档下载推荐.doc

1、第2.4节 语音信号的时域分析 (7)第3章 语音疲劳度的特征参数提取方案 (9)第3.1节 LPCC特征参数 (9)第3.2节 MFCC特征参数 (10)第4章 概率神经网络 (11)第5章 实验方案及讨论结果(13)第5.1节 实验语音信号的录制 (13)第5.2节 实验方案(13)第5.3节 实验结果与讨论(14)第6章 总结与展望(16)附录(主要程序) (18)参考文献 (21)致谢 (22)基于语音的疲劳度检测算法研究摘 要疲劳是一种自然现象,是人体的一种自我调节和保护功能。检测疲劳状态对于当今社会从事各行各业都有积极意义。本课题提出了一种基于语音特征参数和概率神经网络的语音疲劳度

2、识别模型。通过训练不同时段的语音样本来构成语音源库,并建立综合识别系统。实验结果表明本方法能够反应其当时的疲劳程度,MFCC参数融入了人耳的听觉特性,故从测试结果来看,其优于LPCC参数。关键词:语音、疲劳度、线性预测倒谱系数、梅尔频率倒谱系数、概率神经网络Research of Detecting Fatigue Arithmeticin SpeechABSTRACT Fatigue is a natural phenomenon which is the human body a kind of self-regulation and protection. Detection of fa

3、tigue states has positive significance in all occupation in todays society. This issue presents a feature-based parameters and the probabilistic neural network speech recognition model to detecting fatigue. Through training at different times of voice samples to form the voice source and to establis

4、h a comprehensive identification system. Experimental results show that this method can reflect its degree of fatigue at the time, MFCC parameters of the human ear into the auditory characteristics, and therefore the results from the test point of view, its better than the LPCC parameters.KEYWODRS:

5、Speech、Fatique、LPCC、MFCC、PNN第一章 引言第1.1节 本课题研究背景有资料表明,高速公路发生的交通事故中,有一半以上由于长时间疲劳驾驶或所见目标单调使司机注意力不集中、甚至打瞌睡等原因造成的。为减少这方面的事故,疲劳度测试就具有十分重要的意义。疲劳也往往成为脑与心脏疾病的诱因,如通过简单的方法实时检测自己的身体状态,对于预防疾病,减少人为的事故也具有积极的意义。疲劳度的检测方法可以概括为客观和主观两个方面。国内主要采取主观评测的方法,主要依据自我活动记录表、睡眠情况记录表、个人行为记录表等来测评被试者的疲劳程度,虽然主观评价方法使用简单,但很难量化疲劳的等级和程度,又

6、因各人的理解有明显的差异,其结果往往不能令人满意。国外则主要采取客观测评的方法,有基于行为特征的检测的视网膜检测、头部位置检测、视线方向检测等和基于生理参数的检测的脑电图信号检测、心电图信号检测、脉搏跳动检测、唾液检测、其它生理信号检测等。这些方法虽然说能从一定程度上了解人的疲劳状态,但是对每个人疲劳的心理、生理属性还不是特别清楚,疲劳状态下的变化规律很难总结归纳。目前大多数检测算法因其检测条件的限制和复杂环境的影响,检测效果不能完全令人满意。性价比是亟待解决的一个问题,如果成本太大则难以广泛应用。通过声音判断人的疲劳程度是一种更为简便快捷的疲劳度检测方式,能够在不影响正常工作下面,让被检测者

7、对着麦克风说话,将其语音集入电脑,再通过声波的变化进行计算,得到测算值。第1.2节 方案简介通过声音检测,可以很方便可以很方便地了解大脑的疲劳水平。这对于诸如驾驶员等长时间处于紧张状态的人员来说,意义更加重大。本课题采用方法如下:1、通过语音采集得到原始数据参数,通过录音笔进行录制,组员每人每天分别在白天10点,晚上10点,白天4点,晚上4点,录下语音,录制的语音以wave格式保存。2、采用语音信号的基本参数来对疲劳语音特征进行研究,主要包括LPCC、MFCC等,发现对疲劳度影响最大的特征。3、采用基于贝叶斯决策理论的概率神经网络来进行模式识别,对特征进行训练,随后对未知语音信号进行模式识别,

8、得到所需概率参数。4、系统的各种算法由MATLAB编程实现,完成了特征参数的提取和训练工作,建立疲劳度检测系统。5、完成分析测试报告,提出进一步改进方案。第二章 语音信号识别的理论基础第2.1节 语音信号产生的声学基础图2.1是人类语音通信过程中几个重要的环节,从说话人的想法开始到听话人的理解,需要经过说话和听话两个人语义和语法的处理、音位的编码和解码过程,此外最重要的就是人类发声器官和听觉器官的机理。只有深入研究这两个方面,才能建立反映真实情况的物理模型和数字模型。图2.1 人类语音通信过程人发声过程如图2.2所示。人通过口、鼻吸气,使自己的肺叶充满空气,肺是胸腔内一团有弹性的海绵状物质,可

9、以存储空气。当人发声时,肺部的空气被压缩,经气管到喉部。声带是位于喉咙中间的两条白色韧带,一般声带的长度为10mm-14mm。当发声时,气流穿过两条声带间的缝隙,声带自然闭合靠拢,成水平状;当气流被阻断时,声带间就产生缝隙,从而产生一股准周期的脉冲,使声带产生振动。当激励源不是声带的脉冲,而由空气湍流产生的情况下,发出的音就称为“清音”,这时激励源类似于白噪声,最后通过声道的气流通过口唇或者鼻腔向外发出。 图2.2 语音产生的物理模型第2.2节 语音信号产生的数字模型为了简化问题,根据语音产生器官的组织结构,结合信号处理理论,提出了如图2.3所示的语音信号产生的数字模型。 图2.3 语音产生的

10、数字模型如图所示,语音信号的数字模型分为激励模型、声道模型、辐射模型三个部分。 1、激励模型激励模型表示发音器官中的声门子系统,包括负责产生气流的肺和气管以及产生振动的声带,分清音和浊音两种情况。发浊音时,气流冲击声带产生振动,使声门处形成准周期性的脉冲串,并用它去激励声道。此时的脉冲波类似于斜三角形的脉冲,其声门脉冲模型为: 其中和取值接近于1,模型极点靠近单位圆,相当于一个低通滤波器。发清音时,声带松弛而不振动,空气湍流通过声门直接进入声道,这时激励信号就可以简化为随机白噪声,实际中可以用均值为0、均方差为1的白色分布序列来表示。2、声道模型对于声道的建模,经典的语音信号处理技术主要有两种

11、观点,一是把声道看成是由多个不同截面积的管子串联而成的系统,导出“声管模型”;二是把声道视为一个谐振腔,导出“共振峰模型”。现在应用最广泛的声道模型是离散化的声管模型, 把声道看成是由多个不同截面积的管子串联而成的系统。假设在一个“短时”期间声道形状无变化时,而且声波在声道内是沿管轴无损传播的平面波。则由P个短管组成的声道模型的传递函数可以表示为一个P阶的全极点函数: 其中P为全极点滤波器的阶数,=1,为声道模型参数,它随着调音运动在一定限制内不断变化。一般而言P的取值范围为8-12,每一对极点对应着一个共振峰,决定了声道系统的频率特性。一般而言在10ms-30ms范围内认为这些声道参数保持不

12、变,这也是语音信号短时分析的理论依据之一。 3、辐射模型声道的终端是口和唇,从声道输出的是速度波,而语音信号是声压波,两者的倒比称为辐射阻抗,可以用它来表示口唇的辐射效应。研究证明,辐射模型可以简化为: r取值约等于1, 类似一个一阶的高通滤波器。语音信号的系统传递函数就可以用声门激励系统、声道系统和辐射系统传递函数的乘积表示。 其中激励函数分为发浊音和清音两种情况。第2.3节 语音信号的预处理在对语音信号进行各种后续处理之前,为了防止混叠失真和噪声干扰,必须用一个低通滤波器进行防混叠滤波,滤除高于1/2采样率的信号成分。由于语音信号的平均功率谱受口鼻辐射的影响,需要对信号进行高频提升(6db

13、/倍频),便于进行频谱分析和声道函数分析,因而需要将信号进行预加重处理。预加重滤波器形式为:,取值范围为0.93-0.97之间。预加重后的语音信号还能有效滤除低频干扰,尤其是50Hz的工频干扰,同时还能达到消除直流漂移、抑制随机噪声和提升清音部分能量的效果。当语音信号在分析处理之后需要语音合成的时候,还需要进行去加重处理以恢复原来的语音信号。预加重滤波器的幅频响应如图2.4所示。图2.4 预加重滤波器的幅频响应分帧的时候会采取0-50%重叠的方式,前一帧与后一帧之间交叠的部分称为帧移,有了帧移的话,帧与帧之间就能够平滑过渡,如图2.5所示。图2.5 分帧示意图随后对取出的一帧信号进行加窗处理,即,在加窗的时候,不同的窗口和窗长的选择将影响到语音信号分析结果,窗函数通常有矩形窗(Rectangle)和汉明窗(Hamming)两种。矩形窗的表达式为:

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1