基于语音的疲劳度检测算法研究Word文档下载推荐.doc

上传人:b****3 文档编号:15505897 上传时间:2022-11-02 格式:DOC 页数:23 大小:718KB
下载 相关 举报
基于语音的疲劳度检测算法研究Word文档下载推荐.doc_第1页
第1页 / 共23页
基于语音的疲劳度检测算法研究Word文档下载推荐.doc_第2页
第2页 / 共23页
基于语音的疲劳度检测算法研究Word文档下载推荐.doc_第3页
第3页 / 共23页
基于语音的疲劳度检测算法研究Word文档下载推荐.doc_第4页
第4页 / 共23页
基于语音的疲劳度检测算法研究Word文档下载推荐.doc_第5页
第5页 / 共23页
点击查看更多>>
下载资源
资源描述

基于语音的疲劳度检测算法研究Word文档下载推荐.doc

《基于语音的疲劳度检测算法研究Word文档下载推荐.doc》由会员分享,可在线阅读,更多相关《基于语音的疲劳度检测算法研究Word文档下载推荐.doc(23页珍藏版)》请在冰豆网上搜索。

基于语音的疲劳度检测算法研究Word文档下载推荐.doc

第2.4节语音信号的时域分析……………………………………(7)

第3章语音疲劳度的特征参数提取方案…………………………(9)

第3.1节LPCC特征参数……………………………………………(9)

第3.2节MFCC特征参数……………………………………………(10)

第4章概率神经网络………………………………………………(11)

第5章实验方案及讨论结果…………………………………………(13)

第5.1节实验语音信号的录制……………………………………(13)

第5.2节实验方案……………………………………………………(13)

第5.3节实验结果与讨论……………………………………………(14)

第6章总结与展望……………………………………………………(16)

附录(主要程序)………………………………………………………(18)

参考文献………………………………………………………………(21)

致谢……………………………………………………………………(22)

基于语音的疲劳度检测算法研究

摘要

疲劳是一种自然现象,是人体的一种自我调节和保护功能。

检测疲劳状态对于当今社会从事各行各业都有积极意义。

本课题提出了一种基于语音特征参数和概率神经网络的语音疲劳度识别模型。

通过训练不同时段的语音样本来构成语音源库,并建立综合识别系统。

实验结果表明本方法能够反应其当时的疲劳程度,MFCC参数融入了人耳的听觉特性,故从测试结果来看,其优于LPCC参数。

关键词:

语音、疲劳度、线性预测倒谱系数、梅尔频率倒谱系数、概率神经网络

ResearchofDetectingFatigueArithmetic 

inSpeech

ABSTRACT

Fatigueisanaturalphenomenonwhichisthehumanbodyakindofself-regulationandprotection.Detectionoffatiguestateshaspositivesignificanceinalloccupationintoday'

ssociety.Thisissuepresentsafeature-basedparametersandtheprobabilisticneuralnetworkspeechrecognitionmodeltodetectingfatigue.Throughtrainingatdifferenttimesofvoicesamplestoformthevoicesourceandtoestablishacomprehensiveidentificationsystem.Experimentalresultsshowthatthismethodcanreflectitsdegreeoffatigueatthetime,MFCCparametersofthehumanearintotheauditorycharacteristics,andthereforetheresultsfromthetestpointofview,it'

sbetterthantheLPCCparameters.

KEYWODRS:

Speech、Fatique、LPCC、MFCC、PNN

第一章引言

第1.1节本课题研究背景

有资料表明,高速公路发生的交通事故中,有一半以上由于长时间疲劳驾驶或所见目标单调使司机注意力不集中、甚至打瞌睡等原因造成的。

为减少这方面的事故,疲劳度测试就具有十分重要的意义。

疲劳也往往成为脑与心脏疾病的诱因,如通过简单的方法实时检测自己的身体状态,对于预防疾病,减少人为的事故也具有积极的意义。

疲劳度的检测方法可以概括为客观和主观两个方面。

国内主要采取主观评测的方法,主要依据自我活动记录表、睡眠情况记录表、个人行为记录表等来测评被试者的疲劳程度,虽然主观评价方法使用简单,但很难量化疲劳的等级和程度,又因各人的理解有明显的差异,其结果往往不能令人满意。

国外则主要采取客观测评的方法,有基于行为特征的检测的视网膜检测、头部位置检测、视线方向检测等和基于生理参数的检测的脑电图信号检测、心电图信号检测、脉搏跳动检测、唾液检测、其它生理信号检测等。

这些方法虽然说能从一定程度上了解人的疲劳状态,但是对每个人疲劳的心理、生理属性还不是特别清楚,疲劳状态下的变化规律很难总结归纳。

目前大多数检测算法因其检测条件的限制和复杂环境的影响,检测效果不能完全令人满意。

性价比是亟待解决的一个问题,如果成本太大则难以广泛应用。

通过声音判断人的疲劳程度是一种更为简便快捷的疲劳度检测方式,能够在不影响正常工作下面,让被检测者对着麦克风说话,将其语音集入电脑,再通过声波的变化进行计算,得到测算值。

第1.2节方案简介

通过声音检测,可以很方便可以很方便地了解大脑的疲劳水平。

这对于诸如驾驶员等长时间处于紧张状态的人员来说,意义更加重大。

本课题采用方法如下:

1、通过语音采集得到原始数据参数,通过录音笔进行录制,组员每人每天分别在白天10点,晚上10点,白天4点,晚上4点,录下语音,录制的语音以wave格式保存。

2、采用语音信号的基本参数来对疲劳语音特征进行研究,主要包括LPCC、MFCC等,发现对疲劳度影响最大的特征。

3、采用基于贝叶斯决策理论的概率神经网络来进行模式识别,对特征进行训练,随后对未知语音信号进行模式识别,得到所需概率参数。

4、系统的各种算法由MATLAB编程实现,完成了特征参数的提取和训练工作,建立疲劳度检测系统。

5、完成分析测试报告,提出进一步改进方案。

第二章语音信号识别的理论基础

第2.1节语音信号产生的声学基础

图2.1是人类语音通信过程中几个重要的环节,从说话人的想法开始到听话人的理解,需要经过说话和听话两个人语义和语法的处理、音位的编码和解码过程,此外最重要的就是人类发声器官和听觉器官的机理。

只有深入研究这两个方面,才能建立反映真实情况的物理模型和数字模型。

图2.1人类语音通信过程

人发声过程如图2.2所示。

人通过口、鼻吸气,使自己的肺叶充满空气,肺是胸腔内一团有弹性的海绵状物质,可以存储空气。

当人发声时,肺部的空气被压缩,经气管到喉部。

声带是位于喉咙中间的两条白色韧带,一般声带的长度为10mm-14mm。

当发声时,气流穿过两条声带间的缝隙,声带自然闭合靠拢,成水平状;

当气流被阻断时,声带间就产生缝隙,从而产生一股准周期的脉冲,使声带产生振动。

当激励源不是声带的脉冲,而由空气湍流产生的情况下,发出的音就称为“清音”,这时激励源类似于白噪声,最后通过声道的气流通过口唇或者鼻腔向外发出。

图2.2语音产生的物理模型

第2.2节语音信号产生的数字模型

为了简化问题,根据语音产生器官的组织结构,结合信号处理理论,提出了如图2.3所示的语音信号产生的数字模型。

图2.3语音产生的数字模型

如图所示,语音信号的数字模型分为激励模型、声道模型、辐射模型三个部分。

1、激励模型

激励模型表示发音器官中的声门子系统,包括负责产生气流的肺和气管以及产生振动的声带,分清音和浊音两种情况。

发浊音时,气流冲击声带产生振动,使声门处形成准周期性的脉冲串,并用它去激励声道。

此时的脉冲波类似于斜三角形的脉冲,其声门脉冲模型为:

其中和取值接近于1,模型极点靠近单位圆,相当于一个低通滤波器。

发清音时,声带松弛而不振动,空气湍流通过声门直接进入声道,这时激励信号就可以简化为随机白噪声,实际中可以用均值为0、均方差为1的白色分布序列来表示。

2、声道模型

对于声道的建模,经典的语音信号处理技术主要有两种观点,一是把声道看成是由多个不同截面积的管子串联而成的系统,导出“声管模型”;

二是把声道视为一个谐振腔,导出“共振峰模型”。

现在应用最广泛的声道模型是离散化的声管模型,把声道看成是由多个不同截面积的管子串联而成的系统。

假设在一个“短时”期间声道形状无变化时,而且声波在声道内是沿管轴无损传播的平面波。

则由P个短管组成的声道模型的传递函数可以表示为一个P阶的全极点函数:

其中P为全极点滤波器的阶数,=1,为声道模型参数,它随着调音运动在一定限制内不断变化。

一般而言P的取值范围为8-12,每一对极点对应着一个共振峰,决定了声道系统的频率特性。

一般而言在10ms-30ms范围内认为这些声道参数保持不变,这也是语音信号短时分析的理论依据之一。

3、辐射模型

声道的终端是口和唇,从声道输出的是速度波,而语音信号是声压波,两者的倒比称为辐射阻抗,可以用它来表示口唇的辐射效应。

研究证明,辐射模型可以简化为:

r取值约等于1,类似一个一阶的高通滤波器。

语音信号的系统传递函数就可以用声门激励系统、声道系统和辐射系统传递函数的乘积表示。

其中激励函数分为发浊音和清音两种情况。

第2.3节语音信号的预处理

在对语音信号进行各种后续处理之前,为了防止混叠失真和噪声干扰,必须用一个低通滤波器进行防混叠滤波,滤除高于1/2采样率的信号成分。

由于语音信号的平均功率谱受口鼻辐射的影响,需要对信号进行高频提升(6db/倍频),便于进行频谱分析和声道函数分析,因而需要将信号进行预加重处理。

预加重滤波器形式为:

,取值范围为0.93-0.97之间。

预加重后的语音信号还能有效滤除低频干扰,尤其是50Hz的工频干扰,同时还能达到消除直流漂移、抑制随机噪声和提升清音部分能量的效果。

当语音信号在分析处理之后需要语音合成的时候,还需要进行去加重处理以恢复原来的语音信号。

预加重滤波器的幅频响应如图2.4所示。

图2.4预加重滤波器的幅频响应

分帧的时候会采取0-50%重叠的方式,前一帧与后一帧之间交叠的部分称为帧移,有了帧移的话,帧与帧之间就能够平滑过渡,如图2.5所示。

图2.5分帧示意图

随后对取出的一帧信号进行加窗处理,即,在加窗的时候,不同的窗口和窗长的选择将影响到语音信号分析结果,窗函数通常有矩形窗(Rectangle)和汉明窗(Hamming)两种。

矩形窗的表达式为:

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 经管营销 > 财务管理

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1