MATLAB小波在语音信号压缩中的应用Word下载.docx

上传人:b****8 文档编号:22266647 上传时间:2023-02-03 格式:DOCX 页数:17 大小:284.42KB
下载 相关 举报
MATLAB小波在语音信号压缩中的应用Word下载.docx_第1页
第1页 / 共17页
MATLAB小波在语音信号压缩中的应用Word下载.docx_第2页
第2页 / 共17页
MATLAB小波在语音信号压缩中的应用Word下载.docx_第3页
第3页 / 共17页
MATLAB小波在语音信号压缩中的应用Word下载.docx_第4页
第4页 / 共17页
MATLAB小波在语音信号压缩中的应用Word下载.docx_第5页
第5页 / 共17页
点击查看更多>>
下载资源
资源描述

MATLAB小波在语音信号压缩中的应用Word下载.docx

《MATLAB小波在语音信号压缩中的应用Word下载.docx》由会员分享,可在线阅读,更多相关《MATLAB小波在语音信号压缩中的应用Word下载.docx(17页珍藏版)》请在冰豆网上搜索。

MATLAB小波在语音信号压缩中的应用Word下载.docx

引言

通过语音传递倍息是人类最重要、最有效、最常用和最方便的交换信息的形式。

让计算机能听懂人类的语言,是人类自计算机诞生以来梦寐以求的想法,用现代手段研究语音信号,使人们能更加有效地产生、传输、存储、获取和应用语音信息,这对于促进社会的发展具有十分重要的意义。

然而语音通信过程中不可避免的会受到来自周围环境、传输媒介引入的噪声、通信设备内部电噪声、乃至其它讲话者的干扰。

而语音增强就是从带噪语音信号中提取尽可能纯净的原始语音,改善语音质量,提高语音的清晰度和可懂度。

语音压缩质量应该比电话质量更好。

本文中提出了两种新的压缩技术。

每一种技术都在后来被证明,不仅产生了一个更高的压缩比,而且实现了在较高信噪比条件段的质量的提高和平均意见得分值测试比率的提高。

本文中所讨论的语音压缩技术是基于离散小波传输。

提出的这种技术比现有的技术更加简单而有效。

1小波理论

1.1小波定义与应用

小波(wavelet),即小区域的波,是一种特殊的长度有限、平均值为0的波形。

小波函数的确切定义为:

为一平方可积函数,即

,若其傅里叶变换满足条件:

则称

为一个基本小波或小波母函数,称上式为小波函数的可容许条件。

小波分析是近15年来发展起来的一种新的时频分析方法。

其典型应用包括齿轮变速控制,起重机的非正常噪声,自动目标所顶,物理中的间断现象等。

而频域分析的着眼点在于区分突发信号和稳定信号以及定量分析其能量,典型应用包括细胞膜的识别,金属表面的探伤,金融学中快变量的检测,INTERNET的流量控制等。

从以上的信号分析的典型应用可以看出,时频分析应用非常广泛,涵盖了物理学,工程技术,生物科学,经济学等众多领域,而且在很多情况下单单分析其时域或频域的性质是不够的,比如在电力监测系统中,即要监控稳定信号的成分,又要准确定位故障信号。

这就需要引入新的时频分析方法,小波分析正是由于这类需求发展起来的。

小波变换的时频窗口特性与短时傅里叶的时频窗口不一样,因为a不仅影响窗口在频率轴上的位置,也影响窗口的形状。

这样小波变换对不同的频率在时域上的取样步长是可调节的,即在低频时小波变换的时间分辨率较低,而频率分辨率较高;

而高频时小波变换的时间分辨率较高,而频率分辨率较低,这正符合低频信号变化缓慢而高频信号变化迅速的特点,所以被誉为数学显微镜。

这便是它优于经典的傅里叶变换和短时傅里叶变换的地方。

小波变换也一种积分变换,

为小波变换系数。

它不同于傅里叶变换的地方是,小波基具有尺度

和平移

两个参数,所以函数一经小波变换,就意味着将一个时间函数投影到二维的时间-尺度相平面上,这样有利于提取信号函数的某些本质特征。

小波分析是一门新的学科,在频域和时域具有良好的局部化特性,克服了傅里叶分析的不足,能使用傅里叶的地方都可以用小波分析来代替并且效果会更好。

小波分析在数据的压缩、去噪、边缘检测等方面比现有方法更有效。

小波分析与傅里叶分析的区别在于:

傅里叶分析只考虑时域和频域之间的一对一映射,它以单个变量(时间或频率)的函数表示信号;

小波分析则利用联合时间—尺度函数分析非平稳信号,小波分析和时频分析的区别在于:

时频分析在时频平面上表示非平稳信号,小波分析描述非平稳信号虽然也在二维平面上,但不是在时频平面上,而是在时间—尺度平面上,在小波分析中,人们可以在不同尺度上来观察信号,这种对信号分析的多尺度观点是小波分析的基本特征。

小波分析属于时频分析的一种,传统的信号分析是建立在傅立叶变换的基础上的,由于傅立叶分析使用的是一种全局的变换,要么完全在时域,要么完全在时域,要么完全在频域,因此无法表述信号的时频局域性质,而这种性质恰恰是非平稳信号最根本和最关键的性质。

为了分析和处理非平稳信号,人们对傅立叶分析进行了推广乃至根本性的革命,提出并发展了一系列新的信号分析理论:

短时傅立叶变换、Gabor变换、时频分析、小波变换、分数阶傅立叶变换、线调频小波变换、循环统计量理论和调幅-调频信号分析等。

其中,短时傅立叶变换和小波变换也是应传统的傅立叶变换不能够满足信号处理的要求而产生的。

短时傅立叶变换分析的基本思想是:

假定非平稳信号在分析窗函数g(t)的一个短时间间隔内是平稳(伪平稳)的,并移动分析窗函数,使

在不同的有限时间宽度内是平稳信号,从而计算出各个不同时刻的功率谱。

但从本质上讲,短时傅立叶变换是一种单一分辨率的信号分析方法,因为它使用一个固定的短时窗函数。

因而短时傅立叶变换在信号分析上还是存在着不可逾越的缺陷。

小波变换是一种信号的时间—尺度分析方法,它具有多分辨率分析的特点,而且在时频两域都具有表征信号局部特征的能力,是一种窗口大小固定不变但其形状可改变,时间窗和频率窗都可以改变的时频局部化分析方法。

即在低频部分具有较高的频率分辨率,在高频部分具有较高的时间分辨率和较低的频率分辨率,很适合于探测正常信号中夹带的瞬态反常现象并展示其成分,所以被誉为分析信号的显微镜,利用连续小波变换进行动态系统故障检测与诊断具有良好的效果。

1.2小波仿真应用

小波在提取淹没在噪声中的周期信号中的应用仿真如下。

仿真输入信号与噪声信号如图1.1,加噪信号与周期自相关如图1.2。

图1.1仿真输入信号与噪声信号

图1.2加噪信号与周期自相关

2语音信号

2.1语音的特性

2.1.1语音信号具有短时平稳性

语音信号是一种随时间而变化的信号,在一小段时间内(10~30ms)语音信号近似不变,即语音信号具有短时平稳性。

这样,可以把语音信号分为一些短段(称为分析帧)来进行处理。

2.1.2语音信号分为清音和浊音

语音分为清音和浊音,二者的产生机理不同,特征也有很大的差异。

由声带振动发出的语音称为浊音,其他方式发音称为清音。

清音没有明显的时域和频域特征,没有周期性,类似于白噪声。

浊音在时域上有明显的周期性,在频域上具有共振峰结构,能量大部分集中在低频段内。

因此,可以利用浊音的周期性特征,采用梳状滤波器提取语音分量,抑制非语音分量。

2.1.3语音信号可以用统计分析特性来描述

语音信号是一个随机过程,长时间时域统计特性在语音增强中意义不大。

其短时谱幅度的统计特性是时变的,只有当分析帧长趋于无穷大时,才能近似地认为它具有高斯分布。

高斯统计模型是根据中心极限定理得到的。

在高斯模型的假设下,傅立叶展开系数被认为是独立的高斯随机变量,均值为0,而方差是时变的。

这种高斯模型应用于有限帧长时只是一种近似的描述,作为分析的前提在宽带噪声污染的带噪语音增强中应用。

下面是一段语音信号的时域波形图(图2.1)和频域图(图2.2),由这两个图可以看出语音信号的两个特点。

图2.1语音信号时域波形图图2.2语音信号频域波形图

2.2语音信号的采集

在将语音信号进行数字化前,必须先进行防混叠预滤波,预滤波的目的有两个:

抑制输入信导各领域分量中频率超出fs/2的所有分量(fs为采样频率),以防止混叠干扰。

抑制50Hz的电源工频干扰。

这样,预滤波器必须是一个带通滤波器,设其上、下截止颜率分别是fH和fL,则对于绝人多数语音编译码器,fH=3400Hz、fL=60~100Hz、采样率为fs=8kHz;

而对丁语音识别而言,当用于电话用户时,指标与语音编译码器相同。

当使用要求较高或很高的场合时fH=4500Hz或8000Hz、fL=60Hz、fs=10kHz或20kHz。

为了将原始模拟语音信号变为数字信号,必须经过采样和量化两个步骤,从而得到时间和幅度上均为离散的数字语音信号。

采样也称抽样,是信号在时间上的离散化,即按照一定时间间隔△t在模拟信号x(t)上逐点采取其瞬时值。

采样时必须要注意满足奈奎斯特定理,即采样频率fs必须以高于受测信号的最高频率两倍以上的速度进行取样,才能正确地重建波它是通过采样脉冲和模拟信号相乘来实现的。

下图2.3时一段语音信号在采样频率44.1KHz情况下的频谱图。

图2.3采样频率44.1KHz情况下的频谱图。

由图可知,这段语音信号的频率主要集中在1KHz左右,当采样频率为44.1KHz时,由于采样频率比较大,所以采样点数就越密,所得离散信号就越逼近于原信号,频谱也没有发生混叠。

图2.4频谱图

对上述信号进行1/80采样频率抽取,即采样频率变为将近500Hz时,由于采样频率比较小,所以采样点数就稀疏,所得离散信号就越偏离于原信号,频谱也发生了混叠。

在采样的过程中应注意采样间隔的选择和信号混淆:

对模拟信号采样首先要确定采样间隔。

如何合理选择△t涉及到许多需要考虑的技术因素。

一般而言,采样频率越高,采样点数就越密,所得离散信号就越逼近于原信号。

但过高的采样频率并不可取,对固定长度(T)的信号,采集到过大的数据量(N=T/△t),给计算机增加不必要的计算工作量和存储空间;

若数据量(N)限定,则采样时间过短,会导致一些数据信息被排斥在外。

采样频率过低,采样点间隔过远,则离散信号不足以反映原有信号波形特征,无法使信号复原,造成信号混淆。

根据采样定理,当采样频率大于信号的两倍带宽时,采样过程不会丢失信息,利用理想滤波器可从采样信号中不失真地重构原始信号波形。

量化是对幅值进行离散化,即将振动幅值用二进制量化电平来表示。

量化电平按级数变化,实际的振动值是连续的物理量。

具体振值用舍入法归到靠近的量化电平上。

语音信号经过预滤波和采样后,由A/D变换器变换为二址制数字码。

这种防混叠滤波通常与模数转换器做在一个集成块内,因此目前来说,语音信号的数字化的质量还是有保证的。

市面上购买到的普通声卡在这方面做的都很好,语音声波通过话筒输入到声卡后直接获得的是经过防混叠滤波、A/D变换、量化处理的离散的数字信号。

在实际工作中,我们可以利用windows自带的录音机录制语音文件,图2.5是基于PC机的语音信号采集过程,声卡可以完成语音波形的A/D转换,获得WAVE文件,为后续的处理储备原材料。

调节录音机保存界面的“更改”选项,可以存储各种格式的WAVE文件。

图2.5基于PC机的语音信号采集过程

采集到语音信号之后,需要对语音信号进行分析,如语音信号的时域分析、频谱分析、语谱图分析以及加噪滤波等处理。

3语音压缩

3.1语音压缩技术

语音压缩技术指的是对原始数字音频信号流运用适当的数字信号处理技术,在不损失有用信息量,或所引入损失可忽略的条件下,压缩信号编码速率,也称为压缩编码。

以生成适合传输的数字信号流,提高传输效率。

这样做的优点在于可以适应在低码率的信道上实现可靠传输,也可以在同样的信道上传输更多的数据。

对语音编码技术中语音质量的评价主要分为两类,客观评定方法和主观评定方法。

其中客观评定方法用客观测量的手段来评价语音编码的质量,其特点是计算简单,但不能完全反映人对语音质量的感觉。

主观评定方法符合人类听话时对语音质量的感觉,因而得到广泛应用。

语音压缩编码技术有多种,归纳起来大致可分为三类,即波形编码、参数编码和混合编码。

波形编码:

针对语音波形进行编码,而尽量保持输出波形不变,即恢复的语音信号基本上与输入信号波形相同。

参数编码:

是先对语音信号进行分析,提取出其参数,对参数进行编码,在解码后由这些参数重新合成出重构的语音信号,使得到的信号听起来与输入语音相同;

而不是对语音信号的波形直接处理,因而恢复信号与原信号不必保持相同。

混合编码:

由参数编码与波形编码相结合。

这种编码器正在得到人们较大的关注。

这种编码器既具备了声码器的特点(利用语音生成模型提取语音参数),又具备了波形编码的特点(优化激励信号,使其与输入语音波形相匹配)。

当前语音压缩编码的常用技术有:

脉冲编码调制(PulseCodeModulation,简称PCM),自适应差分脉;

中编码调制(ADIcM)及自适应增量调制(ADM),子带编码(SBC),线性预测语音生成模型与参数编码。

由于语音数据量庞大,对语音数据进行有效压缩是很必要的,能够使我们在有限的ROM空间里录入更多的语音内容。

有以下几种方式:

语音分段:

将语音中可以重复的部分截取出来,通过排列组合将内容完整地回放出来。

语音采样:

一般我们使用的喇叭频响曲线在中频部分,较少用到高频,所以,在喇叭音质可以接受的情况下,适当降低采样频率,达到压缩效果,这种过程是不可逆的,无法恢复原貌,叫有损压缩。

数学压缩:

主要是针对采样位数进行压缩,这种方式也是有损压缩。

例如,我们经常采用的ADPCM压缩格式,是将语音数据从16bit压缩到4bit,压缩率是4倍。

MP3是对数据流进行压缩,涉及到数据预测问题,它的波特率压缩倍率为10倍左右。

通常,以上几种压缩方式都是综合起来使用的。

3.2小波包编码的优势

语音信号的特性是其高频分量持续时间短,这要求分析算法对高频分量具有较高的时间分辨率;

而低频分量持续时间长,允许较低的采样速率,这要求分析算法对低频分量具有较高的频率分辨率。

小波包变换正具有这一特性,小波包函数相当于滤波器组,这种滤波器组有一重要特征:

在改变中心频率的同时,频宽也改变。

这样该滤波器组的品质因素就不会发生改变。

这样,不仅可以把信号变换到时频空间,而且随信号频率成份的不同而调整时域取样步长,从而可聚焦到信号的任意细节,兼备良好的时域和频域分辨率。

因为小波包变换在信号高低频部分都具有在时域和频域同时有良好的局域化特性,对语音这种非平稳信号的特征分析,与小波分析相比,效果更好。

小波包提供了对小波空间进行分解的工具。

分解过程可在某一支上停止而这不影响在另一支上继续。

一棵分解树不论如何生长,数据总量将是保持不变的。

所以小波包为信号分析提供了更大的灵活性。

3.3人耳听觉特性分析

人耳有一听觉阈值,在此阈值下的任何频率的声音是完全听不见的;

响度曲线的最低一根曲线表示人的正常听觉阈值,在1kHz~5kHz的区域内,听觉最灵敏,低频和高频段的阈值明显升高。

如下图3.1.

图3.1人耳听觉阈值

声音掩蔽效应,即一种声音的存在会抑制人耳听到另一个声音。

这是由于信号的存在使感觉阈值升高了。

一个2KHz,80dB的正弦音对其他正弦音的掩蔽曲线,第二个音在实线下面时,它不会引起听觉感受。

如下图3.2。

图3.22KHz,80dB的正弦音对其他正弦音的掩蔽曲线

3.4小波编码解码过程

对输入语音进行预处理,检测到语音信息,进行小波包变换将其变换到一定的时频空间,此空间的时频分辨率接近人耳的平均时频分辨率然后计算出最佳小波分解树对小波分解树进行量化实现对信号的压缩编码。

详细框图见下图3.3

图3.3小波编码过程

解码部分对解码后的变换系数进行小波包重构恢复出语音信号,再利用附加信息恢复出完整的语音信息。

解码过程见图3.4。

图3.4解码过程

利用Pentium(3GHz)计算机,在matlab平台上,对几段男、女、童声(包括音频信号)的语音信号进行了压缩和重构,其原始信号和重构信号的波形和频谱如图3.5所示。

图3.5实验仿真图

4总结

通过本次课设,使我对语音信号有了全面的认识,对数字信号处理的知识又有了深刻的理解,我熟悉和掌握MATLAB程序设计方法,小波的应用,熟悉MATLAB处理工具箱,学会运用MATLAB工具箱对简单信号的加噪及小包波分析。

通过这次练习是我进一步了解了信号的产生、采样及频谱分析的方法。

以及其中产生信号和绘制信号的基本命令和一些基础编程语言。

让我感受到只有在了解课本知识的前提下,才能更好的应用这个工具;

并且熟练的应用MATLAB也可以很好的加深我对课程的理解,方便我的思维。

这次设计还使我了解了MATLAB的使用方法,深刻体会到MATLAB分析工具的强大,提高了分析和动手实践能力。

同时我相信,进一步加强对MATLAB的学习与研究对我今后的学习将会起到很大的帮助。

参考文献

[1]胡昌华,张军波,夏军,张伟.基于MATLAB的系统分析与设计——小波分析[M].西安:

西安电子科技大学出版社,2000.

[2]董长虹,高志,余啸海.Matlab小波分析工具箱原理与应用[M].北京:

国防工业出版社,2004.

[3]张兆礼,张春晖,梅晓丹.现代图像处理技术及Matlab实现[M].北京:

人民邮电出版社,2001.

[4]刘贵忠,邸双亮.小波分析及其应用[M].西安:

西安电子科技大学出版社,1992.

[5]奉前清,杨宗凯.实用小波分析[M].西安:

[6]阮秋琦.数字图像处理学[M].北京:

电子工业出版社,2001.

[7]肖自美.图像信息理论与压缩编码技术[M].广州:

中山大学出版社,2000.

[8]容观澳.计算机图像处理[M].北京:

清华大学出版社,2000.

[9]姚东,王爱民,冯峰,王朝阳.MATLAB命令大全[M].北京:

人民邮电出版社,2000.

[10]陈贺新.非线形滤波器与数字图像处理[M].北京:

国防工业出版社,1997.

[11]飞思科技产品研发中心.Matlab辅助小波分析与应用[M].北京:

电子工业出版社,2003.

附录:

小波仿真源程序

%产生原输入信号xn

clearall;

n=0:

499;

xn=sin(0.1*pi*n);

figure

(1);

subplot(211);

plot(n,xn);

gridon;

axis([0300-22]);

xlabel('

n'

);

ylabel('

xn'

title('

原输入信号xn'

%产生噪声信号vn和加噪信号sn

vn=2*(rand(1,500)-0.5);

sn=vn+xn;

subplot(212)

plot(n,vn)

噪声信号vn'

figure

(2)

plot(n,sn);

sn'

axis([0100-23]);

加噪信号sn'

%产生周期自相关r

[r,n]=xcorr(xn);

m=length(r);

n=1:

m;

subplot(212);

plot(n,r);

周期自相关r'

n'

r'

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 农林牧渔 > 畜牧兽医

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1