ImageVerifierCode 换一换
格式:DOCX , 页数:9 ,大小:154.99KB ,
资源ID:28468403      下载积分:3 金币
快捷下载
登录下载
邮箱/手机:
温馨提示:
快捷下载时,用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)。 如填写123,账号就是123,密码也是123。
特别说明:
请自助下载,系统不会自动发送文件的哦; 如果您已付费,想二次下载,请登录后访问:我的下载记录
支付方式: 支付宝    微信支付   
验证码:   换一换

加入VIP,免费下载
 

温馨提示:由于个人手机设置不同,如果发现不能下载,请复制以下地址【https://www.bdocx.com/down/28468403.html】到电脑端继续下载(重复下载不扣费)。

已注册用户请登录:
账号:
密码:
验证码:   换一换
  忘记密码?
三方登录: 微信登录   QQ登录  

下载须知

1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。
2: 试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。
3: 文件的所有权益归上传用户所有。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 本站仅提供交流平台,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

版权提示 | 免责声明

本文(语音信号共振峰提取方法.docx)为本站会员(b****8)主动上传,冰豆网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知冰豆网(发送邮件至service@bdocx.com或直接QQ联系客服),我们立即给予删除!

语音信号共振峰提取方法.docx

1、语音信号共振峰提取方法0.引言在语音数字信号处理的研究中,语音信号的共振峰是一个十分重要的性能参数。共振峰是准周期脉冲激励进入声道时产生的一组共振频率。共振峰参数包括共振峰频率和频带宽度,它是区别不同韵母的重要参数。当前共振峰的提取方法有很多种,每种方法各有利弊,本文对多种共振峰提取方法进行实验和比较分析。与基音提取类似,得到精确的共振峰估值也是很困难的,这些困难是:(1虚假峰值在正常情况下,频谱包络中的最大值完全是由共振峰引起的。但有时会出现虚假峰值,在利用非线性预测分析方法的频谱包络估计时,出现虚假峰值情况较多,而采用线性预测方法时,出现虚假峰值情况得到了很大的改善。(2共振峰合并当出现相

2、邻共振峰时,可能会有频率靠得太近难以分辨的情况,而寻找一种理想的能对共振峰合并进行识别的共振峰提取算法有不少实际困难。(3高音调语音传统的频谱包络估值方法是利用由谐波峰值提供的样点,而高音调语音(如女声和童声的谐波间隔比较宽,因而为频谱包络估值所提供的样点比较少。而利用线性预测进行频谱包络估值可以一定程度上改善这一问题。1.谱包络提取共振峰信息包含在语音频谱包络中,因此共振峰参数提取的关键是估计自然语音频谱包络,并认为谱包络中的最大值就是共振峰。下图1是对21 帧信号的线性预测谱包络提取分析。图12.倒谱法提取共振峰虽然可以直接对语音信号求离散傅里叶变换(DFT,然后用DFT 谱来提取语音信号

3、的共振峰参数,但是,直接DFT的谱要受基频谐波的影响,最大值只能出现在谐波频率上,因而共振峰测定误差较大。为了消除基频谐波的影响,可以采用同态解卷技术,经过同态滤波后得到平滑的谱,这样简单地检测峰值就可以直接提取共振峰参数,因而这种方法更为有效和精确。因为倒谱运用对数运算和二次变换将基音谐波和声道的频谱包络分离开来。因此用低时窗l(n从语音信号倒谱c(n中所截取出来得h(n,能更精确地反映声道响应。这样,由h(n经DFT得到的H(k,就是声道的离散谱曲线,用H(k代替直接DFT的频谱,因为去除了激励引起的谐波波动,所以可以更精确地得到共振峰参数。图2倒谱法求取的共振峰参数图3.LPC法提取共振

4、峰从线性预测导出的声道滤波器是频谱包络估计器的最新形式,线性预测提供了一个优良的声道模型(条件是语音不含噪声。尽管线性预测法的频率灵敏度和人耳不相匹配,但它仍是最廉价、最优良的行之有效的方法。用线性预测可对语音信号进行解卷:即把激励分量归入预测残差中,得到声道响应的全级模型H(z的分量,从而得到这个分量的ai参数。尽管其精度由于存在一定的逼近误差而有所降低,但去除了激励分量的影响。此时求出声道响应分量的谱峰,就可以求出共振峰,这里有两种途径:一是用标准的求取复根的方法计算全级模型分母多项式A(z的根,称为求根法;一是用运算量较少的DFT法,求A(z的离散频率响应A(k的谷点来得到共振峰的位置。

5、因为A(z=1-i=1pa i z-i,所以若求此多项式系数序列(1,a1,a2,a p的DFT,就可以得到A(k。但是一般预测阶数p不大,这就影响了求其谷点即求其共振峰频率值的精度。为了提高DFT的频率分辨率,可以采用补0的办法增加序列的时间长度,即用(1,a1,a2,a p,0,0,0进行DFT,为了能利用FFT,长度一般取为64点、128点、256点、512点等。另外也可以采用抛物线内插技术, 解决频率分辨率较低的情况下的共振峰频率值的求取。图3LPC谱估计法求取的共振峰参数图语音信号共振峰提取方法的研究分析青海师范大学物理系杨丹姜占才余蓥良李振起摘要目前的提取语音共振峰的方法比较多,常

6、用的方法有倒谱法、LPC谱估计法、LPC倒谱法,但没有一种方法是十分完美的,为了系统的深入的研究共振峰的提取,本文对同一帧语音信号进行了不同方法的共振峰提取实验仿真,给出了具体的共振峰频率数据,同时对不同方法的优缺点进行了科学的、深入的研究分析,用Matlab对算法进行仿真实现,实验结果表明共振峰的提取方案中LPCC倒谱法避免了一般同态处理中对复对数的麻烦,可以较为理想的实现对共振峰的提取。关键词共振峰倒谱法LPC谱估计法LPC倒谱法 同态处理1614.求根法提取共振峰找出多项式复根的过程通常采用牛顿拉夫逊(Newton-Raphson 算法。其方法是一开始先猜测一个根值并就此猜测值计算多项式

7、及其导数的值,然后利用结果再找出一个改进的猜测值。当前后两个猜测值之差小于某门限时结束猜测过程。由上述过程可知,重复运算找出复根的计算量相当可观。然而,假设每一帧的最初猜测值域前一帧的根的位置重合,那么根的帧到帧的移动足够小,经过较少的重复运算后,可使新的根的值会聚在一起。当求根过程初始时,第一帧的猜测值可以在单位圆上等间隔设置。具体过程是:设:z i =r i e j i 为第一个根,则其共轭值z i =r i e -j i也是一个根。设与i 对应的共振峰频率为F i ,3dB 带宽为B i ,则它们存在下面的关系:2TF i =i e -B i T=r i 所以:F i =i 2T B i

8、 =-ln r iT 式中,T 是采样周期。因为预测器阶数p 是预先选定的,所以复共轭对的数量最多是p/2。因而判断某一个极点属于哪一个共振峰的问题就不太复杂。而且,不属于共振峰的额外极点容易排除掉,因为其带宽比共振峰带宽要大得多。5.LPC 倒谱法提取共振峰语音信号的倒谱可以通过对信号做傅里叶变换,取模的对数,在求反傅里叶变换得到。由于频率响应H (e j反应声道的频率响应和被分析信号的谱包络,因此用log |H (e j|做傅里叶反变换求出的LPC 倒谱系数,也可以被认为是包含了信号谱的包络信息,因此可以将其看作对原信号短时倒谱的一种近似。 图4LPC 倒谱法求取的共振峰参数图通过线性预测

9、分析得到的合成滤波器的系统函数为H (z =11-i =1pa i z -i,其冲击响应为h(n。下面求h(n的倒谱h (n ,首先根据同态分析方法,有H (z =log H (z 因为H(z是最小相位的,即在单位院内是解析的,所以H (z 一定可以展开成级数形式,即H (z =n =1+h (n z -n ,就是说H(z 的逆变换h (n 是存在的。设h (0=0,将式两边同时对z-1求导,得z -1log 11-i =1a i z -i=z -i n =1+h (n z -n得到n =1+nh(n z -n +1=i =1pia i z -i +11-i =1a i z -i有1-i =1

10、p a i z -i n =1+nh(n z -n +1=n =1+ia i z -i +1,令式左右两边z 的各次幂前系数分别相等得到h (1=a 1h (n =a n +i =1n -11-i n a i h(n -i 1n p h (n =i =1p 1-i n a i h (n -i n p 按照上式可直接从预测系数ai求得倒谱h(n 。这个倒谱是根据现行预测模型得到的,又称为LPC 倒谱。6.分析和总结以上实验表明,倒谱法因为其频谱曲线的波动比较小,所以估计共振峰参数的效果是较好的,但其运算量太大。LPC 法的缺点是用一个全极点模型逼近语音谱,对于含有零点的某些音来说A(z的根反映了

11、极零点的复合效应,无法区分这些根是相对于零点还是极点,或完全与声道的谐振极点有关。声道的系统函数可以由一组LPC 预测系数唯一确定,因此通过分析能估计出声道调制的效果,即获得共振峰参数。当然,LPC 分析阶P 的选择很重要,它近似等于语音信号的抽样频率,这是因为语音谱一般可用每1kHz 具有1对共扼极点的平均密度来表示声道造成的响应,于是采样频率为Fs(kHz的语音信号的LPC 谱大约有Fs 个极点。LPC 分析在大多数情况下能成功提取语音的共振峰参数。求根法求取共振峰的优点在于通过对预测多项式系数的分解可以精确地确定共振峰的中心频率和带宽。LPC 倒谱由于利用线性预测中声道系统函数H(z的最

12、小相位特性,因此避免了一般同态处理中对复对数的麻烦。图5共振峰参数求取三种方法比较分析图当前还有很多种新的共振峰提取方法,每个方法都是在传统共振峰提取方法的基础上进行研究和改进提出的,在一定的基础上较好的实现了共振峰的提取,效果也较为理想,但都保留了一定的改进空间供后来者继承和研究创新。参考文献1Wat anabe A.Formant estimat ion method using inverse-filter control J .IEEE Transactions on Speech and Audio Processing,2001,9(4:317-326.2L.R.Rabiner,B

13、.H.Juang.Fundamentals of Speech Recognition.Prentice Hall,Englewood Cliffs,1993.清华大学出版社(影印,2002年.3黄海,陈祥献.基于Hilbert-Huang 变换的语音信号共振峰频率估计J .浙江大学学报:工学版,2006,40(11:1926-1930.4胡航.语音信号处理(修订版.哈尔滨工业大学出版社,2002年.5于萍,韩冰等.嗓音声学分析和电声门图的比较研究J .听力学及言语疾病杂志,2005,13(3:160-163.6韩继庆,张磊,郑铁然.语音信号处理.清华大学出版社,2004年.1王宏志.一本晚清

14、翻译史的构思J .中国比较文学,2001,(2:104.2谭汝谦.中国译日本书综合目录M .香港:香港中文大学出版社,1980.3(日实藤惠秀.中国人留学日本史M .谭汝谦,林启彦译.北京:生活读书新知三联书店,1983.4李喜所.近代中国的留学生M .北京:北京人民出版社,1987.122、124、144、198-201.5费正清.剑桥中国晚清史下卷M .北京:中国社会科学出版社,1993.405、406、333.6劝同乡父老遣子弟航洋游学书.游学译编(6.7陈潮.近代留学生M .上海:上海古籍出版社,1998.58、83-84.8李亚舒,黎难秋.中国科学翻译史M .长沙:湖南教育出版社,2002:231;209-211.9梁启超.论变法不知本原之害M .饮冰室合集文集之一.10潘玉田,陈永刚.中西文献交流史M .北京:北京图书馆出版社,1997:72.11葛兆光.1895的中国:思想史上的象征意义J .(上接第165页162

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1