声音延时与混响概要.docx

上传人:b****5 文档编号:12306814 上传时间:2023-04-18 格式:DOCX 页数:30 大小:286.50KB
下载 相关 举报
声音延时与混响概要.docx_第1页
第1页 / 共30页
声音延时与混响概要.docx_第2页
第2页 / 共30页
声音延时与混响概要.docx_第3页
第3页 / 共30页
声音延时与混响概要.docx_第4页
第4页 / 共30页
声音延时与混响概要.docx_第5页
第5页 / 共30页
点击查看更多>>
下载资源
资源描述

声音延时与混响概要.docx

《声音延时与混响概要.docx》由会员分享,可在线阅读,更多相关《声音延时与混响概要.docx(30页珍藏版)》请在冰豆网上搜索。

声音延时与混响概要.docx

声音延时与混响概要

目录

摘要I

AbstractII

1任务与要求1

1.1课程设计的任务1

1.2课程设计的要求1

1.3课题背景及意义2

2原理分析3

2.1语音信号的采样3

2.2混响4

2.3延时5

2.4时域分析6

2.5频域分析6

2.6离散傅立叶变换7

2.7滤波器设计8

2.7.1特殊滤波器的系统函数:

8

2.7.2滤波函数filter8

3声音的延时与混响仿真的方案设计9

4运行结果与分析10

4.1原始信号时域与频域波形图10

4.2采样后语音信号时域与频域波形图11

4.3信号延时时域与频域波形图12

4.4信号混响后时域与频域波形图13

4.5单回声滤波器波形图14

4.6多重回声滤波器波形图15

4.7无限回声滤波器波形图16

4.8全通滤波器波形图17

5总结18

参考文献19

附录20

摘要

语音信号处理是研究用数字信号处理技术和语音学知识对语音信号进行处理的新兴的学科,是目前发展最为迅速的信息科学研究领域的核心技术之一。

通过语音传递信息是人类最重要、最有效、最常用和最方便的交换信息形式。

Matlab语言是一种数据分析和处理功能十分强大的计算机应用软件,它可以将声音文件变换为离散的数据文件,然后利用其强大的矩阵运算能力处理数据,如数字滤波、傅里叶变换、时域和频域分析、声音回放以及各种图的呈现等,它的信号处理与分析工具箱为语音信号分析提供了十分丰富的功能函数,利用这些功能函数可以快捷而又方便地完成语音信号的处理和分析以及信号的可视化,使人机交互更加便捷。

信号处理是Matlab重要应用的领域之一。

数字信号处理(DigitalSignalProcessing)技术,从20世纪60年代以来,随着计算机科学和信息科学发展,数字处理技术应运而生并得以快速发展。

语言是人们进行信息沟通的主要方式之一,它具有直接、自然、方便等优点。

语音则是语言的物理层表达方式。

语音处理主要是对语音进行机器处理,以达到传输、自动识别、机器理解等目的。

进行了语音处理过程的滤波、采样、傅立叶变换和谱包络提取的算法实现研究,讨论了在算法的DSP实现方法。

Matlab语言是一种广泛应用于工程计算及数值分析领域的新型高级语言,Matlab功能强大、简单易学、编程效率高。

特别是Matlab还具有信号分析工具箱,不需具备很强的编程能力,就可以很方便地进行信号分析、处理和设计。

本课程设计基于Matlab分析wav声音文件频谱与声音的关系。

通过采集个人的一段声音进行频谱分析等处理,然后设计数字滤波器处理这个原始声音的wav文件,并比较滤波以后输出声音信号与原声音信号的异同。

关键词:

matlab语音信号延时混响滤波器MATLAB语言频谱分析

 

Abstract

Speechsignalprocessingisthestudyofdigitalsignalprocessingtechnologyandphoneticsknowledgeofthevoicesignalprocessingoftheemergingdiscipline,isoneofthecoretechnologyofthefastestgrowingfieldofscientificresearch.Voicetransmissionofinformationishumanisthemostimportantandeffectiveexchangeofinformationintheformmostcommonlyusedandmostconvenient.

TheMatlablanguageisaverypowerfulcomputerapplicationsoftwareinadataanalysisandprocessingfunctions,itcantransformthesoundfilesfordiscretedatafiles,andthenuseitspowerfulmatrixoperationscapableofhandlingdata,suchasdigitalfiltering,Fouriertransform,domainandfrequencydomainanalysis,voiceplayback,aswellasavarietyofmapshowingthesignalprocessingandanalysistoolkitforspeechsignalanalysisprovidesaveryrichfeaturefunction,theuseofthesefeaturesfunctioncanquickandeasilycompletedthespeechsignalprocessingandanalysisandsignalvisualization,makecomputerinteractionmoreconvenient.ThesignalprocessingisoneofthetheMatlabimportantfieldofapplication.

ThiscourseisdesignedbasedonMatlabanalysisofthespectrum,therelationshipbetweensoundofwavsoundfiles.Throughthecollectionofindividualsasoundspectrumanalysis,processing,andthendesignthedigitalfilter,theoriginalsoundwavfiles,andcomparesimilaritiesanddifferencesoftheoutputaudiosignalwiththeoriginalsoundsignalafterthefilter.

Keywords:

matlabvoicesignaldelayreverbfilter

 

1任务与要求

1.1课程设计的任务

这次综合课程设计,是利用MATLAB软件对声音信号进行一系列的处理。

主要要做的任务有一下几点:

(1)利用Windows下的录音机或其他软件,录制一段自己的语音信号,时间控制在1s左右,并对录制的信号进行采样。

(2)语音信号的频谱分析,画出采样后语音信号的时域波形和频谱图。

(3)将信号加入延时和混响,再分析其频谱,并与原始信号频谱进行比较。

(4)设计几种特殊类型的滤波器:

单回声滤波器,多重回声滤波器,无限个回声滤波器,全通结构的混响器,并画出滤波器的频域响应。

(5)用自己设计的滤波器对采集的语音信号进行滤波。

(6)分析得到信号的频谱,画出滤波后信号的时域波形和频谱,并对滤波前后的信号进行对比,分析信号的变化。

(7)回放语音信号。

1.2课程设计的要求

这次课程设计是为了培养我们的学习能力和处理能力,所以对这次的课设有如下的几点要求:

(1)熟悉离散信号和系统的时域特性。

(2)熟悉语音信号的特点。

(3)掌握数字信号处理的基本概念,基本理论和基本方法。

(4)掌握序列快速傅里叶变换方法。

(5)学会MATLAB的使用,掌握MATLAB的程序设计方法。

(6)掌握MATLAB设计各种数字滤波器的方法和对信号进行滤波的方法。

1.3课题背景及意义

数字信号处理主要是研究用数字或符号序列表示和处理信号。

处理的目的可以是削弱信号中的多余内容,滤除混杂的噪声和干扰,或者是将信号变换为容易分析和识别的形式,便于估计和选择它的特征参数。

语音信号分析是语音信号处理的前提和基础,只有分析出可表示语音信号本质特征的参数,才有可能利用这些参数进行高效的语音通信、语音合成和语音识别等处理。

而且,语音合成的音质好坏,语音识别率的高低,也都取决于对语音信号分桥的准确性和精确性。

因此语音信号分析在语音信号处理应用中具有举足轻重的地位。

根据所分析出的参数的性质的不同,可将语音信号分析分为时域分析、频域分析、倒领域分析等;时域分析方法具有简单、计算量小、物理意义明确等优点,但由于语音信号最重要的感知特性反映在功率谱中,而相位变化只起着很小的作用,所以相对于时域分析来说频域分析更为重要。

本文将简要介绍时域分析、频域分析。

声音信号是一维连续信号,而计算机只能处理离散信号。

为了从离散信号还原连续信号,根据采样定理,可以确定采样频率的最小值。

wav文件是一种数字声音文件格式,本课程设计基于Matlab分析了wav声音文件频谱与声音的关系。

通过采集个人的一段声音进行频谱分析等处理,然后设计数字滤波器处理这个原始声音的wav文件,并比较滤波以后输出声音信号与原声音信号的异同。

语音信号处理是一门比较实用的电子工程的专业课程,语音是人类获取信息的重要来源和利用信息的重要手段。

通过语言相互传递信息是人类最重要的基本功能之一。

语言是人类特有的功能,它是创造和记载几千年人类文明史的根本手段,没有语言就没有今天的人类文明。

语音是语言的声学表现,是相互传递信息的最重要的手段,是人类最重要、最有效、最常用和最方便的交换信息的形式。

近年来,随着计算机及大规模数字集成电路的迅速发展,语音数字信号处理得到了相应的发展。

语音信号分析模拟、语音合成、语音识别等的研究已较成熟。

、各种声码器、声控器、语声识别系统、语声合成器等已逐渐有商品出现。

2原理分析

2.1语音信号的采样

(1)采样频率

采样频率是指计算机每秒钟采集多少个声音样本,是描述声音文件的音质、音调,衡量声卡、声音文件的质量标准。

采样频率越高,即采样的间隔时间越短,则在单位时间内计算机得到的声音样本数据就越多,对声音波形的表示也越精确。

这就是说采样频率是衡量声卡采集、记录和还原声音文件的质量标准。

(2)采样位数

采样位数即采样值或取样值,用来衡量声音波动变化的参数,是指声卡在采集和播放声音文件时所使用数字声音信号的二进制位数。

采样频率是指录音设备在一秒钟内对声音信号的采样次数,采样频率越高声音的还原就越真实越自然。

采样位数和采样率对于音频接口来说是最为重要的两个指标,也是选择音频接口的两个重要标准。

无论采样频率如何,理论上来说采样的位数决定了音频数据最大的力度范围。

每增加一个采样位数相当于力度范围增加了6dB。

采样位数越多则捕捉到的信号越精确。

对于采样率来说你可以想象它类似于一个照相机,44.1kHz意味着音频流进入计算机时计算机每秒会对其拍照达441000次。

显然采样率越高,计算机摄取的图片越多,对于原始音频的还原也越加精确。

(3)采样定理

在进行模拟/数字信号的转换过程中,当采样频率fsmax大于信号最高频率fmax的2倍时,即:

fsmax>=2fmax,则采样之后的数字信号完整地保留了原始信号中的信息,一般实际应用中保证采样频率为信号最高频率的5~10倍,采样定理又称奈奎斯特定理。

1924年奈奎斯特(Nyquist)就推导出:

在理想低通信道的最大码元传输速率=2W*log2N(其中W是理想低通信道的带宽,N是电平强度)。

2.2混响

声音是通过媒质传入人的听觉器官的。

媒质,既是声音的传播途径,也是声音的载体。

用一个日常生活中司空见惯的例子来说,媒质,就像湖中传递波浪的湖水。

在平静的湖面投人一块石子,石子击起水波,波纹越来越大,水波越传越远。

这湖水,就是传播水波的媒质。

声音也仿佛如此:

当某一声源发音,空气中声波的震荡就会改变周围空气的静止状态,使之形成时而压缩,时而稀疏的前进波,声波就这样不断地散发开去,传播声音的媒质就是空气。

在闭室中,当声源发出一个声音信号(例如是一个脉冲声信号)时,位于室内任何一点的听者所接收到的声音中,应包含两部分成份,一部分是由声源直接传到听者的声音,我们称其为“直达声”。

另一部分是声波传到墙壁或障碍物处反射出的声音,其中有一些被听者接收到,另外一些又会传到其它墙壁处再次发生反射,反射后的声音中又有一些被听者接收到,类似地持续下去,将听者接收到的这部分声音,统称为“反射声”。

从时间上看,反射声较直达声落后(或称为延迟声),从能量角度看,由于每经一次反射都会有部分能量被吸收,因此反射声是一系列能量逐渐衰减的延迟声。

数字混响可以通过用人工创作的回音并将它加入原始信号里,从而把隔音录音室里录制的声音转换为一种自然的声音形式;回音可以简单地由延迟单元产生。

混响效果主要是用于增加音源的融合感。

自然音源的延时声阵列非常密集、复杂,所以模拟混响效果的程序也复杂多变。

常见参数有以下几种:

(1)混响时间:

能逼真的模拟自然混响的数码混响器上都有一套复杂的程序,其上虽然有很多技术参数可调,然而对这些技术参数的调整都不会比原有的效果更为自然,尤其是混响时间。

(2)高频滚降:

此项参数用于模拟自然混响当中,空气对高频的吸收效应,以产生较为自然的混响效果。

一般高频混降的可调范围为0.1~1.0。

此值较高时,混响效果也较接近自然混响;此值较低时,混响效果则较清澈。

(3)扩散度:

此项参数可调整混响声阵密度的增长速度,其可调范围为0~10,其值较高时,混响效果比较丰厚、温暖;其值较低时,混响效果则较空旷、冷僻。

(4)预延时:

自然混响声阵的建立都会延迟一段时间,预延时即为模拟次效应而设置。

(5)声阵密度:

此项参数可调整声阵的密度,其值较高时,混响效果较为温暖,但有明显的声染色;其值较低时,混响效果较深邃,切声染色也较弱。

(6)频率调制:

这是一项技术性的参数,因为电子混响的声阵密度比自然混响稀疏,为了使混响的声音比较平滑、连贯,需要对混响声阵列的延时时间进行调制。

此项技术可以有效的消除延时声阵列的段裂声,可以增加混响声的柔和感。

(7)调治深度:

指上述调频电路的调治深度。

2.3延时

延时就是将音源延迟一段时间后,再欲播放的效果处理。

依其延迟时间的不同,可分别产生合唱、镶边、回音等效果,当延迟时间在3~35ms之间时人耳感觉不到滞后音的存在,并且他与原音源叠加后,会因其相位干涉而产生"梳状滤波"效应,这就是镶边效果。

如果延迟时间在50ms以上时,其延迟音就清晰可辨,此时的处理效果才是回音。

回音处理一般都是用于产生简单的混响效果,延时、合唱、镶边、回音等效果的可调参数都差不多,具体有以下几项:

延时时间(Dly),即主延时电路的延时时间调整。

反馈增益(FBGain),即延时反馈的增益控制。

反馈高频比(HiRatio),即反馈回路上的高频衰减控制。

调制频率(Freq),指主延时的调频周期。

调制深度(Depth),指上述调频电路的调制深度。

高频增益(HF),指高频均衡控制。

预延时(IniDly),指主延时电路预延时时间调整。

均衡频率(EQF),这里的频率均衡用于音色调整,此为均衡的中点频率选择。

由于延时产生的效果都比较复杂多变,如果不是效果处理专家,建议使用设备提供的预置参数,因为这些预置参数给出的处理效果一般都比较好。

2.4时域分析

语音信号的时域分析就是分析和提取语音信号的时域参数。

进行语音分析时,最先接触到并且也是最直观的是它的时域波形。

语音信号本身就是时域信号,因而时域分析是最早使用,也是应用最广泛的一种分析方法,这种方法直接利用语音信号的时域波形。

时域分析通常用于最基本的参数分析及应用,如语音的分割、预处理、大分类等。

这种分析方法的特点是:

表示语音信号比较直观、物理意义明确。

实现起来比较简单、运算且少。

可以得到语音的一些重要的参数。

④只使用示波器等通用设备,使用较为简单等。

2.5频域分析

在MATLAB的信号处理工具箱中函数FFT和IFFT用于快速傅立叶变换和逆变换。

下面介绍这些函数:

(1)函数FFT用于序列快速傅立叶变换。

函数的一种调用格式为:

y=fft(x)

其中,x是序列,y是序列的FFT,x可以为一向量或矩阵,若x为一向量,y是x的FFT。

且和x相同长度。

若x为一矩阵,则y是对矩阵的每一列向量进行FFT,如果x长度是2的幂次方,函数fft执行高速基-2FFT算法;否则fft执行一种混合基的离散傅立叶变换算法,计算速度较慢。

(2)函数FFT的另一种调用格式为:

y=fft(x,N)

式中,x,y意义同前,N为正整数,函数执行N点的FFT。

若x为向量且长度小于N,则函数将x补零至长度N。

若向量x的长度大于N,则函数截短x使之长度为N。

若x为矩阵,按相同方法对x进行处理。

(3)经函数fft求得的序列y一般是复序列,通常要求其幅值和相位。

MATLAB提供求复数的幅值和相位函数:

abs,angle,这些函数一般和FFT同时使用函数abs(x)用于计算复向量x的幅值,函数angle(x)用于计算复向量的相角,以弧度表示。

函数unwrap(p)用于展开弧度相位角p。

(4)fftshift作用:

将零频点移到频谱的中,用法:

Y=fftshift(X)Y=fftshift(X,dim)

描述:

fftshift移动零频点到频谱中间,重新排列fft,fft2和fftn的输出结果。

将零频点放到频谱的中间对于观察傅立叶变换是有用的。

2.6离散傅立叶变换

在MATLAB的信号处理工具箱中函数FFT和IFFT用于快速傅立叶变换和逆变换。

下面介绍这些函数,函数FFT用于序列快速傅立叶变换,函数的一种调用格式为:

y=fft(x)(式4-1)

其中,x是序列,y是序列的FFT,x可以为一向量或矩阵,若x为一向量,y是x的FFT。

且和x相同长度。

若x为一矩阵,则y是对矩阵的每一列向量进行FFT。

如果x长度是2的幂次方,函数fft执行高速基-2FFT算法;否则fft执行一种混合基的离散傅立叶变换算法,计算速度较慢,函数FFT的另一种调用格式为:

   

y=fft(x,N)(式4-2)

式中,x,y意义同前,N为正整数,函数执行N点的FFT。

若x为向量且长度小于N,则函数将x补零至长度N。

若向量x的长度大于N,则函数截短x使之长度为N。

若x为矩阵,按相同方法对x进行处理,经函数fft求得的序列y一般是复序列,通常要求其幅值和相位。

MATLAB提供求复数的幅值和相位函数:

abs,angle,这些函数一般和FFT同时使用。

用MATLAB工具箱函数fft进行频谱分析时需注意:

(1)函数fft返回值y的数据结构对称性。

(2)频率计算。

(3)作FFT分析时,幅值大小与FFT选择点数有关,但不影响分析结果。

2.7滤波器设计

数字滤波器的作用是利用离散时间系统的特性对输入信号波形(或频谱)进行加工处理,或者说利用数字方法按预定的要求对信号进行变换,数字滤波器可以理解为是一个计算程序或算法,将代表输入信号的数字时间序列转化为代表输出信号的数字时间序列,并在转化过程中,使信号按预定的形式变化。

2.7.1特殊滤波器的系统函数:

单回声滤波器的系统函数:

H(z)=

<1(式4-3)

无限个回声滤波器的系统函数:

H(z)=

<1(式4-4)

多重回声滤波器的系统函数:

H(z)=

<1(式4-5)

全通结构的混响器的系统函数:

H(z)=

<1(式4-6)

2.7.2滤波函数filter

系统还是离散时间LTI系统,系统对输入信号的响应,实质上就是对输入信号从频域角度,无论是连续时间LTI的频谱进行不同选择处理的过程,这个过程称为滤波。

因此,在MATLAB的信息处理工具箱中,提供了一维滤波器函数filter和二维滤波器函数filter2。

函数filter的调用格式为:

y=filter(b,a,x)(式4-7)

该格式采用数字滤波器对数据进行滤波,既可以用于IIR滤波器,也可以用于FIR滤波器。

其中向量b和a分别表示系统函数的分子、分母多项式的系数,若a=1,此时表示FIR滤波器,否则就是IIR滤波器。

该函数是利用给出的向量b和a,对x中的数据进行滤波,结果放入向量y.

3声音的延时与混响仿真的方案设计

利用Windows下录音机或其他软件,录制一段语音信号,时间控制在1s左右

设计流程图:

对语音文件进行单回声滤波,多重回声滤波,无限个回声滤波,全通结构的混响,并画出滤波的频域响应图像。

对采样信号进行延时,再调整采样长度进行叠加得到混响。

并画出时域及频域波形

对语音文件进行采样,并画出时域及频域波形

利用Matlab读取语音文件

4运行结果与分析

4.1原始信号时域与频域波形图

图4-1原始信号时域和频域波形图

本次课程设计中,声音文件的获取可以通过Matlab软件得到。

 

4.2采样后语音信号时域与频域波形图

图4-2采样后时域和频域波形图

结果分析:

与时域波形结果吻合,由频谱可看出频率不集中,有一点高频分量,是由于噪声的干扰引起的。

4.3信号延时时域与频域波形图

图4-3信号延时时域与频域波形图

结果分析:

从原始信号和处理后的延时图可以看出,延时并没有真正意义上改变语音信号,只是把信号的时域推后了,频谱无变化。

4.4信号混响后时域与频域波形图

图4-4信号混响后时域与频域波形图

结果分析:

由运行结果可以看出,原始信号的延时声阵列非常密集、复杂,混响后时域波形音量增大了,各个脉冲变宽,语音信号的频谱展宽了,幅值增大,回放的语音声音变得融合,能听到回音。

4.5单回声滤波器波形图

图4-5单回声滤波器波形图

结果分析:

由运行结果可以看出,时域波形的幅值变大,毛刺变多,频谱的中心频率两边的频率分量展宽、幅值变大,回放的声音立体感变强。

4.6多重回声滤波器波形图

图4-6多重回声滤波器波形图

结果分析:

由运行结果可以看出,时域波形的幅值变大,毛刺变得更多,频谱的中心频率幅值变大,回放的声音立体感变的更强。

4.7无限回声滤波器波形图

图4-7无限回声滤波器波形图

结果分析:

由运行结果可以看出,时域波形的幅值变大,频谱的中心频率不变,中心频率两边的频率分量变得密集、幅值变小,回放的声音变得清晰,音量变大。

4.8全通滤波器波形图

结果分析:

由运行结果可以看出,时域波形和频谱基本不变,回放的声音跟原语音信号很接近。

 

5总结

通过本次课程设计,我对MATLAB软件有了较深的了解,并且学会了用MATLAB对语音信号进行分析和处理。

这次课程设计,刚开始我无从下手,不知所措,后来经过问同学、去图书馆资查料、上网查资料、看视频教程,逐渐了解了用MATLAB对语音信号进行分析和处理要用到的各种函数,及滤波器的设计及其频率响应的绘制,并在调试过程不断出错的过程中,不断加强了对MATLB编程的掌握程度,能够用MATLB对语音信号进行分析和处理,收获颇深。

本次课程设计锻炼了我独立解决问题的能力。

刚看到题目时我一点思路也没有,到后来,自己不断探索MATLB,不断摸索各个函数的使用方法和格式,最后完成了本次课程设计,整个过程让我学会了发现问题,并独立解决问题的方法,也能更好的利用网

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 自然科学 > 物理

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1