ImageVerifierCode 换一换
格式:DOCX , 页数:24 ,大小:906.99KB ,
资源ID:25178945      下载积分:3 金币
快捷下载
登录下载
邮箱/手机:
温馨提示:
快捷下载时,用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)。 如填写123,账号就是123,密码也是123。
特别说明:
请自助下载,系统不会自动发送文件的哦; 如果您已付费,想二次下载,请登录后访问:我的下载记录
支付方式: 支付宝    微信支付   
验证码:   换一换

加入VIP,免费下载
 

温馨提示:由于个人手机设置不同,如果发现不能下载,请复制以下地址【https://www.bdocx.com/down/25178945.html】到电脑端继续下载(重复下载不扣费)。

已注册用户请登录:
账号:
密码:
验证码:   换一换
  忘记密码?
三方登录: 微信登录   QQ登录  

下载须知

1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。
2: 试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。
3: 文件的所有权益归上传用户所有。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 本站仅提供交流平台,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

版权提示 | 免责声明

本文(wav信号的波形分析与合成.docx)为本站会员(b****7)主动上传,冰豆网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知冰豆网(发送邮件至service@bdocx.com或直接QQ联系客服),我们立即给予删除!

wav信号的波形分析与合成.docx

1、wav信号的波形分析与合成教学实验报告实验名称wav信号的波形分析与合成 指导教师 预习部分1.实验目的2.实验基本原理3.主要仪器设备(含必要的元器件、工具)一、 实验目的1.巩固傅里叶变换及其反变换的知识,学习从时域和频域两个角度来观察信号。2.尝试利用短时傅里叶变换分析非平稳信号的频谱变化。3. 熟悉 MATLAB环境中 wavread、wavrecord、wavplay、fft 和ifft 等函数的应 用。2.实验原理音频信号(Audio )是通过麦克风、A/D等数据采集设备将声音转换而成的电 信号,是声波频率、幅度变化的信息载体。声音的三个主观特性是音调、音强和 音色。而声波的三个重

2、要参数为频率 3 0、幅度A n和相位书n,这也就决定了音频信号的特征定义如下:1.基频与音调基频指一个复杂声波中最低的一个频率(其他频率叫谐波)。音调主要由声 音的频率决定,同时也与声音强度有关。对一定强度的纯音,音调随频率的升降 而升降;对一定频率的纯音、低频纯音的音调随声强增加而下降,高频纯音的音 调却随强度增加而上升。2谐波与音色谐波是指周期函数或周期性的波形中不能用常数与原函数基频的正弦函数和余弦函数的线性组合表达的部分。nO称为3 O的n次谐波分量,也称为(n-1)次泛音。音色是由混入基音的泛音所决定的,高次谐波越丰富,音色就越有明亮 感和穿透力。不同的谐波具有不同的幅值 An和相

3、位偏移书n,由此产生各种音 色效果。3.幅度与音强人耳对于声音细节的分辨只有在强度适中时才最灵敏。人的听觉响应与强度 成对数关系。常用音量来描述音强,以分贝(dB=20log )为单位。4.音宽与频带音频信号的频带宽度简称为音宽,它是描述组成复合信号的频率范围。 借助傅里叶变换,信号可以时间函数或频率函数两种形式描述,特别是周期 信号和准周期信号(前者由一个基频成分和若干谐波成分,后者虽可分解为几个 正弦分量,但它们的周期没有公倍数),从频率域可以很清楚地了解它们由哪些 正弦分量组成。而对于非平稳信号,最典型的例子就是语音信号,它是非周期的, 频谱随时间连续变化,因此由傅里叶变换得到的频谱无法

4、获知其在各个时刻的频 谱特性。最直观的想法就是用中心在某一时刻的时间窗截取一段信号,对其做傅 里叶变换,得到这一时刻的频谱;然后将窗在时间轴上移动,从而得到不同时刻 的频谱,这就是短时频谱的原理。最简单的窗就是矩形窗,即直接从原信号中截 取一段。三、 涉及的MATLAB函数1.wavread功能:读取Microsoft 的WAVE文件。基本调用格式:y, Fs, nbits = wavread() 载入以 命名的 WAVE文件。y为采样数据,Fs为WAVE文件被采样时所用的采样频率,nbits为用于描述 每个采样点的编码数据位数(常用的有 8bits和16bits )。其中 以单引号括起的字符

5、串方式输入。2.wavrecord功能:应用PC机上音频输入设备录制声音。基本调用格式:y = wavrecord(n,Fs) 对某音频信号以Fs Hz采样率连续录入n个采样点的 数据。其中Fs默认值为11025Hz3.wavplay功能:应用PC机上音频输出设备播放已录制的声音。基本调用格式:Wavplay(y,Fs)以Fs播放存入矢量y中的音频信号。Fs默认值仍为11025Hz 注:亦可参看sou nd函数。4. fft 功能:离散傅立叶变换函数。基本调用格式:丫 = fft(X,n) 对矢量X进行n点离散傅立叶变换,结果存入矢量 Y。计算时 所用算法为快速傅立叶变换(FFT)。如果X为普

6、通矩阵,那么返回为对此矩 阵进行逐列的FFT的结果。5.ifft功能:离散傅立叶反变换。基本调用格式:y = ifft(X,n) 返回对矢量X进行n点离散傅立叶反变换的结果。同样利用 FFT算法进行具体计算,若X为矩阵,返回结果为逐列离散傅立叶反变换的 丫矩阵。四、 实验内容本实验利用matlab提供的工具来采集和分析声音信号的频谱,由以下几个部分组成:1 声音的采集 Matlab提供了读入、录制和播放声音以及快速傅里叶变换的函数,分别是 wavread、wavrecord、wavplay和fft。阅读这几个函数的帮助文档,熟练使用。2.持续音的频谱分析将Windows的系统目录下的ding.

7、wav文件读入,这是一个双声道的声音, 选择任一声道的信号,使用fft求取其频谱,并用plot显示它的幅度谱, 观察主要的正弦分量; 参考代码:图形如下:1.1024 点 FFT40202. 1024 点 FFT用ifft 函数求取频谱的反傅里叶反变换,比较反变换后的信号波形与原始信号的波形;参考代码:%反变换,结果应与原始信号相同yr1024=real(ifft(YR1024);figure( numbertitle , off ,name , 1024 点fft 的反变换);subplot(2,1,1);plot(yr1024)title( 1024 点 fft 的反变换)subplot(

8、2,1,2);Plot(yr);title( 原信号);图形如下:从频谱中找到幅度最大的正弦分量,构造一个同样幅度的正弦信号,将 其波形与原始信号比较,并且试听一下。参考代码:%重构%寻找幅度最大的正弦分量maxpeak,peaki=max(abs(YR1024(1:512);MAXSIN=zeros(1,1024);MAXSIN(peaki)=maxpeak;MAXSIN(1026-peaki)=maxpeak;maxsi n=100*ifft(MAXSIN);figure( numbertitle , off , name, 用最大正弦分量重构信号 );subplot(2,1,1) plo

9、t(maxs in);title( 重构的信号);subplot(2,1,2);plot(yr1024);title( 原始信号);%试听wavplay(yr1024,fs); wavplay(maxsi n,fs);图形如下:20100-10-200.20.10-0.1-0.20 200 400 600 800 1000 12003.时变音的短时频谱分析使用” load chirp ”载入matlab 自带的一个时变音;参考代码:load chirp %y, Fs从信号中依次截取1024个点,利用上述方法求取其幅度谱,并显示出来, 观察幅度谱随时间的变化情况。参考代码:len=len gth

10、(y)for i=1:floor(le n/1024)seg=y(i-1)*1024+1:i*1024);figure( numbertitle , off , name , Frame ,num2str(i);plot(li nspace(-pi,pi,1024),fftshift(abs(fft(seg); end图形如下:实验操作部分1.实验数据、表格及数据处理2.实验操作过程(可用图表示)3.实验结论思考题:分别录制男生和女生发元音“ a”的声音,通过对音频文件的频谱分析对比 两者的差异,并进行合理的解释。1 通过以下程序录制男生女生声音%录制声音并播放 durati on = 2;f

11、s = 8192;nbits = 16;format = in t16;桌面mysound ; %录制之后的文件%录制两秒mic声音%将声音按fs频率nbits 写入mysound.wavwaveFile=路径,文件名为 mysou nd.wav y = wavrecord(duration*fs, fs, format); wavwrite(y, fs, n bits, waveFile);wavplay(y,fs); %播放(或者使用 sou nd (y,fs )2录制好的男生声音文件名为“ mysound.waV,女声声音文件名为“ nv.wav3.男生声音的分析代码如下:y,fs=wa

12、vread(mysou nd.wav)fs %fs=11025len g=le ngth(y) %le ng=22050% 声音的默认声道为左声道yr=y(:,1);%截取前1024个点yr=yr(1:1024);%求取幅度普并显示,首先是 fs=2048YR2048=fft(yr,2048);figure( numbertitle , off ,name , 2048subplot(2,1,1)plot(li nspace(-pi,pi,2048),abs(YR2048)title( FFT的幅频特性)subplot(2,1,2)plot(li nspace(-pi,pi,2048),fft

13、shift(abs(YR2048)title( FFT 后幅频特性的 fftshift )%fs=1024YR1024=fft(yr,1024);figure( numbertitle , off ,name , 1024subplot(2,1,1)plot(li nspace(-pi,pi,1024),abs(YR1024)title( FFT的幅频特性)subplot(2,1,2)plot(li nspace(-pi,pi,1024),fftshift(abs(YR1024) FFTSHIFTtitle( FFT 后幅频特性的 fftshift )图形如下:点 FFT);%FFT的幅频特性

14、%FFT的幅频特性FFTSHIFT点 FFT);%FFT的幅频特性%FFT的幅频特性的1 . 1024 点 FFTFFT后的幅频特性2. 2048 点FFTFFT后的幅频特性FFT后幅频特性的fftshift%反变换,结果应与原始信号相同yr1024=100*real(ifft(YR1024);figure( numbertitle , off , name , 1024 点fft 的反变换 );subplot(2,1,1);plot(yr1024)title( 1024 点 fft 的反变换)subplot(2,1,2);Plot(yr);title( 原信号);%重构寻找幅度最大的正弦分量

15、maxpeak,peaki=max(abs(YR1024(1:512);MAXSIN=zeros(1,1024);MAXSIN(peaki)=maxpeak;MAXSIN(1026-peaki)=maxpeak;maxsi n=100*ifft(MAXSIN);figure( numbertitle , off , name, 用最大正弦分量重构信号 );subplot(2,1,1)plot(maxs in);title( 重构的信号);subplot(2,1,2);plot(yr1024);title( 原始信号);%试听wavplay(yr1024,fs);wavplay(maxsi n,

16、fs);图形如下:重构的信号100500-500 200 400 600 800 1000 1200原始信号点 FFT);%FFT的幅频特性%FFT的幅频特性FFTSHIFT点 FFT);%FFT的幅频特性-100 010.50女生声音分析代码如下: y,fs=wavread( nv.wav)fs %22050len g=le ngth(y) %84480% 声音的默认声道为左声道yr=y(:,1);%截取前1024个点yr=yr(40000:41024);%求取幅度普并显示,首先是 fs=2048YR2048=fft(yr,2048);figure( numbertitle , off ,n

17、ame , 2048subplot(2,1,1)plot(li nspace(-pi,pi,2048),abs(YR2048)title( FFT的幅频特性) subplot(2,1,2)plot(li nspace(-pi,pi,2048),fftshift(abs(YR2048)title( FFT 后幅频特性的 fftshift )%fs=1024YR1024=fft(yr,1024);figure( numbertitle , off , name , 1024subplot(2,1,1)plot(li nspace(-pi,pi,1024),abs(YR1024)title( FFT

18、的幅频特性) subplot(2,1,2)plot(linspace(-pi,pi,1024),fftshift(abs(YR1024) %FFT 的幅频特性的FFTSHIFTtitle( FFT 后幅频特性的 fftshift )图形如下:1 . 1024 点 FFTFFT后 幅频特性 的fftshift2.2048 点 FFT%反变换,结果应与原始信号相同yr1024=100*real(ifft(YR1024);figure( numbertitle , off,name , 1024 点fft 的反变换);subplot(2,1,1);plot(yr1024)title( 1024 点

19、fft 的反变换)subplot(2,1,2);Plot(yr);title( 原信号);%重构寻找幅度最大的正弦分量maxpeak,peaki=max(abs(YR1024(1:512);MAXSIN=zeros(1,1024);MAXSIN(peaki)=maxpeak;MAXSIN(1026-peaki)=maxpeak;maxsi n=100*ifft(MAXSIN);figure( numbertitle , off , name, 用最大正弦分量重构信号 );subplot(2,1,1)plot(maxs in);title( 重构的信号);subplot(2,1,2);plot(

20、yr1024);title( 原始信号);%试听wavplay(yr1024,fs);wavplay(maxs in, fs);图形如下:-400100504020重构的信号0-20200400 600 8001000 1200-1000原始信号0-5020040060080010001200-100 010.5100501024点fft的反变换0-502004008006001000 1200原信号0-0.5200400600 800100001200实验分析:1.通常女声比男声听上去高,原因是女性的声带比较细。女声比男声的基频高,基频决定了你听到的声音的高低。通常男声基频在 50HZ到18

21、0HZ之间,女声基频在160HZ到 380HZ之间。人耳对声音最敏感的区域是 2000-5000H乙2.由男声女声频谱图可以看出,女声最大幅值时的频率比男声的高一些,男声 的频带宽度比女声的宽一些(由频谱图可以看出)。不过在图中能够明显看出: 男声的声音音强(幅度)明显比女声的低,所以女声听起来尖一些,而男声 低沉一些。三、 实验效果分析(包括仪器设备等使用效果)1 实验过程中,需要考虑到采集的声音样点是否有声音信号,因为有时候录制 声音时是从中间才开始有声音的。像女生的声音是取(40000:41024)这之间 的点才有“ a”的声音。2.在最后用wavplay ()听声音“ a”时,要注意几

22、点:首先要一个一个听才行,不能 wavplay(yr1024,fs);wavplay(maxsi n,fs); 两个一起,那样声音叠在一起,无法听清;其次,要在自己的采样频率下 Fs才能听到清晰的,如果用默认的11025HW失原始声音。3.运用matlab wavrecord()函数录制声音时要取好 FS,在人能听到的范围内, FS越大声音效果越好,越接近原始声音。4.在逆变换后的声音信号通常比较小,如果想听到比较大的声音可以增加幅度 (即能量)。5.如果想再最后听到比较长的原始声音,可以在一开始,从离散的声音信号中 选取多一些点(如:10240个点),在恢复时就能听到比较长的“ a”。四、 教师评语指导教师

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1