混响 声学特性.docx
《混响 声学特性.docx》由会员分享,可在线阅读,更多相关《混响 声学特性.docx(13页珍藏版)》请在冰豆网上搜索。
混响声学特性
(reverberation)混响时间的长短是音乐厅、剧院、礼堂等建筑物的重要声学特性。
声波遇到障碍会反射,所以我们这个世界充满了混响。
混响的要求
声波在室内传播时,要被墙壁、天花板、地板等障碍物反射,每反射一次都要被障碍物吸收一些。
这样,当声源停止发声后,声波在室内要经过多次反射和吸收,最后才消失,我们就感觉到声源停止发声后还有若干个声波混合持续一段时间。
这种现象叫做混响,这段时间叫做混响时间。
对讲演厅来说,混响时间不能太长.我们平时讲话,每秒钟大约发出2~3个单字,假定发出两个单字“物理”,设想混响时间是3秒,那么,在发出“物”字的声音之后,虽然声强逐渐减弱,但还要持续一段时间(3秒),在发出“理”字的声音的时刻,“物”字的声强还相当大。
因而两个单字的声音混在一起,什么也听不清楚了。
但是,混响时间也不能太短,太短则响度不够,也听不清楚。
因此需要选择一个最佳混响时间.北京科学会堂有一个学术报告厅,混响时间为1秒。
不同用途的厅堂,最佳混响时间也不相同,一般来说,音乐厅和剧场的最佳混响时间比讲演厅要长些,而且因情况不同而不同。
轻音乐要求节奏鲜明,混响时间要短些,交响乐的混响时间可以长些。
难于听懂的剧种如昆曲之类,混响时间一长,就更难于听懂.节奏较慢而偏于抒情的剧种,混响时间则可以长些。
总之,要有一定的、恰当的混响时间,才能把演奏和演唱的感情色彩表现出来,收到应有的艺术效果。
北京“首都剧场”的混响时间,坐满观众时为1.36秒,空的时候是3.3秒。
这是因为满座时,吸收声音的物体多了,所以混响时间缩短,上面所说的最佳混响时间是指满座时的混响时间。
高级的音乐厅或剧场,为了满足不同的要求,需要人工调节混响时间.其中一种办法是改变厅堂的吸声情况。
在厅堂内安装一组可以转动的圆柱体,柱面的一半是反射面,反射强、吸收少;另一半是吸声面,反射弱、吸收多.把反射面转到厅堂的内表面,混响时间就变长;反之,把吸收面转到厅堂的内表面,混响时间就变短。
高水平的音乐会都不使用扩音设备,为的是使听众直接听到舞台上的声音.为了让全场听众都能听到较强的声音,音乐厅的天花板上挂着许多反射板,这些反射板的大小、形状、安放位置和角度都经过精确设计,以便把舞台上的声音反射到音乐厅的各个角落。
处理好不同建筑物的声响效果,取得好的音质,这是一门很重要的学问,叫做建筑声学。
上面介绍的混响只是其中的一个方面,希望能引起同学们对声学的兴趣,钻研这门与我们生活关系密切的科学。
录音中的混响
真实世界中的混响
在这个世界中,是否存在没有混响的地方呢?
有!
你坐上飞机,飞到一万米高空,然后往下跳,这时你大喊大叫,就是没有混响的,因为你在空中,周围没有任何障碍物,你的声音将会无限扩散出去而不会被反射回来。
所以就没有混响。
另一个没有混响的地方就是声学实验室。
声学实验室的墙壁、天花板、地面是经过特殊处理的,声音到达墙壁后将会被墙壁吸收而不会被反射回来。
为什么会被吸收?
你可以做一个小实验,找100根针,就是缝衣服的针,把它们捆在一起,弄齐,然后你可以看看这一捆针的针头面,你会发现它是黑的,因为光线到达这一面后,经过多次反射,一直射到里面去,出不来,所以就没有光被反射出来,就好像光都被吸收了一样。
声学实验室的布置也是类似于此,把声音吸收。
录音棚是半个声学实验室,能做到吸收大部份的混响。
录音棚的墙壁排列都是不规则的,表面是用松软的棉制品构成,虽然比不上那捆针头,但声音到达墙壁后进入那乱糟糟的棉花里,七反射八反射就留在棉花里出不去了,所以录音棚里的混响也很小。
在一个房间里大吼一声,会有多少反射声,答案是无数。
在这个房间里,你拍一下巴掌,得到的声音是另一个样子
是不是很多?
这其实是比较简单的一个反射过程。
如果这个房间里再摆上一些桌子椅子,反射会更加复杂。
闭上眼睛,大吼一声,你就可以知道你大概处在一个什么样的环境中,在外面,还是在家里。
甚至你在家里大吼一声,就可以知道你在哪个房间里,在这个房间的哪个位置上。
这是因为各个房间由于空间大小不一样、家具的摆放不同、墙壁的材料不同,所以具有各自不同的混响特征;同一个房间里不同的位置上,由于你距离墙壁的远近不同,所以也具有不同的混响特征。
你熟悉这些特征,所以你就能光凭声音就能分辨你在什么位置上。
一个看起来很菜鸟的问题:
为什么录音和混音要加混响?
为什么录音和混音要加混响?
答:
因为录音时是没有混响的。
为什么录音时是没有混响的?
答:
因为录音棚是无混响的。
为什么录音棚是无混响的?
其实专业的录音棚是有混响的,他们有很多板状的材料,可以灵活把房间改造成各种混响特征。
但随着数字录音技术的飞速发展,数字混响效果器能够模拟真实情况下的混响,所以大家就干脆把录音棚弄成无混响的,录完音后再用效果器来模拟混响效果,想要什么混响就有什么混响……这就是为什么录音棚,尤其是中小录音棚和个人工作室,都做成无混响的原因。
人造混响原理
在这样一个房间里,教师的声音经过多次反射,假如有5条声音反射线到达学生耳朵,
以上只列举出了5条声音反射路线,实际上是几千几万条到无数条。
为了讲解方便,我们就说这5条。
教师每讲一句话,学生实际上就听到了6句:
第一句是直接传到了学生的耳朵里,没有经过反射,后面5句是经过各种反射线路到达学生耳朵的声音。
这6句话时间隔得非常近,图中声音到达有时间表,注意时间单位是毫秒(1毫秒等于0.001秒)。
由于这些反射声到达的时间间隔太近了,所以学生就听不出来是6句话,而是1句带有混响感觉的话。
学生听到的声音是这6个声音的叠加。
这只是为了讲解方便,真实情况是几千几万个声音的叠加。
混响效果器就是这样工作,把声音进行很多很多次的重复叠加,就得到了混响效果。
有了这样一个东西,以后计算起来就方便了,无论教师说什么话,只要把教师的声音,进行某种计算,就可以得到6个声音叠加的效果。
那么,这个“某种”计算,到底是什么计算呢?
在数学中这个叫做“卷积”计算,英文是“convolution”,就是把教师的声音,根据上面那张6个脉冲的图,进行叠加计算。
这种计算是不分先后的,你既可以认为是把教师的声音,根据那个脉冲图(声波),进行叠加计算;也可以认为是把那个脉冲声波,根据教师的声音(把教师的声音考虑成由无数个脉冲组成的声波),进行叠加计算。
这个脉冲图,也就是这个含有6个脉冲的声波,就是这个房间的从教师讲台到学生座位的混响特征。
在声学上,由于这个混响特征是由脉冲得到的,所以就很形象把它称作“脉冲反应”——impulseresponse,简称IR。
混响效果器的工作原理,就是拿源声音,与impulseresponse做卷积计算。
上面的那个具有6个脉冲的IR,在现实中是不可能有的。
现实中的IR往往具有几百、几千、几万个脉冲。
由于各种类型的房间的IR都有一些共同的特点,因此声学上又作了一些规定。
首先规定IR的第一个脉冲叫做“直达声”,因为这个脉冲是未经过反射的直接从声音源到达人耳的声音;
其次规定IR的后面几条明显的脉冲叫做“早期反射”earlyreflections,这几个声音都是声音源经过一次或者两三次反射后到达人耳的,由于反射次数少,声音线路不长,所以具有较强的能量和较短的延迟。
最后规定IR的后面无数条脉冲叫做“迟反射”latereflections,这些声音都是声音源经过无数次反射后才到达人耳,反射次数多,声音线路长,所以具有较弱的能量和较长的延迟。
但是它们数量极多,有如滔滔江水连绵不绝。
效果器里的IR
上一节说道,混响效果器就是用IR与声音源进行卷积计算。
那么,有人就会问了,混响效果器里有IR吗?
每个效果器的IR都是一样的吗?
这个IR是放在哪里的?
以什么形式存在?
如果不一样,这些IR是怎么得来的?
前面说了,混响就是IR与声音源进行卷积计算,所以混响效果器里当然就有IR。
众所周知,不同的效果器的混响效果是不同的,所以IR肯定不一样。
IR放在哪里?
以什么形式存在?
这些IR是怎么得来的?
下面要具体说说了。
混响效果器,象合成器一样分为三种类型:
采样混响、“算法”混响、模拟合成混响。
(一)采样IR混响
Sony,Yamaha都出过采样混响,价格不菲。
软件的采样混响效果器有著名的SonicFoundry的AcousticMirror,还有Samplitude的RoomSimulator。
采样混响的IR,全部是真实采样得来wave文件。
可以存放于任何存储器,例如硬盘、光盘、软盘等等。
Sony,Yamaha的硬件采样混响器,里面也带有容量较大的存储器。
采样混响的IR都是录音采样得来,最简单的获取IR的方式是:
在下图中教师的位置放置一个音箱,学生的位置放置一个话筒。
音箱播放一个脉冲,话筒进行录音。
录到的声音就是IR,也就是这个房间的从讲台到学生座位的混响特征曲线。
Sony、Samplitude等所采用的具体方式是:
在想要获得混响特征的地方,例如下面这个著名的音乐厅,舞台上安置音箱(当然会是极好的音箱),座位席中安置立体声话筒(极好的话筒)。
然后播放一系列测试信号,这些信号以脉冲为主,各种速度的全频段正弦波连续扫描为辅,录得声音,然后经过一些计算得到IR。
用这种采样方法得到的IR,极为真实。
采样混响的IR,不但厂家可以预置给你,你自己也可以根据厂家提供的工具进行制作。
因此从数量上来说是无限的。
采样混响还可以对其他任何混响效果器的效果进行完全复制。
混响特征和各种参数
为了研究的方便,声学上把混响分为几个部份,规定了一些习惯用语。
混响的第一个声音也就是直达声(Directsound),也就是源声音,在效果器里叫做dryout(干声输出),随后的几个明显的相隔比较开的声音叫做“早期反射声”(Earlyreflectedsounds),它们都是只经过几次反射就到达了的声音,声音比较大,比较明显,它们特别能够反映空间中的源声音、耳朵及墙壁之间的距离关系。
后面的一堆连绵不绝的声音叫做reverberation。
大多数的混响效果器会有一些参数选项给你调节,接下来讲讲这些参数具体是什么意思。
(一)衰减时间(Decaytime)
也就是整个混响的总长度。
不同的环境会有不同的长度,有以下几个特点:
空间越大,decay越长,反之越短。
空间越空旷,decay越长,反之越短。
空间中家具或别的物体(比如柱子之类)越少,decay越长;反之越短。
空间表面越光滑平整,decay越长,反之越短。
因此,大厅的混响比办公室的混响长;无家具的房间的混响比有家具的房间长;荒山山谷的混响比森林山谷的混响长;水泥墙壁的空间的混响比布制墙壁的空间的混响长……
一般很多人喜欢把混响时间设得很长。
其实真正的一些剧院、音乐厅的混响时间并没有我们想象得那么长。
例如波士顿音乐厅的混响时间是1.8秒,纽约卡内基音乐厅是1.7秒,维也纳音乐厅是2.05秒。
这里给一个混响时间计算公式,大家可以用来算算某房间的混响时间打开页面
(二)前反射的延迟时间(Predelay)
就是直达声与前反射声的时间距离。
有以下几个特点:
空间越大,Predelay越长;反之越短空间越宽广,Predelay越长;反之越短
因此,大厅的Predelay比办公室的长;而隧道的空间虽然大,但是它很窄,所以Predelay就很短。
想要表现很宽大空旷的空间,就把Predelay设大一点。
(三)wetout
也就是混响效果声的大小。
有以下几个特点:
wetout与空间大小无关,而只与空间内杂物的多少以及墙壁及物体的材质有关墙壁及室内物体的表面材质越松软,wetout越小;反之越大空间内物体越多,wetout越小;反之越大墙壁越不光滑,wetout越小,反之越大墙壁上越多坑坑凹凹,wetout越小,反之越大
因此,挤满了人的车厢的混响就比空车要小得多;放满了家具的房间的混响就比空房间要小;有地毯的房间的混响比无地毯的小;森林山谷的混响比荒山山谷的混响要小
(四)高低频截止(lowcut/highcut)
这个参数在有些效果器里是以EQ的形式来表现的,例如Waves的RVerb。
这项内容实际上跟现实情况没有太直接的联系,它只是为了我们做混响处理时声音好听而设计的。
不过它也能表现高频声音在传播中损失比较厉害的现象。
后面我们有具体的解释。
一般在做处理的时候,为了混响声的清晰和温暖,都会把低频和高频去掉一部份。
只有在表现一些诸如“宇宙声”等科幻环境时,才把高低频保留。
另外有些效果器也把这个叫做“color”(色彩)。
例如TC的效果器就是color。
color也就是“冷”和“暖”的感觉,高频就是冷,低频就是暖。
所以这些效果器用颜色来表示高低频截止,暖色(红)表示混响声偏向低频,冷色(蓝)表示混响声偏向高频。
上面给大家看的Waves的RVerb的EQ,它分别用橙色和蓝绿色来做那两个点,也是出于此目的。
补充:
高低频截止实际上在现实中是不存在的,现实中的普遍现象是:
低频声音的混响无论是声音大小还是衰减时间,都要比高频声音大。
这是因为不同频率的声音由于波长不同,因此绕过障碍的能力不同,高频声音波长短,不容易绕过障碍,低频声音波长长,容易绕过障碍。
加上它们在空气中传播时的衰弱程度不同(频率越高越容易衰弱),被墙壁吸收的程度不同(频率越高越容易损失),所以不同频率的声音的混响时间和大小是不相同的。
在真实世界中,在大多数中小空间里,越低的声音具有越长的混响时间,越高的声音具有越短的混响时间,而不可能做到反过来。
如何做到降低低频混响是任何一个录音棚头疼的难题。
唯独有一种情况,是低频混响小于高频混响的,那就是很大的空间,并且里面布满了由硬质材料制成的障碍和表面,比如采用硬塑料凳子和水泥墙壁地板的室内体育馆。
我们从某音乐厅的真实IR的频谱中可以很清楚地看到这个规律。
因此,有的混响效果器还会有不同频率的声音的衰弱程度的设置项目。
但是也有很多效果器却没有这项内容。
(五)不同频率的不同衰弱程度(Damp)
接着上面说。
这个项目在有些混响效果器里没有提供。
另外在采样混响器里也基本上不提供这个项目,因为采样混响的不同频率的不同衰减程度的特性已经包含在IR里面了。
例如WavesRVerb提供了这个项目。
另外有的效果器只有一个参数设置,就是“damp”或者“damping”,就是让高频更快地衰减。
8zoUw$iF一般来说混响中的高频是很容易大幅度衰减的。
空间越大,空间内物体越多,物体和墙壁表面越不光滑,高频的衰减就越厉害。
只有在中小空间中,并且空间表面比较光滑的情况下,高频的衰减才与低频接近。
但我们做音乐混音的时候,有时为了声音的好听,也并不一定要遵循高频更容易衰弱的自然规律。
(六)不同频率的不同的混响时间
有的效果器也提供了不同的衰减时间给你调节,英文是High-frequencydecayandlow-frequencydecay,或者别的叫法,例如UltrafunkReverb就可以设置不同的衰减时间。
这个特性与前面的damp基本一致。
一般来说混响中的高频的持续时间肯定比低频要短。
空间越大,空间内物体越多,物体和墙壁表面越不光滑,高频的持续时间就短,与低频的差距就越大。
只有在中小空间中,并且空间表面比较光滑的情况下,高频的时间才与低频接近。
以上的三个与频率有关的参数,并不是所有的效果器都提供,有的全部提供,有的提供了其中两个甚至一个。
如果没有全部提供的话,你可以用其他参数之一来代替没有提供的参数,因为它们之间的特性比较接近。
(七)散射度(diffusion)
传统上是叫做Earlyreflectionsdiffusion(早反射的散射度)。
我们知道早反射就是一组比较明显的反射声。
这些反射声的相互接近程度,就是diffusion。
墙壁越不光滑(例如铺上了地毯的),声音的散射度就越大,反射声越多,相互之间越接近,混响是连声一片的,声音很温和;墙壁越光滑(例如玻璃),声音的散射度就越小,反射声越少,相互之间隔得越开,混响声听起来就比较接近回声了,声音很清晰。
因此,对于一些延音类的声音,比如organ,合成弦乐,可以使用较小的diffusion,声音就比较漂亮清楚;对于脉冲类的声音,比如打击乐、木琴等,可以使用较大的diffusion,混响就比较smooth。
有些效果器里也有diffusion这个参数,但是具体的定义不太一样。
在某些效果器里,diffusion是指反射声的无规律程度,空间的形状越不规则(例如山洞、教堂里),墙壁越不光滑,反射声音的出现越没有规律,diffusion越大;空间的形状越规则(例如无家具的住宅、空的教室),墙壁越光滑,反射声的出现越有规律,diffusion越小。
(八)混响密度(Reverbdensity)
这个参数的意思跟diffusion差不多,只是针对早反射之后的混响部份的。
很多效果器并不提供density,而是用diffusion来控制整个混响。
(九)空间大小(Roomsize)
这个应该很好理解,空间可以体现出声场的宽度和纵深度。
不过不同的效果器在这个上面会有不同的算法。
另外,采样混响器不会提供这个参数,因为空间大小已经体现在IR中了。
(十)早反射音量(Earlyreflectionslevel)
也就是早反射的声音大小。
很多效果器可以让你独立调节早反射和后面的混响的声音大小。
(十一)立体声宽度(Width)
有的混响效果器有这样的参数,如果把这个值设大,那么效果器会做手脚使IR的左右差异变得很大,立体声感觉就出来了。
混响时间的定义
在室内声音达到稳定状态后,室内平均声压级从声源停止发声到衰减60dB所用的时间,用T60表示。
T60=0.163V/αS,S为房间内总表面积,V为房间总容量,α为房间内表面的平均吸收系数。
该变量描述了信号混响声场衰减的速度。
它受房间大小、形状、反射面类型等因素的影响,且实际房间中的混响时间随着信号频率的变化而变化:
频率越高,被墙壁、障碍物和家具吸收的声能就越大
Q:
哪些因素会对混响声产生影响。
A:
空气(air)、 空气湿度(Humidity) 空气温度(Temperature)、 反射(Reflections)、吸收(Absorption )衍射(Diffraction)
1.众所周知,声音在空气中传播会消耗能量和高频损失,所以空气是影响混响的一个重要因素
2.空气湿度会影响空气密度,空气密度会影响声音的传播的速度和能量的损失。
3.空气温度的不同也会对声音的频率产生一定程度的影响。
4.声音撞击到障碍物后,不会停止传播。
声音会被反射面以不同的角度反射,在经过多个反射之后,声音能量会受到很大程度的削弱,这导致我们听不出声音的位置,到最后,我们听到的各种反射声就有了不同的时间差和相位差。
5.声音在遇到障碍物之后,一部分被反射,另外一部分被障碍物吸收。
声能被吸收了多少决定了反射声能持续多久。
吸收得越多decaytime越短,反之越长。
6.声音虽然会被吸收和反射,但是波长较长的声波会绕射过障碍物,这就类似于我们在迪斯科外面听到的那种声音感觉。
总谐波
指音频信号源通过功率放大器的时候,由于非线性元件所引起的输出信号比输入信号多出的额外谐波成分。
谐波失真是由于系统不是完全线性造成的,我们用新增加总谐波成份的均方根与原来信号有效值的百分比来表示。
例如,一个放大器在输出10V的1000Hz时又加上Lv的2000Hz,这时就有10%的二次谐波失真。
所有附加谐波电平之和称为总谐波失真。
一般说来,1000Hz频率处的总谐波失真最小,因此不少产品均以该频率的失真作为它的指标。
但总谐波失真与频率有关,因此美国联邦贸易委员会于1974年规定,总谐波失真必须在20~20000Hz的全音频范围内测出,而且放大器的最大功率必须在负载为8欧扬声器、总谐波失真小于1%条件下测定。
国际电工委员会规定的总谐波失真的最低要求为:
前级放大器为0.5%,合并放大器小于等于0.7%,但实际上都可做到0.1%以下:
FM立体声调谐器小于等于1.5%,实际上可做到0.5%以下;激光唱机更可做到0.01%以下。
响度描述的是声音的响亮程度,表示人耳对声音的主观感受
,其计量单位是宋,定义1kHz,声压级为40dB纯音的响度为1宋。
大多数人对信号声级突变3dB以下时是感觉不出来的,因此对音响系统常以3dB作为允许的频率响应曲线变化范围。
人耳对声音的感觉,不仅和声压有关,还和频率有关。
声压级相同,频率不同的声音,听起来响亮程度也不同。
如空压机与电锯,同是100分贝声压级的噪声.听起来电锯声要响得多。
按人耳对声音的感觉特性,依据声压和频率定出人对声音的主观音响感觉量,称为响度级,单位为方。
以频率为1000赫兹的纯音作为基准音,其他频率的声音听起来与基准音一样响,该声音的响度级就等于基准音的声压级,即响度级与声压级是一个概念。
例如,某噪声的频率为100赫兹,强度为50分贝,其响度与频率为1000赫兹,强度为20分贝的声音响度相同,则该噪声的响度级为20方。
人耳对于高频噪声是1000~5000赫兹的声音敏感,对低频声音不敏感。
例如,同是是40方的响度级,对1000赫兹声音来说,声压级是40分贝;4000赫兹的声音,声压级是37分贝;100赫兹的声音,声压级52分贝;30赫兹的声音,声压级是78分贝。
也就是说,低频的80分贝的声音,听起来和高频的37分贝的声音感觉是一样的。
但是声压级在80分贝以上时,各个频率的声压级与响度级的数值就比较接近了,这表明当声压级较高时,人耳对各个频率的声音的感觉基本是一样的。
响度是和听感相关的量,与振幅/声压和频率相关,以1kHz为基准值;
分贝是一个单位,非常广泛,不仅用于声学,多用于衡量各种信号的强度、增益等;
声学上衡量一个单频声音的大小一般用声压级,能“听到”与否取决于响度。
即使没有其他声源体的作用,空气粒子总是在做无规则的震荡,或者说它们总是在骚动,它们激发起微弱的“白噪声”。
绝对静寂的大气空间是不存在的。
所谓背景噪声还包括自然界或人类生活环境里许多声源体杂乱的声音,对于言语交际来说它们没有信息价值。
居室四壁或陡峭的山坡还有回声效应,噪声被放大、被增强了。
言语声和它的滞后的回声叠加在一起,变成复杂的回响声。
电声仪器设备里也都有白噪声。
那种没有通信价值的噪声很强烈的时候人们会心烦意乱。
有意思的是,在噪声极小的消声室待久了,人会感到不安宁。