用于麦克风阵列的球面谐波分解.docx
《用于麦克风阵列的球面谐波分解.docx》由会员分享,可在线阅读,更多相关《用于麦克风阵列的球面谐波分解.docx(7页珍藏版)》请在冰豆网上搜索。
用于麦克风阵列的球面谐波分解
用于麦克风阵列的球面谐波分解
摘要:
随着麦克风阵列在室内声场分析、声场再现、语音通信中的广泛应用,球面谐波分解在阵列信号处理中的地位变得更加重要。
针对球面阵列的球面谐波分解是近年发展起来的波束形成新技术,它还可以扩展到线阵和环形阵等其它阵形中。
从球面傅里叶变换着手,在球面谐波域内对不同条件下波束形成算法的原理、性能及其在阵列信号处理中可能的应用进行了全面的综述。
关键词:
麦克风阵列;球面谐波;波束形成;波达方向估计
0引言
球面谐波是波动方程在球坐标系下的解中关于角度的函数,它是球面傅里叶变换的基函数,不同阶次的谐波之间相互正交。
球面谐波分解在麦克风阵列处理中的应用是基于入射声场的传播与散射,由傅里叶声学原理[1]提出的,这类方法也称为球面谐波域阵列处理。
基于球面谐波分解的波束形成就是首先通过球面傅里叶变换将入射信号的声压变换到球面谐波域内,然后对各阶次的谐波进行加权求和得到整个阵列的输出。
Meyer和Elko[2]通过对声场进行球面谐波分解,得到一种简单、灵活、有效的波束形成器结构,输出波束的形状并不会随着方向的改变而变化。
Abhayapala和Ward[3]将类似的阵列应用到高阶声场录音和重构中。
Abhayapala[4]还将3D球面阵的分解方法扩展到环形阵中,进一步扩展了球面谐波在不同阵形中的应用范围。
随着研究的深入,学者们对球面谐波的提取及球面谐波域波束形成进行了更详细的阐述,提出了许多有效的算法。
Rafely[5]曾针对远场窄带情况对球面阵的采样和波束形成进行了总结。
本文结合新近出现的算法,从球面谐波的分解原理和提取方法出发,按照空间域波束形成的分类方法[6],对球面远场窄带波束形成进行分类,并总结了针对近场源和宽带信号提出的新算法。
同时也对比分析了球面谐波域中不同阵形波束形成算法的原理和性能,及其在麦克风阵列信号处理中的可能应用,以方便那些从事麦克风阵列应用研究的读者。
1基础理论
球面傅里叶变换是整个算法的基础,它实现了信号从阵元域到球面谐波域的变换,在实际工程应用中,通常利用采样的离散变换来代替连续的变换。
本部分将对球面傅里叶变换和空间采样的规则进行介绍。
1.1球面傅里叶变换
1.2空间采样
此外,Vicente[9]提出了两种新的采样方法,将阵元分布在不同的圆环上,每个环可以构成一个子阵,并将圆环按照纬度排列。
在保证满足奈奎斯特定理的前提下,增加阵元之间的距离,从而减少阵元的数目。
新的方法能够保持较高的方向性和波束响应的对称性。
2球面阵波束形成
2.1远场窄带波束形成
根据VanVeen和Buckly对传统波束形成的分类方法[6],我们将球面阵远场窄带波束形成也分为三大类:
固定波束形成、统计最优波束形成和多约束的最优波束形成。
2.1.1固定波束形成
2.1.2统计最优波束形成
在球面谐波域内,统计最优波束形成与空间域类似,权值依赖于阵列接收数据的统计特性。
其实,阵列的输出不仅可以表示成球面谐波域的采样结果,也可以直接在空间域中表示,具有类似的表达形式。
如式(6)所示。
因此,可以将空间域中的统计最优算法扩展到球面谐波域中使用,例如,MVDR、LCMV、GSC等经典算法,并且在球面谐波域中可以减少运算量,提高运行效率[10]。
2.1.3多约束最优波束形成
多约束最优波束形成是指在保证期望波束的同时,可以对其它方向的信号或者相关的性能指标进行约束,最后得到一个最优化的权值,达到对波束进行优化的目的。
Li和Duraswami[11]、Meyer和Elko[12]提出了权值优化的球面波束形成算法,引入白噪声增益作为性能约束条件,权值w是整个优化过程的结果,在一定条件下是最优的。
Rafely[13]提出了能够同时在空间域和球面谐波域中实现的多零陷算法,针对非对称的普通波束,在保证期望波束的同时可以对多个方向的干扰进行抑制,增强期望信号,并应用到室内脉冲响应的测量中。
ShefengYan[17]将二阶锥化与波束形成相结合,在球面谐波域内将多约束的最优算法看成是凸优化的二阶锥化过程,权值和输出的波束是对多项性能指标优化后得到的最优结果。
例如,鲁棒的最小旁瓣算法[14],在保证期望方向的响应和主瓣宽度的同时,使得旁瓣的峰值最小。
最优的模态波束形成[15],它将多个性能参数约束考虑到一个优化过程中,试图从这些相关的参数中得到有效的最优解。
与前面提到的算法不同的是,它可以动态地对干扰进行抑制,可以应用到语音增强和去混响中。
此外,该思想也可以应用到多波束形成算法[16]中,可以同时对多个期望的波束进行约束。
2.2远场宽带波束形成
球面阵的远场宽带波束形成,也可以分为频域和时域两类进行实现。
结合频域的算法,先将宽带信号经过DFT变成窄带信号,然后在球面谐波域内计算各个频率的权值。
同样,基于FIR滤波器的时域算法也可以扩展到球面谐波域内,ShefengYan[17]提出了一种在时域内实现球面谐波域宽带波束形成的算法,将权值的获取看成是滤波器设计,并带有多约束的最优化过程,得到的权值是多个指标优化后的最优解。
在算法实现流程中,借鉴Meyer和Elko[18]的球面波束形成时域处理方法,将球面谐波的实部与虚部分开作为球面傅里叶变换的基,在球面谐波域内得到实数信号,最后经过FIR波束合成模块得到波束响应。
该算法有着比空间域宽带处理更小的计算量。
此外,V.Tourbabin[19]提出的实权值波束形成算法可以看作是FIR实现的一种特例,只需要一组滤波器系数即可,它指出刚性球更适合用此类算法,并将算法性能和复权值算法进行比对。
2.3近场波束形成
上述算法都是基于远场假设的,但在实际应用,例如,手提电话中信源到阵元的距离变小,远场平面波的假设将不再成立,因为在波束响应中信号的相位和幅度可能会出现误差。
Meyer和Elko[20]提出了近距离通话麦克风阵,它基于对近场源声场的球面谐波正交分解,并通过不同模态间的比值估计出信源的距离,加上角度估计可以对信源进行定位。
Fisher和Rafely[21]也已经用阵列的阶数,信号频率和位置等参数定义了近场准则,并对波束响应随径向距离变化的情况进行了研究。
最近,Fisher和Rafely[22,23]又将径向滤波器应用到实际的近场球面阵和实际语音信号中,在控制波束响应方向性能的基础上,试图提高阵列的径向性能。
常用的滤波器有径向契比雪夫、径向V型滤波器等,分析它们的设计方法和性能,结果表明它们可以提高对不同距离干扰的抑制能力,具有不同的距离分辨力。
3线阵和环形阵波束形成
在进行球面谐波分解时,通常将球面阵作为第一选择,但是它要求阵元的位置必须严格正交,这会限制阵列形状的灵活性。
Kennedy和Abhayapala[24,25]课题组对球面谐波在线阵波束形成中的应用进行了研究。
他们根据z轴上线阵波束的轴对称性,简化了波动方程的球面谐波解,并论证了近场和远场波束响应的等价性。
通过径向变换、径向互惠关系等将近场宽带响应变换到远场中,利用成熟的远场算法设计相应的波束。
Meyer和Elko[26]试图用环形阵去提取球面谐波,利用了x-y平面内的环形阵和原点处的一个阵元,这种阵列结构对于高度不变的2D声场分析比较有效,不能完全提取出3D场的全部谐波。
Abhayapala[4]提出更适用于3D声场分解的阵列结构,阵列由一组互相平行的环形阵组成。
在进行球面谐波分解的时候,根据波动方程、勒让德函数和球面贝塞尔函数的性质,将环形阵分为位于x-y平面的、平行于x-y平面的,并在z轴上放置相应数目的阵元,最后将该混合结构应用到远场宽带波束形成中。
4DOA估计
球面谐波域内的高精度DOA估计主要针对用球面麦克风阵列观测相干和/或宽带源的情况。
Teutsch[27]提出了球面阵子空间DOA估计的算法,思想类似于阵元域中的算法。
接着,Teutsch[28]将球面谐波分解后得到的子波束应用到多个宽带信号源的检测和定位中,在定位过程中用到球面Esprit算法。
Goossens和Rogier[29]对上述的球面Esprit算法进行改进,它可以对方位角和俯仰角自动配对,并进行二维DOA估计,即使在相干情况下,它的运算量更低性能也更好。
SunHaohai[30]等指出球面子空间Esprit算法在现实应用中存在的关键问题,例如,相干源和多个信源的定位问题等,并结合频率平滑、方向矢量扩展等技术来提高算法的性能,利用Eigenmike麦克风阵列进行测试。
Khaykin[31]在利用球面阵对相干源进行DOA估计时,在频域将频率平滑和MUSIC算法结合,并在实际环境中得到了比波束形成更好的性能。
LiXuan[32]等利用球面阵阵元的正交性,提出了球面MUSIC算法,与传统MUSIC、波束空间MUSIC以及很多改进算法相比,该算法有更好的估计精度。
SunHaohai[33]将子波束MVDR算法用到宽带相干源的定位和提取中,在较精确地估计出DOA之后,通过计算TDOA可以确定信号的空间位置。
Mabande和SunHaohai[34,35]等人在室内环境中利用Eigenmike麦克风阵列,对基于子空间和基于波束形成的DOA估计算法的性能进行比对,包括子空间MUSIC,子空间ESPRIT和MVDR等算法,主要测试了不同算法对室内反射体的定位性能。
5结语
本文对球面谐波分解在麦克风阵列信号处理中的应用进行了系统的描述,内容涵盖球面谐波的获取、球面阵的空间采样等理论基础,以及波束的分类和权值的设计等核心部分。
在此基础上,将球面阵远场窄带波束形成分为三大类:
固定波束形成、统计最优波束形成和多约束最优波束形成,并归纳整理了新近提出的处理近场和/或宽带源的方法。
此外,还指出了在非球面阵中应用球面谐波分解时,对不同阵形的约束条件,总结了球面谐波分解在宽带相干源高精度DOA估计中的应用现状。
参考文献:
[1]WILLIAMSEG.Fourieracoustics:
soundradiationandnearfieldacousticalholography[M].Cambridge:
AcademicPress,1999.
[2]MEYERJ,ELKOG.Ahighlyscalablesphericalmicrophonearraybasedonanorthonormaldecompositionofthesoundfield[C].IEEEInternationalConferenceonAcoustics,Speech,andSignalProcessing(ICASSP),2002.
[3]ABHAYAPALATD,WARDDB.Theoryanddesignofhighordersoundfieldmicrophonesusingsphericalmicrophonearray[C].IEEEInternationalConferenceonAcoustics,Speech,andSignalProcessing(ICASSP),2002.
[4]ABHAYAPALATD,GUPTAA.Sphericalharmonicanalysisofwavefieldsusingmultiplecircularsensorarrays[J].IEEETransactionsonAudio,Speech,andLanguageProcessin,2010(6).[5]RAFAELYB.Spatialsamplingandbeamformingforsphericalmicrophonearrays[C].Hands-FreeSpeechCommunicationandMicrophoneArrays(HSCMA),2008.
[6]VANVEENBD,BUCKLEYKM.Beamforming:
Aversatileapproachtospatialfiltering[J].IEEEASSPMagazine,1988
(2).
[7]RAFAELYB,WEISSB,BACHMATE.Spatialaliasinginsphericalmicrophonearrays[J].IEEETransactionsonSignalProcessing,2007(3).
[8]RAFAELYB.Analysisanddesignofsphericalmicrophonearrays[J].IEEETransactionsonSpeechandAudioProcessing,2005
(1).
[9]VICENTELM.Adaptivearraysignalprocessingusingtheconcentricringarrayandthesphericalarray[D].UniversityofMissouri,2009.
[10]BRAFAELY,YPELED,MAGMON,etal.Sphericalmicrophonearraybeamforming[C].SpeechProcessinginModernCommunication:
ChallengesandPerspectives.Berlin,Germany:
Springer,2010.
[11]LIZHIYUN,DURAISWAMIR.Flexibleandoptimaldesignofsphericalmicrophonearraysforbeamforming[J].IEEETransactionsonAudio,Speech,andLanguageProcessing,2007
(2).
[12]MEYERJ,ELKOGW.Sphericalmicrophonearraysfor3Dsoundrecording[M].AudioSignalProcessingforNext-GenerationMultimediaCommunicationSystem.Boston:
KluwerAcademicPublishers,2004.
[13]RAFAELYB.Sphericalmicrophonearraywithmultiplenullsforanalysisofdirectionalroomimpulseresponses[C].IEEEInternationalConferenceonAcoustics,SpeechandSignalProcessing(ICASSP),2008.
[14]SUNHAOHAI,YANSHEFENG,PETERSVENSSONU.Robustminimumsidelobebeamformingforsphericalmicrophonearrays[J].IEEETransactionsonAudio,Speech,andLanguageProcessing,2011(4).
[15]YANSHEFENG,SUNHAOHAI,PETERSVENSSONU,etal.Optimalmodalbeamformingforsphericalmicrophonearrays[J].IEEETransactionsonAudio,Speech,andLanguageProcessing,2011
(2).
[16]SUNHAOHAI,YANSHEFENG,PETERSVENSSONU.Robustsphericalmicrophonearraybeamformingwithmulti-beam-multi-nullsteering,andsidelobecontrol[C].IEEEWorkshoponApplicationsofSignalProcessingtoAudioandAcoustics(WASPAA),2009.
[17]YANSHEFENG,SUNHAOHAI,MAXIAOCHUAN,etal.Time-domainimplementationofbroadbandbeamformerinsphericalharmonicsdomain[J].IEEETransactionsonAudio,Speech,andLanguageProcessing,2011(5).
[18]ELKOGW,KUBLIRA,MEYERJ.Audiosystembasedonatleastsecond-ordereigenbeam[P].UnitedStatesPatentWO03/061336A1,Jul,2003.[19]TOURBABINV,AGMONM,RAFAELYB.Optimalreal-weightedbeamformingwithapplicationtolinearandsphericalarrays[J].IEEETransactionsonAudio,Speech,andLanguageProcessing,2012(9).
[20]MEYERJ,ELKOGW.Positionindependentclose-talkingmicrophone[J].SignalProcessing,2006(6).
[21]FISHERE,RAFAELYB.Thenearfieldsphericalmicrophonearray[C].IEEEInternationalConferenceonAcoustics,SpeechandSignalProcessing(ICASSP),2008.
[22]FISHERE,RAFAELYB.Near-fieldsphericalmicrophonearrayforspeech[C].2ndInternationalSymposiumonAmbisonicsandSphericalAcoustics,2010.
[23]FISHERE,RAFAELYB.Near-fieldsphericalmicrophonearrayprocessingwithradialfiltering[J].IEEETransactionsonAudio,Speech,andLanguageProcessing,2011
(2).
[24]KENNEDYRA,ABHAYAPALATD,WARDDB.Broadbandnearfieldbeamformingusingaradialbeampatterntransformation[J].IEEETransactionsonSignalProcessing,1998(8).
[25]KENNEDYRA,WARDDB,ABHAYAPALATD.Nearfieldbeamformingusingradialreciprocity[J].IEEETransactionsonSignalProcessing,1999
(1).
[26]MEYERJ,ELKOG.Sphericalharmonicmodalbeamformingforanaugmentedcircularmicrophonearray[C].IEEEInternationalConferenceonAcoustics,SpeechandSignalProcessing(ICASSP),2008.
[27]TEUTSCHH.Modalarraysignalprocessing:
principlesandapplicationsofacousticwavefielddecomposition[M].Berlin:
Springer-Verlag,2007.
[28]TEUTSCHH,KELLERMANNW.Detectionandlocalizationofmultiplewidebandacousticsourcesbasedonwavefielddecompositionusingsphericalapertures[C]IEEEInternationalConferenceonAcoustics,SpeechandSignalProcessing(ICASSP),2008.
[29]GOOSSENSR,ROGIERH.Unitarysphericalesprit:
2Dangleestimationwithsphericalarraysforscalarfields[J].IETSignalProcessing,2009(3).
[30]SUNHAOHAI,TEUTSCHH,MABANDEE,etal.RobustlocalizationofmultiplesourcesinreverberantenvironmentsusingEB-ESPRITwithsphericalmicrophonearrays[C].IEEEInternationalConferenceonAcoustics,SpeechandSignalProcessing(ICASSP),2011.
[31]KHAYKIND,RAFAELYB.Coherentsignalsdirection-of-arrivalestimationusingasphericalmicrophonearray:
frequencysmoothingapproach[C].IEEEWorkshoponApplicationsofSignalProcessingtoAudioandAcoustics(WASPAA),2009.
[32]LIXUAN,YANSHEFENG,MAXIAOCHUAN,etal.Sphericalharmonicsmusicversusconventionalmusic[J].AppliedAcoustics,2011(9).
[33]SUNHAOHAI,MABANDEE,KOWALCZYKK,etal.JointDOAandTDOAestimationfor3DlocalizationofreflectivesurfacesusingeigenbeamMVDRa