孫思雨,張海劍,孫 洪
(武漢大學(xué) 電子信息學(xué)院,湖北 武漢 430072)
聲矢量傳感器(Acoustic Vector Sensor,AVS)是一種由2~3個(gè)正交的方向傳感器和一個(gè)全向麥克風(fēng)組成的陣列,方向傳感器用來(lái)測(cè)量沿正交軸的粒子速度,全向麥克風(fēng)用來(lái)測(cè)量該點(diǎn)的聲壓[1-3]。AVS中的各傳感器元件十分靠近,故可假定它們被放置在空間中的同一點(diǎn)上,從而使得AVS具有頻率無(wú)關(guān)的特性。利用AVS所提供的豐富聲學(xué)信息以及其頻率無(wú)關(guān)的特性,AVS在陣列信號(hào)處理方面優(yōu)于傳統(tǒng)的傳感器陣列。此外,由于具有體積小、質(zhì)量輕等特點(diǎn),AVS在聲學(xué)研究領(lǐng)域也受到不斷關(guān)注,并且在一些新興行業(yè)中得到實(shí)際應(yīng)用,如目標(biāo)跟蹤[4-6]、水聲通信[7]和聲源定位[8]等。
波達(dá)方向(Direction of Arrival,DOA)估計(jì)是一個(gè)備受關(guān)注的研究熱點(diǎn)[9-13],隨著AVS在陣列信號(hào)處理領(lǐng)域的興起,一些基于AVS的DOA估計(jì)方法也紛沓而至。一種常用的方法是將基于傳統(tǒng)壓力傳感器陣列的DOA估計(jì)方法擴(kuò)展到AVS陣列,如波束形成[14-18]、多重信號(hào)分類(Multiple Signal Classification,MUSIC)[19]、旋轉(zhuǎn)不變參數(shù)估計(jì)(Estimation of Signal Parameters via Rotational Invariance Technique,ESPRIT)[20]以及基于稀疏表示的方法[21]。此外,利用AVS特有的陣列結(jié)構(gòu),過(guò)去三十年中許多學(xué)者提出了適用于AVS的聲源測(cè)向算法。Nehorai等[22]提出了一種基于強(qiáng)度矢量和速度協(xié)方差矩陣的方法,用單個(gè)AVS處理DOA估計(jì)問(wèn)題,這是AVS應(yīng)用在DOA估計(jì)中的開創(chuàng)性工作。此外,Levin等[23]還在其中推導(dǎo)了均方角誤差的克拉美羅下界用來(lái)評(píng)估DOA估計(jì)的性能。文獻(xiàn)[24]中提出了基于單個(gè)AVS的最大導(dǎo)向響應(yīng)能量估計(jì)器,根據(jù)最大功率方向來(lái)估計(jì)DOA,該方法是基于強(qiáng)度矢量和速度協(xié)方差矩陣的擴(kuò)展,能夠利用合適的參數(shù)來(lái)接近克拉美勞下界。然而,上述工作主要是為單源測(cè)向而設(shè)計(jì)的,不適用于多源存在的欠定情況。
上述策略大多是在時(shí)域內(nèi)處理觀測(cè)信號(hào),而不是充分利用時(shí)頻特征,僅利用信號(hào)的時(shí)域統(tǒng)計(jì)信息,難以處理源數(shù)超過(guò)麥克風(fēng)數(shù)目的欠定情況。隨著時(shí)頻分析在信號(hào)處理領(lǐng)域的興起[25-26],時(shí)頻稀疏性理論逐漸應(yīng)用于基于AVS的多源DOA估計(jì)中。通過(guò)檢測(cè)單個(gè)源占主導(dǎo)的時(shí)頻點(diǎn),并利用這些時(shí)頻點(diǎn)進(jìn)行DOA估計(jì),多源DOA估計(jì)任務(wù)可以轉(zhuǎn)換為多個(gè)單源DOA估計(jì)任務(wù)[8]。
準(zhǔn)確估計(jì)DOA的關(guān)鍵在于正確檢測(cè)出具有特定特性的有利于測(cè)向的時(shí)頻點(diǎn)。文獻(xiàn)[27]中提出了一種基于傳感器間數(shù)據(jù)比(Inner-Sensor Data Ratio,ISDR)的方法,通過(guò)提取局域信噪比(Signal to Noise Ratio,SNR)較高的時(shí)頻點(diǎn)來(lái)實(shí)現(xiàn)多源DOA估計(jì)[28]?;贗SDR的方法在自由場(chǎng)假設(shè)的前提下取得了較好DOA估計(jì)性能,但隨著混響的增加,反射信號(hào)會(huì)破壞ISDR,從而導(dǎo)致該方法整體性能下降。為提高在混響環(huán)境下的DOA估計(jì)性能,一般選擇受混響干擾較少的時(shí)頻點(diǎn)從而實(shí)現(xiàn)精確DOA估計(jì)。文獻(xiàn)[29]中提出了一種基于低混響單源點(diǎn)(Low-Reverberant-Single-Source Point,LRSSP)的方法,利用單個(gè)AVS在混響環(huán)境中實(shí)現(xiàn)多源DOA估計(jì),其中LRSSP指代時(shí)頻域中受混響干擾較小的單源時(shí)頻點(diǎn)。針對(duì)AVS特有的頻率無(wú)關(guān)特性,該方法利用每個(gè)LRSSP的實(shí)部和虛部具有相似方向向量的特點(diǎn),用來(lái)在時(shí)頻域中檢測(cè)LRSSP。盡管基于LRSSP方法具有較好性能且易于實(shí)現(xiàn),但隨著混響增加,該方法不可避免地會(huì)檢測(cè)到一些包含錯(cuò)誤方向信息的非LRSSP從而導(dǎo)致性能下降。
為解決上述估計(jì)問(wèn)題,進(jìn)一步提高強(qiáng)混響情況下DOA估計(jì)的準(zhǔn)確性和魯棒性,本文提出了一種有效的方法用來(lái)檢測(cè)直達(dá)聲單源點(diǎn)(Direct-Path-Single-Source Point,DP-SSP),指代由單個(gè)實(shí)際源信號(hào)而非反射源所占主導(dǎo)的時(shí)頻點(diǎn)。DP-SSP中包含了相關(guān)源的正確方向信息,能防止估計(jì)的方向與真實(shí)DOA產(chǎn)生較大偏差。本文受文獻(xiàn)[30]直接路徑優(yōu)勢(shì)(Direct Path Dominance,DPD)測(cè)試的啟發(fā),提出的DP-SSP檢測(cè)技術(shù)首先使用頻率平滑來(lái)減輕反射信號(hào)的影響,然后利用子空間投影技術(shù)來(lái)進(jìn)一步提取DP-SSP并消除干擾項(xiàng)。檢測(cè)出的DP-SSP隨后被用來(lái)進(jìn)行源數(shù)目估計(jì)和聚類。最后將MUSIC方法用于每一類DP-SSP點(diǎn)簇中用來(lái)計(jì)算該點(diǎn)簇對(duì)應(yīng)源的DOA。下文將詳細(xì)介紹本文所提出的基于頻率平滑和子空間分解的DP-SSP檢測(cè)方法。
假設(shè)一個(gè)密閉混響室內(nèi)中存在M個(gè)聲源和一個(gè)由3個(gè)方向傳感器和一個(gè)全向麥克風(fēng)組成的AVS陣列,該AVS陣列接收到的混合信號(hào)經(jīng)過(guò)短時(shí)傅里葉變換(Short-Time Fourier Transform,STFT),得到時(shí)頻域信號(hào)可表示為:
(1)
式中:t和f表示分別表示時(shí)間軸和頻率軸索引,X(t,f)=[Xp(t,f),Xvx(t,f),Xvy(t,f),Xvz(t,f)]T中包含了AVS四個(gè)通道信號(hào)的STFT系數(shù),Xp(t,f)、Xvx(t,f)、Xvy(t,f)、Xvz(t,f)分別表示全向麥克風(fēng)和3個(gè)方向麥克風(fēng)的輸出,Hq(f)表示第q個(gè)源到AVS之間的聲傳輸函數(shù),Sq(t,f)表示第q個(gè)源的STFT系數(shù),N(t,f)表示噪聲的STFT系數(shù)。
由于混響環(huán)境下的觀測(cè)信號(hào)一般由直接路徑聲和反射聲組成,因此第q個(gè)源到AVS之間的聲傳輸函數(shù)可以寫為:
(2)
圖1 信號(hào)反射模型Fig.1 Signal reflection model
這里Iq表示強(qiáng)反射信號(hào)等效產(chǎn)生的虛擬鏡像源的個(gè)數(shù),ai(f)表示第i個(gè)源到AVS之間的聲傳遞函數(shù),Ψi=(θi,φi)表示第i個(gè)源的DOA,則基于AVS的陣列流形第i個(gè)源的導(dǎo)向矢量可以表示為[24]:
d(Ψi)=[1,cosφicosθi,sinφicosθi,sinθi]T,
(3)
以AVS所處位置為笛卡爾坐標(biāo)系原點(diǎn),φi∈[0°,360°)和θi∈(-90°,90°]分別表示第i個(gè)源到原點(diǎn)的方位角和仰角。
基于上述分析,本文的鏡像模型可以等效為一個(gè)不含混響的遠(yuǎn)場(chǎng)模型:
(4)
式中:J表示實(shí)際源和虛擬源總數(shù),其中包含Q個(gè)實(shí)際源和J-Q個(gè)由強(qiáng)反射產(chǎn)生的虛擬鏡像源,E(t,f)表示建模誤差,包含弱混響或者低能量的干擾源點(diǎn)。因此,在混響環(huán)境下的信號(hào)模型可以近似轉(zhuǎn)化為自由空間中存在J個(gè)源的遠(yuǎn)場(chǎng)模型。在低混響情況下,J的值與Q接近。
根據(jù)式(4)中描述的信號(hào)模型,可以將時(shí)頻點(diǎn)分為DP-SSP、強(qiáng)反射單源點(diǎn)(Strong Reflection Single Source Point,SR-SSP)以及多源時(shí)頻點(diǎn)(Multi-Source Point,MSP)。DP-SSP是一種能量由一個(gè)實(shí)際源的直接路徑信號(hào)占主導(dǎo),受其他信號(hào)源和混響影響較少的時(shí)頻點(diǎn)。SR-SSP表示由強(qiáng)早期反射信號(hào)等效的鏡像源占主導(dǎo)的時(shí)頻點(diǎn),強(qiáng)早期反射信號(hào)通常指第一次反射的信號(hào)。MSP表示由多個(gè)能量值較大的源占主導(dǎo)的時(shí)頻點(diǎn),其中包含實(shí)際源和虛擬鏡像源。由于SR-SSP和MSP會(huì)對(duì)最終的DOA估計(jì)結(jié)果產(chǎn)生不利影響,算法設(shè)計(jì)時(shí)需要考慮去除這類離群值。
從理論上來(lái)說(shuō),少量的DP-SSP已經(jīng)足以獲得準(zhǔn)確的DOA估計(jì)。然而DP-SSP的檢測(cè)通常會(huì)伴隨著一系列的干擾時(shí)頻點(diǎn),這些時(shí)頻點(diǎn)在檢測(cè)過(guò)程中不可避免地會(huì)被錯(cuò)誤識(shí)別成DP-SSP。因此,為了精確估計(jì)DOA,顯然希望正確的DP-SSP點(diǎn)在所有檢測(cè)出的時(shí)頻點(diǎn)中占比越高越好。文獻(xiàn)[29]提出了基于LRSSP的方法,致力于利用AVS接收到的信號(hào)存在的獨(dú)特?cái)?shù)學(xué)特性來(lái)設(shè)計(jì)算法提取DP-SSP,從而獲得準(zhǔn)確的源測(cè)向結(jié)果。然而隨著混響增加,大量滿足LRSSP檢測(cè)規(guī)則的異常值被錯(cuò)誤檢測(cè)為DP-SSP,最終導(dǎo)致真實(shí)的DP-SSP在所有檢測(cè)出的時(shí)頻點(diǎn)中占比下降,進(jìn)而對(duì)最終DOA估計(jì)造成影響。
為了分析基于LRSSP[29]的方法在高混響條件下識(shí)別DP-SSP的性能,給出了每個(gè)檢測(cè)到的LRSSP點(diǎn)的強(qiáng)度向量分布,并計(jì)算其中真實(shí)DP-SSP的占比。檢測(cè)到的LRSSP的強(qiáng)度向量計(jì)算方法如下[29]:
(5)
(6)
式中:{·}*表示共軛操作,uq表示第q個(gè)源的單位方向向量,當(dāng)強(qiáng)度向量η(t,f)近似與一個(gè)源的單位方向向量平行時(shí),則其對(duì)應(yīng)的時(shí)頻點(diǎn)(t,f)被認(rèn)為是該源的一個(gè)DP-SSP點(diǎn),其判別規(guī)則可以表示為:
(7)
(8)
式中:Card(·)表示一個(gè)集合中元素的數(shù)量,集合Ωd中包含了所有符合檢測(cè)規(guī)則的時(shí)頻點(diǎn),Ωd中所有滿足式(7)中的時(shí)頻點(diǎn)包含在集合ΩrD中。在本文中,實(shí)際DP-SSP占比P被用來(lái)作為評(píng)估DP-SSP檢測(cè)性能的一個(gè)標(biāo)準(zhǔn)。
本文實(shí)現(xiàn)一個(gè)簡(jiǎn)單的仿真來(lái)輔助說(shuō)明上述分析,對(duì)比結(jié)果展示在圖2中,不同顏色的圓圈表示對(duì)應(yīng)于不同源的真實(shí)DP-SSP。仿真房間大小為8 m×6 m×4 m,AVS被放置在房間中心,3個(gè)聲源來(lái)自于TIMIT數(shù)據(jù)集[32],均被放置于離聲矢量傳感器1.5 m處,3個(gè)源的DOA分別為(50°,0°)、(110°,15°)和(170°,30°)。
(a)基于LRSSP的方法(RT60=0.3 s)
(b)基于LRSSP的方法(RT60=0.6 s)圖2 檢測(cè)到的時(shí)頻點(diǎn)與真實(shí)DP-SSP點(diǎn)對(duì)應(yīng)的強(qiáng)度矢量分布圖(SNR=20 dB)。Fig.2 The intensity vector distribution of the detected time-frequency points and real DP-SSP (SNR=20 dB)
從圖2中可以明顯看到,檢測(cè)到的LRSSP中僅有一小部分是對(duì)DOA估計(jì)有利的真實(shí)DP-SSP點(diǎn)。通過(guò)對(duì)比圖2(a)和圖2(b)可以發(fā)現(xiàn),隨著混響的增加,強(qiáng)度向量分布的方向特征變得不明顯,且實(shí)際DP-SSP的比例逐步下降。盡管基于LRSSP[29]的方法會(huì)對(duì)檢測(cè)到的時(shí)頻點(diǎn)做進(jìn)一步的離群值去除使強(qiáng)度矢量分布具有更加明顯的方向性,但是這僅適用于低混響的情況。隨著混響的增加,大量出現(xiàn)的離群值會(huì)使得每個(gè)源對(duì)應(yīng)的強(qiáng)度矢量簇中心與真實(shí)的方向向量發(fā)生偏移,進(jìn)而在進(jìn)行離群值去除時(shí)導(dǎo)致大量有利于DOA估計(jì)的時(shí)頻點(diǎn)被去除,從而影響最終DOA估計(jì)的精度。為解決上述實(shí)際DP-SSP占比較低的問(wèn)題,本文提出了一種有效的DP-SSP檢測(cè)方法,通過(guò)準(zhǔn)確檢測(cè)DP-SSP并消除離群值,來(lái)提升有利DP-SSP的整體占比。
基于上述分析可以得到,在高混響環(huán)境下,DP-SSP的檢測(cè)對(duì)DOA估計(jì)來(lái)說(shuō)是至關(guān)重要的,因?yàn)镈P-SSP中包含了對(duì)應(yīng)源的關(guān)鍵方向信息。隨著混響的增強(qiáng),DP-SSP的檢測(cè)變得越來(lái)越有挑戰(zhàn)。本文提出了一種有效的兩階段策略來(lái)檢測(cè)有用的DP-SSP并去除干擾時(shí)頻點(diǎn),在第一階段應(yīng)用頻率平滑技術(shù)來(lái)盡可能去除潛在的早期反射強(qiáng)源點(diǎn)SR-SSP,在第二階段應(yīng)用子空間投影進(jìn)一步有效去除多源點(diǎn)MSP并提取DP-SSP。
2.2.1 采用頻率平滑消除SR-SSP
早期反射信號(hào)被認(rèn)為是對(duì)直達(dá)聲信號(hào)做延遲和衰減。隨著混響增強(qiáng),早期反射信號(hào)的能量逐漸增加變得不可忽略,因此第一次反射的信號(hào)通常被建模為一個(gè)與實(shí)際源信號(hào)高度相關(guān)的虛擬鏡像源發(fā)出的信號(hào)。SR-SSP指代那些由虛擬源占主導(dǎo)的時(shí)頻點(diǎn)。為了減少SR-SSP對(duì)最終DOA估計(jì)的影響,首先對(duì)所有的時(shí)頻點(diǎn)做一次頻率平滑以消除潛在的SR-SSP點(diǎn),并粗略提取不受混響干擾的DP-SSP[33]。
受DPD測(cè)試[30]的啟發(fā),本文對(duì)分別對(duì)語(yǔ)譜圖在時(shí)間和頻率軸上平滑取平均,構(gòu)建局部時(shí)頻相關(guān)矩陣:
(9)
式中:Jt和Jf分別表示滑動(dòng)窗口的尺寸大小。鑒于AVS的頻率無(wú)關(guān)特性,導(dǎo)向矢量在頻率平滑的過(guò)程中不會(huì)受到影響,因此上述時(shí)頻相關(guān)矩陣可表示為:
(10)
(11)
(12)
式中:σi(t,f),i=1,2,…,J表示矩陣σi(t,f),i=1,2,…,J的一個(gè)特征值。如果第i個(gè)源在該時(shí)頻區(qū)域內(nèi)不活躍,則其對(duì)應(yīng)的特征值將接近于0。將式(12)帶入式(10)得到:
σJ(t,f)d(ΨJ)Td(ΨJ)。
(13)
(14)
因此,潛在DP-SSP的檢測(cè)規(guī)則可以寫為:
(15)
式中:σmax和σsubmax分別表示最大和第二大的特征值。
通過(guò)頻率平滑和特征值分解操作去除了潛在的SR-SSP,減輕了混響的影響。由于上述操作是一個(gè)“區(qū)域級(jí)”的操作,會(huì)不可避免地檢測(cè)到許多非DP-SSP點(diǎn),比如多源點(diǎn)MSP,因此本文將第一階段檢測(cè)得到的點(diǎn)重新定義為低混響自項(xiàng)源點(diǎn)(Low Reverberant Auto Source Points,LR-ASP)。所有滿足式(15)中檢測(cè)規(guī)則的時(shí)頻點(diǎn)被包含在集合ΩA中。為了進(jìn)一步精確提取DP-SSP,將在下一小節(jié)對(duì)第一階段檢測(cè)到的LR-ASP進(jìn)行“點(diǎn)級(jí)”的處理。
2.2.2 采用子控件分解消除MSP
由于集合ΘA中的LR-ASP主要包含DP-SSP和MSP,因此需要對(duì)LR-ASP進(jìn)行提純,在“點(diǎn)”級(jí)別上提取DP-SSP點(diǎn)。首先利用信號(hào)時(shí)頻稀疏性,對(duì)每個(gè)LR-ASP做如下假設(shè):在每個(gè)LR-ASP出現(xiàn)的強(qiáng)能量源點(diǎn)不超過(guò)2個(gè)。這個(gè)假設(shè)在大多數(shù)情況下是可行的,因?yàn)樯婕?個(gè)或更多高能量源的時(shí)頻點(diǎn)數(shù)量太少可忽略不計(jì)。
因此,每個(gè)LR-ASP可以寫作:
(16)
式中:q1,q2∈{1,2,…,Q}表示出現(xiàn)在該時(shí)頻點(diǎn)上的2個(gè)源的序號(hào)。當(dāng)2個(gè)源之間能量值比值大于一個(gè)遠(yuǎn)大于1的閾值時(shí),能量值高的源被認(rèn)為主導(dǎo)該時(shí)頻點(diǎn),可以被看作是對(duì)應(yīng)源的一個(gè)DP-SSP點(diǎn),該閾值一般為經(jīng)驗(yàn)選取。計(jì)算并歸一化每個(gè)時(shí)頻點(diǎn)對(duì)應(yīng)的空間向量可得:
Cq1(t,f)d(Ψq1)+Cq2(t,f)d(Ψq2),
(17)
(18)
然而,當(dāng)LR-ASP是一個(gè)由2個(gè)源占主導(dǎo)的MSP,上述條件將不會(huì)被滿足。接著對(duì)所有的歸一化空間向量進(jìn)行k-means聚類,得到N簇向量,每個(gè)簇心對(duì)應(yīng)的向量構(gòu)成了一個(gè)過(guò)完備導(dǎo)向矢量字典。由于歸一化空間向量是一個(gè)方向向量,對(duì)應(yīng)的是與單個(gè)源相關(guān)的DP-SSP或者與多個(gè)源相關(guān)的MSP,因此將N設(shè)置為一個(gè)大于Q的值。每個(gè)簇心對(duì)應(yīng)的方向向量計(jì)算為:
(19)
(20)
根據(jù)前述假設(shè),每個(gè)LR-ASP上活躍的源信號(hào)不超過(guò)2個(gè),則在時(shí)頻點(diǎn)(t,f)上最可能出現(xiàn)的2個(gè)源的STFT系數(shù)可以計(jì)算為:
(21)
式中:[·]?表示Moore-Penrose偽逆操作符,aq1、aq2表示2個(gè)源對(duì)應(yīng)的導(dǎo)向矢量。在字典ΘA中搜索,找到最優(yōu)的2個(gè)導(dǎo)向矢量aq1、aq2,滿足下式:
(22)
(23)
A2=[ar1ar2],
(24)
式中:P表示矩陣A2噪聲子空間上的正交投影矩陣,ar1和ar2分別表示從字典ΘA中隨機(jī)挑選的2個(gè)列向量,I表示單位矩陣,(·)-1表示求逆操作。
2個(gè)源的STFT系數(shù)可由式(21)計(jì)算得到。通過(guò)計(jì)算2個(gè)源之間的能量比,并設(shè)定閾值,即可挑選出一組DP-SSP點(diǎn):
(25)
式中:λ2為一個(gè)經(jīng)驗(yàn)閾值。所有滿足上述不等式的LR-ASP點(diǎn)都被認(rèn)為是DP-SSP點(diǎn),包含在集合ΩD中。通過(guò)對(duì)集合ΩA中的所有LR-ASP點(diǎn)進(jìn)行子空間分解,可以有效去除2個(gè)強(qiáng)能量源占主導(dǎo)的多源點(diǎn)MSP。
為了驗(yàn)證所提的DP-SSP檢測(cè)方法的有效性,首先在對(duì)基于LRSSP[29]的方法應(yīng)用頻率平滑,去除潛在的SR-SSP點(diǎn)。結(jié)合LRSSP[29]檢測(cè)和SR-SSP去除后得到的時(shí)頻點(diǎn)強(qiáng)度矢量分布如圖3所示。雖然最后檢測(cè)到的DP-SSP分布的方向性仍不明顯,但與原始基于LRSSP[29]檢測(cè)的方法相比,真實(shí)DP-SSP所占比例有明顯提高。本文所提的兩階段DP-SSP檢測(cè)方法檢測(cè)到的DP-SSP強(qiáng)度矢量分布如圖3(b)所示,其分布具有明顯的方向性。雖仍然存在一些方向向量偏離真實(shí)DOA的較為分散的離群點(diǎn),但總體強(qiáng)度矢量的分布非常接近真實(shí)源方向。此外,采用所提出的DP-SSP檢測(cè)方法,相比基于LRSSP[29]的方法,真實(shí)DP-SSP占比大大提高,有力地說(shuō)明了該方法在檢測(cè)DP-SSP上的優(yōu)越性。
(a)LRSSP檢測(cè)+SR-SSP去除 (RT60=0.6 s)
(b)本文所提DP-SSP檢測(cè)算法 (RT60=0.6 s)圖3 2種檢測(cè)規(guī)則檢測(cè)到的時(shí)頻點(diǎn)與真實(shí)DP-SSP點(diǎn)對(duì)應(yīng)的強(qiáng)度矢量分布圖(SNR=20 dB)Fig.3 The intensity vector distribution of the detected time-frequency points and real DP-SSP using different detection rules (SNR=20 dB)
隨后利用平滑直方圖[29]方法對(duì)檢測(cè)到到DP-SSP進(jìn)行源數(shù)估計(jì),然后根據(jù)估計(jì)出的源數(shù)目將所有檢測(cè)到的DP-SSP聚類為多組。最后對(duì)每組DP-SSP利用MUSIC方法進(jìn)行DOA估計(jì),整合每組DOA估計(jì)結(jié)果得到最終多源DOA估計(jì)結(jié)果。
給出了一系列實(shí)驗(yàn)結(jié)果用來(lái)評(píng)估所提算法在仿真環(huán)境中的DP-SSP檢測(cè)、源數(shù)估計(jì)以及DOA估計(jì)3個(gè)方面的性能,并與基于LRSSP[29]的方法進(jìn)行了比較。為了突出所提兩階段DP-SSP方法每一步的有效性,本文還將SR-SSP去除與LRSSP[29]檢測(cè)結(jié)合作為另外一種對(duì)比方法,用來(lái)評(píng)估DP-SSP的檢測(cè)性能。
仿真混響室內(nèi)為一個(gè)理想的封閉長(zhǎng)方體,尺寸為8 m×6 m×4 m,AVS被放置在房間中心。采用鏡像原理[31]生成混響室內(nèi)的房間脈沖響應(yīng),聲源被放置在以AVS為圓心,半徑1.5 m的圓上。聲源從TIMIT語(yǔ)料庫(kù)[32]中挑選,采樣率為16 kHz。麥克風(fēng)接收到的信號(hào)進(jìn)行STFT變換,FFT點(diǎn)數(shù)為1 024,幀間重疊為50%。加性噪聲為高斯白噪聲,其他實(shí)驗(yàn)參數(shù)設(shè)置如表1所示,表1中的閾值均為經(jīng)驗(yàn)選取。
表1 參數(shù)設(shè)置Tab.1 Parameter settings
與文獻(xiàn)[29]類似,本文采用均方角誤差(Root-Mean-Square Angular Error,RMSAE)作為評(píng)估指標(biāo)來(lái)量化所提方法在所有實(shí)驗(yàn)中的整體性能,RMSAE定義為:
(26)
(27)
不同混響環(huán)境下利用3種不同的檢測(cè)規(guī)則檢測(cè)到的時(shí)頻點(diǎn)中真實(shí)DP-SSP占比如圖4所示。
圖4 采用3種方法得到的時(shí)頻點(diǎn)中真實(shí)DP-SSP所占百分比隨混響時(shí)間變化Fig.4 Variation of real DP-SSP percentage with reverberation using three detection rules
從圖3中可以看到,隨著混響的增強(qiáng),基于3種檢測(cè)規(guī)則的真實(shí)DP-SSP占比呈現(xiàn)下降趨勢(shì)。但隨著混響增加,所提的兩階段DP-SSP檢測(cè)方法始終保持著明顯優(yōu)勢(shì)。結(jié)合SR-SSP去除和LRSSP[29]檢測(cè)的方法在DP-SSP檢測(cè)上優(yōu)于原始的LRSSP[29]方法,這說(shuō)明對(duì)去除SR-SSP可以有效輔助DP-SSP的檢測(cè)。通過(guò)對(duì)比也可發(fā)現(xiàn),除了第一階段的SR-SSP去除,第二階段的子空間投影算法也在DP-SSP檢測(cè)中展現(xiàn)極大優(yōu)勢(shì)。真實(shí)DP-SSP占比的提高使得所提算法能在高混響情況下實(shí)現(xiàn)更高精度的源計(jì)數(shù)和DOA估計(jì)。
表2給出了所提DP-SSP檢測(cè)方法與基于LRSSP[29]的方法相比,不同混響環(huán)境下正確估計(jì)源信號(hào)數(shù)目的概率。從表中可以發(fā)現(xiàn),2種檢測(cè)規(guī)則在RT60=0.3 s的情況下均能準(zhǔn)確估計(jì)源數(shù),信噪比對(duì)估計(jì)結(jié)果的影響較小。當(dāng)RT60<0.45 s,SNR=20 dB時(shí),基于LRSSP[29]的方法基本可以正確估計(jì)源數(shù),準(zhǔn)確率大于90%,且當(dāng)RT60<0.45 s時(shí),基于LRSSP[29]的方法估計(jì)精度斷崖式下降。此外,從表中可以看到,基于LRSSP[29]的方法性能受SNR影響很大,這說(shuō)明該方法對(duì)噪聲更加敏感。本文所提方法隨著混響增強(qiáng)和信噪比降低,仍然能保持穩(wěn)定有效的源數(shù)估計(jì)性能。
表2 在不同信噪比和混響程度下正確估計(jì)源數(shù)目的概率Tab.2 Percentage of the correct estimation of the number of sources with different SNRs and reverberation
圖5中展示了SNR為20 dB,在RT60=0.6 s和RT60= 0.75 s的仿真混響環(huán)境下,不同算法進(jìn)行DOA估計(jì)的可視化結(jié)果。3個(gè)源信號(hào)所在位置分別為(70°,0°)、(110°,15°)、(170°,30°)。然而,當(dāng)混響時(shí)間增加到0.75 s時(shí),基于LRSSP[29]的方法無(wú)法準(zhǔn)確定位出每個(gè)源,如圖5(b)所示,一些源的DOA估計(jì)與對(duì)應(yīng)的真實(shí)DOA有很大偏差。與基于LRSSP[29]的方法不同,隨著混響增加,所提算法仍能實(shí)現(xiàn)高精度的DOA估計(jì),且誤差較小。此外,圖6展示了在多個(gè)源間隔較近的情況下DOA的估計(jì)結(jié)果。3個(gè)源的DOA分別為(70°,0°)、(110°,15°)、(150°,25°)。結(jié)果表明,基于LRSSP[29]的方法無(wú)法處理距離較近的多源DOA估計(jì),而所提方法能實(shí)現(xiàn)準(zhǔn)確估計(jì),具有明顯優(yōu)勢(shì)。
(a)基于LRSSP[29]的方法(RT60=0.60 s) (b)所提DP-SSP檢測(cè)的方法(RT60=0.60 s)
(c)基于LRSSP[29]的方法(RT60=0.75 s) (d)所提DP-SSP檢測(cè)的方法(RT60=0.75 s)圖5 仿真環(huán)境下2種方法估計(jì)DOA的可視化結(jié)果圖(SNR=20 dB)Fig.5 DOA estimation results in the simulated environment using different DOA estimation algorithms (SNR=20 dB)
(a)基于LRSSP[29]的方法(RT60=0.60 s) (b)所提DP-SSP檢測(cè)的方法(RT60=0.60 s)圖6 源相隔較近時(shí)2種方法估計(jì)DOA的可視化結(jié)果圖(SNR=20 dB)Fig.6 DOA estimation results using different DOA estimation algorithms in the case of closely spaced sources (SNR=20 dB)
表3展示了利用2種不同算法計(jì)算的RMSAE隨混響時(shí)間變化的情況。由表3可以看出,在RT60<0.6 s時(shí),基于LRSSP[29]的方法在3個(gè)源DOA估計(jì)上表現(xiàn)較好,但當(dāng)混響時(shí)間超過(guò)0.6 s時(shí),該方法的DOA估計(jì)精度明顯下降。值得注意的是,盡管所提方法的性能不可避免地隨著混響的增加而下降,但當(dāng)RT60增加到0.9 s時(shí),在SNR=20 dB的條件下,對(duì)比算法已經(jīng)完全無(wú)法進(jìn)行多源DOA估計(jì),然而所提算法仍然具有一定性能。當(dāng)信噪比降到15 dB,且RT60=0.9 s時(shí),所提方法性能略有下降。
表3 RMSAE隨混響和SNR變化Tab.3 Variation of RMSAE with the reverberation and SNR
圖7展示了對(duì)不同數(shù)量的源進(jìn)行DOA估計(jì)后計(jì)算得到的RMSAE隨混響變化的趨勢(shì)。結(jié)果表明,隨著源數(shù)量的增加,本文所提方法性能不可避免地下降,特別是存在4個(gè)源的情況下,性能下降明顯,這是因?yàn)镈P-SSP檢測(cè)的準(zhǔn)確性隨著源數(shù)量的增加而下降。所提算法在2個(gè)源的情況下,在不同的環(huán)境中都能展現(xiàn)出較好的性能,即使當(dāng)RT60增加到0.9 s時(shí),仍然能獲得較高精度。
圖7 不同源數(shù)情況下使用所提方法計(jì)算的RMSAE隨混響時(shí)間變換圖(SNR=20 dB)Fig.7 Variation of RMSAE with reverberation time in case of different number of sources by the proposed algorithm (SNR=20 dB)
本文針對(duì)傳統(tǒng)算法利用單個(gè)AVS在高混響情況下多源DOA估計(jì)性能差的問(wèn)題,提出了一種新的多源DOA估計(jì)算法。該算法的關(guān)鍵在于檢測(cè)DP-SSP,這些DP-SSP為DOA的估計(jì)提供了有利信息。本文所提出的DP-SSP檢測(cè)算法有兩方面的貢獻(xiàn)。首先,針對(duì)單個(gè)AVS設(shè)計(jì)了一種基于頻率平滑的SR-SSP去除方法,有效地消除了混響帶來(lái)的不利影響,為準(zhǔn)確檢測(cè)DP-SSP提供幫助。其次,采用子空間投影的算法進(jìn)一步細(xì)化DP-SSP的檢測(cè),消除大部分MSP,提取正確的DP-SSP。實(shí)驗(yàn)結(jié)果表明,該算法對(duì)DP-SSP的高精度檢測(cè)使得本文算法在源數(shù)目估計(jì)和DOA估計(jì)方面取得較好性能。