文小軍,吉建華,鐘林波,伍守豪,王艷芬
1.深圳大學(xué) 信息工程學(xué)院,廣東 深圳 518060
2.深圳市現(xiàn)代通信與信息處理重點(diǎn)實(shí)驗(yàn)室,廣東 深圳 518060
基于時(shí)延估計(jì)的聲源定位算法實(shí)驗(yàn)研究
文小軍,吉建華,鐘林波,伍守豪,王艷芬
1.深圳大學(xué) 信息工程學(xué)院,廣東 深圳 518060
2.深圳市現(xiàn)代通信與信息處理重點(diǎn)實(shí)驗(yàn)室,廣東 深圳 518060
麥克風(fēng)陣列信號處理是陣列信號處理的重要分支,其在聲源定位上的應(yīng)用是目前陣列信號處理方向的一個(gè)研究熱點(diǎn)。目前,基于麥克風(fēng)陣列的聲源定位算法,按照定位原理主要分為三大類[1]:(1)基于最大輸出功率的可控波束形成技術(shù);(2)基于到達(dá)時(shí)間差(TDOA)定位技術(shù);(3)基于高分辨率譜估計(jì)的定位技術(shù)。第一類方法,常基于背景噪聲和聲源信號的先驗(yàn)知識限制了算法的應(yīng)用;第三類算法來源于高分辨譜估計(jì)技術(shù),其定位性能好,但計(jì)算復(fù)雜度高,不利于實(shí)時(shí)實(shí)現(xiàn);第二類算法,計(jì)算復(fù)雜度較低,硬件實(shí)現(xiàn)成本少,因而備受關(guān)注[2-4]。目前,針對第二類算法,大部分研究都集中在理論研究與軟件仿真[5-6],針對實(shí)測數(shù)據(jù)的實(shí)驗(yàn)相對較少。仿真研究中,文獻(xiàn)[7]分析了在時(shí)延估計(jì)時(shí)可能出現(xiàn)的估計(jì)偏差增加一個(gè)擾動(dòng)時(shí)間差進(jìn)行預(yù)估計(jì),未有真實(shí)環(huán)境的實(shí)驗(yàn)說明,對應(yīng)用缺少指導(dǎo),且其主要目的為減少M(fèi)USIC算法的搜索復(fù)雜度。在實(shí)測數(shù)據(jù)的研究中,對任意信號入射角度常選用相同的誤差判決門限篩選定位結(jié)果,如文獻(xiàn)[8]進(jìn)行了大量實(shí)測數(shù)據(jù)實(shí)驗(yàn),對不同情況下算法的定位性能進(jìn)行了對比分析,但對定位結(jié)果的篩選均以與參考角度的絕對誤差為10°作為篩選依據(jù),且其陣列長度較大不利于便攜設(shè)備的應(yīng)用;文獻(xiàn)[9]針對近場情況做了大量實(shí)驗(yàn),對定位結(jié)果均以絕對誤差為5°作為篩選依據(jù),且陣列長度同樣較大。
本文在陣列長度較短情況下,對不同入射角度采用不同的角度篩選判決門限,利用真實(shí)語音環(huán)境中采集的人聲進(jìn)行聲源定位實(shí)驗(yàn)研究,希望對實(shí)際工程應(yīng)用提供一定參考。
基于到達(dá)時(shí)間差的定位算法[10],主要由時(shí)延估計(jì)和聲源定位兩部分組成[11]。第一步通過不同的時(shí)延估計(jì)方法估計(jì)出兩路信號之間的相對時(shí)延,其中運(yùn)用最廣泛的方法是廣義互相關(guān)函數(shù)法(Generalized Cross-Correlation,GCC)。廣義互相關(guān)函數(shù)法首先對兩路信號求傅里葉變換(FFT),對其中一路FFT數(shù)據(jù)取共軛,然后計(jì)算兩路信號之間的互功率譜,根據(jù)不同的需求選擇不同的加權(quán)因子對互功率譜進(jìn)行加權(quán),使互相關(guān)函數(shù)在兩路信號之間的時(shí)延處峰值更為明顯。將頻域信號轉(zhuǎn)換到時(shí)域,得到廣義互相關(guān)函數(shù),找到相關(guān)函數(shù)的峰值位置,即為信號之間的相對時(shí)延。其估計(jì)過程如圖1所示。
圖1 GCC算法流程示意圖
第二步,根據(jù)第一步計(jì)算得到的時(shí)延,利用陣元與聲源位置的幾何關(guān)系得到聲源的位置[12]。以均勻直線陣列為例,假設(shè)聲源距陣列的距離滿足遠(yuǎn)場條件,陣元拓?fù)浣Y(jié)構(gòu)如圖2所示。
圖2 均勻直線陣列結(jié)構(gòu)示意圖(遠(yuǎn)場)
由圖2可知,此時(shí)的聲源位置可由式(1)計(jì)算得到:
其中,τ為相鄰陣元接收信號的時(shí)延差,c為聲速,常溫下空氣中取340 m/s,d為陣元間距。
實(shí)際應(yīng)用中,假定估計(jì)的峰值位置為第n個(gè)采樣點(diǎn),系統(tǒng)的采樣率為 fs,則估計(jì)的時(shí)延結(jié)果表達(dá)式為:
由于噪聲等其他因素的影響,往往不能得到準(zhǔn)確的時(shí)延點(diǎn),且一定為整數(shù)倍采樣點(diǎn)對應(yīng)的時(shí)延誤差。因此,本文以實(shí)際估計(jì)時(shí)延采樣點(diǎn)數(shù)±1點(diǎn)作為定位結(jié)果的判斷門限。設(shè)陣元間距為5 cm和15 cm,采樣速率均為48 kHz,則對應(yīng)可能出現(xiàn)的時(shí)延點(diǎn)數(shù)范圍分別為[-7,7]和[-21,21],此時(shí)不同采樣點(diǎn)時(shí)延對應(yīng)的估計(jì)角度是僅可能出現(xiàn)的定位結(jié)果,如表1、2所示。
表1 d=5 cm時(shí)不同時(shí)延點(diǎn)數(shù)對應(yīng)的估計(jì)角度
表2 d=15 cm時(shí)不同時(shí)延點(diǎn)數(shù)對應(yīng)的估計(jì)角度
根據(jù)三角函數(shù)的性質(zhì),負(fù)時(shí)延采樣點(diǎn)與對應(yīng)正時(shí)延采樣點(diǎn)的定位角度存在互補(bǔ)關(guān)系,因此僅列出正時(shí)延采樣點(diǎn)對應(yīng)時(shí)延的結(jié)果。由表1、2顯然可知,此時(shí)的判決門限不固定,且篩選條件更為合理。
該文選用ADI公司生產(chǎn)的ADSP-BF533開發(fā)板作為信號的采集模塊,數(shù)據(jù)采集的原理如圖3所示。
圖3 數(shù)據(jù)采集硬件結(jié)構(gòu)示意圖
ADSP-BF533開發(fā)板的4個(gè)音頻接口連接4個(gè)麥克風(fēng),外界聲源信息通過內(nèi)置的音頻編解碼器AD1836編碼轉(zhuǎn)化為數(shù)字信號,通過SPORT口以DMA方式輸送到SDRAM,再由UART口連接PC機(jī)的串口發(fā)送到PC機(jī),利用Matlab軟件進(jìn)行實(shí)測數(shù)據(jù)的定位實(shí)驗(yàn)。
聲源定位的實(shí)驗(yàn)環(huán)境為一間普通實(shí)驗(yàn)室,墻壁未作任何聲學(xué)處理。實(shí)驗(yàn)室內(nèi)存在各種噪聲,如鍵盤敲擊聲、桌椅移動(dòng)聲、計(jì)算機(jī)風(fēng)扇聲及旁邊公路的汽車發(fā)動(dòng)機(jī)噪聲等。本文選用的陣列由4個(gè)各向同性的麥克風(fēng)組成,麥克風(fēng)均勻分布在一條直線上,陣元間距5 cm,聲源(人)距離參考麥克風(fēng)3 m。采集信號的時(shí)域圖形如圖4所示,選用常用典型的信號入射角度,分別測試不同陣元間距情況下第二類算法的定位性能,利用本文提到的方法,即以距離信號入射角度最近的兩個(gè)時(shí)延點(diǎn)對應(yīng)的角度作為定位中可能出現(xiàn)的結(jié)果的判決門限,計(jì)算20次得到可能結(jié)果的集合,進(jìn)而求得定位結(jié)果的均方根誤差如圖5所示。
圖4 采集信號的時(shí)域波形
圖5 不同陣元間距對應(yīng)定位結(jié)果的均方根誤差
由圖5可以得出以下結(jié)論:(1)在陣元數(shù)較少,陣列長度較短情況下,基于時(shí)延估計(jì)的聲源定位算法在[60°,120°]范圍內(nèi)具有較高的定位精度,而靠近陣列兩端(接近0°或180°)時(shí),性能較差,符合均勻直線陣的特點(diǎn)[13]。(2)[60°,120°]范圍以外時(shí),定位結(jié)果的均方根誤差將驟然上升,表明定位結(jié)果出現(xiàn)不穩(wěn)定現(xiàn)象。(3)隨著陣元間距的增大,陣列的分辨力增強(qiáng),此時(shí)均方根誤差變小且變化速率更平緩。
在陣元間距為15 cm,對應(yīng)可能出現(xiàn)的定位結(jié)果見表2,對比傳統(tǒng)方法與本文所用方法結(jié)果如圖6所示。
圖6 與傳統(tǒng)方法對比結(jié)果
在圖6中,傳統(tǒng)方法選用固定誤差為 ±5°時(shí):(1)[30°,150°]之間由于此時(shí) ± 5范圍內(nèi)可能出現(xiàn)的時(shí)延點(diǎn)數(shù)已多于兩個(gè)點(diǎn),因此所得曲線高于本文方法曲線。(2)在30°和150°時(shí),剛好是兩個(gè)時(shí)延點(diǎn),因此與本文所得結(jié)果重合。(3)靠近0°或180°時(shí),由于相鄰時(shí)延點(diǎn)對應(yīng)角度差大于±5°,因此傳統(tǒng)方法僅可能得到一個(gè)結(jié)果,均方根誤差趨近0,但由均勻線陣的特性易知,這顯然是不合理的。(4)傳統(tǒng)方法中,當(dāng)固定誤差增大為±15°時(shí),各點(diǎn)均方根誤差明顯大于本文方法,靠近0°或180°時(shí),呈下降趨勢,與均勻直線陣列的特點(diǎn)不符。
本文通過硬件采集真實(shí)語音數(shù)據(jù),結(jié)合軟件算法實(shí)現(xiàn)聲源定位,通過對信號不同入射角度以±1個(gè)對應(yīng)采樣點(diǎn)誤差范圍作為結(jié)果的判決門限,得出了不同陣元間距情況下定位結(jié)果的均方根誤差,并以此分析了第二類算法在陣元數(shù)少,陣列長度較短情況下的性能。與傳統(tǒng)固定誤差范圍的方法進(jìn)行對比,驗(yàn)證了本文方法的合理性。相比單純的理論仿真,本文所用數(shù)據(jù)為真實(shí)語音環(huán)境數(shù)據(jù),因此得出的結(jié)論對實(shí)際工程應(yīng)用具有一定的參考價(jià)值。
[1]Potanmitis I,Chen H,Tremoulis G.Tracking of multiple moving speakers with multiple microphone arrays[J].IEEE on Speech and Audio Processing,2004,12(5):520-529.
[2]Knapp C H,Carter G C.The generalized correlation method for estimation of time delay[J].IEEE,Acoust,Speech,Signal Processing,2000,24(8):320-327.
[3]Reed F A,F(xiàn)eintuch P L,Bershad N J.Time delay estimation using the LMS adaptive filter-dynamic behavior[J].IEEE,Acoustics,Speech,Signal Processing,2006,29:561-571.
[4]Youn D H,Ahmed N,Carter G C.On using the LMS algorithm for delay estimation[J].IEEE,Acoustics,Speech,Signal Processing,2006,30:798-801.
[5]Carter G C,Nuttall A H,Cable P G.The Smoothed Coherence Transform(SCOT)[J].Proceedings of IEEE,2005,61:1497-1498.
[6]Cadzow J A,Kim Y S,Shie D C.General direction-ofarrival estimation:a signal subspace approach[J].IEEE,Aerospace and Electronic Systems,1989,25(1):31-46.
[7]崔緯緯.基于麥克風(fēng)陣列的聲源定位與語音增強(qiáng)方法研究[D].北京:清華大學(xué),2008.
[8]陳穎.基于麥克風(fēng)陣列的聲源定位算法研究及DSP實(shí)現(xiàn)[D].河北秦皇島:燕山大學(xué),2012.
[9]蘇立娟.基于麥克風(fēng)陣列的聲源定位技術(shù)研究與ARM實(shí)現(xiàn)[D].河北秦皇島:燕山大學(xué),2011.
[10]Brandstein M S,Silverman H F.A practical methodology for speech source localization with microphone arrays[J]. Computer,Speech,and Language,2004,11(2):951-958.
[11]王宏禹,邱天爽.自適應(yīng)噪聲抵消和時(shí)間延遲估計(jì)[M].遼寧大連:大連理工大學(xué)出版社,2003.
[12]居太亮.基于麥克風(fēng)陣列的聲源定位算法研究[D].成都:電子科技大學(xué),2006.
[13]王永良,陳輝,彭應(yīng)寧,等.空間譜估計(jì)理論與算法[M].北京:清華大學(xué)出版社,2004.
WEN Xiaojun,JI Jianhua,ZHONG Linbo,WU Shouhao,WANG Yanfen
1.College of Information Engineering,Shenzhen University,Shenzhen,Guangdong 518060,China
2.Shenzhen Key Lab of Advanced Communications and Information Processing,Shenzhen,Guangdong 518060,China
In general,because the microphone array can get more information of the acoustic source,more attention is dedicated on acoustic source location.When the acoustic source near the ends of array,the uniform-linear-array’s resolution is gradually reduced.It is unreasonable that the signal incident angle is different,but the reference range is the same.By analyzing the characteristics of uniform linear array,the time delay is been used to filter the results.The experimental results verify the reasonableness of method.Because the experimental array number is less and the length of array is short, the results also have a certain reference value for the practical application.
microphone array;acoustic source location;delay estimation;uniform linear array;experimental research; ADSP-BF533
麥克風(fēng)陣列因其相對于單麥克風(fēng)能夠獲取更多聲源信息,在聲源定位的應(yīng)用上正日益得到人們的極大關(guān)注。均勻線陣中,針對信號入射方向靠近陣列的兩端陣列分辨力將逐漸降低,利用基于時(shí)延估計(jì)的聲源定位算法時(shí),對不同的信號入射角度以相同的角度誤差作為結(jié)果篩選的依據(jù)的做法,顯然不合理。通過分析均勻線陣的特點(diǎn),當(dāng)信號以不同角度入射時(shí),以時(shí)延點(diǎn)數(shù)誤差作為不同角度估計(jì)結(jié)果的篩選門限,并通過實(shí)測數(shù)據(jù)實(shí)驗(yàn),驗(yàn)證了方法的合理性。由于實(shí)驗(yàn)使用陣元數(shù)少且陣列長度較短,因此實(shí)驗(yàn)結(jié)果對陣列信號處理的實(shí)際工程應(yīng)用具有一定的參考價(jià)值。
麥克風(fēng)陣列;聲源定位;時(shí)延估計(jì);均勻線陣;實(shí)驗(yàn)研究;ADSP-BF533
A
TN912.3
10.3778/j.issn.1002-8331.1301-0190
WEN Xiaojun,JI Jianhua,ZHONG Linbo,et al.Experimental research of microphone array acoustic source location algorithm based on time delay estimation.Computer Engineering and Applications,2014,50(23):212-214.
深圳市基礎(chǔ)研究項(xiàng)目(No.JC201005280625A)。
文小軍(1988—),男,碩士研究生,主要研究方向:寬帶信號處理;吉建華(1970—),男,博士研究生,教授,主要研究方向:寬帶通信與網(wǎng)絡(luò);鐘林波(1988—),男,碩士研究生,主要研究方向:寬帶信號處理;伍守豪(1973—),男,博士研究生,高級工程師,主要研究方向:寬帶移動(dòng)通信與陣列信號處理;王艷芬(1989—),男,碩士研究生,主要研究方向:噪聲消除與語音增強(qiáng)。
2013-01-17
2013-03-25
1002-8331(2014)23-0212-03
CNKI網(wǎng)絡(luò)優(yōu)先出版:2013-04-11,http://www.cnki.net/kcms/detail/11.2127.TP.20130411.1555.002.html