王元昊,王宏強(qiáng),楊 琪,鄧 彬,羅成高
(國(guó)防科技大學(xué) 電子科學(xué)學(xué)院, 湖南 長(zhǎng)沙 410073)
太赫茲指的是頻率在0.1~10 THz之間的電磁波,太赫茲雷達(dá)就是指工作在太赫茲頻段下的雷達(dá)。相比于傳統(tǒng)微波頻段雷達(dá),太赫茲雷達(dá)在精度方面具有天然的優(yōu)勢(shì),使其在拓展傳統(tǒng)雷達(dá)應(yīng)用領(lǐng)域上具有巨大的潛力。聲音活動(dòng)檢測(cè)(Voice Activity Detection,VAD)指從包含聲音的信號(hào)中確定出聲音的起點(diǎn)及終點(diǎn),即確定待處理信號(hào)是否為有效聲音信號(hào),是聲音信號(hào)預(yù)處理的重要一環(huán)。對(duì)于后續(xù)的聲音增強(qiáng),聲音識(shí)別等處理具有重要意義。目前的VAD算法多采取基于信號(hào)特征的形式進(jìn)行聲音或非聲音的判別,常用的特征有能量、頻域、倒譜、諧波等。但這些特征都依賴于所獲得信號(hào)中的噪聲分量具有和聲音分量顯著的特征差異,基于深度學(xué)習(xí)的VAD方法也基本建立在特征值的提取上[1-2],顯著的特征差異對(duì)于識(shí)別算法起著至關(guān)重要的作用,獲取聲音信號(hào)的方式對(duì)于特征值的獲取也有著至關(guān)重要的作用。
目前,麥克風(fēng)方式是發(fā)展最為成熟[3]、應(yīng)用最為廣泛的一種聲音信號(hào)獲取方式,但是利用麥克風(fēng)存在一些弊端,導(dǎo)致其應(yīng)用受限:一是抗干擾能力差,即面對(duì)所期望得到的聲音湮沒在噪聲中或傳輸路徑中存在干擾聲源時(shí)該方法難以取得良好的性能。二是作用距離近,因?yàn)槁曇粜盘?hào)在空氣中的衰減較大,所以一般都會(huì)放置在聲源米量級(jí)內(nèi)的位置來獲得最佳的效果。但若在麥克風(fēng)接收路徑上存在其他聲源的聲音干擾,則即便是信道噪聲不強(qiáng),在進(jìn)行VAD時(shí)也會(huì)存在較大的誤差。因此,探索一種新的VAD手段具有重要意義。探測(cè)聲波本質(zhì)上是探測(cè)物體的振動(dòng)信息,而雷達(dá)天然地具有測(cè)距能力。王健琪團(tuán)隊(duì)在2016年提出基于94 GHz雷達(dá)的生物聲音獲取系統(tǒng)[3-4],利用毫米波雷達(dá)對(duì)人聲帶振動(dòng)信號(hào)進(jìn)行遠(yuǎn)程檢測(cè)從而得到聲音信號(hào)。Khanna等在2019年提出基于多普勒雷達(dá)的聲音識(shí)別系統(tǒng)[5],該系統(tǒng)放置在離人咽喉很近的地方。相比于麥克風(fēng),雷達(dá)獲取聲音信號(hào)的方式可以認(rèn)為是遠(yuǎn)程直接探測(cè)聲源表面的振動(dòng),可以有效地避免傳輸路徑上其余聲音干擾帶來的影響。但是上述對(duì)于雷達(dá)聲音獲取技術(shù)的研究仍然存在不具備目標(biāo)選擇能力以及多目標(biāo)同時(shí)獲取能力不足的問題。
為此,本文提出一種基于載波頻率為120 GHz的寬帶太赫茲雷達(dá)的VAD技術(shù),綜合利用太赫茲雷達(dá)頻段高和帶寬大的特性,實(shí)現(xiàn)多聲音信號(hào)活動(dòng)檢測(cè),同時(shí)通過譜減-小波聯(lián)合去噪方法提升雷達(dá)獲取聲音信號(hào)的質(zhì)量。
聲音信號(hào)本質(zhì)上是由物體振動(dòng)產(chǎn)生的機(jī)械波。假設(shè)一個(gè)無向聲源,該聲源的振動(dòng)方程為f(x,t)|x=0。根據(jù)傅里葉變換原理,聲音信號(hào)可以分解為不同頻率、幅度的正弦信號(hào)的線性疊加,因此,f(x,t)|x=0可以重寫為:
(1)
式中,Aω是頻率分量為ω的諧波所對(duì)應(yīng)的振幅,φω是其相應(yīng)的相位值。
考慮M個(gè)主要頻率分量以及因路徑傳播所帶來的延遲,式(1)可以重寫為:
(2)
式中,Aωi是頻率分量為ωi的諧波所對(duì)應(yīng)的振幅,φωi是對(duì)應(yīng)的相位,λ表示波長(zhǎng)。
當(dāng)聲波傳遞到硬質(zhì)介質(zhì)表面時(shí),會(huì)引發(fā)該介質(zhì)的振動(dòng),考慮振動(dòng)方程:
(3)
式中,δ為阻尼系數(shù),ω0表示物體本振頻率,m表示該物體質(zhì)量。
假設(shè)M=1,求解式 (3) 可得:
(4)
分析式(4)可得,含有e-δt的前兩個(gè)振動(dòng)項(xiàng)為自由振動(dòng),會(huì)隨著時(shí)間迅速衰減,而只有最后一項(xiàng)為受迫振動(dòng),該受迫振動(dòng)項(xiàng)將以與聲源頻率相同的頻率振動(dòng)且振幅與聲源振幅A呈線性關(guān)系。
設(shè)太赫茲雷達(dá)發(fā)射調(diào)頻連續(xù)波,記發(fā)射信號(hào)為:
(5)
式中,f0是中心頻率,γ是調(diào)頻率。
假設(shè)目標(biāo)有N個(gè)散射中心,可以得到回波信號(hào)表達(dá)式為:
(6)
設(shè)參考信號(hào)為:
(7)
式中,c為光速,Rref為參考距離。
將回波信號(hào)r(t)和參考信號(hào)sref(t)相乘,得到去斜后信號(hào):
(8)
進(jìn)一步利用相位測(cè)距[6-7]原理可得到目標(biāo)位移如下:
Δφ=angle[r′(t+Δt)-r′(t)]
(9)
(10)
在得到位移變化序列后進(jìn)一步通過聯(lián)合譜減算法[8-9]以及小波去噪[10]提升信號(hào)質(zhì)量。
譜減法是從含噪信號(hào)功率譜中減去噪聲功率譜,要求噪聲與純凈聲音信號(hào)不相關(guān)。純凈聲音信號(hào)與噪聲的相關(guān)性決定了去噪后聲音信號(hào)的質(zhì)量。然而,由于有色噪聲的分布特點(diǎn),去除噪聲的效果并不理想。但是有色噪聲的功率很低,可以采用小波去噪的方法。因?yàn)樾〔ㄈピ氲幕舅枷胧菍?duì)信號(hào)進(jìn)行小波變換,通過選擇合適的閾值來保留較大的小波系數(shù),從而保留了信號(hào)的主要分量。
記通過相位測(cè)距處理得到的位移序列y[n]={R(t),R(t+T),…,R(t+mT)},其可以認(rèn)為是含噪信號(hào),假設(shè)純凈聲音信號(hào)和噪聲是不相關(guān)的。
含噪信號(hào)可以表示為:
(11)
其中,x(n)表示干凈信號(hào),dcgn(n)表示有色噪聲,dwgn(n)表示白噪聲。
將式(11)轉(zhuǎn)換到頻域,可以表示為:
(12)
其中,Y[k]、X[k]、Dcgn[k]和Dwgn[k]分別是y[n]、x[n]、dcgn(n)和dwgn[n]的傅里葉變換。
進(jìn)一步轉(zhuǎn)換成功率譜可得:
(13)
通過選擇不含聲音信號(hào)的一部分來估計(jì)純凈信號(hào):
(14)
最后,通過小波降噪的方法進(jìn)一步去除dcgn[n],從而得到干凈聲音信號(hào)x[n]。信號(hào)處理框圖如圖1所示。
圖1 太赫茲雷達(dá)聲音活動(dòng)檢測(cè)信號(hào)處理框圖Fig.1 Signal processing flow of VAD system for terahertz radar
本文所設(shè)計(jì)太赫茲雷達(dá)聲音活動(dòng)檢測(cè)系統(tǒng)主要由原始數(shù)據(jù)獲取前端和數(shù)據(jù)精細(xì)化處理后端組成。其結(jié)構(gòu)框圖如圖2所示。原始數(shù)據(jù)獲取前端主要是一部太赫茲雷達(dá),其發(fā)射波形為調(diào)頻連續(xù)波,中心頻率為120 GHz,帶寬為0.1~4 GHz(可調(diào)節(jié)),掃頻周期為0.1~1 ms(可調(diào)節(jié))。數(shù)據(jù)精細(xì)化處理后端主要由一臺(tái)上位機(jī)組成,其作用是控制雷達(dá)參數(shù)、接收雷達(dá)數(shù)據(jù)并處理。
因?yàn)槔走_(dá)的距離分辨率為Rres=c/(2B),帶寬B選擇為500 MHz可以區(qū)分目標(biāo)聲源與干擾聲源。掃頻周期選擇為0.5 ms,掃頻周期的倒數(shù)對(duì)應(yīng)于實(shí)際對(duì)聲源信號(hào)的采樣率,0.5 ms對(duì)應(yīng)采樣率為2 000 Hz,可以基本滿足對(duì)于檢測(cè)聲音活動(dòng)的需求。
圖2 太赫茲雷達(dá)聲音活動(dòng)檢測(cè)系統(tǒng)框圖Fig.2 Block diagram of VAD system for terahertz radar
設(shè)計(jì)實(shí)驗(yàn)場(chǎng)景如圖3所示,實(shí)驗(yàn)環(huán)境為微波暗室和戶外,選取兩個(gè)藍(lán)牙音箱分別作為目標(biāo)聲源和干擾聲源,目標(biāo)聲源播放聲音“電子科學(xué)學(xué)院”,聲音信號(hào)獲取系統(tǒng)選擇麥克風(fēng)和太赫茲雷達(dá),麥克風(fēng)系統(tǒng)主要用來與太赫茲雷達(dá)對(duì)比所獲得聲音信號(hào)的VAD性能。
(a) 實(shí)驗(yàn)室環(huán)境(a) Laboratory environment
(b) 戶外環(huán)境(b) Outdoor environment圖3 實(shí)驗(yàn)場(chǎng)景Fig.3 Experimental environment
實(shí)驗(yàn)室環(huán)境下太赫茲雷達(dá)測(cè)得的聲音信號(hào)如圖4所示。對(duì)于目標(biāo)聲源,雷達(dá)通過相位測(cè)距方式得到的原始信號(hào)、經(jīng)過譜減法降噪后的聲音信號(hào)、譜減法與小波去噪結(jié)合降噪后的聲音信號(hào)的信噪比分別為7.53 dB、20.69 dB和36.55 dB。 對(duì)于干擾聲源,該數(shù)值分別為9.69 dB、20.10 dB和29.38 dB。從圖4和計(jì)算的信噪比可以看出,譜減-小波聯(lián)合降噪算法具有明顯的信噪比改善。
(a) 目標(biāo)聲源(a) Desired speech signal
(b) 干擾聲源(b) Interference speech signal圖4 實(shí)驗(yàn)室環(huán)境下的太赫茲雷達(dá)探測(cè)聲音信號(hào)結(jié)果Fig.4 Results of acoustic signal acquired by terahertz radar in laboratory environment
同樣給出戶外測(cè)試的結(jié)果,如圖5所示。從圖5中可以看出,相比于實(shí)驗(yàn)室環(huán)境,戶外環(huán)境下原始提取信號(hào)的幅度抖動(dòng)十分劇烈,通過所提譜減-小波聯(lián)合降噪方法可以有效抑制噪聲,保留聲音信號(hào)。
(a) 目標(biāo)聲源(a) Desired speech signal
(b) 干擾聲源(b) Interference speech signal圖5 戶外環(huán)境下的太赫茲雷達(dá)探測(cè)聲音信號(hào)結(jié)果Fig.5 Results of acoustic signal acquired by terahertz radar in outdoor environment
麥克風(fēng)在實(shí)驗(yàn)室環(huán)境中采集的聲音信號(hào)的結(jié)果如圖6所示。由于麥克風(fēng)不能區(qū)分不同位置處的聲源,采集到的聲音信號(hào)存在嚴(yán)重混疊現(xiàn)象。
圖6 麥克風(fēng)采集聲音信號(hào)VAD結(jié)果Fig.6 VAD result of microphone
從圖6中可以看出,麥克風(fēng)所采集聲音信號(hào)無法區(qū)分聲音信號(hào)來源是目標(biāo)物體還是干擾物體;當(dāng)在傳輸信道中施加干擾聲源后,麥克風(fēng)采集聲音信號(hào)難以正確判斷目標(biāo)物體是否進(jìn)行聲音活動(dòng)。
圖7展示了基于太赫茲雷達(dá)所采集聲音信號(hào)的VAD結(jié)果。因?yàn)槔走_(dá)天然地具有距離分辨的能力,所以首先通過距離分辨選擇目標(biāo)所在的距離單元數(shù)據(jù)進(jìn)行進(jìn)一步分析,可以有效地避免采集到來自干擾聲源的信號(hào)。通過對(duì)比圖6可以明顯看出,基于太赫茲雷達(dá)采集的聲音信號(hào)的VAD效果明顯優(yōu)于麥克風(fēng)方式。
圖7 雷達(dá)采集聲音信號(hào)VAD結(jié)果Fig.7 VAD result of terahertz radar
進(jìn)一步,通過聲源與雷達(dá)的距離來對(duì)該系統(tǒng)的應(yīng)用場(chǎng)景進(jìn)行評(píng)估,以信噪比作為評(píng)判標(biāo)準(zhǔn),捕捉最初無聲音信號(hào)播放時(shí)的雷達(dá)數(shù)據(jù)作為噪聲樣本,得到結(jié)果如圖8所示。
圖8 探測(cè)聲音信號(hào)信噪比與作用距離的關(guān)系Fig.8 Relationship between signal to noise ratio and operating distance of sound signal
從圖8中可以看出,該系統(tǒng)的探測(cè)性能隨距離下降十分明顯,但該性能的下降可以通過提升雷達(dá)功率的方式來得以改善。
本文提出了一種太赫茲雷達(dá)多聲音檢測(cè)方法。太赫茲雷達(dá)憑借其頻率高、 波長(zhǎng)短的特點(diǎn),在相位測(cè)距精度上有著顯著的優(yōu)勢(shì)。本文采用太赫茲雷達(dá)進(jìn)行聲音信號(hào)獲取并進(jìn)行聲音活動(dòng)檢測(cè),同時(shí)在相同環(huán)境下也設(shè)置了麥克風(fēng)進(jìn)行聲音信號(hào)獲取來進(jìn)行對(duì)比。實(shí)驗(yàn)結(jié)果表明,太赫茲雷達(dá)聲音檢測(cè)方法在面臨傳輸路徑上存在聲源干擾時(shí),對(duì)目標(biāo)聲源的聲音活動(dòng)仍然有良好的判斷性能,在一定程度上可以彌補(bǔ)基于麥克風(fēng)的聲音信號(hào)采集系統(tǒng)的不足,該方法為在復(fù)雜環(huán)境下聲音信號(hào)的探測(cè)提供了一種新的思路。