盧佳敏 宋三明 景 嚴(yán) 張 瑤 谷 浪魯 帆 胡志強(qiáng) 李 碩
(1 中國(guó)科學(xué)院沈陽(yáng)自動(dòng)化研究所 機(jī)器人學(xué)國(guó)家重點(diǎn)實(shí)驗(yàn)室 沈陽(yáng) 110016)
(2 中國(guó)科學(xué)院機(jī)器人與智能制造創(chuàng)新研究院 沈陽(yáng) 110169)
(3 中國(guó)科學(xué)院大學(xué) 北京 100049)
(4 中國(guó)科學(xué)院聲學(xué)研究所 北京 100190)
水中機(jī)動(dòng)目標(biāo)在航行時(shí)會(huì)輻射出具有特殊頻譜分布的噪聲,因此可以通過(guò)噪聲分析來(lái)估計(jì)航行器的噸位、槳葉數(shù)等物理特征和軸頻、航速等運(yùn)動(dòng)狀態(tài)[1?2],進(jìn)而實(shí)現(xiàn)合作或?qū)箞?chǎng)景下的態(tài)勢(shì)感知。軸頻是螺旋槳轉(zhuǎn)速的最直接反映[3],對(duì)水下目標(biāo)探測(cè)具有重要的意義,本文將重點(diǎn)研究如何從水聽(tīng)器陣列接收到的噪聲中估計(jì)軸頻信息。
軸頻也稱為基頻,在數(shù)值上等于目標(biāo)螺旋槳主軸的轉(zhuǎn)動(dòng)頻率[4],常用DEMON 譜分析法提取調(diào)制譜特征,以獲取基頻及其諧波在內(nèi)的低頻線譜,進(jìn)而檢測(cè)目標(biāo)的基頻、葉頻或槳葉數(shù)目。文獻(xiàn)[5–6]評(píng)估了不同解調(diào)分量得到的DEMON譜的鑒別能力。文獻(xiàn)[7–11]研究了DEMON 譜凈化與增強(qiáng),提高了線譜的信噪比與基頻估計(jì)的精度。其中,文獻(xiàn)[7]基于線譜之間的倍頻關(guān)系,提出基于最大公約數(shù)的基頻提取方法,文獻(xiàn)[12–13]對(duì)此進(jìn)行了拓展并提出相應(yīng)的改進(jìn)方法。這些算法需要人為設(shè)置參數(shù)進(jìn)行特征提取和基頻估計(jì),對(duì)信噪比較敏感。實(shí)際接收到的目標(biāo)噪聲信號(hào),受到不同海洋波導(dǎo)傳輸過(guò)程的乘性作用和加性干擾,其信噪比變化大[14?15]。
深度學(xué)習(xí)具有較強(qiáng)的泛化能力,近年來(lái)逐漸被研究人員引入水下目標(biāo)識(shí)別領(lǐng)域。文獻(xiàn)[16]通過(guò)提取DEMON 譜中各諧波之間的結(jié)構(gòu)特征關(guān)系建立模板庫(kù),根據(jù)模板庫(kù)對(duì)深度神經(jīng)網(wǎng)絡(luò)(Deep neural networks,DNN)進(jìn)行訓(xùn)練,并識(shí)別螺旋槳的葉片數(shù)目。文獻(xiàn)[17]將梅爾頻率倒譜系數(shù)(Melfrequency cepstrum coefficient,MFCC)和頻譜包絡(luò)特征輸入卷積神經(jīng)網(wǎng)絡(luò)(Convolutional neural networks,CNN)和深度置信網(wǎng)絡(luò)(Deep belief networks,DBN),對(duì)船舶目標(biāo)進(jìn)行分類。文獻(xiàn)[18]提出一個(gè)類似方案,將線性預(yù)測(cè)倒譜系數(shù)(Linear predictive cepstral coefficient,LPCC)和MFCC 串聯(lián)后輸入DBN 網(wǎng)絡(luò)。文獻(xiàn)[19]將梅爾頻率特征分別輸入支持向量機(jī)(Support vector machine,SVM)和VGGish 網(wǎng)絡(luò)中,對(duì)生物、潛艇和船只3 種目標(biāo)噪聲進(jìn)行分類。文獻(xiàn)[20]使用堆疊降噪自編碼器(Stacked denoising auto encoder,SDAE)對(duì)原始信號(hào)數(shù)據(jù)進(jìn)行降維和逐層特征提取,然后使用SVM和BP 網(wǎng)絡(luò)進(jìn)行分類。文獻(xiàn)[21]開(kāi)展了基于長(zhǎng)短時(shí)記憶(Long short-term memory,LSTM)網(wǎng)絡(luò)的聲學(xué)目標(biāo)分類,發(fā)現(xiàn)時(shí)域、頻域和MFCC 三種特征具有相當(dāng)?shù)姆诸愋阅堋kS后,他們對(duì)DEMON 譜和MFCC等特征進(jìn)行融合,提高了LSTM 網(wǎng)絡(luò)的分類準(zhǔn)確率[22]。
大多數(shù)現(xiàn)有水下目標(biāo)分類算法首先通過(guò)波束形成將水聽(tīng)器陣列信號(hào)約減為一維信號(hào),然后提取頻域特征輸入深度網(wǎng)絡(luò)進(jìn)行訓(xùn)練。本文開(kāi)展基于深度學(xué)習(xí)的基頻估計(jì),但是重點(diǎn)考慮如下兩個(gè)問(wèn)題:
(1)在特征提取時(shí),絕大多數(shù)研究都采用了MFCC特征。MFCC反映能量在不同頻率區(qū)間的分布,本質(zhì)上是對(duì)噪聲信號(hào)頻譜包絡(luò)的一種描述,關(guān)注的是連續(xù)譜而非調(diào)制譜特征。
(2)在波束形成時(shí),會(huì)丟失很多細(xì)節(jié)信息,且會(huì)引入新的陣形估計(jì)誤差。
對(duì)于問(wèn)題(1),由于調(diào)制譜是由基頻及其諧頻決定的,而一般采用DEMON 譜來(lái)提取調(diào)制譜,所以本文在估計(jì)基頻時(shí)候選擇DEMON 譜作為網(wǎng)絡(luò)的輸入。需要注意的是,在目標(biāo)航速很低時(shí)噪聲的調(diào)制效應(yīng)很弱,因此調(diào)制譜分析更適合分析非低速航行下的目標(biāo)噪聲。
對(duì)于問(wèn)題(2),一種更加合理的選擇是將水聽(tīng)器陣列采集的多通道信號(hào)直接用于特征提取。然而,多通道數(shù)據(jù)不僅會(huì)導(dǎo)致特征數(shù)急速增長(zhǎng),而且還會(huì)引入隨機(jī)噪聲的譜特征。本文擬采用CNN 網(wǎng)絡(luò)對(duì)多通道特征進(jìn)行二次特征提取,實(shí)現(xiàn)特征降維和凈化。最后,將多個(gè)時(shí)間窗對(duì)應(yīng)的二次特征輸入LSTM網(wǎng)絡(luò)實(shí)現(xiàn)基頻估計(jì)。
本文提出的基頻檢測(cè)算法流程如圖1所示。首先,對(duì)每個(gè)通道的噪聲信號(hào)作加窗分幀處理,在每個(gè)時(shí)間窗內(nèi)提取DEMON 譜特征;然后,利用梳狀濾波器對(duì)DEMON 譜特征中包含的倍頻關(guān)系進(jìn)行增強(qiáng);最后,將同一時(shí)間窗內(nèi)所有通道特征組成二維矩陣經(jīng)卷積層處理后輸入LSTM網(wǎng)絡(luò)。
本文采用分類網(wǎng)絡(luò)來(lái)估計(jì)基頻。把基頻取值范圍分成幾個(gè)頻段,每個(gè)頻段當(dāng)作一個(gè)類別,將基頻估計(jì)問(wèn)題轉(zhuǎn)化為分類問(wèn)題。需要說(shuō)明的是,也可以采用回歸網(wǎng)絡(luò)進(jìn)行基頻估計(jì)。但是,在很多研究領(lǐng)域中,回歸網(wǎng)絡(luò)或者分類網(wǎng)絡(luò)在性能上并不存在本質(zhì)的區(qū)別[23?24]。下面將詳細(xì)介紹算法各個(gè)步驟的具體實(shí)現(xiàn)方法。
DEMON譜的計(jì)算流程如圖2所示。
圖2 DEMON 譜計(jì)算流程圖Fig.2 The DEMON spectrum extraction procedure
調(diào)制信號(hào)對(duì)不同頻帶噪聲的信號(hào)調(diào)制強(qiáng)度是不同的[7]??梢詫⑿盘?hào)的頻譜劃分成多個(gè)頻段,然后將不同頻段的線譜進(jìn)行融合來(lái)提高線譜質(zhì)量。具體包括如下幾個(gè)步驟:(1)在高頻端選取若干個(gè)子帶,對(duì)原始噪聲信號(hào)進(jìn)行時(shí)域帶通濾波;(1)對(duì)每個(gè)子帶進(jìn)行平方解調(diào),得到時(shí)域包絡(luò);(2)對(duì)包絡(luò)做快速傅里葉變換(Fast Fourier transform,FFT)得到頻譜,并利用雙向α濾波器去除趨勢(shì)項(xiàng)得到各個(gè)子帶的線譜;(3)根據(jù)線譜根數(shù)將各子帶的線譜進(jìn)行加權(quán)融合,得到最終的線譜特征??紤]到水中運(yùn)動(dòng)目標(biāo)的實(shí)際工況,后面實(shí)驗(yàn)中將基頻的搜索范圍限制在5~10 Hz之間。而且,由于DEMON譜的線譜階數(shù)不會(huì)太高[7],本文以10 階為限,僅保留100 Hz以下的DEMON譜。
受到不穩(wěn)定調(diào)制的影響,線譜之間的倍頻關(guān)系可能會(huì)減弱或消失。本文采用文獻(xiàn)[25]提出的梳狀濾波器對(duì)倍頻關(guān)系進(jìn)行增強(qiáng)。梳狀濾波器由許多按等頻率間隔排列的通帶和阻帶組成,能夠很好地保留信號(hào)中的倍頻關(guān)系。
對(duì)于理想的DEMON 譜,其對(duì)數(shù)頻域上基頻及倍頻的分布可以表示為
其中,b為線譜幅度,k表示第k個(gè)諧頻,f0為基頻,N(q)為加性噪聲。
理想狀態(tài)下,各次諧波線譜之間遵守嚴(yán)格的倍數(shù)關(guān)系。當(dāng)梳狀濾波器h(q)的第一個(gè)通帶移動(dòng)至某個(gè)線譜頻率處時(shí),其余各通帶會(huì)落在該頻率對(duì)應(yīng)的各次諧波上,對(duì)各個(gè)諧頻進(jìn)行累積。在第一個(gè)通帶位于基頻f0處時(shí)達(dá)到峰值。相應(yīng)的理想濾波器h(q)可以用式(2)描述:
但在實(shí)際中,基頻及諧頻之間的倍頻關(guān)系并不嚴(yán)格,如諧頻位置存在偏差或存在一定的譜峰寬度。因此,DEMON 譜不能直接用式(1)描述,相應(yīng)的也不能用式(2)的濾波器進(jìn)行濾波。一種考慮了偏差和譜峰寬度的濾波器為
其中,g(q)為
參數(shù)K是諧波個(gè)數(shù),γ代表譜峰寬度。在后面的實(shí)驗(yàn)中K取10,γ取1.8,取β,使
利用梳狀濾波器進(jìn)行濾波時(shí),首先將特征信號(hào)映射至對(duì)數(shù)域,q=logf,然后將DEMON譜與濾波器做卷積得到增強(qiáng)后的線譜特征:
梳狀濾波前后的DEMON 譜如圖3所示,濾波后諧波結(jié)構(gòu)(線譜間的倍頻關(guān)系)明顯增強(qiáng)。
圖3 梳狀濾波器對(duì)DEMON 譜的增強(qiáng)效果Fig.3 Enhancement to DEMON spectrum by the comb filtering
提取DEMON 譜特征后,可以通過(guò)訓(xùn)練分類網(wǎng)絡(luò)來(lái)估計(jì)基頻。作者在文獻(xiàn)[26]中提出過(guò)一種基于CNN 網(wǎng)絡(luò)的檢測(cè)方法,利用小波變換對(duì)DEMON譜特征去噪,然后將將凈化譜特征輸入CNN 網(wǎng)絡(luò)來(lái)估計(jì)基頻。但是,去噪可能會(huì)造成譜特征信息的丟失,而且單純采用CNN 網(wǎng)絡(luò)需要對(duì)較長(zhǎng)的時(shí)間序列進(jìn)行融合,影響實(shí)時(shí)性。本文去掉了去噪步驟,同時(shí)在CNN 網(wǎng)絡(luò)上增加了LSTM 網(wǎng)絡(luò),以期利用LSTM 網(wǎng)絡(luò)的時(shí)序建模能力去捕獲低信噪比條件下基頻及其倍頻的統(tǒng)計(jì)特性,提高基頻估計(jì)的穩(wěn)定性和實(shí)時(shí)性。
LSTM是循環(huán)神經(jīng)網(wǎng)絡(luò)(Recurrent neural network,RNN)的一種改進(jìn)結(jié)構(gòu),具有RNN 處理時(shí)間序列信號(hào)能力的同時(shí)解決了RNN 存在的長(zhǎng)時(shí)依賴問(wèn)題,被廣泛用于處理各種語(yǔ)聲任務(wù)。LSTM 基本單元結(jié)構(gòu)如圖4所示。其中,xt為各時(shí)間步輸入LSTM 單元的特征,ht是各時(shí)間步LSTM 單元的輸出,sig為sigmoid函數(shù)。
圖4 LSTM 基本單元Fig.4 Cell of LSTM
網(wǎng)絡(luò)的整體結(jié)構(gòu)如圖5所示,包含一個(gè)擁有8個(gè)3×3 卷積核的卷積層、一個(gè)卷積核尺寸為2×2的池化層、一個(gè)含有256 個(gè)神經(jīng)元的LSTM 層以及一個(gè)大小為128的隱藏層和大小為25的softmax 分類層。注意,輸出是one-hot 向量,當(dāng)基頻的真實(shí)值落在相應(yīng)頻率范圍內(nèi)時(shí),該類值為1,其余為0。損失函數(shù)采用交叉熵函數(shù),網(wǎng)絡(luò)使用mini-batch 進(jìn)行訓(xùn)練。其中卷積層對(duì)輸入的多通道DEMON譜特征進(jìn)行降維,LSTM層用于提取輸入信號(hào)的時(shí)序特征,隨后輸入分類網(wǎng)絡(luò)進(jìn)行分類。
圖5 網(wǎng)絡(luò)結(jié)構(gòu)示意圖Fig.5 The proposed deep-learning network structure
訓(xùn)練深度網(wǎng)絡(luò)需要大量標(biāo)定好的數(shù)據(jù)。但是,真實(shí)艦船噪聲數(shù)據(jù)往往比較稀缺,而且實(shí)測(cè)數(shù)據(jù)標(biāo)定是一項(xiàng)繁瑣且容易出錯(cuò)的工作。因此本文首先使用仿真數(shù)據(jù)對(duì)網(wǎng)絡(luò)進(jìn)行訓(xùn)練,在湖試中利用實(shí)測(cè)艦船噪聲數(shù)據(jù)對(duì)預(yù)訓(xùn)練好的網(wǎng)絡(luò)進(jìn)行微調(diào)后,再進(jìn)行基頻估計(jì)。本節(jié)介紹艦船噪聲信號(hào)的仿真方法。
對(duì)于仿真艦船噪聲信號(hào)來(lái)說(shuō),周期性局部平穩(wěn)過(guò)程[14]和準(zhǔn)周期性隨機(jī)聲脈沖序列模型[15]是描述其時(shí)域信號(hào)較為客觀接近實(shí)際的兩種數(shù)理模型。準(zhǔn)周期性隨機(jī)聲脈沖序列模型可以模擬以不同噪聲源為主導(dǎo)的不同工況下的目標(biāo)輻射噪聲信號(hào),其脈沖形狀和脈沖出現(xiàn)的周期性程度可取不同值,使其具有不同的寬帶連續(xù)譜形狀和不同線譜幅度、調(diào)制深度,具有良好的普適性,因此本文根據(jù)文獻(xiàn)[15]對(duì)目標(biāo)噪聲信號(hào)進(jìn)行仿真。
艦船噪聲的頻譜可以看作由連續(xù)譜和線譜疊加組成,噪聲的時(shí)域波形可以看作由準(zhǔn)周期性隨機(jī)脈沖聲序列構(gòu)成,其中第n個(gè)聲脈沖的出現(xiàn)時(shí)刻(脈沖前沿)為
其中,T為聲脈沖序列之間的平均間隔,Δn為脈沖序列在周期點(diǎn)附近的隨機(jī)擺幅,服從均值為零、方差為δΔ的正態(tài)分布。
準(zhǔn)周期性隨機(jī)聲脈沖序列指出噪聲輻射線譜相對(duì)于連續(xù)譜的幅值僅取決于脈沖的隨機(jī)擺幅,脈沖序列的準(zhǔn)周期性越差,則線譜幅值越低。對(duì)于不同工況的船舶,通過(guò)選擇周期性隨機(jī)序列脈沖的各個(gè)參數(shù)可以獲得不同頻率和幅度的線譜,以及譜峰頻率不同、連續(xù)譜形狀和衰減規(guī)律不同的功率譜[15]。
以聲脈沖形狀為指數(shù)衰減型為例給出具體實(shí)現(xiàn)過(guò)程。第n個(gè)聲脈沖的形狀為[15]
其中,γ為衰減系數(shù),τ是脈沖持續(xù)時(shí)間。脈沖幅度分布遵循式(9):
每個(gè)脈沖的起始時(shí)間在槳葉周期附近服從高斯分布:
圖6給出一段仿真信號(hào)的頻譜。
圖6 一段基頻為5 Hz 的噪聲仿真信號(hào)的頻譜Fig.6 The frequency spectrum of a synthesized ship-radiated noise signal with the shaft frequency being 5 Hz
海洋環(huán)境噪聲和水聲信道傳輸過(guò)程會(huì)降低接收點(diǎn)處接收信號(hào)的信噪比,本節(jié)介紹如何仿真受海洋環(huán)境影響的接收點(diǎn)信號(hào)。
本文主要面向接收點(diǎn)與目標(biāo)之間距離為中近距離的情形,側(cè)重考慮隨距離變化的聲能平均傳播損失、海底與海面反射引起的相干多途干擾以及海洋環(huán)境噪聲加性干擾。采用基于射線聲學(xué)的bellhop模型對(duì)傳播損失和多途干擾進(jìn)行仿真,聲源深度10 m,接收6 元陣,接收深度10 m,為垂直線陣,接收陣水平距離2000 m,海水密度1.0 g/cm3,海底聲速1680 m/s,海底密度1.8 g/cm3,吸收系數(shù)0.6 dB/λ。聲速剖面分別選用等聲速梯度剖面、負(fù)聲速梯度剖面、含有溫躍層的淺海聲速剖面、深海Munk 聲速剖面等,水深分別選用50 m、500 m、5000 m,來(lái)模擬不同環(huán)境下的相干多途傳播信道。聲源使用2.1 節(jié)中合成的仿真信號(hào)。海洋環(huán)境噪聲使用不同信噪比高斯白噪聲模擬。
合成的仿真噪聲數(shù)據(jù)與真實(shí)工況下的噪聲并不完全一致,但可以使用仿真數(shù)據(jù)完成網(wǎng)絡(luò)訓(xùn)練后,再利用真實(shí)數(shù)據(jù)對(duì)網(wǎng)絡(luò)進(jìn)行微調(diào)來(lái)彌補(bǔ)二者之間的差別。
本文設(shè)計(jì)了4個(gè)實(shí)驗(yàn)來(lái)測(cè)試本文提出的基頻檢測(cè)算法。
(1)分別采用本文提出的深度學(xué)習(xí)算法(數(shù)據(jù)驅(qū)動(dòng))和傳統(tǒng)的模型驅(qū)動(dòng)方法對(duì)仿真噪聲信號(hào)進(jìn)行基頻檢測(cè),以測(cè)試數(shù)據(jù)驅(qū)動(dòng)方法在抗噪性和適應(yīng)性上的提升。
(2)本文在文獻(xiàn)[26]的基礎(chǔ)上,去掉了去噪步驟,增加了LSTM網(wǎng)絡(luò)。為此,本文設(shè)計(jì)了一組對(duì)比實(shí)驗(yàn)來(lái)比較二者在準(zhǔn)確性和實(shí)時(shí)性上的性能差異。
(3)為了測(cè)試LSTM 網(wǎng)絡(luò)在提取時(shí)序譜特征上的可行性,分別采用CNN 和CNN+LSTM 網(wǎng)絡(luò)開(kāi)展時(shí)序基頻檢測(cè)。實(shí)驗(yàn)中保持兩者卷積層部分的結(jié)構(gòu)相同。
(4)分別采用本文提出的深度學(xué)習(xí)算法(數(shù)據(jù)驅(qū)動(dòng))和傳統(tǒng)的模型驅(qū)動(dòng)方法對(duì)外場(chǎng)實(shí)測(cè)噪聲數(shù)據(jù)進(jìn)行基頻檢測(cè),以測(cè)試本文方法在實(shí)測(cè)數(shù)據(jù)上的檢測(cè)性能。
在仿真數(shù)據(jù)準(zhǔn)備階段,總共生成了長(zhǎng)度大約為12 h 的數(shù)據(jù),采樣頻率為10 kHz,數(shù)據(jù)的基頻范圍在5~10 Hz 之間,按0.2 Hz 的間隔劃分為25 個(gè)類別。估計(jì)的基頻值定義為預(yù)測(cè)類別的中點(diǎn)。例如:劃分到5~5.2 Hz 類別的基頻預(yù)測(cè)值為5.1 Hz。仿真的噪聲數(shù)據(jù)中槳葉數(shù)的取值為3~7 葉。此外,本文將80%的樣本作為訓(xùn)練數(shù)據(jù)集,剩余20%的數(shù)據(jù)作為測(cè)試樣本集。評(píng)價(jià)指標(biāo)包括:P,定義為誤差小于0.1 Hz 的預(yù)測(cè)值比例,計(jì)算公式為P=(N ?Ne)/N ×100%,其中Ne為預(yù)測(cè)誤差超過(guò)0.1 Hz 的數(shù)據(jù)個(gè)數(shù),N為總數(shù)據(jù)量;平均誤差,其中fig表示第i段數(shù)據(jù)的真實(shí)基頻值,fip表示第i段數(shù)據(jù)的預(yù)測(cè)基頻值。
傳統(tǒng)檢測(cè)方法存在對(duì)先驗(yàn)知識(shí)的依賴,尤其DEMON 譜提取過(guò)程和倍頻統(tǒng)計(jì)步驟需要人工設(shè)定很多參數(shù)。本文方法簡(jiǎn)化預(yù)處理過(guò)程,并利用神經(jīng)網(wǎng)絡(luò)建模的方式降低檢測(cè)算法對(duì)先驗(yàn)知識(shí)的依賴。為了比較兩類方法的性能,本文選取文獻(xiàn)[12]和文獻(xiàn)[13]中提出的兩種基于DEMON 譜的基頻提取算法作為對(duì)比。這兩種方法計(jì)算基頻時(shí),首先利用波束形成將陣列信號(hào)約減為一維信號(hào),再進(jìn)行計(jì)算。
表1 給出了兩種不同信噪比(Signal to noise ratio,SNR)背景噪聲強(qiáng)度下對(duì)仿真數(shù)據(jù)進(jìn)行基頻檢測(cè)的結(jié)果,兩種模型驅(qū)動(dòng)算法的檢測(cè)性能相當(dāng),而本文方法在誤差小于0.1 Hz 的預(yù)測(cè)值比例P上有較大提升,且平均誤差更小。相對(duì)于傳統(tǒng)方法從DEMON 譜提取人工特征然后計(jì)算基頻而言,基于深度網(wǎng)絡(luò)的方法提取DEMON 譜的高層特征再進(jìn)行基頻估計(jì),能夠降低噪聲的影響,從而改善檢測(cè)結(jié)果。而傳統(tǒng)方法提取的淺層特征對(duì)噪聲線譜的抗干擾能力相對(duì)較弱,因此對(duì)于SNR 較低、線譜質(zhì)量較差的DEMON 譜,本文方法能夠取得較常規(guī)方法更好的檢測(cè)結(jié)果。但是,當(dāng)DEMON譜質(zhì)量較好,干擾線譜很少的時(shí)候,常規(guī)方法也能獲得比較理想的檢測(cè)結(jié)果。
表1 本文方法與傳統(tǒng)方法的對(duì)比結(jié)果Table 1 Comparison between classic methods and the proposed method
文獻(xiàn)[26]提出了一種基于CNN 網(wǎng)絡(luò)的基頻檢測(cè)方法。而本文優(yōu)化了網(wǎng)絡(luò)結(jié)構(gòu),去掉了DEMON譜去噪和多幀融合步驟,使得特征提取部分更加簡(jiǎn)單。兩種方法的檢測(cè)結(jié)果對(duì)比如表2所示。
表2 與文獻(xiàn)[26]進(jìn)行對(duì)比Table 2 Comparison with the method in Ref.[26]
從表2 可以看出,當(dāng)信號(hào)輸入時(shí)長(zhǎng)上由20 s 下降至6 s 時(shí),本文的檢測(cè)算法幾乎達(dá)到同樣的準(zhǔn)確率;而輸入時(shí)長(zhǎng)增加至10 s時(shí),誤差小于0.1 Hz的預(yù)測(cè)值比例P會(huì)略高于CNN網(wǎng)絡(luò)。因此,盡管簡(jiǎn)化了預(yù)處理程序,但是LSTM 網(wǎng)絡(luò)卻能夠以較短的信號(hào)輸入時(shí)長(zhǎng)獲得大致相同的P值;從不同時(shí)長(zhǎng)的檢測(cè)結(jié)果能夠看出,本文的方法在時(shí)效性上有了較大的提升。對(duì)于本文提出的算法,對(duì)比時(shí)長(zhǎng)為3 s 和6 s的實(shí)驗(yàn)結(jié)果,可以發(fā)現(xiàn)時(shí)長(zhǎng)較長(zhǎng)的信號(hào)能夠提供更多穩(wěn)定的檢測(cè)結(jié)果。由于計(jì)算代價(jià)和信號(hào)長(zhǎng)度成正比,這也提示我們可以通過(guò)調(diào)整輸入信號(hào)的時(shí)長(zhǎng)來(lái)滿足不同任務(wù)對(duì)準(zhǔn)確率和實(shí)時(shí)性的不同需求。
為了驗(yàn)證LSTM 網(wǎng)絡(luò)從時(shí)序DEMON 譜中提取統(tǒng)計(jì)特征的能力,分別采用CNN和CNN+LSTM網(wǎng)絡(luò)進(jìn)行基頻檢測(cè)。表3 列出了兩種網(wǎng)絡(luò)結(jié)構(gòu)在不同的輸入信號(hào)長(zhǎng)度上的實(shí)驗(yàn)結(jié)果。CNN 的輸入為一幀語(yǔ)音信號(hào)計(jì)算的DEMON譜,添加LSTM層的網(wǎng)絡(luò)每輸入5 個(gè)時(shí)間幀輸出一個(gè)檢測(cè)結(jié)果,其中幀間重疊為50%。
表3 CNN 與CNN+LSTM 的實(shí)驗(yàn)結(jié)果對(duì)比Table 3 Comparison between CNN and CNN + LSTM
當(dāng)幀長(zhǎng)為1 s時(shí),CNN網(wǎng)絡(luò)的P值在53%左右,添加LSTM 結(jié)構(gòu)后增加至74%;當(dāng)幀長(zhǎng)增加至2 s時(shí),前者的P值上升至75%左右,而后者提高至84%左右。由實(shí)驗(yàn)結(jié)果能夠看出,隨著幀長(zhǎng)的增加,輸入網(wǎng)絡(luò)的特征信息將增多,基頻的檢測(cè)精度上升;而在相同的幀長(zhǎng)情況下,添加LSTM 層后精度有較大的提升,表明LSTM 網(wǎng)絡(luò)能夠較大幅度提升基頻檢測(cè)的準(zhǔn)確率。
分別利用湖試數(shù)據(jù)和海試數(shù)據(jù)對(duì)所提算法進(jìn)行測(cè)試。其中,湖試數(shù)據(jù)于千島湖外場(chǎng)實(shí)驗(yàn)中獲得,目標(biāo)船只噸位為幾十噸級(jí),接收距離約1 km,共采集216 段數(shù)據(jù);海試數(shù)據(jù)于三亞外場(chǎng)實(shí)驗(yàn)中獲得,為百噸級(jí)漁船噪聲,接收距離約2 km,共采集162段數(shù)據(jù)。兩次實(shí)驗(yàn)的接收陣均為24 陣元的水平線陣,陣元距離1.875 m,位于水下15 m,采樣頻率為20 kHz。數(shù)據(jù)共包含5 種不同轉(zhuǎn)速,基頻范圍為5~10 Hz。對(duì)使用湖試數(shù)據(jù)進(jìn)行基頻估計(jì)前,先利用實(shí)測(cè)噪聲數(shù)據(jù)對(duì)神經(jīng)網(wǎng)絡(luò)的權(quán)值進(jìn)行微調(diào)學(xué)習(xí)。為了擴(kuò)充數(shù)據(jù)集,本文采用加噪、平移、縮放等方式對(duì)實(shí)測(cè)數(shù)據(jù)進(jìn)行數(shù)據(jù)集擴(kuò)充。使用20%的數(shù)據(jù)作為訓(xùn)練集,其余80%數(shù)據(jù)作為測(cè)試集。
將無(wú)目標(biāo)情況下采集到的背景噪聲放大后疊加到原始信號(hào)上,疊加后信號(hào)的信噪比大約為0 dB,用于驗(yàn)證加噪情況下算法的性能。
表4 給出了兩組外場(chǎng)實(shí)驗(yàn)數(shù)據(jù)的基頻檢測(cè)結(jié)果。其中原始數(shù)據(jù)中目標(biāo)距離較近,信號(hào)的信噪比相對(duì)較高。因此,本文方法及常規(guī)基頻檢測(cè)方法均獲得了較好的檢測(cè)結(jié)果,但本文方法的平均誤差更小。對(duì)于加噪后的信號(hào),本文方法較常規(guī)方法在精度上有較大的提升,并且平均誤差在可接受的范圍;常規(guī)方法的精度較低且常出現(xiàn)倍頻半頻錯(cuò)誤的緣故導(dǎo)致平均誤差很大。
表4 本文方法與傳統(tǒng)方法在實(shí)測(cè)數(shù)據(jù)上的檢測(cè)性能對(duì)比Table 4 Comparison between classic methods and the proposed method on the field dataset
圖7 給出了一段實(shí)測(cè)噪聲的時(shí)域波形及其DEMON 譜,從DEMON 譜中能夠看到較多的干擾線譜。表5 給出了該段數(shù)據(jù)分別使用3 種方法得到的檢測(cè)結(jié)果??梢钥吹?,常規(guī)方法由于受到干擾線譜的影響,估計(jì)出的基頻值誤差較大。
圖7 某段基頻為8.4 Hz 的漁船噪聲數(shù)據(jù)Fig.7 A segment of sea trial data with shaft frequency being 8.4 Hz
表5 圖7 的基頻檢測(cè)結(jié)果Table 5 Fundamental frequency detection results of the signal segment in Fig.7
本文提出了一種基于CNN 和LSTM 網(wǎng)絡(luò)的水下目標(biāo)輻射噪聲基頻檢測(cè)方法。在網(wǎng)絡(luò)輸入上,與傳統(tǒng)方法利用波束形成融合多通道信息不同,本文提取每個(gè)通道的DEMON 譜并以二維矩陣的方式直接送入網(wǎng)絡(luò)中,充分利用各個(gè)通道的信息;在特征提取部分,去掉了先前工作中的去噪和多幀融合步驟,在簡(jiǎn)化預(yù)處理步驟的同時(shí)提高算法的實(shí)時(shí)性,也擺脫了傳統(tǒng)模型驅(qū)動(dòng)算法在預(yù)處理過(guò)程中對(duì)先驗(yàn)知識(shí)的依賴。最后,將經(jīng)過(guò)CNN+LSTM 提取的特征輸入全連接層實(shí)現(xiàn)基頻估計(jì)。仿真實(shí)驗(yàn)和實(shí)驗(yàn)數(shù)據(jù)表明,本文方法能夠較好適應(yīng)模擬的不同環(huán)境和不同信噪比的目標(biāo)噪聲,具有良好泛化性能,可望實(shí)際推廣;在一定信噪比下,能夠從時(shí)序DEMON 譜特征中估計(jì)出較為準(zhǔn)確的基頻值,可供進(jìn)一步研究和應(yīng)用參考。
需要注意的是,本文主要關(guān)注較高航速下目標(biāo)噪聲的基頻檢測(cè)。當(dāng)航行速度很低時(shí),無(wú)法從DEMON 譜中提取到基頻的調(diào)制信息,所以本文算法不適用于低速狀態(tài)的航行器的基頻檢測(cè)。且限于實(shí)測(cè)數(shù)據(jù)規(guī)模的限制,本文使用仿真數(shù)據(jù)進(jìn)行訓(xùn)練。仿真數(shù)據(jù)并不能完好地模擬實(shí)測(cè)數(shù)據(jù),因此對(duì)實(shí)測(cè)數(shù)據(jù)的檢測(cè)結(jié)果可能有一定的影響。后續(xù)工作中隨著實(shí)測(cè)數(shù)據(jù)數(shù)量的增加,將盡可能利用實(shí)測(cè)數(shù)據(jù)對(duì)網(wǎng)絡(luò)進(jìn)行訓(xùn)練,進(jìn)一步提高網(wǎng)絡(luò)的性能。