李海濤,劉 振,陳 喆,邱家興
(海軍潛艇學(xué)院,山東青島266071)
船舶輻射噪聲分類(lèi)識(shí)別是判別船舶目標(biāo)類(lèi)型的重要方法。近年來(lái),深度學(xué)習(xí)技術(shù)的發(fā)展為船舶輻射噪聲分類(lèi)識(shí)別提供了一個(gè)新的方法。國(guó)內(nèi)外許多專(zhuān)家學(xué)者將深度學(xué)習(xí)技術(shù)應(yīng)用于船舶輻射噪聲分類(lèi)識(shí)別上,以提高船舶目標(biāo)分類(lèi)識(shí)別能力。Sabara R基于圖形信號(hào)處理和卷積神經(jīng)網(wǎng)絡(luò)研究,開(kāi)發(fā)了一種基于圖形卷積神經(jīng)網(wǎng)絡(luò)的水聲目標(biāo)識(shí)別系統(tǒng)[1]。Kamal S使用深度置信網(wǎng)絡(luò)提取信號(hào)時(shí)頻信息的深度特征用于分類(lèi)識(shí)別[2]。國(guó)內(nèi)也對(duì)基于深度學(xué)習(xí)的船舶輻射噪聲分類(lèi)識(shí)別方法進(jìn)行了深入的研究,主要方法是使用深度神經(jīng)網(wǎng)絡(luò)[3~5]、卷積神經(jīng)網(wǎng)絡(luò)[6~13]、深度置信網(wǎng)絡(luò)[13~16]、自編碼神經(jīng)網(wǎng)絡(luò)[17~19]等模型提取不同輸入數(shù)據(jù)的深度特征,并用于分類(lèi)識(shí)別。
人工聽(tīng)測(cè)判型是船舶輻射噪聲分類(lèi)識(shí)別的重要方法。在此過(guò)程中,操作員獲得的信息僅為人耳聽(tīng)測(cè)得到的船舶輻射噪聲。經(jīng)驗(yàn)豐富的操作員根據(jù)多年積累的先驗(yàn)知識(shí)對(duì)聽(tīng)測(cè)的噪聲信號(hào)進(jìn)行分類(lèi)識(shí)別。研究人耳聽(tīng)覺(jué)特性,對(duì)于分類(lèi)識(shí)別具有重要意義。張大偉[20]將聽(tīng)覺(jué)中樞上的二維聽(tīng)覺(jué)譜圖作為卷積神經(jīng)網(wǎng)絡(luò)的輸入,提取出深度特征并用于分類(lèi)識(shí)別。楊宏暉[21]使用多尺度卷積濾波器將時(shí)域信號(hào)分解為具有不同頻率分量的信號(hào),使用卷積神經(jīng)網(wǎng)絡(luò)對(duì)每個(gè)信號(hào)進(jìn)行特征提取用于分類(lèi)識(shí)別。本文從人耳聽(tīng)覺(jué)的角度出發(fā),提出一種融合人耳聽(tīng)覺(jué)特性與堆疊自編碼神經(jīng)網(wǎng)絡(luò)(Stacked Auto-Encoder Network,SAE)的船舶輻射噪聲分類(lèi)方法。該方法首先使用Mel濾波器提取船舶輻射噪聲模擬人耳聽(tīng)覺(jué)特性的特征量,然后將該特征量作為堆棧自編碼神經(jīng)網(wǎng)絡(luò)的輸入,逐層提取輸入數(shù)據(jù)的深度特征并用于分類(lèi)識(shí)別。
研究表明,人耳對(duì)聲音的選擇不均勻。它在自己關(guān)注的頻率范圍內(nèi)聽(tīng)測(cè)度較高,在其他頻率范圍內(nèi)聽(tīng)測(cè)度較低,人耳的這種選擇可以用一組Mel濾波器來(lái)模擬。Mel濾波器在頻率上分布不均勻,它在高頻段分布稀疏,在低頻段分布密集。通過(guò)Mel濾波器可以將信號(hào)真實(shí)頻率轉(zhuǎn)化為人耳聽(tīng)覺(jué)關(guān)注的Mel頻率,Mel頻率與真實(shí)頻率近似滿足如下關(guān)系式:
其變化趨勢(shì)圖如圖1所示。
圖1 Mel頻率與真實(shí)頻率關(guān)系圖Fig.1 Diagram of the relationship between Mel frequency and real frequency
在0~10kHz頻帶設(shè)計(jì)的20組Mel濾波器,其頻率響應(yīng)與頻率的關(guān)系如圖2所示。
圖2 Mel濾波器頻率響應(yīng)與頻率關(guān)系圖Fig.2 Diagram of frequency response and frequency of Mel filter
針對(duì)某商船信號(hào)進(jìn)行處理,信號(hào)時(shí)長(zhǎng)25s,時(shí)域波形如圖3所示。
圖3 某商船信號(hào)時(shí)域波形圖Fig.3 Time-domain waveform of a merchant ship signal
對(duì)信號(hào)進(jìn)行分幀處理,每幀信號(hào)時(shí)長(zhǎng)1s,幀移0.5s。計(jì)算每幀信號(hào)的人耳聽(tīng)覺(jué)特征量。取第1幀信號(hào),作DFT處理:
得到信號(hào)頻域特征如圖4所示。
圖4 商船某幀信號(hào)頻域特征Fig.4 Frequency-domain characteristics of a frame signal of merchant ship
針對(duì)信號(hào)頻域特征,在頻域范圍內(nèi)設(shè)置1000組Mel濾波器,得到如圖5所示的特征譜圖,該特征譜圖即為模擬人耳聽(tīng)覺(jué)獲得的特征量。
圖5 通過(guò) Mel濾波器后的特征譜圖Fig.5 Characteristic Spectrum after Mel filtering
自編碼器由編碼器和解碼器2部分組成,結(jié)構(gòu)如圖6所示。
圖6 自編碼器結(jié)構(gòu)圖Fig.6 Structural diagram of self-encoder
自編碼神經(jīng)網(wǎng)絡(luò)是一種特殊的自編碼器,它通過(guò)神經(jīng)網(wǎng)絡(luò)實(shí)現(xiàn)自編碼器的功能,其結(jié)構(gòu)如圖7所示。自編碼神經(jīng)網(wǎng)絡(luò)通過(guò)訓(xùn)練一個(gè)神經(jīng)網(wǎng)絡(luò)來(lái)得到一個(gè)恒等函數(shù),使得網(wǎng)絡(luò)模型的輸出等于輸入。訓(xùn)練完成的模型具備了的能力。當(dāng)層神經(jīng)元節(jié)點(diǎn)數(shù)小于層神經(jīng)元節(jié)點(diǎn)數(shù)時(shí),為了能夠重構(gòu)輸入數(shù)據(jù),網(wǎng)絡(luò)模型必須自動(dòng)學(xué)習(xí)輸入數(shù)據(jù)的壓縮表示,這個(gè)過(guò)程是對(duì)輸入數(shù)據(jù)的特征壓縮和提取。
圖7 自編碼神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)圖Fig.7 Structural diagram of self-coding neural network
圖8 深度特征的逐層提取過(guò)程Fig.8 Extraction of depth features layer-by-layer
3.1.1 自編碼網(wǎng)絡(luò)參數(shù)選擇
自編碼神經(jīng)網(wǎng)絡(luò)訓(xùn)練中最重要的參數(shù)是確定隱含層神經(jīng)元節(jié)點(diǎn)數(shù)。目前理論上還不存在普遍的方法用于確定隱含層節(jié)點(diǎn)數(shù),節(jié)點(diǎn)數(shù)的選擇主要是通過(guò)經(jīng)驗(yàn)選擇和實(shí)驗(yàn)確定[23]。訓(xùn)練自編碼神經(jīng)網(wǎng)絡(luò)的目的是為了使輸出數(shù)據(jù)盡可能復(fù)原輸入數(shù)據(jù),因此本文通過(guò)計(jì)算神經(jīng)網(wǎng)絡(luò)輸入與輸出之間的誤差來(lái)確定隱藏層節(jié)點(diǎn)數(shù),計(jì)算公式為:
選擇某一幀商船信號(hào)的人耳聽(tīng)覺(jué)特征量,將其作為自編碼神經(jīng)網(wǎng)絡(luò)的輸入,網(wǎng)絡(luò)輸入節(jié)點(diǎn)數(shù)為1000,選擇不同的隱含層神經(jīng)元節(jié)點(diǎn)數(shù),計(jì)算網(wǎng)絡(luò)輸入與輸出之間的誤差。隨機(jī)挑選了5幀信號(hào)作為輸入,得到如圖9所示的統(tǒng)計(jì)結(jié)果。
圖9 自編碼網(wǎng)絡(luò)輸入與輸出之間的誤差Fig.9 Error between input and output of self-coding network
通過(guò)計(jì)算可以看出,當(dāng)網(wǎng)絡(luò)隱藏層神經(jīng)元節(jié)點(diǎn)數(shù)選擇為輸入層節(jié)點(diǎn)數(shù)的一半時(shí),網(wǎng)絡(luò)輸入與輸出之間的誤差最小。因此本文設(shè)置網(wǎng)絡(luò)隱藏層節(jié)點(diǎn)數(shù)為輸入神經(jīng)元節(jié)點(diǎn)數(shù)的一半。
3.1.2 深度特征提取
針對(duì)船舶輻射噪聲的人耳聽(tīng)覺(jué)特征量,設(shè)置5層自編碼神經(jīng)網(wǎng)絡(luò)提取其深度特征,設(shè)置每一層網(wǎng)絡(luò)節(jié)點(diǎn)數(shù)時(shí),隱藏層節(jié)點(diǎn)數(shù)為輸入神經(jīng)元節(jié)點(diǎn)數(shù)的一半。網(wǎng)絡(luò)模型的訓(xùn)練采取逐層訓(xùn)練的方法,每次只訓(xùn)練一層網(wǎng)絡(luò)模型,上一層網(wǎng)絡(luò)訓(xùn)練完成后,提取隱藏層數(shù)據(jù)作為下一層網(wǎng)絡(luò)的輸入,以此類(lèi)推。
當(dāng)5層自編碼神經(jīng)網(wǎng)絡(luò)全部訓(xùn)練完成之后,提取每層網(wǎng)絡(luò)的輸入層和隱藏層數(shù)據(jù)堆疊成SAE網(wǎng)絡(luò)模型,則該網(wǎng)絡(luò)模型的節(jié)點(diǎn)數(shù)設(shè)置為1000-500-250-100-50-25。選擇某商船信號(hào)進(jìn)行試驗(yàn),提取該信號(hào)通過(guò)Mel濾波器的平均能量譜圖,使用上述5層自編碼神經(jīng)網(wǎng)絡(luò)提取其深度特征。觀察每一層網(wǎng)絡(luò)的輸入數(shù)據(jù)與輸出數(shù)據(jù)的相似度情況,得到5層自編碼神經(jīng)網(wǎng)絡(luò)輸入數(shù)據(jù)與輸出數(shù)據(jù)的對(duì)比圖,如圖10所示。
可以看出,每一層自編碼神經(jīng)網(wǎng)絡(luò)對(duì)輸入數(shù)據(jù)都有很好的復(fù)原效果。但是,當(dāng)輸入層網(wǎng)絡(luò)節(jié)點(diǎn)數(shù)較多時(shí),輸出數(shù)據(jù)與輸入數(shù)據(jù)之間相對(duì)誤差較大。隨著輸入層網(wǎng)絡(luò)節(jié)點(diǎn)數(shù)的減小,自編碼神經(jīng)網(wǎng)絡(luò)對(duì)輸入數(shù)據(jù)的復(fù)原效果越來(lái)越好。尤其在第5層自編碼神經(jīng)網(wǎng)絡(luò)中,輸出數(shù)據(jù)與輸入數(shù)據(jù)基本相同。提取每一層自編碼神經(jīng)網(wǎng)絡(luò)的隱藏層數(shù)據(jù),該數(shù)據(jù)即為深度特征的逐層提取過(guò)程。
圖10 五層自編碼神經(jīng)網(wǎng)絡(luò)輸入數(shù)據(jù)與輸出數(shù)據(jù)對(duì)比圖Fig.10 Contrast diagram of input data and output data of five-layer self-coding neural network
使用實(shí)測(cè)船舶輻射噪聲信號(hào)建立訓(xùn)練集和測(cè)試集,信號(hào)總數(shù)為913條,每條信號(hào)時(shí)長(zhǎng)在35~60s之間。對(duì)所有信號(hào)按照船舶類(lèi)型分類(lèi),共分25類(lèi)。針對(duì)每一條信號(hào),以3s為一段劃分樣本,對(duì)每一個(gè)樣本進(jìn)行分幀處理。計(jì)算每一幀信號(hào)模擬人耳聽(tīng)覺(jué)特征量的特征數(shù)據(jù),取平均值作為樣本的特征數(shù)據(jù)。取每條信號(hào)前3/4樣本及其對(duì)應(yīng)的類(lèi)別標(biāo)記作為訓(xùn)練數(shù)據(jù)集,后1/4樣本及其對(duì)應(yīng)的類(lèi)別標(biāo)記作為測(cè)試數(shù)據(jù)集。
訓(xùn)練過(guò)程分2步進(jìn)行:
第1步為無(wú)監(jiān)督訓(xùn)練,使用訓(xùn)練集數(shù)據(jù)對(duì)5層自編碼神經(jīng)網(wǎng)絡(luò)進(jìn)行訓(xùn)練。通過(guò)訓(xùn)練獲得一個(gè)初始化的網(wǎng)絡(luò)權(quán)值,訓(xùn)練完成后提取每層自編碼神經(jīng)網(wǎng)絡(luò)的輸入層和隱藏層,堆疊得到SAE網(wǎng)絡(luò)模型。
第2步訓(xùn)練過(guò)程為有監(jiān)督訓(xùn)練,使用訓(xùn)練數(shù)據(jù)集和其類(lèi)別標(biāo)記對(duì)SAE網(wǎng)絡(luò)進(jìn)行訓(xùn)練。在此過(guò)程中,統(tǒng)計(jì)網(wǎng)絡(luò)前向運(yùn)算與數(shù)據(jù)類(lèi)型標(biāo)記之間的交叉熵?fù)p失函數(shù),對(duì)網(wǎng)絡(luò)模型進(jìn)行反向傳播訓(xùn)練。當(dāng)訓(xùn)練集所有數(shù)據(jù)訓(xùn)練一遍時(shí),記為迭代一輪。統(tǒng)計(jì)每一輪迭代過(guò)程中產(chǎn)生平均損失函數(shù)隨迭代輪數(shù)的變化過(guò)程,如圖11所示。
圖11 平均損失函數(shù)隨迭代輪數(shù)變化圖Fig.11 Variation diagram of average loss function with the number of iteration rounds
保存訓(xùn)練完成的SAE模型,使用測(cè)試數(shù)據(jù)集檢測(cè)SAE網(wǎng)絡(luò)模型的識(shí)別能力。統(tǒng)計(jì)識(shí)別結(jié)果發(fā)現(xiàn),針對(duì)本實(shí)驗(yàn)所使用的數(shù)據(jù)集,識(shí)別正確率為91.19%,結(jié)果表明該方法具有較好的識(shí)別效果。
人耳聽(tīng)測(cè)是船舶輻射噪聲分類(lèi)識(shí)別的重要方法,本文從人耳聽(tīng)覺(jué)角度出發(fā),提出一種融合人耳特性與SAE網(wǎng)絡(luò)模型的船舶輻射噪聲分類(lèi)方法。該方法使用Mel濾波器模擬人耳對(duì)噪聲信號(hào)頻率的選擇,使用SAE網(wǎng)絡(luò)逐層自動(dòng)提取艦船輻射噪聲模擬人耳聽(tīng)特征量的深度特征,并將該特征用于分類(lèi)識(shí)別。針對(duì)實(shí)測(cè)船舶輻射噪聲信號(hào)進(jìn)行試驗(yàn),結(jié)果表明,本文提出的方法在試驗(yàn)數(shù)據(jù)集上的識(shí)別正確率為91.19%,具有較好的識(shí)別效果。通過(guò)本文的研究可以看出,艦船輻射噪聲的人耳聽(tīng)覺(jué)特征量可以用于分類(lèi)識(shí)別,SAE網(wǎng)絡(luò)模型能夠?qū)斎霐?shù)據(jù)進(jìn)行深度特征提取并用于分類(lèi)識(shí)別。本文的研究對(duì)于進(jìn)一步探索深度學(xué)習(xí)技術(shù)在船舶輻射噪聲分類(lèi)識(shí)別上的應(yīng)用具有重要意義。