倪俊帥,趙 梅,胡長青
(1.中國科學院聲學研究所東海研究站,上海201815;2.中國科學院大學,北京100049)
艦船輻射噪聲的分類屬于復雜的分類問題。由于大量采集艦船輻射噪聲數(shù)據(jù)較為不易,再加上艦船航行工況的復雜性,因此艦船輻射噪聲的識別是在有限樣本甚至是小樣本的條件下完成的。艦船輻射噪聲中含有豐富的特征信息,有些信息表征著艦船不變的物理特性,有些信息則與艦船的工況或狀態(tài)相關。這些時域或者頻域的特征可以通過一定的手段提取出來,用于艦船的分類與識別工作。由于艦船輻射噪聲的主體是寬帶平穩(wěn)隨機信號[1],其時域特征不穩(wěn)定,因此在時域特征上進行分類很難得到較高的正確率。艦船輻射噪聲的頻域特征相對穩(wěn)定,以往的研究多采用DEMON譜分析和梅爾倒譜系數(shù)分析等方法[2-5]提取相應的頻域特征,然后采用一定的分類手段進行分類。隨著深度學習在語音識別和計算機視覺等領域取得的一系列成果[6-8],近年來深度學習也被廣泛地應用于艦船輻射噪聲的分類與識別。
國內(nèi)外對艦船輻射噪聲深度學習分類已有較多的相關研究,取得了一定的成果。朱可卿等[9]提取了艦船輻射噪聲的頻譜、梅爾倒譜系數(shù)和線譜等特征,繪制圖像并用卷積神經(jīng)網(wǎng)絡和深度置信網(wǎng)絡進行分類,得出了深度學習方法可以有效提高艦船輻射噪聲分類正確率的結(jié)論。張少康等[10]提出了一種基于梅爾倒譜系數(shù)的長短時記憶網(wǎng)絡分類方法,具備一定的智能化水下目標分類識別能力。朱成名等[11]改進了梅爾倒譜系數(shù)提取方法,在信號預處理階段,采用正弦窗代替?zhèn)鹘y(tǒng)方法使用的漢明窗來進行頻譜估計,獲得了梅爾倒譜系數(shù)并用深度學習的方法進行分類,提高了噪聲環(huán)境下分類識別的正確率。曾賽等[12]提出一種水下目標多模態(tài)深度學習的分類識別方法。針對水聲信號的一維時域模態(tài)和二維頻域模態(tài)特征,建立一種多模態(tài)特征融合的深度學習結(jié)構(gòu),結(jié)合了長短時記憶網(wǎng)絡和卷積神經(jīng)網(wǎng)絡的優(yōu)點,提高了分類正確率。然而,在一種特征上進行分類嚴重限制了深度學習的特征提取,進而限制了艦船輻射噪聲分類正確率的提高;將艦船輻射噪聲分類轉(zhuǎn)化為圖像分類有一定的誤差,部分細節(jié)特征無法通過圖像表現(xiàn)出來。
本文為了改善分類系統(tǒng)的性能、進一步提高艦船輻射噪聲分類的正確率,提出了一種基于深度神經(jīng)網(wǎng)絡的多特征融合分類方法。文章提取了艦船輻射噪聲的頻譜特征、梅爾倒譜系數(shù)和功率譜特征,采用了基于誤差反向傳播(Back Propagation,BP)算法的具有多個輸入分支的深度神經(jīng)網(wǎng)絡,同時直接對3種特征參數(shù)進行學習分類。文章在實測艦船輻射噪聲數(shù)據(jù)上進行了實驗,選用了兩種訓練集和驗證集的劃分方法,對比了不同信噪比下多特征融合分類方法和在一種特征上進行分類方法的正確率。
梅爾(Mel)倒譜系數(shù)提取是一種基于人耳聽覺特性的特征提取方法,頻率軸上按Mel頻率尺度不均勻劃分是梅爾倒譜系數(shù)提取的重要特點[13]。Mel頻率與實際頻率f的關系可用式(1)來描述:
梅爾倒譜系數(shù)計算過程的具體步驟如下:
(1) 對艦船輻射噪聲信號進行分幀、預加重及漢明窗處理,再進行傅里葉變換得到其頻譜。然后,設計三角形帶通濾波器進行濾波。濾波器的頻率特性為
帶通濾波器輸出為
(2) 對濾波器的輸出取對數(shù),再進行離散余弦變換,得到梅爾倒譜系數(shù):
頻譜特征提取是最簡單的頻域特征提取方法,對艦船輻射噪聲數(shù)據(jù)加漢明窗處理后做若干點的離散傅里葉變換即可得到其頻譜。艦船輻射噪聲的功率譜描述了艦船輻射噪聲的信號功率在頻域的分布情況,在不考慮海洋信道影響的前提下,反映了艦船的物理特性。假定艦船輻射噪聲主體為平穩(wěn)的各態(tài)歷經(jīng)的隨機過程,采用周期圖法對艦船輻射噪聲信號做功率譜估計。為了減少噪聲譜對艦船輻射噪聲功率譜特征參數(shù)提取的影響,本文采用了一種類似于短時能量分析的平均功率譜特征提取方法。首先在頻率軸上對功率譜進行截取。艦船輻射噪聲的能量主要集中在低頻部分,因此低頻段對應的特征參數(shù)能夠有效地反映艦船輻射噪聲的基本特性。提取艦船輻射噪聲的功率譜特征參數(shù)時要舍去直流分量,一般情況下,頻率截取下限為5 Hz,上限為500 Hz。然后對截取的部分做加窗求和取平均值處理,即可得到艦船輻射噪聲的平均功率譜[14]。假設截取部分對應的頻率下限為fl,上限為fh,提取特征參數(shù)的維度為Ma,則窗寬La為
每個窗內(nèi)點數(shù)為Na,平均功率譜特征參數(shù)為
深度神經(jīng)網(wǎng)絡(Deep Neural Networks, DNN)有多個隱藏層的神經(jīng)網(wǎng)絡,其內(nèi)部的神經(jīng)網(wǎng)絡層可以分為輸入層、隱藏層和輸出層,其結(jié)構(gòu)如圖1所示。
圖1 深度神經(jīng)網(wǎng)絡結(jié)構(gòu)圖Fig.1 Structure of a deep neural network
對一個M+1層的深度神經(jīng)網(wǎng)絡,將輸入層記作“層0”,將輸出層記作“層M”。在0~M層中[15]:
其中,Zm為激勵向量,Vm為激活向量,Wm為權(quán)重矩陣,Bm為偏差系數(shù)。V0為輸入特征向量,第0層的神經(jīng)元個數(shù)由V0的維度決定。
由于艦船輻射噪聲分類屬于多分類任務,輸出層神經(jīng)元個數(shù)由分類數(shù)決定,每個輸出層神經(jīng)元代表一類,n∈{1,???,N},其中N為類的個數(shù)。輸出層采用softmax函數(shù)作為激活函數(shù)進行歸一化,第n個輸出神經(jīng)元的值代表輸入特征向量屬于類n的概率PDNN(n|V0),表達式為
訓練過程要最小化期望損失函數(shù),損失函數(shù)的輸入為網(wǎng)絡預測值和真實目標值。采用交叉熵訓練準則和誤差反向傳播(BP)算法來訓練深度神經(jīng)網(wǎng)絡。如前,深度神經(jīng)網(wǎng)絡層數(shù)為M+1,假設訓練樣本數(shù)為Lz,分類數(shù)為N,訓練過程的損失函數(shù)可表示為
多特征融合可以通過具有多個輸入分支的深度神經(jīng)網(wǎng)絡來實現(xiàn),每一個輸入分支可以用來學習一種特征。不同的輸入分支通過一個連接層結(jié)合并與隱藏層和輸出層相連[16]。多輸入深度神經(jīng)網(wǎng)絡的結(jié)構(gòu)如圖2所示。
將第k個輸入分支的第i層表示為,最后一層表示為。連接層記作V0,可以看作后一個深度神經(jīng)網(wǎng)絡的輸入層,則
圖2 多輸入深度神經(jīng)網(wǎng)絡結(jié)構(gòu)圖Fig.2 Multi-input deep neural network structure diagram
學習過程先利用輸入分支上的多個隱藏層對特征進行抽象,然后將各輸入分支的底層抽象特征通過連接層進行融合,接著再對融合特征進行深度學習,最后在網(wǎng)絡的輸出層得到分類結(jié)果。相比于分別對不同的特征逐一進行學習分類,然后對所得結(jié)果做加權(quán)平均或取最大值,最終得到分類結(jié)果的方法,具有多個輸入分支的深度神經(jīng)網(wǎng)絡可以同時查看所有可用的輸入模態(tài),從而聯(lián)合學習更加精確的數(shù)據(jù)模型。艦船輻射噪聲分類的流程如圖3所示。
圖3 艦船輻射噪聲多特征分類流程Fig.3 Multi-feature classification process of ship radiated noise
實測目標為12艘不同的艦船,按噸位大小可分為A、B、C、D四類,每類艦船各有3艘。獲取目標艦船的輻射噪聲并進行預處理共得到數(shù)據(jù)1 440段,每類目標各有360段,采樣率為均32 000 Hz,每段數(shù)據(jù)長度均為1 s。根據(jù)數(shù)據(jù)所屬的艦船目標種類為各段信號添加標簽,A類艦船的數(shù)據(jù)標簽為0,B類艦船的數(shù)據(jù)標簽為1,C類艦船的數(shù)據(jù)標簽為2,D類艦船的數(shù)據(jù)標簽為3。
提取各段信號的梅爾倒譜系數(shù)。根據(jù)1.1節(jié)特征參數(shù)提取方法,fh=16 000 Hz,取M=160,對每段信號進行處理,歸一化后去除兩個低頻和高頻分量,可以得到包含156個梅爾倒譜系數(shù)的一維數(shù)組。提取各段信號的頻譜特征。根據(jù)1.2節(jié)特征參數(shù)提取方法,對各段信號做N點的離散傅里葉變換,取N=32 000。取譜值的模并進行歸一化處理,然后選取頻率3~240 Hz對應的部分,從而得到包含238個頻譜特征參數(shù)的一維數(shù)組。提取各段信號的功率譜特征。根據(jù)1.2節(jié)特征參數(shù)提取方法,對各段信號做功率譜估計,然后截取5~500 Hz的部分,再以2 Hz為窗寬對截取部分加窗求和處理并歸一化,可以得到包含247個功率譜特征參數(shù)的一維數(shù)組。將4類艦船輻射噪聲數(shù)據(jù)提取的頻譜特征、梅爾倒譜系數(shù)特征和功率譜特征用圖像來表示,如圖4~6所示。
圖4 4類艦船輻射噪聲數(shù)據(jù)的頻譜特征參數(shù)Fig.4 Spectral characteristics of radiated noise data for four types of ships
圖5 4類艦船輻射噪聲數(shù)據(jù)的梅爾倒譜系數(shù)Fig.5 Mel cepstrum coefficients of radiated noise data for four types of ships
圖6 4類艦船輻射噪聲數(shù)據(jù)的功率譜特征參數(shù)Fig.6 Power spectral characteristics of radiated noise data for four types of ships
首先,在一種特征上進行分類。設計單輸入單輸出的深度神經(jīng)網(wǎng)絡,該網(wǎng)絡有3個隱藏層,每個隱藏層有10個神經(jīng)元。輸入層神經(jīng)元的個數(shù)為輸入特征向量的維度,輸出層神經(jīng)元的個數(shù)為標簽向量的維度。以梅爾倒譜系數(shù)特征為例,采用監(jiān)督式學習,在梅爾倒譜系數(shù)特征樣本集中隨機抽取80%的樣本作為訓練集,分50個批次對網(wǎng)絡進行訓練,以剩余的樣本作為驗證集進行驗證,網(wǎng)絡迭代30次,正確率約為98.48%,學習和分類過程用時約3.54 s。同樣選取功率譜特征樣本集進行相同實驗,正確率約為98.03%,學習和分類過程用時約3.57 s。選取頻譜特征樣本集進行相同實驗,正確率約為98.14%,學習和分類過程用時約3.55 s。
然后,同時在3種特征上進行分類。設計具有3個輸入分支的多輸入深度神經(jīng)網(wǎng)絡,如圖7所示,輸入層1的神經(jīng)元個數(shù)等于梅爾倒譜系數(shù)特征向量的維度,輸入層2的神經(jīng)元個數(shù)等于功率譜特征向量的維度,輸入層3的神經(jīng)元個數(shù)等于頻譜特征向量的維度。3個輸入分支上各有兩個隱藏層,每個隱藏層有10個神經(jīng)元。3個輸入分支通過連接層與一個具有10個神經(jīng)元的隱藏層相連接。
圖7 多輸入深度神經(jīng)網(wǎng)絡結(jié)構(gòu)Fig.7 Structure of multi-input deep neural network
按對應標簽合并3個不同特征的樣本集,合并后的樣本集樣本容量為1 440。在新的樣本集中隨機抽取80%的樣本作為訓練集,分50個批次對網(wǎng)絡進行訓練,以剩余的樣本作為驗證集進行驗證,網(wǎng)絡迭代30次。采用監(jiān)督式學習,3個輸入層分別輸入梅爾特征向量、功率譜特征向量和頻譜特征向量,以向量化的標簽作為輸出。正確率約為99.85%,學習和分類過程用時約3.56 s。該過程訓練精度和驗證精度曲線、訓練損失和驗證損失曲線如圖8和圖9所示。
圖8 訓練精度和驗證精度曲線Fig.8 Training accuracy and validation accuracy curve
圖9 訓練損失和驗證損失曲線Fig.9 Training loss and validation loss curves
在本實驗所選用的艦船輻射噪聲數(shù)據(jù)集上,采用多輸入深度神經(jīng)網(wǎng)絡,同時學習3種特征再進行分類。采用此方法的分類正確率有一定的提高,比僅學習梅爾倒譜系數(shù)特征參數(shù)時的分類正確率提高了1.37%,比僅學習功率譜特征參數(shù)時的分類正確率提高了1.82%,比僅學習頻譜特征參數(shù)時的分類正確率提高了1.71%。通過訓練損失和驗證損失曲線可知網(wǎng)絡擬合良好,網(wǎng)絡有效提取并學習了樣本的深層特征,具有較好的穩(wěn)定性。
對獲取的艦船輻射噪聲原始數(shù)據(jù)進行加噪聲處理后再進行實驗,所加噪聲為隨機噪聲,其均值為0、方差為1。實驗結(jié)果如表1所示。
由表1可見,艦船輻射噪聲原始數(shù)據(jù)加噪聲后再進行實驗,4種分類方法的正確率均隨著信噪比的降低而減小。加噪聲后,本文方法的正確率依然高于在一種特征上進行分類的方法的正確率,即
表1 不同信噪比下各分類方法的正確率Table 1 Accuracy rate of three classification methods under different signal to noise ratios
隨著信噪比的降低,本文方法在分類正確率上的優(yōu)勢更加明顯。當信噪比為0 dB時,本文方法得到的正確率較在其中一種特征上進行學習分類得到的正確率至少高出2.15%;當信噪比為-10 dB時,正確率至少高出2.98%;當信噪比為-20 dB時,正確率至少高出10.83%。此外,相比于對不同的特征逐個進行學習再對結(jié)果做融合判決的多特征分類方法,本文方法不僅能夠獲得較高的正確率,而且在分類性能上也有明顯的提高。
在實際的分類工作中,對于同類未知艦船目標,我們可以在已知的艦船輻射噪聲數(shù)據(jù)上進行訓練,然后用訓練好的模型對未知艦船進行分類。改變訓練集和驗證集進一步實驗。對于四類艦船,將A類艦船記為A1、A2和A3,B類艦船記為B1、B2和B3,C類艦船記為C1、C2和C3,D類艦船記為D1、D2和D3。以A1、A2、B1、B2、C1、C2、D1和D2的樣本作為訓練集,用來模擬已知艦船,以A3、B3、C3和D3的樣本作為驗證集,用來模擬未知艦船,在不改變神經(jīng)網(wǎng)絡參數(shù)和訓練方法的前提下進行實驗。不加噪聲時,采用梅爾倒譜系數(shù)、功率譜特征和頻譜特征得到的分類正確率分別約為89.78%、85.42%和88.33%,采用多特征融合分類得到的分類正確率約為95.13%,比在一種特征下進行分類的正確率至少高出5.35%。
本文針對艦船輻射噪聲分類問題,引入了具有多個輸入分支的深度神經(jīng)網(wǎng)絡,提取了艦船輻射噪聲的3種特征進行學習分類,并將分類結(jié)果與在一種特征上進行學習的分類結(jié)果做了對比。結(jié)果表明,該方法提高了正確率,是一種可行的分類方法。多種特征在并行學習過程中節(jié)省了學習和分類的時間,并且在多次實驗過程中艦船輻射噪聲分類的正確率結(jié)果具有較好的穩(wěn)定性。同時,它還適用于采用其他特征提取方法后的艦船輻射噪聲樣本的分類。對于采用更多種類的特征提取方法,可以通過增加深度融合網(wǎng)絡的輸入分支數(shù)量來解決。