嚴(yán)韶光,康春玉,夏志軍,李昆鵬
(1. 海軍大連艦艇學(xué)院 研究生隊(duì),遼寧 大連 116018;2. 海軍大連艦艇學(xué)院 水武與防化系,遼寧 大連 116018)
水下被動(dòng)目標(biāo)的自動(dòng)識(shí)別對(duì)于提高裝備智能化程度有著重要意義,也是國(guó)內(nèi)外水聲領(lǐng)域的研究重點(diǎn)和難點(diǎn)。依靠艦船輻射噪聲來(lái)解決目標(biāo)分類(lèi)識(shí)別問(wèn)題是主要途徑,近些年來(lái)陸續(xù)提出了一些新的解決方法,如提取連續(xù)譜特征,使用遺傳算法改進(jìn)的神經(jīng)網(wǎng)絡(luò)分類(lèi)器完成目標(biāo)分類(lèi)識(shí)別[1];將免疫算法[2](Artificial immune algorithm,AIA)與支持向量機(jī)[3](Support vector machine,SVM)結(jié)合,不斷選擇適應(yīng)度最高的SVM作為分類(lèi)器[4];運(yùn)用最小均方無(wú)失真響應(yīng)(Minimu Variance Distortionless Response,MVDR)譜系數(shù)[5]作為特征參數(shù),使用多分類(lèi)支持向量機(jī)作為分類(lèi)器等方法[6],但識(shí)別效果仍然有待提高。
2006 年,Hinton 提出的深度學(xué)習(xí)[7–9](Deep Learning,DL)直接掀起了人工智能又一輪研究熱潮[10],且在語(yǔ)音識(shí)別[11–12]、圖像識(shí)別[13–14]等模式識(shí)別領(lǐng)域取得了巨大的成功。但其在被動(dòng)聲吶目標(biāo)識(shí)別這一模式識(shí)別領(lǐng)域的研究尚處于起步階段。深度學(xué)習(xí)通過(guò)模擬人類(lèi)大腦識(shí)別信息的過(guò)程,有意識(shí)的過(guò)濾無(wú)關(guān)信息,再?gòu)闹兄饘由钊胩崛√卣鞑?jù)此完成分類(lèi)識(shí)別。深度自編碼器[15](Stacked Autoencoders,SAE)作為深度學(xué)習(xí)中的一種無(wú)監(jiān)督學(xué)習(xí)網(wǎng)絡(luò),相比較線性的分類(lèi)識(shí)別方法,SAE中的各層自編碼器進(jìn)行編碼和解碼的訓(xùn)練采用了非線性激活函數(shù),它能夠提取更充分的特征用于分類(lèi)識(shí)別。相對(duì)于淺層神經(jīng)網(wǎng)絡(luò)而言,SAE能提取輸入數(shù)據(jù)中最具代表性的深層特征來(lái)高效地完成目標(biāo)的分類(lèi)識(shí)別[16]。
本文在提取艦船輻射噪聲Welch功率譜特征的基礎(chǔ)上,提出了基于SAE的目標(biāo)分類(lèi)識(shí)別方法。首先通過(guò)深度自編碼網(wǎng)絡(luò)獲得深層特征,然后在輸出層使用softmax函對(duì)深層特征進(jìn)行分類(lèi)識(shí)別。并與文獻(xiàn)[17]中搭建的BP神經(jīng)網(wǎng)絡(luò)(NN)分類(lèi)器進(jìn)行性能對(duì)比,通過(guò)對(duì)比實(shí)驗(yàn)結(jié)果證明了SAE分類(lèi)器的優(yōu)越性。
深度自編碼網(wǎng)絡(luò)的結(jié)構(gòu)基礎(chǔ)是自編碼器(Autoencoder,AE)。每個(gè)AE包含輸入層、隱含層、輸出層,由輸入層向前傳播到隱含層的過(guò)程成為編碼,由隱含層向前傳播到輸出層的過(guò)程成為解碼,如圖1所示。
圖 1 自編碼器Fig. 1 Autoencoder
AE權(quán)重的更新可采用隨機(jī)梯度下降算法,權(quán)值更新公式如下式:
為了獲取輸入的深層低維特征,基于上述AE,采用堆棧的方式來(lái)構(gòu)建深度自編碼網(wǎng)絡(luò)[18]。首先,按照AE的訓(xùn)練方式,使用輸入層訓(xùn)練第1個(gè)隱含層的參數(shù)和,見(jiàn)圖2,訓(xùn)練完成后只保留的編碼階段。
圖 2 訓(xùn)練第1個(gè)隱含層Fig. 2 Training the first hidden laye
圖 3 訓(xùn)練第2個(gè)隱含層Fig. 3 Training the second hidden layer
這樣每一隱含層都可以充分的包含原始信號(hào)的信息[14],通過(guò)這種“堆?!狈绞酵瓿芍饘臃潜O(jiān)督預(yù)訓(xùn)練就構(gòu)建了深度自編碼網(wǎng)絡(luò)[19]。整個(gè)SAE訓(xùn)練完成后,接入softmax分類(lèi)器完成分類(lèi)任務(wù),如圖4所示。
圖 4 SAE結(jié)構(gòu)圖Fig. 4 The System structure diagram of SAE
但由深度自編碼訓(xùn)練好的權(quán)重直接堆疊構(gòu)成的網(wǎng)絡(luò)較為粗糙,需要使用有監(jiān)督的方法對(duì)權(quán)重等參數(shù)進(jìn)行微調(diào),從而加強(qiáng)整體層級(jí)之間連接的緊密性以及反饋調(diào)節(jié)的連續(xù)性,保證網(wǎng)絡(luò)處于最優(yōu)狀態(tài),所以將輸出分類(lèi)結(jié)果和目標(biāo)類(lèi)別標(biāo)記進(jìn)行對(duì)比,利用反向傳播算法對(duì)全局參數(shù)進(jìn)行有監(jiān)督調(diào)試。對(duì)所有輸入樣本個(gè)數(shù)求平均錯(cuò)誤得到損失函數(shù),如下式:
在后續(xù)分析中,損失函數(shù)選擇經(jīng)典平方損失函數(shù)
本文提出如圖5所示的基于SAE的艦船輻射噪聲分類(lèi)識(shí)別框架。首先使用Welch功率譜估計(jì)方法對(duì)經(jīng)過(guò)預(yù)處理的艦船輻射噪聲信號(hào)提取功率譜特征,然后進(jìn)行歸一化得到樣本特征庫(kù)。將樣本特征庫(kù)分為訓(xùn)練樣本集和測(cè)試樣本集,并對(duì)訓(xùn)練樣本集進(jìn)行優(yōu)化處理,得到新的訓(xùn)練樣本集。使用新的訓(xùn)練樣本集構(gòu)建和優(yōu)化SAE分類(lèi)器,搭建好SAE分類(lèi)器后,用測(cè)試樣本對(duì)SAE分類(lèi)器的效果進(jìn)行檢驗(yàn)。
圖 5 基于SAE的艦船輻射噪聲分類(lèi)識(shí)別框架Fig. 5 The classification and recognition framework of ship radiant noise based on SAE
全部輻射噪聲樣本是在不同工況和水文氣象條件下,實(shí)際錄制的3類(lèi)海上目標(biāo)(分別用Ⅰ,Ⅱ和Ⅲ表示)的艦船輻射噪聲。采樣頻率25 kHz,每個(gè)樣本長(zhǎng)度為6.553 6 s。對(duì)所有的4 506個(gè)樣本集(共146艘不同工況艦船)采用文獻(xiàn)[20]的方法估計(jì)得到513維的Welch譜特征向量。并將整個(gè)樣本集分為訓(xùn)練樣本集和測(cè)試樣本集,其中訓(xùn)練樣本和測(cè)試樣本的選取方法如圖6所示,相當(dāng)于每間隔65.536 s選取一個(gè)樣本進(jìn)行訓(xùn)練,然后取這2個(gè)訓(xùn)練樣本的中間樣本作為測(cè)試樣本。由此得到訓(xùn)練樣本集和測(cè)試樣本集各類(lèi)樣本數(shù)量如表1所示。
圖 6 訓(xùn)練樣本集和測(cè)試樣本集選取方法Fig. 6 The selection method of training sample set and test sample set
表 1 訓(xùn)練樣本集和測(cè)試樣本集各類(lèi)樣本數(shù)量Tab. 1 The number of different training sample sets and test sample sets
可以看出,原始訓(xùn)練樣本集中各類(lèi)樣本在數(shù)量上存在較大差異。其中第Ⅱ類(lèi)的樣本數(shù)量最多,意味著原始訓(xùn)練集中第Ⅱ類(lèi)樣本不僅在數(shù)量上占有優(yōu)勢(shì)性而且更具有多樣性。因此原始訓(xùn)練集訓(xùn)練下的SAE分類(lèi)器對(duì)于第Ⅱ類(lèi)樣本會(huì)得到最充分的訓(xùn)練,因而在目標(biāo)分類(lèi)識(shí)別時(shí)會(huì)集中識(shí)別第Ⅱ類(lèi)樣本[21]。針對(duì)這種情況,本文提出一種順次重復(fù)處于劣勢(shì)樣本的優(yōu)化方法,即增加第Ⅰ類(lèi)和第Ⅲ類(lèi)樣本數(shù)量,使每類(lèi)樣本數(shù)量基本處于均衡狀態(tài)。具體步驟如下:
步驟1 根據(jù)訓(xùn)練樣本集中每類(lèi)樣本的總數(shù),得到訓(xùn)練樣本數(shù)量最多一類(lèi)的樣本個(gè)數(shù),如式(7)所示,其中表示原始訓(xùn)練樣本集中第類(lèi)樣本的個(gè)數(shù),表示訓(xùn)練樣本中數(shù)量最多的一類(lèi)樣本的個(gè)數(shù),即第Ⅱ類(lèi)樣本的個(gè)數(shù)。
步驟3 根據(jù)步驟2獲得的重復(fù)次數(shù)對(duì)原始訓(xùn)練集中各類(lèi)樣本進(jìn)行重復(fù)。如圖7所示,原始訓(xùn)練樣本集的三類(lèi)樣本和重復(fù)后獲得的新訓(xùn)練樣本集中的三類(lèi)樣本,分別用和表示。
圖 7 新訓(xùn)練樣本集Fig. 7 The new training sample set
通過(guò)上述步驟對(duì)訓(xùn)練樣本集進(jìn)行優(yōu)化處理后,訓(xùn)練樣本集中各類(lèi)樣本數(shù)量如表2所示。
表 2 訓(xùn)練樣本集中各類(lèi)樣本數(shù)量Tab. 2 The number of samples in the training sample
為了從輸入的Welch功率譜特征中獲取深層次的特征來(lái)提高SAE分類(lèi)器的分類(lèi)識(shí)別能力,要求自編碼網(wǎng)絡(luò)捕捉訓(xùn)練數(shù)據(jù)中最顯著的深層特征,本文SAE分類(lèi)器的各層自編碼器均采用欠完備的自編碼器,得到SAE分類(lèi)器中各層節(jié)點(diǎn)數(shù)目之間的邏輯關(guān)系如式(9),其中表示隱含層第層的節(jié)點(diǎn)數(shù)目,表示輸入節(jié)點(diǎn)數(shù),表示輸出節(jié)點(diǎn)數(shù)。
具體SAE網(wǎng)絡(luò)結(jié)構(gòu)設(shè)置如圖8所示,以目標(biāo)分類(lèi)識(shí)別準(zhǔn)確率為標(biāo)準(zhǔn),設(shè)置恰當(dāng)?shù)木W(wǎng)絡(luò)深度保證網(wǎng)絡(luò)獲取的深度特征不會(huì)因?yàn)檫^(guò)于抽象而無(wú)法識(shí)別,也不會(huì)因?yàn)樘崛〉牟粔蛏疃貌坏接行У纳顚犹卣?。調(diào)整各層節(jié)點(diǎn)數(shù),使該層節(jié)點(diǎn)輸出的深層特征具有維度低和有效性強(qiáng)的特點(diǎn)。
最終設(shè)置的網(wǎng)絡(luò)結(jié)構(gòu)為4層,隱含層數(shù)為2層,具體各節(jié)點(diǎn)數(shù)如圖9所示。
圖 8 網(wǎng)絡(luò)層數(shù)和各層節(jié)點(diǎn)數(shù)設(shè)置Fig. 8 The number of network layer number and nodes in each layer
圖 9 SAE網(wǎng)絡(luò)結(jié)構(gòu)Fig. 9 The structure diagram of SAE
2.3.1 激活函數(shù)選擇
將上述激活函數(shù)分別作為2個(gè)隱含層自編碼器的激活函數(shù),通過(guò)對(duì)比SAE分類(lèi)器的識(shí)別效果來(lái)選擇最合適的激活函數(shù)組合。
SAE分類(lèi)器的識(shí)別效果如表3所示,fj為第 i層激活函數(shù),Rj為第類(lèi)目標(biāo)識(shí)別精度,為總體識(shí)別精度。通過(guò)表3對(duì)比可知,當(dāng)?shù)?層和第2層激活函數(shù)均為sigmoid時(shí),SAE分類(lèi)器分類(lèi)識(shí)別效果最好,故選擇sigmoid作為第1層和第2層的激活函數(shù),選擇softmax作為輸出層的激活函數(shù)完成分類(lèi)。
表 3 不同激活函數(shù)組合下SAE分類(lèi)器的正確分類(lèi)識(shí)別概率Tab. 3 Correct classification and recognition probability of SAE classifier with different activation functions
2.3.2 學(xué)習(xí)率和訓(xùn)練次數(shù)的選擇
在上述SAE分類(lèi)器設(shè)計(jì)的基礎(chǔ)上,進(jìn)一步對(duì)影響網(wǎng)絡(luò)效率的參數(shù)——學(xué)習(xí)率和訓(xùn)練次數(shù)進(jìn)行選擇。因?yàn)椴捎秒S機(jī)梯度下降算法對(duì)SAE的權(quán)重進(jìn)行更新,結(jié)合權(quán)值更新式(4),可知在每次訓(xùn)練中權(quán)值更新的梯度都在下降以便更有效的逼近最優(yōu)值,所以SAE分類(lèi)器的分類(lèi)識(shí)別效果在訓(xùn)練次數(shù)和學(xué)習(xí)率共同作用下才能夠達(dá)到較好效果。
學(xué)習(xí)率的經(jīng)驗(yàn)值區(qū)間一般為0~1,分別選擇0.1,0.5,0.9,1作為學(xué)習(xí)率代表,得到訓(xùn)練次數(shù)和錯(cuò)誤的下降曲線,如圖10所示。
可以看出,在采用梯度下降算法更新權(quán)重時(shí),學(xué)習(xí)率較大則每次下降的步長(zhǎng)越大,能夠在較少的訓(xùn)練次數(shù)下快速逼近最優(yōu)值,但可能存在由于步長(zhǎng)過(guò)長(zhǎng)使權(quán)重值在最優(yōu)值點(diǎn)附近徘徊,無(wú)法接近最優(yōu)值點(diǎn);選擇的學(xué)習(xí)率過(guò)小時(shí),雖然能夠接近最優(yōu)值,但需要很多次訓(xùn)練,權(quán)重逼近最優(yōu)值點(diǎn)的速度慢,同時(shí)可能會(huì)出現(xiàn)過(guò)擬合的現(xiàn)象。因此,需要選擇恰當(dāng)?shù)膶W(xué)習(xí)率才能在盡可能少的訓(xùn)練次數(shù)下,實(shí)現(xiàn)在耗時(shí)較短的前提下獲得較好的權(quán)重值。
根據(jù)上述分析,以錯(cuò)誤率收斂為準(zhǔn)則,按如圖11所示流程對(duì)SAE分類(lèi)器的訓(xùn)練次數(shù)和學(xué)習(xí)率進(jìn)行選擇,具體步驟如下:
步驟1 將學(xué)習(xí)率經(jīng)驗(yàn)區(qū)間0~1劃分為10份區(qū)間間隔0.1,結(jié)合各點(diǎn)錯(cuò)誤率曲線初步篩選區(qū)間為0.8~0.9;
步驟2 在初步篩選區(qū)間0.8~0.9基礎(chǔ)上,按照0.01間隔長(zhǎng)度將0.8~0.9劃分為10份,再次結(jié)合各點(diǎn)錯(cuò)誤率曲線進(jìn)行選擇,進(jìn)一步確定區(qū)間為0.88~0.89;
步驟3 在0.88~0.89區(qū)間內(nèi)按照0.001間隔將0.88~0.89劃分為10份再次細(xì)化學(xué)習(xí)率,最終確定學(xué)習(xí)率為0.889,得到圖12學(xué)習(xí)率0.889時(shí)訓(xùn)練次數(shù)和錯(cuò)誤率下降曲線。
圖 10 不同學(xué)習(xí)率下訓(xùn)練次數(shù)與錯(cuò)誤率關(guān)系Fig. 10 The relationship between the number of training and the error rate under different learning rates
圖 11 學(xué)習(xí)率選擇流程Fig. 11 Learning rate selection process
在如圖12所示學(xué)習(xí)率為0.889的錯(cuò)誤率曲線中可得訓(xùn)練次數(shù)在470~480之間已經(jīng)達(dá)到穩(wěn)定狀態(tài),為提高SAE分類(lèi)器的實(shí)效性,在470~480之間經(jīng)過(guò)對(duì)比最終選取的訓(xùn)練次數(shù)為475。
使用原始訓(xùn)練樣本集分別對(duì)構(gòu)建好的SAE分類(lèi)器和NN分類(lèi)器進(jìn)行訓(xùn)練,SAE和NN的參數(shù)設(shè)置訓(xùn)練完成后使用測(cè)試樣本集對(duì)進(jìn)行測(cè)試,得到如表4所示的正確分類(lèi)識(shí)別概率。
分析可知,在三類(lèi)訓(xùn)練樣本數(shù)目不均勻的條件下,由于第Ⅱ類(lèi)樣本數(shù)目最多,更具有多樣性,分類(lèi)器對(duì)于第Ⅱ類(lèi)樣本能夠提取更為豐富的特征,強(qiáng)化分類(lèi)器對(duì)第Ⅱ類(lèi)目標(biāo)的分類(lèi)識(shí)別能力,使分類(lèi)器權(quán)值偏向第Ⅱ類(lèi)目標(biāo)。相比之下,第Ⅰ類(lèi)和第Ⅲ類(lèi)樣本樣本數(shù)目較少使得這兩類(lèi)樣本的特征提取的不夠全面,導(dǎo)致分類(lèi)器對(duì)這兩類(lèi)目標(biāo)的分類(lèi)識(shí)別能力得不到充分訓(xùn)練,識(shí)別率較低。
使用新訓(xùn)練樣本集訓(xùn)練再次訓(xùn)練SAE分類(lèi)器與NN分類(lèi)器,然后使用同一測(cè)試樣本集對(duì)分類(lèi)器的分類(lèi)識(shí)別能力進(jìn)行測(cè)試,得到表5所示2種網(wǎng)絡(luò)分類(lèi)器的正確分類(lèi)識(shí)別概率。
NN屬于淺層網(wǎng)絡(luò),不具備提取數(shù)據(jù)深層特征的能力。NN分類(lèi)器只能根據(jù)輸入的Welch譜特征向量進(jìn)行分類(lèi)識(shí)別,其分類(lèi)效果受樣本數(shù)量和樣本多樣性影響。對(duì)于同一類(lèi)樣本而言,數(shù)量越多、多樣性越強(qiáng)、識(shí)別效果就越好。對(duì)比表4和表5可以看出,新訓(xùn)練樣本集增加了樣本數(shù)量,但沒(méi)有增加樣本的多樣性,因而NN分類(lèi)器的分類(lèi)識(shí)別能力沒(méi)有得到改善。
SAE屬于深度學(xué)習(xí)網(wǎng)絡(luò)模型,能夠提取深層特征,同時(shí)SAE的結(jié)構(gòu)還能抑制過(guò)擬合。SAE分類(lèi)器通過(guò)對(duì)Welch譜特征向量進(jìn)行深層特征挖掘,找到樣本之間的本質(zhì)區(qū)別,用來(lái)對(duì)目標(biāo)進(jìn)行高效準(zhǔn)確地分類(lèi)識(shí)別。結(jié)合表1和表4分析可以看出,原始訓(xùn)練樣本集中3類(lèi)目標(biāo)數(shù)量差距較大、SAE分類(lèi)器稀疏性強(qiáng),所以在運(yùn)用原始訓(xùn)練集訓(xùn)練SAE分類(lèi)器時(shí),提取的深層特征不全面,導(dǎo)致SAE分類(lèi)器分類(lèi)識(shí)別不準(zhǔn)確。從表2和表5分析得到,新訓(xùn)練樣本集中增加了第Ⅰ類(lèi)樣本和第Ⅲ類(lèi)樣本的數(shù)量,從而解決了由于這兩類(lèi)樣本數(shù)量太少導(dǎo)致的深層特征提取不全面的問(wèn)題,并且SAE分類(lèi)器的稀疏度能夠有效抑制NN分類(lèi)器中出現(xiàn)的過(guò)擬合現(xiàn)象。從表5可以看出,通過(guò)新訓(xùn)練樣本集的訓(xùn)練,SAE分類(lèi)器對(duì)第Ⅰ類(lèi)樣本和第Ⅲ類(lèi)樣本的分類(lèi)識(shí)別能力得到了明顯提升,改善了SAE分類(lèi)器的整體分類(lèi)識(shí)別能力。
圖 12 學(xué)習(xí)率為0.889時(shí)訓(xùn)練次數(shù)與錯(cuò)誤率關(guān)系Fig. 12 The relationship between the number of training and the error rate when the learning rate is 0.889
表 4 2種分類(lèi)器在原始訓(xùn)練樣本集訓(xùn)練下的正確分類(lèi)識(shí)別概率Tab. 4 The correct classification probability of two classifiers under the training of the original training sample set
表 5 2種分類(lèi)器在新訓(xùn)練樣本集訓(xùn)練下的正確分類(lèi)識(shí)別概率Tab. 5 The correct classification probability of two classifiers under the training of new training sample set
深度學(xué)習(xí)多層非線性的特點(diǎn),使它能夠通過(guò)簡(jiǎn)潔的參數(shù)學(xué)習(xí)來(lái)表達(dá)復(fù)雜數(shù)據(jù)之間的關(guān)系。欠完備AE本身具有很好的特征提取能力,能夠提取樣本低維度的重要特征。AE堆疊而成的SAE發(fā)揮了這種優(yōu)勢(shì),在降低數(shù)據(jù)維度的同時(shí)能夠充分挖掘數(shù)據(jù)的深層特征,更好地完成對(duì)艦船輻射噪聲的分類(lèi)識(shí)別。并且簡(jiǎn)單的數(shù)據(jù)重復(fù)與SAE分類(lèi)器自身的稀疏能力相配合,能夠在提高各類(lèi)目標(biāo)的分類(lèi)識(shí)別率的同時(shí)防止過(guò)擬合現(xiàn)象的出現(xiàn),SAE分類(lèi)器在實(shí)際應(yīng)用中與傳統(tǒng)淺層神經(jīng)網(wǎng)絡(luò)相比具有很強(qiáng)的優(yōu)越性。同時(shí),該分類(lèi)網(wǎng)絡(luò)也可推廣應(yīng)用于艦船其他特征下的分類(lèi)識(shí)別。