陳卓
(海裝駐上海地區(qū)軍事代表局,上海,200083)
隨著信息技術(shù)的快速發(fā)展,各國對(duì)海洋開發(fā)、水下防衛(wèi)能力需求不斷提升,水下信息感知方法研究的熱度有增無減,新興技術(shù)聯(lián)合傳統(tǒng)水聲技術(shù)的水下目標(biāo)探測、識(shí)別等感知方法已成為水下探測領(lǐng)域的重要發(fā)展方向。水聲目標(biāo)識(shí)別作為水聲探測的核心功能,其關(guān)鍵在于水下目標(biāo)可分性特征的挖掘和提取。傳統(tǒng)目標(biāo)識(shí)別方法通常從目標(biāo)噪聲產(chǎn)生的物理機(jī)理出發(fā),通過信號(hào)處理手段提取能反映目標(biāo)本質(zhì)屬性的可分性特征并基于分類器或模板匹配方法實(shí)現(xiàn)識(shí)別[1-4]。但隨著水下目標(biāo)隱身性能的不斷提升,以及水聲目標(biāo)發(fā)聲機(jī)理的多樣性、海洋信道時(shí)空多變性、平臺(tái)噪聲和強(qiáng)干擾等因素的影響,水聲目標(biāo)信號(hào)通常具有信噪比低、干擾成分強(qiáng)等特點(diǎn),目標(biāo)固有特征隱匿性強(qiáng)[5],并導(dǎo)致傳統(tǒng)特征提取方法較難獲取具有良好可分性的特征,識(shí)別正確率不高,方法泛化能力差。
近年來,深度學(xué)習(xí)模型受到廣泛關(guān)注和快速發(fā)展,已涌現(xiàn)出大量適用不同場合的深度學(xué)習(xí)算法,涉及識(shí)別、預(yù)測、控制等多個(gè)領(lǐng)域,逐漸成為水下目標(biāo)識(shí)別研究的重要方向和新技術(shù)途徑。深度學(xué)習(xí)通過構(gòu)建多隱層結(jié)構(gòu)來增強(qiáng)計(jì)算能力,在圖像、語音識(shí)別等領(lǐng)域已取得令人贊嘆的效果[6-8]。本文針對(duì)被動(dòng)目標(biāo)輻射噪聲信號(hào)特征提取與識(shí)別的特點(diǎn),提出將深度學(xué)習(xí)中的稀疏降噪自編碼器方法應(yīng)用于水聲目標(biāo)噪聲降維和數(shù)值特征提取。
稀疏降噪自編碼器的基礎(chǔ)結(jié)構(gòu)是自編碼器(AutoEncoder, AE)。AE是一個(gè)中間層具有結(jié)構(gòu)對(duì)稱性的多層前饋網(wǎng)絡(luò),其訓(xùn)練目標(biāo)是將輸入信號(hào)從目標(biāo)表達(dá)中重構(gòu)出來。單個(gè)AE結(jié)構(gòu)可分為編碼器和解碼器,前者完成從輸入向量到輸出表征的映射轉(zhuǎn)換,后者實(shí)現(xiàn)輸出表征逆向映射回輸入空間,得到重構(gòu)信號(hào)。訓(xùn)練目標(biāo)是使重構(gòu)信號(hào)盡可能接近輸入向量。
降噪自編碼器(Denoising AutoEncoder,DAE)與傳統(tǒng)的AE具有相同的結(jié)構(gòu),只是在輸入數(shù)據(jù)中加入一定的噪聲,其學(xué)習(xí)的目標(biāo)是從受污染的輸入中重構(gòu)出純凈的輸入,從而增加輸出特征的魯棒性。將DAE逐層疊加,即將上一層DAE的輸出作為當(dāng)前AE的輸入,得到堆疊降噪自編碼器(Stacked Denoising AutoEncoder,SDAE)。為進(jìn)一步優(yōu)化算法的計(jì)算精度和泛化能力,在損失函數(shù)中加入稀疏約束項(xiàng),通常可表示為
式中,β為稀疏約束項(xiàng)系數(shù),ρ為設(shè)定的稀疏性參數(shù),j為隱藏神經(jīng)元j的平均活躍度,s為隱藏神經(jīng)元數(shù)量,為j和ρ之間的KL 散度,可表示為
此外,為防止AE訓(xùn)練時(shí)的過度擬合,通常會(huì)在代價(jià)函數(shù)中增加權(quán)重衰減項(xiàng)Jweight(θ),通??杀硎緸?/p>
式中,λ為權(quán)重衰減項(xiàng)系數(shù),nl為網(wǎng)絡(luò)層數(shù),sl為第l層網(wǎng)絡(luò)的節(jié)點(diǎn)數(shù)量,為權(quán)值矩陣W中角標(biāo)為j和i的元素值。稀疏降噪自編碼器最終的損失函數(shù)可表示為
式中,J(W,b)為基本目標(biāo)數(shù)據(jù)與重構(gòu)數(shù)據(jù)之間的基本損失項(xiàng)。
Fisher準(zhǔn)則下的判別法是一種常用的線性判別方法,當(dāng)高維空間的樣本點(diǎn)投影到低維空間時(shí),該方法使不同類的樣本點(diǎn)在空間上的投影盡量分離,而同類的樣本點(diǎn)則盡量聚集在一起。文中將類內(nèi)距離和類間距離作為評(píng)價(jià)指標(biāo)。類內(nèi)散布矩陣為該類特征向量分布的協(xié)方差矩陣,反映了各樣本點(diǎn)圍繞均值的散布情況。類內(nèi)距離是指同一類特征向量集內(nèi),各樣本間的均方距離。特征向量集X內(nèi)任意兩個(gè)樣本之間的距離可表示為:
當(dāng)各樣本相互獨(dú)立時(shí),類內(nèi)距離為2倍的協(xié)方差矩陣C的跡(協(xié)方差矩陣主對(duì)角線上各元素之和),即
類間距離為各類特征向量在空間中距離,主要反映了各類特征向量之間的可分性。
為驗(yàn)證稀疏降噪自編碼器用于被動(dòng)目標(biāo)噪聲特征提取的性能,構(gòu)建了圖1所示的基于多隱層稀疏降噪自編碼器的水下被動(dòng)目標(biāo)特征提取器。該特征提取器以聲信號(hào)功率譜為輸入,通過多隱層結(jié)構(gòu)進(jìn)行降維與特征提取,輸出能夠反映目標(biāo)固有屬性的可分性數(shù)值特征,綜合考慮AE方法特點(diǎn)及水聲目標(biāo)噪聲的復(fù)雜性,中間隱層設(shè)置為2層。最后,在稀疏降噪自編碼器模型頂部添加 Softmax分類器,以便基于梯度下降方法實(shí)現(xiàn)整個(gè)模型的有監(jiān)督訓(xùn)練優(yōu)化,通過結(jié)合帶標(biāo)簽數(shù)據(jù)進(jìn)行反向微調(diào),對(duì)整個(gè)深度學(xué)習(xí)模型的性能提升起到?jīng)Q定性作用,圖2為原理框圖。
圖1 水下被動(dòng)目標(biāo)噪聲特征提取器原理框圖
圖2 多隱層稀疏降噪自編碼器有監(jiān)督訓(xùn)練原理框圖
基于上述特征提取器模型開展了對(duì)商船和漁船兩類目標(biāo)的波束域仿真數(shù)據(jù)頻域的特征提取與識(shí)別分析。訓(xùn)練數(shù)據(jù)信噪比為 3 dB,數(shù)據(jù)長度為384,其中兩類目標(biāo)的差異性主要體現(xiàn)在連續(xù)譜譜形、線譜幅度和頻點(diǎn)等方面。與漁船噪聲相比,商船線譜和連續(xù)譜的強(qiáng)度均更高,兩類目標(biāo)無標(biāo)簽數(shù)據(jù)各15 360組,用于模型的無監(jiān)督預(yù)訓(xùn)練,帶標(biāo)簽數(shù)據(jù)各128組,用于模型的有監(jiān)督訓(xùn)練。處理模型共4層,基于每層節(jié)點(diǎn)數(shù)量逐級(jí)遞減的原則設(shè)置中間隱層節(jié)點(diǎn)數(shù)量,通過測試多種節(jié)點(diǎn)參數(shù)組合,最終設(shè)置中間隱層節(jié)點(diǎn)分別為300和30,同時(shí)針對(duì)節(jié)點(diǎn)數(shù)量相對(duì)較多的隱層1加入稀疏約束,稀疏系數(shù)設(shè)置為0.05,同時(shí)設(shè)置噪聲比例為0.2。
將上述稀疏降噪自編碼器模型無監(jiān)督預(yù)訓(xùn)練后的隱層輸出數(shù)據(jù)基于 t分布隨機(jī)近鄰嵌入(t-distributed Stochastic Neighbor Embedding,t-SNE)算法進(jìn)行投影,結(jié)果如圖3所示(圖中所示散點(diǎn)是對(duì)歸一化目標(biāo)數(shù)據(jù)進(jìn)行提取特征和可視化的結(jié)果,無量綱。下文同)??梢钥吹?,經(jīng)過中間計(jì)算層對(duì)數(shù)據(jù)進(jìn)行無監(jiān)督預(yù)訓(xùn)練式的降維,得到的降維數(shù)據(jù)的分布特征發(fā)生變化,可分性提高。
對(duì)有監(jiān)督訓(xùn)練后的稀疏降噪自編碼器模型進(jìn)行測試,測試數(shù)據(jù)信噪比為-3 dB。表1為評(píng)價(jià)結(jié)果(歸一化目標(biāo)數(shù)據(jù)進(jìn)行提取特征和評(píng)價(jià)的結(jié)果,無量綱,下文同)。圖4所示為部分?jǐn)?shù)據(jù)及對(duì)應(yīng)數(shù)值特征提取結(jié)果的 t-SNE投影,可以看到,和原始數(shù)據(jù)相比,降維得到數(shù)值特征的分布發(fā)生較明顯變化,類內(nèi)距離明顯降低,類間距離大幅提升。
圖3 無監(jiān)督訓(xùn)練模型輸出結(jié)果
表1 -3 dB信噪比測試數(shù)據(jù)數(shù)值特征評(píng)價(jià)結(jié)果
圖4 -3 dB信噪比測試數(shù)據(jù)數(shù)值特征投影結(jié)果
采用信噪比為3 dB的仿真目標(biāo)數(shù)據(jù)進(jìn)行測試。圖 5所示為部分?jǐn)?shù)據(jù)及對(duì)應(yīng)數(shù)值特征提取結(jié)果的t-SNE投影,表2所示為評(píng)價(jià)結(jié)果??梢钥吹?,數(shù)值特征提取效果比信噪比為-3 dB時(shí)的結(jié)果要好。總的來說,稀疏降噪自編碼器實(shí)現(xiàn)有效數(shù)據(jù)降維和數(shù)值特征提取。
圖5 3 dB信噪比測試數(shù)據(jù)數(shù)值特征投影結(jié)果
表2 3 dB信噪比測試數(shù)據(jù)數(shù)值特征評(píng)價(jià)結(jié)果
為進(jìn)一步驗(yàn)證稀疏降噪自編碼器模型的特征提取能力,頂部添加SVM(Support Vector Machine)分類器輸出分類結(jié)果。同時(shí)基于SVM方法對(duì)原始樣本進(jìn)行處理,輸出對(duì)比結(jié)果,如表 3所示??梢钥吹?,經(jīng)過稀疏降噪自編碼器降維后的分類器識(shí)別率比直接基于SVM的識(shí)別率要高,驗(yàn)證了特征提取的有效性。
表3 3 dB信噪比測試數(shù)據(jù)分類識(shí)別結(jié)果
對(duì)包含2類目標(biāo)的實(shí)際數(shù)據(jù)頻譜進(jìn)行降維與數(shù)值特征提取處理模型同樣包含4層,中間隱層節(jié)點(diǎn)數(shù)量分別為500和200,噪聲比例設(shè)置為0.2,隱層1稀疏系數(shù)設(shè)置為0.05。訓(xùn)練數(shù)據(jù)為波束域數(shù)據(jù),訓(xùn)練樣本包含無標(biāo)簽樣本3500個(gè),帶標(biāo)簽樣本1000個(gè)。表4和圖6分別為評(píng)價(jià)結(jié)果和特征投影,可以看到,類內(nèi)距離和類間距離的變化趨勢和仿真數(shù)據(jù)處理結(jié)果類似。與原始數(shù)據(jù)相比,數(shù)值特征的可分性有了明顯提升,特征類間距比原始譜數(shù)據(jù)提升超過500%,類內(nèi)距離降低接近85%,驗(yàn)證了稀疏降噪自編碼器在水聲目標(biāo)識(shí)別中應(yīng)用的有效性。
表4 實(shí)際數(shù)據(jù)特征提取評(píng)價(jià)結(jié)果
圖6 實(shí)際數(shù)據(jù)特征提取投影結(jié)果
本文針對(duì)水中目標(biāo)輻射噪聲,構(gòu)建了含多隱層的稀疏降噪自編碼器方法實(shí)現(xiàn)數(shù)值特征提取,采用類內(nèi)距離和類間距離對(duì)提取的特征進(jìn)行評(píng)價(jià)。仿真和實(shí)際數(shù)據(jù)的處理結(jié)果表明,提取的數(shù)值特征可分性較原始數(shù)據(jù)明顯提升,特征類間距比原始譜數(shù)據(jù)提升超過500%,類內(nèi)距離降低接近85%,驗(yàn)證了稀疏降噪自編碼器用于水聲目標(biāo)輻射噪聲特征提取與識(shí)別的有效性。