田 斌,李 俊,楊 超,李 楊,文仕強
(武漢工程大學電氣信息學院,湖北 武漢 430205)
水下目標探測是海洋開發(fā)與海上安全所需的關鍵技術之一。 水下目標探測的方法有聲探測[1-2]、光學成像探測[3]、雷達射頻探測[4]以及磁異常探測[2,5]等,其中聲探測是目前水下目標探測最主要且最成熟的方法。但隨著現(xiàn)代消音技術的發(fā)展,海洋環(huán)境噪聲大幅提高,聲探測面臨目標輻射噪聲與回波強度大幅降低、海洋環(huán)境水聲效應影響顯著等一系列的問題[6],亟需一種輔助或替代方法。由于海洋中異常目標的存在,會產(chǎn)生包括感應電磁場、源電磁場在內(nèi)的多種物理場[7]。目前尚無可以完全消除目標電磁特性的技術,因此磁探測作為非聲探測技術中的一種重要手段在水下目標探測中呈現(xiàn)出越來越廣闊的應用前景[8]。
隨著深度學習技術的發(fā)展,卷積神經(jīng)網(wǎng)絡(convolutional neural network, CNN)也在水下目標檢測與識別中廣泛應用?;诰矸e神經(jīng)網(wǎng)絡的水下目標探測研究多聚焦于水聲探測,如用CNN提取艦船輻射噪聲信號的LOFAR譜圖來實現(xiàn)水下目標探測與高精度識別的方法[9];用更小的卷積核逐點提取水聲信號的特征,實現(xiàn)端到端的目標自動識別方法[10-11];通過小波預處理與改進卷積的卷積神經(jīng)網(wǎng)絡實現(xiàn)探測與高準確率識別的水聲目標識別方法[12]等。
然而,基于工頻磁場與卷積神經(jīng)網(wǎng)絡的水下目標探測仍有兩方面難題亟待解決。一方面工頻磁場水下目標探測研究尚處于試驗階段,已發(fā)表的文獻多為軟件仿真結果[13-14]。如用基于多特征融合的CNN檢測磁異常信號,在低信噪比下仍有良好的檢測性能[15];利用遷移學習下的CNN對地磁環(huán)境中的水下磁異常仿真信號識別,有較高的識別率[16]。區(qū)別于地磁信號,實測工頻磁信號受限于自身信號強度低,以及海洋中高動態(tài)變換非高斯特性噪聲影響,易被淹沒,導致特征工程難以開發(fā),磁矢量定位困難。另一方面,水下目標信號數(shù)據(jù)采集難度大、花費高,難以收集到足量的數(shù)據(jù)用于模型訓練。實測樣本數(shù)據(jù)少,有目標和無目標兩類數(shù)據(jù)結構不平衡造成識別精度低。信號特性與樣本數(shù)據(jù)上的差異,使得現(xiàn)有基于CNN的水下目標探測與分類方法無法直接用于工頻磁場水下目標探測。
針對以上問題,本文提出基于深度卷積生成對抗網(wǎng)絡(deep convolutional genertive adversarial network, DCGAN)數(shù)據(jù)增強和DY-CNN模型的工頻磁場水下目標探測方法。
工頻磁場是由交流輸變電設施產(chǎn)生的磁場,屬于超低頻電磁場,其頻率為50 Hz,波長6 000 km。世界上采用的高壓輸電網(wǎng)絡一般為三相三線交流輸電線,全球電網(wǎng)裝機容量巨大。目前為止世界上的電網(wǎng)裝機總量達到70億千瓦以上,我國以及周邊國家現(xiàn)有的高壓輸/變/用電網(wǎng)絡能在周邊海域產(chǎn)生分布均勻、可探測的工頻磁場[6]。水下鐵磁性物體會使工頻磁場分布發(fā)生改變,產(chǎn)生二次感應場的畸變擾動信號,此畸變擾動信號(即磁異常信號)可通過大氣、海水等介質(zhì)進行傳播,捕捉該信號可實現(xiàn)水下鐵磁性目標的探測。
基于工頻磁場的水下磁異常信號屬于微弱信號,且易受溫度、風速、雷雨等環(huán)境因素影響,具有強非線性與非平穩(wěn)性[17]。工頻磁擾動信號具有低信噪比、識別難度大等特點,深度學習理論可以擺脫信號識別中特征提取方法的依賴,極大地降低噪聲的影響,因此采用深度學習的識別方法具有重大意義。
20世紀80年代,卷積神經(jīng)網(wǎng)絡方法就已經(jīng)被提出。隨著深度學習理論的發(fā)展和數(shù)值計算設備的改進,卷積神經(jīng)網(wǎng)絡也得到了高速發(fā)展,并被廣泛應用于各個領域。典型的卷積神經(jīng)網(wǎng)絡結構包含卷積層、池化層、全連接層等。
1) 卷積層
卷積層是卷積神經(jīng)網(wǎng)絡的核心,通過卷積核可以從輸入中提取信號特征從而形成特征圖像。若卷積層的輸入為X,卷積核為k,則單次卷積輸出y為
(1)
式(1)中,σ為卷積核大小,l1和l2為卷積核在輸入圖像上所處的位置,b為偏置項,f為激活函數(shù)。
2) 池化層
池化層也稱為降采樣層,用于在卷積層之后對特征參數(shù)進行降維,從而降低神經(jīng)網(wǎng)絡的模型大小和網(wǎng)絡參數(shù),提高運算速度。池化層主要的兩種方法分別是最大池化(max-pooling)和平均池化(average-pooling)。
3) 全連接層
全連接層的作用是對提取的特征進行非線性組合以得到輸出,經(jīng)過卷積和池化處理后的特征矩陣,采用全連接的方式將圖像矩陣排列成一維數(shù)組的形式輸出,從而完成分類。
區(qū)別于傳統(tǒng)的磁異常檢測通過標量正交基函數(shù)檢測器用磁梯度信息來進行目標探測與定位的方法[18-19]。本文提出一種基于DCGAN數(shù)據(jù)增強與CNN分類的檢測方法。該方法框架如圖1所示,由預處理、數(shù)據(jù)強化、信號分類三個部分組成。數(shù)據(jù)預處理將信號從一維時域轉化到二維圖像;把二維信號圖像劃分為訓練集和測試集;數(shù)據(jù)強化利用DCGAN的生成器生成數(shù)據(jù)集中樣本較少的目標信號,解決數(shù)據(jù)集樣本不足的問題,即對較少的樣本數(shù)據(jù)進行增強,得到數(shù)據(jù)量平衡的訓練集;信號分類即將原始樣本的訓練集和經(jīng)過增強的訓練集圖像輸入到CNN中訓練,最終利用經(jīng)過訓練的卷積神經(jīng)網(wǎng)絡模型對測試集進行分類識別。
圖1 磁異常信號檢測方法框架Fig.1 Framework of magnetic anomaly signal detection method
本文采用將水下時域信號轉換為二維灰度值圖片的方法進行特征提取。二維圖像是一維數(shù)據(jù)的同步轉換,將時域中的磁場強度、時間變化等信息轉化為與其一一對應的像素值,保留了信號的全部特征。二維圖像轉化過程如圖2所示。
圖2 時域信號到圖像的轉化過程Fig.2 Time-domain signal to image transition process
步驟1)窗口截取。利用滑動窗口取值,在含有目標的信號上隨機截取,設定截取窗口大小為M,表示每次以M為單位長度進行取值,每次取值完成后,窗口向后滑動N個單位長度,保證N≥M,最后得到M×M大小的圖像;
步驟2)信號組合。將步驟1)中的目標信號片段組合,得到一條M×M的信號序列,每條序列的強度為L(k),其中k=1,2,3,…,M×M;
步驟3)圖像轉化。將步驟2)中的目標信號序列,根據(jù)公式轉化為灰度圖:
(2)
式(2)中,round{·}為取整函數(shù),將轉變的圖像像素歸一化至0~255。
本文在已有的實測信號基礎上,使用DCGAN生成新的信號樣本,作為卷積神經(jīng)網(wǎng)絡的數(shù)據(jù)支撐。GAN主要包含生成器G與判別器D兩個網(wǎng)絡結構,通過DCGAN生成樣本數(shù)據(jù)方法如圖3所示。
圖3 DCGAN模型Fig.3 DCGAN models
DCGAN訓練過程如下:
1)構造生成器和判別器,凍結生成器通過損失函數(shù)訓練判別器網(wǎng)絡,更新參數(shù)
(3)
θd←θd+η?Vd(θd),
(4)
式中,η為學習率。
2)凍結判別器,訓練生成器
(5)
θg←θg+η?VG(θg)。
(6)
3) 反復訓練生成器和判別器,經(jīng)過多輪的生成對抗訓練,最終達到納什均衡,生成逼近真實數(shù)據(jù)的樣本。
原始的GAN模型并不穩(wěn)定,存在梯度消失、模式崩潰等問題,而DCGAN將GAN和CNN相結合,用卷積和去卷積代替池化層,去掉了全連接層,使用了全局池化,并在D網(wǎng)絡和G網(wǎng)絡中都添加了批標準化(batch normalization,BN)操作,極大地提升了GAN訓練的穩(wěn)定性和輸出數(shù)據(jù)的質(zhì)量。
AlexNet在目標檢測、語音識別、圖像識別等眾多領域都有著出色的表現(xiàn),隨著深度學習的不斷拓展,AlexNet也成為眾多學者首選的神經(jīng)網(wǎng)絡模型[12]。激活函數(shù)對CNN有著十分重要的作用,能將神經(jīng)元的輸入映射到輸出端。文獻[20]提出在CNN中使用ReLU作為激活函數(shù),加快了模型收斂的同時也解決了梯度消失的問題,提高了模型的魯棒性。不少學者也通過不斷地改進ReLU激活函數(shù)來優(yōu)化神經(jīng)網(wǎng)絡,例如:LReLU、ELU等[21]。但是ReLU和其眾多衍生版本的參數(shù)調(diào)整都是靜態(tài)的,伴隨著參數(shù)的增加,容易出現(xiàn)過擬合的情況。
本文以AlexNet網(wǎng)絡結構為基礎,引入動態(tài)激活函數(shù)DY-ReLU,提出一種優(yōu)化的DY-CNN模型,并且為了加快收斂,將每個卷積層的卷積核個數(shù)減半,優(yōu)化后的網(wǎng)絡結構如圖4所示。
圖4 DY-CNN模型結構Fig.4 DY-CNN model structure
激活函數(shù)在神經(jīng)網(wǎng)絡中的應用,增加了網(wǎng)絡模型的非線性,可以將當前特征空間通過一定的線性關系映射到另一個空間,更利于數(shù)據(jù)分類。
DY-ReLU是一種動態(tài)激活函數(shù),該激活函數(shù)可以根據(jù)不同數(shù)據(jù)集確定最優(yōu)的ReLU函數(shù)參數(shù)。
(7)
(8)
實驗數(shù)據(jù)采集點位于我國東部沿海城市黃海海域,在岸基處分別放置兩臺三軸感應式傳感器,一臺磁通門傳感器,其中磁通門傳感器以地磁信號為基準作為目標標定,感應式傳感器用于測量工頻頻段水下目標。傳感器采樣率3 000 Hz,定位數(shù)據(jù)采用慣性導航系統(tǒng)實施動態(tài)差分。水下目標為無人潛航器,下潛深度3 m,離岸距離CPA=30 m。為了更好地實現(xiàn)工頻環(huán)境下的電磁探測,在岸基處還放置了一個100 W的燈泡作為用電負載,模擬一個微型的電力系統(tǒng),家用燈泡一般為50 W,本實驗選擇功率更大的負載,電壓恒定,用電設備的功率越大,線路中通過的電流也就越大,產(chǎn)生的磁場越強。在給燈泡供電的過程中,由于220 V輸電線路中存在50 Hz交變電流流通,產(chǎn)生了50 Hz的工頻磁場,增強了工頻背景場的信號強度。在模擬的電力系統(tǒng)和變電站、城市電網(wǎng)輸電線等所產(chǎn)生的工頻磁場的疊加作用下,實驗地點實測工頻信號強度達到18 nT左右。目標及傳感器布位如圖5所示。兩種傳感器的同步測量數(shù)據(jù)如圖6所示。
圖5 傳感器布位圖Fig.5 Sensor layout
圖6 兩種傳感器同步測量時域圖Fig.6 Time domain diagram of two sensors synchronously measured
根據(jù)實測的水下目標數(shù)據(jù),將信號截取并轉換成64×64格式的二維圖。兩種不同狀態(tài)的二維圖轉化如圖7所示。
圖7 兩種狀態(tài)的時域信號轉化二維圖像Fig.7 Two state time-domain signal transformation into two-dimensional image
從圖7可以看出,有目標的信號和無目標的信號轉換成圖像后,差異并不明顯。由于工頻磁異常信號為弱磁信號,實測數(shù)據(jù)的幅值變化非常小,并且還包含著磁探設備自身的噪聲以及強度較高的背景場等干擾,目標信號往往被淹沒在這些復雜的噪聲成分中。
原始數(shù)據(jù)由上述方法轉換后一共獲得1 500張圖像,其中有目標500張,無目標1 000張。將兩種數(shù)據(jù)中各取100張作為測試集M2,剩下的作為訓練集M1,并打上標簽,1代表有目標,0代表無目標。具體結構如表1所示。
表1 數(shù)據(jù)集介紹Tab.1 Dataset introduction
實際測量中,由于無目標的數(shù)據(jù)量遠遠高于有目標的,在神經(jīng)網(wǎng)絡的訓練中,這種傾斜的數(shù)據(jù)結構極易造成檢測結果的偏移。本文使用DCGAN進行數(shù)據(jù)增強來解決此樣本分布不均的問題。
DCGAN模型中生成器網(wǎng)絡和判別器網(wǎng)絡都有5層。生成器網(wǎng)絡的輸入層為帶ReLU激活的線性層,然后是3個帶有ReLU激活的反卷積層,最后一層輸出層為帶tanh激活的反卷積層。判別器包括4個帶有LeakyReLU激活的卷積層和最后一個帶有sigmoid激活的線性層組成。學習率為0.000 2。將數(shù)據(jù)集M1中有目標的數(shù)據(jù)作為DCGAN的輸入,由DCGAN經(jīng)過多輪的迭代后生成500張有目標的數(shù)據(jù)圖像,擴充后的圖像如圖8所示。
圖8 由DCGAN擴充的樣本圖像Fig.8 Sample images augmented by DCGAN
將新獲得的500張有目標的圖像,加入到數(shù)據(jù)集M1中,記為數(shù)據(jù)集M3。有目標的數(shù)據(jù)達到了900張,與無目標的數(shù)據(jù)量相等。
表2 數(shù)據(jù)增強后的數(shù)據(jù)集Tab.2 Data augmented dataset
分別對原始樣本和增強樣本訓練,測試DY-CNN在低樣本下的識別精度和數(shù)據(jù)強化后的識別精度,實驗結果如表3所示。
表3 數(shù)據(jù)增強前后準確率對比Tab.3 Accuracy comparison before and after data enhancement
由表3可知,在使用原始樣本M1為訓練集,以M2為測試集,DY-CNN識別率為82.5%;經(jīng)過數(shù)據(jù)增廣后,將M3作為訓練集時,以M2為測試集,識別率為92.5%,相比沒有增廣時,識別精度提高了10%。
在增廣數(shù)據(jù)集下將DY-CNN與CNN中其他常用的激活函數(shù)效果進行對比。本實驗為二分類問題,因此以準確率、F1-score兩個指標作為模型的評價標準。準確率能較直觀地反映模型的識別精度,F(xiàn)1越大代表模型性能越好,具體數(shù)據(jù)如表4所示。不同激活函數(shù)的loss曲線如圖9所示,loss值反映了預測值和真實值的距離,loss值隨著迭代次數(shù)的增加而逐漸收斂,代表模型也逐漸優(yōu)化到最佳。
表4 DY-CNN與其他激活函數(shù)性能對比Tab.4 Performance comparison of DY-CNN and other activation functions
圖9 不同激活函數(shù)的loss曲線Fig.9 Loss curves of different activation functions
由表4可知,引入了DY-Relu的網(wǎng)絡模型的準確率比ReLU、LReLU、PReLU和ELU模型分別高出4.5%、4%、3%和2.5%;DY-Relu的網(wǎng)絡模型的F1-score比ReLU、LReLU、PReLU和ELU模型分別高出5%、4%、1%和2%。
本文將水下目標的一維時域信號轉換到二維圖像,利用DCGAN將有限的數(shù)據(jù)樣本進行擴充,一定程度上解決了由樣本數(shù)據(jù)傾斜造成的識別率偏低的問題。同時將動態(tài)激活函數(shù)DY-ReLU引入到CNN結構中進行優(yōu)化,從而有效地提升了工頻磁場環(huán)境下的水下目標識別精度。使用樣本增強的DY-CNN相較于小樣本下的識別率提升了10%,識別率達到92.5%;引入了動態(tài)激活函數(shù)的CNN模型無論在識別率還是在克服模型偏移方面,都比傳統(tǒng)使用靜態(tài)激活函數(shù)的CNN模型更加優(yōu)秀。然而工頻磁場作為一種全新的磁探技術,其探測理論還需要進一步的完善,以緩解目標信號特征提取困難的局面。