鞠東豪,李 宇,張萬達,張春華
(1. 中國科學院聲學研究所,北京100190;2. 中國科學院大學,北京100039;3. 中國科學院先進水下信息技術(shù)重點實驗室,北京100190;4. 中國船舶工業(yè)系統(tǒng)工程研究院,北京100036)
近年來,隨著各類航行器的發(fā)展以及各類傳感器的更新迭代,海洋航行和探測識別領(lǐng)域取得了很大的進步。目標分類識別算法是水下探測技術(shù)的關(guān)鍵一環(huán),也是聲吶的一項重大任務,傳統(tǒng)的目標識別技術(shù)往往依賴于聲吶兵的經(jīng)驗進行判斷,但是隨著探測技術(shù)的發(fā)展和傳感器數(shù)目大量增加,以及各類無人航行器的發(fā)展,人工識別漸漸被淘汰。
目標識別可以分為兩部分進行,其一是對目標進行特征提取,即對接收數(shù)據(jù)使用信號處理手段突出其代表性特征。其二是分類器設(shè)計,即對目標特征進行學習和分類。其中特征提取算法的優(yōu)劣往往直接決定了目標識別的成功率,因此特征提取是水聲被動目標識別的關(guān)鍵任務。1997年章新華等將目標特征提取和小波分析和功率譜分析結(jié)合,使用BP神經(jīng)網(wǎng)絡進行分類[1],取得了較好的分類效果。2002年李亞安等利用水下噪聲信號的混沌現(xiàn)象提取其混沌特征[2]。此外,還有學者受人耳識別的啟發(fā),利用梅爾頻率倒譜系數(shù)(Mel-Frequency Cepstral Coefficient, MFCC)特征進行目標的識別[3],同樣有較好的效果。
1998年,黃鍔提出了希爾伯特-黃變換(Hilbert-Huang Transform, HHT)[4],該變換被稱為經(jīng)驗模態(tài)分解算法(Empirical Mode Decomposition, EMD)。這是一種檢測并且將信號分解為各階模態(tài)的方法。這一方法依賴對信號極值點的尋找、極值點的插值以及停止準則,且該方法缺乏數(shù)學理論的支撐,綜上幾點原因該方法的魯棒性還有待提高。EMD算法雖然存在一些弊端,但是影響十分廣泛,在醫(yī)學、生物學等多個領(lǐng)域均有應用。2007年王鋒等將HHT方法引入水聲信號處理中[5],對四類目標進行分類實驗,達到了 90%以上的識別正確率。另外針對EMD算法存在的模態(tài)混疊問題,有學者將集合經(jīng)驗模態(tài)分解算法(Ensemble Empirical Mode Decomposition, EEMD)和希爾伯特邊際譜相結(jié)合[6],一定程度上解決EMD分解時出現(xiàn)的模態(tài)混疊問題。Dragomiretskiy等于 2014年提出了變分模態(tài)分解(Variational Mode Decomposition, VMD)算法,該方法自適應地切割信號頻段,有效解決了傳統(tǒng)EMD算法中模態(tài)混疊的問題[7]。
為了提升目標識別的效率,本文將VMD引入水聲目標分類當中,結(jié)合希爾伯特變換算法形成21維特征向量,通過對比多類分類器實驗,結(jié)果表明VMD-HT聯(lián)合處理算法具有更高的分類正確率。
傳統(tǒng) EMD算法的本征模函數(shù)(Intrinsic Mode Function, IMF)被定義為一個局部極值和過零點個數(shù)最多相差1的信號。VMD算法對IMF的定義稍做改動,VMD算法認為 IMF是調(diào)幅調(diào)頻信號(AM-FM)[7],記為
式中:uk(t)為第k階MF分量,其中第k階MF分量的相角是一個非遞減函數(shù),即,第k階MF分量的幅值是非負的函數(shù)為時間。在足夠長的時間段模態(tài)uk( t)可以被視為是一個振幅為Ak( t)、瞬時頻率為φk′(t ) 的純諧波信號。不難發(fā)現(xiàn),上述這一定義比最原始的IMF定義更加嚴格。
VMD分解的目的是將原始輸入信號 f分解為多個符合上述模型的 IMF分量uk。假設(shè)每一個IMF分量uk是圍繞著某一個中心頻率ωk振動產(chǎn)生的,而這一中心頻率是在分解過程中確定的。對每一個IMF uk( t)進行希爾伯特變換,利用指數(shù)修正得到K個模態(tài)函數(shù),將模態(tài)函數(shù)頻譜修正到估算的中心頻率,利用高斯平滑計算出模態(tài)分量的帶寬[7]:
使用乘法算子交替算法(Alternating Direction Method of Multipliers, ADMM)求式(3)的鞍點,更新uk如式(4)所示:
式中:α為懲罰因子;λ為拉格朗日乘子;X為f和uk所在的函數(shù)空間。使用 Parseval/Plancherel傅里葉等距變換,將式(4)轉(zhuǎn)換到頻域,如式(5)所示:
該算法在分解信號的過程中不斷自適應的更新每個IMF分量的中心頻率,可以有效地避免傳統(tǒng)EMD分解算法中的模態(tài)混疊現(xiàn)象,減少無效分解數(shù)量,且不同于EMD算法的是,該方法具有詳細完整的數(shù)學推導過程。
水聲被動目標識別過程如圖1所示。
圖1 水聲被動目標識別算法流程圖Fig.1 Flow chart of the classification algorithm for ship radiation noise
如1.1節(jié)所述,對信號進行VMD分解后,為了更好地反映數(shù)據(jù)的瞬時性,對分解后的各個分量進行Hilbert變換處理,可以得到各個分量的瞬時振幅和瞬時頻率,如式(9)所示:
由信號的瞬時相位可以求得其瞬時頻率如式(12)所示:
由經(jīng)過希爾伯特變換的IMF分量的瞬時頻率、邊際譜以及幅值等特征經(jīng)過組合構(gòu)成 VMD-HT特征。仿真數(shù)據(jù)的時域信號如圖2所示。
將圖2所示的時域信號分別進行短時傅里葉變換和VMD-HT變換后的時頻圖,如圖3所示。
圖2 仿真數(shù)據(jù)時域信號Fig.2 Time domain signal of simulation data
圖3 仿真數(shù)據(jù)短時傅里葉變換以及VMD-HT的時頻圖Fig.3 The time-frequency diagrams of short-time Fourier transform of simulation data and VMD-HT
由圖3不難看出,VMD-HT算法所繪制的時頻譜圖相比于短時傅里葉變換時頻譜可以更好地描述信號的隨機擾動。
VMD各階模態(tài)中是否存在干擾模態(tài)以及如何將干擾模態(tài)剔除是十分值得研究的問題。干擾模態(tài)不僅增加特征維數(shù),影響分類器效率,很大程度上也容易混淆目標特征,從而影響對目標的分類,所以需要在特征提取之前將干擾模態(tài)剔除。本文使用相關(guān)性作為區(qū)分依據(jù)進行干擾模態(tài)的剔除。以漁船噪聲為例,漁船噪聲的原始時域信號以及VMD分解結(jié)果如圖4所示。對圖4中的各階IMF分別計算其與原信號的相關(guān)系數(shù)結(jié)果如圖5所示。通過將每一階 IMF和原始信號的相關(guān)系數(shù)與閾值(本文設(shè)定為0.1)對比,不難看出,對于圖4中的漁船數(shù)據(jù)而言,應當保留1~3階IMF進行特征提取,而4~10階IMF則被視為干擾模態(tài)被剔除。使用這一方法能夠一定程度上提高特征提取算法的效率和分類器的分類正確率。
圖4 漁船噪聲原始時域信號以及VMD分解結(jié)果Fig.4 Original time domain signal and VMD decomposition result of fishing boat noise
圖5 漁船噪聲各階本征模函數(shù)(IMF)與原始信號相關(guān)系數(shù)Fig.5 Correlation coefficients between each order of IMF and original signal of fishing boat noise
水下目標分類常用的分類器算法有:K最近鄰(K-Nearst Neighbor, KNN) 算法、隨機森林(Random Forest, RF) 算法、樸素貝葉斯(Naive Bayes, NB)算法、人工神經(jīng)網(wǎng)絡(Artificial Neural Network, ANN)算法以及支持向量機(Support Vector Machine,SVM)算法。水聲目標分類由于樣本數(shù)量有限的原因容易出現(xiàn)過學習和欠學習的現(xiàn)象。支持向量機算法所構(gòu)建的分類規(guī)則能夠很好地平衡算法的性能和推廣能力,既能適應復雜多變的水下環(huán)境,又能夠保證較好的分類效果,所以本文應用支持向量機算法對目標進行分類。
支持向量機源于結(jié)構(gòu)風險最小化理論,首先利用核方法將輸入空間樣本經(jīng)過非線性變換映射到高維空間中,然后在從高維空間中尋找最優(yōu)超平面進行分類,這一過程可以將一個復雜的分類問題極大簡化。所謂最優(yōu)超平面就是要求該超平面不僅可以將兩類數(shù)據(jù)分開而且分類間隔最大,這種具有最大分類邊界的分類算法具有更好的泛化能力。
式中:x是輸入向量,w是可調(diào)權(quán)值向量,b是偏置。由式(13)可以寫出:
對于給定的w和b,決策曲面與最近數(shù)據(jù)點之間的間距被稱為分離邊緣ρ。支持向量機算法核心在于如何尋找分離邊緣ρ最大的決策曲面,決策曲面被稱為最優(yōu)超平面。通過上述原則可以構(gòu)造出線性支持向量機的最優(yōu)化問題:
可以通過求解上述凸二次規(guī)劃問題得到目標支持向量機額最優(yōu)權(quán)值w*和偏置b*。
對于線性可分的樣本,很容易確定最優(yōu)超平面,但是當樣本類別以非線性的形式分散時,線性邊界就變得不再適用。可以使用某種映射函數(shù)將輸入向量投影到可線性分類的高維的特征空間中,從而解決這一非線性分類問題。這種映射函數(shù)被稱為核函數(shù),核函數(shù)的選取需要滿足Mercer定理,在這里列舉三類常用核函數(shù)作為例子[8],如表1所示。
表1 支持向量機(SVM)常用核函數(shù)Table 1 Common kernel functions for SVM
本文提取多類基于VMD分解的數(shù)據(jù)特征,特征類型及對應向量維數(shù),如表2所示。
表2 特征類型及對應向量維數(shù)表Table 2 Feature types and corresponding vector dimensions
使用某航次數(shù)據(jù)作為數(shù)據(jù)集。該數(shù)據(jù)集中包括三類不同型號的艦船目標輻射噪聲,分別提取目標信號EMD-HT、EEMD-HT以及VMD-HT三種類別特征作為分類器輸入,分別使用K近鄰分類器、隨機森林分類器、樸素貝葉斯分類器以及由一對一法構(gòu)建的支持向量機多分類器共四種分類器進行對比分析,結(jié)果如表3~5所示。
表3 不同分類器基于EMD-HT特征分類結(jié)果(某一航次數(shù)據(jù))Table 3 Classification results of different classifiers based on EMD-HT features (data from a certain voyage)
表4 不同分類器基于EEMD-HT特征分類結(jié)果(某一航次數(shù)據(jù))Table 4 Classification results of different classifiers based on EEMD-HT features (data from a certain voyage)
表5 不同分類器基于VMD-HT特征分類結(jié)果(某一航次數(shù)據(jù))Table 5 Classification results of different classifiers based on VMD-HT features (data from a certain voyage)
為了更好地驗證 VMD-HT算法的魯棒性,選取同次海試不同航次的數(shù)據(jù)作為測試集,分類結(jié)果如表6~8所示。
表6 不同分類器基于EMD-HT特征分類結(jié)果(另一航次數(shù)據(jù))Table 6 Classification results of different classifiers based on EMD-HT features (data from another voyage)
表7 不同分類器基于EEMD-HT特征分類結(jié)果(另一航次數(shù)據(jù))Table 7 Classification results of different classifiers based on EEMD-HT features (data from another voyage)
表8 不同分類器基于VMD-HT特征分類結(jié)果(另一航次數(shù)據(jù))Table 8 Classification results of different classifiers based on VMD-HT features (data from another voyage)
由上述對比分析結(jié)果可見,VMD-HT算法對各類目標的分類準確率比EMD-HT以及EEMD-HT算法都有一定的程度的提高。EEMD一定程度上避免了模態(tài)混疊問題,識別正確率有了一定的提升;而 VMD-HT算法一方面解決了模態(tài)混疊的問題,同時也保證了 IMF信號的完整性。綜上所述,VMD-HT算法對各類目標的分類正確率都高于其他幾類分類算法。因此使用VMD算法進行水下目標的分類,可以有效提升對水下目標的分類效果。此外,由對比分析還可見,SVM分類器在分類準確度方面要高于KNN、RF以及NB三類分類器。
本文使用變分模態(tài)分解算法結(jié)合希爾伯特變換來構(gòu)造目標信號特征集,基于分解后的干擾信號數(shù)據(jù),采用設(shè)定相關(guān)系數(shù)閾值剔除干擾模態(tài)的方法,對比KNN、隨機森林、樸素貝葉斯以及SVM四種分類器的對EMD-HT、EEMD-HT和VMD-HT三種特征集的分類效果表明,其中 VMD-HT算法提取的特征分類正確率最高,此外還針對訓練出的分類模型使用不同的航次數(shù)據(jù)進行了驗證,得到了相同的結(jié)論,可見本文 VMD-HT特征集用于水下目標被動分類具有良好的應用前景。