劉夏揚(yáng),李晶,*,于華鵬,趙國新,楊淑潔
(1.北京石油化工學(xué)院信息工程學(xué)院,北京 102617; 2.軍事科學(xué)院國防創(chuàng)新研究中心,北京 100071; 3.浙江海洋大學(xué)海洋工程裝備學(xué)院,浙江 舟山 316022)
船舶噪聲信號的分類識別方向作為海洋勘測研究中不可或缺的技術(shù)之一,用各種神經(jīng)網(wǎng)絡(luò)對船舶噪聲信號進(jìn)行分類和處理的相關(guān)研究也日漸豐富[1]。能否在水下對各類目標(biāo)進(jìn)行快速無誤地識別,很大程度上影響了未來海軍艦艇的作戰(zhàn)能力。
船只噪聲信號的特征提取和分類中取得了大量高質(zhì)量的研究成果[2-5]。由于聲波在水中傳播時,水介質(zhì)的折射及聲波在水面、水底的反射,自發(fā)射點(diǎn)至接收點(diǎn)存在多個傳播途徑的現(xiàn)象,船只噪聲信號通常體現(xiàn)為時變信號[6],且船只在行進(jìn)過程中受到復(fù)雜環(huán)境的干擾,對于船舶噪聲特征提取帶來了一定難度。以往的船舶噪聲大多都是以單一特征進(jìn)行目標(biāo)識別,但對于完整地表述船舶的特征信息這一要求,單一特征有部分局限性。利用不同方法對船舶信號特征進(jìn)行提取,可以從不同方面反應(yīng)船舶的特征。排列熵(Permutation Entropy, PE)由于其良好的魯棒性和精確性以及能夠捕獲所分析的時間序列的底層動態(tài),近年來已被應(yīng)用在特征提取方面。但PE只比較相鄰值,不考慮振幅,同時受等值的影響也很大,導(dǎo)致計算值與真實(shí)值存在偏差。為了解決這一問題,F(xiàn)adlallah Bila[7]提出了加權(quán)排列熵(Weighted Permutation Entropy, WPE),引入考慮信號波動的加權(quán)因子。與PE相比,WPE對振幅信息更敏感,能有效檢測到信號的停滯區(qū)和突變區(qū),并在許多領(lǐng)域得到了實(shí)際應(yīng)用[8]。
長短期記憶網(wǎng)絡(luò)(Long Short-Term Memory,LSTM)是目前實(shí)際應(yīng)用中高效的序列模型,該網(wǎng)絡(luò)對于解決循環(huán)神經(jīng)網(wǎng)絡(luò)(Recurrent Neural Network, RNN)長時序樣本梯度爆炸及梯度消失的問題有著很好的效果。張亮[9]基于LSTM設(shè)計了自動區(qū)分計算機(jī)和人的圖靈測試,并取得較高的識別率;Debashis Das Chakladar等[10]提出了一種基于雙向長短期記憶(Bi-directional Long-Short Term Memory,BLSTM)和LSTM相結(jié)合的深度混合模型來處理腦電頻譜功率分類,效果甚佳。
針對船舶噪聲信號的特點(diǎn),并利用排列熵對時序性信號的敏感性,筆者提出了基于時頻域特征和排列熵的船舶噪聲信號識別方法。利用小波新閾值去噪和希爾伯特-黃變換(Hilbert-Huang Transform,HHT)對信號進(jìn)行預(yù)處理,采用反向加權(quán)排列熵對IMF進(jìn)行篩選,繼而將保留的IMF的加權(quán)排列熵以及瞬時頻率等進(jìn)行特征提取并篩選的方式得到信號特征,通過構(gòu)建LSTM網(wǎng)絡(luò),得到了理想的分類精度。
船舶噪聲信號包括機(jī)械噪聲、螺旋槳噪聲、水動力噪聲等。為了提高后續(xù)訓(xùn)練速率和測試準(zhǔn)確度,需要對信號進(jìn)行預(yù)處理。
小波降噪的核心是:小波分解將原始信號分解出各層系數(shù),給定特定閾值,系數(shù)的模大于或小于特定閾值時分別進(jìn)行處理,處理完的小波系數(shù)再進(jìn)行反變換重構(gòu)得到降噪后的信號[11]。小波閾值去噪過程如圖1所示。
圖1 小波閾值去噪過程Fig.1 Flow chart of wavelet domain denoising
有用信號的小波系數(shù)幅值較大,噪聲的小波系數(shù)賦值較小,選擇合適的閾值處理小波系數(shù)極為重要。經(jīng)典閾值函數(shù)為硬閾值函數(shù)和軟閾值函數(shù),硬閾值函數(shù)[13]:
(1)
軟閾值函數(shù):
(2)
(3)
式中:n為信號長度;σ為噪聲標(biāo)準(zhǔn)差。閾值可以保持局部特征,但重構(gòu)信號平滑度不夠。軟閾值法可以得到平滑的信號曲線,但往往會使信號產(chǎn)生失真。采用一種新的閾值法,由Gao和Bruce引入收縮函數(shù)的變化,其克服了硬閾值和軟閾值的缺點(diǎn)。因此具有良好的去噪性能。公式如下[14]:
(4)
由于傳播過程的多途效應(yīng),往往體現(xiàn)的是時變信號,故在宏觀上是不平穩(wěn)的。為了準(zhǔn)確描述信號特征,使用經(jīng)驗(yàn)?zāi)B(tài)分解(Empirical Mode Decomposition, EMD)將信號分解為有限個本征模函數(shù)IMF,再求出各個IMF的瞬時頻率構(gòu)建特征向量組[15-18]。
EMD可以看作是一個對原始信號的篩選過程,根據(jù)原始信號的特點(diǎn)及規(guī)則分為多個IMF。IMF要滿足以下2個條件:
(1)信號的極值點(diǎn)數(shù)量與零點(diǎn)數(shù)相等或兩者數(shù)量差值為1;
(2)信號的上包絡(luò)線和下包絡(luò)線得到的局部均值為0.
對信號x(t)具體分解過程如下:
(1)求取原始信號的極大值點(diǎn)和極小值點(diǎn);
(2)用樣條差值法對極小值形成下包絡(luò)線xd(t),對極大值形成上包絡(luò)線xu(t),計算上下包絡(luò)的均值函數(shù)公式為[15]:
(5)
(3)檢查h1(t)=x(t)-m1(t)是否滿足IMF的條件,如果滿足則繼續(xù)下一步,否則對h1(t)繼續(xù)進(jìn)行上面兩步操作,直到第n步結(jié)果h1n(t)滿足IMF條件,則可求得第1個IMF,即c1=h1n(t);
(4)得到第1個殘余函數(shù)r1(t)=x(t)-c1,接著以此類推,直到rk(t)為單調(diào)函數(shù)或者只有1個極值點(diǎn)為止。
(5)經(jīng)過以上步驟的分解,原始信號可以表示為:
(6)
1.3.1 加權(quán)排列熵
加權(quán)排列熵(WPE)是對排列熵(PE)的一種改進(jìn),其計算步驟如下[7]:
輸入1個長度為N的時間序列X,嵌入尺寸m>2,延遲時間τ,然后從時間序列X中提取長度為m的所有可能的N-(m-1)個子序列,則X可以映射到:
=1,2,…,N-(m-1)τ
(7)
接著X按照遞增順序重新排列:
x(i+(j1-1)τ)≤x(i+(j2-1)τ)≤…≤
x(i+(jm-1)τ)
(8)
如果有2個元素相等:
(i+(j1-1)τ)=x(i+(j2-1)τ)
(9)
則他們的順序?yàn)椋?/p>
x(i+(j1-1)τ)≤x(i+(j2-1)τ),(j1≤j2)
(10)
計算出每個子序列的權(quán)重值ωi:
(11)
(12)
Pω(πk)=
(13)
則WPE計算式為:
(14)
1.3.2 反向加權(quán)排列熵
反向加權(quán)排列熵(Reverse Weighted Permutation Entropy, RWPE)保持了WPE和反向排列熵(Reverse Permutation Entropy, RPE)的優(yōu)勢,是一種包含距離和振幅信息的復(fù)雜性度量方法,其中RPE代表時序信號與白噪聲之間的距離[18]。EMD將信號分解為若干個IMF后,有效船舶信號占較大比重,但仍有部分IMF與原始信號的相關(guān)性較低,故通過計算每一個IMF的反向加權(quán)排列熵來確定每一個IMF是否包含重要信息。其定義如下[5]:
(15)
加權(quán)相對頻率的計算式為:
(16)
反向加權(quán)排列熵表示觀測信號與高斯白噪聲之間的距離[5],此時RWPE定義為:
(17)
其中:τ為延遲時間;m為嵌入維數(shù);ωj為時序信號的權(quán)值。
與排列熵和加權(quán)排列熵相比,RWPE融合了振幅信息和距離信息,比PE具有更強(qiáng)的噪聲識別能力[18]。
對保留的IMF進(jìn)行希爾伯特變換[19]:
(18)
接著構(gòu)造解析信號:
zt(t)=ci(t)+jH[ci(t)]=ai(t)ejφi(t)
(19)
得到的幅值函數(shù)和相位函數(shù)分別為:
(20)
(21)
各IMF的瞬時頻率計算方法為:
(22)
將提取的瞬時頻率和瞬時幅值經(jīng)過統(tǒng)計得到加權(quán)平均瞬時頻率,其計算式為:
(23)
式中:IFi(k)為第i個IMF中第k個點(diǎn)的瞬時頻率;Ai(k)表示第i個IMF中第k個點(diǎn)的瞬時振幅。
利用長短期記憶算法對預(yù)處理后的信號進(jìn)行分類訓(xùn)練。LSTM是在RNN的基礎(chǔ)上增加了一個單元狀態(tài)C。
LSTM記憶單元組織圖如圖2所示。
圖2 LSTM記憶單元組織圖Fig.2 Chart of Memory Cells of LSTM
由圖2可知,在T時刻,LSTM的輸入有3個:上一時刻的輸出值ht-1、上一時刻的單元狀態(tài)Ct-1以及當(dāng)前網(wǎng)絡(luò)的輸入值xt;輸出有2個:t時刻的輸出值ht和當(dāng)前時刻的單元狀態(tài)Ct。在t時刻,輸入門和輸出門都是關(guān)閉狀態(tài),于是記憶單元把之前的狀態(tài)傳遞到t+1時刻,這樣就把第1個狀態(tài)記錄了下來。以此類推,時間步t時的記憶單元就被記錄了下來,解決了梯度消失的問題。
以上為單向LSTM的計算方式,其相比單向LSTM,雙向LSTM的隱藏層要保存2個單元狀態(tài)A、A′,A參與正向計算,A′參與反向計算,最終的輸出y取決于2個值。雙向LSTM的訓(xùn)練單元如圖3所示。
圖 3 雙向LSTM訓(xùn)練單元Fig.3 Training Unit of BILSTM
利用雙向LSTM進(jìn)行訓(xùn)練,相比單向LSTM訓(xùn)練精度更好。
按照上述理論分析,船舶噪聲信號分類識別總體流程如圖4所示。
圖4 分類識別總體流程Fig.4 Flow chart of classification and identification
為了驗(yàn)證船舶噪聲識別方法的有效性,使用了維戈大學(xué)提供的名為ShipsEar的真實(shí)水下船只噪聲數(shù)據(jù)庫。
實(shí)驗(yàn)涉及四類船只目標(biāo),簡稱為A、B、C、D類,2 000個噪聲樣本作為實(shí)驗(yàn)數(shù)據(jù)集。每個樣本分別采集于不同時間和環(huán)境,信號采樣率為50 kHz。選取的各類數(shù)據(jù)的原始時域波形如圖5所示。
圖5 四類信號類時域分析圖Fig.5 Four Class time domain waveform
為驗(yàn)證新閾值的去噪能力,將原始信號視為未加噪聲信號x(t),加噪信號由原始信號和白噪聲疊加,信噪比為10 dB。利用小波變換將x(t)劃分為4階小波信號,sym4作為小波函數(shù),并使用新閾值函數(shù)去噪。最后,將去噪后小波信號進(jìn)行組合得到去噪后的信號s(t)。原始信號與去噪信號如圖6所示。以信噪比和均方根誤差來評價去噪效果。信噪比的計算式為:
(31)
圖6 原始信號與去噪信號Fig.6 Original signal and denoised signal
不同閾值方法的去噪能力如表1所示。
表1 不同閾值方法去噪能力比較
從表1中可以看出,新閾值法在保持較低RMSE值的同時,可以得到較高的信噪比。故新閾值法去噪性能更佳。某一信號去噪前后EMD分解圖如圖7所示。
圖7 原始信號和除噪后EMD分解對比圖Fig.7 Comparison between the EMD decomposition of original signal and the original signal after denoising
在經(jīng)過信號分解算法處理的有噪信號得到的IMF中,并不是每個IMF都能對原始信號進(jìn)行表征。有些成分是噪聲,需要在特征提取前排除。由文獻(xiàn)[18]可知,RWPE值越大,觀測值與白噪聲的距離越小。四類信號在求取IMF后每一類隨機(jī)選取100組IMF信號求RWPE平均值。四類船只信號中IMF的RWPE結(jié)果直方圖如圖8所示。該去噪方法區(qū)分原始信號中噪聲IMF是可行的。為了進(jìn)一步驗(yàn)證該方法的有效性,選取RWPE閾值為2和4的本征函數(shù)重構(gòu)新信號。不同取值下加噪信號和重構(gòu)信號的信噪比如表2所示。加噪信號的信噪比為10 dB。從表2中可以看出,當(dāng)RWPE取值為4時,可以得到較高的信噪比。
表2 不同RWPE值下原始信號與重構(gòu)信號的信噪比
圖8 EMD的RWPE結(jié)果的直方圖Fig.8 The histogram of the RWPE results for EMD
從數(shù)據(jù)集中隨機(jī)選出80%的信號作為訓(xùn)練集,在訓(xùn)練前使用訓(xùn)練集的均值和標(biāo)準(zhǔn)差來標(biāo)準(zhǔn)化訓(xùn)練集和測試集。由于輸入信號各有2個維度,將輸入序列大小設(shè)置為2;指定雙向LSTM層輸出大小為500;每次訓(xùn)練迭代的小批量的數(shù)量設(shè)置為50;最大訓(xùn)練次數(shù)設(shè)置為50。
為了進(jìn)一步檢驗(yàn)特征提取方法的性能,選用IMF與原始信號的能量比以及WPE加權(quán)能量比構(gòu)建特征向量[25],進(jìn)行分類實(shí)驗(yàn)。
處理后的結(jié)果對應(yīng)的識別結(jié)果如表3所示, 目標(biāo)識別的結(jié)果混淆矩陣如圖9所示。
圖9 測試集效果混淆矩陣Fig.9 Test set classification effect of confusion matrix of Class A、B、C、D
表3 不同特征提取方法識別率對比
由表3中可以看出,以IMF和原始信號能量比為特征進(jìn)行識別在多類的情況下并不實(shí)用,平均識別率為50%。在相同樣本的情況下,利用WPE對能量比進(jìn)行加權(quán)后作為特征進(jìn)行訓(xùn)練,系統(tǒng)的平均識別率提升到92.12%,而特征提取方法訓(xùn)練后的平均識別率為99.40%,說明提出的特征具有更好的性能。
使用提出的特征提取方法,A類船只的識別率達(dá)到100.0%,B類船只的識別率為99.3%,C類船只的識別率為98.5%,D類船只的識別率為99.8%。故對于船舶噪聲識別的效果是比較理想的。
提出了一種基于時頻域特征與排列熵的識別方法,經(jīng)驗(yàn)?zāi)B(tài)分解可以根據(jù)局部特征將多分量信號分解為一系列的IMF,并利用原始信號的時頻域特征有效提取船舶噪聲特征,并利用加權(quán)排列熵與加權(quán)平均瞬時頻率組成特征向量,并利用LSTM對不同類型的船舶噪聲信號進(jìn)行識別。分析了不同特征識別的特點(diǎn),并通過實(shí)驗(yàn)證明了該方法的可行性。