郭德鑫,康春玉,夏志軍,張 憶
(1. 海軍大連艦艇學(xué)院 研究生隊,遼寧 大連 116018;2. 海軍大連艦艇學(xué)院 水武與防化系,遼寧 大連 116018)
利用船舶在航行過程中產(chǎn)生的輻射噪聲進(jìn)行特征提取來實現(xiàn)目標(biāo)識別是水下目標(biāo)分類識別的一種重要手段,但是由于船舶型號、航速、螺旋槳工況的不同,目標(biāo)的輻射噪聲特征變化較大,特別是在惡劣海況下,識別效果更不令人滿意,提取更加具有魯棒性的特征及研究與特征相匹配的分類識別方法是急需解決的問題。
近年來,隨著張量研究的不斷深入與發(fā)展,張量分解在圖像識別,語音信號處理和醫(yī)學(xué)等領(lǐng)域[1]中得到廣泛應(yīng)用。在圖像識別領(lǐng)域,周春光等[2]在線性主成分分析的基礎(chǔ)上提出了稀疏張量主成分分析算法,有效降低了遮擋對人臉特征提取的影響,并且在不同表情的人臉識別中優(yōu)于原算法;計雨含利用奇異值分解對人物、表情、向量長度構(gòu)建的3階張量進(jìn)行識別,提高了人臉在光照、角度發(fā)生改變時的識別精確度[3]和分類識別時的速度[4];同時在循環(huán)次數(shù)、特征維數(shù)以及訓(xùn)練樣本和測試樣本數(shù)目差別等不同方面對非負(fù)張量分解和非負(fù)矩陣分解進(jìn)行的對比也表明了非負(fù)張量分解具有的有效性和高效性[5];任卿龍[6]利用不同波段上的遙感圖像構(gòu)建高維張量,對飛機(jī)目標(biāo)和艦船目標(biāo)進(jìn)行分級識別也取得了較好的實驗結(jié)果。在聲學(xué)領(lǐng)域,王珊[7]在混合矩陣估計中引入張量分解,利用分解后的各個矩陣實現(xiàn)了對多通道混合音樂的盲分離;楊立東[8-9]用語音命令張量經(jīng)過Tucker分解得到的特征進(jìn)行識別,平均識別率達(dá)到95%,同樣對聲矢量傳感器輸出的多維陣列信號進(jìn)行張量奇異值分解,相比于傳統(tǒng)的矢量奇異值分解能夠更好地抑制噪聲,并對信號子空間的估計更加準(zhǔn)確[10]。醫(yī)學(xué)方面,利用張量方法表征腦電信號的時域、頻率、空域特征[11],處理肌電信號[12],提取心電信號[13]的操作,均比傳統(tǒng)方法具有更高的準(zhǔn)確率和相對的優(yōu)越性。機(jī)器學(xué)習(xí)方面也有關(guān)于張量應(yīng)用的研究[14-15]。
張量分解在圖像識別,語音信號處理和醫(yī)學(xué)等領(lǐng)域取得了較好的成果,但在與其具有類似高維結(jié)構(gòu)的船舶輻射噪聲信號特征提取和分類識別領(lǐng)域中尚未見到相關(guān)報道。本文在船舶輻射噪聲特征提取中引入張量,利用張量的空間坐標(biāo)系具有旋轉(zhuǎn)不變性,以及直接對高維空間進(jìn)行整體分析和操作的特點進(jìn)行船舶輻射噪聲特征提取和張量構(gòu)造,并經(jīng)過張量分解實現(xiàn)對船舶輻射噪聲的分類識別。
張量可以直觀理解為一個多維數(shù)組,是多個矢量的空間乘積,張量的階是張量不同維上元素個數(shù)的數(shù)量表達(dá),也被稱為way或mode。通常認(rèn)為向量是張量的1階表達(dá),矩陣是張量的2階表達(dá),具有3階或更高階數(shù)的張量則稱為高階張量。本文提及的張量指的都是高階張量,用粗體大寫字母表示,如;向量用粗體小寫字母表示,如;矩陣用斜體大寫字母表示,如。一個N階張量可以表示為其中表示第i階上的維數(shù)。
張量分解的思想最早由Hitchcock在1927年提出。1963年,Tucker首次提出了Tucker分解,并在隨后進(jìn)行了完善。1970年,Carroll,Chang和Harshman提出了CANDECOMP/PARAFAC分解,即CP分解[1]。近年來,尹鳳等[16]在張量CP分解和Tucker分解的基礎(chǔ)上,提出一種利用交替最小二乘法計算高階張量秩的分解方法。Tucker分解將張量分解為核張量和因子矩陣的形式,類似于矩陣的奇異值分解,因此Tucker分解又被稱為高階奇異值分解(HOSVD)[17],并可以將其看做是奇異值分解(SVD)的高階形式。本文所采用的張量分解方法就是Tucker分解。
圖1 三階張量Tucker分解模型Fig. 1 Tucker decomposition model of a third-order tensor
同奇異值分解一樣,高階奇異值分解中核張量代表原始張量的某些特性,因子矩陣代表著這些特性的重要程度,核張量和因子矩陣也是本文進(jìn)行艦船輻射噪聲分類識別的關(guān)鍵。
研究表明,船舶信息主要集中在1 000 Hz以下的船舶輻射噪聲中[18],而1 000 Hz以上主要是螺旋槳空化噪聲,因此對低頻噪聲進(jìn)行分解可以得到更多的船舶信息,更便于船舶特征的提取。離散小波變換可以對信號低頻進(jìn)行分解,因此本文采用的方法是將船舶輻射噪聲經(jīng)過分幀、小波變換、美爾頻率倒譜系數(shù)(MFCC)提取處理后構(gòu)建一個幀數(shù)×小波分解分量×MFCC特征維數(shù)的3階輻射噪聲張量。
小波變換(WT)是在傅里葉變換(FT)的基礎(chǔ)上發(fā)展來的,將FT中無限長的三角函數(shù)基換成有限長的會衰減的小波基,能夠在獲得頻率信息的同時定位到時間,其與信號做卷積的形式表示為下式:
對信號進(jìn)行小波變換是改變小波的尺度,實現(xiàn)在頻域內(nèi)的伸縮;改變平移量實現(xiàn)在時域內(nèi)的移動,通過分析與在時刻的相似程度得到該時刻的頻率信息。在信號處理中,一般采用離散小波變換,把式(4)中的參數(shù),都進(jìn)行離散化,令其中,通常取分別對應(yīng)小波的伸縮變換與平移,從而把連續(xù)小波變?yōu)殡x散小波(DW)[18]。
則離散小波變換(DWT)為:
圖中,L為低通濾波器,H為高通濾波器,↓2為系數(shù)為2的降采樣濾波器。由于一直在進(jìn)行降采樣,所以雖然濾波器L,H不變,但其濾波帶寬一直在減半。如此經(jīng)過次分解后,信號就可以表示為:
在小波變換中,Morlet小波,Haar小波,Daubechies小波,Meyer小波等是常用的小波,本文進(jìn)行小波變換時采用的是Daubechies小波,常記為是其階數(shù)。小波不具有解析式,由滿足一定條件的濾波器系數(shù)迭代逼近小波,一般先給出低通濾波器系數(shù)再由式(8)推導(dǎo)得到高通濾波器系數(shù)。
圖2 離散小波變換分解流程Fig. 2 Decomposition process of discrete wavelet transformation
MFCC特征是一種根據(jù)人耳聽覺對不同頻率的聲波靈敏度不同的特性提出的一種聽覺感知特性,在信號處理中可以理解為信號的能量在不同頻率范圍的分布系數(shù)占比。計算過程如下[19]:
將頻譜幅度平方后得到的能量譜通過美爾(Mel)頻率濾波器組得到各分量的Mel頻譜,并對Mel頻譜取自然對數(shù)得到對數(shù)頻譜:
通過上述處理,就可以構(gòu)建一個幀數(shù)×小波分解分量×MFCC特征維數(shù)的3階船舶輻射噪聲張量,其結(jié)構(gòu)如圖3所示。
圖3 三階張量Fig. 3 A third-order tensor
分類識別實驗中,共有Ⅰ,Ⅱ,Ⅲ類船舶4 506個輻射噪聲樣本,采樣頻率為25 kHz,每個樣本長為6.553 6 s。從整個輻射噪聲樣本中每間隔10個樣本取1個作為訓(xùn)練樣本集,余下的作為測試樣本集,得到451個訓(xùn)練樣本,4 055個測試樣本。對每個樣本采用漢明窗進(jìn)行分幀,每幀長度為81 92個采樣點,幀移為1 024個采樣點,分幀后共得到153幀。在小波分解過程中,采用db3小波進(jìn)行3層小波分解,小波分解后得到4個分量。對每個分量提取12維美爾頻率倒譜系數(shù)(MFCC)。然后使用上述步驟得到的153幀、4個小波分解分量、1 2維M F C C特征系數(shù)構(gòu)建一個的3階小波張量,最后按分類識別方法完成分類識別實驗,測試樣本集總的正確分類識別概率為詳細(xì)的分類識別概率如表1所示。
表1 分類識別概率(%)Tab. 1 Probability of classification and recognition (%)
輻射噪聲特征提取是進(jìn)行目標(biāo)識別的重要組成部分,提取能夠充分表示噪聲信息的特征是提高識別率的關(guān)鍵。本文提出的艦船輻射噪聲張量特征提取方法,利用小波變換及美爾頻率倒譜系數(shù)(MFCC)構(gòu)建具有較高魯棒性的3階張量。通過HOSVD張量分解得到訓(xùn)練樣本的核張量和各維度上的因子矩陣,將因子矩陣的轉(zhuǎn)置與測試樣本構(gòu)建的張量進(jìn)行矩陣乘運算得到投影張量,最后通過范數(shù)比較核張量和投影張量之間的差異性,確定測試樣本所屬類別。實驗結(jié)果表明該方法識別率高,具有一定的優(yōu)越性。