余春祥,王 彪,朱雨男,吳承希,徐 晨
(江蘇科技大學(xué) 電子信息學(xué)院,江蘇 鎮(zhèn)江 212100)
水下波達方向估計是水下陣列數(shù)據(jù)處理的主要任務(wù),相比于空間波達估計,水下聲環(huán)境更為復(fù)雜。近年來,隨著科技的發(fā)展,人類水下活動急劇增多導(dǎo)致水下噪聲水平上升,同時潛艇和水面船艦的制造工藝提升,使得目標信號強度減弱,進一步降低水下信噪比。如何在低信噪比條件下,快速高效的進行方位估計是水下陣列信號處理的核心任務(wù)。
相比于標量水下陣列,矢量水下陣列不僅能獲取聲壓單通道信息,在空間共點同步拾取聲場的振速信息。因而矢量水聽器成為水下聲吶技術(shù)中一個快速發(fā)展的新方向[1]。在矢量陣列信號處理領(lǐng)域,傳統(tǒng)波束形成算法面臨著瑞利限的分辨率限制[2]?;谧涌臻g和特征分解算法的提出解決了分辨率限制,形成了包括MUSIC 在內(nèi)多種子空間類DOA 估計方法[3],具有較好的估計性能。但是基于子空間和特征分解算法面臨著矢量水聽器聲壓與振速通道接收噪聲功率不一致的問題[4],隨著信噪比逐漸減小,信號子空間與噪聲子空間的劃分變得逐漸困難,算法性能急劇下降。同時信號空間分解計算復(fù)雜,不能滿足DOA 估計快速性要求。
隨著深度學(xué)習(xí)的快速發(fā)展,多種類型的神經(jīng)網(wǎng)絡(luò)被應(yīng)用于水下DOA 估計[5-8]。相比于傳統(tǒng)DOA 估計算法,在神經(jīng)網(wǎng)絡(luò)中,不用考慮對水聲陣列采集數(shù)據(jù)進一步處理,而是將DOA 估計看作數(shù)據(jù)分類問題。神經(jīng)網(wǎng)絡(luò)的應(yīng)用克服了對陣列模型誤差敏感,低信噪比下效果不佳等問題,同時訓(xùn)練生成的網(wǎng)絡(luò)模型,能夠?qū)崿F(xiàn)DOA 的實時估計[9]。卷積神經(jīng)網(wǎng)絡(luò)在DOA 估計中的應(yīng)用已取得良好效果,但由于池化層丟失部分位置信息,同時神經(jīng)元輸出采用標量形式導(dǎo)致細節(jié)特征提取不充分,需要大數(shù)據(jù)樣本才能更好提取詳細特征。
本文采用Hinton 等于2017 年提出的膠囊網(wǎng)絡(luò)模型[10],其核心思想是將神經(jīng)網(wǎng)絡(luò)中輸出形式由標量輸出變?yōu)槭噶枯敵?,舍棄池化層結(jié)構(gòu),保留網(wǎng)絡(luò)中的位置特征信息,從而實現(xiàn)更好的特征提取效果。采用膠囊神經(jīng)網(wǎng)絡(luò)作為訓(xùn)練模型,利用膠囊神經(jīng)網(wǎng)絡(luò)基于矢量特征輸出特性,證明了在不同信噪比噪聲環(huán)境下,膠囊網(wǎng)絡(luò)DOA 估計性能優(yōu)于傳統(tǒng)子空間類算法和卷積神經(jīng)網(wǎng)絡(luò)模型。
如圖1 所示,在二維平面情況下,建立一個含有N個矢量陣元的均勻線陣,相鄰陣元間距為半波長d=λ/2。在遠場條件下,以位于坐標系原點的陣元1 為參考陣元,假設(shè)有一個波長為 λ的窄帶入射信號,入射水平方位角為θ。理想情況下省略時間因子和波阻抗,則矢量線陣接收到1 個聲壓通道信息P和2 個相互正交的振速分量vx和vy,可以表示為:
圖1 矢量水聽器陣列模型Fig. 1 Model of vector hydrophone array
式中,x(t)為該平面波波形。由單個矢量陣元的單位幅度響應(yīng)可定義:
矢量線陣的空間相位延遲向量表達為:
則矢量水聽器陣列導(dǎo)向矢量為:
式中, ?表示為Kronecker 積。在J次快拍下,這個遠場窄帶信號入射到均勻矢量線陣的輸出數(shù)據(jù)為:
式中:X為 3N×J維數(shù)據(jù)矩陣,表示矢量水聽器對該信號J次快拍下的輸出向量;A=a(θ) 為 3N×1維陣列流型;S=[x1(t)...xJ(t)] 是1 ×J維信號矩陣;N=[n1(t)...nJ(t)]是 3N×J維高斯噪聲矩陣。矢量陣列輸出數(shù)據(jù)的協(xié)方差矩陣可以表示為:
式中, ( ·)H和 E [·]表示為共軛轉(zhuǎn)置和數(shù)學(xué)期望。
在傳統(tǒng)子空間分類算法中可以將Rx看作是由信號子空間US和噪聲子空間UN構(gòu)成:
式中:US代表信號子空間;UN代表噪聲子空間,ΛS; ΛN代表著對應(yīng)的特征值對角矩陣。在理想的條件下,信號子空間與噪聲子空間是相互正交的,所以信號的陣列流型與噪聲子空間也是相互正交,即
Schmidt 利用這個特性構(gòu)造了經(jīng)典MUSIC 算法空間譜:
仿真實驗中由于聲波包含幅值與相位角兩部分信息,所得到的Rx矩陣存在復(fù)數(shù)數(shù)值。由于神經(jīng)網(wǎng)絡(luò)訓(xùn)練過程中不能處理復(fù)值數(shù)據(jù),不能將Rx直接作為數(shù)據(jù)輸入。需要對Rx進 行相應(yīng)數(shù)學(xué)處理。已知Rx=Re{Rx}+Im{Rx}i, 常見方式為將Rx分為實虛部兩部分,令
式中: Re{·} 表示復(fù)數(shù)實部, I m{·}表示復(fù)數(shù)虛部。將Rx的實虛部Q,P看作2 個獨立實值矩陣作為數(shù)據(jù)輸入。實虛部分離法可視作將協(xié)方差矩陣分為2 個維度數(shù)據(jù)并行輸入神經(jīng)網(wǎng)絡(luò),已在卷積神經(jīng)網(wǎng)絡(luò)中取得了良好效果。但實虛部分離法削弱了相位與幅值間關(guān)聯(lián),考慮到聲波信息中幅值相位相互關(guān)聯(lián),采用幅值相位角法進行數(shù)據(jù)變換輸入。已知對任意復(fù)數(shù)有:
通過將數(shù)據(jù)變換為幅值與相位角輸入,最大限度保留幅值與相位角的相關(guān)性,使得網(wǎng)絡(luò)更好地提取相關(guān)位置信息特征,進一步提升模型性能。
2017 年,Hinton 等提出了膠囊網(wǎng)絡(luò)概念。核心思想為采用動態(tài)路由方式,將神經(jīng)元標量輸入輸出變?yōu)橄蛄枯斎胼敵?。相比于傳統(tǒng)神經(jīng)網(wǎng)絡(luò),向量輸出的膠囊網(wǎng)絡(luò),具有更豐富的特征表達能力。
在膠囊網(wǎng)絡(luò)中,由不同神經(jīng)元組成的膠囊包含多個特征信息,從而擁有包含空間方向位置等多特征提取能力。膠囊網(wǎng)絡(luò)結(jié)構(gòu)如圖2 所示。
圖2 膠囊網(wǎng)絡(luò)結(jié)構(gòu)Fig. 2 Capsule network structure
其主要結(jié)構(gòu)包括,卷積特征提取層,主膠囊層,數(shù)字膠囊層。卷積層主要功能在于通過卷積運算提取輸入數(shù)據(jù)中的特征,輸出特征圖。主膠囊層是由卷積層產(chǎn)生的特征圖經(jīng)過卷積操作后,將生成的標量轉(zhuǎn)化為所需要的向量膠囊結(jié)構(gòu)。數(shù)字膠囊層與卷積神經(jīng)網(wǎng)絡(luò)中全連接層相似,但不再是由神經(jīng)元求和后以標量形式輸出,而是改造為膠囊結(jié)構(gòu)進行分類輸出。通過輸出的向量模大小進行分類,以模值最大的向量作為輸出類別。
膠囊網(wǎng)絡(luò)動態(tài)路由算法與卷積神經(jīng)網(wǎng)絡(luò)激活方式對比如圖3 所示。其算法過程如下:
圖3 卷積神經(jīng)網(wǎng)絡(luò)激活方式與膠囊網(wǎng)絡(luò)激活方式Fig. 3 Convolution neural network activation mode and capsule network activation mode
1)初始化,l層膠囊i到l+1層 膠囊j的特征傳遞系數(shù)為bi j←0。
2)在膠囊網(wǎng)絡(luò)中引入新的膠囊權(quán)重耦合系數(shù)cij,由動態(tài)softmax 方式獲取,具體公式為:
3)上層膠囊特征ui傳遞至下層膠囊,得到下層膠囊特征sj,公式為:
4)膠囊的輸出向量的長度來表示某些特征的概率大小。因此,使用一個非線性的“Squashing”函數(shù)保證上層膠囊進行特征壓縮得到下層特征,公式為:
實踐發(fā)現(xiàn)權(quán)值1 改為0.5,可以將模長接近0 的向量放大輸出,加強了特征提取能力。
5)動態(tài)迭代更新l層膠囊i到l+1層膠囊j的特征傳遞系數(shù),其公式為:
膠囊網(wǎng)絡(luò)中損失函數(shù)采用類似支持向量機算法中的邊緣損失函數(shù),其具體公式為:
式中:k為分類數(shù);Tk為分類的指示函數(shù) (存在為 1,不存在為 0);m+=0.9為上界,代表著若數(shù)據(jù)分類后輸出屬于第k類中,則其對應(yīng)數(shù)字膠囊輸出向量的模長至少>0.9,反之則若數(shù)據(jù)分類輸出不屬于第k類中,則膠囊輸出的是一個很短的向量,其模長<0.1; λ 為比例系數(shù),調(diào)整兩者比重,本文取 λ=0.5??倱p失是所有數(shù)字膠囊損失之和。
為驗證本文所提膠囊網(wǎng)絡(luò)算法的性能,進行數(shù)值仿真??紤]到增強算法結(jié)果對比以及水下陣列布放難度,采用陣元數(shù)較少的均勻線陣。該線陣由3 個矢量水聽器組成,陣元間距為半波長,信號源搜索范圍為[-90°,+90°] , 每隔1°取一個樣本,快拍數(shù)為500,對每個角度進行1 000 次Monte-Carlo 仿真實驗。以信噪比為0 dB 時為例,仿真得到181 000 個大小為9×9 的二維協(xié)方差矩陣。將數(shù)據(jù)進行幅值相位處理,以對應(yīng)入射角度為標簽,得到訓(xùn)練所需要的訓(xùn)練集數(shù)據(jù) (|Rx|,θ)。
實驗中,采用卷積神經(jīng)網(wǎng)絡(luò)與膠囊神經(jīng)網(wǎng)絡(luò)進行仿真對比。為了保證實驗結(jié)果準確性,2 個網(wǎng)絡(luò)中卷積核相同,步長為1,模型均采用Relu 激活函數(shù),優(yōu)化方法為Adam,學(xué)習(xí)率為率為0.001,訓(xùn)練過程中單次數(shù)據(jù)讀入量為32,最大迭代次數(shù)設(shè)置為50。卷積神經(jīng)網(wǎng)絡(luò)與膠囊網(wǎng)絡(luò)具體結(jié)構(gòu)如圖4 所示。
圖4 卷積神經(jīng)網(wǎng)絡(luò)模型與膠囊網(wǎng)絡(luò)模型Fig. 4 Convolution neural network model and capsule network model
相鄰陣元間距為半波長d=λ/2,假設(shè)有一個角度為 θ ,波長為 λ的窄帶入射信號下得到信噪比為-5 dB,0 dB,5 dB,10 dB,15 dB 的5 組樣本數(shù)據(jù)。將樣本按照9∶1 的比例隨機劃分為訓(xùn)練集核驗證集。
圖5為MUSIC,CNN,CapsNet 等3 種算法在不同信噪比條件下的準確率??梢钥闯?,由于存在噪聲條件影響,3 種方法不同程度的受到影響。其中,傳統(tǒng)子空間分解所受影響最大,MUSIC 算法的DOA 估計效果較差。卷積神經(jīng)網(wǎng)絡(luò)具有一定抗噪效果,較MUSIC 算法準確率有一定提升。膠囊網(wǎng)絡(luò)在低信噪比條件下,DOA 估計效果優(yōu)于卷積神經(jīng)網(wǎng)絡(luò)。證明膠囊網(wǎng)絡(luò)通過動態(tài)路由方式,有效地進行了多特征提取,加強了的網(wǎng)絡(luò)分類能力。
圖5 不同信噪比下準確率Fig. 5 Accuracy rate of different SNR
圖6為幾種算法的估計角度均方根誤差統(tǒng)計,其公式為:
圖6 不同信噪比下均方根誤差Fig. 6 Accuracy rate of different RMSE
式中:y為真實波達角度;y?為估計的波達角度;m代表需要估計的數(shù)據(jù)個數(shù)。均方根誤差統(tǒng)計可以較好的反應(yīng)出算法的精度和穩(wěn)定性。可以看出,膠囊網(wǎng)絡(luò)算法分辨率總體優(yōu)于卷積神經(jīng)網(wǎng)絡(luò)和MUSIC 算法,且隨著信噪比降低,算法性能優(yōu)勢更加明顯。高信噪比情況下,3 種算法均能提供較好的分辨能力??傮w來說,膠囊網(wǎng)絡(luò)在廣泛的信噪比范圍下具有比其他算法更加穩(wěn)定算法精度與分辨能力。
表1 為快拍數(shù)為500 時,各算法單次估計角度的消耗時長。運行時長為測試1 000 所取平均時間。由表1 可知單次估計時,使用網(wǎng)絡(luò)模型估計時長低于子空間類算法20 倍左右。卷積神經(jīng)網(wǎng)絡(luò)與膠囊網(wǎng)絡(luò)消耗時長相差較小。綜上,膠囊網(wǎng)絡(luò)在保證算法估計性能同時在運行時間上有著明顯優(yōu)勢。
表1 不同估計方法的單次運行時間Tab. 1 Single run time of different estimation methods
本文提出了一種基于膠囊網(wǎng)絡(luò)的水下波達估計算法。結(jié)合矢量水下均勻陣列仿真實驗,對比不同信噪比環(huán)境下膠囊網(wǎng)絡(luò),多重空間分類法與卷積神經(jīng)網(wǎng)絡(luò)3 種方法的方位估計準確率與穩(wěn)定性能。實驗結(jié)果表明,低信噪比環(huán)境下,各算法預(yù)測均受嚴重影響。相比較其他算法,膠囊網(wǎng)絡(luò)所擁有向量動態(tài)路由方式,降低了噪聲影響同時加強了特征能力提取能力,使得在低信噪比環(huán)境下,方位估計模型準確率與穩(wěn)定性能均有較大提升,同時滿足DOA 估計的快速性要求??紤]到本文使用信號均為單個信源,如何利用膠囊網(wǎng)絡(luò)進行多信源方位估計將是下一步工作中心。