尹偉石, 楊文紅, 曲福恒
(1. 長春理工大學 理學院, 長春 130022; 2. 長春理工大學 計算機科學技術學院, 長春 130022)
聲波散射問題在雷達、 無損探傷、 醫(yī)學成像等領域應用廣泛, 目前已得到廣泛關注. 聲波散射問題分為正散射問題和反散射問題. 正散射問題是指對給定的入射波和散射體確定波場的散射特性, 反散射問題是根據(jù)波場的散射特性確定散射體的物理或幾何信息. Kress等[1]提出并證明了無相位遠場數(shù)據(jù)具有平移不變性, 因此利用無相位遠場數(shù)據(jù)重構障礙物的位置十分困難; Zhang等[2]證明了兩個不同方向的平面波疊加入射可打破無相位遠場數(shù)據(jù)的平移不變性, 并用牛頓迭代法重構了障礙物形狀; 文獻[3-4]通過在散射系統(tǒng)中加入?yún)⒖记? 打破了無相位遠場數(shù)據(jù)的平移不變性; Sun等[5]提出了兩個點源疊加入射可以克服無相位數(shù)據(jù)的平移不變性, 并給出了相應的證明. 這些方法使無相位遠場數(shù)據(jù)的平移不變性得到解決. 目前, 關于無相位數(shù)據(jù)反演障礙物形狀問題的研究已有很多結果: Shin[6]在足夠高的頻率下, 提出了利用無相位遠場數(shù)據(jù)重構障礙物形狀的迭代算法, 并通過數(shù)值實驗證明了所提方法的有效性; Zhang等[7]提出了一種直接成像算法, 在固定頻率下, 由多組不同方向的入射波和觀測點產(chǎn)生的無相位遠場數(shù)據(jù)重構障礙物的形狀.
近年來, 神經(jīng)網(wǎng)絡方法在反散射問題中被廣泛應用[8-13]. Li等[8]提出了一種幾何體生成方法, 根據(jù)輸入的特征參數(shù)生成幾何體, 并通過數(shù)值實驗證明了該方法可很好地重構幾何體; Yin等[9]提出了一種序列對序列的神經(jīng)網(wǎng)絡方法, 使用無相位遠場數(shù)據(jù)較好地恢復了障礙物的位置和形狀. 在實際應用中, 遠場數(shù)據(jù)的相位信息很難獲取, 只能獲取遠場數(shù)據(jù)的強度或模(無相位遠場數(shù)據(jù)), 本文考慮無相位遠場數(shù)據(jù)恢復散射障礙問題, 提出一種兩層門控循環(huán)單元(GRU)神經(jīng)網(wǎng)絡對門控循環(huán)單元神經(jīng)網(wǎng)絡的方法(MGNN), 并給出該方法的收斂性分析.
考慮二維聲波散射問題, 對均勻介質中的不可穿透障礙物D?2, 總場u(x)∶=u(i)(x)+u(s)(x), 滿足Helmholtz系統(tǒng)[14]:
因此無法用無相位遠場數(shù)據(jù)|u(∞)(x;d,k)|重構障礙物的位置和形狀. 為打破無相位數(shù)據(jù)的平移不變性, 本文考慮用兩組不同方向的平面波, 令
u(i)=u(i)(x;d1j,d2j,k)∶=exp{ikd1j·x}+exp{ikd2j·x},
(4)
本文從機器學習的角度考慮無相位遠場數(shù)據(jù)反演障礙物位置及形狀問題.
(5)
并定義x=(x(1),x(2),…,x(T))表示{λ11,λ12,…,λnj,…,λΓ1Γ2}, 其中T=Γ1Γ2.
假設1假設障礙物D的邊界曲線有以下參數(shù)化形式:
?D:z(t)=(z1(t),z2(t)), 0≤t≤2π,
其中z1(t),z2(t)用下列Fourier的截斷形式表示:
(6)
式中Q∈. 定義y=(y(1),y(2),…,y(M))表示式(6)的系數(shù)a0,b0,aq,bq,q=1,2,…,Q, 其中M=4Q+2.
本文構建一種兩層GRU神經(jīng)網(wǎng)絡對門控循環(huán)單元神經(jīng)網(wǎng)絡(MGNN)模型, 該模型由多個GRU神經(jīng)網(wǎng)絡構成. 在訓練過程中,x=(x(1),x(2),…,x(T))為模型的輸入,y=(y(1),y(2),…,y(M))為模型的輸出. 對輸入向量x=(x(1),x(2),…,x(T))中每個元素x(t)都先經(jīng)過兩層的GRU神經(jīng)網(wǎng)絡進行特征提取, 并將提取特征作為中間特征進行特征記憶, 再將記憶的特征與y(m)經(jīng)過兩層GRU神經(jīng)網(wǎng)絡進行訓練學習, 從而完成整個神經(jīng)網(wǎng)絡模型的訓練. 每個GRU神經(jīng)網(wǎng)絡的工作狀態(tài)如圖1所示.
圖1 GRU神經(jīng)網(wǎng)絡示意圖Fig.1 Schematic diagram of GRU neural network
GRU神經(jīng)網(wǎng)絡的工作過程由重置門和更新門控制, 圖1中r(t)表示重置門,z(t)表示更新門. 實現(xiàn)過程如下:
r(t)=S(Wr[x(t),h(t-1)]),
t時刻的候選狀態(tài)為:
z(t)=S(Wz[x(t),h(t-1)]),
并計算出中間狀態(tài)
3) 中間狀態(tài)h(t)經(jīng)過全連接層得到最終輸出為y(t)=S(Wo·h(t)).
(7)
損失函數(shù)對權重的梯度為
(8)
更新模型即為更新模型中的權重和偏置.
神經(jīng)網(wǎng)絡第一層、 第二層、 第三層、 第四層的輸入分別為
每層神經(jīng)網(wǎng)絡的輸入向量為
定義3激活函數(shù)對于任意向量A=(a1,a2,…an)T, 有G(A)=(g(a1),g(a2),…,g(an))T, 定義
G′(A)=(g′(a1),g′(a2),…,g′(an))T,G″(A)=(g″(a1),g″(a2),…,g″(an))T.
第四層神經(jīng)網(wǎng)絡重置門的權重梯度為
由初始條件y(0)恒為0得
(10)
對任意給定的初始權重w0, 權重序列{wk}由以下迭代產(chǎn)生:
wk+1=wk+Δwk,
(11)
其中,
(12)
η>0是學習率.
假設2|g(r)|,|g′(r)|,|g″(r)|和|S(r)|,|S′(r)|,|S″(r)|對于r∈是一致有界的.
假設3|wk|(k=0,1,2,…)是一致有界的.
注1假設2和假設3對本文使用的S型激活函數(shù)及雙曲正切激活函數(shù)有效, 且傳統(tǒng)方法經(jīng)常使用假設3進行非線性迭代[12-13], 以確保網(wǎng)絡是收斂的.
定理1假設誤差函數(shù)為式(7), 權重矩陣wt是由式(11)的任意初始權重w0生成的, 且權重矩陣wk二次連續(xù)可導, 則有:
1)E(wk+1)≤E(wk),k=0,1,2,…;
定理1表明建立的神經(jīng)網(wǎng)絡模型是收斂的.
注2由式(7),(8)可得
考慮不同迭代次數(shù)的權重{wk}, 并定義
引理1令Δv(4)(wk,m)=v(4)(wk+1,m)-v(4)(wk,m), 則
(13)
且當d=1時, 有
其中
θ(m-d)是Δv(wk,m)和Δv(wk+1,m)的中間量.
證明: 使用歸納法證明式(13), 首先考慮當m=1時,
Δv(wk,1)=wk+1u(4)(wk+1,1)-wku(4)(wk,1)=wk+1u(4)(wk,1)-wku(4)(wk,1)=u(4)(wk,1)Δwk
成立. 其次, 假設
成立, 則只需證明下式成立即可:
引理2若假設2和假設3成立, 則‖Δv(wk,t)‖≤C‖Δwk‖.
證明: 使用歸納法. 首先考慮當m=1時, 下式成立:
Δv(wk,1)=wk+1u(wk+1,1)-wku(wk,1)=wk+1u(wk,1)-wku(wk,1)=Δwku(wk,1)≤C‖Δwk‖.
假設‖Δv(wk,m)‖≤C‖Δwk‖成立, 則只需證下式成立即可:
同理可證對四層神經(jīng)網(wǎng)絡的權重也成立.
下面證明定理1. 應用Taylor展開式(7),(8),(12)以及注2、 引理1和引理2, 有
其中,
τ(m-d)是Δv(wk,m)和Δv(wk+1,m)的中間量. 根據(jù)假設1、 假設2、 注2、 引理1和引理2及Cauchy-Schwarz不等式, 有|ρ(wk)|≤C‖Δwk‖2, 因此L(wk+1)-L(wk)≤-(η-C)‖Δwk‖2, 若學習率足夠小且滿足0<η<1/C(C是常數(shù)), 則結論1)成立.
下面通過數(shù)值實例說明建立的模型可應用于無相位遠場數(shù)據(jù)重構障礙物的形狀, 并通過數(shù)值實驗驗證本文提出的神經(jīng)網(wǎng)絡模型收斂.
數(shù)據(jù)集的構造是機器學習解決反散射問題的基礎, 本文構造無相位遠場數(shù)據(jù)與形狀參數(shù)的數(shù)據(jù)集. 障礙物D對應的數(shù)據(jù)由定義1的無相位遠場數(shù)據(jù)XD=(XD(1),XD(2),…,XD(T))和假設1的形狀參數(shù)YD=(YD(1),YD(2),…,YD(M))構成. 因此, 引入訓練數(shù)據(jù)集
T={(XD,YD);D∈D},
(14)
其中D表示形狀集合. 首先, 對給定的形狀D, 使用積分方程方法[14]求解系統(tǒng)(1)-(3), 以獲得相關的無相遠場數(shù)據(jù). 其次, 為排除自交邊界曲線和參數(shù)為零的情形, 將式(6)系數(shù)(均勻分布在[-α,α]內,α∈+為給定的先驗常數(shù))用隨機森林算法[15]進行分類處理. 即在第一階段, 訓練網(wǎng)絡以識別其屬于障礙的類別; 在第二階段, 在給定的障礙類別內, 通過給定其無相遠場數(shù)據(jù), 訓練網(wǎng)絡以恢復未知障礙的相應Fourier系數(shù).
假設:
1) 入射波u(i)=u(i)(x;d1j,d2j,k)(j=1,2), 兩組不同入射方向的夾角均為π/3;
2) 用實線表示障礙物的精確邊界, 虛線表示障礙物的預測邊界;
3) 障礙物的無相位遠場數(shù)據(jù)均由波數(shù)k=1.1,2.1計算產(chǎn)生的無相位遠場數(shù)據(jù)拼接而成;
4) GRU神經(jīng)網(wǎng)絡的神經(jīng)元個數(shù)一般設為2p(p∈+), 通過大量實驗確定模型中的參數(shù). 模型中GRU神經(jīng)元個數(shù)為256個, Dropout為0.5, 批量處理(Batch)為800, 迭代次數(shù)(Epoch)為50.
圖2 花生形狀重構Fig.2 Reconstruction of peanut shape
圖3 風箏形狀重構Fig.3 Reconstruction of kite shape
其次, 分別對Γ1,Γ2=5的數(shù)據(jù)集加入5%,10%,20%的噪聲(均值為0、 方差為0.05,0.1,0.2的高斯白噪聲), 對花生和風箏形狀進行反演, 結果分別如圖4和圖5所示. 其中, 圖4(A)~(C)和圖5(A)~(C)分別表示加5%,10%,20%噪聲的訓練數(shù)據(jù)集訓練網(wǎng)絡預測的花生形狀和風箏形狀. 由圖4和圖5可見: 加10%以下噪聲時對花生和風箏形狀的反演結果無明顯影響; 當增加到20%噪聲時, 反演的障礙物曲線與真實曲線發(fā)生偏離. 圖6(A),(B)分別為針對花生形狀和風箏形狀迭代次數(shù)繪制的損失函數(shù)曲線(針對Γ1,Γ2=5的網(wǎng)絡). 圖6結果驗證了網(wǎng)絡的收斂性. 對入射方向及觀測方向Γ1,Γ2=5產(chǎn)生的無相位遠場數(shù)據(jù), 分別選取訓練樣本集為2萬個樣本和5萬個樣本進行花生形狀重構實驗, 結果如圖7所示. 由圖7可見, 增加數(shù)據(jù)集的大小, 可使反演結果更好.
圖4 加噪數(shù)據(jù)對花生形狀重構效果Fig.4 Reconstruction effects of peanut shape with noisy data
圖5 加噪數(shù)據(jù)對風箏形狀重構效果Fig.5 Reconstruction effects of kite shape with noisy data
圖6 迭代損失曲線Fig.6 Curves of iteration loss
圖7 2萬樣本數(shù)據(jù)集(A)和5萬樣本數(shù)據(jù)集(B)的花生形狀重構效果Fig.7 Reconstruction effects of peanut shapes data sets with 20 000 (A) and 50 000 (B) samples
綜上可見, 兩層GRU神經(jīng)網(wǎng)絡對GRU神經(jīng)網(wǎng)絡的方法能有效恢復散射障礙的位置和形狀, 本文從理論和數(shù)值實驗兩方面說明了算法的收斂性, 為無相位反散射問題提供了一種新的計算方法.