馬 敏,孫 穎,范廣永
(中國民航大學(xué) 電子信息與自動化學(xué)院,天津 300300)
電容層析成像(electrical capacitance tomography,ECT)以其非侵入式、無輻射性、低成本、響應(yīng)快速等技術(shù)優(yōu)勢,作為一種多相流可視化的測量方法,受到國內(nèi)外研究人員的廣泛關(guān)注。它是以CT為基礎(chǔ)而發(fā)展起來的一種層析成像技術(shù),與CT技術(shù)所不同的是:ECT技術(shù)所處的領(lǐng)域為軟場,所測量的信號分布與被測物質(zhì)分布存在著復(fù)雜多變的非線性關(guān)系。
ECT圖像重建的數(shù)學(xué)基礎(chǔ)是奧地利數(shù)學(xué)家Randon的變換理論,具有典型的病態(tài)性、欠定性與非線性。1985年,Murai和Kagawa根據(jù)靈敏度定理,使用有限元方法對電導(dǎo)率分布圖像進行了重建[1]。2005年,Soleimani等通過變分的方法重新推導(dǎo)出靈敏度定理,離散后的矩陣便是靈敏度矩陣[2],靈敏度矩陣結(jié)合多種算法用于對反問題的求解。但通過靈敏度矩陣求解的過程中,會造成很大的誤差,導(dǎo)致成像質(zhì)量不佳。早在1994年,Nooralhaiyan等通過神經(jīng)網(wǎng)絡(luò)獲得了將電容數(shù)據(jù)轉(zhuǎn)換為油/氣或油/水相分布的模型,開拓了神經(jīng)網(wǎng)絡(luò)應(yīng)用在ECT技術(shù)中的道路。神經(jīng)網(wǎng)絡(luò)能夠避免靈敏度的求解,于是越來越廣泛地應(yīng)用在ECT技術(shù)中。2014年,宋蕾[3]等提出Elman神經(jīng)網(wǎng)絡(luò)在ECT系統(tǒng)流型辨識中的應(yīng)用;2018年,王莉莉等[4]提出自適應(yīng)與附加動量BP神經(jīng)網(wǎng)絡(luò)的ECT流型辨識。
傳統(tǒng)的神經(jīng)網(wǎng)絡(luò)具有淺層的網(wǎng)絡(luò)結(jié)構(gòu),隱含層較少導(dǎo)致難以表征較為復(fù)雜的函數(shù)關(guān)系。被廣泛應(yīng)用于非線性系統(tǒng)中[5,6]的深度信念網(wǎng)絡(luò)(deep belief network,DBN),含有多隱含層,能夠逐層地進行特征提取,對于復(fù)雜函數(shù)具有強大的學(xué)習(xí)能力。2017年,朱林奇等[7]提出融合深度信念網(wǎng)絡(luò)與核極限學(xué)習(xí)機算法的核磁共振測井儲層滲透率預(yù)測方法,構(gòu)建了NMR測井橫向弛豫時間譜與滲透率的非線性關(guān)系;2018年,劉夢溪等[8]研究了焊縫缺陷圖像分類識別的深度信念網(wǎng)絡(luò)。由于在ECT技術(shù)中,電容數(shù)據(jù)復(fù)雜多樣且與介電常數(shù)呈非線性關(guān)系[9],本文利用深度信念網(wǎng)絡(luò)強大的學(xué)習(xí)能力,構(gòu)建已檢測電容值與圖像灰度值的函數(shù)關(guān)系,簡化圖像重建的過程。為了提高重建圖像質(zhì)量、縮短DBN的訓(xùn)練時間,對該算法進行了改進。
本文所采用的ECT系統(tǒng)[10]主要是由三大部分組成:16電極電容傳感器、數(shù)據(jù)采集系統(tǒng)以及圖像重建系統(tǒng)。16電極電容傳感器是用來測量極板間的電容數(shù)值;數(shù)據(jù)采集系統(tǒng)是將傳感器測量的數(shù)據(jù)進行收集、濾波、變換等處理,并將數(shù)據(jù)傳送給圖像重建系統(tǒng);圖像重建系統(tǒng)將得到的數(shù)據(jù)通過軟件與圖像重建算法進行圖像重建,最終得到重建圖像呈現(xiàn)在PC機上。ECT系統(tǒng)結(jié)構(gòu)如圖1所示。
圖1 ECT系統(tǒng)結(jié)構(gòu)圖Fig.1 System structure diagram of ECT
在ECT系統(tǒng)中主要涉及到的數(shù)學(xué)問題就是正問題[11]與反問題[12]。ECT中的正問題可歸結(jié)為:已知傳感器結(jié)構(gòu)、激勵/測量模式、介電常數(shù)分布等條件,求解場域內(nèi)極板間的電容值、電荷量等數(shù)據(jù)值,最終得到靈敏度矩陣。反問題是相對于正問題而言,根據(jù)正問題中得到的靈敏度矩陣,反演介質(zhì)在場中的分布,圖像重建就是求解反問題的過程。
將電容值與介電常數(shù)分布的非線性關(guān)系離散歸一化[13],得到近似線性的逆問題模型[14,15]為:
C=S×G
(1)
式中:C∈Rm×1;S∈Rm×n;G∈Rn×1;C為電容值;S為靈敏度矩陣;G為介電常數(shù);m為電極的對數(shù);n為剖分的網(wǎng)格數(shù)目。
電容層析成像的最終目的是求解得到介電常數(shù)G。為得到介電常數(shù)G的值,將DBN引入到電容層析成像技術(shù)中,只考慮電容值C與介電常數(shù)G,不需要再對靈敏度矩陣S進行求解;而是利用DBN構(gòu)建電容值與介電常數(shù)分布的非線性關(guān)系,輸入已檢測的電容值C,直接得到介電常數(shù)分布的圖像灰度值。
假設(shè)ECT場域內(nèi)不存在自由電荷,ECT敏感場的數(shù)學(xué)模型可表示為:
[ε(x,y)φ(x,y)]=0
(2)
式中:ε為介電常數(shù)在管道內(nèi)的分布函數(shù);φ為場域內(nèi)電勢分布函數(shù)。
進而得到:
ε(x,y)φ(x,y)+ε(x,y)2φ(x,y)=0
(3)
利用高斯定律,得到電極上的感應(yīng)電荷Qij為:
(4)
(5)
通過傳感器系統(tǒng)測得獨立值電容值的個數(shù)由式(6)表示,本文選取16(n=16)電極,所以會得到120個電容值。
(6)
深度信念網(wǎng)絡(luò)(DBN)是多個RBM[16]模型堆疊而成的能量概率分布模型,訓(xùn)練過程分為預(yù)訓(xùn)練和微調(diào)兩個階段。在預(yù)訓(xùn)練階段,采用對比散度(CD)算法對每個RBM進行逐層無監(jiān)督訓(xùn)練,初始化網(wǎng)絡(luò)參數(shù),其中RBM的輸出層(隱藏層)將會作為下層RBM的輸入層,每一層RBM的訓(xùn)練結(jié)果是對輸入數(shù)據(jù)的非線性變換,以此類推,逐層完成RBM的預(yù)訓(xùn)練。微調(diào)階段,可根據(jù)性能、需求采用不同的算法,利用誤差反向傳播優(yōu)化參數(shù)空間。
RBM是一個兩層的無向圖模型,包含一個可見層V和一個隱藏層H[17],結(jié)構(gòu)如圖2所示??梢妼雍碗[藏層的神經(jīng)元在層內(nèi)無連接,層間全連接??梢妼佑糜诮邮蛰斎霐?shù)據(jù),隱藏層是對可見層進行重構(gòu),可視為特征提取層。
圖2 RBM結(jié)構(gòu)圖Fig.2 Structure Diagram of RBM
假設(shè)所有的隱藏層單元h和可見層單元v均為二值分布,即?i,j,vi∈{0,1},hj∈{0,1}。對于給定的一組狀態(tài)(v,h),RBM的能量函數(shù)為:
(7)
式中:m為可見層單元數(shù)目;n為隱藏層的單元數(shù)目;θ={wij,ai,bj}是RBM的參數(shù);wij是隱藏層單元與可見層單元之間的連接權(quán)重;ai和bj分別表示可見層和隱藏層單元的偏置。根據(jù)能量函數(shù),可以得出這組狀態(tài)(v,h)的聯(lián)合概率分布為:
(8)
(9)
Zθ為歸一化因子。根據(jù)RBM的結(jié)構(gòu)性質(zhì)可知,在給定可見層單元v(或隱藏層h)的基礎(chǔ)上,各個隱藏層單元h(或可見層單元v)的狀態(tài)是相互獨立的,因此計算出第j個隱藏層單元和第i個可見層單元的條件概率分布分別為:
(10)
(11)
其中
(12)
當(dāng)給定1組訓(xùn)練樣本集合S={v1,v2,…,vn}時,其目標(biāo)就是最大化如下似然函數(shù):
(13)
式中N表示訓(xùn)練樣本數(shù)量。為尋求最優(yōu)參數(shù)θ,采用梯度上升法求Lθ,S的最大值。參數(shù)θ的更新公式為:
(14)
式中η表示步長。假設(shè)只有一個訓(xùn)練樣本,則對數(shù)似然函數(shù)Lθ對參數(shù)θ中wij、ai和bj的偏導(dǎo)數(shù)分別為:
(15)
(16)
(17)
[·]data和[·]model分別表示Pθ(h|v)和Pθ(v,h)兩個概率分布的數(shù)學(xué)期望,由于在實際計算中[·]model很難得到,因此利用CD算法中的k步Gibbs采樣方法得到其近似值[18],其近似值表示為[·]k。
對于DBN的構(gòu)建,首先要確定輸入數(shù)據(jù)電容值與輸出數(shù)據(jù)圖像灰度值。確定輸入輸出數(shù)據(jù)后,對于隱藏層數(shù)進行確定。為了選取較為準(zhǔn)確的隱藏層[19],逐漸對隱藏層的個數(shù)進行增加,最多增加到10層,得到了不同層數(shù)的錯誤率[20],如圖3所示。
圖3 不同層數(shù)的錯誤率Fig.3 Error rate of different layers
可以發(fā)現(xiàn)當(dāng)隱藏層為3時效果最好,因此本文構(gòu)建具有3層RBM的DBN。每個隱藏層的節(jié)點數(shù)根據(jù)經(jīng)驗設(shè)置,DBN隱含層的節(jié)點數(shù)分別為100-50-300。數(shù)據(jù)集中的訓(xùn)練數(shù)據(jù)均用來初始化3層網(wǎng)絡(luò)的參數(shù)空間。
使用BP網(wǎng)絡(luò)進行反向微調(diào),對深層網(wǎng)絡(luò)進一步優(yōu)化,數(shù)據(jù)集中的訓(xùn)練數(shù)據(jù)均用來優(yōu)化、更新參數(shù)空間。利用構(gòu)建好的DBN網(wǎng)絡(luò),對存儲的數(shù)據(jù)進行預(yù)訓(xùn)練與反向微調(diào)。DBN模型結(jié)構(gòu)如圖4所示。
圖4 DBN模型結(jié)構(gòu)圖Fig.4 Structure Diagram of DBN Model
(1)引入自適應(yīng)步長的預(yù)訓(xùn)練過程
由于在CD算法中每個RBM均需要進行多次迭代,且每次迭代后的參數(shù)更新方向不盡相同,所以需要選擇適當(dāng)?shù)牟介Lη。如果選擇的η較大,容易引起振蕩;如果η較小,則會導(dǎo)致收斂速度緩慢。為解決這個問題,采用了一種自適應(yīng)步長(adaptive step,AS)的方法[21]。
(18)
式中:α>1表示η的增加系數(shù),β<1表示η的減小系數(shù),且0<β<α。如果2次連續(xù)的參數(shù)更新方向相同,則η增加;如果方向相反,則η減小。引入自適應(yīng)步長后參數(shù)更新機制發(fā)生了變化,參數(shù)wij、ai和bj的更新公式分別為:
wij=wij+η*([vihj]data-[vihj]k)
(19)
ai=ai+η*([vi]data-[vi]k)
(20)
bj=bj+η*([hj]data-[hj]k)
(21)
(2)基于BFGS擬牛頓法的微調(diào)過程
在DBN微調(diào)過程中,一般利用BP算法進行有監(jiān)督地參數(shù)微調(diào),基于最速下降法沿目標(biāo)函數(shù)的負梯度方向調(diào)整參數(shù)。但是這種方法在越接近目標(biāo)值時,收斂速度越慢,從而導(dǎo)致訓(xùn)練耗時長的問題。因此本文采用BFGS擬牛頓法[22]替代最速下降法來加快學(xué)習(xí)速度。
BFGS擬牛頓法是對牛頓法的改進,利用目標(biāo)函數(shù)值和一階導(dǎo)數(shù)的信息構(gòu)造出近似的Hessian矩陣,解決了牛頓法需要計算Hessian矩陣而導(dǎo)致工作量大的缺陷,同時保留了牛頓法收斂速度快的優(yōu)點。
在BFGS擬牛頓法中,目標(biāo)函數(shù)F的定義如下:
(22)
γk+1=γk+αkdk
(23)
式中:dk表示第k步迭代的搜索方向;αk表示第k步搜索方向的步長,一般沿搜索方向做一維搜索獲得最優(yōu)步長。
(24)
設(shè)目標(biāo)函數(shù)F的梯度為g,即:
g=F(γ)
(25)
令第k步迭代的搜索方向dk為:
(26)
其中Bk為近似Hessian矩陣。
(27)
其中,
sk=γk+1-γk
(28)
yk=gk+1-gk
(29)
因此,在預(yù)訓(xùn)練階段引入自適應(yīng)步長(AS),解決固定步長難以尋找全局最優(yōu)的問題;在微調(diào)階段采用BFGS擬牛頓法加快網(wǎng)絡(luò)學(xué)習(xí)速度,減少訓(xùn)練時間。具體的算法流程如圖5所示。
圖5 算法流程圖Fig.5 Diagram of algorithm flow
在本文的仿真實驗中,通過COMSOL5.3軟件對16電極ECT傳感器系統(tǒng)進行建模,對傳感器系統(tǒng)進行有限元分割,分割網(wǎng)絡(luò)設(shè)置為64×64,剖分單元為三角單元,通過有效網(wǎng)絡(luò)來求解場內(nèi)的電容值。主要對核心流、雙泡流、三泡流、層流以及環(huán)狀流進行了仿真設(shè)計,建立模型如圖6所示。其中電極板、屏蔽罩和極板的介電常數(shù)設(shè)置為2.2,管道的介電常數(shù)設(shè)置為5.8,空場材料的介電常數(shù)設(shè)置為1,被測物質(zhì)流型設(shè)置為4.2。
圖6 傳感器系統(tǒng)仿真圖Fig.6 Simulation Diagram of Sensor system
通過MATLAB2014a進行編程,將原流型的圖像分成3228個網(wǎng)格,分別代表了3228個介電常數(shù)值。對于流型與空場的介電常數(shù)設(shè)置一定的閾值,小于1.5的介電常數(shù)統(tǒng)一設(shè)置為灰度值255,大于3.5的介電常數(shù)統(tǒng)一設(shè)置為灰度值0,其余的介電常數(shù)值映射到灰色的灰度值范圍。得到的灰度圖像如圖7所示。
圖7 原流型灰度圖像Fig.7 Gray-scale image of the original flow pattern
由于使用的是16電極的電容傳感器,采樣得到120個獨立電容值,120維的數(shù)據(jù)將作為DBN的輸入。同時使用MATLAB2014a,將原流型圖分成3228個網(wǎng)格,意味著有3228個數(shù)據(jù),DBN的輸出是3228維的數(shù)據(jù)。通過仿真設(shè)計共獲取訓(xùn)練數(shù)據(jù)7500組,其中每種流型數(shù)據(jù)為1500組。
運行MATLAB2014a軟件,通過常用的算法(LBP、Landweber)對已建模型進行圖像重建。再通過DBN與改進DBN對存儲數(shù)據(jù)進行訓(xùn)練與反向微調(diào),使用測試數(shù)據(jù)進行成像;把得到的圖像與傳統(tǒng)算法的圖像進行對比。為了體現(xiàn)對比效果,將傳統(tǒng)算法的重建圖像也設(shè)置一定的閾值,轉(zhuǎn)變成灰度圖像。各流型的圖像重建結(jié)果如圖8所示。
圖8 各流型重建圖像Fig.8 Reconstruction images of various flow patterns
本次實驗仿真利用重建圖像的圖像相關(guān)系數(shù)(CORR)與圖像誤差(IME)對圖像效果進行分析。圖像誤差越小,圖像相關(guān)系數(shù)越大,說明重建圖像的效果越好。圖像誤差I(lǐng)ME和圖像相關(guān)系數(shù)CORR的計算公式如式(30)、(31)所示:
(30)
(31)
表1 IME的計算值Tab.1 Calculated values for IME
表2 CORR的計算值Tab.2 Calculated values for CORR
由CORR與IME的數(shù)據(jù)可以看出,通過DBN重建的圖像明顯優(yōu)于傳統(tǒng)算法的重建圖像,改進DBN的重建效果比DBN的重建效果也有了提高。
對環(huán)狀流,LBP與landweber重建誤差最大,而通過DBN與改進DBN重建誤差最??;改進DBN的圖像誤差低至0.009 4,相關(guān)系數(shù)高達0.997 3,說明DBN對環(huán)狀流的重建有顯著效果,為更好地重建環(huán)狀流提供了基礎(chǔ)。
在改進DBN中,微調(diào)階段采用BFGS擬牛頓法加快網(wǎng)絡(luò)學(xué)習(xí)速度,減少訓(xùn)練時間。通過實驗得知采用DBN進行數(shù)據(jù)訓(xùn)練的時間為21.25 s,而改進DBN將訓(xùn)練時間縮短到15.74 s,說明改進DBN不僅改善了重建效果,還縮短了訓(xùn)練時間。雖然DBN的訓(xùn)練時間較長,但對于已經(jīng)訓(xùn)練好的數(shù)據(jù)進行圖像重建時,能達到圖像重建的實時性,明顯要優(yōu)于傳統(tǒng)算法。
本文將DBN應(yīng)用在電容層析成像技術(shù)中,良好的重建效果驗證了DBN應(yīng)用在ECT技術(shù)中的有效性和可行性。從預(yù)訓(xùn)練和微調(diào)兩個階段對傳統(tǒng)DBN進行了改進,在預(yù)訓(xùn)練階段引入自適應(yīng)步長(AS),避免了固定步長所造成的難以尋找全局最優(yōu)的問題,提高了重建圖像質(zhì)量;在微調(diào)階段,采用BFGS擬牛頓法替代最速下降法,加快了網(wǎng)絡(luò)學(xué)習(xí)速度。當(dāng)確定了DBN的最優(yōu)深度,對于訓(xùn)練數(shù)據(jù)規(guī)模也有很大的要求時,若訓(xùn)練數(shù)據(jù)規(guī)模不足,DBN則會出現(xiàn)過擬合現(xiàn)象。因此為了使DBN在電容層析成像技術(shù)可以得到更廣泛、更有效的應(yīng)用,對于訓(xùn)練數(shù)據(jù)規(guī)模不足的情況,還有待進一步研究。