高明亮,于生寶,鄭建波,徐暢,劉偉宇,欒卉
吉林大學(xué)儀器科學(xué)與電氣工程學(xué)院,長春 130026
?
基于IGA算法的電阻率神經(jīng)網(wǎng)絡(luò)反演成像研究
高明亮,于生寶,鄭建波,徐暢,劉偉宇,欒卉*
吉林大學(xué)儀器科學(xué)與電氣工程學(xué)院,長春 130026
為滿足地球物理資料反演解釋的高精度、快速、穩(wěn)定的要求,本文結(jié)合免疫遺傳算法尋優(yōu)速度快和BP神經(jīng)網(wǎng)絡(luò)反演不依賴初始模型等優(yōu)點(diǎn),設(shè)計(jì)了一種將BP神經(jīng)網(wǎng)絡(luò)和免疫遺傳算法進(jìn)行有機(jī)結(jié)合的全局優(yōu)化反演策略,并將該策略成功地應(yīng)用于二維高密度電法數(shù)據(jù)反演.利用免疫遺傳算法(Immune Genetic Algorithm,簡稱IGA)對神經(jīng)網(wǎng)絡(luò)的反演參數(shù)進(jìn)行同步優(yōu)化,提高了電阻率反演的精度.仿真和實(shí)驗(yàn)結(jié)果驗(yàn)證設(shè)計(jì)的全局優(yōu)化反演策略取得了較好的效果,通過與線性反演方法和BP法以及遺傳神經(jīng)網(wǎng)絡(luò)法等反演方法進(jìn)行比較,得出該方法具有反演精度更高,反演時(shí)間更短等顯著優(yōu)勢的結(jié)論.
免疫遺傳算法;BP神經(jīng)網(wǎng)絡(luò);高密度電阻率法;反演精度
隨著計(jì)算機(jī)技術(shù)和最優(yōu)化方法的發(fā)展,非線性反演方法在地球物理領(lǐng)域逐步顯示出強(qiáng)大的生命力(徐海浪和吳小平,2006;劉斌,2010;張凌云,2011;戴前偉等,2014).近年來,國內(nèi)外關(guān)于電阻率非線性反演方法進(jìn)行了較深入的研究,取得了一些成果.目前非線性反演方法研究主要集中在一維、二維反演方面,其中神經(jīng)網(wǎng)絡(luò)算法以其較強(qiáng)的計(jì)算能力和學(xué)習(xí)能力在地球物理反演領(lǐng)域應(yīng)用最為廣泛(Poulton and El Fouly,1991;Calderon-Macis et al.,2000;Spichak et al.,2002;Fani et al.,2013).Jimmy(2004)、Singh(2005)等率先將神經(jīng)網(wǎng)絡(luò)算法引入電阻率測深的一維反演工作中.在2D、3D電阻率非線性反演中,采用神經(jīng)網(wǎng)絡(luò)法進(jìn)行了電阻率反演研究,不依賴于初始模型,不需要求解偏導(dǎo)數(shù)矩陣且反演速度較快,取得了較好的反演效果(El-Qady and Keisuke,2001;Mann,2006;Ahmad and Samsudin,2009;Singh et al.,2010).但是由于神經(jīng)網(wǎng)絡(luò)的固有特性,存在網(wǎng)絡(luò)結(jié)構(gòu)不穩(wěn)定,反演容易陷入局部極小、收斂慢等問題(Poulton et al.,1992;Cranganu et al.,2007;Vladimir and Krasnopolsky,2007).國內(nèi)外學(xué)者對此進(jìn)行了較為深入的研究,對神經(jīng)網(wǎng)絡(luò)算法做了進(jìn)一步改進(jìn),通過蟻群算法、遺傳算法等算法對網(wǎng)絡(luò)進(jìn)行優(yōu)化(Dai et al.,2014;Marina et al.,2014),克服了神經(jīng)網(wǎng)絡(luò)的上述缺點(diǎn).Maiti等(2011)提出將蒙特卡羅法與神經(jīng)網(wǎng)絡(luò)相結(jié)合進(jìn)行混合二維電阻率反演,張凌云和劉鴻福(2011)利用蟻群算法對神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu)參數(shù)進(jìn)行了優(yōu)化,改善了神經(jīng)網(wǎng)絡(luò)容易陷入局部極小的問題,但是網(wǎng)絡(luò)收斂速度慢,反演精度有待提高.通過對蟻群、模擬退火等多種非線性方法研究發(fā)現(xiàn)遺傳算法與神經(jīng)網(wǎng)絡(luò)相結(jié)合進(jìn)行混合反演,其反演精度最高(張凌云,2011).遺傳算法屬于隨機(jī)優(yōu)化算法,通過初始值的改變尋找最優(yōu)解,而在網(wǎng)絡(luò)維數(shù)較大的情況下,隨機(jī)優(yōu)化算法較組合排序算法具有更明顯的優(yōu)勢.雖然遺傳算法與神經(jīng)網(wǎng)絡(luò)混合反演的反演精度最高,但是遺傳算法優(yōu)化神經(jīng)網(wǎng)絡(luò)參數(shù)時(shí)間較長,遺傳算法的解空間容易被相似性高的適應(yīng)值個(gè)體充滿而缺乏多樣性,導(dǎo)致算法早熟,局部搜索能力變差(周明等,1999;單文桃等,2013).針對遺傳算法的不足,本文嘗試將免疫遺傳算法與神經(jīng)網(wǎng)絡(luò)進(jìn)行混合反演.通過在遺傳算法中引入免疫算子并將BP算法嵌入其中,優(yōu)化神經(jīng)網(wǎng)絡(luò)的反演參數(shù).這種混合反演方法解決了單一遺傳算法優(yōu)化神經(jīng)網(wǎng)絡(luò)時(shí)間過長的問題,加快了遺傳算法搜索速度,提高全局搜索能力,確??焖偈諗坑谌肿顑?yōu)解.同時(shí)克服了BP神經(jīng)網(wǎng)絡(luò)容易陷入局部極小,容錯(cuò)能力差,網(wǎng)絡(luò)結(jié)構(gòu)不穩(wěn)定等問題,減少了反演迭代次數(shù),節(jié)約了運(yùn)算時(shí)間,并且可以獲得更好的電阻率反演結(jié)果,實(shí)現(xiàn)了快速、高精度反演.
由于直流電阻率的建模與模型參數(shù)優(yōu)化直接影響反演成像質(zhì)量,因此對反演模型中的視電阻率進(jìn)行預(yù)處理建模顯得尤為重要.為滿足地球物理反演高精度、快速、穩(wěn)定的要求,并且適應(yīng)復(fù)雜地質(zhì)勘查情況,提高反演成像的快速性和準(zhǔn)確性,本文應(yīng)用BP神經(jīng)網(wǎng)絡(luò)算法對直流電阻率數(shù)據(jù)進(jìn)行建模,利用免疫遺傳算法對神經(jīng)網(wǎng)絡(luò)參數(shù)進(jìn)行同步優(yōu)化,模型輸入為X、Z位置和視電阻率值D矩陣,U為D歸一化處理的數(shù)據(jù),yd和ya分別是參考模型和實(shí)際模型輸出的真實(shí)電阻率矩陣,參考模型空間可通過地質(zhì)信息或廣義線性反演結(jié)果給定模型參數(shù)的變化范圍.E為參考模型輸出與實(shí)際輸出電阻率值的均方差矩陣,BP神經(jīng)網(wǎng)絡(luò)反演參數(shù)通過免疫遺傳算法進(jìn)行在線和離線優(yōu)化獲得,從而使直流電阻率模型的實(shí)際電阻率能夠準(zhǔn)確跟蹤參考模型輸出,也就是均方差值E趨近于0.參考模型和BP神經(jīng)網(wǎng)絡(luò)模型都需要用BP神經(jīng)網(wǎng)絡(luò).其中,參考模型是用來訓(xùn)練BP神經(jīng)網(wǎng)絡(luò)的初始反演參數(shù),它是以離線的方式通過有限差分法正演數(shù)值計(jì)算產(chǎn)生訓(xùn)練集進(jìn)而訓(xùn)練BP神經(jīng)網(wǎng)絡(luò)從而得到初始的反演參數(shù)(戴前偉等,2014).而作為反演模型的BP網(wǎng)絡(luò),其作用則是用以控制被控對象的輸出能夠跟隨參考模型的輸出.
基于IGA算法的電阻率神經(jīng)網(wǎng)絡(luò)反演成像主要分為三部分:BP神經(jīng)網(wǎng)絡(luò)建模、IGA算法優(yōu)化神經(jīng)網(wǎng)絡(luò)反演參數(shù)、神經(jīng)網(wǎng)絡(luò)反演成像.圖1為IGA優(yōu)化的神經(jīng)網(wǎng)絡(luò)反演成像模型系統(tǒng)結(jié)構(gòu)圖.
2.1 BP神經(jīng)網(wǎng)絡(luò)建模
BP神經(jīng)網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu)如圖2a所示.神經(jīng)網(wǎng)絡(luò)包括輸入層、隱含層和輸出層.其中,輸入層神經(jīng)元的數(shù)量等于輸入變量的個(gè)數(shù),輸出層神經(jīng)元的數(shù)量等于輸出變量的個(gè)數(shù),隱含層神經(jīng)元的數(shù)量可以依據(jù)輸入信息量的大小和復(fù)雜度作相應(yīng)的改變.本文將X、Z位置和視電阻率作為神經(jīng)網(wǎng)絡(luò)的輸入,以真實(shí)電阻率作為神經(jīng)網(wǎng)絡(luò)的輸出,這樣的數(shù)據(jù)類型最適合神經(jīng)網(wǎng)絡(luò)的訓(xùn)練和測試.具體討論參見第3節(jié).BP神經(jīng)網(wǎng)絡(luò)的主要思想就是通過樣本集訓(xùn)練網(wǎng)絡(luò),使得神經(jīng)網(wǎng)絡(luò)的輸出與期望輸出的誤差平方和達(dá)到最小.它是通過反復(fù)迭代使相對誤差函數(shù)在斜率下降的方向上計(jì)算網(wǎng)絡(luò)權(quán)閾值和偏差的變化而逐漸達(dá)到目標(biāo).每一次權(quán)值和偏差的變化都與網(wǎng)絡(luò)誤差的響應(yīng)成正比,并以發(fā)射傳播的方式傳到每一層.
圖1 IGA優(yōu)化的反演成像模型系統(tǒng)結(jié)構(gòu)圖Fig.1 The system structure diagram of inversion imaging model
圖2 神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)示意圖(a) 神經(jīng)網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu);(b) 神經(jīng)網(wǎng)絡(luò)算式.Fig.2 A neural network structure diagram(a) The neural network topology;(b) The expression of neural network.
BP神經(jīng)網(wǎng)絡(luò)具體的結(jié)構(gòu)算式如圖2b所示.其中神經(jīng)網(wǎng)絡(luò)的每一隱含層都需要用到激活函數(shù),本文選擇logsig函數(shù),其函數(shù)表達(dá)式如式(1)所示:
(1)
輸入層到隱含層單元J表達(dá)式如下:
(2)
其中xi是神經(jīng)網(wǎng)絡(luò)的輸入變量,netj是隱含層第j個(gè)神經(jīng)元的輸出,wij是神經(jīng)網(wǎng)絡(luò)的連接權(quán)值,bj是單元j第j個(gè)神經(jīng)元的閾值.
隱含層單元J到輸出層aj表達(dá)式為
(3)
BP神經(jīng)網(wǎng)絡(luò)訓(xùn)練算法一般采用梯度下降法來計(jì)算神經(jīng)網(wǎng)絡(luò)權(quán)值,權(quán)值更新規(guī)則如下:
(4)
式中,ε為學(xué)習(xí)動(dòng)量,η為學(xué)習(xí)率,t為訓(xùn)練次數(shù).
BP神經(jīng)網(wǎng)絡(luò)的學(xué)習(xí)誤差E為
(5)
最終BP神經(jīng)網(wǎng)絡(luò)通過不斷地迭代直到誤差函數(shù)E足夠小,網(wǎng)絡(luò)訓(xùn)練結(jié)束.式中P為樣本總數(shù),N為輸出節(jié)點(diǎn)數(shù),apj和dpj分別為第p個(gè)樣本中輸出層神經(jīng)網(wǎng)絡(luò)第j個(gè)神經(jīng)元實(shí)際輸出和期望輸出值.
2.2 免疫遺傳算法
免疫遺傳算法就是將免疫理論(Immune Algorithm,IA)和基本遺傳算法(Simple Genetic Algorithm,SGA)各自的優(yōu)點(diǎn)結(jié)合起來的一個(gè)多學(xué)科相互交叉、滲透的優(yōu)化算法.免疫遺傳算法可以看作一種新型融合算法,羅小平(2002)在遺傳算法中加入免疫算子,使遺傳算法變成具有免疫功能的新算法,是一種改進(jìn)的遺傳算法,該算法既保留了遺傳算法的搜索特性,又利用了免疫算法的多機(jī)制求解多目標(biāo)函數(shù)最優(yōu)解的自適應(yīng)特性,在很大程度上避免了“早熟”,收斂于局部極值.
2.3 IGA算法優(yōu)化神經(jīng)網(wǎng)絡(luò)反演參數(shù)
本文應(yīng)用免疫遺傳算法優(yōu)化神經(jīng)網(wǎng)絡(luò)的反演參數(shù).對神經(jīng)網(wǎng)絡(luò)反演參數(shù)進(jìn)行優(yōu)化設(shè)計(jì)時(shí),應(yīng)在保證神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)穩(wěn)定的前提下,力求加快網(wǎng)絡(luò)收斂速度,以實(shí)現(xiàn)高精度反演.在優(yōu)化設(shè)計(jì)時(shí),本文使用的目標(biāo)函數(shù)與約束函數(shù)均是高度非線性的,屬于多目標(biāo)優(yōu)化問題,適合于免疫遺傳算法的求解.
2.3.1 建立目標(biāo)函數(shù)
對于神經(jīng)網(wǎng)絡(luò)的優(yōu)化設(shè)計(jì)可建立多種目標(biāo)函數(shù),但通常多以目標(biāo)最小為目標(biāo)函數(shù),本文設(shè)計(jì)的目標(biāo)函數(shù)為
(6)
將公式(1)、(2)、(3)代入(6)可以得到:
(7)
2.3.2 優(yōu)化變量設(shè)計(jì)
式(7)為IGA優(yōu)化的目標(biāo)函數(shù),其中目標(biāo)函數(shù)內(nèi)變量wij、bpj為免疫遺傳算法優(yōu)化的變量X.根據(jù)相關(guān)文獻(xiàn)資料以及實(shí)驗(yàn)測試,本文確定選擇有一個(gè)隱含層的三層IGA-BP神經(jīng)網(wǎng)絡(luò)進(jìn)行訓(xùn)練.免疫遺傳算法優(yōu)化神經(jīng)網(wǎng)絡(luò)步驟如下:
(1) 編碼
將待尋優(yōu)變量X作為抗體.標(biāo)準(zhǔn)遺傳算法一般采用二進(jìn)制編碼,其搜索能力強(qiáng),交叉變異計(jì)算方便,但需要頻繁的編碼與解碼,計(jì)算量較大而且精度不高.由于十進(jìn)制編碼精度更高,搜索空間更大,待優(yōu)化參量較多,因而本研究采用十進(jìn)制編碼,可以減小搜索空間,有利于加快收斂速度.
(2) 初始抗體的生成
隨機(jī)產(chǎn)生種群,為了避免無效抗體的產(chǎn)生,本文將變量的取值控制在規(guī)定范圍內(nèi).
(3) 疫苗的提取
在免疫遺傳算法中,疫苗是指從具體的待求解問題的先驗(yàn)知識中提取的一種特征信息.免疫遺傳算法的運(yùn)行效率和性能很大程度上取決于疫苗的合理選擇.優(yōu)良的疫苗對免疫算法的收斂速度有著決定性的影響.本文將每一代的最優(yōu)解作為疫苗,動(dòng)態(tài)地建立疫苗庫,當(dāng)前的最優(yōu)解比疫苗庫中的最差疫苗的親和力高時(shí),則取代該最差疫苗.
(4) 抗體產(chǎn)生(交叉與變異)
用設(shè)定的交叉概率Pc和變異概率Pm,按照標(biāo)準(zhǔn)遺傳算法進(jìn)行交叉和變異操作.
(5) 接種疫苗
從種群中選擇要進(jìn)行接種的個(gè)體,按照動(dòng)態(tài)計(jì)算的接種率將疫苗的基因片段依次接入,即用疫苗基因置換抗體相應(yīng)基因位上原有的基因,形成更好的免疫種群.
(6) 計(jì)算適應(yīng)度和濃度
本文選擇種群大小為100.運(yùn)用IGA來搜索最優(yōu)的函數(shù)參數(shù)X,計(jì)算抗體的適應(yīng)度.公式(7)為本文參數(shù)尋優(yōu)目標(biāo)函數(shù),而免疫遺傳算法中的適應(yīng)度函數(shù)通常為目標(biāo)最大化問題,因此,適應(yīng)度函數(shù)Fitness(x)為
(8)
(7) 免疫機(jī)制選擇
免疫機(jī)制選擇指每次遺傳操作后,隨機(jī)抽取一些個(gè)體注射疫苗,然后進(jìn)行免疫檢測.若親和度提高,則繼續(xù);反之,說明在交叉、變異的過程中出現(xiàn)了嚴(yán)重的退化現(xiàn)象,這時(shí)該個(gè)體將被父代中對應(yīng)的個(gè)體所取代.
(8) 終止條件的判斷
免疫遺傳算法在神經(jīng)網(wǎng)絡(luò)的優(yōu)化過程中,本文定義終止條件為三種形式:
(a) 達(dá)到設(shè)定的循環(huán)迭代次數(shù);
(b) 連續(xù)幾代優(yōu)化解沒有改善;
(c) 達(dá)到最大優(yōu)化時(shí)間.
滿足其一,則將與抗原親和度最高的抗體加入免疫記憶數(shù)據(jù)庫中,輸出最優(yōu)結(jié)果并進(jìn)行下一步.
(9) 獲取神經(jīng)網(wǎng)絡(luò)參數(shù)
通過免疫遺傳算法的深度優(yōu)化,提供了一組最佳的網(wǎng)絡(luò)參數(shù),然后再進(jìn)行神經(jīng)網(wǎng)絡(luò)反演,若滿足反演效果,則進(jìn)行下一步,否則,繼續(xù)進(jìn)行訓(xùn)練,直到達(dá)到滿意結(jié)果.
(10) 仿真測試,結(jié)果輸出.免疫遺傳算法優(yōu)化神經(jīng)網(wǎng)絡(luò)框圖如圖3所示.
電阻率的反演建模是一個(gè)極其復(fù)雜的問題,Singh等(2010)使用采集的視電阻率和基單元作為網(wǎng)絡(luò)模型的輸入節(jié)點(diǎn),真實(shí)的電阻率作為模型的輸出節(jié)點(diǎn),通過改變異常體的大小和位置作為網(wǎng)絡(luò)訓(xùn)練樣本,對于復(fù)雜的地質(zhì)結(jié)構(gòu),則需要建立大量訓(xùn)練樣本,耗費(fèi)運(yùn)算時(shí)間.徐海浪等(2006)考慮上述缺點(diǎn),使用視電阻率作為網(wǎng)絡(luò)模型的輸入節(jié)點(diǎn),真實(shí)電阻率作為網(wǎng)絡(luò)模型的輸出.但是由于輸入和輸出節(jié)點(diǎn)過大,導(dǎo)致網(wǎng)絡(luò)收斂速度降低,訓(xùn)練和測試需要大量的時(shí)間.針對這個(gè)問題,戴前偉等(2014)提出了新的建模方式,將采集并預(yù)處理后的視電阻率數(shù)據(jù)按分布區(qū)域分組,以每個(gè)分組數(shù)據(jù)為神經(jīng)網(wǎng)絡(luò)的一個(gè)訓(xùn)練樣本.雖然通過分割樣本的大小來控制輸入輸出節(jié)點(diǎn)的數(shù)量,提高了網(wǎng)絡(luò)收斂的速度并且節(jié)約了運(yùn)算時(shí)間,但是依然存在輸入輸出節(jié)點(diǎn)過多的問題.Ahmand等(2010)使用采集的視電阻率和相應(yīng)的水平、垂直位置作為網(wǎng)絡(luò)模型的輸入節(jié)點(diǎn),相應(yīng)位置的真實(shí)電阻率作為輸出節(jié)點(diǎn),其特點(diǎn)是輸入輸出節(jié)點(diǎn)少,網(wǎng)絡(luò)結(jié)構(gòu)簡單,網(wǎng)絡(luò)收斂速度最佳,但是要求建立足夠多訓(xùn)練網(wǎng)絡(luò)的樣本.
圖3 免疫遺傳神經(jīng)網(wǎng)絡(luò)框圖Fig.3 The flowchart of Immune Genetic Algorithm
對于IGA-BP神經(jīng)網(wǎng)絡(luò),以上四種建模方法均有不足,Singh等(2010)采用的建模方法網(wǎng)絡(luò)結(jié)構(gòu)復(fù)雜,訓(xùn)練樣本數(shù)目過多,網(wǎng)絡(luò)收斂速度慢;徐海浪等(2006)采用的建模方法輸入輸出節(jié)點(diǎn)過多,網(wǎng)絡(luò)結(jié)構(gòu)臃腫,參數(shù)過多,不便于IGA優(yōu)化;戴前偉等(2014)采用的樣本分割建模方法,雖然是輸入輸出節(jié)點(diǎn)有所減少,網(wǎng)絡(luò)收斂速度加快,但是依然存在節(jié)點(diǎn)過多的問題.對于IGA優(yōu)化設(shè)計(jì)來講,參數(shù)過多容易導(dǎo)致優(yōu)化時(shí)間較長;Ahmand等(2010a,2010b)提出了很好的建模方法,輸入輸出節(jié)點(diǎn)少,網(wǎng)絡(luò)結(jié)構(gòu)精煉,但是單個(gè)樣本集數(shù)量過大.
本文充分考慮以上多種建模的優(yōu)缺點(diǎn),采用如下的建模方法:首先,確定模型的輸入輸出節(jié)點(diǎn),對采集的視電阻率進(jìn)行預(yù)處理,然后將預(yù)處理后的視電阻率和相應(yīng)的水平、垂直位置作為網(wǎng)絡(luò)模型輸入節(jié)點(diǎn),真實(shí)的電阻率作為網(wǎng)絡(luò)模型的輸出節(jié)點(diǎn),這樣構(gòu)建的網(wǎng)絡(luò)結(jié)構(gòu)參數(shù)最小,模型結(jié)構(gòu)精簡,收斂速度快.其次分割訓(xùn)練樣本集.由于單個(gè)樣本集整體輸入網(wǎng)絡(luò)訓(xùn)練,數(shù)量過大,我們將大的樣本集分隔開成多個(gè)小樣本集,來訓(xùn)練網(wǎng)絡(luò),這樣在保證網(wǎng)絡(luò)收斂快的同時(shí)節(jié)約了運(yùn)算時(shí)間,構(gòu)建的模型反演效果更好.
為了驗(yàn)證不同學(xué)習(xí)算法對神經(jīng)網(wǎng)絡(luò)反演的影響,本文采用溫納-斯倫貝格裝置進(jìn)行測量,共使用37個(gè)測量電極,測量極距為1 m.共采集210個(gè)數(shù)據(jù)點(diǎn).通過上述的討論,本文IGA-BP神經(jīng)網(wǎng)絡(luò)模型使用三層神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu).網(wǎng)絡(luò)的樣本集通過改變異常體的大小、位置、形態(tài)來獲得,其中測試樣本集不參與網(wǎng)絡(luò)的訓(xùn)練,圖4為構(gòu)建的部分訓(xùn)練樣本模型.圖5為用于測試的樣本模型.
其中在構(gòu)建訓(xùn)練樣本集時(shí)要盡可能考慮反演目標(biāo)中異常體的形態(tài)、大小以及反演目標(biāo)的周圍環(huán)境測試樣本集應(yīng)該與反演目標(biāo)較為接近.本文使用RES2DMOD軟件獲得的2D數(shù)據(jù)集作為訓(xùn)練與測試數(shù)據(jù)集.
圖4 用于訓(xùn)練的部分樣本模型Fig.4 The sample models for network training
圖5 用于測試的樣本模型Fig.5 The sample models for network test
在人工神經(jīng)網(wǎng)絡(luò)中,BP神經(jīng)網(wǎng)絡(luò)占據(jù)了重要的位置,許多研究對其內(nèi)部的訓(xùn)練算法做了進(jìn)一步的改進(jìn),從而提高收斂速度.其中比較有代表的是附加動(dòng)量法、自適應(yīng)學(xué)習(xí)速率法、彈性BP算法(簡稱RPROP).彈性BP算法只取偏導(dǎo)數(shù)符號,不考慮偏導(dǎo)數(shù)的幅值,偏導(dǎo)數(shù)的符號決定權(quán)值更新的方向.該訓(xùn)練算法收斂速度較前述兩種方法快,因而在大量實(shí)際應(yīng)用中,彈性BP算法非常有效.
Ahmand(2010a,2010b)、張凌云等(2011)均采用彈性BP算法作為網(wǎng)絡(luò)訓(xùn)練算法,對于大數(shù)據(jù)來說,該算法收斂速度最快,因而在地球物理中得到廣泛應(yīng)用.
BP算法大多是局部優(yōu)化算法,這些算法本身自然在訓(xùn)練過程容易陷入局部小的問題,即在訓(xùn)練過
程中可能找不到某個(gè)具體問題的解.針對這個(gè)問題,張凌云等(2010)提出混合算法進(jìn)行優(yōu)化設(shè)計(jì),并指出遺傳算法優(yōu)化神經(jīng)網(wǎng)絡(luò)的反演精度最高,但是基本的遺傳算法優(yōu)化時(shí)間過長,本文在基本遺傳算法的基礎(chǔ)上,又引進(jìn)了免疫算法,通過引入免疫機(jī)制提高遺傳算法的優(yōu)化速度,使其在優(yōu)化過程中,快速得到最佳解.
本文分別用三種算法——采用彈性BP訓(xùn)練算法的神經(jīng)網(wǎng)絡(luò)算法、遺傳神經(jīng)網(wǎng)絡(luò)算法(簡稱GABP法)和免疫遺傳神經(jīng)網(wǎng)絡(luò)算法(簡稱IGA-BP法)對所建立的訓(xùn)練樣本集進(jìn)行訓(xùn)練和測試.實(shí)驗(yàn)中算法的運(yùn)行參數(shù)分別設(shè)置如下:種群規(guī)模均為100,疫苗接種概率:a=0.7,交叉概率:Pc=0.67,變異概率:Pm= 0.05,最大代數(shù)為1000,動(dòng)態(tài)疫苗庫的疫苗數(shù)量M=8.目標(biāo)誤差均設(shè)置為0.01,具體的參數(shù)設(shè)置如表1所示.
三種不同學(xué)習(xí)算法性能如表2、3所示,從中我們可以清晰地看出非線性算法混合反演的優(yōu)越性,反演計(jì)算時(shí)間短、精度高.本文選取50個(gè)樣本集和12個(gè)測試集進(jìn)行試驗(yàn)驗(yàn)證,其中表2性能對比為50次訓(xùn)練的平均值,學(xué)習(xí)步數(shù)和時(shí)間均是在目標(biāo)收斂的情況下.表3、4為分別使用BP法、GABP法和IGA-BP法的進(jìn)行訓(xùn)練和測試的結(jié)果對比表,由此得到以下結(jié)論:
表1 不同算法的參數(shù)設(shè)置
(1) 針對神經(jīng)網(wǎng)絡(luò)容易陷入局部小,收斂性相對較差的問題,應(yīng)用多種算法對神經(jīng)網(wǎng)絡(luò)進(jìn)行權(quán)重優(yōu)化,從表2中,IGA-BP神經(jīng)網(wǎng)絡(luò)算法明顯優(yōu)于GABP神經(jīng)網(wǎng)絡(luò),優(yōu)化時(shí)間明顯少于GABP神經(jīng)網(wǎng)絡(luò),而且迭代次數(shù)要明顯少于GABP神經(jīng)網(wǎng)絡(luò),大大節(jié)約了運(yùn)算時(shí)間.
表2 反演算法權(quán)重優(yōu)化過程對比
表3 三種反演算法性能對比
表4 三種反演算法試驗(yàn)結(jié)果對比
(2) BP神經(jīng)網(wǎng)絡(luò)法進(jìn)行反演時(shí)需要用雙隱含層才可以獲得較好的網(wǎng)絡(luò)進(jìn)行預(yù)測,需要多次調(diào)整隱含層節(jié)點(diǎn)數(shù),因此迭代次數(shù)較多、費(fèi)時(shí)較長,而IGA-BP法反演和GABP反演時(shí),由于先優(yōu)化了BP神經(jīng)網(wǎng)絡(luò)初始的權(quán)闕值,所以在訓(xùn)練時(shí)僅單隱含層網(wǎng)絡(luò)就可得到更優(yōu)的結(jié)果,反演速度較快.
(3) 收斂比是指在50次訓(xùn)練的過程中收斂的次數(shù)占總數(shù)的比例,表明算法的優(yōu)越性.綜合對比不難發(fā)現(xiàn)IGA-BP反演收斂效果最好.
(4) 反演時(shí)間是指訓(xùn)練好神經(jīng)網(wǎng)絡(luò)的權(quán)闕值參數(shù)之后,實(shí)際反演所需的時(shí)間.IGA-BP神經(jīng)網(wǎng)絡(luò)的反演時(shí)間在相同情況之下,所需時(shí)間最短,其次為GABP神經(jīng)網(wǎng)絡(luò),而BP神經(jīng)網(wǎng)絡(luò)的時(shí)間較長,表明神經(jīng)泛化能力不及前兩者.
(5) 預(yù)測誤差是指參考模型輸出與實(shí)際輸出電阻率值的均方差值(MSE),判斷系數(shù)R2通常用于判定自變量和因變量之間的符合度,通常介于0~1之間,R2越大符合性越好(張凌云,2011;戴前偉,2014),這兩者是表明數(shù)據(jù)穩(wěn)定性的參數(shù).從三種神經(jīng)網(wǎng)絡(luò)方法的預(yù)測誤差值看,IGA-BP要優(yōu)于GABP和BP算法,在測試的樣本模型中預(yù)測最大絕對值誤差,前者僅為12.3,后兩者高達(dá)32.19和82.28.因此,通過上述五點(diǎn)的對比,可見IGA-BP和GABP神經(jīng)網(wǎng)絡(luò)算法無論訓(xùn)練成功率還是數(shù)據(jù)穩(wěn)定性都要明顯好于BP算法.從收斂速度和運(yùn)算時(shí)間上看,IGA-BP算法反演效果是最優(yōu)的.
表5 反演算法試驗(yàn)結(jié)果對比
為了進(jìn)一步驗(yàn)證上述反演算法的性能,本文選擇的算例模型為經(jīng)典的垂直雙阻模型和3個(gè)異常體的組合模型,并將其用于IGA-BP和最小二乘法RES2DINV、GABP、BP反演結(jié)果的對比.
模型1采用溫納-斯倫貝格裝置,電極極距為1 m,共使用37個(gè)電極.背景場的電阻率為100 Ωm,其中的兩處異常均為高阻500 Ωm,地下埋深分別為1 m和3 m,在水平16 m和19 m之間,異常體的尺寸大小均為1 m×3 m,如圖6a所示.在電阻率二維神經(jīng)網(wǎng)絡(luò)反演測試中,神經(jīng)網(wǎng)絡(luò)輸入節(jié)點(diǎn)為X、Z位置和視電阻率數(shù)據(jù),網(wǎng)絡(luò)輸出為真實(shí)電阻率參數(shù),網(wǎng)絡(luò)輸出的反演結(jié)果如圖6所示.
從圖6和表5的反演結(jié)果分析可知,從異常體形態(tài)上來看,IGA-BP神經(jīng)網(wǎng)絡(luò)反演的結(jié)果能較為準(zhǔn)確地反應(yīng)異常體的位置和電阻率,異常體形態(tài)和輪廓清晰,最小二乘法反演結(jié)果沒有區(qū)分開異常體之間的間隙,IGA-BP反演效果明顯優(yōu)于RES2DINV軟件的反演結(jié)果.從反演時(shí)間上來看,IGA-BP算法首先利用IGA法對神經(jīng)網(wǎng)絡(luò)進(jìn)行初始權(quán)值、闕值的最優(yōu)尋找,為神經(jīng)網(wǎng)絡(luò)算法提供較好的訓(xùn)練初始權(quán)值、闕值,優(yōu)化好神經(jīng)網(wǎng)絡(luò)參數(shù)后,神經(jīng)網(wǎng)絡(luò)可以直接反演,而且不需要重復(fù)訓(xùn)練反演時(shí)間只需要1.6 s,而最小二乘法反演時(shí)間為2.7 s.僅單純從反演時(shí)間來看,IGA-BP反演時(shí)間最短,具有較高的反演效率.
模型2為3個(gè)異常體的組合模型,主要用于檢驗(yàn)IGA-BP和GABP、BP的反演性能的差異,模型2的基本參數(shù)設(shè)置如下:依然采用溫納-斯倫貝格裝置,接收電極37個(gè),電極極距1 m,背景場的電阻率為150 Ωm,高阻異常體1的形態(tài)大小為1 m×3 m,電阻率值為800 Ωm,在水平13 m和16 m之間,低阻異常體2的形態(tài)大小均為0.5 m×1 m,頂部埋深2 m,在水平14.75 m和15.25 m之間,電阻率值為20 Ωm,低阻異常體3的形態(tài)大小均為12 m×2 m,頂部埋深1 m,在水平25 m和37 m之間,電阻率值為20 Ωm,頂部埋深1 m,在電阻率二維神經(jīng)網(wǎng)絡(luò)反演測試中,神經(jīng)網(wǎng)絡(luò)輸入節(jié)點(diǎn)為 X、Z位置和視電阻率數(shù)據(jù),網(wǎng)絡(luò)輸出為真實(shí)電阻率參數(shù),網(wǎng)絡(luò)輸出的反演結(jié)果如圖7所示.
從表5和圖7的反演結(jié)果分析可知,從預(yù)測誤差和判斷系數(shù)來看,IGA-BP算法的MSE和R2僅為3.07%和0.97,反演性能最優(yōu).從異常體形態(tài)上來看,三種神經(jīng)網(wǎng)絡(luò)反演的結(jié)果均能較為準(zhǔn)確地反映異常體的位置和電阻率,異常體形態(tài)和輪廓都較為清晰.BP算法的反演結(jié)果在高阻異常體1、低阻異常體2處出現(xiàn)了較大失真,多了一些冗余構(gòu)造,同時(shí)低阻異常體的電阻率值與實(shí)際差異較大.GABP反演算法較BP算法得到一些改善,但在低阻異常體2依然存在較大的失真.IGA-BP算法的反演結(jié)果與實(shí)際模型更為接近,異常體的形態(tài)結(jié)構(gòu)、位置、電阻率值均得到較好的反映,證實(shí)了算法具有較好的泛化能力和穩(wěn)定性.
圖6 樣本模型1的示意圖及不同方法的反演結(jié)果(a) 模型示意圖;(b) IGA-BP反演結(jié)果;(c) RES2DIV軟件反演結(jié)果.Fig.6 The model 1 and inversion results of different algorithms(a) The Schematic model;(b) IGA-BP inversion results;(c) RES2DIV software inversion results.
圖7 樣本模型2的示意圖及不同方法的反演結(jié)果(a) 模型示意圖;(b) IGA-BP反演結(jié)果;(c) GABP反演結(jié)果;(d) BP反演結(jié)果.Fig.7 The model 2 and inversion results of different algorithms(a) Schematic model;(b) IGA-BP inversion results;(c) GABP inversion results;(d) BP inversion results.
圖8 采空區(qū)示意圖及視電阻率斷面圖(a) 野外示意圖;(b) 視電阻率斷面圖.Fig.8 The schematic of Goaf and its apparent resistivity cross-sectional view(a) The Goaf schematic view;(b)The apparent resistivity cross-sectional view.
圖9 不同方法的反演結(jié)果(a) IGA-BP反演結(jié)果;(b) BP反演結(jié)果;(c) 線性反演結(jié)果.Fig.9 The inversion results of different algorithms(a) IGA-BP inversion results;(b) BP inversion results;(c) RES2DIV software inversion results.
為了進(jìn)一步驗(yàn)證IGA-BP算法的優(yōu)越性,本文進(jìn)行了野外工程實(shí)驗(yàn),實(shí)驗(yàn)區(qū)域?yàn)榧质¢L春市吉林大學(xué)朝陽校區(qū)原日偽時(shí)期留下的防空洞區(qū)域,圖8a為防空洞示意圖.圖中A處為下水管道口,下水管道口徑為1 m×2 m,深度為3 m,在第12個(gè)電極和第14個(gè)電極之間.B處為防空洞區(qū)域.防空洞走向?yàn)橛蓶|向北,頂部距離地面0.5 m,深度為3 m,在第25個(gè)電極和第37個(gè)電極之間,本次探測在測區(qū)內(nèi)由南向北布設(shè)1條測線,使用GenPenE60D分布式高密度電法儀器進(jìn)行實(shí)地測量,采用溫納-斯倫貝格裝置,電極極距為1 m,共使用37個(gè)電極,共完成測點(diǎn)210個(gè).
本文用三種算法分別對采集的視電阻率進(jìn)行反演成像,視電阻率斷面圖、反演結(jié)果分別如圖8b、圖9所示.由反演結(jié)果圖9可知,從異常體形態(tài)上來看,IGA-BP算法和BP算法均較正確地反映了異常體的位置和電阻率值,而在異常體輪廓上IGA-BP算法反演結(jié)果更為清晰.而線性反演方法反演結(jié)果與實(shí)際結(jié)果相比失真很大,并且異常體的阻值也與實(shí)際值相差很大,無法觀測數(shù)據(jù)末端的異常體.基于以上判斷,不難發(fā)現(xiàn)IGA-BP算法的優(yōu)越性,從而驗(yàn)證了IGA-BP算法具有較強(qiáng)的泛化能力和穩(wěn)定性.
本文聯(lián)合多種算法實(shí)現(xiàn)了高密度電阻率法的非線性混合反演,克服了單獨(dú)使用BP神經(jīng)網(wǎng)絡(luò)易陷入局部極小、依賴初始權(quán)閾值、反演時(shí)間長及收斂速度慢等缺點(diǎn).文中提出將免疫遺傳算法與神經(jīng)網(wǎng)絡(luò)混合進(jìn)行反演,提出了最小精煉的反演模型結(jié)構(gòu),通過模型仿真與實(shí)驗(yàn)驗(yàn)證,并與BP等反演算法對比,該算法反演誤差較小,反演時(shí)間較短,較傳統(tǒng)的線性反演成像更加清晰準(zhǔn)確,具有很好的應(yīng)用前景.總之,IGA-BP反演方法是一種新型的直流電法非線性反演成像技術(shù),對復(fù)雜地質(zhì)構(gòu)造和三維電阻率反演成像的問題,IGA-BP反演方法有待進(jìn)一步進(jìn)行理論研究,需在以后的工作中不斷完善.
致謝 感謝吉林大學(xué)地球信息探測儀器教育部重點(diǎn)實(shí)驗(yàn)室提供了研究平臺,感謝吉林大學(xué)時(shí)間域電磁組的全體成員給予的幫助和指導(dǎo),感謝審稿專家對該文的審定.
Ahmad N,Samsudin T.2009.Using artificial neural networks to invert 2D DC resistivity imaging data for high resistivity contrast regions:A MATLAB application.Computers and Geosciences,35(11):2268-2274.
Ahmad N,W A T.Wan.A,Samsudin T.2010a.Inversion of quasi-3D DC resistivity imaging data using artificial neural networks.Journal of Earth System Science,119(1):27-40.
Ahmad N,W A T.Wan.A,Samsudin H.T.2010b.3D inversion of DC data using artificial neural networks.Studia Geophysica et Geodaetica,54(3):465-485.
Calderon-Macis C,Sen I K,Stoffa P L.2000.Artificial neural networks for parameter estimation in geophysics.Geophysical Prospecting,48(1):21-47.
Cranganu C.2007.Using artificial neural networks to predict the presence of overpressured zones in the Anadarko Basin,Oklahoma.Pure and Applied Geophysics,164(10):2067-2081.
Dai Q W,Jiang F B,Li D.2014.Nonlinear inversion for electrical resistivity tomography based on chaotic DE-BP algorithm.Journal of Central South University.,21(5):2018-2025.
Dai Q W,Jiang F B,Dong L.2014.RBFNN inversion for electrical resistivity tomography based on Hannan-Quinn criterion.Chinese J.Geophys.(in Chinese),57(4):1335-1344.
El-Qady G,Keisuke U.2001.Inversion of DC resistivity data using neural networks.Geophysical Prospecting,49(1):417-430.
Fani E A,George J T,Ioannis F G,et al.2013.Estimation of seasonal variation of ground resistance using Artificial Neural Networks.Electric Power Systems Research,94:113-121.
Jimmy Stephen,Manoj C,Singh S B.2004.A direct inversion seheme for deep resistivity Sounding data using artificial neural networks.Journal of Earth System Science,113(l):49-66.
Liu B.2010.Study on the water-bearing structure advanced detection and water inrush hazards real-time monitoring in tunnel based on the electrical resistivity method and induced polarization method [Ph.D.thesis] (in Chinese).Shandong:Shandong University.
Luo X P.2002.The research on artificial immune genetic learning algorithm and its application in engineering [Ph.D.thesis] (in Chinese).Hangzhou:Zhejiang University.
Poulton M,El-Fouly A.1991.Preprocessing GPR signatures for cascading neural network classification.SEG Expanded Abstracts,10(1):507-509.
Poulton M,Sternberg K,Glass C.1992.Neural network pattern recognition of subsurface EM images.Journal of Applied Geophysic,29(1):21-36.
Spichak V V,F(xiàn)ukuoka K,Kobayashi T.et al.2002.Artificial neural network reconstruction of geoelectrical parameters of the Minou fault zone by scalar CSAMT data.Journal of Applied Geophysics,49(1):75-90.
Singh U K,Tiwari R K,Singh S B.2005.One-dimensional inversion of geo-electrical resistivity sounding data using artificial neural networks—a case study.Computers &Geosciences,31(1):99-108.
Singh U K,Tiwari R K,Singh S B.2010.Inversion of 2-D DC resistivity data using rapid optimizationand minimal complexity neural network.Nonlinear Processes in Geophysics,17(1):65-76.
Mann C J H .2006.Geophysical Applications of Artificial Neural Networks and Fuzzy Logic.Kybernetes,35(1):3-4.
Shan W T,Chen X A,He Y,et al. 2013.Application of immune genetic algorithm based fuzzy RBF neural Network in high-speed motorized spindles.Chinese Journal of Mechanical Engineering (in Chinese),49(23):167-173.
Maiti S,Gupta G,Erram V C.2011.Inversion of Schlumberger resistivity sounding data from the critically dynamic Koyna region using the Hybrid Monte Carlo-based neural network Approach.Nonlinear Processes in Geophysics.,18(2):179-192.
Marina R C,NiklasL,Thomas K,Jasper A.2014.Vrugt Two-dimensional probabilistic inversion of plane-wave electromagnetic data:methodology,model constraints and joint inversion with electrical resistivity data.Geophysical Journal International,196 (3):1508-1524.
Vladimir M,Krasnopolsky.2007.Neural network emulations for complex multidimensional geophysical mappings:Applications of neural network techniques to atmospheric and oceanic satellite retrievals and numerical modeling.Reviews of Geophysics,45(1):RG3009.
Xu H L,Wu X P.2006.Inversion of 2D resistivity neural networks.Chinese J.Geophys.(in Chinese),49(2):584-589.
Zhang L Y,Liu H F.2011. The application of ABP method in high-density resistivity method inversion. Chinese J.Geophys.(in Chinese),54(1):227-233.
Zhang L Y.2011.The study of nonlinear inversion method in high-density resistivity method inversion[Ph.D.thesis] (in Chinese).Taiyuan:Taiyuan University of Technology.
Zhou M,Sun S D.1999.Genetic Algorithm Theory and Application (in Chinese).Bengjing:National Defense Industry Press.
附中文參考文獻(xiàn)
戴前偉,江沸菠,董莉.2014.基于漢南-奎因信息準(zhǔn)則的電阻率層析成像徑向基神經(jīng)網(wǎng)絡(luò)反演.地球物理學(xué)報(bào),57(4):1335-1344.
單文桃,陳小安,合燁等.2013.基于免疫遺傳算法的模糊徑向基函數(shù)神經(jīng)網(wǎng)絡(luò)在高速電主軸中的應(yīng)用.機(jī)械工程學(xué)報(bào),49(23):167-173.
劉斌.2010.基于電阻率法與激電法的隧道含水地質(zhì)構(gòu)造超前探測與突水災(zāi)害實(shí)時(shí)監(jiān)測研究[博士論文].山東:山東大學(xué).
羅小平.2002.人工免疫遺傳學(xué)習(xí)算法及其工程應(yīng)用研究[博士論文].杭州:浙江大學(xué).
徐海浪,吳小平.2006.電阻率二維神經(jīng)網(wǎng)絡(luò)反演.地球物理學(xué)報(bào),49(2):584-589.
張凌云,劉鴻福.2011.ABP法在高密度電阻率法反演中的應(yīng)用.地球物理學(xué)報(bào),54(1):227-233.
張凌云.2011.高密度電阻率勘探反演的非線性方法研究[博士論文].太原:太原理工大學(xué).
周明,孫樹棟.1999.遺傳算法原理與應(yīng)用.北京:國防工業(yè)出版社.
(本文編輯 汪海英)
Research of resistivity imaging using neural network based on immune genetic algorithm
GAO Ming-Liang,YU Sheng-Bao,ZHENG Jian-Bo,XU Chang,LIU Wei-Yu,LUAN Hui*
College of Instrumentation and Electrical Engineering,Jilin University,Changchun 130026,China
In order to meet the requirements of high precision,high speed and stability in geophysical inversion,we design a global optimization inversion strategy based on BP neural network and immune genetic algorithm,considering the fast searching speed of immune genetic algorithm and the independence of the initial model in BP neural network inversion.The strategy is successfully applied to the two-dimensional high density resistivity inversion.By using Immune Genetic Algorithm (IGA) for synchronous optimization of the neural network inversion parameters,the precision of the resistivity inversion can be improved .The results of experiment and simulation verify that the global optimization strategy achieves great results.Comparing with the linear inversion method,BP method,and genetic neural network method,our method has higher precision and shorter time of inversion.
Immune Genetic Algorithm;BP neural network;High density resistivity method;Inversion precision
高明亮,于生寶,鄭建波等.2016.基于IGA算法的電阻率神經(jīng)網(wǎng)絡(luò)反演成像研究.地球物理學(xué)報(bào),59(11):4372-4382,
10.6038/cjg20161136.
Gao M L,Yu S B,Zheng J B,et al.2016.Research of resistivity imaging using neural network based on immune genetic algorithm.Chinese J.Geophys.(in Chinese),59(11):4372-4382,doi:10.6038/cjg20161136.
10.6038/cjg20161136
P631
2015-09-02,2016-09-27收修定稿
地面電磁探測(SEP)系統(tǒng)研制-野外試驗(yàn)研究(201311193-05(SinoProbe-09-02-05))資助
高明亮,男,1987年生,博士,研究方向?yàn)橹绷麟姺ǚ蔷€性反演方法研究.E-mail:mlgao13@mails.jlu.edu.cn
*通訊作者 欒卉,女,1979年生,副教授,碩士生導(dǎo)師,研究方向?yàn)殡姶趴碧椒椒ㄑ芯?E-mail:luanhui@jlu.edu.cn