杜宇 潘遙
(1、中國地質(zhì)大學(xué)(武漢)工程學(xué)院,湖北 武漢430074 2、中南財經(jīng)政法大學(xué)財政稅務(wù)學(xué)院,湖北 武漢430073)
巖石可鉆性指的是巖石抵抗鉆鑿破碎的能力, 是探礦鉆井工程不可或缺的一個指標(biāo),具有重要的價值意義。對于巖石可鉆性的評價方法也受到學(xué)者越來越多的關(guān)注。目前對于巖石可鉆性的研究方法主要有三類: 微鉆實驗法、Dc 指數(shù)法和利用測井參數(shù)預(yù)測法[4]。其中前兩種方法都為鉆后評價法,脫離了巖心所處的真實的高溫高壓環(huán)境,鉆取的巖心不具有代表性等缺點。利用測井資料評價法既能較好的反應(yīng)地層實際的環(huán)境, 又能全面的反應(yīng)一個地區(qū)(某口井)的可鉆性性質(zhì),還具有經(jīng)濟(jì)環(huán)保等優(yōu)點。在可鉆性預(yù)測模型研究里,有一種通過利用測井資料建立神經(jīng)網(wǎng)絡(luò)模型來對巖石可鉆性進(jìn)行預(yù)測的方法, 這樣既能反應(yīng)巖石地層巖石實時鉆進(jìn)環(huán)境, 又能更加方便快捷的建立可鉆性與巖石所處環(huán)境的之間的聯(lián)系。
人工神經(jīng)網(wǎng)絡(luò)是一種運算模型,它在解決非線性、多參數(shù)的擬合問題有較好的效果。而BP 神經(jīng)網(wǎng)絡(luò)作為常見的神經(jīng)網(wǎng)絡(luò),它常被研究者用于地層可鉆性的預(yù)測研究中。夏宏泉等人基于BP 神經(jīng)網(wǎng)絡(luò)利用測井資料建立巖石可鉆性預(yù)測模型,為鉆頭選型提供了較好的依據(jù)[3]。沙林秀等人提出基于自適應(yīng)雙鏈量子遺傳算法優(yōu)化BP 神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)的巖石可鉆性提取建模方法[10]。周啟成等人把測井?dāng)?shù)據(jù)作為輸入?yún)?shù), 可鉆性極值作為輸出參數(shù),利用BP 神經(jīng)網(wǎng)絡(luò)建立涪陵頁巖氣區(qū)塊輸入?yún)?shù)與輸出參數(shù)之間的映射關(guān)系[8]。董青青等人提出了基于粒子群算法優(yōu)化的BP 神經(jīng)網(wǎng)絡(luò)巖層可鉆性預(yù)測模型,具有較高的精度[7]。
BP 網(wǎng)絡(luò)模型具有良好的自適應(yīng)性、自學(xué)習(xí)性和極強的非線性逼近、容錯能力等優(yōu)點。但是在用于網(wǎng)絡(luò)的初始權(quán)值和閾值都是隨機生成的,就可能會導(dǎo)致結(jié)果陷入局部最優(yōu)。因此本文提出一種基于遺傳算法優(yōu)化的BP 神經(jīng)網(wǎng)絡(luò)巖石可鉆性預(yù)測模型,以地層的測井資料作為網(wǎng)絡(luò)的輸入?yún)?shù), 地層可鉆性級值作為輸出建立BP 神經(jīng)網(wǎng)絡(luò),然后利用遺傳算法BP 神經(jīng)網(wǎng)絡(luò)的初始權(quán)值和閾值進(jìn)行優(yōu)化,提高了模型的收斂速度和預(yù)測精度。
遺傳算法(Genetic Algorithms,GA)在1962 年由美國人提出,它是通過模擬遺傳學(xué)的機理和達(dá)爾文生物進(jìn)化論而形成的一種并行隨機搜索最優(yōu)化方法。與自然界中“優(yōu)勝略汰,適者生存”的生物進(jìn)化原理相似, 遺傳算法就是將需要優(yōu)化的參數(shù)進(jìn)行編碼成染色體并入種群群體中,選擇合適的適應(yīng)度函數(shù),對種群中的個體進(jìn)行選擇、交叉和變異操作,保留適應(yīng)度值好的個體,適應(yīng)度差的個體被淘汰。這樣反復(fù)循環(huán)操作,直至滿足所需要的條件。
首先先對參數(shù)進(jìn)行編碼, 將需要優(yōu)化的參數(shù)編碼含有N 個個體的種群X={X1,X2,…,Xn},其中Xi是種群個體的基因值也即是需要的參數(shù)值。然后就是確定一個適應(yīng)度函數(shù)為種群大小,來評價參數(shù)優(yōu)化后的,預(yù)測精度。
BP(Back Propagation)神經(jīng)網(wǎng)絡(luò)是用誤差逆向傳播算法(Error Back Propagation)進(jìn)行訓(xùn)練的,是一種多層前饋神經(jīng)網(wǎng)絡(luò)。結(jié)構(gòu)主要包括三個部分,輸入層、輸出層和若干個隱含層,處于同一層的神經(jīng)元是相互獨立的,它們之間沒有信息傳遞,不同層之間的神經(jīng)元則是通過神經(jīng)網(wǎng)絡(luò)網(wǎng)絡(luò)參數(shù)(權(quán)值和閾值)相互連接。基本BP 算法包括信息前向傳播過程和誤差反向傳播過程。正向傳播時, 輸入信號由輸入層向前傳遞到隱含層再到輸出層得到輸出信號,得到的輸出信號與期望輸出不符,則計算它們之間的誤差,轉(zhuǎn)入誤差的反向傳播過程。誤差反向傳播則是將得到的誤差反向作用于各層神經(jīng)元的網(wǎng)絡(luò)參數(shù)。如此循環(huán)反復(fù)學(xué)習(xí)訓(xùn)練,直到實際輸出與期望輸出達(dá)到要求的精度為止,訓(xùn)練即告停止。
遺傳算法優(yōu)化BP 神經(jīng)網(wǎng)絡(luò)模型分為3 個部分, 分別為BP神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)確定、GA 優(yōu)化權(quán)值與閾值和BP 神經(jīng)網(wǎng)絡(luò)預(yù)測。由文獻(xiàn)[3~5]可知影響巖層的可鉆性級別的因素主要包括聲波時差Δt、地層密度ρ、電阻率Rt以及泥質(zhì)質(zhì)量分?jǐn)?shù)Vsh等。我們將與地層可鉆性密切相關(guān)的參數(shù)(聲波時差、地層密度、泥質(zhì)質(zhì)量分?jǐn)?shù)、電阻率)作為網(wǎng)絡(luò)的輸入量,以地層可鉆性級別Kd作為網(wǎng)絡(luò)的輸出,建立巖石可鉆性預(yù)測模型如圖1 所示。
圖1 可鉆性預(yù)測模型
BP(Back Propagation)神經(jīng)網(wǎng)絡(luò)是一種采用誤差反向傳播算法(Error Back Propagation)的前饋神經(jīng)網(wǎng)絡(luò)模型,實質(zhì)上就是求誤差最小問題, 通過模式順傳播和誤差傳播反復(fù)進(jìn)行網(wǎng)絡(luò)記憶訓(xùn)練直到收斂。我們可以采用均誤差MSE(Mean Squared Error)來作為網(wǎng)絡(luò)的擬合函數(shù):
式中:Fi表示神經(jīng)網(wǎng)絡(luò)的預(yù)測值(i=1,2, …,n);Yi表示目標(biāo)值(期望結(jié)果)。
基于GA 優(yōu)化的BP 神經(jīng)網(wǎng)絡(luò)是對初始值和閾值進(jìn)行優(yōu)化得到的預(yù)測模型。我們利用文獻(xiàn)[3]數(shù)據(jù)中的地層參數(shù),作為BP神經(jīng)網(wǎng)絡(luò)的輸入數(shù)據(jù)和輸出數(shù)據(jù),然后使用MATLAB 軟件先構(gòu)建不同節(jié)點數(shù)的BP 神經(jīng)網(wǎng)絡(luò),采用默認(rèn)初始值各模擬5000 次,計算得到每個神經(jīng)網(wǎng)絡(luò)的誤差MSN,如圖2 所示。從圖中可以看出在隱含層為7 時樣本誤差MSE 值最小,并且誤差比較穩(wěn)定,所以選擇7 個節(jié)點最優(yōu),因此BP 神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)為n-7-1,n 為輸入層節(jié)點數(shù)(對應(yīng)地層的各個參數(shù)),7 為隱含層個數(shù),輸出層個數(shù)為1(表示可鉆性級值)。
圖2 不同隱含層的對應(yīng)的MSE 值
基于遺傳算法和BP 神經(jīng)網(wǎng)絡(luò)理論,在MATLAB 中實現(xiàn)基于GA 優(yōu)化的BP 神經(jīng)網(wǎng)絡(luò)巖石可鉆性預(yù)測模型。遺傳算法中的參數(shù)設(shè)置: 種群規(guī)模設(shè)為100, 進(jìn)化次數(shù)設(shè)為200 次, 交叉概率為0.4,變異概率為0.2。進(jìn)化次數(shù)在50 次左右適應(yīng)度就已接近平緩了,為了保守起見將進(jìn)化代數(shù)設(shè)置為200。模型的網(wǎng)絡(luò)結(jié)構(gòu)一共有有4 個輸入?yún)?shù)、1 個輸出參數(shù), 所以設(shè)置的BP 神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)為4-7-1,即輸入層有4 個節(jié)點,隱含層7 個節(jié)點,輸出層1 個節(jié)點,網(wǎng)絡(luò)結(jié)構(gòu)中共有4×7+7×1=35 個權(quán)值,7+1=8 個閾值。可以確定遺傳算法個體的編碼長度為35+8=43。
將優(yōu)化好的初始權(quán)值和閾值對所建好的模型進(jìn)行訓(xùn)練,并將文獻(xiàn)中的后10 組數(shù)據(jù)進(jìn)行回判預(yù)測,再將文獻(xiàn)[1]中預(yù)測數(shù)據(jù)進(jìn)行對比分析,得到回判結(jié)果,將所得結(jié)果繪制成曲線如圖3 所示。由圖3 可看出基于GA 優(yōu)化的BP 神經(jīng)網(wǎng)絡(luò)對地層可鉆性的預(yù)測誤差不超過1%,比未經(jīng)優(yōu)化的BP 神經(jīng)網(wǎng)絡(luò)擬合效果更好,而且誤差波動較小。
圖3 三種預(yù)測地層可鉆性模型的曲線對比
4.1 通過預(yù)測值對比結(jié)果分析可以看出,GA-BP 的相對誤差的平均值為0.17,BP 的相對誤差的平均值為3.26。GA-BP 模型預(yù)測精度比BP 模型要高,克服了BP 網(wǎng)絡(luò)容易陷入極小值的缺點,為可鉆性級值預(yù)測提供了一種高精度的模型。
4.2 利用已鉆的測井資料建立訓(xùn)練模型,然后利用未鉆區(qū)域的測井資料輸入模型中即可預(yù)測未鉆區(qū)域的可鉆性級值, 為地層巖石可鉆性評價提供了一種新的方案,具有適用性廣的特點。