張勇,馬曉東,李彥婧,蔡景順
(1.中國石化華東油氣分公司 勘探開發(fā)研究院,江蘇 南京 210005; 2.四川寶石花鑫盛油氣運營服務(wù)有限公司,四川 成都 610000)
近年國內(nèi)頁巖氣勘探成果豐碩,先后發(fā)現(xiàn)了涪陵、威遠等大型頁巖氣田。通過近幾年的頁巖氣勘探開發(fā)實踐,對頁巖氣富集主控因素也有了更深入的認識,其中含氣量是評價頁巖氣富集高產(chǎn)的主控因素之一。目前含氣量評價主要方法有測井解釋、巖心實驗測定以及地震預測。測井解釋及巖心實驗測定均只顯示單點特征,要刻畫研究區(qū)整體含氣量平面特征,需通過地震預測來實現(xiàn)。地震預測方法中,由于含氣性不是巖石物理彈性參數(shù),難以通過地球物理反演技術(shù)直接預測,主要通過線性的單屬性擬合或多屬性融合、非線性的簡單神經(jīng)網(wǎng)絡(luò)方法來預測[1-6],利用這幾種方法對頁巖氣的含氣量開展預測,發(fā)現(xiàn)精度較低。為了進一步提高頁巖含氣量預測精度,開展了非線性的深度學習預測含氣量研究工作。近幾年深度學習技術(shù)高速發(fā)展[7-8],在石油天然氣勘探開發(fā)領(lǐng)域也有了廣泛的應(yīng)用。主流的深度學習神經(jīng)網(wǎng)絡(luò)包括深度神經(jīng)網(wǎng)絡(luò)(DNN)、遞歸神經(jīng)網(wǎng)絡(luò)(RNN)、卷積神經(jīng)網(wǎng)絡(luò)(CNN)。深度神經(jīng)網(wǎng)絡(luò)和傳統(tǒng)意義上的神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)并無太大區(qū)別,最大的不同是層數(shù)增多,訓練方法更為優(yōu)化,算法也更加先進;遞歸神經(jīng)網(wǎng)絡(luò)相比深度神經(jīng)網(wǎng)絡(luò)只能夠接收到當前時刻上一層的輸入,神經(jīng)元的輸出可以在下一時間段直接作用到本身,在自然語言處理方面多有使用;卷積神經(jīng)網(wǎng)絡(luò)[9]主要是模擬人的視覺神經(jīng)系統(tǒng),在人臉識別、圖片識別領(lǐng)域應(yīng)用廣泛。本文利用深度神經(jīng)網(wǎng)絡(luò)的深度學習方法開展頁巖含氣量預測,結(jié)果表明,該方法能有效減小含氣量預測誤差。
深度神經(jīng)網(wǎng)絡(luò)DNN(deep neural network)是基于神經(jīng)網(wǎng)絡(luò)的擴展,可以理解為很多隱藏層的神經(jīng)網(wǎng)絡(luò)[10],包括一個輸入層,若干個隱藏層及一個輸出層(圖1)。深度神經(jīng)網(wǎng)絡(luò)相比傳統(tǒng)的神經(jīng)網(wǎng)絡(luò)主要區(qū)別在于:加入了若干個隱藏層,整個模型的表達能力得到增強,但是隨著隱藏層的增加模型的復雜度也隨之增加;輸出層的神經(jīng)元也可以一個或者多個輸出,模型可以靈活的應(yīng)用于分類回歸;對邏輯函數(shù)做擴展,簡單神經(jīng)網(wǎng)絡(luò)的邏輯函數(shù)sign(z)處理能力有限,因此深度神經(jīng)網(wǎng)絡(luò)中使用Sigmoid函數(shù)。
圖1 深度神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)Fig.1 Structure of deep neural network
在深度訓練開始時,利用澤維爾初始化隨機給出每一個地震屬性對應(yīng)的權(quán)重系數(shù)w以及偏置系數(shù)b,然后以加權(quán)平均的形式輸入到第一個隱藏層中的神經(jīng)元。神經(jīng)元加權(quán)平均的和作為Sigmoid邏輯函數(shù)的輸入,每一個神經(jīng)元由一個非線性邏輯函數(shù)構(gòu)成:
式中,z代表神經(jīng)元輸入數(shù)據(jù)。經(jīng)過邏輯函數(shù)非線性轉(zhuǎn)換后,得到中間結(jié)果。
在得到中間結(jié)果后,將加權(quán)平均結(jié)果作為下一隱藏層神經(jīng)元的輸入,經(jīng)過輸出層后,再進行邏輯函數(shù)轉(zhuǎn)換,得到最終結(jié)果。輸出的最終結(jié)果是基于初始化的w和b所得到,最終目的是要對所有w和b進行優(yōu)化,使輸出結(jié)果與實測數(shù)據(jù)之間達到最小二乘誤差,即構(gòu)建一個以w和b為自變量的函數(shù),使預測結(jié)果與實測數(shù)據(jù)之間誤差的平方和最小。
南川地區(qū)構(gòu)造上處于四川盆地川東高陡構(gòu)造帶萬縣復向斜南部,位于四川盆地與武陵褶皺帶的過渡區(qū),總體呈現(xiàn)“隆凹相間”的構(gòu)造格局,是江南—雪峰陸內(nèi)造山作用向NW方向遞進擴展變形的結(jié)果[11-12],地表出露巖性多變,三疊系、二疊系、志留系、奧陶系、寒武系均有出露。地下構(gòu)造特征復雜,斷裂主要呈NE向展布(圖2)。南川地區(qū)頁巖地層五峰—龍馬溪組為一套穩(wěn)定發(fā)育的暗黑色頁巖,含泥質(zhì)粉砂,厚度為80~120 m,富含有機質(zhì)和筆石化石。TOC大于2%的優(yōu)質(zhì)頁巖厚度一般在30~38 m之間,熱演化程度適中,Ro為2.3%~2.6%,孔隙度為3.2%~5%,含氣量為3.5~7.3 m3/t,各項靜態(tài)指標優(yōu)越[13-15],測井響應(yīng)特征表現(xiàn)為高伽馬、低縱波速度、低橫波速度、低密度。從A井五峰—龍馬溪組綜合柱狀圖(圖3)看,五峰—龍馬溪組一段可細分為9個小層,總含氣量由下到上逐漸降低,下部①小層局部總含氣量能達到7.2 m3/t。該區(qū)東北部A井所在背斜區(qū)域已完鉆30口井,單井測試產(chǎn)量(15.4~89.5)×104m3/d,開發(fā)效果好。
圖2 南川地區(qū)構(gòu)造特征Fig.2 Structural characteristics map of Nanchuan area
圖3 A井五峰組—龍馬溪組一段綜合柱狀圖Fig.3 Comprehensive histogram of the first section of Wufeng-Longmaxi Formation in Well A
深度學習需要有訓練目標和訓練數(shù)據(jù),在訓練目標和訓練數(shù)據(jù)之間進行學習,得到訓練模型,然后利用模型對訓練目標進行預測[16-20]。在深度學習預測含氣量過程中,需要對屬性進行相關(guān)性排序,然后確定最優(yōu)屬性個數(shù),再優(yōu)選合適的最優(yōu)化求解方法、隱藏層個數(shù)、神經(jīng)元個數(shù)、迭代次數(shù)建立高精度的訓練模型,以求獲得高精度預測結(jié)果。
2.2.1 屬性排序及優(yōu)選
深度學習預測含氣量,需要盡量多的含氣量測井數(shù)據(jù)以及大量的地震屬性,如疊后振幅、頻率、相位屬性,以及地震反演得到的縱波阻抗、橫波阻抗、楊氏模量、泊松比等。有了屬性數(shù)據(jù)后,要進行多屬性排序:首先確定最優(yōu)屬性,即單屬性中的與含氣量曲線相關(guān)性最高的最優(yōu)屬性;然后將剩余所有屬性依次和該屬性配對,利用所有的配對屬性進行預測,尋找預測誤差最小的那個屬性對,該屬性對中的另外一個屬性就為第二優(yōu)屬性;確定最優(yōu)及第二優(yōu)屬性后,重復前面確定第二優(yōu)屬性過程,依次對所有屬性的優(yōu)劣進行排序,得到屬性排序表。在經(jīng)過排序以后需要確定最優(yōu)屬性的個數(shù),由于地震疊后屬性及疊前屬性多種多樣,并不一定選擇屬性越多,預測精度越高,過多的屬性帶入學習會導致學習過度,反而導致更大的誤差。從分析圖上看(圖4),當5個屬性時驗證誤差最低,所以優(yōu)選5個屬性,分別為密度、縱波阻抗、平均頻率、極性、優(yōu)勢頻率。
圖4 屬性個數(shù)優(yōu)選Fig.4 Attribute number optimization diagram
2.2.2 最優(yōu)化求解方法
在輸出層輸出結(jié)果過程中,由于求解方程包含很多非線性成分,直接求解不能得到期望的結(jié)果,需要確定優(yōu)選最優(yōu)化求解方法。最優(yōu)化求解方法一般包括基于一階泰勒級數(shù)展開的最速下降法、基于二階泰勒函數(shù)展開的牛頓法,以及介于二者之間的共軛梯度法。最速下降法是最簡單的優(yōu)化方法,其利用的是一階泰勒展開式,從初始點出發(fā),采用一階線性逼近,沿著負梯度方向移動一段距離,然后跳回到原函數(shù),如此反復,直至收斂。牛頓法也是在每一步利用逼近來降低函數(shù)值,盡管也是利用泰勒級數(shù)展開,但牛頓法中用的是二次逼近,其從初始點出發(fā),通過重復構(gòu)造函數(shù)的二次逼近,移動到這個二次方程的駐點并跳回到原函數(shù)來進行優(yōu)化。因為牛頓法的每一步都使用二次逼近,而二次方程可以更好地模擬相關(guān)函數(shù),所以牛頓法比最速下降法收斂更快,但牛頓法每次迭代都需要計算和存儲矩陣,計算量較大。共軛梯度法利用一階導數(shù)信息,收斂速度較快,共軛梯度法的每一個搜索方向是互相共軛的。針對3種最優(yōu)化求解方法進行測試,共軛梯度法訓練模型相對另外2種方法精度更高,優(yōu)選共軛梯度法來進行最優(yōu)求解。
2.2.3 模型質(zhì)量控制
在深度學習過程中,要得到高精度的訓練模型還需要優(yōu)選的參數(shù),包括隱藏層個數(shù)、神經(jīng)元個數(shù)以及迭代次數(shù)的選擇。合適的隱藏層個數(shù)能提高學習效率,隱藏層個數(shù)太少,不能有效進行分類,過多的隱藏層個數(shù)會使參數(shù)呈爆炸式增長,為機器帶來負擔,并且分類效果增強得越不明顯。通過測試,研究區(qū)隱藏層個數(shù)為3時較合適。選擇一個合適的隱藏層神經(jīng)元數(shù)量也是至關(guān)重要的,在隱藏層中使用太少的神經(jīng)元將導致欠擬合,使用過多的神經(jīng)元同樣會導致過擬合。經(jīng)過多輪測試,研究區(qū)每個隱藏層里20個神經(jīng)元較為合適。在確定好隱藏層個數(shù)及神經(jīng)元個數(shù)后,還需要選取合適的迭代次數(shù),通過測試,當?shù)螖?shù)為30次時,訓練及驗證誤差最小。選取合適的質(zhì)量控制參數(shù)以后,利用井參與訓練相關(guān)系數(shù)達到了0.958,井不參與訓練驗證相關(guān)系數(shù)為0.942,相關(guān)系數(shù)高,且兩個相關(guān)系數(shù)差距小,證明深度學習模型預測精度高。從4口井實測含氣量曲線與預測含氣量曲線疊合看(圖5),預測曲線細節(jié)特征清晰,與實鉆曲線吻合程度高。
圖5 實測曲線與預測曲線疊合圖Fig.5 Superimposed graph of actual measured curve and predicted curve
將研究區(qū)分布不同構(gòu)造部位4口導眼井A、B、C、D作為訓練樣本數(shù)據(jù),E井作為驗證井。利用多屬性融合、概率神經(jīng)網(wǎng)絡(luò)、深度學習3種不同方法對含氣量進行預測,首先從模型上看,多屬性融合驗證相關(guān)系數(shù)為0.728,概率神經(jīng)網(wǎng)絡(luò)驗證相關(guān)系數(shù)為0.836,深度學習驗證相關(guān)系數(shù)為0.942,深度學習預測模型精度最高。再從3種方法預測E—D井含氣量連井剖面看(圖6),3種方法都具有龍馬溪組一段從下往上含氣量逐漸降低,底部優(yōu)質(zhì)頁巖段含氣量明顯高于上部頁巖儲層的特征。多屬性融合方法預測含氣量整體偏低,E井優(yōu)質(zhì)頁巖段實測含氣量為4.7 m3/t,預測為4.1 m3/t,誤差達到12.7%,E井優(yōu)質(zhì)頁巖段含氣量明顯低于D井不符合地質(zhì)認識。概率神經(jīng)網(wǎng)絡(luò)方法預測含氣量整體偏高,E井優(yōu)質(zhì)頁巖段預測含氣量達到5.1 m3/t,誤差為8.5%,深度學習方法預測E井優(yōu)質(zhì)頁巖段含氣量為4.5 m3/t,誤差為4.2%,是3種預測方法中預測精度最高的。從深度學習技術(shù)預測研究區(qū)優(yōu)質(zhì)頁巖段平均含氣量平面圖看(圖7),D井北部含氣量相對較高,往南降低,D井與E井相差不大?;谏疃壬窠?jīng)網(wǎng)絡(luò)的含氣量預測方法,相對傳統(tǒng)的線性屬性融合技術(shù)以及神經(jīng)網(wǎng)絡(luò)技術(shù),預測精度有了進一步的提高。
圖6 不同類型預測方法含氣量預測剖面Fig.6 The gas content prediction profile of different types of prediction methods
圖7 優(yōu)質(zhì)頁巖段平均含氣量與構(gòu)造疊合Fig.7 The average gas content and structure superposition map of high-quality shale section
1)基于深度學習的頁巖氣含氣量預測方法,相比多屬性融合及概率神經(jīng)網(wǎng)絡(luò),能有效提高頁巖氣含氣量預測精度。
2)研究區(qū)預測頁巖含氣量最優(yōu)屬性為密度、縱波阻抗、平均頻率及優(yōu)勢頻率;最優(yōu)化求解方法為共軛梯度法。當深度學習預測模型在3個隱藏層、20個神經(jīng)元及30次迭代次數(shù)時,預測模型精度最高,驗證相關(guān)系數(shù)達到0.942。
3)預測含氣量與實測含氣量誤差較小,且平面特征符合地質(zhì)認識,該技術(shù)在一定程度上能為研究區(qū)頁巖氣儲層評價提供支撐,指導該區(qū)頁巖氣勘探。