張 艷,張春雷,成育紅,高世臣,黃文輝
(1.中國地質大學(北京),北京 100083;2.北京中地潤德石油科技有限公司,北京 100083;3.中國石油長慶油田分公司,陜西 西安 710016)
沉積相揭示了目的層段的沉積環(huán)境及其分布規(guī)律,結合地震資料研究其特征對油氣勘探具有重要意義[1-2]。機器學習方法在數據挖掘、圖像處理等方面的成功應用,促使該方法在儲層預測方面快速發(fā)展[3-5]。機器學習方法分為無監(jiān)督學習和有監(jiān)督學習方法。無監(jiān)督學習方法根據數據結構建立數學模型,聚類過程中無標記數據,致使學習過程具有盲目性;有監(jiān)督學習根據已知標記數據建立數學模型,進而預測未知數據。該方法獲取標記樣本費時費力,而且當標記樣本較少時,所獲得的分類器泛化能力較差[6-9]。為此,形成一種介于2種方法之間的新方法——半監(jiān)督學習,此次研究主要采用半監(jiān)督模糊C均值(Semi-Fuzzy C Means,SFCM)方法[10-11],通過隸屬度表征樣本歸屬每種類別的不確定性。預測過程中以井點數據作為標記數據,以地震數據作為未標記數據,指導SFCM預測過程。豐富的地震數據能夠改善預測的準確度,該方法在儲層預測過程中具有廣泛的應用前景。
研究區(qū)召30區(qū)塊位于蘇里格氣田東部,主要產氣層為上古生界下二疊統(tǒng)石盒子組盒8段,三維地震資料采集于2010年,滿覆蓋面積為252 km2,地震有效頻寬為8~65 Hz,視主頻為36 Hz[12]。取心井段觀察和測井相分析,結合構造背景、物源供給等因素,認為研究區(qū)屬砂質河流相沉積體系[13],主要發(fā)育辮狀河沉積,頂部有向曲流河過渡的趨勢,發(fā)育心灘、河道、河道側緣以及河道間4種沉積類型。有效儲層受控于沉積相,多發(fā)育于心灘或河道沉積砂體。沉積儲層中,砂巖厚度為8~15 m,砂巖孔隙度為5%~15%,滲透率為0.1×10-3~0.5×10-3μm3,含氣飽和度平均值在65%左右,總體表現為低孔、低滲、致密的儲層特征[14]。
模糊C均值是一種常用的聚類方法,采用隸屬度表征聚類過程的模糊性。半監(jiān)督學習聚類過程中根據已標記樣本得到初始模型,未標記樣本引導聚類過程,改進初始模型[15]。
假設X={x1,x2,…,xn}是n個樣本組成的集合,SFCM算法迭代過程與FCM算法相同,但是在聚類過程中,引入影響因子α平衡2種數據的比例,該算法最終目標是使目標函數達到最小,其目標函數如下:
(1)
式中:C和n分別為聚類中心和樣本的數量;nl和nu表示已知標簽數據和未知標記樣本點個數;uij表示第i個樣本屬于第j種類型的隸屬度;d(xi,vj)是樣本點xi到聚類中心點vj的距離;m∈(1,∞) ,用于控制聚類過程中模糊度,通常取2;α為已知標記數據與無標記數據的比例,用于控制半監(jiān)督與完全監(jiān)督函數之間的平衡;fij=1表示已知標簽數據的隸屬度矩陣,當樣本xi屬于第j種類別時,fij=1,否則fij=0 。迭代過程中,對應的中心和隸屬度公式更新為:
(2)
(3)
為了驗證算法的可行性,采用UCI機器學習數據庫中的標準Iris數據集進行實驗。Iris數據集包含150個樣本數據、4個特征值、3種不同的類型。隨機選擇α分別為10%、20%、30%、40%和50%作為訓練集,剩余數據作為測試集,為了減少聚類過程中的隨機性,重復實驗10次,得到不同α參數下的平均正確率分別為87.72%、88.76%、89.37%、89.80%、90.04%。該結果表明,隨著監(jiān)督信息的增加,識別的正確率增大,同時當參數α增加到30%時,正確率增加的速率變慢。從標準數據集Iris的識別精度上驗證了該算法的合理性和有效性,并且說明了參數α在預測過程中重要性。
結合上述分析過程可知,在聚類過程中有標記數據增加會提高識別的精度,故在使用SFCM聚類過程中應盡可能擴大已知標記數據的比例。召30區(qū)塊18口水平井鉆遇盒8段,為了擴充有標記數據的比例,聚類過程中對鉆遇的18口水平井的水平段進行分割,每個分割點的沉積類型均為已知,進而豐富已知標記數據,為SFCM方法聚類過程提供數據基礎。
地震屬性分析逐漸成為油氣藏地球物理的核心技術,在儲層預測過程中有著重要作用。不同沉積或砂體的儲層在地震記錄上的響應特征不同,進而在地震屬性上有所反映。針對不同的儲層和不同的預測對象,地震屬性的選取也不相同。針對沉積相展布特征的分析,主要提取均方根振幅、平均瞬時頻率、有效帶寬等疊后屬性。圖1為提取這3個疊后屬性與井點處氣層厚度疊合圖。由圖1可知,高振幅、低瞬時頻率、低有效帶寬的范圍內主要分布厚度大于10 m的氣層;而氣層厚度低于5m的范圍主要分布在振幅小于4 750、頻率大于30 Hz、有效帶寬大于115 Hz內。同時通過井點氣層厚度與地震屬性疊合圖之間的關系可知,不同氣層厚度的測井在單一的地震屬性上呈現一定的分布趨勢,但單一的地震屬性存在一定的重疊。因此,預測過程中需要綜合多個地震屬性開展沉積相研究。
圖1 疊后地震屬性分布及氣層厚度疊合
以測井數據得到的沉積相及地震屬性作為已標記數據,采用SFCM方法得到研究區(qū)沉積相分布圖(圖2a、b)。
首先對比分析預測結果和地震屬性平面分布特征,整體上看,SFCM得到的結果和每種地震屬性分布趨勢保持一致,但是不同屬性之間作用存在差異,如西部預測得到的心灘(圖2a和2b中品紅色部分),相比均方根振幅,平均瞬時頻率和有效帶寬起著主導作用;而對于中南部無井區(qū)域得到的心灘和河道類型(圖2a和2b中藍色部分),均方根振幅作用更為明顯,進一步說明單屬性預測得到的結果存在一定的不確定性,所以有必要進行多屬性分析的研究。
其次,根據前面分析,SFCM方法中有標記數據的比例α對預測的精度有著重要影響,為此,在聚類過程中分析了不同α值對應的沉積相分布(圖2a和2b)。聚類結果表明,不同的α值對應的沉積相展布特征與先驗地質認識一致(圖2d)。研究區(qū)整體發(fā)育4條完整河道,均呈南北向條帶狀展布,中部河道交匯連片分布,至南部匯聚為3條主河道;河道側緣及河道間分布面積較小。不同的α值聚類結果在無井控地區(qū)存在細微差別,如中西部部分井區(qū)。與地質人員預測無井控地區(qū)認識相比,該方法對井間沉積相的刻畫更為精細,特別是針對東部無井控地區(qū),相對于粗略表征河道形態(tài),該方法預測的井間信息更為詳盡豐富。為了分析SFCM預測結果,基于多地震屬性,采用傳統(tǒng)的FCM開展無監(jiān)督聚類方法研究,得到盒8段沉積相分布(圖2c)。相比SFCM結果,傳統(tǒng)FCM方法是一種無監(jiān)督聚類的過程,聚類過程中忽略測井資料,結果隨機性較大,得到結果和先驗認識相似,但預測結果表現為河道間類型分布范圍較廣,隨機性大,不能表征完整的河道形態(tài)。特別是在東部無井區(qū)域刻畫的也較為粗糙,無法用于地質解釋。
圖2 SFCM與傳統(tǒng)FCM聚類結果對比分析
最后,通過統(tǒng)計測井處的預測沉積相及砂體厚度,分析不同沉積類型的砂體厚度(表1)。由表1可知,不同的沉積類型對應的砂體厚度存在一定的差異,心灘及河道交匯處沉積砂體最厚,平均厚度為36.00 m;河道沉積砂體厚度為27.00~30.00 m,平均為28.00 m;河道側緣沉積砂體略小,主要為20.00~27.00 m,平均為25.00 m;河道間沉積對應砂體厚度通常小于20 .00 m,平均為17.00 m。而圖2c傳統(tǒng)半監(jiān)督方法得到的結果則與井點處的砂體厚度存在很大的差異。
表1 不同沉積類型對應的砂體厚度(部分井)
(1) SFCM方法在沉積相預測過程中的成功應用,證明了機器學習方法在儲層預測過程中的可行性和有效性,同時說明結合井震數據,采用機器學習方法解決致密砂巖儲層預測的問題是必然的。
(2) 根據巖心照片及測井資料分析,召30區(qū)塊沉積環(huán)境主要為辮狀河,共發(fā)育心灘、河道、河道側緣及河道間沉積相類型。根據研究區(qū)的測井資料及水平井資料,開展了SFCM方法的沉積相預測,結果表明該方法能夠得到與先驗地質認識較為一致的沉積相展布特征。
(3) 從定性和定量角度分析SFCM聚類結果,研究區(qū)整體發(fā)育4條較為明顯的主河道,呈南北向連續(xù)分布,而河道側緣及河道間沉積類型呈零星分布,和先驗地質認識較為一致,并且改善了無井區(qū)域的地質認識。
(4) SFCM在沉積相預測中的成功應用為儲層預測提供新的思路,需要進一步探討機器學習中的其他方法在儲層預測中的應用。
[1] 袁照威,陳龍,高世臣,等.基于馬爾科夫-貝葉斯模擬算法的多地震屬性沉積相建模方法——以蘇里格氣田蘇10區(qū)塊為例[J].油氣地質與采收率,2017,24(3):37-43.
[2] 賴生華, 柳偉明, 趙永剛, 等. 利用地震信息研究沉積體系平面分布特征:以鄂爾多斯盆地延長探區(qū)高家河三維區(qū)盒八段為例[J].石油實驗地質, 2017, 39(2): 272-277.
[3] 周志華.機器學習[M].北京:清華大學出版社,2016:293-317.
[4] ANTOINE C,LORENZO P,ERWAN G, et al. Machine learning as a tool for geologists[J].The Leading Edge, 2017,36(3):215-219.
[5] 郭繼剛,郭凱,宮鵬騏,等. 鄂爾多斯盆地延長組儲層致密化及其影響下的致密油充注特征[J].石油實驗地質, 2017, 39(2): 169-179.
[6] 唐俊,王琪,馬曉峰,等.Q型聚類分析和判別分析法在儲層評價中的應用[J].特種油氣藏,2012,19(6):28-31.
[7] 唐銜,侯加根,鄧強,等.基于模糊C均值聚類的流動單元劃分方法——以克拉瑪依油田五3中區(qū)克下組為例[J].油氣地質與采收率,2009,16(4):34-37.
[8] MAJID B,MOHAMMADAR.Seismicfacies analysis from well logs based on supervised classification scheme with different machine learning techniques[J]. Arabian Journal of Geoscience,2015,8(9):7153-7161
[9] BRENDON H. Facies classification using machine learning[J].The Leading Edge,2016,35(10):906-909.
[10] 張陽,邱隆偉,李際,等.基于模糊C均值地震屬性聚類的地震相分析[J].中國石油大學學報(自然科學版),2015,39(4):53-61.
[11] FORESTIER G,WEMMERT C. Semi-supervised learning using multiple clusterings with limited labeled data[J].Information Sciences,2016,361-362(C):48-65.
[12] 高世臣,袁照威.地震屬性在沉積相預測中的方法研究——序貫隨機模式識別[J].地球物理學進展,2016,31(3):1066-1072.
[13] 郭智,賈愛林,何東博,等.鄂爾多斯盆地蘇里格氣田辮狀河體系帶特征[J].石油與天然氣地質,2016,37(2):197-204.
[14] 袁照威,強小龍,高世臣,等.蘇里格氣田不同沉積相建模方法及空間結構特征評價[J].特種油氣藏,2017,24(1):77-83.
[15] QI J,LIN TF,ZHAO T,et al.Semi-supervisedmultiattribute seismic faciesanalysis[J]. Interpretation, 2016, 4(1):SB91-SB106.