李志曄,劉錚,張衛(wèi)衛(wèi),楊學奇,敖威,雷勝蘭
中海石油深海開發(fā)有限公司,深圳 518054
隨著油氣勘探開發(fā)的不斷深入,對儲層預測的精度要求也逐漸提高,不僅需要判斷儲層的位置,還需要判定儲層中所含流體的性質(zhì),發(fā)展高精度的定量預測儲層含油氣性的有效方法,對提高油氣勘探成功率具有重要意義。自上世紀70年代中期,基于地震振幅異常檢測的“亮點”和AVO分析技術(shù)[1-2]最先進入石油勘探領(lǐng)域,發(fā)現(xiàn)含氣砂巖與含水砂巖反射振幅隨偏移距增大顯現(xiàn)出不同的變化特征。隨AVO技術(shù)實踐的深入,亮點解釋的多解性問題逐漸顯露,許多學者開始找尋新的對油氣具有指示作用的屬性[3-4]。Smith 和Gidlow[5]首次提出“流體因子”的概念,用縱、橫波速度的加權(quán)差預測儲層流體,在此基礎(chǔ)上,Goodway等[6]提出利用拉梅參數(shù)及剪切模量分別與密度的乘積(λρ和μρ)作為流體因子的油氣檢測方法,Russell等[7]基于Biot-Gassmann 雙相介質(zhì)理論,認為可直接將Gassmann流體項作為流體因子開展油氣檢測,Quakenbush等[8]通過縱、橫波阻抗之間的數(shù)學變換,提出泊松阻抗這一參數(shù)并應用于流體識別。
然而,常規(guī)的AVO技術(shù)忽視了頻率因素,而實際上地震波的反射系數(shù)與頻率之間的關(guān)系十分密切。據(jù)雙相介質(zhì)理論,地震波在穿過含油氣地層時,頻散和衰減現(xiàn)象將變得更加明顯,地震波的高頻成分在通過油氣時會更快地衰減,而低頻成分受到的影響相對較少,因此低頻成分相對增加,即發(fā)生高頻衰減和低頻增加現(xiàn)象[9-11]。
為充分利用地震資料蘊含的振幅和頻率異常信息,近年來,國內(nèi)外學者針對流體存在時地震波衰減及頻散現(xiàn)象開展了大量研究,為頻變流體識別奠定理論基礎(chǔ)[12-14]。頻變AVO流體識別研究是對基于彈性、粘彈性參數(shù)流體識別方法的補充,可有效降低識別的多解性。
考慮到流體性質(zhì)會受到壓實、巖性、厚度調(diào)諧、孔隙等干擾屏蔽,需要去除這些背景影響—固流解耦才能放大出來[15]。泊松阻抗是最簡易的固流解耦因子,孫喜新[16]利用泊松阻抗在平湖油氣田進行砂巖氣藏檢測,對于識別低密度、低泊松比的氣藏取得了一定的效果;時秀朋[17]證實了泊松阻抗屬性分析方法在復雜巖石物理條件下預測儲層含油氣性的有效性,但都未實現(xiàn)使用泊松阻抗對氣藏進行定量描述。為了獲得精確、量化的油氣檢測結(jié)果,將泊松阻抗與定量表征油氣的含氣飽和度測井曲線建立關(guān)聯(lián),并尋找一種合適的方法對其擬合并進行非線性預測。
隨著人工智能時代的到來,為從地震數(shù)據(jù)中提取、優(yōu)化和組合地震屬性來直接預測含氣飽和度度提供了可行性方法[18-21],宋建國[22]等應用隨機森林算法預測儲層,較好地刻畫出儲層的三角洲前緣沉積特征。隨機森林算法可以從輸入數(shù)據(jù)中提取特征、學習規(guī)律,用于對待測目標的預測。因此,本文引入隨機森林算法,提出一種相控頻變阻抗人工智能油氣飽和度預測方法,對儲層含油氣性進行定量預測。
泊松阻抗被定義為泊松速度與密度的乘積,而泊松速度與泊松比有關(guān),所以泊松阻抗綜合了泊松比和密度兩者的特點,克服了常規(guī)阻抗屬性不能很好地分辨儲層流體的問題,是一種敏感度很高的巖性流體識別屬性。通常在縱波阻抗-橫波阻抗交會圖上泥巖、含水砂巖、含油砂巖存在一定的重疊,僅依靠縱波阻抗或橫波阻抗單一軸很難區(qū)分儲層流體。若利用坐標旋轉(zhuǎn)技術(shù),將縱波阻抗旋轉(zhuǎn)至泊松阻抗位置,可有效識別巖性和含油氣性變化[23]。
泊松阻抗PI可定義為:
式中:IP為縱波阻抗;IS為橫波阻抗;C為常數(shù),利用縱波阻抗、橫波阻抗進行交會分析,當將坐標軸旋轉(zhuǎn)至某一角度,能夠有效區(qū)分不同巖性及流體,此時參數(shù)C為斜率的倒數(shù)。
縱、橫波阻抗均為速度與密度的乘積,式(1)可以寫為:
式中,α為縱波速度,β為橫波速度,νσ為泊松速度。
由式(2)可看出泊松阻抗是泊松速度和密度的函數(shù),定義為一種阻抗的量綱。一般而言,通過縱、橫波阻抗交會圖可以了解儲層含氣性與巖石物理性質(zhì)之間的關(guān)系,但以坐標旋轉(zhuǎn)獲取的泊松阻抗,在定量預測的含氣飽和度誤差較大,通過加入地震資料所含的振幅和頻率異常信息,利用頻散、衰減特征,提高預測精度并降低干擾信息。根據(jù)地球物理理論,應該存在與泊松阻抗對應的反射率剖面,可稱其為泊松反射率剖面,但現(xiàn)有技術(shù)中無法直接求取泊松反射率,為此,利用廣義泊松阻抗的射線域表達式,獲取射線域泊松反射率[24]。
在Aki-Richard簡化式的基礎(chǔ)上,眾多學者推導出了射線彈性阻抗REI[25]:
劉力輝[26]等為克服射線彈性阻抗高次冪函數(shù)穩(wěn)定性和抗噪能力差的缺點,對其進行改進,改進后的射線彈性阻抗為
在(4)式的基礎(chǔ)上推導:
令
將公式(6)代入公式(5)則有
再根據(jù)泊松阻抗的定義公式(1),可得
前文已提到參數(shù)C可由縱波阻抗、橫波阻抗及巖性或物性資料做三維交會得到,根據(jù)公式(6)即可得到對應的入射角θ,此時泊松阻抗等于該角度θ對應的疊前射線彈性阻抗乘以入射角θ的余弦。由此可以看出在射線域,射線彈性阻抗可以表達為廣義泊松阻抗,某個射線路徑上的地震剖面為根據(jù)該射線對應角度計算而來的泊松反射率剖面,對疊前道集資料進行對應泊松角度部分疊加可以快速求得泊松反射率,泊松反射率是泊松阻抗的一種實際表現(xiàn)形式,且相對于常規(guī)泊松阻抗來說保留了頻率特征。
常規(guī)的利用泊松阻抗識別流體的方法難以利用頻散、衰減特性,而泊松阻抗可以視為一種廣義的指示油氣的流體因子,頻變流體因子不僅是對基于地震振幅的流體因子的擴充,而且還可以與其他方法相互驗證,綜合利用地震資料的振幅和頻率信息,降低預測多解性,提高勘探精度。因此采用分頻技術(shù),使用頻變的泊松阻抗描述流體引起的頻散程度,消除利用單一振幅信息所引起的流體識別假象,增強對油氣檢測的準確性和敏感性。
泊松阻抗度含氣性敏感,通過機器學習中的隨機森林建立泊松阻抗與含水飽和度的關(guān)聯(lián),并融合衰減與頻散信息,實現(xiàn)定性向定量的轉(zhuǎn)換,完成高精度的油氣檢測。
隨機森林是近些年較為流行的一種機器學習算法,其以決策樹為基分類器,通過反復二分將數(shù)據(jù)進行分類或回歸,并采用隨機的方式將決策樹集合成為一個“森林”。隨機森林在決策樹訓練過程中融合了隨機屬性選擇,并在建模過程使用了Bootstrap重復抽樣方法從原始樣本抽取多個樣本,再對每個樣本展開決策樹建模,并組成多棵樹進行預測。
隨機森林算法在生成的過程中,從原始訓練集中產(chǎn)生N個訓練子集,每個訓練子集的容量和原始訓練數(shù)據(jù)集一樣,每次抽樣均為隨機且放回抽樣,所產(chǎn)生的訓練子集具有一定的重復性,其目的是降低森林中的決策樹產(chǎn)生局部最優(yōu)解的風險。算法為每一個訓練子集分別建立一棵決策樹,生成N棵決策樹從而形成“森林”,每棵決策樹任其生長,不需要剪枝處理。其中涉及兩個重要過程:
(1)節(jié)點分裂。節(jié)點分裂是算法的核心步驟,通過節(jié)點分裂才能產(chǎn)生一棵完整的決策樹。每棵樹的分支的生成,都是按照某種分裂規(guī)則選擇屬性,這些規(guī)則主要包括信息增益最大、信息增益率最大和Gini系數(shù)最小等原則,不同的規(guī)則對應不同的分裂算法。在節(jié)點分裂時,將每個屬性的所有劃分按照規(guī)則指標進行排序,然后按照規(guī)則選擇某個屬性作為分裂屬性,劃分實現(xiàn)決策樹的分支生長。
(2)隨機特征變量的隨機選取。由于隨機森林在進行節(jié)點分裂時,不是所有的屬性都參與屬性指標的計算,而是隨機地選擇某幾個屬性,即隨機特征變量參與比較。其基本思想是,在進行節(jié)點分裂時,讓所有的屬性按照某種概率分布隨機選擇其中某幾個屬性參與節(jié)點的分裂過程。隨機特征變量使每棵決策樹之間的相關(guān)性減少,同時提升每棵決策樹的分類精度,從而提升整個森林的性能。
隨機森林通過對上述的隨機重復采樣和隨機特征選取兩個隨機性進行多次重復,投票產(chǎn)生預測結(jié)果,回歸問題通過取平均值輸出回歸森林的預測值。隨機森林的構(gòu)建流程如圖1 所示。
圖1 隨機森林結(jié)構(gòu)示意圖Fig. 1 Structure Diagram of random forest
Breiman[25]利用數(shù)學理論和大量的實際數(shù)據(jù)測試證實了隨機森林具有泛化誤差小、抗干擾能力強、不易產(chǎn)生過擬合等特點的優(yōu)點,不會輕易出現(xiàn)過擬合問題。因此,選擇隨機森林算法進行有監(jiān)督學習,建立泊松阻抗與含氣飽和度關(guān)聯(lián)。
相控頻變阻抗人工智能油氣飽和度預測方法的技術(shù)路線如圖2 所示,步驟如下:
圖2 技術(shù)路線示意圖Fig. 2 Technical roadmap diagram
(1)準備工區(qū)的優(yōu)化處理后的地震、測井資料,通過縱、橫波阻抗交會,對疊前道集分析獲得敏感的角度范圍,按照該角度范圍進行部分疊加獲得泊松反射率,使用道積分后獲得泊松阻抗。
(2)利用小波分頻將泊松阻抗分解為不同頻率,隨后篩選出與油氣敏感的特征頻率,并加入孔隙度相控體,在有效儲層里進行含氣飽和度的定量預測。將井旁道屬性數(shù)據(jù)與測井含水飽和度標簽數(shù)據(jù)組成原始樣本集,并按比例劃分為訓練井樣本和驗證井樣本。
(3)設(shè)置隨機森林的訓練參數(shù),通過訓練井與驗證井的預測誤差質(zhì)控,不斷調(diào)整模型直至滿足精度需求。得到最優(yōu)隨機森林模型后,將預測范圍擴大至整個工區(qū),即可獲得含氣飽和度的三維數(shù)據(jù)體。
研究區(qū)位于白云凹陷陸坡深水區(qū),白云東鼻狀隆起帶上。漸新世珠江組受陸架坡折帶控制,在陸坡區(qū)發(fā)育重力流水道—扇朵葉沉積。重力流砂體儲層橫向非均質(zhì)性強,甜點區(qū)識別難度大。流體相比骨架和孔隙屬于弱信號,對彈性參數(shù)的影響很微弱,受到壓實、巖性、厚度調(diào)諧、孔隙等干擾屏蔽,氣層、低飽和度氣層、油層地震響應類似,常規(guī)彈性參數(shù)反演方法難識別,含氣飽和度預測難度大[26]。針對本地區(qū)含氣性特征,利用含油氣地層頻散、衰減特性,利用人工智能方法建立頻變泊松阻抗與含氣飽和度非線性關(guān)系,以此定量預測含其飽和度。
針對研究區(qū)道集資料,從CRP道集分析表明存在噪聲及剩余多次波的問題,需要對道集進行針對性的解釋性處理。首先針對遠道異常,進行道集切除,通過預測去噪和SVD去噪壓制隨機噪聲和殘余多次。在保頻保幅的思想下獲得優(yōu)化后的道集。通過觀察優(yōu)化后道集并結(jié)合井上AVO規(guī)律(圖3)發(fā)現(xiàn),氣層主要表現(xiàn)為III類AVO特征,水層表現(xiàn)為IV類AVO特征,并且氣層和水層在大角度上所表現(xiàn)出的AVO特征差異最明顯,由公式(8)所推導的泊松反射率與疊前道集的關(guān)系,射線道集的敏感角度部分疊加具有泊松反射率的含義,因此在道集優(yōu)化處理的基礎(chǔ)上,采用大角度(25°~36°)疊加獲得泊松反射率,隨后進行道積分處理,獲得泊松阻抗。
圖3 優(yōu)化道集及AVO特征Fig. 3 Optimize gathers and AVO features
如圖4 所示,目標區(qū)彈性參數(shù)λρ與飽和度交會圖可以看出,λρ與含氣飽和度具有一定的相關(guān)性,但同一λρ值可能對應不同的飽和度,使用λρ表征含氣性具有很強的多解性。而通過敏感泊松阻抗曲線與含水飽和度對比分析,泊松阻抗對應含氣性的多解性變低,在一定的孔隙度范圍內(nèi)通過泊松阻抗更容易表現(xiàn)地層的含氣性。
圖4 (a)目標區(qū)λρ與含水飽和度交會圖; (b)目標區(qū)泊松阻抗與孔隙度交會圖(色標為含水飽和度)Fig. 4 (a)cross plot of λρ and water saturation in target zone; (b)cross plot of sensitive Poisson impedance and porosity in target zone
從剖面與平面特征也容易看出,泊松阻抗與油氣顯示具有很強的相關(guān)性(圖5,圖中藍色點代表水層井,紅色點代表氣層井)。但由于所得的泊松阻抗包含全頻率信息,未挖掘其頻變特征,與井上的油氣對應程度仍有差異。例如W5 井區(qū)實鉆證實為水層,物性較好,地震剖面上顯示為強振幅特征,其泊松阻抗也有一定的異常顯示。
圖5 泊松阻抗剖面及平面特征Fig. 5 Poisson impedance profile and planar characteristics
因此利用小波變換,采用Mono小波對泊松阻抗進行分頻,Mono小波具有構(gòu)造簡單、比其它小波變換計算速度快的優(yōu)點。分頻獲得10~60 Hz的泊松阻抗分頻數(shù)據(jù),如圖6 所示,對比后發(fā)現(xiàn)在泊松阻抗10 Hz、20 Hz頻段,與已知的油井、水井對應程度較高,而在中頻、高頻的泊松阻抗上,則與已知的油氣性吻合度低,若直接將10~60 Hz各頻率的泊松阻抗全部輸入,勢必引入干擾信息。因此認為10 ~20Hz為泊松阻抗檢測油氣的敏感頻段,隨后增加了15 Hz的擴充特征頻率及樣本。因此,最終的輸入樣本為10 Hz、15 Hz、20 Hz特征頻率泊松阻抗,根據(jù)雙相介質(zhì)理論,流體賦存在儲層的有效孔隙內(nèi),因此本次加入孔隙度進行相控。將特征頻率(10 Hz、15 Hz、20 Hz)的泊松阻抗與相控孔隙度數(shù)據(jù)體輸入到隨機森林中進行學習,得到預測的三維含氣飽和度數(shù)據(jù)體。
圖6 分頻泊松阻抗平面特征Fig. 6 Frequency-divided Poisson impedance plane characteristics
使用工區(qū)中的3 口井W1、W2、W3 作為訓練井,W5 井作為驗證,使用隨機森林進行訓練,通過多次測試,得到的最優(yōu)參數(shù)為:樹棵數(shù)為300,決策樹最大樹深為6,節(jié)點可分的最小樣本數(shù)為20。通過優(yōu)選的參數(shù)獲得的訓練和驗證結(jié)果如圖7 所示,訓練后的最優(yōu)隨機森林模型顯示:W1、W2、W3 井的原始含水飽和度曲線與預測曲線的相關(guān)系數(shù)分別為0.893、0.981 和0.872,驗證井W5 井上的相關(guān)系數(shù)為0.892,滿足預測精度要求,可以用于含水飽和度預測。
圖7 隨機森林訓練井、驗證井含水飽和度預測結(jié)果Fig. 7 Water saturation prediction results of random forest training well and verification well
抽取W1 井的Sw預測曲線與真實Sw曲線進行對比分析,如圖8 所示,預測結(jié)果與實測曲線形態(tài)、值域范圍及趨勢一致,通過預測結(jié)果可以明顯地識別出井上的氣層,而W1 井的氣層低λρ特征相對不明顯,較難識別其含氣性。
圖8 W1 井含水飽和度預測結(jié)果Fig. 8 Prediction results of water saturation in well W1
使用頻變阻抗人工智能油氣性預測方法定量預測的含氣性結(jié)果如圖9d所示,對比定性油氣檢測——吸收屬性剖面(圖9a)與彈性參數(shù)λρ油氣檢測剖面(圖9b),含氣飽和度預測與黏彈性亮點位置一致,定量預測結(jié)果符合定性認識,而對比使用全頻段泊松阻抗的預測結(jié)果(圖9c),使用頻變泊松阻抗人工智能油氣性預測方法的剖面氣層、水層與含油水層區(qū)別明顯,整體連續(xù)性強,并且與井上油氣層厚度、類型對應程度更高。
圖9 含氣性預測剖面對比Fig. 9 Comparison of gas bearing prediction profiles
三種方法的預測平面如圖10 所示,彈性參數(shù)λρ受儲層巖性、物性的影響,針對W5 井水層預測結(jié)果顯示為油氣亮點;而使用一般泊松阻抗進行人工智能預測含氣飽和度的結(jié)果如圖10c所示,結(jié)合剖面預測結(jié)果,由于未充分利用有效頻率信息,其在W3 井上存在偏差。頻變泊松阻抗人工智能含氣性預測結(jié)果與吸收屬性含氣性檢測結(jié)果相符,對氣層、水層識別較準確,并且基于泊松阻抗的人工智能含氣飽和度預測方法于可以定量反映高飽和度氣層和低飽和度氣層的差異。
圖10 含氣性預測平面對比Fig. 10 Comparison of gas content prediction planes
對比結(jié)果顯示,基于相控頻變阻抗的人工智能流體飽和度預測結(jié)果可以反映砂組平面流體分布情況,對井吻合性高。通過觀察剖面和平面含氣飽和度特征,預測結(jié)果在厚度、值域、延伸方向均與已知對應,可以作為后期的依據(jù)目標評價和優(yōu)選的有力指標。
1) 白云凹陷陸坡深水區(qū)重力流砂體受壓實、厚度調(diào)諧、孔隙等因素影響難以獲取準確可靠的含氣飽和度,根據(jù)研究區(qū)的彈性參數(shù)與含水飽和度交匯分析,與常規(guī)的彈性參數(shù)λρ相比,在一定的孔隙度范圍內(nèi)泊松阻抗更容易表現(xiàn)地層的含氣性,且通過分頻對比,在泊松阻抗10 Hz、20 Hz頻段,與已知的氣井、水井對應程度相較于中高頻段更高。
2) 將特征頻率的泊松阻抗與相控孔隙度數(shù)據(jù)體輸入到隨機森林中得到定量預測的含氣飽和度,結(jié)果顯示使用頻變泊松阻抗人工智能油氣性預測方法氣層、低飽和度氣層、水層區(qū)別明顯,整體連續(xù)性強,并且與井上油氣層厚度、類型對應程度更高。