歐傳根 唐 誠 王崇敬 梁 波
(中石化西南石油工程有限公司地質錄井分公司)
頁巖氣是近年來的勘探開發(fā)熱點,在頁巖氣解釋評價方面已經開展了大量的工作,普遍認為含氣頁巖儲集層的典型響應特征具有高自然伽馬、低巖石密度的特征,并廣泛應用密度、中子、伽馬能譜、電阻率等測井項目來評價地層孔隙度、含氣飽和度、有機碳含量,獲取鏡質體反射率Ro、計算礦物組分體積含量等[1-2]。這些方法和技術的應用,表明頁巖密度是用來開展頁巖氣甜點評價的重要依據和關鍵參數之一。由于頁巖氣開發(fā)的“降本增效”原因,且一般采用水平井施工,水平井段普遍達到1 500 m以上,放射性測井的井下安全風險極大,絕大部分水平井取消了巖石密度測井項目,部分工區(qū)的開發(fā)井也取消了測井項目,僅依靠隨鉆伽馬測井資料與氣測錄井資料開展儲集層評價等工作,導致測試選層時缺乏可靠的評價依據。針對上述問題,開展頁巖地層巖石密度錄井計算方法研究,既可為頁巖氣井的儲集層評價、測試選層提供依據,也可為其他類型油氣層的解釋評價參數求取提供借鑒。
在鉆探現場,直接獲取巖石密度的方法有密度測井與巖石密度錄井兩種,井下安全與降低成本等多重原因導致水平井普遍取消了密度測井項目。巖石密度錄井主要通過計量巖屑排出液體的體積來計算密度,但由于巖屑普遍細小,測量有一定的誤差,在頁巖氣井中基本沒有得到應用。
間接獲取巖石密度的方法主要由地球物理方法發(fā)展而來,如Gardner經驗公式根據聲波速度來擬合巖石密度,該算法在物探領域應用范圍極廣,但存在明顯的誤差。王盼等[3]在該經驗公式的基礎上加入電阻率與自然伽馬數據,形成了優(yōu)化算法,取得了較好的應用效果,但該方法需要較多的測井數據,在不測井的頁巖氣水平井中無法應用。
目前最常用的密度計算方法從ECS測井方法發(fā)展而來。Herron等[4]應用氧閉合模型將地層中元素含量轉換成氧化物,根據氧化物的質量或元素的質量,利用統計公式建立元素與礦物含量之間的關系,因為每種礦物對應固定的骨架密度,所以可根據地層中礦物類型和含量求出地層骨架密度,模型計算公式為:
式中:ρ為地層密度,g/cm3;m為地層中礦物的種類;ρi為第i種礦物對應的骨架密度,g/cm3;Mi為地層中第i種礦物的百分含量,%。
該模型實質是線性模型,制約精度的關鍵在于礦物種類及含量的準確獲取。孫建孟等[5]通過廣義逆矩陣優(yōu)化了元素與礦物的轉換模型,廖東良、趙子斌等[6-7]在此基礎上,開展了礦物類型約束、相對密度加權、反演評價等優(yōu)化工作,獲得的地層骨架密度計算模型更符合地區(qū)特點。
顧炎午等[8]借鑒ECS測井計算模型,開展元素錄井數據多元線性回歸方法研究,建立利用元素計算巖石密度的數學模型,很大程度上緩解了測井項目少、頁巖氣評價參數匱乏的困境。但是,巖石的密度與巖石骨架成分之間存在復雜的非線性關系[6],而多元統計回歸模型為線性回歸模型,故計算精度難以進一步得到提高,同時計算模型的可推廣性與可移植性也有待提高,該模型在四川盆地A井應用時相關系數達到0.8,移植到B井時,計算結果與實測數據相關系數大幅度降低到0.71。因此,有必要進一步開展計算方法的研究,建立精度更高的數學模型,便于推廣應用。
多元自適應回歸樣條(Multivariate Adaptive Regression Splines,以下簡稱為MARS)是機器學習算法中的一種,屬于能自適應處理高維數據的樣條回歸方法[9-11]。MARS方法的本質是將每一個預測變量(輸入參數)設定一個切分點拆成兩組,然后在每一組中建立預測變量與結果變量的關系,形成一對鉸鏈函數,其數學模型為:
一對鉸鏈函數通常寫成h(x-a)和h(a-x),其中x是預測變量,a是該變量的切分點。如果存在兩個變量x1和x2,且x1對預測結果的影響與x2有關,則稱之為變量的交互項,用x1*x2表示,其鉸鏈函數通常寫作h(x1-a)*h(x2-b)的形式,a、b分別為變量x1、x2的切分點。針對每一個變量形成鉸鏈函數,建立分段線性模型,每個鉸鏈函數擬合原始數據的一部分,且相互不產生影響。通過反復的窮舉搜索,尋找擬合最好的切分點,完成全部預測變量的擬合以后,移除對模型沒有顯著貢獻的變量,可優(yōu)選出最合適的模型。在所有機器學習算法中,MARS方法有一定的計算量,但相對而言計算快捷,并且不需要太多的數據預處理以及變量的篩選,還能夠捕捉變量之間的非線性和交互作用[10]。
頁巖巖石中不同元素之間存在多重共線性等復雜的關系[4,8],如Al與K元素存在明顯的正相關性,Si、Ca、Al之間此消彼長的現象較為明顯,元素與巖石密度之間也存在復雜的非線性關系,因此從理論上分析,MARS方法較多元線性回歸等方法更具優(yōu)勢。
本次研究選取四川盆地頁巖氣井Y井的XRF元素錄井數據、ECS測井及分析化驗資料為基礎,開展計算模型的研究。
XRF元素錄井能獲取20多種常見的元素含量,但頁巖中常見的元素只有10余種。斯倫貝謝公司的ECS或Litho Scanner測井能提供9種元素的分析結果,其中元素錄井與測井均能提供的元素數據只有8種(Mg、Al、Si、S、K、Ca、Ti、Fe)。由于其他元素的含量極低,同時也為了便于對比,統一設定輸入參數為這8種元素,同時統一按ECS測井數據格式,將元素錄井的數值轉換為小于1的小數。
MARS方法需要設定兩個調優(yōu)參數,為預測變量的階數和保留特征的項數,分別稱之為degree和nprune。degree為≥1的整數,Hastie等[10-11]推薦給degree設定一個上限(如≤3),因較高的階數會導致計算量大幅度增加,并導致數值大幅度膨脹或縮小,故不宜取值過大;nprune一般取值≥2,當變量數少于10個時,其上限建議為20。在綜合分析后將調優(yōu)參數degree設定為1~5,nprune設定為2~20,一共形成90個MARS模型。
設定參數后進行模型的訓練,由于建立了90個MARS模型,采用K折交叉驗證方法從中選擇最優(yōu)模型[10-11],獲得最優(yōu)模型的決定系數r2=0.85,調優(yōu)參數degree=2,nprune=17,鉸鏈函數及其系數如表1所示。
從表1最終的模型以及圖1中元素與密度的關系分析,8種元素中僅有6種參與了模型計算。對密度數值影響較為明顯的元素是Ca、Si、Fe,并且不是簡單的線性關系,Ca、Fe、K、Si元素均表現為分段式的影響,Ca元素甚至在不同的含量區(qū)間內,對密度的影響關系存在明顯反轉現象,Al、S兩種元素與密度整體呈微弱的負相關,Mg、Ti兩種元素的含量變化對密度基本沒有影響。
表1 基于MARS的頁巖密度計算模型系數
同時,MARS模型揭示了元素之間存在相互影響,Al、Si元素之間,Al、Ca、Fe與S元素之間存在交互影響,證實了元素與密度之間存在復雜的非線性關系,因而采用簡單的線性模型難以取得較好的計算效果。
Y井3 433.00~3 864.00 m井段實測密度2.30~2.71 g/cm3,平均2.63 g/cm3。分別用多元回歸模型、MARS模型以及Herron等公開的ECS計算模型[4-5](以下簡稱為Herron模型)進行計算,將獲得的結果與實測的頁巖密度進行對比可知,3種模型的效果有顯著的差異(圖2)。
MARS模型的效果最好,巖石密度計算結果為2.31~2.72 g/cm3,平均值2.63 g/cm3,計算結果與實測數據之間沒有明顯的偏差,r2=0.85。多元回歸模型也有一定的效果,計算結果為2.38~2.70 g/cm3,平均值2.65 g/cm3,計算結果普遍略高于實測結果,r2=0.71。效果最不理想的是Herron模型,該模型的計算結果為2.66~2.75 g/cm3,平均值2.72 g/cm3,計算結果與實測數據在數值的絕對值方面有較大的差異,變化趨勢方面具有微弱的正相關性(r2=0.0356),可能與其模型建立時間早,建立模型的數據主要來源于北美地區(qū),沒有考慮到地區(qū)之間的差異有一定關系。對比結果表明MARS模型的計算結果較為可靠,能滿足后期的頁巖氣甜點評價需求。
圖1 基于MARS方法的巖石密度與8種元素間的相關關系
圖2 Y井3種模型計算結果的相關性對比
將研究建立的MARS模型在四川地區(qū)的Z井進行了應用。Z井為水平井,其大斜度段與水平井段為3 750.00~5 450.00 m,鉆后未測井,僅有一條隨鉆伽馬曲線,且該伽馬曲線為兩種工具測量,井深4 105.00 m以上為旋轉導向工具提供的隨鉆伽馬,測值490~805 API,后續(xù)井段為LWD工具測量,測值165~418 API,測值有明顯差異。由于使用了不同的隨鉆工具,鉆時與氣測值也有明顯的波動,旋轉導向工具應用井段的氣測全烴值4.851%~24.380%,平均16.509%,鉆時3~24 min/m,平均8.5 min/m。使用LWD滑動工具井段氣測全烴值4.873%~37.359%,平均13.338%,鉆時3~42 min/m,平均15.6 min/m。外部環(huán)境的變化導致直接應用氣測、鉆時、隨鉆伽馬評價儲集層的難度加大。
圖3 Z井3 750.00~5 450.00 m井段計算效果圖
通過應用MARS模型計算出地層密度(圖3),全井段密度2.32~2.66 g/cm3,平均2.50 g/cm3,全井目的層可以分為4個層段。第一段井深3 750.00~3 850.00 m為入窗井段,氣測值出現異常,全烴0.868%~15.021%,平均7.070%,計算頁巖密度為2.66~2.52 g/cm3,密度開始下降的位置與氣測明顯升高的位置吻合,整體而言氣測值有異常但數值不高,頁巖密度較高,儲集層的含氣性一般。第二段井深3 850.00~4 694.00 m,氣測全烴值6.194%~24.380%,平均13.274%,計算巖石密度一般在2.45~2.54 g/cm3之間,平均2.49 g/cm3,個別井深出現高值達到2.61 g/cm3,但高值不延續(xù),推測為巖屑混雜,造成元素錄井數據出現波動,導致計算結果隨之波動,出現波動的數據點僅有2處,不影響整段的評價,整個井段氣測值明顯增加,頁巖密度為明顯的低值,表明地層的含氣性較好。第三段為井深4 694.00~4 884.00 m,氣測全烴值為9.139%~37.359%,平均24.467%,井深4 850.00~4 855.00 m出現異常低值,全烴僅為7.723%,對應井段的鉆時較高達到29 min/m,為平均鉆時的2倍以上,反映了高鉆時是氣測值變低的影響因素,而不是地層含氣性有明顯變化。計算巖石密度為2.32~2.51 g/cm3,平均2.42 g/cm3,密度明顯低于其余井段,表明該段含氣性最好,與氣測錄井結果較為吻合,是本井的最優(yōu)儲集層。第四段井深4 884.00~5 450.00 m,氣測全烴值4.875%~20.706%,平均12.075%,計算頁巖密度2.45~2.53 g/cm3,平均2.49 g/cm3,氣測全烴值較高,頁巖密度較低,井段的含氣性較好,與第二段基本相當。
從全井段來分析,單獨根據氣測、鉆時難以開展儲集層分段,但通過計算頁巖密度,能有效地區(qū)分出最優(yōu)儲集層與一般儲集層,且頁巖密度計算值與其他錄井數據可以相互補充與印證,在當前頁巖氣井不測井或測井項目少的情況下,為頁巖氣甜點評價提供了可靠的評價依據。
(1)頁巖密度是開展頁巖氣甜點評價的重要參數,但因大量的頁巖氣開發(fā)井不開展密度測井,甚至不測井,導致評價參數匱乏?;诙嘣赃m應回歸樣條算法,建立了頁巖密度計算模型,為頁巖氣儲集層評價提供了更多的依據。
(2)通過對比與應用,基于多元自適應回歸樣條算法的密度計算模型提供的結果較為可靠,計算精度較多元回歸模型有明顯提高,結合常規(guī)錄井數據,在水平井分段評價方面具有較好的應用效果。
(3)元素錄井獲取了地層豐富的信息,但數據的應用還不夠充分,機器學習算法在解決非線性、復雜模型的建模過程中具有明顯優(yōu)勢,有必要進一步加強數學算法在錄井數據應用過程中的方法研究,挖掘更多錄井數據的價值。