關(guān)鍵詞:巖石力學(xué)參數(shù),復(fù)雜巖性地層,機(jī)器學(xué)習(xí),自適應(yīng)組合預(yù)測
0引言
準(zhǔn)確的巖石力學(xué)參數(shù)在油氣勘探與開發(fā)中發(fā)揮著重要作用,如井位選擇、井壁穩(wěn)定分析、井眼軌跡優(yōu)化、壓裂改造等[1?6]。室內(nèi)巖心實(shí)測是確定巖石力學(xué)參數(shù)最基本、最直接的方法,但是巖心試驗(yàn)數(shù)據(jù)有限且離散,不能完全反映鉆井中地層巖石力學(xué)參數(shù)的變化趨勢,不利于鉆井、壓裂等工程應(yīng)用[7],因而在實(shí)踐中更多的是采用地球物理測井預(yù)測方法。
常用的巖石力學(xué)參數(shù)測井預(yù)測方法有:基于彈性波動理論的預(yù)測方法和基于巖石力學(xué)參數(shù)的巖石物理響應(yīng)機(jī)制建立的預(yù)測方法[8]。Gui等[9]結(jié)合室內(nèi)試驗(yàn)和測井資料預(yù)測頁巖地層脆性指數(shù);王英偉等[10]根據(jù)室內(nèi)試驗(yàn)獲取動、靜態(tài)巖石力學(xué)參數(shù)轉(zhuǎn)換關(guān)系,對致密礫巖儲層開展巖石力學(xué)參數(shù)預(yù)測;郭思強(qiáng)[11]利用縱波速度計算致密砂巖動態(tài)巖石力學(xué)參數(shù),結(jié)合室內(nèi)試驗(yàn)實(shí)現(xiàn)了動、靜態(tài)力學(xué)參數(shù)之間的轉(zhuǎn)換;鄧晗等[12]對疏松砂巖儲層的單軸抗壓強(qiáng)度(UniaxialCompressiveStrength,UCS)與深度、聲波時差、密度(ρ)等測井?dāng)?shù)據(jù)進(jìn)行相關(guān)性分析,構(gòu)建了多元線性回歸模型并應(yīng)用于實(shí)際資料;孫佳成等[13]對致密砂巖開展室內(nèi)試驗(yàn),實(shí)現(xiàn)了動、靜態(tài)巖石力學(xué)參數(shù)之間的轉(zhuǎn)換,計算得到巖石力學(xué)參數(shù)測井預(yù)測剖面。
巖石力學(xué)參數(shù)測井預(yù)測模型的建立通常基于實(shí)驗(yàn)室獲得的半經(jīng)驗(yàn)關(guān)系[14]。眾多學(xué)者的研究表明,不同經(jīng)驗(yàn)公式具有明顯的區(qū)域性特點(diǎn)且易受巖性影響[14?18],而對于富有機(jī)質(zhì)頁巖、碳酸鹽巖、致密砂巖等復(fù)雜巖性地層,由于其具有巖石成分和結(jié)構(gòu)復(fù)雜、強(qiáng)非均質(zhì)性、孔隙結(jié)構(gòu)復(fù)雜等特征[19?22],因此地球物理測井預(yù)測方法精度較低,這為復(fù)雜巖性地層巖石力學(xué)參數(shù)預(yù)測帶來較大挑戰(zhàn)。
隨著人工智能技術(shù)的快速發(fā)展,巖石力學(xué)參數(shù)預(yù)測方法出現(xiàn)智能化趨勢。不同學(xué)者以聲波時差、密度、孔隙度(?)、滲透率等作為輸入?yún)?shù),針對不同巖性地層,采用不同機(jī)器學(xué)習(xí)算法開展巖石力學(xué)參數(shù)預(yù)測。Asadi[23]針對砂巖地層采用BP神經(jīng)網(wǎng)絡(luò)預(yù)測UCS;Matin等[24]基于隨機(jī)森林(RandomForest,RF)模型實(shí)現(xiàn)了對凝灰?guī)r樣品彈性模量(E)和UCS的準(zhǔn)確預(yù)測;Barzegar等[25]采用支持向量機(jī)(SupportVectorMachine,SVM)預(yù)測凝灰?guī)r樣品UCS;He等[26]采用卷積神經(jīng)網(wǎng)絡(luò)(ConvolutionalNeuralNetwork,CNN)預(yù)測大理巖和灰?guī)r的UCS;Mahmoodzadeh等[27]采用決策樹(ClassificationandRegressionTree,CART)和長短時記憶(Long?ShortTermMemory,LSTM)網(wǎng)絡(luò)分別預(yù)測砂巖巖樣的內(nèi)聚力(C)和內(nèi)摩擦角(φ)。
上述研究說明了不同機(jī)器學(xué)習(xí)算法均可用于巖石力學(xué)參數(shù)預(yù)測。然而,僅構(gòu)建單一算法模型進(jìn)行巖石力學(xué)參數(shù)預(yù)測,可能會受到模型不規(guī)范、過度擬合、樣本大小等因素影響[28],因此部分學(xué)者采用不同機(jī)器學(xué)習(xí)算法相結(jié)合的方式開展巖石力學(xué)參數(shù)預(yù)測。Mahmoodzadeh等[27]采用粒子群算法優(yōu)化長短時記憶(ParticleSwarmOptimizationLong?ShortTermMemory,PSO?LSTM)網(wǎng)絡(luò)實(shí)現(xiàn)了砂巖內(nèi)聚力和內(nèi)摩擦角的高精度預(yù)測;Nasiri等[29]采用Shapley加法解釋(ShapleyAdditiveExplanations,SHAP),結(jié)合XGBoost預(yù)測凝灰?guī)rUCS和彈性模量;Maryam等[30]采用布谷鳥算法優(yōu)化人工神經(jīng)網(wǎng)絡(luò)(CuckooOptimizationAlgorithm?ArtificialNeuralNetwork,COA?ANN),對灰?guī)r的UCS和彈性模量進(jìn)行預(yù)測。不同智能算法的結(jié)合進(jìn)一步提升了預(yù)測模型的精度和適應(yīng)性,然而目前的研究僅關(guān)注于少數(shù)幾個巖石力學(xué)參數(shù)的預(yù)測,且多數(shù)針對單一巖性地層,對于復(fù)雜巖性地層多個巖石力學(xué)參數(shù)的同步預(yù)測的方法較少見于文獻(xiàn)。
近年來,組合預(yù)測方法成為機(jī)器學(xué)習(xí)中一種最有效、最流行的預(yù)測技術(shù)[28]。組合預(yù)測方法采用多種預(yù)測模型對同一問題進(jìn)行預(yù)測,然后賦予各單項(xiàng)預(yù)測模型合適的權(quán)系數(shù)并進(jìn)行組合,從而提取各單項(xiàng)預(yù)測模型有效信息,優(yōu)化預(yù)測效果,提高模型預(yù)測精度[31?32]?;诖?,本文將組合預(yù)測的思想應(yīng)用到復(fù)雜巖性地層巖石力學(xué)參數(shù)預(yù)測當(dāng)中。
本文以準(zhǔn)噶爾盆地瑪湖凹陷風(fēng)城組為例,首先,開展基于傳統(tǒng)方法的巖石力學(xué)參數(shù)預(yù)測,通過室內(nèi)巖石力學(xué)實(shí)驗(yàn)所獲取的不同巖性巖樣密度、聲波速度參數(shù)以及UCS、彈性模量、泊松比(μ)、內(nèi)聚力、內(nèi)摩擦角、抗張強(qiáng)度(σt)、脆性指數(shù)(B)、斷裂韌性(KIC)等巖石力學(xué)參數(shù),構(gòu)建巖石力學(xué)參數(shù)預(yù)測模型并開展預(yù)測;然后,采用BP、XGBoost、SVM、RF、CNN、CART、LSTM等不同機(jī)器學(xué)習(xí)算法,預(yù)測巖石力學(xué)參數(shù)并分析不同機(jī)器學(xué)習(xí)算法的預(yù)測效果;在此基礎(chǔ)上,提出一種不同巖石力學(xué)參數(shù)的自適應(yīng)權(quán)重組合預(yù)測方法,通過對不同巖石力學(xué)參數(shù)選取不同預(yù)測基模型,賦予權(quán)重并進(jìn)行組合,以期實(shí)現(xiàn)對復(fù)雜巖性地層不同巖石力學(xué)參數(shù)的同步準(zhǔn)確預(yù)測。
1傳統(tǒng)巖石力學(xué)參數(shù)預(yù)測方法
準(zhǔn)噶爾盆地瑪湖凹陷風(fēng)城組為多源混合細(xì)粒沉積,主要巖性為白云質(zhì)粉砂巖、白云質(zhì)泥巖、白云質(zhì)細(xì)砂巖、凝灰質(zhì)細(xì)砂巖、熔結(jié)凝灰?guī)r等[33?34]。對研究區(qū)4口井巖樣(深度為4300~5000m)開展室內(nèi)試驗(yàn),獲得其密度;然后開展巖石力學(xué)測試,主要包括單軸/三軸壓縮測試(單軸抗壓強(qiáng)度、彈性模量、泊松比、內(nèi)聚力、內(nèi)摩擦角、脆性指數(shù))、巴西劈裂測試(抗張強(qiáng)度)、人字形切槽巴西圓盤法測試(斷裂韌性)等,同時獲取每一個巖樣的縱波時差(Δtc)、橫波時差(Δts)。經(jīng)過室內(nèi)巖石力學(xué)試驗(yàn)和數(shù)據(jù)處理,共獲得單軸抗壓強(qiáng)度、彈性模量、泊松比、脆性指數(shù)(應(yīng)力—應(yīng)變曲線計算得到[35])、斷裂韌性等數(shù)據(jù)各25組,抗張強(qiáng)度數(shù)據(jù)45組,內(nèi)聚力、內(nèi)摩擦角數(shù)據(jù)各30組。
不同巖性巖樣的密度及聲學(xué)特征如圖1所示,巖石力學(xué)參數(shù)分布特征如圖2所示。由圖1和圖2可見,不同巖性巖樣的巖石物理參數(shù)和巖石力學(xué)參數(shù)分布范圍差異較明顯,且部分相同巖性巖樣的巖石物理參數(shù)、巖石力學(xué)參數(shù)的差異也較大,這可能與風(fēng)城組縱向上巖性頻繁變化、同一巖性巖樣非均質(zhì)性強(qiáng)、紋層發(fā)育等因素有關(guān)[34]。
根據(jù)彈性波動理論和巖石物理響應(yīng)特征,通過回歸分析縱波時差、橫波時差、密度等參數(shù)與不同巖石力學(xué)參數(shù)之間的關(guān)系,可建立不同巖石力學(xué)參數(shù)的預(yù)測模型(表1)。
根據(jù)不同巖石力學(xué)參數(shù)預(yù)測模型(表1)開展預(yù)測,并采用決定系數(shù)(R2)、平均相對誤差(MRE)和均方根誤差(RMSE)評價預(yù)測效果。評價指標(biāo)公式分別為
式中:yi、y?i分別為巖石力學(xué)參數(shù)的實(shí)測值、預(yù)測值;y為實(shí)測巖石力學(xué)參數(shù)的平均值;n為測試數(shù)量。
傳統(tǒng)方法對不同巖石力學(xué)參數(shù)的預(yù)測效果如表2所示。由表可見,不同巖石力學(xué)參數(shù)預(yù)測值與實(shí)測值的R2lt;0.4、MREgt;20%、RMSE較大,這說明基于彈性波動理論和巖石力學(xué)參數(shù)的巖石物理響應(yīng)特征的傳統(tǒng)預(yù)測方法對復(fù)雜巖性地層的適應(yīng)性較差。
2基于機(jī)器學(xué)習(xí)算法的預(yù)測方法
不同機(jī)器學(xué)習(xí)算法在巖石力學(xué)參數(shù)預(yù)測中的應(yīng)用結(jié)果如表3所示。由表可見,針對不同巖性巖石,可以選擇不同機(jī)器學(xué)習(xí)算法得到較高精度的預(yù)測結(jié)果,這說明不同機(jī)器學(xué)習(xí)算法均能用于巖石力學(xué)參數(shù)預(yù)測。然而,針對復(fù)雜巖性地層,不同機(jī)器學(xué)習(xí)算法的適用性尚有待進(jìn)一步研究。因此,本文采用BP、RF、SVM、CNN、CART、LSTM、XGBoost等7種機(jī)器學(xué)習(xí)算法,分別構(gòu)建巖石力學(xué)參數(shù)預(yù)測模型并開展預(yù)測。通過比較不同機(jī)器學(xué)習(xí)算法的預(yù)測效果,尋找預(yù)測復(fù)雜巖性地層巖石力學(xué)參數(shù)的最優(yōu)機(jī)器學(xué)習(xí)算法。
基于室內(nèi)實(shí)驗(yàn)獲取的巖樣巖性、密度、縱波時差、橫波時差數(shù)據(jù)以及不同巖石力學(xué)參數(shù)數(shù)據(jù),可建立用于機(jī)器學(xué)習(xí)算法模型的數(shù)據(jù)庫。考慮到巖石力學(xué)參數(shù)的巖石物理響應(yīng)特征及其受巖性影響的特點(diǎn),本文將巖性、縱波速度、橫波速度、密度作為機(jī)器學(xué)習(xí)的輸入?yún)?shù),各個巖石力學(xué)參數(shù)作為輸出參數(shù)。同時,為了訓(xùn)練模型并評估不同模型預(yù)測結(jié)果的準(zhǔn)確性,將數(shù)據(jù)庫隨機(jī)分成兩組,即訓(xùn)練集(80%)和測試集(20%)。
基于不同機(jī)器學(xué)習(xí)算法開展模型訓(xùn)練和測試,并計算預(yù)測值與實(shí)測值的R2、MRE和RMSE。圖3為不同機(jī)器學(xué)習(xí)算法預(yù)測抗張強(qiáng)度的結(jié)果。由圖可見,不同機(jī)器學(xué)習(xí)算法預(yù)測效果有所不同,其中SVM、LSTM和XGBoost算法的預(yù)測效果較好,其他機(jī)器學(xué)習(xí)算法的預(yù)測效果較差。
進(jìn)一步計算不同機(jī)器學(xué)習(xí)算法預(yù)測抗張強(qiáng)度結(jié)果與實(shí)測值的R2、MRE和RMSE,結(jié)果如表4所示。由表可見,在訓(xùn)練階段中,SVM算法的R2、RMSE、MRE分別為0.90、1.45、6.65%;LSTM算法的R2、RMSE、MRE分別為0.90、1.49、10.90%;XGBoost算法的R2、RMSE、MRE分別為0.97、1.06、14.55%。上述結(jié)果與圖3中展示的預(yù)測結(jié)果相吻合。
在測試階段,SVM算法的預(yù)測效果最好,R2達(dá)到1.00,RMSE僅為0.10,MRE僅為1.21%。測試階段的效果反映了模型在開展實(shí)際應(yīng)用時的效果,因此所訓(xùn)練的SVM模型能更加準(zhǔn)確地實(shí)現(xiàn)抗張強(qiáng)度的預(yù)測。
表5展示了不同機(jī)器學(xué)習(xí)算法模型在測試階段預(yù)測不同巖石力學(xué)參數(shù)的效果。通過對比可以發(fā)現(xiàn),針對不同巖石力學(xué)參數(shù),不同機(jī)器學(xué)習(xí)算法的預(yù)測效果存在差異。以MRE作為主要評價指標(biāo),同時考慮較高的R2值和較低的RMSE值,則單軸抗壓強(qiáng)度的預(yù)測最優(yōu)機(jī)器學(xué)習(xí)算法模型為SVM,彈性模量為BP,泊松比為RF,抗張強(qiáng)度為SVM,內(nèi)聚力為XGBoost,內(nèi)摩擦角為LSTM,脆性指數(shù)為SVM,斷裂韌性為LSTM。以上結(jié)果進(jìn)一步說明了針對復(fù)雜巖性地層不同巖石力學(xué)參數(shù)的預(yù)測最優(yōu)機(jī)器學(xué)習(xí)算法有所不同,采用單一機(jī)器學(xué)習(xí)算法難以實(shí)現(xiàn)對不同巖石力學(xué)參數(shù)的準(zhǔn)確預(yù)測。
3自適應(yīng)權(quán)重組合預(yù)測方法
為了實(shí)現(xiàn)對復(fù)雜巖性地層不同巖石力學(xué)參數(shù)的同步準(zhǔn)確預(yù)測,本文采用基于Pearson相關(guān)系數(shù)的自適應(yīng)權(quán)重組合預(yù)測方法。該方法主要是通過對不同巖石力學(xué)參數(shù)選擇不同的基模型、賦予相應(yīng)權(quán)重并進(jìn)行組合,其中預(yù)測精度越高的基模型權(quán)重越大。該方法的關(guān)鍵在于不同巖石力學(xué)參數(shù)的基模型選擇以及基模型的權(quán)重確定。單個巖石力學(xué)參數(shù)的預(yù)測基模型選擇流程如圖4所示。首先通過不同機(jī)器學(xué)習(xí)算法模型對巖石力學(xué)參數(shù)開展預(yù)測,然后以R2≥0.60且MRElt;20%為指標(biāo)對模型進(jìn)行篩選,篩選后的模型即為該巖石力學(xué)參數(shù)的預(yù)測基模型。為了減小計算復(fù)雜度,本文選擇的基模型不超過4個。對不同巖石力學(xué)參數(shù)重復(fù)圖4的流程,便可選出每個巖石力學(xué)參數(shù)的預(yù)測基模型。
基模型的權(quán)重通過Pearson相關(guān)系數(shù)確定。根據(jù)基模型的預(yù)測結(jié)果可計算預(yù)測值與實(shí)測值的Pearson相關(guān)系數(shù)。Pearson相關(guān)系數(shù)反映兩個向量間的線性相關(guān)性,即向量A=[a1,a2,…,ak]與B=[b1,b2,…,bk]之間的Pearson相關(guān)系數(shù)
據(jù)圖5所示流程對不同巖石力學(xué)參數(shù)開展自適應(yīng)權(quán)重組合預(yù)測,并計算預(yù)測值與實(shí)測值(圖6)的R2、RMSE和MRE(表7)。由圖6可見,不同巖石力學(xué)參數(shù)的預(yù)測值與實(shí)測值之間的相關(guān)性均較高,預(yù)測效果均較好。
從表7中可以發(fā)現(xiàn),不同巖石力學(xué)參數(shù)自適應(yīng)權(quán)重組合預(yù)測結(jié)果的R2均較高,絕大部分大于0.90;不同巖石力學(xué)參數(shù)的RMSE均較低;除訓(xùn)練集中泊松比預(yù)測結(jié)果的MRE為10.30%外,其他巖石力學(xué)參數(shù)預(yù)測結(jié)果的MRE均小于10.00%。以上結(jié)果進(jìn)一步說明:通過對不同巖石力學(xué)參數(shù)開展自適應(yīng)權(quán)重組合預(yù)測可以提高機(jī)器學(xué)習(xí)算法對不同巖石力學(xué)參數(shù)的預(yù)測精度和適應(yīng)性,從而實(shí)現(xiàn)對復(fù)雜巖性地層不同巖石力學(xué)參數(shù)的同步準(zhǔn)確預(yù)測。
基于自適應(yīng)權(quán)重組合預(yù)測方法得到瑪湖凹陷風(fēng)城組不同巖石力學(xué)參數(shù)的測井剖面如圖7所示。由圖可見,某深度處預(yù)測值與實(shí)測值(綠色橫線)吻合度較高。
由圖8可見,不同巖石力學(xué)參數(shù)預(yù)測結(jié)果的平均相對誤差均小于10.00%,其中單軸抗壓強(qiáng)度平均相對誤差為6.71%,彈性模量為6.57%,泊松比為8.11%,抗張強(qiáng)度為6.82%,內(nèi)聚力為9.05%,內(nèi)摩擦角為7.34%,脆性指數(shù)為7.51%,斷裂韌性為9.64%,以上結(jié)果證明了本文所提出的自適應(yīng)權(quán)重組合預(yù)測方法的適用性。
4結(jié)論
本文基于室內(nèi)巖石力學(xué)實(shí)驗(yàn)所獲取的不同巖性巖樣密度、聲波速度參數(shù)以及抗壓強(qiáng)度、彈性模量、泊松比、內(nèi)聚力、內(nèi)摩擦角、抗張強(qiáng)度、脆性指數(shù)、斷裂韌性等巖石力學(xué)參數(shù),采用傳統(tǒng)預(yù)測方法、基于機(jī)器學(xué)習(xí)算法的預(yù)測方法和自適應(yīng)權(quán)重組合預(yù)測法,對復(fù)雜巖性地層不同巖石力學(xué)參數(shù)進(jìn)行預(yù)測,得到的結(jié)論如下:
(1)傳統(tǒng)預(yù)測方法在復(fù)雜巖性地層巖石力學(xué)參數(shù)的預(yù)測中適應(yīng)性較差,預(yù)測精度較低;
(2)不同機(jī)器學(xué)習(xí)算法對復(fù)雜巖性地層不同巖石力學(xué)參數(shù)的預(yù)測效果存在差異,單一機(jī)器學(xué)習(xí)算法難以實(shí)現(xiàn)對多個巖石力學(xué)參數(shù)的同步準(zhǔn)確預(yù)測;
(3)通過構(gòu)建自適應(yīng)權(quán)重組合預(yù)測模型,開展巖石力學(xué)參數(shù)預(yù)測,能夠有效地提升機(jī)器學(xué)習(xí)算法的泛化性能,從而實(shí)現(xiàn)復(fù)雜巖性地層多個巖石力學(xué)參數(shù)的同步準(zhǔn)確預(yù)測。
本文實(shí)例中僅選用了幾種常用的機(jī)器學(xué)習(xí)算法去構(gòu)建自適應(yīng)權(quán)重組合預(yù)測模型。根據(jù)本文所提出的方法,也可選擇更多的機(jī)器學(xué)習(xí)算法模型作為預(yù)測基模型以構(gòu)建基模型庫,進(jìn)一步提高復(fù)雜巖性地層巖石力學(xué)參數(shù)的預(yù)測精度,同時實(shí)現(xiàn)更多巖石力學(xué)參數(shù)的同步準(zhǔn)確預(yù)測。