宋歌
本文以?xún)?chǔ)集層含油氣作為研究對(duì)象,用機(jī)器學(xué)習(xí)為基于測(cè)井解釋的儲(chǔ)層評(píng)價(jià)提供了一種自動(dòng)有效的方法,提出了測(cè)井儲(chǔ)層評(píng)價(jià)的機(jī)器學(xué)習(xí)框架,并在2個(gè)測(cè)井?dāng)?shù)據(jù)集上對(duì)其性能進(jìn)行了驗(yàn)證。實(shí)驗(yàn)結(jié)果表明,測(cè)井解釋結(jié)論與試油結(jié)果一致,與傳統(tǒng)的評(píng)價(jià)方法相比,該方法效率高,為石油勘探開(kāi)發(fā)大數(shù)據(jù)平臺(tái)的建設(shè)提供了參考。
儲(chǔ)層評(píng)價(jià)的基本思路是充分利用測(cè)井資料等多種資料,對(duì)儲(chǔ)層特性進(jìn)行評(píng)價(jià),如含油性評(píng)價(jià)、儲(chǔ)層分類(lèi)、儲(chǔ)層參數(shù)預(yù)測(cè)和產(chǎn)能估算等。隨著測(cè)井資料的不斷積累,勘探開(kāi)發(fā)的重要難點(diǎn)是如何更加充分地挖掘和分析地質(zhì)數(shù)據(jù)。機(jī)器學(xué)習(xí)提供了一種新的有效方法,被認(rèn)為是石油勘探開(kāi)發(fā)領(lǐng)域十大技術(shù)之一,被成功地應(yīng)用于油藏實(shí)時(shí)動(dòng)態(tài)監(jiān)測(cè)、石油工程工作最佳實(shí)踐識(shí)別以及油藏描述酬等領(lǐng)域,這些非線性方法優(yōu)于線性統(tǒng)計(jì)分析技術(shù),在石油勘探開(kāi)發(fā)中得到了廣泛應(yīng)用。在測(cè)井解釋方面,機(jī)器學(xué)習(xí)的優(yōu)點(diǎn)是不需要事先具備巖石物理機(jī)制等專(zhuān)業(yè)知識(shí),只需要少量的背景知識(shí),直接從地質(zhì)資料中構(gòu)建模型。機(jī)器學(xué)習(xí)中的分類(lèi)技術(shù)是儲(chǔ)層評(píng)價(jià)中最密切相關(guān)的工作,廣泛應(yīng)用于巖性識(shí)別、沉積相劃分、儲(chǔ)層參數(shù)預(yù)測(cè)和油氣水層識(shí)別等。本文分析了基于測(cè)井解釋的儲(chǔ)層評(píng)價(jià)流程,提出了一套基于機(jī)器學(xué)習(xí)的測(cè)井儲(chǔ)層評(píng)價(jià)框架。
地球物理測(cè)井是利用物理原理解決地球物理問(wèn)題的一種方法。利用儲(chǔ)層電化學(xué)性質(zhì)、傳導(dǎo)特性、聲學(xué)特性和放射性等來(lái)預(yù)測(cè)地球物理參數(shù),主要有數(shù)據(jù)采集和測(cè)井解釋兩大任務(wù)。
儲(chǔ)層評(píng)價(jià)的主要任務(wù)是利用測(cè)井原始資料對(duì)儲(chǔ)層的孔隙度、含油飽和度和巖性特征等進(jìn)行綜合評(píng)價(jià)。測(cè)井原始數(shù)據(jù)主要包括電位曲線(SP)、伽馬曲線(GR)、電阻率曲線(RT,RI,RXO、密度測(cè)井(DEN)、聲波測(cè)井(AC)和補(bǔ)償中子測(cè)井(CNL)等測(cè)井曲線,除原始測(cè)井?dāng)?shù)據(jù)外,還采集了關(guān)鍵井的實(shí)驗(yàn)數(shù)據(jù)。對(duì)于關(guān)鍵井,不僅要進(jìn)行綜合錄井采集原始資料,還要進(jìn)行取芯井巖石樣品的實(shí)驗(yàn)。通過(guò)對(duì)非臨界井的孔隙度和滲透率等實(shí)驗(yàn)數(shù)據(jù)的分析,得到巖性和含油性質(zhì)。
機(jī)器學(xué)習(xí)提供了一種新的有效方法。在測(cè)井儲(chǔ)層評(píng)價(jià)中,孔隙度、滲透率及飽和度等參數(shù)的計(jì)算,與監(jiān)督學(xué)習(xí)中的回歸任務(wù)相對(duì)應(yīng)。油層識(shí)別、巖性識(shí)別和沉積相劃分對(duì)應(yīng)監(jiān)督學(xué)習(xí)中的分類(lèi)任務(wù)。油氣勘探開(kāi)發(fā)專(zhuān)家在計(jì)算完儲(chǔ)層參數(shù)后,結(jié)合計(jì)算結(jié)果和給出最終評(píng)價(jià)結(jié)論。這完全取決于專(zhuān)家經(jīng)驗(yàn),而機(jī)器學(xué)習(xí)為儲(chǔ)層測(cè)井評(píng)價(jià)提供了一種自動(dòng)、數(shù)據(jù)驅(qū)動(dòng)的方法。
屬性選擇
由于輸入數(shù)據(jù)的維數(shù)比傳統(tǒng)方法高得多,可能導(dǎo)致數(shù)據(jù)擬合過(guò)度,建模時(shí)需要進(jìn)行特征選擇。測(cè)井解釋常用的特征選擇方法有交會(huì)圖法、相關(guān)分析法和專(zhuān)家經(jīng)驗(yàn)法。特征選擇有嵌入方法、過(guò)濾方法和包裝方法3種工作模式。特征選擇是嵌入式算法的一部分。濾波方法是一種獨(dú)立于分類(lèi)器的方法,如基于相關(guān)性的特征選擇。
模型優(yōu)化
不同算法的性能在很大程度上取決于模型參數(shù)的設(shè)置。因此有必要對(duì)模型進(jìn)行優(yōu)化。在大多數(shù)情況下,設(shè)置參數(shù)只能依靠經(jīng)驗(yàn)或?qū)Ρ葘?shí)驗(yàn),對(duì)模型參數(shù)優(yōu)化的研究也很少。一種有效的方法是K交叉驗(yàn)證和網(wǎng)格搜索相結(jié)合。K交叉驗(yàn)證:訓(xùn)練數(shù)據(jù)集將被拆分為個(gè)大小相同的獨(dú)立文件。選擇-1作為訓(xùn)練數(shù)據(jù)集,其余作為測(cè)試數(shù)據(jù)集。建模過(guò)程將重復(fù)次,并選擇次迭代后的MSE平均值來(lái)估計(jì)預(yù)期的泛化誤差。
模型評(píng)估
由于鉆井取心的成本很高,因此很少有可用于訓(xùn)練的數(shù)據(jù)。模型評(píng)估應(yīng)采用交叉驗(yàn)證,除了對(duì)分類(lèi)器進(jìn)行評(píng)價(jià)外,還需要進(jìn)行統(tǒng)計(jì)檢驗(yàn)。
新區(qū)塊、新層儲(chǔ)層評(píng)價(jià)一直面臨新的問(wèn)題,不同的預(yù)測(cè)建模方法難以從理論上分析其優(yōu)缺點(diǎn),只能通過(guò)實(shí)驗(yàn)來(lái)確定其適用性。比較了前面提到的框架與傳統(tǒng)的儲(chǔ)層測(cè)井評(píng)價(jià)方法在2種測(cè)井?dāng)?shù)據(jù)上的性能,訓(xùn)練數(shù)據(jù)集由盆地致密砂巖巖心測(cè)井曲線和數(shù)據(jù)組成,分類(lèi)標(biāo)簽為含油氣評(píng)價(jià)結(jié)果,算法用Python語(yǔ)言開(kāi)發(fā)。
(1)儲(chǔ)層參數(shù)預(yù)測(cè)對(duì)于第一個(gè)數(shù)據(jù)集,回歸任務(wù)是由MRA構(gòu)造的,因?yàn)橥ǔJ且粋€(gè)線性問(wèn)題。由于第二個(gè)數(shù)據(jù)集的非線性,采用了LSSVM,用F檢驗(yàn)驗(yàn)證方程的有效性,t檢驗(yàn)驗(yàn)證方程系數(shù)的有效性。對(duì)于修正后的最終模型,第一個(gè)數(shù)據(jù)集的F檢驗(yàn)P值為4.645E-08,第二個(gè)數(shù)據(jù)集的F檢驗(yàn)P值為6.996E-07,這表明回歸模型是有效的。
(2)基于機(jī)器學(xué)習(xí)的儲(chǔ)層測(cè)井解釋?zhuān)褂弥С窒蛄繖C(jī)、決策樹(shù)、貝葉斯、人工神經(jīng)網(wǎng)絡(luò)(ANN)對(duì)預(yù)測(cè)模型進(jìn)行訓(xùn)練,并使用十折交叉驗(yàn)證對(duì)模型進(jìn)行驗(yàn)證。
總之,機(jī)器學(xué)習(xí)提供了多種建模方法,擴(kuò)展了儲(chǔ)層評(píng)價(jià)方法,使分析不僅可以進(jìn)行預(yù)測(cè),而且可以發(fā)現(xiàn)新的知識(shí)。特別是面對(duì)大數(shù)據(jù)的挑戰(zhàn),在面臨新問(wèn)題的同時(shí),快速給出解決方案。為了提高效率,建議開(kāi)發(fā)與現(xiàn)有測(cè)井解釋評(píng)價(jià)軟件相結(jié)合的機(jī)器學(xué)習(xí)軟件,不斷豐富算法庫(kù),為解決這一問(wèn)題提供最佳方案。