張 欣,田英英,韓澤龍,趙 明,蔣亞峰
(中國地質(zhì)科學(xué)院勘探技術(shù)研究所,河北 廊坊 065000)
井漏是指相當(dāng)一部分或者全部鉆井液從井筒損失進(jìn)入到具有高滲透率的地層中,比如洞穴、裂縫或者松散地層。國外較為成熟的井漏預(yù)測與診斷的技術(shù)有精細(xì)控壓鉆井技術(shù)、ALS-K 井涌井漏快速探測系統(tǒng)、DrillEdge 軟件[1-3],分別通過微量溢流測量、鉆井液進(jìn)出口流量測量和案例推理技術(shù)來實(shí)現(xiàn)。國內(nèi)相關(guān)的井漏預(yù)測與診斷技術(shù)有綜合錄井技術(shù)方法、分離器液面檢測方法和井下微流量檢測方法等[4-7],這些方法對(duì)井漏的處理主要是專家結(jié)合井漏的現(xiàn)場情況提出解決方案,過于依靠現(xiàn)場專家的經(jīng)驗(yàn),導(dǎo)致無法實(shí)現(xiàn)鉆前診斷,忽略了其他堵漏決策方案[8]。而應(yīng)用人工智能方法預(yù)測與診斷井漏等復(fù)雜井下情況成為了鉆井工程領(lǐng)域的發(fā)展趨勢(shì),學(xué)者多采用神經(jīng)網(wǎng)絡(luò)[9-12]、貝葉斯網(wǎng)絡(luò)[13-14]和支持向量機(jī)(SVM)[15-16]等機(jī)器學(xué)習(xí)算法建立井漏預(yù)測與診斷模型。每種機(jī)器學(xué)習(xí)算法都有其優(yōu)缺點(diǎn)和適用范圍,其中神經(jīng)網(wǎng)絡(luò)適用于復(fù)雜非線性數(shù)據(jù)建模[10],但是該算法容易陷入局部最優(yōu)解問題[17],不充分的數(shù)據(jù)難以維持算法計(jì)算;貝葉斯網(wǎng)絡(luò)在基于鉆井參數(shù)的不確定性預(yù)測中發(fā)揮了重要作用,但還需要對(duì)時(shí)間尺度、趨勢(shì)判斷界限和閾值優(yōu)化進(jìn)行深入研究,提高預(yù)測準(zhǔn)確性[14];支持向量機(jī)適用于小樣本、非線性及高緯度的數(shù)據(jù)處理[15],不適用于數(shù)據(jù)量龐大的井漏診斷與識(shí)別問題。
梯度提升決策樹算法(GBDT,Gradient Boost?ed Decision Tree),是一種集成學(xué)習(xí)算法,該算法通過建立一個(gè)決策樹,以適應(yīng)它前面的樹的殘差,就像其他提升算法一樣,GBDT 算法是一種迭代過程,可以將幾個(gè)弱的“學(xué)習(xí)器”組合成一個(gè)強(qiáng)的“學(xué)習(xí)器”,提高預(yù)測的準(zhǔn)確性。同時(shí),其對(duì)原始數(shù)據(jù)處理要求低,能夠有效應(yīng)對(duì)復(fù)雜的工程問題[18-20]。目前,該 算 法 已 應(yīng) 用 于 醫(yī) 學(xué)[21-22]、城 市 交 通[23-25]、電力[26-27]、石油[17,28]等領(lǐng)域。
綜上所述,本文旨在研究GBDT 在井漏預(yù)測與診斷中的應(yīng)用,通過井漏機(jī)理分析,選取地層參數(shù)和鉆井工程參數(shù),分析GBDT 作為井漏鉆前診斷模型的可行性;利用案例推理技術(shù)建立井漏案例診斷庫,使用歐幾里得算法和LB_Keogh 算法進(jìn)行井漏案例的檢索,提出相應(yīng)的井漏處理措施,通過實(shí)例計(jì)算得出相似性計(jì)算的可靠性。
井漏的發(fā)生受到地質(zhì)、工程等多種原因影響,也會(huì)通過地面監(jiān)測儀器參數(shù)表現(xiàn)出來,因此,在使用GBDT 算法對(duì)井漏進(jìn)行預(yù)測時(shí),應(yīng)將這些原因考慮進(jìn)去,提高預(yù)測精度。
1.1.1 井深
在同一區(qū)塊的油氣井發(fā)生的井漏一般會(huì)集中在一個(gè)深度范圍。不同的井深對(duì)應(yīng)的漏失工況、鉆井液性能和所鉆遇的地層巖性等因素亦不相同。
1.1.2 地層壓力
當(dāng)?shù)貙又写嬖谔烊宦┦ǖ阑蜚@井液密度過大時(shí),地層孔隙壓力<井內(nèi)壓力,鉆井液會(huì)從井內(nèi)流入地層,誘發(fā)井漏事故[14]。
1.1.3 破裂壓力
在鉆井液漏失機(jī)理中,當(dāng)漏失壓力≥破裂壓力時(shí),地層中的裂縫會(huì)被壓開或者由于壓力過大地層出現(xiàn)新裂縫,形成漏失通道,造成鉆井液的漏失事故。
1.1.4 坍塌壓力
在鉆井過程中,有一些地層會(huì)出現(xiàn)“寧漏勿塌”的現(xiàn)象,這時(shí)的漏失壓力和坍塌壓力近乎相等,井底壓力稍微大一些地層就會(huì)出現(xiàn)漏失事故,井底壓力稍微小一些地層就會(huì)出現(xiàn)坍塌事故。
1.1.5 地層巖性、孔隙度和滲透率
在鉆井設(shè)計(jì)時(shí),考慮地層分層及其特征并進(jìn)行故障提示是非常有必要的,比如碳酸鹽巖地層裂縫、孔洞發(fā)育;粗砂、礫石地層滲透率高;頁巖具有弱平面的特點(diǎn),在鉆井作業(yè)中容易被壓裂形成漏失通道。所以地層巖性、孔隙度和滲透率需要參與到井漏診斷的計(jì)算中。
1.1.6 鉆井液密度、粘度、排量
鉆井液密度對(duì)井漏的影響主要是由于密度升高,增大了液柱壓力,從而增大了井內(nèi)與地層之間的壓差。粘度較大時(shí),對(duì)防止井漏或減輕井漏是有益的。但是在實(shí)際鉆井過程中,過大的粘度將會(huì)使得循環(huán)壓力過高,從而使薄弱地層產(chǎn)生人為裂縫,引起更大的漏失[29]。而過大的排量也會(huì)對(duì)井眼穩(wěn)定性產(chǎn)生影響,因此在易漏地層,應(yīng)適當(dāng)調(diào)整鉆井液的密度、粘度和排量值[30]。
1.1.7 鉆井液固相顆粒
漏失通道的尺寸應(yīng)大于鉆井液固相顆粒粒徑,否則固相顆粒過大會(huì)在井壁形成泥餅,而固相顆粒過小,則會(huì)導(dǎo)致井筒內(nèi)鉆井液的漏失[31],較差的固相顆粒級(jí)配也會(huì)造成泥餅質(zhì)量差,導(dǎo)致漏失。
1.1.8 泵壓
泵壓升高或降低一定程度上反映了井下是否發(fā)生了復(fù)雜事故,亦可作為漏失是否發(fā)生的判定條件之一。
1.1.9 鉆井液池體積、出入口流量差、立壓、大鉤負(fù)載和鉆速
在發(fā)生井漏時(shí),鉆井液池體積、出入口流量差、立壓、大鉤負(fù)載和鉆速也會(huì)發(fā)生變化,根據(jù)地下情況的不同,變化規(guī)律也不盡相同[32]。單一的地面參數(shù)變化不能完全表示井漏的發(fā)生,需要多參數(shù)協(xié)同表示,才能夠提高預(yù)測和診斷的精度。
GBDT 使用回歸樹模型作為弱學(xué)習(xí)器,通過多次迭代,每次迭代產(chǎn)生一個(gè)弱學(xué)習(xí)器,每個(gè)學(xué)習(xí)器在上一輪學(xué)習(xí)器的梯度基礎(chǔ)上進(jìn)行訓(xùn)練,即讓損失函數(shù)沿著梯度方向下降,使當(dāng)前迭代輪次的損失函數(shù)最小。當(dāng)?shù)瓿珊?,就可以得到最終的強(qiáng)學(xué)習(xí)器,實(shí)現(xiàn)預(yù)測的目的。在構(gòu)建井漏預(yù)測模型的過程中,需要對(duì)模型進(jìn)行數(shù)據(jù)訓(xùn)練來提高模型的精度。
在進(jìn)行數(shù)據(jù)訓(xùn)練之前首先對(duì)數(shù)據(jù)進(jìn)行預(yù)處理,剔除由人為因素或外界因素干擾造成的異常數(shù)據(jù),對(duì)含有缺失值的數(shù)據(jù)進(jìn)行忽略,并將數(shù)值進(jìn)行歸一化,從而避免特征量綱差異對(duì)預(yù)測結(jié)果造成的影響。本研究選用最大最小化方法將特征歸一到[0,1]之間:
式中:Xnew——?dú)w一化后特征;Xmax、Xmin——分別為特征的最大值和最小值。
需要進(jìn)行處理的數(shù)據(jù)分為2 類,一類是數(shù)值型數(shù)據(jù),一類是文字型數(shù)據(jù)。數(shù)值型數(shù)據(jù)需要統(tǒng)一格式再進(jìn)行處理,采用能夠代表井漏特征的參數(shù)進(jìn)行表示,其中使用馬氏漏斗粘度來表示鉆井液粘度,其中馬氏漏斗粘度通過流出一定體積的鉆井液所經(jīng)歷的時(shí)間來衡量粘度大?。挥妙w粒級(jí)配中的中值粒徑D50來表示固相顆粒的大小程度,其中D50表示顆粒累積分布百分?jǐn)?shù)達(dá)到50%時(shí)所對(duì)應(yīng)的粒徑值;文字型數(shù)據(jù)需要進(jìn)行量化,使文字?jǐn)?shù)據(jù)轉(zhuǎn)化為數(shù)值數(shù)據(jù)。在井漏特征參數(shù)中只有地層巖性是文字型數(shù)據(jù),將其進(jìn)行量化的處理方法是按照0~100 的順序邏輯對(duì)特征屬性的所有取值賦予一個(gè)對(duì)應(yīng)的正整數(shù),方便后續(xù)計(jì)算。
本文將井漏參數(shù)分別進(jìn)行歸一化處理。將訓(xùn)練數(shù)據(jù)代入到GBDT 模型中進(jìn)行訓(xùn)練,建立井漏預(yù)測模型。
(1)輸入:
數(shù)據(jù)集T={(x1,y1),(x2,y2),…,(xn,yn)},
損失函數(shù)L[y,f(x)]。
輸出:梯度提升模型F(x)。
初始化:
式中:c——使損失函數(shù)達(dá)到極小值的常數(shù)。
(2)假設(shè)有m=1,2,…,M次迭代,對(duì)樣本i=1,2,…,n,計(jì)算損失函數(shù)的負(fù)梯度——?dú)埐畹墓烙?jì)值為:
(3)利用數(shù)據(jù)集(xi,rmi)擬合下一輪基礎(chǔ)模型,得到對(duì)應(yīng)的葉子結(jié)點(diǎn)Rmj,j=1,2,…,J,計(jì)算每個(gè)葉子結(jié)點(diǎn)Rmj的最佳擬合值,使損失函數(shù)最?。?/p>
(4)計(jì)算所有葉子節(jié)點(diǎn)對(duì)應(yīng)的cmj之和得到第m輪的基礎(chǔ)模型:
結(jié)合前m-1 輪的基礎(chǔ)模型得到最終強(qiáng)學(xué)習(xí)器:
案例推理既是一種人工智能技術(shù),又是利用相似案例的相關(guān)信息解決當(dāng)前問題的類比推理方法[33]。該方法的工作流程為案例表示、案例檢索和案例學(xué)習(xí)。案例的表示需要將所有的案例使用統(tǒng)一的方式描述出來,建立案例數(shù)據(jù)庫。數(shù)據(jù)庫中的案例越多,案例越具有代表性,數(shù)據(jù)庫越成熟。本研究將收集到的數(shù)據(jù)采用三元組的形式進(jìn)行描述,分別是:(1)井漏案例基本信息,此部分包括案例編號(hào)、油田名稱、區(qū)塊名稱、井口坐標(biāo)、井號(hào)、事故類型、漏失層位、漏失巖性、漏失位置、鉆井工況、漏速和堵漏次數(shù)等;(2)井漏特征屬性信息,此部分內(nèi)容包括案例編號(hào)和特征參數(shù);(3)井漏事故結(jié)論信息,此部分內(nèi)容包括案例發(fā)生經(jīng)過、處理方案和處理效果。
案例檢索的相似度計(jì)算是診斷模型的核心[34]。本研究針對(duì)井漏特征參數(shù)中的非時(shí)間序列數(shù)據(jù)和時(shí)間序列數(shù)據(jù)分別采用歐幾里得數(shù)學(xué)模型和LB_Ke?ogh 數(shù)學(xué)模型進(jìn)行相似度計(jì)算。當(dāng)輸入新案例井的信息時(shí),診斷模型將搜索與新案例的信息匹配度最高的案例,將其調(diào)用出來,技術(shù)人員可參考調(diào)用出來的案例中防漏堵漏的信息,對(duì)新案例井進(jìn)行處理。
診斷模型需要不斷加入新案例進(jìn)行自主學(xué)習(xí)[35],也需要?jiǎng)h減案例,提高案例質(zhì)量。若診斷模型未檢索出與新案例井相似的案例,則將新案例井的信息存儲(chǔ)進(jìn)去;若某一案例被檢索出來的頻率很高,則將此案例作為經(jīng)典案例;若部分案例經(jīng)常一起被檢索出來,則刪除其余案例,保留一個(gè)代表性案例。
在井漏診斷中,本研究利用層析分析法中的標(biāo)度法,對(duì)井漏參數(shù)構(gòu)建判斷矩陣,其中各標(biāo)度值見表1。層次分析法通過對(duì)影響因素進(jìn)行賦權(quán),每一層影響因素的權(quán)重都會(huì)影響到結(jié)果,可以將復(fù)雜問題變成層次分明的階梯結(jié)構(gòu),是一種解決多目標(biāo)復(fù)雜問題的決策分析方法。
表1 特征參數(shù)標(biāo)度值Table 1 Value scale of characteristic parameters
建立判斷矩陣:
式中:amn——判斷矩陣中第m個(gè)特征參數(shù)相對(duì)于第n個(gè)特征參數(shù)的重要判斷標(biāo)度值。
由表1 的特征參數(shù)判斷標(biāo)度值得判斷矩陣為:
為了確保最終計(jì)算結(jié)果的準(zhǔn)確性,需要進(jìn)一步構(gòu)建最優(yōu)傳遞矩陣,如果判斷矩陣滿足下式,則判斷矩陣為一致性矩陣:
構(gòu)建一致性矩陣:
通過計(jì)算一致性矩陣C每行元素的乘積:
最終通過計(jì)算每個(gè)乘積的n次方根,并對(duì)結(jié)果做歸一化處理得到每個(gè)特征參數(shù)的權(quán)重值,最后計(jì)算結(jié)果見圖1。
圖1 層次分析法權(quán)重求取結(jié)果Fig.1 AHP weighting results
式中:n——特征參數(shù)的個(gè)數(shù)。
為確保各特征參數(shù)之間重要程度之間的協(xié)調(diào)性,需要對(duì)舉證做一致性檢驗(yàn),即可靠性論證,以免出現(xiàn)參數(shù)A比參數(shù)B重要,參數(shù)B比參數(shù)C重要,但參數(shù)C比參數(shù)A重要的矛盾。一致性指標(biāo)見式(14)。
式中:CR——致性指標(biāo);CI——致性系數(shù);RI——平均隨機(jī)一致性指標(biāo)。
其中平均隨機(jī)一致性指標(biāo)與矩陣階數(shù)n有關(guān),具體數(shù)值見表2。
表2 平均隨機(jī)一致性指標(biāo)RI 數(shù)值Table 2 Values of mean random consistency index RI
矩 陣 中 最 大 特 征 根λmax=18.6,CI=0.097,RI=1.61,CR=0.06 < 0.1,滿足矩陣一致性要求。
本研究選用歐幾里得距離法來計(jì)算屬于非時(shí)間序列的井漏特征參數(shù)。下面結(jié)合2 個(gè)案例具體研究如何使用歐幾里得法計(jì)算井漏案例在特征參數(shù)上的相似度[36]。
設(shè)A井漏案例中的所有非時(shí)間序列參數(shù)的取值組成的集合為:
設(shè)B井漏案例中的所有非時(shí)間序列參數(shù)的取值組成的集合為:
式中:Aj、Bj——2 個(gè)井漏案例的第j個(gè)特征屬性的取值;n——井漏案例的非時(shí)間序列參數(shù)的總個(gè)數(shù)。
計(jì)算相似度之前,需要將鉆井作業(yè)中采集到的數(shù)據(jù)進(jìn)行預(yù)處理,消除數(shù)據(jù)量綱或數(shù)據(jù)數(shù)值過大對(duì)計(jì)算造成的不良影響。以地層壓力為例,本文利用歸一化算法和歐幾里得法計(jì)算2 個(gè)井漏案例在鉆井液密度上的相似度,見式(17):
式中:max——地層壓力特征屬性的最大取值;min——地層壓力特征屬性的最小取值
在計(jì)算2 個(gè)案例某一特征的相似度之后,要計(jì)算2 個(gè)案例的所有特征的相似度,并且根據(jù)層次分析法求取的每個(gè)特征參數(shù)的權(quán)重進(jìn)行求和,計(jì)算出2 個(gè)案例的整體相似度,見式(18):
式中:S(a)——井漏案例在所有特征參數(shù)上的相似度 ;ωi—— 第i個(gè) 特 征 參 數(shù) 所 具 有 的 權(quán) 重 ;sim(Ai,Bi)——井漏案例在第i個(gè)特征參數(shù)上的相似度。
本研究采用動(dòng)態(tài)彎曲算法中的LB_Keogh 算法[37]進(jìn)行時(shí)間序列的相似度計(jì)算,在相似度計(jì)算之前給時(shí)間序列Q設(shè)施加一個(gè)邊界約束,分別為U和L。使得時(shí)間序列Q被U和L包裹在其中,由此設(shè)置時(shí)間序列U和L滿足下式:
式中:r≥1。
對(duì)于任意的U、L和Q都滿足下式:
定義了U和L之后,使用它們來定義一個(gè)下界度量:
則時(shí)間序列Q和C之間的相似度為:
2 個(gè)案例之間的相似度為所有井漏特征參數(shù)乘以權(quán)重再求和,見式(24):
以同在珍珠沖層位發(fā)生小漏的川6B1 和川6B1井為例,以鉆井液池總體積特征參數(shù)為例說明此時(shí)間序列檢索模型的應(yīng)用。川6B1 和川6B2 井發(fā)生井漏時(shí)鉆井液池總體積參數(shù)數(shù)據(jù)及其歸一化計(jì)算見表3。
表3 川6B1 與川6B2 井井漏特征參數(shù)Table 3 Characteristic parameters of lost circulation in Chuan-6B1 and Chuan-6B2 wells
定義川6B1 井的歸一化數(shù)據(jù)為時(shí)間序列Q,川6B2 井的歸一化數(shù)據(jù)為時(shí)間序列C。則根據(jù)上述公式得:
由于發(fā)生井漏的2 口井漏案例為同一區(qū)塊且位于同一層位的2 個(gè)案例,因此在鉆井液池總體積參數(shù)上的相似度很大,其他參數(shù)的相似度計(jì)算與上文計(jì)算步驟類似,再此不一一贅述。通過此實(shí)例說明LB_Keogh 算法在對(duì)時(shí)間序列相似度求取上的可靠性。
對(duì)非時(shí)間序列和時(shí)間序列分別進(jìn)行相似度計(jì)算后,設(shè)置非時(shí)間序列的相似度在案例整體相似度中所占權(quán)重為0.4,時(shí)間序列的相似度在案例整體相似度中所占權(quán)重為0.6,得到整體權(quán)重的相似度計(jì)算公式:
式中:S(a)——非時(shí)間序列的相似度;S(b)——時(shí)間序列的相似度。
通過案例相似度的計(jì)算,可以根據(jù)相似度進(jìn)行井間的匹配,對(duì)相似度設(shè)定某一閾值,只有相似度大于這一閾值的案例井才能被調(diào)出,其防漏堵漏措施能夠應(yīng)用于新案例井。
(1)本文通過分析,論證了梯度提升決策樹算法在預(yù)測模型上的可行性,采用案例推理方法建立了井漏診斷模型,在預(yù)測出新井某一深度的漏失情況后,可使用診斷模型計(jì)算相似度,快速檢索與新井最相似的案例井,現(xiàn)場工作人員可參考案例井的防漏堵漏措施,提前準(zhǔn)備處理方案。
(2)在井漏診斷模型中,使用層次分析法確定井漏特征參數(shù)權(quán)重,使用歐幾里得距離法和LB_Keogh 動(dòng)態(tài)彎曲算法對(duì)案例相似度進(jìn)行計(jì)算,并驗(yàn)證了相似度算法的可靠性。