李 琪, 屈峰濤*, 何璟彬, 王 勇,解 聰, 王六鵬
(1.西安石油大學(xué)石油工程學(xué)院,西安 710065;2.川慶鉆探工程有限公司長(zhǎng)慶鉆井總公司,西安 710021;3.中石油長(zhǎng)慶油田分公司質(zhì)量安全環(huán)保部,西安 710018)
隨著地質(zhì)工程一體化鉆井技術(shù)研究與發(fā)展,早期基于單因素分析獲得的鉆速方程很難滿足現(xiàn)場(chǎng)海量實(shí)鉆數(shù)據(jù)的應(yīng)用需求,嚴(yán)重影響地質(zhì)工程一體化安全高效鉆井方案的調(diào)整和優(yōu)化,亟待建立新的鉆速方程[1]。近年來(lái),隨著將大數(shù)據(jù)、機(jī)器學(xué)習(xí)等信息領(lǐng)域新技術(shù)應(yīng)用于石油行業(yè),綜合多因素的智能鉆速方程越來(lái)越受到中外學(xué)者的關(guān)注[2-3]。Ahmed等[4]分析人工神經(jīng)網(wǎng)絡(luò)、極限學(xué)習(xí)機(jī)、支持向量回歸機(jī)等模型的預(yù)測(cè)精度,驗(yàn)證了智能算法在鉆速預(yù)測(cè)的可行性。景寧等[5]提出了一種基于層析分析法與神經(jīng)網(wǎng)絡(luò)相組合的智能模型,利用巖石抗壓強(qiáng)度、鉆頭尺寸、鉆進(jìn)參數(shù)、鉆井液密度實(shí)現(xiàn)鉆速預(yù)測(cè),預(yù)測(cè)誤差在10%以內(nèi)。Amer等[6]建立了以人工神經(jīng)網(wǎng)絡(luò)為基礎(chǔ)的機(jī)械鉆速預(yù)測(cè)模型,該模型以巖性變化、鉆井參數(shù)和鉆頭數(shù)據(jù)為輸入?yún)?shù),預(yù)測(cè)結(jié)果準(zhǔn)確率在88%~90%。趙穎等[7]建立了一種基于極限學(xué)習(xí)機(jī)回歸算法的機(jī)械鉆速預(yù)測(cè)模型,預(yù)測(cè)結(jié)果準(zhǔn)確率達(dá)90%以上。
雖然目前已經(jīng)建立了多種機(jī)械鉆速智能預(yù)測(cè)模型,但是單一智能算法很容易陷入局部最優(yōu),且預(yù)測(cè)結(jié)果穩(wěn)定性差,因此,需要開(kāi)發(fā)基于混合算法的機(jī)械鉆速預(yù)測(cè)模型。在鉆井工程實(shí)測(cè)數(shù)據(jù)的基礎(chǔ)上,建立了粒子群優(yōu)化算法與反向傳播(back propagation,BP)神經(jīng)網(wǎng)絡(luò)相結(jié)合的鉆井機(jī)械鉆速預(yù)測(cè)新模型,該模型以機(jī)械鉆速為目標(biāo),轉(zhuǎn)速、鉆壓、鉆井液密度、深度、井徑等為輸入?yún)?shù)。結(jié)果表明,粒子群優(yōu)化(particle swarm optimization,PSO)算法優(yōu)化的BP神經(jīng)網(wǎng)路相較于其他算法優(yōu)化的BP神經(jīng)網(wǎng)絡(luò)具有更高的預(yù)測(cè)精度。
將現(xiàn)場(chǎng)實(shí)測(cè)數(shù)據(jù)與BP神經(jīng)網(wǎng)絡(luò)結(jié)合得到圖1所示的BP神經(jīng)網(wǎng)絡(luò)的拓?fù)浣Y(jié)構(gòu),其輸入層的輸入信號(hào)主要分為三類(lèi):機(jī)械參數(shù)、鉆井液參數(shù)和水力參數(shù);輸出層的輸出信號(hào)為機(jī)械鉆速,將模型預(yù)測(cè)的機(jī)械鉆速與實(shí)測(cè)機(jī)械鉆速進(jìn)行比較,通過(guò)誤差反傳調(diào)整隱含層的權(quán)值和閾值,最終建立高精度的機(jī)械鉆速預(yù)測(cè)模型[8]。
圖1 BP神經(jīng)網(wǎng)絡(luò)的拓?fù)浣Y(jié)構(gòu)
粒子群優(yōu)化算法是一種具有隨機(jī)性的搜索算法,是群集智能的一種。粒子群優(yōu)化算法用粒子來(lái)模擬鳥(niǎo)類(lèi)個(gè)體,每個(gè)粒子可視為D維搜索空間的一個(gè)搜索個(gè)體,粒子的當(dāng)前位置即為優(yōu)化對(duì)應(yīng)的一個(gè)候選解,粒子的飛行過(guò)程即為該個(gè)體的搜索過(guò)程。粒子的飛行速度根據(jù)粒子歷史最優(yōu)位置Pbest和種群最優(yōu)位置Gbest進(jìn)行調(diào)整,不斷迭代,直至得到滿足終止條件的最優(yōu)解[9-10]。
假設(shè)在一個(gè)D維空間,有n個(gè)粒子的種群規(guī)模,其中第i個(gè)粒子在D搜維索空間中的位置可表示為Xi=[xi1,xi2,…,xiD]T,第i個(gè)粒子的速度為Vi=[vi1,vi2,…,viD]T,第i個(gè)粒子的個(gè)體最優(yōu)值為Pi=[pi1,pi2,…,piD]T,D維空間所有粒子的全局最優(yōu)為Pg=[pg1,pg2,…,pgD]T。每個(gè)粒子根據(jù)全局最優(yōu)和個(gè)體最優(yōu)這兩個(gè)極值來(lái)更新自己的位置,更新公式為
(1)
(2)
式中:ω為慣性權(quán)重;d為粒子的維數(shù),取值為[1,D];i表示當(dāng)前為第i個(gè)粒子,取值為[1,n];k表示當(dāng)前的迭代次數(shù);Vid為粒子的速度;Xid為粒子的位置,C1、C2為學(xué)習(xí)因子;r1、r2為介于[0,1]之間的隨機(jī)數(shù)。
BP神經(jīng)網(wǎng)絡(luò)采用梯度下降法來(lái)實(shí)現(xiàn)在訓(xùn)練過(guò)程中的權(quán)值和閾值調(diào)整,直至收斂到某一全局最優(yōu)值,但由于初始權(quán)值和閾值一般通過(guò)隨機(jī)函數(shù)生成的,梯度下降法容易陷入局部最優(yōu),無(wú)法保重最終獲得的權(quán)值、閾值是誤差平面的全局最優(yōu)。很多研究表明[11-12],PSO算法避免了梯度下降法的缺點(diǎn),應(yīng)用PSO算法代替梯度下降法訓(xùn)練BP神經(jīng)網(wǎng)絡(luò)的權(quán)值、閾值,將極大地提升網(wǎng)絡(luò)性能,避免梯度下降法造成網(wǎng)絡(luò)陷入局部最優(yōu)。算法實(shí)現(xiàn)的流程如圖2所示。
圖2 基于PSO優(yōu)化的BP神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)模型流程圖
PSO算法優(yōu)化BP神經(jīng)網(wǎng)絡(luò)的算法步驟如下。
步驟1確定BP神經(jīng)網(wǎng)絡(luò)的拓?fù)浣Y(jié)構(gòu)。
步驟2初始化參數(shù),包括BP神經(jīng)網(wǎng)絡(luò)的初始權(quán)值、閾值,PSO算法的粒子種群,迭代次數(shù),慣性權(quán)重,加速度因子以及位置和速度的取值限定區(qū)間。
步驟3依據(jù)適應(yīng)度函數(shù),對(duì)各粒子進(jìn)行適應(yīng)度檢測(cè),尋找Pbest、Gbest。
步驟4根據(jù)步驟3計(jì)算結(jié)果更新各粒子的位置和速度。
步驟5判斷算法是否達(dá)到最大迭代次數(shù)或預(yù)設(shè)誤差標(biāo)準(zhǔn),滿足要求則停止迭代生成最優(yōu)解,否則迭代次數(shù)加1返回步驟3繼續(xù)迭代。
步驟6將步驟5得到最優(yōu)解賦給BP神經(jīng)網(wǎng)絡(luò),建立新的BP神經(jīng)網(wǎng)絡(luò)。
步驟7輸入測(cè)試集數(shù)據(jù),對(duì)新的BP神經(jīng)網(wǎng)絡(luò)進(jìn)行測(cè)試,若預(yù)測(cè)結(jié)果滿足預(yù)設(shè)精度條件,則此前工作成功完成,獲得合適的模型;否則返回步驟2,繼續(xù)優(yōu)化模型,直至滿足條件,獲得鉆井機(jī)械鉆速預(yù)測(cè)模型。
影響鉆井機(jī)械鉆速的因素主要分為不可控因素和可控因素。不可控因素主要表征地層性質(zhì)及巖石物性,如深度、巖石類(lèi)型、巖石可鉆性、泥質(zhì)含量、孔隙體積等,這些因素一般在鉆井設(shè)計(jì)初期已經(jīng)確定??煽匾蛩刂饕譃闄C(jī)械參數(shù)、鉆井液參數(shù)及水力參數(shù)三大類(lèi),機(jī)械參數(shù)通過(guò)影響鉆頭對(duì)巖石的研磨、剪切過(guò)程來(lái)影響機(jī)械鉆速,主包含鉆壓、轉(zhuǎn)速、鉆頭類(lèi)型、立管壓力等;鉆井液參數(shù)通過(guò)影響循環(huán)壓力損耗和井底凈化等來(lái)間接影響機(jī)械鉆速,主要有鉆井液體系、密度、初切力、流變參數(shù)等,鉆井液性能和流變參數(shù)[13-14]。水力參數(shù)通過(guò)保持井底凈化從而影響機(jī)械鉆速主要包含水射流速度、射流功率、鉆頭壓降等[15]。
在井場(chǎng)中通過(guò)電纜傳輸測(cè)井、錄井、定向等數(shù)據(jù)信息,由于數(shù)字電路中存在的高頻數(shù)字電平,使信號(hào)中出現(xiàn)許多尖峰或突變的噪聲,為了復(fù)原數(shù)據(jù)中攜帶有用信號(hào),必須去除疊加的噪聲和干擾成分[16]。小波濾波是一種在低頻部分具有較高的頻率分辨率和較低的時(shí)間分辨率,在高頻部分具有較高的時(shí)間分辨率和較低的頻率分辨率,能夠有效地去除測(cè)量設(shè)備中產(chǎn)生的白噪聲。小波濾波將分析信號(hào) 做小波變換為
(3)
式(3)中:a為尺度因子且a>0,實(shí)現(xiàn)對(duì)基本小波φ(t)進(jìn)行伸縮變換;τ為平移因子,實(shí)現(xiàn)對(duì)基本小波在時(shí)間軸上的平移變換。
應(yīng)用小波濾波方法對(duì)現(xiàn)場(chǎng)實(shí)測(cè)數(shù)據(jù)進(jìn)行處理,可以有效地實(shí)現(xiàn)數(shù)據(jù)濾波,達(dá)到信噪分離的目的。
現(xiàn)場(chǎng)獲得鉆井?dāng)?shù)據(jù)種類(lèi)繁多,數(shù)據(jù)間多為非線性相關(guān),常用的皮爾森系數(shù)無(wú)法有效的表征非線性相關(guān)變量間的特征,引入互信息實(shí)現(xiàn)對(duì)實(shí)測(cè)數(shù)據(jù)間的關(guān)聯(lián)關(guān)系量化統(tǒng)計(jì)[17]。當(dāng)(X,Y)?p(x,y),則變量X、Y之間的互信息定義為
MI(X;Y)=H(X)+H(Y)-H(X,Y)
(4)
式(4)中:H(X,Y)是變量X、Y的聯(lián)合熵;H(X)、H(Y)分別為變量X、Y的無(wú)條件熵。
通過(guò)互信息關(guān)聯(lián)分析,優(yōu)選機(jī)械鉆速預(yù)測(cè)模型的輸入?yún)?shù),降低智能鉆速預(yù)測(cè)模型冗余,提高預(yù)測(cè)精度。
PSO-BP機(jī)械鉆速預(yù)測(cè)模型框架結(jié)構(gòu),如圖3所示。PSO-BP機(jī)械鉆速預(yù)測(cè)模型建模過(guò)程分為五個(gè)部分,其中第一部分、第二部分為數(shù)據(jù)預(yù)處理,第一部分進(jìn)行現(xiàn)場(chǎng)實(shí)測(cè)數(shù)據(jù)的收集與整理以及模型訓(xùn)練集、測(cè)試集分組,第二部分完成對(duì)數(shù)據(jù)的降噪以及參數(shù)相關(guān)性分析,篩選出鉆速預(yù)測(cè)模型的輸入?yún)?shù);第三部分、第四部分為模型建立,第三部分為BP神經(jīng)網(wǎng)絡(luò)初始化及粒子群尋優(yōu),完成模型BP神經(jīng)網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu)的確定,第四部分為神經(jīng)網(wǎng)絡(luò)訓(xùn)練過(guò)程,將相關(guān)性分析后篩選的參數(shù)作為模型輸入變量,以機(jī)械鉆速作為輸出變量進(jìn)行模型訓(xùn)練;第五部分為誤差分析與模型評(píng)價(jià),若預(yù)測(cè)誤差達(dá)到精度要求則輸出模型,反之調(diào)整BP神經(jīng)網(wǎng)絡(luò)及粒子群優(yōu)化算法初始參數(shù),重復(fù)迭代直至達(dá)到精度要求,輸出模型。
圖3 PSO-BP機(jī)械鉆速預(yù)測(cè)模型框架結(jié)構(gòu)
本次實(shí)例數(shù)據(jù)來(lái)自現(xiàn)場(chǎng)特定區(qū)塊下的某定向井井史數(shù)據(jù),該井為生產(chǎn)井,設(shè)計(jì)井深4 200 m,造斜點(diǎn)位于井深1 850 m。對(duì)該井完鉆井史中的鉆井液、鉆時(shí)、井徑記錄等數(shù)據(jù)進(jìn)行分析,篩選井深、機(jī)械鉆速、轉(zhuǎn)速、鉆壓、轉(zhuǎn)速、流量、鉆井液密度、井徑及鉆頭水功率等8組數(shù)據(jù)。表1列舉了部分?jǐn)?shù)據(jù)資料。
表1 部分鉆井參數(shù)
現(xiàn)場(chǎng)鉆進(jìn)環(huán)境復(fù)雜,存在各種干擾,導(dǎo)致測(cè)量?jī)x器接收到的數(shù)據(jù)信號(hào)存在一定的白噪聲干擾。應(yīng)用小波濾波方法對(duì)實(shí)測(cè)數(shù)據(jù)進(jìn)行降噪,并提取第2層的分解結(jié)果作為輸出結(jié)果,如圖4所示。
圖4 小波降噪處理效果對(duì)比
在圖4中,原始數(shù)據(jù)曲線包含許多尖峰和突變,應(yīng)用小波濾波處理后的數(shù)據(jù)曲線較原始數(shù)據(jù)光滑且曲線輪廓清晰??梢?jiàn),小波濾波可以有效的去除了原始信號(hào)中的噪聲干擾,且降噪處理后依然保持原始數(shù)據(jù)的變化特性。
將濾波后的數(shù)據(jù)進(jìn)行互信息關(guān)聯(lián)分析,得到如圖5所示的鉆井參數(shù)互信息關(guān)聯(lián)分析。
圖5 鉆井參數(shù)互信息關(guān)聯(lián)分析
由圖5可見(jiàn),鉆速(機(jī)械鉆速)與其他各鉆井參數(shù)的相關(guān)性大于1/m(m為輸入模型的參數(shù)個(gè)數(shù),此處m=8),所以機(jī)械鉆速的大小受到這些參數(shù)的影響。其中,機(jī)械鉆速與轉(zhuǎn)速、鉆壓、密度(鉆井液密度)、深度、井徑等鉆井參數(shù)相關(guān)性強(qiáng),與流量和水功率(鉆頭水功率)的互信息值較低,因此,篩選轉(zhuǎn)速、鉆壓、鉆井液密度、井深、井徑等五個(gè)參數(shù)篩選作為機(jī)械鉆速預(yù)測(cè)模型的輸入變量。
為了驗(yàn)證PSO-BP神經(jīng)網(wǎng)絡(luò)模型較其他優(yōu)化后的智能模型是否具有優(yōu)越性,選取標(biāo)準(zhǔn)BP神經(jīng)網(wǎng)絡(luò)模型、BAS-BP神經(jīng)網(wǎng)絡(luò)模型、GA-BP神經(jīng)網(wǎng)絡(luò)模型進(jìn)行對(duì)比分析,實(shí)驗(yàn)結(jié)果如圖6所示。
圖6 測(cè)試集預(yù)測(cè)結(jié)果對(duì)比
選取均方根(RMSE)、平均絕對(duì)百分比誤差(MAPE)、決定系數(shù)(R2)作為評(píng)價(jià)指標(biāo)對(duì)模型性能進(jìn)行評(píng)價(jià)[18],評(píng)價(jià)結(jié)果如表2所示。
由圖6可見(jiàn),PSO-BP模型的預(yù)測(cè)值與實(shí)測(cè)數(shù)據(jù)的真實(shí)值曲線走勢(shì)一致,且在表2中,PSO-BP模型的各項(xiàng)誤差分析結(jié)果均優(yōu)于其他三種智能模型,由此可見(jiàn),本文提出的PSO-BP機(jī)械鉆速預(yù)測(cè)模型預(yù)測(cè)精度高。
表2 不同模型評(píng)價(jià)指標(biāo)對(duì)比
將PSO-BP機(jī)械鉆速預(yù)測(cè)模型中各輸入?yún)?shù)與模型輸出的機(jī)械鉆速進(jìn)行高斯擬合,擬合結(jié)果如圖7所示。
圖7 PSO-BP機(jī)械鉆速預(yù)測(cè)模型單因素影響規(guī)律分析
在圖7(a)中機(jī)械鉆速隨著轉(zhuǎn)速增加持續(xù)增大。在圖7(b)中機(jī)械鉆速隨著鉆壓的增大先增加后達(dá)到最大機(jī)械鉆速后降低,在實(shí)際鉆井過(guò)程中達(dá)到最佳鉆壓后,鉆壓繼續(xù)增大,鉆頭將陷入壓裂后底部巖層中造成泥包,機(jī)械鉆速隨之降低[19]。圖7(c)是鉆井液參數(shù)與機(jī)械鉆速的關(guān)系,鉆井液在循環(huán)過(guò)程中平衡地層壓力、清潔井底和攜帶巖屑,但鉆井液密度越大,巖屑的壓持效應(yīng)越強(qiáng),鉆頭重復(fù)切削井底巖層,機(jī)械鉆速越低[20]。在圖7(d)中機(jī)械鉆速隨著地層埋藏深度的增大而降低,因?yàn)榫钤酱髱r石強(qiáng)度越大,越難被破碎。在圖7(e)中隨著井徑的增大,鉆頭所需的破巖能量也隨之增加,在能量補(bǔ)充不足時(shí)機(jī)械鉆速隨之降低。
提出基于PSO算法優(yōu)化BP神經(jīng)網(wǎng)絡(luò)機(jī)械鉆速智能預(yù)測(cè)模型。通過(guò)互信息分析篩選轉(zhuǎn)速、鉆壓、鉆井液密度、深度、井徑等五個(gè)參數(shù)作為自變量建立機(jī)械鉆速預(yù)測(cè)模型,該P(yáng)SO-BP機(jī)械鉆速預(yù)測(cè)模型相較其他模型具有更高的預(yù)測(cè)精度。將混合算法應(yīng)用于機(jī)械鉆速預(yù)測(cè)為后續(xù)的工程應(yīng)用提供指導(dǎo)。探討了機(jī)械鉆速的智能預(yù)測(cè),隨著智能油田的建設(shè),應(yīng)智能鉆速預(yù)測(cè)與智能鉆井與智慧油田融合研究,為節(jié)約鉆井成本、提高鉆井效率提供有力的支持。