祝兆鵬 張瑞 宋先知, 李根生, 郭勇 劉慕臣 周德濤
(1. 油氣資源與探測(cè)國(guó)家重點(diǎn)實(shí)驗(yàn)室(中國(guó)石油大學(xué)(北京)) 2.中國(guó)石油大學(xué)(北京)人工智能學(xué)院 3. 中國(guó)石油新疆油田分公司工程技術(shù)研究院 )
井底壓力是鉆井方案設(shè)計(jì)和鉆井參數(shù)調(diào)控中的重要參數(shù)[1]。準(zhǔn)確計(jì)算井底壓力為實(shí)現(xiàn)安全高效鉆井提供了保障。然而,受排量、鉆速、軌跡、氣侵等復(fù)雜因素影響,井底壓力計(jì)算是一個(gè)多參數(shù)、波動(dòng)明顯的復(fù)雜過(guò)程??紤]到傳統(tǒng)經(jīng)驗(yàn)公式誤差大,數(shù)值求解方法依賴假設(shè)條件、效率低,安裝隨鉆測(cè)壓(PWD)傳感器成本高、無(wú)效失真數(shù)據(jù)多等局限,難以達(dá)到現(xiàn)場(chǎng)工程應(yīng)用高精度、高效率的需求,亟需提出一種新的解決方案,完善現(xiàn)有的井底壓力預(yù)測(cè)方法。
近年來(lái),人工智能在解決多參數(shù)、非線性的復(fù)雜工程問(wèn)題方面表現(xiàn)出強(qiáng)大的優(yōu)勢(shì),引領(lǐng)了新一代變革性鉆井技術(shù)[2],實(shí)現(xiàn)了包括井下工況識(shí)別[3]、風(fēng)險(xiǎn)預(yù)警診斷[4-7]、機(jī)械鉆速預(yù)測(cè)[8]等多方面的研究。國(guó)內(nèi)外學(xué)者開始采用機(jī)器學(xué)習(xí)方法預(yù)測(cè)井底壓力,在精度和效率方面得到了顯著提升。D.OPOKU等[9]使用油井的生產(chǎn)數(shù)據(jù)(油、氣、水流量和井口壓力)作為輸入,基于拉丁超立方抽樣的算法從每個(gè)參數(shù)中隨機(jī)選擇樣本,建立流動(dòng)參數(shù)與井底壓力之間的經(jīng)驗(yàn)關(guān)系,最終選擇誤差最小的相關(guān)系數(shù)。多個(gè)學(xué)者[1,10-16]嘗試建立不同結(jié)構(gòu)的人工神經(jīng)網(wǎng)絡(luò)(ANN)以實(shí)現(xiàn)井底壓力的精準(zhǔn)計(jì)算。N.A.SAMI等[1]運(yùn)用隨機(jī)森林、K近鄰、神經(jīng)網(wǎng)絡(luò)3種機(jī)器學(xué)習(xí)算法,基于地面的監(jiān)測(cè)數(shù)據(jù),實(shí)現(xiàn)對(duì)生產(chǎn)井的井底流動(dòng)壓力的精確預(yù)測(cè)。E.E.OKORO等[17]利用隨鉆測(cè)量裝置收集了6口井下隨鉆壓力數(shù)據(jù),分別基于極端隨機(jī)樹和前饋神經(jīng)網(wǎng)絡(luò)算法建立了2個(gè)高精度井底壓力預(yù)測(cè)模型。F.H.AL SHEHRI等[18]采用ANN、功能神經(jīng)網(wǎng)絡(luò)和長(zhǎng)短時(shí)記憶網(wǎng)絡(luò)(LSTM)3種模型對(duì)壓裂井井底壓力進(jìn)行預(yù)測(cè)。為了進(jìn)一步提高模型的預(yù)測(cè)精度,多個(gè)研究者開始使用混合網(wǎng)絡(luò)模型。ZHU Z.P.等[19]建立了卷積神經(jīng)網(wǎng)絡(luò)(CNN)和LSTM的CNN-LSTM串聯(lián)網(wǎng)絡(luò)模型,證明了混合網(wǎng)絡(luò)相比單一網(wǎng)絡(luò)處理井底壓力多元序列的優(yōu)越性。Z.TARIQ等[20]基于生產(chǎn)井的地面數(shù)據(jù),實(shí)現(xiàn)了粒子群優(yōu)化算法與神經(jīng)網(wǎng)絡(luò)相結(jié)合的PSO-ANN模型,模型平均絕對(duì)百分比誤差小于2.1%,優(yōu)于傳統(tǒng)的機(jī)理經(jīng)驗(yàn)?zāi)P秃虯NN模型。A.M.NAIT 等[21]提出一種基于支持向量回歸和螢火蟲優(yōu)化算法結(jié)合的預(yù)測(cè)模型,實(shí)現(xiàn)了多相流垂直井下的井底壓力預(yù)測(cè),結(jié)果證明了模型的高魯棒性和準(zhǔn)確性。LIANG H.B.等[22]通過(guò)遺傳算法優(yōu)化了BP神經(jīng)網(wǎng)絡(luò)的預(yù)測(cè)精度和收斂速度,為井底壓力的實(shí)時(shí)預(yù)測(cè)和控制提供參考。
然而,考慮到井底壓力具有較強(qiáng)的非線性、波動(dòng)性和時(shí)序性:一方面,高溫高壓等復(fù)雜井段數(shù)據(jù)難以實(shí)時(shí)采集,使得數(shù)據(jù)有效信息少、分布空間受限,難以對(duì)復(fù)雜井段ECD(鉆井液循環(huán)當(dāng)量密度)精準(zhǔn)計(jì)算;另一方面,由于數(shù)據(jù)驅(qū)動(dòng)模型對(duì)數(shù)據(jù)的敏感特性,現(xiàn)有模型針對(duì)不同井段之間的遷移能力仍待提升。
因此,針對(duì)數(shù)據(jù)有效信息少、模型應(yīng)用時(shí)效性差的難題,筆者提出了一種基于數(shù)據(jù)拓展和增量更新實(shí)時(shí)預(yù)測(cè)井底壓力的方法。通過(guò)構(gòu)建生成對(duì)抗網(wǎng)絡(luò)(GAN)生成特定井段區(qū)間數(shù)據(jù),增強(qiáng)預(yù)測(cè)模型在不同數(shù)據(jù)變化下的穩(wěn)定性;利用增量數(shù)據(jù)流更新LSTM階段預(yù)測(cè)模型,最終集成全井段預(yù)測(cè)模型;利用混合注意力機(jī)制進(jìn)行井底壓力智能預(yù)測(cè)模型的可解釋分析等3個(gè)步驟,實(shí)現(xiàn)井底壓力的實(shí)時(shí)精準(zhǔn)預(yù)測(cè)。研究結(jié)果可為實(shí)現(xiàn)井底壓力高效精準(zhǔn)預(yù)測(cè)提供有效技術(shù)支撐,為現(xiàn)場(chǎng)工程師高效科學(xué)采取控壓措施提供指導(dǎo)性意見(jiàn)。
實(shí)現(xiàn)井底壓力智能預(yù)測(cè)的整體工作流程如圖1所示。工作流程包括:隨鉆測(cè)量數(shù)據(jù)預(yù)處理及特征工程;利用GAN網(wǎng)絡(luò)擴(kuò)充得到不同井段區(qū)間的數(shù)據(jù)集;基于現(xiàn)場(chǎng)實(shí)時(shí)采集的增量數(shù)據(jù)更新不同井段區(qū)間的預(yù)測(cè)模型;根據(jù)預(yù)測(cè)誤差分配不同權(quán)重,集成全井段井底壓力預(yù)測(cè)模型;通過(guò)對(duì)LSTM預(yù)測(cè)模型引入混合注意力機(jī)制,進(jìn)行模型結(jié)構(gòu)和預(yù)測(cè)結(jié)果的可解釋性分析。
圖1 井底壓力智能預(yù)測(cè)方法工作流程Fig.1 Workflow of the intelligent BHP prediction method
本試驗(yàn)初始數(shù)據(jù)是新疆某口控壓鉆井的20萬(wàn)組隨鉆數(shù)據(jù),其包括常規(guī)錄井?dāng)?shù)據(jù)、PWD數(shù)據(jù)、鉆井液數(shù)據(jù)等,涉及最大井深6 705 m,最大垂深4 942 m。
利用距離相關(guān)系數(shù)作為隨鉆數(shù)據(jù)相關(guān)性度量準(zhǔn)則。系數(shù)越大,則說(shuō)明2個(gè)變量之間的相關(guān)性越強(qiáng)。計(jì)算式為:
(1)
其次,考慮到鉆井液性能參數(shù)對(duì)井底壓力的重要影響,且避免相似度較高的多個(gè)參數(shù)同時(shí)引入擴(kuò)大噪聲,影響模型的穩(wěn)定性,本文選擇將漏斗黏度、含砂量、鉆井液密度3個(gè)特征補(bǔ)充至原數(shù)據(jù)集。通過(guò)計(jì)算距離相關(guān)系數(shù),最后篩選得到相關(guān)性系數(shù)大于0.5的輸入特征變量共12個(gè),分別為定點(diǎn)垂深、入口流量、回壓泵流量、鉆頭深度、轉(zhuǎn)速、立壓、總池體積、出口流量、出口密度、鉆井液密度、含砂量和漏斗黏度,隨鉆測(cè)壓數(shù)據(jù)共8萬(wàn)組。
將處理完成的數(shù)據(jù)依據(jù)井深排序劃分,得到60 000組淺部測(cè)壓點(diǎn)作為訓(xùn)練集,20 000組深部測(cè)壓點(diǎn)作為測(cè)試集。同時(shí),進(jìn)行數(shù)據(jù)的歸一化有利于模型加快搜索尋找最優(yōu)解。本研究采用max-min歸一化,使特征變量映射到(0,1)之間:
(2)
式中:x表示某一特征值;xmin表示某一特征的最小值;xmax表示某一特征的最大值。
由于鉆井現(xiàn)場(chǎng)采集的隨鉆測(cè)壓數(shù)據(jù)具有一定的時(shí)序相關(guān)性,即認(rèn)為上部井底壓力會(huì)對(duì)下部產(chǎn)生一定影響,可將井底壓力的預(yù)測(cè)問(wèn)題視作為多變量的序列預(yù)測(cè)問(wèn)題?;瑒?dòng)窗口是處理序列預(yù)測(cè)問(wèn)題的重要方法之一[23]。使用固定窗口長(zhǎng)度h依次滑動(dòng)長(zhǎng)度為n的隨鉆數(shù)據(jù)序列,得到新的多元序列輸入樣本X=[xn-h,…,xt,…,x1]T和標(biāo)簽樣本Y=[yn-h,…,yt,…,y1]T。
其中:xt=[定點(diǎn)垂深t-1,…,t-h,入口流量t-1,…,t-h,回壓泵流量t-1,…,t-h,…,漏斗黏度t-1,…,t-h]。
針對(duì)復(fù)雜井段有效數(shù)據(jù)少、不同井段數(shù)據(jù)波動(dòng)性強(qiáng)的特點(diǎn),本部分利用GAN網(wǎng)絡(luò)生成不同規(guī)模的訓(xùn)練數(shù)據(jù),擴(kuò)充原始數(shù)據(jù)集,最后基于LSTM構(gòu)建井底壓力預(yù)測(cè)模型,分析不同數(shù)據(jù)規(guī)模下的試驗(yàn)預(yù)測(cè)結(jié)果。
GAN是一種無(wú)監(jiān)督學(xué)習(xí)模型,現(xiàn)廣泛應(yīng)用于生成新數(shù)據(jù)樣本[24]。GAN 的網(wǎng)絡(luò)結(jié)構(gòu)主要由一個(gè)生成器神經(jīng)網(wǎng)絡(luò)和一個(gè)判別器神經(jīng)網(wǎng)絡(luò)組成(見(jiàn)圖2)。
長(zhǎng)短時(shí)記憶神經(jīng)網(wǎng)絡(luò)是一種改進(jìn)的循環(huán)神經(jīng)網(wǎng)絡(luò),最初由Hochreiter和Schmidhuber[25]提出改進(jìn),因其獨(dú)有的門控單元和隱藏狀態(tài),善于捕捉序列數(shù)據(jù)的前后依賴關(guān)系,至今已在多個(gè)序列預(yù)測(cè)場(chǎng)景[26-29]得到應(yīng)用。LSTM的循環(huán)單元由3個(gè)控制門組成:輸入門、輸出門和遺忘門。它們分別決定了當(dāng)前時(shí)刻所需保留的信息、下一時(shí)刻輸出的信息和被遺忘的信息,從而改變當(dāng)前的單元狀態(tài)。
圖2 GAN模型結(jié)構(gòu)示意圖Fig.2 Schematic structure of the GAN model
本部分利用網(wǎng)格搜索法對(duì)模型結(jié)構(gòu)中的隱藏層神經(jīng)元數(shù)量、丟棄概率、批量數(shù)、學(xué)習(xí)率等超參數(shù)進(jìn)行尋優(yōu)。試驗(yàn)發(fā)現(xiàn)當(dāng)LSTM層數(shù)超過(guò)2層時(shí),模型的預(yù)測(cè)精度開始明顯下降,訓(xùn)練效率減慢,因此本研究選擇LSTM層數(shù)為1層。最優(yōu)超參數(shù)組合為:批量訓(xùn)練數(shù)600,學(xué)習(xí)率0.001,優(yōu)化器選用Adam,激活函數(shù)為Rule,LSTM層神經(jīng)元個(gè)數(shù)32,全連接層神經(jīng)元個(gè)數(shù)8,丟棄神經(jīng)元概率0.2。
圖3 不同數(shù)據(jù)規(guī)模預(yù)測(cè)結(jié)果對(duì)比Fig.3 Prediction results in different data scales
為了全面評(píng)價(jià)不同數(shù)據(jù)分布空間對(duì)模型預(yù)測(cè)結(jié)果的影響,本文分別利用GAN生成不同規(guī)模大小的新數(shù)據(jù)序列,進(jìn)行如下5次試驗(yàn):①使用60 000組原始數(shù)據(jù)集;②在原始數(shù)據(jù)集上增加GAN網(wǎng)絡(luò)生成的10 000組數(shù)據(jù);③在原始數(shù)據(jù)集上增加GAN網(wǎng)絡(luò)生成的15 000組數(shù)據(jù);④在原始數(shù)據(jù)集上增加GAN網(wǎng)絡(luò)生成的20 000組數(shù)據(jù);⑤在原始數(shù)據(jù)集上增加GAN網(wǎng)絡(luò)生成的25 000組數(shù)據(jù)。
試驗(yàn)評(píng)價(jià)指標(biāo)選用常用的誤差度量函數(shù):平均絕對(duì)百分比誤差(P)、均方根誤差(R)、平均絕對(duì)誤差(A)。同時(shí)本次試驗(yàn)在評(píng)價(jià)指標(biāo)上額外增加模型運(yùn)行時(shí)間,進(jìn)行模型的運(yùn)行效率對(duì)比。
(3)
(4)
(5)
式中:m為樣本的總數(shù)量;yi為真實(shí)的井底壓力值;ypre為預(yù)測(cè)的井底壓力值。
對(duì)比模型的預(yù)測(cè)結(jié)果(見(jiàn)圖3)可以發(fā)現(xiàn),未增加新數(shù)據(jù)訓(xùn)練的模型預(yù)測(cè)結(jié)果總體波動(dòng)性較強(qiáng);在井底壓力維持穩(wěn)定階段,如6 300~6 400 m井段,預(yù)測(cè)結(jié)果與實(shí)測(cè)值存在較大偏差。相比而言,增加10 000和15 000組數(shù)據(jù)的預(yù)測(cè)模型在精度和穩(wěn)定性上得到大幅提升,在壓力的穩(wěn)定階段和突變處皆有快速響應(yīng)性。其中增加10 000組數(shù)據(jù)的預(yù)測(cè)模型表現(xiàn)最優(yōu),P降低至0.043%,誤差相比原來(lái)減小50%,A和R也相應(yīng)降低。增加20 000和25 000組的模型誤差顯著上升(見(jiàn)圖4),僅表現(xiàn)出對(duì)井底壓力整體變化趨勢(shì)的預(yù)測(cè),未能有效分析局部壓力變化,即過(guò)多增加生成數(shù)據(jù)會(huì)對(duì)模型的預(yù)測(cè)精度起反向作用。分析認(rèn)為:①適量擴(kuò)充數(shù)據(jù)集彌補(bǔ)了原有數(shù)據(jù)表征信息能力的不足,使得不同井段的數(shù)據(jù)分布更均勻。②增加的10 000組生成數(shù)據(jù)已有足夠能力預(yù)測(cè)深層的井底壓力,多余數(shù)據(jù)的增加無(wú)法表征更多有效信息,造成數(shù)據(jù)冗余,削弱了局部刻畫壓力變化的能力,使其預(yù)測(cè)精度降低。
圖4 預(yù)測(cè)結(jié)果誤差曲線Fig.4 Errors of prediction results
通過(guò)可視化井深和井底壓力數(shù)據(jù)分布(見(jiàn)圖5)發(fā)現(xiàn),GAN網(wǎng)絡(luò)生成的數(shù)據(jù)有效擴(kuò)充了不同井段間的井底壓力。通過(guò)對(duì)比圖5a和圖5b,發(fā)現(xiàn)原有數(shù)據(jù)的井底壓力分布較稀疏,使模型在更深井段處無(wú)法預(yù)測(cè)未知信息,這也是現(xiàn)有智能模型泛化能力低的根本原因。增加了10 000組新數(shù)據(jù)后的壓力分布發(fā)生局部改變,使得模型在57.8~58.7 MPa的井底壓力預(yù)測(cè)范圍得到擴(kuò)充。結(jié)合圖3a和圖3b可知,在6 300~6 400 m井段區(qū)間,新數(shù)據(jù)增強(qiáng)了預(yù)測(cè)模型對(duì)井底壓力的表征能力,彌補(bǔ)了原有數(shù)據(jù)在該井段下的預(yù)測(cè)偏差。而增加15 000、20 000、25 000組數(shù)據(jù)后,井底壓力的信息在57.8~58.7 MPa范圍內(nèi)得到進(jìn)一步增強(qiáng),使得模型更加注重壓力的整體趨勢(shì)變化,削弱了刻畫局部壓力變化的能力。圖3d和圖3e說(shuō)明模型對(duì)于局部突變的壓力變化分析能力不足,最終降低了預(yù)測(cè)精度。因此,基于本文的研究條件,擴(kuò)充井段數(shù)據(jù)的15%~20%能夠有效提升模型的預(yù)測(cè)精度。
圖5 井深-井底壓力數(shù)據(jù)分布圖Fig.5 Data distribution of well depth-bottomhole pressure
為了充分利用鉆進(jìn)過(guò)程中的實(shí)時(shí)數(shù)據(jù)流,實(shí)現(xiàn)動(dòng)態(tài)更新井底壓力預(yù)測(cè)模型,本部分提出一種基于遷移學(xué)習(xí)和集成學(xué)習(xí)的實(shí)時(shí)預(yù)測(cè)方法,整體的模型預(yù)測(cè)流程如圖6所示。
圖6 實(shí)時(shí)增量更新的集成式LSTM模型預(yù)測(cè)流程Fig.6 Prediction workflow of the ensemble LSTM model with real-time incremental update
首先通過(guò)隨鉆測(cè)壓數(shù)據(jù)的歷史數(shù)據(jù)集D0訓(xùn)練得到子模型LSTM0;當(dāng)獲取增量數(shù)據(jù)ΔD1時(shí),凍結(jié)LSTM0層權(quán)重,同時(shí)訓(xùn)練新的LSTM1層;輸出信息的同時(shí)輸入共享層S1融合(見(jiàn)圖7),即融合了歷史數(shù)據(jù)信息和增量數(shù)據(jù)信息,得到當(dāng)前模型LSTM1。共享層加權(quán)輸出可用式(6)表示。同樣的,當(dāng)獲取增量數(shù)據(jù)ΔD2時(shí),LSTM1進(jìn)行遷移學(xué)習(xí)得到子模型LSTM2,如此循環(huán)使得子模型不斷利用實(shí)時(shí)數(shù)據(jù)進(jìn)行微調(diào)更新。最后將所有LSTM子模型進(jìn)行誤差加權(quán)集成,預(yù)測(cè)更深井段的井底壓力。
(6)
圖7 遷移學(xué)習(xí)的模型更新和特征融合示意圖Fig.7 Model update and feature fusion of transfer learning
為有效評(píng)價(jià)提出的增量更新模型,更加貼合現(xiàn)場(chǎng)鉆進(jìn)的實(shí)時(shí)場(chǎng)景,試驗(yàn)從原訓(xùn)練集中選取200 m上部連續(xù)井深序列,代表已鉆和即將鉆進(jìn)地層訓(xùn)練集D0,ΔD1,…,ΔDt;100 m下部連續(xù)井深序列,代表未鉆進(jìn)地層測(cè)試集。根據(jù)數(shù)據(jù)流增量ΔD的不同,訓(xùn)練得到不同的LSTM預(yù)測(cè)子模型。最終集成不同子模型用于新井段的井底壓力預(yù)測(cè),并與歷史數(shù)據(jù)訓(xùn)練的靜態(tài)模型進(jìn)行對(duì)比分析。
4.3.1 更新增量區(qū)間選擇
由試驗(yàn)評(píng)價(jià)結(jié)果(見(jiàn)表1)可以看出,使用增量實(shí)時(shí)數(shù)據(jù)訓(xùn)練的預(yù)測(cè)模型在精度和穩(wěn)定性上皆優(yōu)于使用全井段序列訓(xùn)練的預(yù)測(cè)模型,且模型的運(yùn)行效率僅有細(xì)微差別,說(shuō)明使用全井段歷史數(shù)據(jù)訓(xùn)練的預(yù)測(cè)模型捕捉特定井段信息的能力不足,導(dǎo)致模型在新地層條件下的測(cè)試能力差,推廣適用性受限。進(jìn)一步研究發(fā)現(xiàn),當(dāng)增量更新的數(shù)據(jù)量達(dá)到30,即每采集30 m數(shù)據(jù)訓(xùn)練建立一個(gè)LSTM網(wǎng)絡(luò),其預(yù)測(cè)平均相對(duì)誤差最低達(dá)到0.12%,此時(shí)集成的預(yù)測(cè)模型能夠更好地融合歷史與鉆進(jìn)信息,在更深井段具有更高的預(yù)測(cè)精度和穩(wěn)定性。而增量更新數(shù)偏小或偏大時(shí),由于數(shù)據(jù)有效信息不足或信息冗余,導(dǎo)致預(yù)測(cè)精度略有降低。
表1 模型評(píng)價(jià)結(jié)果Table 1 Model evaluation results
4.3.2 模型遷移共享的必要性
對(duì)比分析添加與未添加共享融合層的LSTM集成模型預(yù)測(cè)評(píng)價(jià)結(jié)果,如表2所示。由表2可知,添加共享層的模型預(yù)測(cè)精度更高,其中P較未添加模型下降30%?;谶w移共享層的預(yù)測(cè)模型不僅保留了上部地層的歷史信息,同時(shí)融合了當(dāng)前井段信息,使最終集成的預(yù)測(cè)模型能夠精準(zhǔn)預(yù)測(cè)更深井段的井底壓力。對(duì)于智能模型遷移時(shí)效性問(wèn)題,模型預(yù)測(cè)的難點(diǎn)在于同時(shí)處理歷史靜態(tài)信息和實(shí)時(shí)動(dòng)態(tài)信息,因此信息的遷移融合尤為必要。
表2 集成模型的預(yù)測(cè)結(jié)果對(duì)比Table 2 Prediction results of ensemble models
復(fù)雜模型由于嵌套復(fù)雜的非線性激活函數(shù)而面臨著可解釋性難的窘境?,F(xiàn)階段針對(duì)可解釋的研究[30-31]多為對(duì)模型建立完成后的數(shù)據(jù)結(jié)果進(jìn)行解釋,很少有直接針對(duì)建模過(guò)程中的模型進(jìn)行解釋的研究。本部分通過(guò)修改原有LSTM模型內(nèi)在結(jié)構(gòu),將注意力模塊嵌入到模型結(jié)構(gòu)中,提出了一種端到端的可解釋模型(SI-LSTM),如圖8所示,能夠使模型對(duì)自身預(yù)測(cè)結(jié)果進(jìn)行合理解釋。
圖8 混合注意力機(jī)制Fig.8 Hybrid attention mechanism
從修改標(biāo)準(zhǔn)LSTM模型的隱藏狀態(tài)出發(fā),使輸入的每個(gè)參數(shù)都攜帶著自身的隱藏狀態(tài)。在此基礎(chǔ)上對(duì)每個(gè)輸入?yún)?shù)的隱藏狀態(tài)使用時(shí)序注意力機(jī)制,以獲得每個(gè)參數(shù)豐富的歷史時(shí)序信息。隨后借助該歷史信息,引入特征注意力機(jī)制進(jìn)行歷史信息的狀態(tài)合并,將上述2步驟結(jié)合為一個(gè)概率混合模型[32],以幫助模型的學(xué)習(xí)、預(yù)測(cè)和自解釋。從圖8可以更清楚地了解混合注意力機(jī)制的工作流程,即每一個(gè)SI-LSTM處理當(dāng)前時(shí)刻下的特征序列xt,最后再通過(guò)混合注意力加權(quán)將其進(jìn)行合并?;旌细怕士梢员硎緸椋?/p>
(7)
應(yīng)用前述SI-LSTM可解釋模型,本部分重點(diǎn)對(duì)模型的預(yù)測(cè)結(jié)果進(jìn)行可解釋分析。本文通過(guò)提取各輸入特征的權(quán)重系數(shù),便于將各個(gè)特征的重要性量化分析??梢暬恳粋€(gè)訓(xùn)練周期的各個(gè)參數(shù)重要程度(見(jiàn)圖9),發(fā)現(xiàn)當(dāng)?shù)螖?shù)為40時(shí),各個(gè)特征的重要性程度趨向穩(wěn)定,說(shuō)明模型訓(xùn)練已經(jīng)收斂。同時(shí)隨著訓(xùn)練迭代進(jìn)行,井底壓力的特征重要性不斷上升,說(shuō)明模型逐步構(gòu)建了上部測(cè)壓數(shù)據(jù)與后續(xù)井底壓力表現(xiàn)的聯(lián)系。其余特征的重要系數(shù)變化趨勢(shì)總體較平穩(wěn),取值范圍從0.05至0.075。
圖9 不同迭代時(shí)期的參數(shù)重要性Fig.9 Parameter importance at different iterations
圖10顯示了各個(gè)特征的重要性權(quán)重系數(shù),發(fā)現(xiàn)SI-LSTM對(duì)井底壓力自身的關(guān)注程度最高,對(duì)模型的預(yù)測(cè)過(guò)程貢獻(xiàn)最大,系數(shù)達(dá)到0.25近似其他特征的5倍,即對(duì)預(yù)測(cè)結(jié)果的影響最大?,F(xiàn)有的控壓鉆井方法主要包括[33]:①調(diào)節(jié)鉆井液密度;②調(diào)節(jié)地面鉆井液泵排量;③調(diào)節(jié)回壓泵閥門形成一定的井口回壓。此與本文重要程度排序較高的總池體積和鉆井液密度相符。根據(jù)節(jié)流循環(huán)的井底壓力計(jì)算公式為:
pwf=po+pm+pf
(8)
式中:pwf為井底壓力,Pa;po為井口壓力,Pa;pm為井筒流體液柱壓力,Pa;pf為井筒流體流動(dòng)損耗壓力,Pa。
圖10 各個(gè)參數(shù)的重要程度排序Fig.10 Ranking of parameters by importance
分析可知,總池體積的變化反映了井筒內(nèi)流體體積的變化,鉆井液密度會(huì)引起井筒流體的重力變化,兩者是影響井筒流體液柱壓力pm變化的重要因素,從而影響井底壓力的變化。另外由于入口流量和出口流量對(duì)井底壓力的影響存在關(guān)聯(lián)性,所以當(dāng)模型訓(xùn)練結(jié)束時(shí),入口流量的重要性系數(shù)較于出口流量保持在更高水平。同時(shí)觀察井底壓力隨采集時(shí)間變化的趨勢(shì)(見(jiàn)圖11)發(fā)現(xiàn),從t-6時(shí)刻開始,即以當(dāng)前時(shí)刻為節(jié)點(diǎn)的前6 s,井底壓力的重要性開始凸顯,且在t-4和t-3時(shí)刻達(dá)到峰值,說(shuō)明前3~4 s的井底壓力對(duì)當(dāng)前時(shí)刻井底壓力的預(yù)測(cè)貢獻(xiàn)最大。
圖11 井底壓力隨時(shí)間變化的重要程度Fig.11 Importance of BHP over time
綜上所述,本文從特征和時(shí)序2方面分析得出:井底壓力具有短期的自相關(guān)性,與控壓鉆井過(guò)程的井口回壓傳播形式相符。這表明壓力的傳播過(guò)程不是瞬態(tài)完成的,而是具有一定的傳播速度和衰減性。該研究結(jié)果可一定程度上解釋現(xiàn)場(chǎng)異常壓力波動(dòng)的原因,可為技術(shù)人員采取合理控壓措施提供參考,對(duì)井底壓力的高效調(diào)控具有借鑒意義。
針對(duì)復(fù)雜井段數(shù)據(jù)難以實(shí)時(shí)采集,智能模型難以適用不同井段以及模型的可解釋性問(wèn)題,本研究提出了基于GAN網(wǎng)絡(luò)的數(shù)據(jù)拓展和增量更新的集成式井底壓力預(yù)測(cè)方法,實(shí)現(xiàn)了時(shí)效性強(qiáng)、適用性廣、精準(zhǔn)度高的井底壓力預(yù)測(cè),并得出以下結(jié)論:
(1)在歷史數(shù)據(jù)的基礎(chǔ)上,能夠拓展模型在未鉆地層的觀測(cè)數(shù)據(jù)空間,增強(qiáng)預(yù)測(cè)模型對(duì)井底壓力局部突變的刻畫能力,從而顯著提高預(yù)測(cè)性能。結(jié)果表明,擴(kuò)充15%~20%的GAN網(wǎng)絡(luò)生成數(shù)據(jù)能提升模型的預(yù)測(cè)性能,但增加過(guò)度數(shù)據(jù)會(huì)導(dǎo)致模型誤差增加,削弱捕捉壓力動(dòng)態(tài)變化的信息。
(2)基于增量更新的集成式預(yù)測(cè)方法,使模型能夠動(dòng)態(tài)捕捉壓力變化信息,有效融合歷史數(shù)據(jù)和實(shí)時(shí)數(shù)據(jù),提取影響井底壓力的共有特征,更快更好地適應(yīng)井下復(fù)雜變化的環(huán)境,平均相對(duì)誤差相比歷史靜態(tài)模型降低60%。
(3)利用基于混合注意力機(jī)制LSTM模型對(duì)預(yù)測(cè)結(jié)果進(jìn)行合理解釋分析,通過(guò)提取特征及時(shí)序的權(quán)重系數(shù)表征參數(shù)重要性,實(shí)現(xiàn)了結(jié)果的可解釋。結(jié)果表明井底壓力具有短期自相關(guān)性,與井口回壓的調(diào)節(jié)相關(guān)。