趙巖龍,方正魁,邱子瑤,馮 智,祝宏平,米 翔
(1.中國石油大學(北京)克拉瑪依校區(qū)石油學院,克拉瑪依 834000;2.中國石油天然氣股份有限公司新疆油田分公司,石西油田作業(yè)區(qū),克拉瑪依 834000;3.中國石油天然氣股份有限公司新疆油田分公司,采油一廠,克拉瑪依 834000)
抽油桿是有桿泵采油系統(tǒng)中的重要組成部分,起到連接抽油機與抽油泵、傳遞載荷的作用[1]。油井管桿失效問題普遍存在,并一直困擾著油田生產(chǎn)實踐[2]。隨著油井開發(fā)年限的延長,進入高含水期開采階段的油井數(shù)量不斷增加[3],油井下泵深度逐漸加大,抽油桿在長期交變載荷作用、井身結(jié)構(gòu)、失穩(wěn)彎曲、產(chǎn)出液的腐蝕破壞[4-5]等多種因素共同影響下容易發(fā)生故障,從而導致油井檢泵周期縮短、修井作業(yè)頻繁。準確預測抽油桿在井下腐蝕條件下的剩余使用壽命(remaining useful life,RUL),對保證油田正常生產(chǎn)具有重要意義。
抽油桿剩余壽命預測方法主要有:基于理論分析的桿柱壽命的預測方法,主要包括:基于斷裂力學的疲勞裂紋擴展模型、疲勞累積損傷理論模型、磨損理論模型等[6];基于實驗或監(jiān)測數(shù)據(jù)的經(jīng)驗預測模型,該類方法將實驗或監(jiān)測數(shù)據(jù)作為樣本,通過神經(jīng)網(wǎng)絡、回歸理論和灰色理論等方法建立經(jīng)驗管桿壽命預測模型[7]。近年來,深度學習理論在人工智能領域中逐漸興起,深度神經(jīng)網(wǎng)絡在處理復雜非線性問題上表現(xiàn)出很好的模擬及預測能力[8]。其中,長短時記憶網(wǎng)絡(long short-term memory,LSTM)適用于解決序列化問題[9],已廣泛應用于設備故障的預警、診斷[10]及評估[11]、剩余壽命[12]及工作參數(shù)[13]的預測。在油氣勘探開發(fā)領域大數(shù)據(jù)時代背景下,LSTM神經(jīng)網(wǎng)絡較多地應用于測井曲線的解釋及分析[14-15],在抽油桿剩余壽命預測方面還處于起步階段。將LSTM神經(jīng)網(wǎng)絡與油田生產(chǎn)數(shù)據(jù)相結(jié)合,以期擴展抽油桿剩余壽命預測新思路、提高預測效率和精度。研究結(jié)果對延長油井免修期、節(jié)約油田作業(yè)成本具有一定意義。
LSTM即長短時記憶網(wǎng)絡是循環(huán)神經(jīng)網(wǎng)絡(recurrent neural network,RNN)的一種改進模型,它在循環(huán)網(wǎng)絡的基礎上加入了3個可以篩選信息的門結(jié)構(gòu),能夠有效解決RNN模型中梯度消失的問題[16]。LSTM的門限結(jié)構(gòu)包括:輸入門、遺忘門和輸出門[17],分別起到處理輸入的時序數(shù)據(jù)、識別重要信息并剔除低價值數(shù)據(jù)以及輸出具有長短期記憶特征信息的作用。LSTM通過增加了一項元胞數(shù)組[18],利用遺忘門與輸入門提取的信息,將其隨著時間序列長期循環(huán)存儲下去,這使得LSTM具有長期記憶的特征。圖1為LSTM單元的基本結(jié)構(gòu)[16]。
圖1 LSTM單元結(jié)構(gòu)[16]Fig.1 Unitstructure of LSTM[16]
(1)遺忘門:是輸入數(shù)據(jù)經(jīng)過LSTM內(nèi)部結(jié)構(gòu)的第一個門,通過Sigmoid激活函數(shù)遺忘掉部分信息[19],保留下有用的信息,其表達式為
ft=σ(wfht-1+ufxt+bf)
(1)
(2)輸入門:決定輸入數(shù)據(jù)需要更新的信息。分為兩部分,第一部分通過Sigmoid激活函數(shù)更新信息,第二部分通過雙曲正切函數(shù)作為激活函數(shù)更新信息[17],其表達式為
it=σ(wiht-1+uixt+bi)
(2)
(3)
(3)輸出門:通過Sigmoid激活函數(shù)決定輸入數(shù)據(jù)需要留下哪些有價值的信息,其計算公式為
ot=σ(woht-1+uoxt+bo)
(4)
(4)單元狀態(tài):為了實現(xiàn)LSTM模型的長期記憶引入的元胞數(shù)組[20],其計算公式為
(5)
式中:ft、it、ot分別為t時刻遺忘門、輸入門、LSTM內(nèi)部輸入、輸出門結(jié)構(gòu)的輸出;ct為單元狀態(tài)的輸出;ht-1為t-1時刻單元的輸出,xt為t時刻單元的輸入;wf、wi、wc、wo分別為遺忘門、輸入門、內(nèi)部長程記憶單元、輸出門結(jié)構(gòu)元t-1時刻h值的權(quán)重;uf、ui、uc、uo分別為遺忘門、輸入門、內(nèi)部長程記憶單元、輸出門結(jié)構(gòu)t時刻x的權(quán)重;bf、bi、bc、bo分別為遺忘門、輸入門、內(nèi)部長程記憶單元、輸出門結(jié)構(gòu)的閾值;σ為Sigmoid函數(shù),tanh為雙曲正切函數(shù);?為Hadamard乘積。
數(shù)據(jù)標準化是為了去除輸入數(shù)據(jù)因?qū)傩?、?shù)量級、單位不同導致的差異,一般將數(shù)據(jù)映射在[0,1]或者[-1,1]區(qū)間范圍內(nèi)。目前,普遍運用的數(shù)據(jù)標準化方法主要有:線性歸一化、標準方差歸一化以及非線性歸一化方法等[8]。采用標準方差歸一化,其計算公式為
x′=(x-μ)/σ
(6)
式(16)中:x′為歸一化后的數(shù)據(jù);x為原始數(shù)據(jù);μ為樣本均值;σ為樣本標準差。
管桿剩余壽命的預測屬于序列映射序列的回歸預測問題,選用誤差平方和函數(shù)作為損失函數(shù)(式7),將誤差反向傳播。
(7)
根據(jù)t時刻的誤差項就可以得到任意時刻的誤差項,其表達式為
(8)
在訓練LSTM網(wǎng)絡時,通常訓練數(shù)據(jù)的規(guī)模較大,如果每次迭代都更新整個訓練集的梯度,不但增加了訓練時間[9],還使整體的梯度變的冗余,因此采用小批量梯度下降法(mini-batch gradient descent)訓練網(wǎng)絡,避免了在整個訓練集上更新梯度。在小批量梯度下降法中,批量大小(batch size)對網(wǎng)絡優(yōu)化有一定的影響,需要設置合適的學習率,采用了自適應動量估計算法即Adam算法對其進行優(yōu)化。
為了避免LSTM網(wǎng)絡過擬合、提高網(wǎng)絡泛化能力,保證在測試集上的訓練效果,通常使用正則化方法對網(wǎng)絡進行處理,主要有:L1、L2正則化、提前停止法、丟棄法等。選用丟棄法(dropout method),即在訓練LSTM網(wǎng)絡時,按照一定概率隨機丟棄一部分神經(jīng)元來避免過擬合,如圖2所示[10]。
圖2 標準網(wǎng)絡與應用丟棄法后的網(wǎng)絡[10]Fig.2 Standard network and network after application of dropout method[10]
基于LSTM的抽油桿剩余壽命預測流程如圖3所示。
圖3 預測流程圖Fig.3 Flow chart of prediction
模型選取50個序列樣本作為訓練集,另外選取20個序列樣本作為測試集。模型中設置一個LSTM層,兩個全連接層。LSTM層丟棄率分別選取0.5、0.6、0.7;全連接層1丟棄率分別選取0.5、0.6、0.7、0.8。最大迭代次數(shù)分別選取150次、200次。通過網(wǎng)絡測試發(fā)現(xiàn),當丟棄率分別為0.6、0.5,最大迭代次數(shù)200次時,測試集均方根誤差及平均絕對誤差皆為最小值。當學習率為0.001、0.005時訓練曲線收斂較差,因此學習率取值0.01,優(yōu)化后的LSTM模型超參設置如表1所示。
表1 模型超參數(shù)設置Table 1 Hyperparameters setting of model
將訓練好的LSTM網(wǎng)絡對20口油井進行測試,得到了隨機4口井的擬合結(jié)果(圖4),觀察發(fā)現(xiàn),4號和17號井在工作周期末端的預測效果較好,16號和18號井的預測結(jié)果與實際數(shù)據(jù)之間有一定誤差。
圖4 隨機4口油井測試曲線Fig.4 Random test curves of 4 wells
圖5給出了20口油井抽油桿剩余壽命預測結(jié)果與實際數(shù)據(jù)的對比結(jié)果,觀察發(fā)現(xiàn)預測結(jié)果與測試數(shù)據(jù)間具有一定相關性,進一步計算得到20口油井預測值的平均誤差為36%,表明模型具有一定的泛化能力,但精度有待提高,部分油井的預測值與實際值差異較大,這主要是由于抽油桿剩余壽命屬于隨機數(shù),一口井本次修井主要影響因素可能為抽油桿腐蝕斷脫,下次作業(yè)可能由泵漏、油管漏、結(jié)垢、結(jié)蠟等其他因素造成,因此,細化影響抽油桿壽命因素的現(xiàn)場數(shù)據(jù)監(jiān)測,增加油井數(shù)量的統(tǒng)計,擴充模型訓練數(shù)據(jù)庫,有助于進一步提升模型預測精確度。
圖5 20口油井抽油桿剩余壽命預測結(jié)果對比Fig.5 Comparison of RUL prediction results of sucker rods in 20 oil wells
采用均方根誤差(root mean square error,RMSE)作為標準衡量模型的精度,RMSE的計算公式為
(9)
進一步引入雙向LSTM模型(BiLSTM)和深度LSTM模型(DeepLSTM),對20口油井抽油桿剩余壽命進行預測,BiLSTM和DeepLSTM模型基本參數(shù)如表2所示。表3為3種模型測試結(jié)果對比。
表2 模型基本參數(shù)Table 2 Fundamental parameters
表3 不同模型預測結(jié)果對比Table 3 Comparison of prediction results of different models
由對比結(jié)果可知,相比于BiLSTM模型和DeepLSTM模型,LSTM預測模型均方根誤差最小,相關性最好,預測精度更高,能夠應用于腐蝕工況下抽油桿柱剩余壽命的預測。
(1)統(tǒng)計了新疆油田某井區(qū)50口因抽油桿腐蝕導致停泵的油井生產(chǎn)數(shù)據(jù),針對腐蝕工況下引起抽油桿失效的大量不確定影響因素,集成了一個與腐蝕環(huán)境密切相關的數(shù)據(jù)集,包含了15個特征量。
(2)通過參數(shù)優(yōu)化、網(wǎng)絡訓練,構(gòu)建了基于LSTM的抽油桿剩余壽命預測模型,對20口生產(chǎn)井數(shù)據(jù)的測試顯示,LSTM模型預測結(jié)果的平均誤差為36%。與雙向LSTM模型和深度LSTM模型進行對比表明LSTM預測模型具有更好的預測能力。
(3)細化影響抽油桿壽命因素的現(xiàn)場數(shù)據(jù)監(jiān)測,增加油井數(shù)量的統(tǒng)計,擴充模型訓練數(shù)據(jù)庫,有助于進一步提升模型預測精度。