馮中申(遼河油田興隆臺(tái)采油廠,遼寧 盤錦 124010)
用于動(dòng)液面軟測量的經(jīng)驗(yàn)?zāi)B(tài)分解和高斯過程回歸建模方法
馮中申(遼河油田興隆臺(tái)采油廠,遼寧 盤錦 124010)
動(dòng)液面的軟測量預(yù)測模型一直存在著預(yù)測精度不高、泛化能力差的缺點(diǎn),針對上述問題本文提出基于經(jīng)驗(yàn)?zāi)B(tài)分解和高斯過程回歸相結(jié)合的算法對動(dòng)液面進(jìn)行預(yù)測,以提高模型的預(yù)測精度,滿足實(shí)際的生產(chǎn)要求。
動(dòng)液面;經(jīng)驗(yàn)?zāi)B(tài)分解;高斯過程回歸
動(dòng)液面參數(shù)是油田生產(chǎn)指導(dǎo)的重要依據(jù),傳統(tǒng)的人工測量容易受到各種因素的影響,存在著實(shí)時(shí)性差、誤差大的缺陷,而現(xiàn)有的動(dòng)液面軟測量模型又達(dá)不到較高的預(yù)測精度。本文提出基于經(jīng)驗(yàn)?zāi)B(tài)分解[1]和高斯過程回歸相結(jié)合的算法對動(dòng)液面進(jìn)行預(yù)測,以此改善模型的預(yù)測性能,提高預(yù)測精度。
軟測量建模過程中,對于主導(dǎo)變量而言,輔助變量的選取是否合理直接關(guān)系到建模質(zhì)量,影響模型的預(yù)測性能。在實(shí)際生產(chǎn)中,相關(guān)的可測變量有很多,如何選取輔助變量變得尤為重要。根據(jù)相關(guān)機(jī)理分析與先驗(yàn)知識得出:
其中,Ld為動(dòng)液面深度;Pt是井口套壓;Qr代表日產(chǎn)液量;泵效η;Δv為建模的動(dòng)態(tài)項(xiàng)。所以,輔助變量選取為泵效、套壓和日產(chǎn)液量。
在油田的現(xiàn)場開采過程中,由于其復(fù)雜的生產(chǎn)環(huán)境影響,使得輔助變量的數(shù)據(jù)監(jiān)測傳感器在采集數(shù)據(jù)時(shí)難免受到噪聲干擾。噪聲對于建模數(shù)據(jù)的影響直接關(guān)系到建模質(zhì)量,所以本文提出采用經(jīng)驗(yàn)?zāi)B(tài)分解(EMD)的方法對數(shù)據(jù)進(jìn)行去噪處理。經(jīng)驗(yàn)?zāi)B(tài)分解過程如下:
其中,x(t)為待分解信號;c1(t),c2(t),...,cn(t)為一系列的本征模態(tài)函數(shù)(IMF),頻率由低到高排列;r(t)為殘差信號。由于先分解出來的IMF高頻數(shù)據(jù)為噪聲信號或者異常數(shù)據(jù),所以,刪除高頻的IMF成分并將其他段的IMF數(shù)據(jù)進(jìn)行重新整合作為輔助變量數(shù)據(jù)。
高斯過程回歸[2]是一種熱門的機(jī)器學(xué)習(xí)方法,相對于神經(jīng)網(wǎng)絡(luò)、支持向量機(jī)在處理高維數(shù)據(jù)和非線性復(fù)雜問題的應(yīng)用上有明顯的適用性;建模的參數(shù)比較少并且有優(yōu)化簡單的優(yōu)勢,所以本文選取高斯過程回歸進(jìn)行軟測量建模。選用徑向基函數(shù)作為模型的協(xié)方差函數(shù),使用極大似然法對超參數(shù)θ=[w1,w2,…wm,v1,v0]進(jìn)行調(diào)整。選用的徑向基函數(shù)如下:
式中,v0是噪聲方差(服從高斯分布);wd是模型的測度參數(shù);v1是局部相關(guān)性程度;δij為算子Kronecker算子。
以某油田J18-32油井的實(shí)際產(chǎn)生數(shù)據(jù)作為實(shí)驗(yàn)數(shù)據(jù)對本文提出的方法進(jìn)行驗(yàn)證分析。對同一口井采集350組數(shù)據(jù),200組數(shù)據(jù)作為訓(xùn)練數(shù)據(jù),150組數(shù)據(jù)作為測試數(shù)據(jù)。對傳感器采集的輔助變量數(shù)據(jù)進(jìn)行EMD處理,消除噪聲干擾。為了驗(yàn)證EMD算法對輔助變量去噪處理的有效性,對經(jīng)過去噪處理的輔助變量數(shù)據(jù)和未經(jīng)過處理的輔助變量數(shù)據(jù)分別進(jìn)行軟測量建模,對比分析實(shí)驗(yàn)結(jié)果。建模方法采用高斯過程回歸,模型對應(yīng)的協(xié)方差函數(shù)如式(1)所示,對于模型中的超參數(shù)θ=[w1,w2,…wm,v1,v0],w1~wm的初值均設(shè)置為1,v1和v0分別取2和0.01,假設(shè)認(rèn)為每個(gè)輔助變量對主導(dǎo)變量的貢獻(xiàn)是相同的,利用極大似然法對輸入的超參數(shù)最優(yōu)值進(jìn)行尋優(yōu)。仿真的結(jié)果圖如下:
圖1 不同方法的仿真結(jié)果圖
計(jì)算圖中兩種方法對應(yīng)預(yù)測結(jié)果的均方根誤差(RMSE)和平均絕對誤差(MAE)。輔助變量經(jīng)過EMD處理的建模方法對應(yīng)的誤差值分別為16.569、28.653;輔助變量未經(jīng)過EMD處理的建模方法對應(yīng)的誤差值分別為21.843、35.964。通過誤差對比分析可知,輔助變量經(jīng)過EMD處理后的預(yù)測結(jié)果誤差明顯小于輔助變量未經(jīng)過去噪處理的預(yù)測結(jié)果誤差,由此可說明EMD算法對于輔助變量去噪處理的有效性,可以提高模型的預(yù)測精度。
本文針對油田生產(chǎn)數(shù)據(jù)采集過程中存在的噪聲干擾,以及軟測量建模方法的選取對模型預(yù)測性能的影響問題進(jìn)行了研究。提出經(jīng)驗(yàn)?zāi)B(tài)分解(EMD)的方法對輔助變量數(shù)據(jù)進(jìn)行去噪處理,以及更適用于復(fù)雜的非線性問題和高維數(shù)據(jù)的高斯過程回歸進(jìn)行軟測量建模,對動(dòng)液面結(jié)果進(jìn)行預(yù)測。通過對實(shí)際生產(chǎn)數(shù)據(jù)進(jìn)行仿真分析,證明了本方法的有效性,確實(shí)能夠有效提升模型的預(yù)測精度。
[1]J Huang N E,Shen Z,Long S R,et al.The empirical mode decomposition and the Hilbert spectrum for nonlinear and non-sta?tionary time series analysis[J].Proc.Rsoc.Lond.,1998,454:56-78
[2]Wang Huazhong(王華忠).Gaussian process and its appli?cation to soft-sensor modeling[J].Journal of Chemical Industry and Engineering(China)(化工學(xué)報(bào)),2007,58(11):2839-2845.