趙燕紅,馬駟駒,劉小平,景文杰,張召召(.西安長慶化工集團(tuán)有限公司研究所,陜西西安 7008;.中國石油長慶油田分公司第三采油廠,寧夏銀川 750006)
?
基于最小二乘支持向量機(jī)的低滲透油藏調(diào)剖效果預(yù)測
趙燕紅1,馬駟駒2,劉小平2,景文杰2,張召召2
(1.西安長慶化工集團(tuán)有限公司研究所,陜西西安710018;2.中國石油長慶油田分公司第三采油廠,寧夏銀川750006)
摘要:調(diào)剖效果受油藏地質(zhì)條件、開發(fā)狀況和調(diào)剖工藝等諸多因素影響,調(diào)剖效果預(yù)測實質(zhì)上是解決一個多因素共同作用的復(fù)雜非線性問題。常規(guī)的數(shù)值模預(yù)測對地質(zhì)建模準(zhǔn)確性要求高、歷史擬合時間長而不能滿足實際應(yīng)用需求。本文提出利用最小二乘支持向量機(jī)法構(gòu)建調(diào)剖效果與其主控因素之間的非線性映射模型,將未知井調(diào)剖效果預(yù)測轉(zhuǎn)化為非線性函數(shù)的求解過程。以靖安油田五里灣區(qū)塊24口調(diào)剖井資料為學(xué)習(xí)樣本,建立了計算調(diào)剖后井組增油量、降水量的最小二乘支持向量機(jī)預(yù)測模型并進(jìn)行了驗證。結(jié)果表明,計算結(jié)果與實際值擬合精度較高、誤差較小,該方法可用于礦場調(diào)剖效果預(yù)測與評價。
關(guān)鍵詞:調(diào)剖效果;影響因素;最小二乘支持向量機(jī);預(yù)測模型;五里灣區(qū)塊
影響調(diào)剖效果的因素涉及油藏條件、開發(fā)狀況和調(diào)剖工藝等三大類中的諸多小類[1-4],因此,調(diào)剖效果預(yù)測實質(zhì)上成為解決一個多因素共同作用的復(fù)雜非線性問題。目前,廣泛采用數(shù)值模擬法進(jìn)行調(diào)剖效果的預(yù)測[5-7],該方法對地質(zhì)建模準(zhǔn)確性要求較高、歷史擬合耗時較長,往往不能滿足實際應(yīng)用的需求。本文利用基于統(tǒng)計學(xué)習(xí)理論的支持向量機(jī)(Support Vector Machine,SVM)方法進(jìn)行調(diào)剖效果預(yù)測。SVM基于Vapnik的結(jié)構(gòu)風(fēng)險最小化原理,具有結(jié)構(gòu)簡單、泛化能力強(qiáng)、求解速度快等特點,在解決小樣本、非線性、多維問題方面優(yōu)勢顯著[8-13]。最小二乘支持向量機(jī)(least squares support vector machine,LSSVM)是標(biāo)準(zhǔn)支持向量機(jī)的改進(jìn),采用等式約束代替標(biāo)準(zhǔn)支持向量機(jī)中的不等式約束,并將求解二次規(guī)劃問題轉(zhuǎn)化為直接求解線性方程組,大大降低了計算復(fù)雜程度。對于調(diào)剖效果與各影響因素的復(fù)雜關(guān)系,LSSVM通過核函數(shù)將樣本空間映射到特征空間中求出原樣本集的最優(yōu)化分類面,進(jìn)而得到輸入變量(影響因素)與輸出變量(調(diào)剖效果)之間的非線性關(guān)系,最終將二者的復(fù)雜關(guān)系轉(zhuǎn)化為非線性函數(shù)估計和逼近的數(shù)學(xué)求解問題。
1.1結(jié)構(gòu)風(fēng)險最小化原理
設(shè)某區(qū)域的樣本為n維向量,則該區(qū)域的m個樣本及其值可表示為:
傳統(tǒng)機(jī)器學(xué)習(xí)方法采用經(jīng)驗風(fēng)險最小化原則,即最小化:
根據(jù)Vapnik結(jié)構(gòu)風(fēng)險最小化原則,機(jī)器學(xué)習(xí)的最終目的是最小化期望風(fēng)險,即最小化:
上式中:R(w)-風(fēng)險函數(shù);f(x,w)-預(yù)測函數(shù)集,是對變量x和y之間關(guān)系的估計;L(y,f(x,w))-采用f(x ,w)對y進(jìn)行預(yù)測產(chǎn)生的損失函數(shù);F(x,y)-變量x和y的聯(lián)合分布概率。根據(jù)概率與數(shù)理統(tǒng)計理論,經(jīng)驗風(fēng)險最小不等于期望風(fēng)險最小,二者在極壞分布情況下,以概率1-η滿足以下關(guān)系:
1.2最小二乘支持向量機(jī)
SVM是結(jié)構(gòu)風(fēng)險最小化理論的實現(xiàn),由Vapnik等于1995年首先提出[8]。SVM因其較好的泛化能力用來解決各領(lǐng)域中的高維非線性映射問題。LSSVM是標(biāo)準(zhǔn)支持向量機(jī)的一種擴(kuò)展,它采用最小二乘線性系統(tǒng)作為損失函數(shù),將求解二次規(guī)劃問題轉(zhuǎn)化為求解一組線性方程。對于n維向量、m個樣本,通過非線性變換z=φ(xi),將n維向量映射到l(l>>n)維這個高維度特征空間中,利用SVM算法實現(xiàn)輸入數(shù)據(jù)與輸出數(shù)據(jù)之間的非線性擬合,并允許出現(xiàn)擬合偏差。其數(shù)學(xué)關(guān)系表現(xiàn)形式為:
式中:w-權(quán)值矢量;φ(x)-非線性映射,生產(chǎn)和輸入向量x同維的向量;b-偏差;(w,φ)-w和φ(x)的點積。
LSSVM最優(yōu)化問題是尋找一個函數(shù),在規(guī)定誤差內(nèi)能夠估計出幾乎接近目標(biāo)的輸出,同時最小化w模型參數(shù),使其具有更強(qiáng)的泛化能力,使回歸模型在模型推廣能力和經(jīng)驗風(fēng)險之間找到最佳平衡點,即結(jié)構(gòu)風(fēng)險最小化。對于最小二乘支持向量機(jī)方法,優(yōu)化目標(biāo)等價于一個最基本的凸二次規(guī)劃問題,其形式如下:
在LSSVM回歸模型容許的擬合誤差范圍內(nèi),引入松弛系數(shù)ξ,帶有松弛系數(shù)的同等最優(yōu)化問題可表示為:
式中:J(w,ξ)-誤差控制函數(shù);ξ-松弛系數(shù),用于表征允許擬合誤差的程度;wTw-控制模型的復(fù)雜度;C-懲罰因子,用于控制訓(xùn)練錯誤率與泛化能力的一個折中系數(shù),用來懲罰超出誤差的數(shù)據(jù)點,并作為誤差與優(yōu)化目標(biāo)之間的權(quán)重。
利用Lagrange乘數(shù)法求解式(6)的優(yōu)化問題,轉(zhuǎn)化為一個等價的二次規(guī)劃問題,定義Lagrange函數(shù):
式(7)中,αi(i=1,2,…,m)為Lagrange乘子。
根據(jù)KKT優(yōu)化條件得到:
則有:
引入核函數(shù),K(xi,yi)=φ(xi)·φ(yi),根據(jù)式(9),將求解優(yōu)化問題轉(zhuǎn)化為求解線性方程:
解上述線性方程組可得到Lagrange乘子αi和偏差參數(shù)b,由此確定LSSVM的輸出為:
式(11)即為需要的LSSVM模型。式中函數(shù)f(x)完全由αi乘子決定。根據(jù)LSSVM回歸函數(shù)的性質(zhì),只有少數(shù)的αi不為0,這些參數(shù)對應(yīng)的向量稱之為支持向量,偏差b也可以由標(biāo)準(zhǔn)支持向量計算得到。由于式(11)描述的對象是一個凸規(guī)劃問題,其任一解均為全局最優(yōu)解,而無局部極值問題,即具有較強(qiáng)的全局搜索能力[14]。
另外,式中的核函數(shù)是一個必須滿足Mercer條件的函數(shù)。核函數(shù)有很多形式,本文采用能夠較好解決復(fù)雜非線性問題的徑向基RBF核函數(shù),其表達(dá)式為:
式中:σ-核寬度。最終得到支持向量回歸機(jī)的估計函數(shù):
2.1輸入?yún)?shù)選取及歸一化
調(diào)剖效果作為輸出參數(shù)是確定的,但其影響因素較多,且各因素對調(diào)剖效果好壞的關(guān)聯(lián)程度各不相同,這些因素還可能相互關(guān)聯(lián)。本文用灰色關(guān)聯(lián)法確定調(diào)剖效果的主控因素。首先將各因素屬性值進(jìn)行歸一化處理,具體為采用線性函數(shù)法中的最大最小值法將各因素屬性值都映射到[0,1]區(qū)間。對于某一特定的屬性序列xi(i=1,2,…,m),則有:
式中:x、X分別為歸一化前后的因素屬性值;xmax、xmin分別為因素屬性的最大值和最小值。根據(jù)結(jié)果對影響調(diào)剖效果的系列因素進(jìn)行關(guān)聯(lián)度排序,選擇影響調(diào)剖效果的主控因素作為模型的輸入?yún)?shù)。此外,在模型進(jìn)行樣本訓(xùn)練時,同樣使用歸一化的屬性值,以利于提升核函數(shù)點積計算速度。
2.2核函數(shù)參數(shù)優(yōu)化
實踐表明,合理確定LSSVM模型的松弛系數(shù)ξ、懲罰因子C、核函數(shù)RBF的基寬σ,可以顯著提升模型的精度和推廣能力。本文采用交叉驗證網(wǎng)格搜索方法來確定松弛系數(shù)ξ、懲罰因子C和核寬度σ,并將其最優(yōu)參數(shù)組合代入RBF核函數(shù),通過公式(13)即可得到需要的LSSVM模型。
表1 LSSVM歸一化訓(xùn)練樣本Tab.1 Normalized training sample of LSSVM
靖安油田五里灣區(qū)塊為典型的低滲透油藏,儲層平均孔隙度12.74 %,平均滲透率1.81×10-3μm2,有效厚度12.4 m。區(qū)塊于1998年大規(guī)模投產(chǎn),采用300 m× 300 m近似正方形反九點井網(wǎng)、同步注水開發(fā)。開發(fā)過程中含水不斷上升,2014年底綜合含水達(dá)51.7 %,表現(xiàn)出含水加快上升,產(chǎn)量下降,平面及縱向矛盾日益突出。2015年以來,通過開展“弱凝膠+凝膠顆?!鄙畈空{(diào)剖技術(shù)應(yīng)用,有效緩解了油藏水驅(qū)不均矛盾,穩(wěn)油控水效果明顯。
以五里灣區(qū)塊2015年實施的24口調(diào)剖井組為例,首先將眾因素屬性值歸一化,通過灰色關(guān)聯(lián)法得到與調(diào)剖效果關(guān)聯(lián)度前五位的油層厚度、含油飽和度、含水率、變異系數(shù)和調(diào)剖注入量作為模型的輸入?yún)?shù),目標(biāo)輸出分別為調(diào)剖井組增油量和降水量。將上述輸入輸出參數(shù)歸一化后作為學(xué)習(xí)樣本(見表1),應(yīng)用LSSVM進(jìn)行該區(qū)調(diào)剖效果的訓(xùn)練與回歸。在初始訓(xùn)練樣本確定的情況下,利用交叉驗證網(wǎng)格搜索方法得到松弛系數(shù)ξ=0.01、懲罰因子C=400、基寬σ=2,使得最終LSSVM法計算結(jié)果是唯一的。將24個訓(xùn)練樣本進(jìn)行預(yù)處理后用于LSSVM學(xué)習(xí)。利用LSSVM進(jìn)行訓(xùn)練得到的增油量、降水量計算值與真實值的相關(guān)系數(shù)R2分別為0.988 4、0.845 6,擬合程度較高,說明該預(yù)測模型可靠性較好(見圖1)。
利用訓(xùn)練好的預(yù)測模型對五里灣區(qū)塊未參與學(xué)習(xí)的3口調(diào)剖井進(jìn)行預(yù)測及對比。結(jié)果表明(見表2),模型預(yù)測的井組增油量與實際值的平均相對誤差為5.71 %,井組降水量與實際的平均相對誤差為2.71 %,能夠滿足礦場應(yīng)用的精度要求。
圖1 訓(xùn)練樣本計算值與實際值的對比Fig.1 Comparison between calculated and actual values for training sample
表2 檢驗樣本的實際值與模型預(yù)測值對比Tab.2 Comparison between calculated and actual values for inspection sample
(1)調(diào)剖效果受多因素影響,難以將其與各影響因素之間建立一種確定的數(shù)學(xué)關(guān)系用于礦場應(yīng)用計算。利用在小樣本條件下解決關(guān)聯(lián)屬性之間的多維非線性問題的優(yōu)越性,提出采用最小二乘支持向量機(jī)法建立調(diào)剖效果與其主控因素之間的非線性映射數(shù)學(xué)模型,進(jìn)而預(yù)測未知井的調(diào)剖效果。
(2)以靖安油田五里灣區(qū)塊調(diào)剖井為學(xué)習(xí)樣本,將調(diào)剖后井組增油量和降水量作為目標(biāo)輸出,進(jìn)行了最小二乘支持向量機(jī)法實例計算及驗證。計算結(jié)果與樣本實際值擬合相關(guān)性較高,預(yù)測相對誤差在6 %以內(nèi),該方法用于調(diào)剖效果預(yù)測及評價是可行的。
參考文獻(xiàn):
[1]趙明宸,陳月明,蔣海巖,等.調(diào)剖措施效果影響因素的不確定性及其關(guān)聯(lián)分析[J].中國石油大學(xué)學(xué)報(自然科學(xué)版),2006,30(6):59-62.
[2]徐耀東,任允鵬,丁良成,等.基于支持向量機(jī)的調(diào)剖效果預(yù)測方法研究[J].斷塊油氣田,2007,14(2):50-52.
[3]巫祥陽,等.基于支持向量機(jī)的調(diào)剖措施效果預(yù)測模型研究[J].石油天然氣學(xué)報,2006,28(5):120-121.
[4]汪洪,喬方,于春濤.影響調(diào)剖效果因素的分析[J].鉆采工藝,2008,31(增刊):65-67.
[5]姜漢橋,劉偉,袁謀,等.多輪次調(diào)剖數(shù)值模擬研究[J].石油鉆采工藝,2003,25(5):63-66.
[6]李梅,康志江.深度調(diào)剖數(shù)值模擬研究與應(yīng)用[J].大慶石油地質(zhì)與開發(fā),2004,23(3):76-77.
[7]王清平.化學(xué)調(diào)剖效果經(jīng)濟(jì)評價方法研究[D].浙江:浙江大學(xué),2002.
[8]Vapnik V N.The nature of statistical learning theory[M].NewYork:Springer,1995.
[9]張學(xué)工.關(guān)于統(tǒng)計學(xué)習(xí)理論與支持向量機(jī)[J].自動化學(xué)報,2000,26(1):32-41.
[10]楊位民,田芳,龔聲蓉,等.基于支持向量機(jī)的壓裂井層優(yōu)選[J].計算機(jī)工程,2006,32(7):247-249.
[11]聶玲玲,童凱軍,侯東梅,等.利用支持向量機(jī)方法求取縫洞型油氣藏地層系數(shù)[J].中國海上油氣,2011,23(2):93-96.
[12]侯健,樂友喜,王才經(jīng),等.基于統(tǒng)計學(xué)習(xí)理論的提高采收率潛力預(yù)測[J].石油大學(xué)學(xué)報(自然科學(xué)版),2004,28(4):67-70.
[13]錢曉山,陽春華.基于GEP的最小二乘支持向量機(jī)模型參數(shù)選擇[J].智能系統(tǒng)學(xué)報,2012,7(3):1-5.
[14]Xu Kaikuo,et al.A novel method for real parameter optimization based on gene expression programming[J].Applied Soft Computing,2009,9(2):725-737.
Effect prediction of profile control based on least squares support vector machine in low permeability reservoir
ZHAO Yanhong1,MA Siju2,LIU Xiaoping2,JING Wenjie2,ZHANG Zhaozhao2
(1.Research Institute of Xi'an Changqing Chemical Group Co.,Ltd.,Xi'an Shanxi 710018,China;2.Oil Production Plant 3 of PetroChina Changqing Oilfield Company,Yinchuan Ningxia 750006,China)
Abstract:The efficiency of profile control is influenced by many factors such as geological conditions,development status and profile control technology,and effect prediction of profile control is considered as solving a complicated nonlinear problem which is influenced by many factors.It can not meet the actual application needs for conventional numerical simulation method with the demanding accuracy of geological modeling and the long time of history fitting.The least squares support vector machine(LSSVM)was used to construct the nonlinear mapping model between the profile control effect and its main controlling factors in this paper,and effect prediction of profile control for unknown well is transformed to the process of solving a nonlinear function.Based on the data of 24 profile control wells of Wuliwan block in Jing'an oilfield,the LSSVM forecast model of increasing oil and decreasing waterbook=38,ebook=43was established,and it was verified by inspection sample.The results show that the fitting accuracy between calculation results and actual values is relatively high and the error is small, the method can be used for prediction and evaluation of profile control effect in field.
Key words:efficiency of profile control;influence factors;least squares support vector machine;prediction model;Wuliwan block
*收稿日期:2015-12-31
DOI:10.3969/j.issn.1673-5285.2016.03.010
中圖分類號:TE348
文獻(xiàn)標(biāo)識碼:A
文章編號:1673-5285(2016)03-0037-05