宋金波, 張劍風(fēng), 宋衍茹
(1.東北石油大學(xué),黑龍江大慶 163318;2.大慶油田有限責(zé)任公司第九采油廠地質(zhì)大隊(duì)黑龍江大慶163513;3.大慶工程有限公司,黑龍江大慶 163513)
目前,在世界范圍內(nèi),注水開采的油氣產(chǎn)量占了很大比重.由于長(zhǎng)期大量的注入水,許多油田已經(jīng)發(fā)生水淹,油田進(jìn)入了高含水期開采階段.水淹層解釋已成為油田開發(fā)生產(chǎn)中的重要工作.大慶西部外圍油田低孔低滲泥質(zhì)砂巖儲(chǔ)層巖性復(fù)雜,泥質(zhì)含量高,儲(chǔ)層以薄互層為主,導(dǎo)致測(cè)井響應(yīng)不同程度地受到影響而失真,油水層識(shí)別難度大,測(cè)井解釋符合率較低,傳統(tǒng)的經(jīng)驗(yàn)性測(cè)井解釋逐漸滿足不了生產(chǎn)需要.
近年來(lái),支持向量機(jī)(SVM)在模式識(shí)別中取得了良好的應(yīng)用.它是由Vapnik在1995年提出的以結(jié)構(gòu)風(fēng)險(xiǎn)最小化為原則的統(tǒng)計(jì)學(xué)習(xí)方法[1],相對(duì)于傳統(tǒng)統(tǒng)計(jì)學(xué)的經(jīng)驗(yàn)風(fēng)險(xiǎn)最小化原則,有效的提高了學(xué)習(xí)的泛化能力.標(biāo)準(zhǔn)支持向量機(jī)通過(guò)適當(dāng)?shù)倪x擇核函數(shù)及函數(shù)子集,根據(jù)有限樣本信息在模型復(fù)雜性和學(xué)習(xí)泛化能力之間尋找最佳折中,使分類器的實(shí)際風(fēng)險(xiǎn)達(dá)到最小[2~3],而Suykens J.A.K[4]在1999年提出的最小二乘支持向量機(jī)(Least Squares Support Vector Machine,簡(jiǎn)稱 LSSVM)作為支持向量機(jī)的一種,采用最小二乘線性系統(tǒng)作為損失函數(shù),將凸優(yōu)化的求解過(guò)程變成了解一個(gè)等式方程組,求解速度相對(duì)加快,并且在解決模式識(shí)別小樣本、非線性及高維識(shí)別中表現(xiàn)出一定的優(yōu)勢(shì),具有良好的應(yīng)用前景[3-6].測(cè)井資料的水淹層識(shí)別過(guò)程則是一個(gè)典型的小樣本高維非線性模式識(shí)別過(guò)程,因此,針對(duì)低孔低滲透油藏水淹層識(shí)別困難現(xiàn)狀,本文以大慶西部外圍XZ油田為例,給出了LSSVM分類識(shí)別方法,建立分類識(shí)別模型并驗(yàn)證其合理性,試圖尋求一種便捷可行的低孔低滲泥質(zhì)砂巖水淹層識(shí)別方法[7-9].
支持向量機(jī)(SVM)采用結(jié)構(gòu)風(fēng)險(xiǎn)原則訓(xùn)練學(xué)習(xí)機(jī),通過(guò)核函數(shù)的非線性映射把實(shí)際的n維向量從原來(lái)的空間映射到高維特征空間,然后在此高維特征空間中構(gòu)造最優(yōu)線性決策函數(shù),并且用VC維理論度量結(jié)構(gòu)風(fēng)險(xiǎn)最小,算法最終歸結(jié)為求解一個(gè)凸二次規(guī)劃問(wèn)題,從而獲得全局最優(yōu)解.
SVM是從二分類問(wèn)題發(fā)展而來(lái)的.首先要定義一個(gè)用于分類的判別函數(shù),即n為空間的分界面,這個(gè)分界面不僅能將兩類樣本正確的分開,而且還能保證樣本點(diǎn)距離分界面的間隔最大[2].假設(shè)分類線為x·w+b=0(w為權(quán)向量,b∈R),對(duì)它進(jìn)行歸一化,從而使線性可分的樣本集x?Rd,y∈ {+1,- 1},滿足[2]
此時(shí)的分類間隔為2/‖w‖,若使分類間隔最大,則使
最大.所以,求解最優(yōu)分類面問(wèn)題實(shí)質(zhì)上就是求(2)式在約束(1)式下的條件極值.
然而,在實(shí)際應(yīng)用過(guò)程中需要分類識(shí)別的大多是小樣本非線性的,此時(shí),可以通過(guò)非線性映射將問(wèn)題轉(zhuǎn)化為某個(gè)高維空間的線性問(wèn)題,在此高維空間中求解線性分類問(wèn)題,找到最優(yōu)分類面[10].假設(shè)特征空間F內(nèi),對(duì)于線性不可分的間隔超平面是在條件下求如下函數(shù)的極小值
其中 <·>符號(hào)表示在特征空間中求點(diǎn)積,Ψ為Rd→F樣本空間到特征空間的映射,c為懲罰參數(shù),ζi≥0為允許分類誤差而引入的松弛變量.
引入Lagrange乘子,可以將標(biāo)準(zhǔn)支持向量機(jī)的最優(yōu)問(wèn)題轉(zhuǎn)化為如下的二次歸化問(wèn)題:
式中,K(xi,xj)為任意滿足Mercer條件的核函數(shù).
最小二乘支持向量機(jī)作為標(biāo)準(zhǔn)支持向量機(jī)的發(fā)展,將最小二乘線性系統(tǒng)引入到支持向量機(jī)中,用誤差的二范數(shù)作為系統(tǒng)的損失函數(shù),代替了標(biāo)準(zhǔn)支持向量機(jī)中的用誤差來(lái)作為損失函數(shù),所以,最小二乘支持向量機(jī)優(yōu)化問(wèn)題為[4]:
引入Lagrange乘子,可以將最小二乘支持向量機(jī)的優(yōu)化問(wèn)題轉(zhuǎn)化為求解如下線性方程組的問(wèn)題:
大慶西部XZ油田平均滲透率為5.4mD,平均孔隙度為12.6%,泥質(zhì)含量21.5%,屬于典型的低孔低滲泥質(zhì)砂巖油藏.由于該油田儲(chǔ)層物性差異較大,儲(chǔ)層非均質(zhì)性強(qiáng),油田注水后受效不均勻,層間矛盾突出.一是泥質(zhì)和鈣質(zhì)含量較高、薄互層發(fā)育,水淹層常規(guī)測(cè)井響應(yīng)特征不明顯,識(shí)別難度大;二是儲(chǔ)層非均質(zhì)性強(qiáng),各層水淹程度不同,儲(chǔ)層受注入水沖刷,導(dǎo)電機(jī)理發(fā)生變化,水淹層電性特征不能反映儲(chǔ)層的真實(shí)流體性質(zhì),水淹層人工解釋解釋符合率低,給油田開發(fā)帶來(lái)較大的困難.
在測(cè)井解釋中,學(xué)習(xí)樣本的真實(shí)性、代表性和泛化性是決定模型判別效果的關(guān)鍵.因此,本文樣本選取過(guò)程中,主要考慮對(duì)儲(chǔ)層水淹較為敏感的聲波時(shí)差、深側(cè)向等測(cè)井信息以及泥質(zhì)含量等儲(chǔ)層特征信息,且樣本深度段有試油資料作為驗(yàn)證.輸出結(jié)果用正整數(shù)代表油層是否水淹及水淹級(jí)別.在與模型匹配的核函數(shù)選擇的基礎(chǔ)上,編寫了分類計(jì)算程序,通過(guò)有試油資料的多組樣本數(shù)據(jù)學(xué)習(xí)和訓(xùn)練,選取識(shí)別率最高模型對(duì)應(yīng)的參數(shù)為最優(yōu)參數(shù).
經(jīng)過(guò)對(duì)研究目標(biāo)油田測(cè)井曲線和地質(zhì)特征深入分析后,優(yōu)選出以下7個(gè)對(duì)儲(chǔ)層水淹最為敏感的參數(shù):
(1)測(cè)井資料參數(shù):聲波時(shí)差(AC),自然電位(SP),深側(cè)向(RLLD).
(2)儲(chǔ)層參數(shù):泥質(zhì)含量(Vsh),孔隙度(φ).
(3)飽和度:利用取心資料擬合公式計(jì)算含水飽和度(Sw)和束縛水飽和度(Swi).
表1 LSSVM模型部分輸入數(shù)據(jù)
圖1 大慶西部XZ油田A井測(cè)井綜合解釋成果圖
經(jīng)過(guò)優(yōu)選不同核函數(shù)進(jìn)行對(duì)比分析,針對(duì)目標(biāo)油田水淹層識(shí)別和分類問(wèn)題,徑向基函數(shù)(RBF)識(shí)別符合率最高,因此選擇RBF函數(shù)作為核函數(shù),使用網(wǎng)格選擇法確定最優(yōu)的參數(shù)和數(shù)值,最終優(yōu)選的參數(shù)c=2145,σ2=1.
實(shí)驗(yàn)過(guò)程中,根據(jù)算法用C++語(yǔ)言編寫水淹層識(shí)別模型程序,利用已優(yōu)選的參數(shù),從目標(biāo)油田選取有試油資料的20口井70個(gè)小層,將其中的30個(gè)小層輸入樣本作為訓(xùn)練樣本,另外40個(gè)小層的樣本作為驗(yàn)證樣本,輸出結(jié)果利用正整數(shù)分別代表不同的水淹級(jí)別:1代表未水淹層(油層)、2代表差油層、3代表水層、4代表弱水淹層、5代表中水淹層和6代表強(qiáng)水淹層.
表2 復(fù)雜儲(chǔ)層流體性質(zhì)分類結(jié)果
圖1為所選研究目標(biāo)油田的1口井水淹綜合解釋成果圖,人工解釋認(rèn)為PI5-21號(hào)小層是弱水淹層,但通過(guò)所建立的自動(dòng)識(shí)別模型判定為高水淹層,試油資料顯示含水91.2%;PI6號(hào)小層人工解釋為油層,但通過(guò)所建立的自動(dòng)識(shí)別模型判定為中水淹層,試油資料證實(shí)含水63.3%,因此,從試油結(jié)果看,所建立的分類模型識(shí)別結(jié)果是正確的.利用訓(xùn)練好的LSSVM模型對(duì)其余40個(gè)小層的樣本驗(yàn)證,并與試油結(jié)果對(duì)比分析,符合率達(dá)到92.2%(如表2所示).從驗(yàn)證結(jié)果來(lái)看,所建立的LSSVM模型對(duì)電性響應(yīng)較弱的中水淹層和弱水淹層識(shí)別程度高,說(shuō)明最小二乘支持向量機(jī)尤其對(duì)四性關(guān)系較差的儲(chǔ)層水淹程度判別具有高效性.
通過(guò)理論研究和實(shí)驗(yàn)驗(yàn)證,本文所建立的基于最小二乘支持向量機(jī)的水淹層分類識(shí)別模型,可以在給定測(cè)井曲線信息、地質(zhì)信息情況下建立起良好有效的與儲(chǔ)層流體性質(zhì)之間的對(duì)應(yīng)關(guān)系,實(shí)現(xiàn)低孔低滲油田水淹層高精度判別,能夠避免人工解釋引起的誤判.同時(shí),低孔低滲儲(chǔ)層厚度薄、巖性復(fù)雜,測(cè)井曲線不能完全反映地層的真實(shí)流體性質(zhì),因此,水淹層解釋過(guò)程需在生產(chǎn)動(dòng)態(tài)資料的指導(dǎo)下,地質(zhì)、測(cè)井、錄井等多專業(yè)相結(jié)合,才能獲得較高的識(shí)別率.
[1]Vapnik V.The nature of Statistical Learning Theory[M].New York:Springer.1995,10-45.
[2]Burges C J C.A Tutorial on Support Vector Machines for Pattern Reconnition[J].Data Mining and Knowledge Discovering,1998,2(2):32-35.
[3]郭新辰.最小二乘支持向量機(jī)及應(yīng)用研究[D].長(zhǎng)春:吉林大學(xué),2008.12:23-36.
[4]Suykens J A K,Vandew alle J.Least Squares Support Vect or Mach Ine Classif iers[J].Neural rocessing Lett ers,1999,9(3):293- 300.
[5]趙宇,王志良.一種基于支持向量機(jī)的測(cè)井巖性預(yù)測(cè)新方法[J].微計(jì)算機(jī)(測(cè)控自動(dòng)化),2004,20(6):50-51.
[6][11]閻威武,邵惠鶴.支持向量機(jī)和最小二乘支持向量機(jī)的比較及應(yīng)用研究[J].控制與決策,2003,18(3):358-360.
[7]楊斌.一種用于測(cè)井油氣層綜合識(shí)別的支持向量機(jī)方法[J].測(cè)井技術(shù),2005,29(6):512-514.
[8]宋延杰,張劍風(fēng),基于支持向量機(jī)的復(fù)雜巖性測(cè)井識(shí)別方法[J],大慶石油學(xué)院學(xué)報(bào),2007,31(5):18-20.
[9]連承波,等.基于支持向量機(jī)的低阻油層識(shí)別方法及應(yīng)用[J],石油天然氣學(xué)報(bào),2008,30(1):80-82.
[10]張學(xué)工.關(guān)于統(tǒng)計(jì)學(xué)習(xí)理論與支持向量機(jī)[J].自動(dòng)化學(xué)報(bào),2000,26(1):18-21.