李學(xué)貴,許少華,李 娜
(1.東北石油大學(xué) 計(jì)算機(jī)與信息技術(shù)學(xué)院,大慶 163318;2.山東科技大學(xué) 信息科學(xué)與工程學(xué)院,青島 266590;3.大慶油田化工有限責(zé)任公司 東昊分公司,大慶 163312)
數(shù)字信號(hào)處理
基于支持向量機(jī)和粒子群優(yōu)化的油層開采狀態(tài)識(shí)別
李學(xué)貴1,許少華2,李 娜3
(1.東北石油大學(xué) 計(jì)算機(jī)與信息技術(shù)學(xué)院,大慶 163318;2.山東科技大學(xué) 信息科學(xué)與工程學(xué)院,青島 266590;3.大慶油田化工有限責(zé)任公司 東昊分公司,大慶 163312)
針對(duì)開發(fā)小層生產(chǎn)狀態(tài)評(píng)價(jià)問題,基于油井套損檢測(cè)信號(hào)和儲(chǔ)層巖性、物性、生產(chǎn)動(dòng)態(tài)等動(dòng)靜態(tài)數(shù)據(jù),提出了一種支持向量機(jī)和粒子群優(yōu)化相結(jié)合的判別算法,較大提高了對(duì)多學(xué)科信息的綜合能力和判別的準(zhǔn)確性。
支持向量機(jī);粒子群優(yōu)化;開采狀態(tài)識(shí)別
油管受到腐蝕、外力等作用,就會(huì)引起套管的損壞,影響油層的注水效果和油水產(chǎn)量,破壞油層的開采狀態(tài)。油水井的套管損壞給油田正??碧介_發(fā)生產(chǎn)帶來很大的危害,不僅造成經(jīng)濟(jì)損失,而且影響開發(fā)效果。大慶油田自投入開發(fā)以來至目前共計(jì)發(fā)現(xiàn)套損井近2萬口,占到開發(fā)總井?dāng)?shù)的15.3%,每年以1200口的速度遞增[1,2]。套損井的存在嚴(yán)重制約了油田正常生產(chǎn),已經(jīng)成為了制約油田穩(wěn)產(chǎn)的難題。其危害在于:1)油井由于套損出現(xiàn)了大量的報(bào)廢和停產(chǎn),嚴(yán)重影響了產(chǎn)量;2)增加了大量的修井成本;3)破壞了開發(fā)小層的注采平衡關(guān)系,影響了地層壓力和地質(zhì)情況,又誘發(fā)新的套損。
目前,許多科研人員也對(duì)套損成因機(jī)理做了大量的研究,較多的研究都是從力學(xué)角度出發(fā),設(shè)定邊界條件,進(jìn)行有限元模擬,定性研究套損情況,但是由于地質(zhì)情況的復(fù)雜性及相關(guān)數(shù)據(jù)的不完備性造成了研究的局限性,很多力學(xué)參數(shù)特別是動(dòng)態(tài)參數(shù)是估算而來,很難給出一個(gè)定性或者是定量的結(jié)論,研究區(qū)域以及研究領(lǐng)域的差異性很難用一種通用的機(jī)理來進(jìn)行套損成因描述。近年來,許多學(xué)者考慮將神經(jīng)網(wǎng)絡(luò)等智能方法應(yīng)用到套損預(yù)測(cè),但是神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu)設(shè)計(jì)過于依賴經(jīng)驗(yàn),支持向量機(jī)[3,4]基于結(jié)構(gòu)風(fēng)險(xiǎn)最小化原則,泛化能力更優(yōu)于神經(jīng)網(wǎng)絡(luò),模型參數(shù)設(shè)置也更簡(jiǎn)單,被廣泛應(yīng)用油田勘探開發(fā)匯總[5~10]。為此將支持向量機(jī)應(yīng)用油水井的套管損壞問題,實(shí)現(xiàn)油層開發(fā)狀態(tài)識(shí)別,具有比較重要的實(shí)用價(jià)值。
基于支持向量機(jī)的套管損壞識(shí)別模型在套損數(shù)據(jù)的特征空間中尋找最優(yōu)分類超平面,構(gòu)建全局最優(yōu)的套損分類器。SVM就是通過某種事先選擇的非線性映射將輸入向量映射到一個(gè)高維特征空間,在這個(gè)特征空間中構(gòu)造最優(yōu)分類超平面。
支持向量分類機(jī)的核函數(shù)受核函數(shù)參數(shù)σ影響,求解問題的關(guān)鍵轉(zhuǎn)化為在最優(yōu)核函數(shù)下尋找最優(yōu)的懲罰因子C和核函數(shù)參數(shù)σ,以使得正確分類率最大。因此,以C和σ為對(duì)象在不同核函數(shù)類型下,C和σ在一定范圍內(nèi)取值,對(duì)于選定的C和σ,計(jì)算此組C和σ下訓(xùn)練集驗(yàn)證分類準(zhǔn)確率,最終取得訓(xùn)練集驗(yàn)證分類準(zhǔn)確率最高的那組C和σ作為最佳的參數(shù)。懲罰系數(shù)C與核參數(shù)σ選擇過程實(shí)際上是一個(gè)優(yōu)化搜索過程,采用優(yōu)化算法就可以不必遍歷所有參數(shù)點(diǎn),也能找到全局最優(yōu)解。針對(duì)支持向量機(jī)參數(shù)優(yōu)化問題,采用粒子群優(yōu)化算法對(duì)SVM參數(shù)尋優(yōu)。
圖1 支持向量機(jī)套管損壞識(shí)別算法流程
粒子群優(yōu)化算法主要設(shè)置最大進(jìn)化次數(shù)、種群大小,自身因子和全局因子,慣性因子等參數(shù)。由于優(yōu)化SVM的主要目的在于獲得更高的分類正確率,因此采用訓(xùn)練集進(jìn)行CV意義下分類準(zhǔn)確率Vacc作為粒子群優(yōu)化算法的適應(yīng)度函數(shù),基于粒子群優(yōu)化算法的SVM參數(shù)尋優(yōu)算法描述如下:
Step 1:設(shè)置粒子群優(yōu)化算法參數(shù),最大進(jìn)化次數(shù)、種群大小,自身因子和全局因子,慣性因子等參數(shù),定義適應(yīng)度函數(shù)Vacc;
Step 2:根據(jù)當(dāng)前粒子位置,計(jì)算適應(yīng)度函數(shù);
Step 3:根據(jù)適應(yīng)度函數(shù)值確定當(dāng)前最優(yōu)解;
Step 4:判斷是否滿足迭代終止條件,滿足條件轉(zhuǎn)到Step 6,不滿足Step 5;
Step 5:更新粒子速度,根據(jù)粒子速度更新位置,進(jìn)化步數(shù)t=t+1,轉(zhuǎn)到Step 2;
Step 6:迭代結(jié)束,輸出迄今為止的最優(yōu)解S。
對(duì)于套損指標(biāo)相關(guān)分析模型,選出對(duì)套損類型影響較大的套損指標(biāo)因變量,采用的相似系數(shù)度量方法為夾角余弦和相關(guān)系數(shù)。
2.1 夾角余弦
指標(biāo)Xi的n次觀測(cè)值(x1i,x2i,…,xni)可以看成n維空間向量,則Xi和Xj的夾角αij的余弦稱為兩向量的相似系數(shù),記為:
圖2 PSO優(yōu)化SVM參數(shù)算法流程
當(dāng)指標(biāo)Xi和指標(biāo)Xj平行時(shí),其夾角αij=0,夾角余弦Cij(1)=1,說明這兩個(gè)指標(biāo)向量完全相似,相似度100%;當(dāng)指標(biāo)Xi和指標(biāo)Xj正交時(shí),夾角αij =π2,夾角余弦Cij(1)=0,說明這兩個(gè)向量不相關(guān),相似度為0。
2.2 相關(guān)系數(shù)
相關(guān)系數(shù)是用以反映指標(biāo)之間相關(guān)關(guān)系密切程度的統(tǒng)計(jì)指標(biāo),指標(biāo)Xi和指標(biāo)Xj的相關(guān)系數(shù)常用rij表示,記為Cij(2),即:
當(dāng)Cij(2)=1時(shí),表示兩變量線性相關(guān),一般Cij(2)≤1。
油層開采狀態(tài)識(shí)別數(shù)據(jù)采用S開發(fā)區(qū)某區(qū)塊小層數(shù)據(jù)進(jìn)行資料處理,該區(qū)塊壓裂井?dāng)?shù)多、壓裂層段多、壓裂方式全,是典型的套損井較多的區(qū)塊。選取區(qū)塊中的15口產(chǎn)生套損油井的共301個(gè)小層的靜態(tài)數(shù)據(jù)構(gòu)成數(shù)據(jù)集,另取該區(qū)塊7口井的共141個(gè)小層數(shù)據(jù)組成測(cè)試樣本集,套損類型包括錯(cuò)斷、變形。計(jì)算油層數(shù)據(jù)指標(biāo)與套損類型的相關(guān)系數(shù)值,計(jì)算結(jié)果如表1所示,根據(jù)相關(guān)系數(shù)計(jì)算結(jié)果判斷套損數(shù)據(jù)指標(biāo)對(duì)不同對(duì)于套損類型的影響進(jìn)行分析后,選取套損深度、二類砂巖頂深、二類砂巖厚度、砂巖頂深、砂巖厚度、有效頂深、有效厚度、有效厚度累計(jì)、孔隙度、滲透率、巖性11個(gè)數(shù)據(jù)指標(biāo)作為識(shí)別的輸入指標(biāo)數(shù)據(jù)。
表1 套損數(shù)據(jù)指標(biāo)與套損類別的相關(guān)系數(shù)結(jié)果
箱線圖(Boxplot)是一種描述數(shù)據(jù)分布的統(tǒng)計(jì)圖,利用它可以從視覺的角度來觀察變量值的分布情況,對(duì)指標(biāo)數(shù)據(jù)進(jìn)行繪制箱線圖,如圖3所示。
圖3 套損數(shù)據(jù)指標(biāo)箱線圖
將11種通過相關(guān)分析選擇的數(shù)據(jù)指標(biāo)和套損類型繪制樣本數(shù)據(jù)散點(diǎn)圖,分別繪制12張二維散點(diǎn)圖展示數(shù)據(jù)分布情況,如圖4所示。
基于粒子群算法的支持向量機(jī)參數(shù)尋優(yōu)模型,最大迭代次數(shù)設(shè)置為100,種群數(shù)量設(shè)置10,懲罰因子C的范圍取[0,10],核參數(shù)σ取值范圍[0,10],迭代次數(shù)與適應(yīng)度變化曲線如圖5所示。
圖4 套損數(shù)據(jù)指標(biāo)散點(diǎn)圖
【】【】
圖5 粒子群算法進(jìn)化迭代適應(yīng)度曲線
仿真實(shí)驗(yàn)采用遺傳算法參數(shù)尋優(yōu)方法作為參比模型,支持向量機(jī)的核函數(shù)分別三種核函數(shù):線性核函數(shù)、徑向基(RBF)核函數(shù)和Sigmoid核函數(shù)。不同算法和三種核函數(shù)的套管損壞類型識(shí)別結(jié)果如表2所示。
表2 套損識(shí)別的識(shí)別率比較
從表2仿真實(shí)驗(yàn)結(jié)果可以看出,采用粒子群優(yōu)化算法對(duì)SVM參數(shù)進(jìn)行尋優(yōu)的分類準(zhǔn)確率上也優(yōu)于遺傳算法,得到了較好的效果,為解決油層開采狀態(tài)識(shí)別問題提供了一種較為有效的方法。
針對(duì)基于機(jī)采井套損檢測(cè)數(shù)據(jù)的開發(fā)小層生產(chǎn)狀況診斷分析問題,建立了基于粒子群優(yōu)化的支持向量機(jī)診斷分析模型,可較好解決實(shí)際油田開發(fā)評(píng)價(jià)研究中的小樣本建模問題,提高預(yù)測(cè)模型和診斷分析模型的泛化能力。將PSO-SVM用于基于油田生產(chǎn)過程數(shù)據(jù)的開發(fā)指標(biāo)預(yù)測(cè)和基于套管井損檢測(cè)數(shù)據(jù)的開發(fā)小層生產(chǎn)狀況分析問題,取得了良好的應(yīng)用結(jié)果。
[1] 陸蔚剛,李自平,劉建忠,陳淑華,劉海龍.油田套損信息管理系統(tǒng)存在的問題及對(duì)策[J].大慶石油地質(zhì)與開發(fā),2006,25(6):79-81.
[2] 張斌然,張紅濱,解玉鋒,等.大慶油田套損井綜合管理平臺(tái)的構(gòu)建[J].中外能源,2014,19(6).
[3] Vapnik VN.The Nature of Statistical Learning Theory[M].Neural Networks IEEE Transactions on,1995,10(5):988-999.
[4] Scholkopf B,Smola A J,Williamson R C.New support vector machines[J].Neural Computation,2000,12(5):1207-1245.
[5] 石廣仁.支持向量機(jī)在裂縫預(yù)測(cè)及含氣性評(píng)價(jià)應(yīng)用中的優(yōu)越性[J].石油勘探與開發(fā),2008,35(5):588-594.
[6] 樂友喜,劉雯林.應(yīng)用支持向量機(jī)方法預(yù)測(cè)聚合物驅(qū)參數(shù)[J].石油勘探與開發(fā),2004,31(3):122-124.
[7] 于代國,孫建孟,王煥增,陳偉中,李召成,張振成.測(cè)井識(shí)別巖性新方法-支持向量機(jī)方法[J].大慶石油地質(zhì)與開發(fā),2005,24(5):93-95.
[8] 楊斌,匡立春,孫中春,施澤進(jìn).一種用于測(cè)井油氣層綜合識(shí)別的支持向量機(jī)方法[J].測(cè)井技術(shù),2005,29(6):511-514.
[9] 袁士寶,蔣海巖,鮑丙生,陶軍.基于支持向量機(jī)的火燒油層效果預(yù)測(cè)[J].石油勘探與開發(fā),2007,34(1):104-107.
[10] 石廣仁.支持向量機(jī)在多地質(zhì)因素分析中的應(yīng)用[J].石油學(xué)報(bào),2008,29(2):195-198.
Production condition evaluation of development layer based on support vector machine and particle swarm optimization
LI Xue-gui1, XU Shao-Hua2, LI Na3
TP183
A
1009-0134(2017)04-0008-04
2016-12-19
國家自然科學(xué)基金(61170132);中國石油科技創(chuàng)新基金(2010D-5006-0302)
李學(xué)貴(1982 -),男,山東臨沂人,講師,博士研究生,研究方向?yàn)樯窠?jīng)網(wǎng)絡(luò)和數(shù)據(jù)挖掘。