周雪 張珊珊 李祿勝 李玉蓉 柳偉明 趙曉亮 董鵬
1. 延長油田股份有限公司志丹采油廠;2. 中國石油大學(xué)(北京)油氣資源與探測國家重點實驗室
實際油藏非均質(zhì)性強,油藏產(chǎn)能主控因素較難確定,因此也造成優(yōu)勢儲層難以判別[1]。目前,對于優(yōu)勢儲層的評價需要基于地震資料及測井資料等的深入研究[2-4],以及基于儲層巖心實驗[5],難以推廣到預(yù)測整個油藏中優(yōu)勢儲層的平面分布[6],且不能兼顧井的實際生產(chǎn)情況,導(dǎo)致預(yù)測精度較低。
隨著算法以及算力的提升,應(yīng)用機器學(xué)習(xí)自動進行優(yōu)勢儲層判別成為可能。目前,主要以有監(jiān)督的機器學(xué)習(xí)算法來進行自動優(yōu)勢儲層判別。該方法使用地震數(shù)據(jù)、測井數(shù)據(jù)、巖性數(shù)據(jù)等,通過人工識別出優(yōu)勢儲層數(shù)據(jù)作為樣本來訓(xùn)練機器學(xué)習(xí)模型[1,7-9]。
然而,該方法首先需要人工為數(shù)據(jù)集標定標簽,提高了應(yīng)用門檻。此外,這些方法一般基于單井剖面進行優(yōu)勢儲層評價,無法確定全區(qū)的優(yōu)勢儲層分布。因此,筆者提出一種基于單分類支持向量機(OCSVM)[10]的全區(qū)儲層評價方法,該方法所使用的數(shù)據(jù)為三維地質(zhì)模型數(shù)據(jù)體。由于單分類支持向量機屬于無監(jiān)督算法,在實際訓(xùn)練過程中,無需專業(yè)人員對地震、測井等數(shù)據(jù)進行優(yōu)勢儲層的標簽標定,僅需人為指定出高產(chǎn)井,并使用該井井周的三維地質(zhì)模型數(shù)據(jù)作為訓(xùn)練樣本。模型訓(xùn)練完成后,即可在全區(qū)范圍內(nèi)檢測高產(chǎn)區(qū)域,為后續(xù)井位部署及調(diào)整、油藏開發(fā)方案設(shè)計提供明確的參考標準。
在實際油田開發(fā)過程中,高產(chǎn)井數(shù)量較少,如何利用高產(chǎn)井所處的地質(zhì)信息來尋找出油藏中類似的區(qū)域分布對布井及開發(fā)有重要現(xiàn)實意義。該問題可看作只有一類樣本的新穎性檢測問題。將高產(chǎn)井近井地質(zhì)信息作為正樣本,通過檢測油藏中是否有類似特點的儲層以獲得較高的產(chǎn)量。本文使用單類支持向量機對儲層的地質(zhì)信息進行檢測,以獲得可能為高產(chǎn)區(qū)的優(yōu)質(zhì)區(qū)域平面分布來確定優(yōu)勢儲層。OCSVM是一種無監(jiān)督算法[11],已廣泛用于異常檢測及入侵檢測領(lǐng)域[12-14]。它學(xué)習(xí)一個決策函數(shù)來進行新穎性檢測,將新數(shù)據(jù)分類為與訓(xùn)練集相似或不同的數(shù)據(jù)。該算法尋找一個超平面使得正例盡可能遠離原點,預(yù)測則是用這個超平面做決策,該超平面被稱為決策邊界。若樣本落在決策邊界正方向,即認為是正樣本,反之為負樣本,如圖1。
圖1 OCSVM分類問題Fig. 1 Classification of OCSVM
OCSVM的目標函數(shù)為
為求解該問題,首先引入拉格朗日函數(shù)
式中,xi為樣本數(shù)據(jù);v為平衡參數(shù),是一待優(yōu)化超參數(shù);ξi為松弛變量,用于控制模型的擬合程度,其值越大,模型越傾向于欠擬合;Ns為樣本個數(shù); Φ為向特征空間映射的函數(shù);w和 ρ分別為特征空間超平面法向量和偏移量;α ,β為拉格朗日因子。
Φ(x)可 以使用核函數(shù)K(xi1,xi2)計算內(nèi)積
令Lp對w,ξ,ρ的偏導(dǎo)分別為0并代入式 (1),并將Φ(x)的內(nèi)積寫為核函數(shù)形式,可對原問題的對偶形式化簡為
求得α,即可確定OCSVM模型。
由此,可通過決策函數(shù)判斷樣本是否屬于正例,如式(5),
若f(x)>0,則表示該樣本落在決策邊界正方向,判定為正例,反之為負例??梢钥闯觯瑳Q策函數(shù)值表征了樣本在投影空間到原點的距離,其值越大,表明該樣本越接近正例樣本。
本文中,所使用的核函數(shù)為高斯核函數(shù),如式(6)。
式中,σ為徑向基半徑,其值大小表示樣本對其他樣本的影響程度,為待優(yōu)化超參數(shù)。
假設(shè)某區(qū)塊有生產(chǎn)井Ns口,該區(qū)小層數(shù)Nl層,地質(zhì)屬性特征Nf個,則樣本集可表示為
在輸入OCSVM模型之前,對樣本集數(shù)據(jù)進行歸一化
其中
最后,在特征維度按層對樣本張量進行拼接后獲得二維輸入數(shù)據(jù)
式中,上標i表示第i口井,上標j表示第j個地質(zhì)屬性,下標k表示第k小層。
對于式(4)的優(yōu)化問題,同時求解出所有 α是較為困難的,因此,Platt提出了序列最小優(yōu)化算法SMO算法[15]來高效求解式(4)。SMO算法采用了一種啟發(fā)式的方法,其基本思想是每次選出兩個α進行優(yōu)化并固定其他的 α值。重復(fù)此過程,直到達到終止條件即可得到優(yōu)化結(jié)果。
為了評價模型質(zhì)量并優(yōu)選模型,構(gòu)建了決策函數(shù)值與產(chǎn)量的相關(guān)性系數(shù)作為評價指標,如式(10)所示。
式中,f(xi) 為 樣本i的決策函數(shù)值,(xi)為樣本決策函數(shù)值的均值,QCi為樣本i的累積產(chǎn)量,QˉCi為樣本平均累積產(chǎn)量。
Cor越接近1,表示決策函數(shù)值與累積產(chǎn)量越正相關(guān),這表明隨著累積產(chǎn)量的增加,決策函數(shù)值將相應(yīng)地增加,其相關(guān)性越強,所訓(xùn)練的模型越能更好地將正樣本分離;Cor越接近?1,表示決策函數(shù)值與累積產(chǎn)量越負相關(guān),表明模型學(xué)習(xí)到了錯誤的特征,無法使得正樣本遠離投影空間原點;Cor越接近0,表示決策函數(shù)值與累積產(chǎn)量越無關(guān)。為確定最優(yōu)模型,可使用相關(guān)性系數(shù)Cor作為評價指標,對模型超參數(shù),如徑向基半徑和平衡參數(shù)進行優(yōu)化。通過調(diào)整超參數(shù),獲得使相關(guān)性系數(shù)Cor最大的模型作為最優(yōu)模型,進而對全區(qū)地質(zhì)特征樣本的決策函數(shù)進行計算來確定優(yōu)勢儲層區(qū)位,圖2為本文中優(yōu)勢儲層評價流程。
圖2 基于單分類支持向量機的優(yōu)勢儲層評價流程Fig. 2 Favorable reservoir evaluation process based on OCSVM
一非均質(zhì)黑油油藏數(shù)值模型如圖3所示,模型網(wǎng)格維度為26×26×5。生產(chǎn)井受平面非均質(zhì)性和縱向非均質(zhì)性的影響。
圖3 案例數(shù)值模型Fig. 3 Numerical model of the case
本文選區(qū)的地質(zhì)屬性特征為滲透率對數(shù)、飽和度和孔隙度,即Nf=3。小層數(shù)為5,即Nl=5。每小層的屬性如圖4所示。生產(chǎn)井20年累積產(chǎn)量如圖5所示,可以看出PR1、PR9、PR7產(chǎn)量顯著較低,因此將其從樣本集中剔除。使用其余井的數(shù)據(jù)對模型進行訓(xùn)練,即Ns=6。從圖5中井周地質(zhì)特征可以看出,對于非均質(zhì)儲層,僅通過對比地質(zhì)特征平均值不能有效地篩選出高產(chǎn)區(qū)域,應(yīng)當結(jié)合地質(zhì)屬性的分布特征進行綜合判斷?;趩畏诸愔С窒蛄繖C的優(yōu)勢儲層評價方法,可以對地質(zhì)屬性的分布特征進行有效利用,提高了優(yōu)勢儲層判別準確度及速度。
圖4 案例數(shù)值模型小層地質(zhì)屬性平面分布圖Fig. 4 Distribution plane of subzone geological attributes in the numerical model of the case
圖5 生產(chǎn)井累積產(chǎn)量及近井地質(zhì)特征分布柱狀圖Fig. 5 Cumulative production of production well and distribution column of geological characteristics near the well
為了確定最優(yōu)OCSVM模型以對全區(qū)儲層進行評價,使用相關(guān)性系數(shù)Cor作為OCSVM模型得分指標,對模型超參數(shù)徑向基半徑和平衡參數(shù)進行優(yōu)化。由圖6可以看出,最優(yōu)徑向基半徑為0.01,最優(yōu)平衡參數(shù)為0.1?;谧顑?yōu)OCSVM模型,使用式(5)計算樣本的決策函數(shù)值后,繪制其與產(chǎn)量的散點圖,如圖7所示,使用式(10)計算其相關(guān)性為0.9764,說明決策函數(shù)通過地質(zhì)信息可以較好地反映產(chǎn)量大小。
圖6 OCSVM模型超參數(shù)優(yōu)化結(jié)果Fig. 6 Optimization result of super parameters of OCSVM model
圖7 累產(chǎn)量與決策函數(shù)關(guān)系圖Fig. 7 Relationship between cumulative production and decision function
基于訓(xùn)練好的OCSVM模型對整個儲層進行評價,將平面上每個網(wǎng)格作為一個樣本,因此,該模型一共可產(chǎn)生26×26=676個樣本。為每個樣本計算決策函數(shù)值,并繪制等高線,如圖8所示。
圖8 決策函數(shù)等高線Fig. 8 Contour of decision function
為了進一步測試模型的可靠性,沿模型的對角線選取3個典型樣本進行日產(chǎn)量對比,如圖9所示,可以看出在決策函數(shù)等高線較大的位置,井的產(chǎn)量也較高。表1總結(jié)了井點處樣本和測試樣本的決策函數(shù)值。
圖9 測試樣本日產(chǎn)量圖Fig. 9 Daily production of test samples
表1 樣本的決策函數(shù)值Table 1 Decision function value of samples
(1)基于高產(chǎn)井的井周地質(zhì)特征,采用單類支持向量機模型對其學(xué)習(xí)并使用決策函數(shù)來評價全區(qū)的地質(zhì)模型數(shù)據(jù),獲得優(yōu)勢儲層平面展布圖。結(jié)果表明,展布圖與產(chǎn)量有著明顯的相關(guān)性,證明該評價方法的有效性。
(2)建立了基于單類支持向量機模型的優(yōu)勢儲層評價方法,該方法由于無需人為給定標簽,使得該方法兼顧了易用性與準確性,為確定全區(qū)高產(chǎn)區(qū)域分布提供了有力工具。