王桂芳,王碩亮,許學健,雷燕,康波
(1.中國石油 吐哈油田分公司 勘探開發(fā)研究院,新疆 哈密 839009;2.中國地質(zhì)大學 能源學院,北京 100083)
KS 油田位于哈薩克斯坦南圖爾蓋盆地Aryskum坳陷Ashisai 凸起,構造頂部發(fā)育小斷層,油藏內(nèi)部斷裂不發(fā)育[1-4]。主要目的層為白堊系和上侏羅統(tǒng),發(fā)現(xiàn)MⅠ、MⅡ、JⅠ、JⅡ、JⅢ和JⅣ共6套含油層系。儲集層物性較好,為中—高孔、中—高滲儲集層,其中白堊系儲集層平均孔隙度為28.7%,平均滲透率為2 288 mD;侏羅系儲集層平均孔隙度為23.8%,平均滲透率為625 mD。油藏原油性質(zhì)較好,具有低密度和低黏度的特點。該油田已進入開發(fā)后期,含水率高達98.2%[5-8],采出程度達90.9%,多數(shù)采油井處于高含水率、低產(chǎn)油量的狀態(tài)。KS 油田儲集層砂巖強親水,在均質(zhì)砂巖中水驅(qū)效率很高,注入高效驅(qū)油劑后采收率提高幅度有限;在非均質(zhì)砂巖中,注入水易沿高滲層竄流,波及體積小[9]。因此,亟需開展注水井調(diào)剖,但該油田調(diào)剖堵水經(jīng)驗欠缺,調(diào)剖堵水選井決策時的具體界限難以界定。
調(diào)剖堵水常用的選井選層方法有PI 決策[10-13]和RE 決策,對于中—高滲儲集層,PI決策中的壓力指數(shù)決策方法雖然不能保證調(diào)剖效果,但能夠指導調(diào)剖措施的實施,因為壓力指數(shù)能反映中—高滲儲集層的滲透率,高滲通道可使?jié)B透率增大,儲集層非均質(zhì)性增強[14-17],但是僅通過注水井井口壓降測試數(shù)據(jù)來判斷注水井是否應該調(diào)剖,沒有考慮采油井的生產(chǎn)狀況,不能充分體現(xiàn)油藏的整體開發(fā)規(guī)律。RE 決策的指標選取較PI 決策更加全面,但是各指標的界限和權重難以確定,不同類型油藏的不同開發(fā)階段對調(diào)剖選井決策的指標界限和權重影響較大,人為干擾因素過多。
本文提出調(diào)剖選井模糊聚類方法,根據(jù)KS 油田地質(zhì)特征和生產(chǎn)特征,構建基于多項式核函數(shù)、徑向基核函數(shù)和Sigmoid 核函數(shù)[18]的新型核函數(shù),提高調(diào)剖選井的樣本集識別率和檢測集識別率。將該方法應用于KS 油田,篩選出3 口注水井調(diào)剖,都取得較好的降水增油效果。
首先,更新劃分矩陣U=[μij]:
更新聚類中心:
根據(jù)所選擇的指標體系與最終結果的邏輯關系,確定聚類類別的物理意義和對應措施。
從計算過程可以看出,模糊聚類分析是一個爬坡過程,以類間距離最大和類內(nèi)距離最小為準則,不斷進行迭代計算,直至得到最優(yōu)解。因此,此計算過程對距離的表達式要求很高,不同的指標集合、不同的數(shù)據(jù)形式,所對應的最優(yōu)距離表達式不同,目前常用5種距離表達式(表1)。
表1 模糊聚類類間最優(yōu)距離計算方法Table 1.Calculation methods of the optimal distance between fuzzy clusters
在聚類分析過程中,利用不同的距離表達式,識別出來的各類模式結果也不相同,這主要取決于目標數(shù)據(jù)體的分布形式。例如,歐氏距離(歐幾里德距離)可以識別出圓形的數(shù)據(jù)形式,如果研究目標是圓形的分布模式,利用歐氏距離可較準確識別;若研究目標是矩形或三角形的分布模式,則誤差較大。
以KS 油田的實際數(shù)據(jù)為基礎,分別利用歐氏距離和曼哈坦距離公式進行模糊聚類計算。利用歐氏距離識別出的3 個類中心坐標分別為(1.065,0.006),(2.998,0.041),(4.940,0.018);利用曼哈坦距離識別出的3個類中心坐標分別為(1.056,0.017),(3.102,-0.029),(4.911,0.001)。采用不同表達式計算的距離具有差異,因此明確數(shù)據(jù)的分布規(guī)律十分必要。在調(diào)剖選井決策中,如果沒有明確研究目標的數(shù)據(jù)分布模式,在距離表達式的選取上,必然存在一定的盲目性。直接用某一種距離計算方法對油水井進行分類,容易產(chǎn)生較大的誤差。
考慮到核函數(shù)具有將空間非線性樣本映射到高維空間呈線性分布的特征,將核函數(shù)引入模糊聚類計算,以解決油田動態(tài)數(shù)據(jù)分布特征不穩(wěn)定的問題。常用的核函數(shù)有多項式核函數(shù)、徑向基核函數(shù)和Sigmoid核函數(shù)(表2)。
表2 常用核函數(shù)的表達式和特征Table 2.Expressions and characteristics of commonly used kernel functions
由于以上核函數(shù)均存在一定不足,本文將以上3種核函數(shù)進行多元線性組合,構建了一種新型核函數(shù)。新型核函數(shù)中存在n1、n2和n3共3個待定系數(shù),代表3種核函數(shù)對新型核函數(shù)的影響程度,可通過模糊聚類學習樣本進行機器學習和訓練時確定具體數(shù)值。構建的新型核函數(shù)為:
由于KS 油田調(diào)剖樣品數(shù)量較少,選用與KS 油田相鄰的KN 油田的調(diào)剖堵水數(shù)據(jù),作為學習和檢測的樣本。KN 油田累計實施調(diào)剖堵水達100 余井次,將調(diào)剖后增油量超過300 t 的單井作為急需調(diào)剖的學習樣本;將調(diào)剖后見效但增油量小于300 t 的單井作為密切觀察的學習樣本;將無需調(diào)剖的單井作為正常生產(chǎn)的學習樣本,分別采用多項式核函數(shù)、徑向基核函數(shù)、Sigmoid 核函數(shù)和本文構建的新型核函數(shù)進行學習和驗證。由計算結果可知,新型核函數(shù)的樣本集識別率和檢測集識別率比其他幾種核函數(shù)更高(表3),說明新型核函數(shù)對于調(diào)剖堵水選井決策指標體系的數(shù)據(jù)具有較好的學習和預測能力。因此,選用新型核函數(shù)對KS油田的基礎數(shù)據(jù)進行空間轉(zhuǎn)換。
表3 各類核函數(shù)樣本識別結果Table 3.Recognition results of various kernel function samples
根據(jù)KS 油田的生產(chǎn)特點,確定了注水井調(diào)剖模糊聚類方法的指標體系選取原則:①數(shù)據(jù)多,模糊聚類方法對具有一定規(guī)模和分布規(guī)律的數(shù)據(jù)有較好的識別效果;②時間長,能夠反映長期高強度注水開發(fā)后儲集層孔隙結構的變化;③成本低,要求決策過程費用低、周期短、不影響生產(chǎn);④時效性好,要求指標體系能夠較準確反映目前實際生產(chǎn)狀況和變化趨勢;⑤獨立性強,指標體系之間不能存在共軛性。根據(jù)以上原則,最終確定了4 個靜態(tài)指標(有效厚度、滲透率、滲透率突進系數(shù)、滲透率變異系數(shù))、4個注水井指標(日注水量、注水油壓、視吸水指數(shù)、單位厚度累計注水量)、4 個采油井指標(日產(chǎn)液量變化率、含水率、視產(chǎn)液指數(shù)變化率、單位厚度累計產(chǎn)液量)和2 個井間指標(油水井關聯(lián)性、關聯(lián)性變化率)。該指標體系的數(shù)值越大,越需要調(diào)剖,因此,類中心數(shù)值最大的一類對應的選井決策結果是急需調(diào)剖[19-20],類中心數(shù)值最小的一類對應的選井決策結果是正常生產(chǎn)。
本文提出的基于新型核函數(shù)的調(diào)剖選井模糊聚類方法主要包括4 個步驟,分別是數(shù)據(jù)標準化、數(shù)據(jù)特征降維、聚類計算和歸類分析。
(1)數(shù)據(jù)標準化 為了使影響資料質(zhì)量的各種系統(tǒng)誤差降到最低,需要對數(shù)據(jù)進行標準化處理。假設由原始數(shù)據(jù)構成的矩陣經(jīng)標準化后形成矩陣Sj為第j個變量的標準差。相關公式如下:
(2)數(shù)據(jù)特征降維 由于單井描述特征較多,數(shù)據(jù)可讀性差,特征多重共線性嚴重,算法的搜索難度大,計算成本高,需要將數(shù)據(jù)進行特征降維,將高維模型投影到低維模型上。假設Rn為某個數(shù)據(jù)集,可得一組有序的正交基向量,對任意X∈Rn,降維之后的向量可表示為:
(3)聚類計算 基于新型核函數(shù)的模糊聚類算法,可以根據(jù)實際情況,產(chǎn)生最合適的類的數(shù)目,半徑和最小密度閾值均為全局參數(shù)。
(4)歸類分析 基于新型核函數(shù)的模糊聚類算法可以根據(jù)實際情況產(chǎn)生最佳分類數(shù),可以通過調(diào)試最小密度閾值得到規(guī)定分類數(shù)。
對KS 油田22 口注水井進行模糊聚類計算,結果表明,急需調(diào)剖的井有3 口,密切觀察和正常生產(chǎn)的井分別為13口和6口(表4)。
表4 KS油田注水井調(diào)剖選井結果Table 4.Results of water injection well selection for profile control in KS oilfield
對這3 口注水井實施調(diào)剖,均取得了較好的降水增油效果(表5)。從采油井2717 井的生產(chǎn)曲線可以看出,注水井2716井調(diào)剖后,對應采油井2717井含水率明顯下降,產(chǎn)油量顯著上升,表明注水井調(diào)剖選井工作較為成功(圖1)。
表5 KS油田典型注水井調(diào)剖效果統(tǒng)計Table 5.Statistics of profile control effects for typical water injection wells in KS oilfield
(1)針對KS油田的地質(zhì)和生產(chǎn)特點,對傳統(tǒng)的調(diào)剖注水井選井決策方法進行了改進,采用多元線性組合的方式構建了一種新型核函數(shù),建立了新型的模糊聚類算法,選擇需要調(diào)剖的井,能夠達到較高的擬合精度和預測精度。
(2)新型注水井調(diào)剖選井決策方法應用于KS油田,從22口注水井中優(yōu)選出3口進行調(diào)剖,取得了較好的增油降水效果。
符 號 注 釋
A——協(xié)方差矩陣;
b——聚類中心迭代次數(shù);
c,v——Sigmoid核函數(shù)參數(shù);
d——距離,m;
g——加權指數(shù);
h——樣本數(shù)最大值;
i,j——元素序號;
k——樣品指標數(shù);
K(xi,xj)——核函數(shù);
m,n——i,j的最大值;
n1、n2、n3——待定系數(shù);
p——樣品指標數(shù)最大值;
q——階數(shù);
Rn——數(shù)據(jù)集;
Sj——第j個變量的標準差;
U——矩陣;
vi——行聚類中心;
vk——列聚類中心;
Vb——第b個聚類中心;
Vb+1——第b+1個聚類中心;
x′——標準化矩陣;
xi——第i行數(shù)據(jù);
xik——第i行第k列數(shù)據(jù);
xij——第i行第j列數(shù)據(jù);
——標準化矩陣第i行第j列數(shù)據(jù);
xj——第j列數(shù)據(jù);
xjk——第j行第k列數(shù)據(jù);
X——降維后向量;
yn——降維前第n個向量;
ε——模糊聚類精度要求;
μij——模糊聚類劃分矩陣;
σ——函數(shù)寬度參數(shù);
φi——第i個正交基向量;
φn——第n個正交基向量。