劉仕友,宋 煒,應(yīng)明雄,孫萬元,汪 銳,牛 悅
(1.中海石油(中國)有限公司湛江分公司,廣東湛江524057;2.中國石油大學(xué)(北京),北京102249)
地震相是三維空間中特定沉積體地震反射參數(shù)的綜合響應(yīng),在相變帶地震反射參數(shù)(如反射結(jié)構(gòu)、振幅、連續(xù)性、頻率和層速度)與相鄰單元不同,因此它產(chǎn)生的反射特征變化表征了沉積物的巖性組合、層理和沉積特征的變化。BROWN等[1]首次提出基于三維地震時(shí)間切片分析和解釋沉積相的方法;WOLFGANG[2]提出利用三維地震技術(shù)研究古代沉積形態(tài)平面展布的基本方法,并將古代沉積在地震時(shí)間切片上的響應(yīng)與現(xiàn)代的密西西比河三角洲的航拍照片進(jìn)行對比,所采用的方法和POSAMENTIER等[3]提出的等比例切片方法類似。ZENG等[4-7]提出了相關(guān)地層切片的方法,利用理論模型研究和實(shí)際資料解釋結(jié)果驗(yàn)證了方法的應(yīng)用效果,并首次定義了“地震沉積學(xué)”的概念。主流的地層切片技術(shù)主要利用地震振幅屬性進(jìn)行地震相劃分,但受地震數(shù)據(jù)分辨率和信噪比的影響,地震振幅屬性在實(shí)際應(yīng)用中存在不確定性和多解性的問題。目前,較為先進(jìn)的地震相劃分方法是基于機(jī)器學(xué)習(xí)的地震相定量分析方法,主要包括有監(jiān)督聚類方法和無監(jiān)督聚類方法[8-9]。有監(jiān)督聚類方法根據(jù)有限的鉆井資料和地震資料建立訓(xùn)練分類器,然后使用該訓(xùn)練器對無井區(qū)域的地震資料進(jìn)行預(yù)測,由于訓(xùn)練樣本較少,難以建立地震波形/地震屬性與已知的儲層含氣性特征的準(zhǔn)確模型,因而預(yù)測精度低[10-12]。徐海等[13]提出了在高精度層序地層格架約束條件下基于波形相對變化的波形-微相定量表征綜合解釋技術(shù),該技術(shù)先利用主成分分析法(principal component analysis,PCA)降維,而后采用有監(jiān)督和無監(jiān)督自組織網(wǎng)絡(luò)(self-organizing map,SOM)神經(jīng)方法實(shí)現(xiàn)波形聚類分析。李輝等[14]采用自組織網(wǎng)絡(luò)神經(jīng)波形聚類的方法識別主河道、河道側(cè)翼等不同疊合模式下的砂體邊界。白博等[15]先對反映貝殼灰?guī)r內(nèi)部反射特征的偽阻抗體進(jìn)行計(jì)算,而后對偽阻抗波形展開聚類分析,預(yù)測了貝克灰?guī)r的展布。劉愛群等[16]在利用分頻屬性分析確定砂體邊界的基礎(chǔ)上,結(jié)合已知油氣田的波形特征,展開聚類分析而后確定有利儲層。林年添等[17]利用不同卷積核卷積升維形成各類縱、橫波地震屬性,然后利用聚類分析法進(jìn)行無監(jiān)督學(xué)習(xí)實(shí)現(xiàn)縱、橫波地震屬性降維,再將聚合屬性作為支持向量機(jī)的學(xué)習(xí)集進(jìn)行含油氣儲層地震預(yù)測。陳雷等[18]提出了一種基于相似性傳播聚類與主成分分析的地震斷層識別方法,并利用該方法對斷層進(jìn)行“量化”解釋。本文引入了基于無監(jiān)督機(jī)器學(xué)習(xí)條件下基于密度的含噪聲應(yīng)用波形空間聚類(density-based spatial clustering of applications with noise,DBSCAN)方法開展地震相分析。與K均值聚類方法和層次聚類方法不同,DBSCAN方法作為典型的基于密度的無監(jiān)督機(jī)器學(xué)習(xí)聚類分析方法,它將簇定義為密度相連的點(diǎn)的最大集合,將滿足條件的高密度區(qū)域劃分為簇[19-20]。該方法無需事先確定地震波形聚類類別數(shù),可有效識別噪聲點(diǎn),并可滿足空間中任意分布的波形聚類,既提高了聚類分析精度也增強(qiáng)了抗噪能力。本文先以地震解釋的基準(zhǔn)參考面為基礎(chǔ),基于地震沉積學(xué)原理制作等時(shí)地層切片,然后沿地層切片在一定時(shí)窗范圍內(nèi)提取地震波形,再對特征波形進(jìn)行標(biāo)準(zhǔn)化處理并輸入DBSCAN程序,以實(shí)現(xiàn)基于無監(jiān)督機(jī)器學(xué)習(xí)的波形聚類地震相分析,最后根據(jù)三維地層物理模型試驗(yàn)和實(shí)際資料處理結(jié)果,驗(yàn)證方法的有效性和適用性。
DBSCAN方法是一種既適用于凸樣本集,又適用于非凸樣本集的典型密度聚類方法,利用樣本集中類的密度連通性,快速發(fā)現(xiàn)任意形狀的樣本類別。該方法的密度連通性涉及鄰域、密度閾值、核心點(diǎn)和邊界點(diǎn)、密度直達(dá)、密度可達(dá)、密度相連、密度分類、噪聲點(diǎn)等參數(shù)。
對于任意樣本集S=(s1,s2,…,sm),則其鄰域(ε)內(nèi)的最小樣本點(diǎn)數(shù),即密度閾值(MinPts)的具體含義如下。①鄰域(ε):對于任意的樣本點(diǎn)sj∈S,其鄰域是指以sj為圓心,以ε為半徑的區(qū)域內(nèi)包含的樣本點(diǎn)的集合。②密度閾值(MinPts):對于空間中任意的樣本sj∈S,其密度閾值是以該點(diǎn)為圓心,以ε為半徑的區(qū)域內(nèi)包含的最小樣本點(diǎn)數(shù)目,Nε(sj)={D(si,sj)≤ε|(si,sj)∈S},其中D為sj與ε內(nèi)任意一點(diǎn)si的距離,Nε(sj)為最小樣本點(diǎn)個(gè)數(shù)。
在核心點(diǎn)密度可達(dá)的條件下,搜尋到的最大密度相連的樣本子集S=(s1,s2,…,sn),n≤m為DBSCAN方法中密度聚類的某個(gè)類簇,其中m是用于聚類分析的樣本個(gè)數(shù),n是某個(gè)類簇樣本子集的樣本個(gè)數(shù)。DBSCAN方法的類簇核心點(diǎn)可以是一個(gè)或多個(gè)。對于單核心點(diǎn),樣本子集S=(s1,s2,…,sn),n≤m內(nèi)的非核心點(diǎn)都在核心對象的鄰域內(nèi);對于多個(gè)核心點(diǎn),樣本子集S=(s1,s2,…,sn),n≤m內(nèi)的任意一個(gè)核心點(diǎn)的鄰域中一定包含其它核心點(diǎn),否則該核心點(diǎn)無法實(shí)現(xiàn)密度可達(dá)條件。
對于多個(gè)核心點(diǎn)的樣本集,首先選擇任意一個(gè)沒有類別的核心點(diǎn)si∈S為種子點(diǎn),尋找該核心點(diǎn)密度可達(dá)條件下的樣本子集形成一個(gè)聚類簇C1=(c11,c12,…,c1n),n≤m;然后選擇另一個(gè)沒有類別的核心點(diǎn)sj∈S,尋找該核心點(diǎn)密度可達(dá)條件下的樣本子集,形成另一個(gè)聚類簇C2=(c21,c22,…,c2n),n≤m,如此這般,直到所有核心點(diǎn)都實(shí)現(xiàn)類別分類。對于一些不位于任何核心點(diǎn)鄰域內(nèi)的異常樣本點(diǎn)按噪聲點(diǎn)處理。DBSCAN方法中的距離度量思想和K-近鄰分類算法的最近鄰思想相同,多采用歐氏距離、曼哈頓距離、切比雪夫距離等度量。對于某些樣本點(diǎn),其到達(dá)兩個(gè)核心點(diǎn)的距離都小于ε,且兩個(gè)核心點(diǎn)均不符合密度可達(dá)條件,故不屬于同一類簇。針對這種情況,DBSCAN方法根據(jù)先來后到的順序,采用先進(jìn)行聚類的類簇標(biāo)記該樣本點(diǎn),因此DBSCAN方法并非完全穩(wěn)定。
圖1 采用DBSCAN方法進(jìn)行密度聚類示意
圖1中給定鄰域和密度閾值(MinPts=5),紅色樣本點(diǎn)為核心點(diǎn),黑色樣本點(diǎn)為非核心點(diǎn),可以看出以鄰域?yàn)榘霃?紅色核心樣本點(diǎn)為中心的圓形區(qū)域內(nèi)的樣本點(diǎn)滿足密度直達(dá)條件,不在該圓形區(qū)域內(nèi)的樣本點(diǎn)不滿足密度直達(dá)條件。圖1中綠色箭頭連接的核心點(diǎn)為滿足密度可達(dá)條件的樣本序列,在鄰域內(nèi)該序列的所有樣本點(diǎn)密度相連,因此這些點(diǎn)可劃分為同一類簇。
為了展示DBSCAN方法對非凸數(shù)據(jù)集聚類的優(yōu)勢,生成1組3簇隨機(jī)數(shù)據(jù),其中兩組是非凸的。圖2a 為3簇隨機(jī)數(shù)據(jù),圖2b是對圖2a數(shù)據(jù)采用K均值聚類方法進(jìn)行聚類分析的結(jié)果,圖2c是對圖2a 數(shù)據(jù)采用DBSCAN方法進(jìn)行聚類分析的結(jié)果。從聚類分析結(jié)果看,采用K均值聚類方法對非凸數(shù)據(jù)集聚類分析的結(jié)果不理想,而采用DBSCAN方法可以準(zhǔn)確區(qū)分3類樣本,得到滿意的聚類分析結(jié)果。從本例可以看出,對于非規(guī)則隱蔽型儲集體如河道砂體等,其空間展布的形態(tài)往往是非凸的,采用DBSCAN方法進(jìn)行聚類分析,可獲得良好的聚類分析結(jié)果。
圖2 采用不同方法聚類分析的結(jié)果a 3簇隨機(jī)數(shù)據(jù); b K均值聚類方法; c DBSCAN方法
和數(shù)值模擬相比,三維地震物理模擬所獲得的地震記錄更接近實(shí)際情況,其研究成果可靠性強(qiáng),且經(jīng)濟(jì)高效。為了研究南海深水區(qū)砂巖儲層的空間展布規(guī)律,我們結(jié)合實(shí)際情況設(shè)計(jì)了相應(yīng)的三維地層物理模型,在考慮地質(zhì)條件合理性的同時(shí),盡量讓模型與真實(shí)沉積層序接近且具備一定的地層復(fù)雜性。設(shè)計(jì)的三維地層物理模型空間比例尺為1∶10000,實(shí)際地質(zhì)體大小為8000m×6400m×2200m,共有5個(gè)砂層,砂層厚度為5~15m不等,各砂層的形態(tài)和空間分布不同。表1為三維地層物理模型的縱、橫波速度和密度,該模型及其在水槽中擺放方式如圖3所示,圖4為該模型第1~6層的砂體自上而下的空間分布情況,圖5為該模型砂體垂向剖面。由于三維地層物理模型中的砂體薄且形狀各異,因此制作地層切片的關(guān)鍵在于選擇具有地質(zhì)時(shí)間意義的反射界面。圖6為某條主測線的克?;舴蚍e分時(shí)間偏移的地震剖面及等時(shí)地層切片解釋剖面的疊合顯示。
表1 三維地層物理模型的縱、橫波速度和密度
機(jī)器學(xué)習(xí)算法通常需要假設(shè)特征數(shù)據(jù)符合正態(tài)分布規(guī)律,即滿足零均值且單位方差呈高斯分布,為此需要對輸入數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化處理,使其滿足正態(tài)分布。我們選擇Scikit-Learn的開源數(shù)學(xué)庫中的StandardScalar程序?qū)斎霐?shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化處理[21],將Inline41中的200道波形曲線作為樣本輸入聚類分析程序(圖7)。
圖3 三維地層物理模型示意(單位:mm)
圖4 三維地層物理模型第1~6層砂體自上而下的空間分布情況
圖5 三維地層物理模型砂體垂向剖面(單位:mm)
圖6 某條主測線的克希霍夫積分時(shí)間偏移的地震剖面及等時(shí)地層切片解釋剖面的疊合顯示
自下向上逐層澆筑形成三維地層物理模型,高速砂巖由環(huán)氧樹脂添加滑石粉制成。圖8a是第1層“蛇形”砂體頂、底疊置顯示的平面形態(tài),黃色區(qū)域代表砂巖底面,白色區(qū)域代表砂巖頂面。在實(shí)際制作中,由于模型誤差和環(huán)氧樹脂添加滑石粉時(shí)無法保證混合均勻,因此導(dǎo)致砂體介質(zhì)傳播速度的變化。圖8b 是沿地層切片提取的均方根(root mean square,RMS)振幅屬性,可用于描述砂體的展布和形態(tài),但無法分辨砂體頂、底面。圖8c、圖8d、圖8e和圖8f分別是不同鄰域和密度閾值參數(shù)下采用DBSCAN方法得到的波形聚類屬性,該方法可用于描述砂體的空間展布及頂、底邊界的范圍。當(dāng)鄰域和密度閾值變化時(shí),波形聚類屬性明顯不同,因此如何合理確定鄰域和密度閾值是應(yīng)用DBSCAN方法的關(guān)鍵,其參數(shù)優(yōu)選相對于傳統(tǒng)的K均值聚類算法略顯復(fù)雜,需對鄰域和密度閾值展開聯(lián)合調(diào)試,但無需事先確定聚類類別數(shù)。分析可知,隨著鄰域和密度閾值的同時(shí)增大,聚類類別數(shù)變小;用于分類的子波樣點(diǎn)數(shù),即波形向量的維度,與分類結(jié)果相關(guān)。
圖7 作為樣本輸入聚類分析程序的200道波形曲線
圖8 第1層模型平面形態(tài)及沿地層切片提取的均方根振幅屬性和采用DBSCAN方法得到的波形聚類屬性a 第1層“蛇形”砂體頂、底疊置顯示的平面形態(tài); b 均方根振幅屬性; c 波形聚類屬性(ε=0.3,MinPts=5,波形向量31維,聚類類別為7類); d 波形聚類屬性(ε=0.2,MinPts=5,波形向量21維,聚類類別為7類); e 波形聚類屬性(ε=0.15,MinPts=4,波形向量31維,聚類類別為9類); f 波形聚類屬性(ε=0.4,MinPts=7,波形向量31維,聚類類別為5類)
圖9a是第3層“腸狀”砂體和“橢圓形”泥巖頂、底疊置顯示的平面形態(tài)展布,黃色區(qū)域代表砂巖底面,白色區(qū)域代表砂巖頂面。圖9b是沿地層切片提取的均方根振幅屬性,可以用于劃分地層空間展布形態(tài)。圖9c 和圖9d均為采用DBSCAN方法得到的波形聚類屬性,其“腸狀”砂體和“橢圓形”泥巖平面形態(tài)展布刻畫較RMS振幅屬性更加精確,但采用不同的鄰域和密度閾值得到的波形聚類屬性明顯不同。無論是均方根振幅屬性還是聚類分析屬性,都無法區(qū)分“腸狀”砂巖和“橢圓形”泥巖的巖性,這與該模型制作過程中,砂、泥巖材料彈性參數(shù)差異不明顯有一定關(guān)系。
圖9 第3層模型的平面形態(tài)、沿地層切片提取的均方根振幅和采用DBSCAN方法得到的波形聚類屬性a 第3層“腸狀”砂體和“橢圓形”泥巖頂、底疊置顯示的平面形態(tài); b RMS振幅屬性; c 波形聚類屬性(ε=0.3,MinPts=5,波形向量21維,聚類類別為7類); d 波形聚類屬性(ε=0.2,MinPts=5,波形向量11維,聚類類別為7類)
從上述分析可以看出盡管該模型的砂層非常薄,但通過地層切片得到的地震相水平分辨率高。因模型在澆鑄過程中不能均勻成型,導(dǎo)致砂層中砂體的背景介質(zhì)不均勻,故該模型除砂體之外的部分也存在相帶的變化。利用均方根振幅屬性進(jìn)行地震相劃分得到的相帶變化的邊界不是特別清晰,未能顯示出某些局部相帶的變化;利用波形聚類屬性進(jìn)行地震相描述得到的結(jié)果更詳細(xì),對地震相帶變化的劃分更精確。將地震沉積學(xué)原理與無監(jiān)督機(jī)器學(xué)習(xí)條件下的DBSCAN方法相結(jié)合,可進(jìn)一步提高地震相劃分的精度。
實(shí)際地震資料來自瓊東南盆地深水區(qū)某目標(biāo)區(qū),該區(qū)內(nèi)未鉆井,目標(biāo)儲層為具有強(qiáng)反射特征的砂巖儲集體,在地震剖面上表現(xiàn)為強(qiáng)振幅反射特征。
以地震解釋得到的特征反射格架層T50,T60,T70,T100為基礎(chǔ),根據(jù)地震沉積學(xué)原理,將上述特征反射格架層細(xì)分為相應(yīng)的地層切片,圖10為目標(biāo)區(qū)聯(lián)絡(luò)測線855的地層切片解釋剖面。圖11是解釋層位T100的等t0結(jié)果,可以看出目標(biāo)區(qū)東南部是構(gòu)造高點(diǎn),西北部是構(gòu)造斜坡帶。
圖12a是全角度疊加的地震數(shù)據(jù)沿T100層切片的RMS振幅屬性,可以看出在構(gòu)造高部位和斜坡帶均呈強(qiáng)振幅反射特征。單憑RMS振幅屬性細(xì)分強(qiáng)反射特征差異困難,因此對不同角度道集疊加的地震數(shù)據(jù)沿T100層切片提取的RMS振幅屬性展開分析(圖12b、圖12c和圖12d),可以看出在構(gòu)造高部位和斜坡帶均有明顯的AVO特征;將從大角度道集疊加地震數(shù)據(jù)提取的RMS振幅屬性與小角度疊加地震數(shù)據(jù)提取的RMS振幅屬性相比發(fā)現(xiàn),盡管存在強(qiáng)反射特征差異,僅利用RMS振幅屬性很難將這些差異通過相帶劃分表達(dá)。為劃分不同反射特征的地震相帶,我們采用DBSCAN方法對T100層進(jìn)行聚類分析(ε=0.3,MinPts=5,波形向量為21維)。圖13a是全角度疊加的地震數(shù)據(jù)沿T100層切片的波形聚類屬性,從屬性分布可以看出,構(gòu)造高點(diǎn)反射特征被分為3類,斜坡帶反射特征被分為5類,其中構(gòu)造高部位的黃色區(qū)域分布著目標(biāo)儲集體,但該方法無法區(qū)分不同類型的強(qiáng)振幅反射特征。對不同角度道集疊加的地震數(shù)據(jù)沿T100層切片展開DBSCAN分析,得到的小角度道集疊加地震數(shù)據(jù)沿T100層切片的波形聚類屬性和大角度道集疊加地震數(shù)據(jù)沿T100層切片的波形聚類屬性差異明顯(圖13b、圖13c和圖13d),這預(yù)示著不同角度道集疊加地震數(shù)據(jù)沿層切片的波形聚類屬性可反映AVO特征。從圖13d可以看出,斜坡帶和構(gòu)造高點(diǎn)被分為不同的類。在構(gòu)造高點(diǎn)波形聚類屬性被分為3類:構(gòu)造高部位斜坡帶的黃色區(qū)域可能分布著含氣潛山風(fēng)化殼儲集體,構(gòu)造低部位的儲集體波形聚類屬性被分為其余2類。由此可見,利用不同角度道集疊加地震數(shù)據(jù)沿地層切片展開DBSCAN分析,可解決全角度疊加地震數(shù)據(jù)沿地層切片展開聚類分析時(shí)無法區(qū)分有效儲層的問題,因而為儲層預(yù)測奠定了基礎(chǔ)。
圖10 目標(biāo)區(qū)聯(lián)絡(luò)測線855的地層切片解釋剖面
圖11 解釋層位T100的等t0結(jié)果
圖12 全角度及不同角度道集疊加地震數(shù)據(jù)沿T100層切片的RMS振幅屬性a 全角度; b 角道集(3°~9°); c 角道集(15°~21°); d 角道集(27°~33°)
圖13 全角度及不同角度疊加地震數(shù)據(jù)沿T100層切片的波形聚類屬性(ε=0.3,MinPts=5)a 全角度; b 角道集(3°~9°); c 角道集(15°~21°); d 角道集(27°~33°)
三維地層物理模型的實(shí)驗(yàn)結(jié)果表明,在合理選擇參考地震同相軸的情況下,將地震沉積學(xué)原理與基于密度的含噪角道集波形聚類方法相結(jié)合,可顯著提高地層切片的橫向分辨率。與基于RMS振幅屬性的地震相分析技術(shù)相比,采用本文方法進(jìn)行相邊界劃分的精度高。鄰域和密度閾值是DBSCAN方法的重要參數(shù),需要聯(lián)合調(diào)試優(yōu)選參數(shù),不同的參數(shù)組合對聚類分析的結(jié)果影響大。實(shí)際地震資料處理時(shí),在綜合考慮AVO效應(yīng)差異的前提下,對全角度和不同角度道集疊加的地震數(shù)據(jù)沿地層切片進(jìn)行DBSCAN分析可知,該方法不但可以增加地震相劃分的可靠性,還可以區(qū)分相同類型儲層的含氣性差異。本文方法具有強(qiáng)魯棒性和高橫向分辨率的特征,是儲層相變分析和沉積相研究的輔助工具。實(shí)際應(yīng)用中需要注意以下3點(diǎn):①聯(lián)合優(yōu)選參數(shù)鄰域時(shí),應(yīng)根據(jù)已知信息(如井、巖相標(biāo)定、沉積模式、儲層預(yù)測成果等)調(diào)整參數(shù);②地層切片的解釋和劃分將直接影響聚類分析結(jié)果的精度和可靠性;③聚類分析的波形向量維度和儲層厚度相關(guān),需針對儲層特征,合理選擇波形向量維度。