李祺鑫 羅亞能 馬曉強(qiáng) 陳 誠(chéng) 祝彥賀
(①中海油研究總院有限責(zé)任公司,北京 100028; ②東方地球物理公司物探技術(shù)研究中心,河北涿州 072751)
地震相分析是根據(jù)地震反射同相軸的外部形態(tài)、內(nèi)部結(jié)構(gòu)、頂?shù)捉佑|關(guān)系、動(dòng)力學(xué)以及運(yùn)動(dòng)學(xué)特征,分析地層、巖性及油氣分布情況,在油氣田的勘探、評(píng)價(jià)、開發(fā)、生產(chǎn)等階段都有著廣泛的應(yīng)用。
20世紀(jì)90年代以前,多以二維地震數(shù)據(jù)為主,解釋人員通過視覺、逐個(gè)剖面定性描述同相軸的振幅、頻率、相位等信息[1],并根據(jù)這些信息的差別,結(jié)合區(qū)域構(gòu)造、沉積背景,依據(jù)鉆井標(biāo)定,進(jìn)一步將地震相轉(zhuǎn)化為沉積相,這是狹義上的地震相分析流程[2]。之后,三維地震勘探興起,數(shù)據(jù)量大幅增加,解釋人員逐個(gè)剖面地開展地震相分析已經(jīng)變得不切實(shí)際。隨著地震屬性技術(shù)的發(fā)展,進(jìn)入了以地震屬性分析技術(shù)為中心的地震相分析階段,這是廣義上的地震相分析。
地震屬性分析主要是通過對(duì)原始地震數(shù)據(jù)進(jìn)行某種數(shù)學(xué)變換,提取或是放大原始地震信號(hào)的某種差異,如瞬時(shí)屬性、幾何結(jié)構(gòu)等; 后來又進(jìn)一步提出如甜點(diǎn)、紋理[3]、地震倒譜特征[4]等屬性。通常情況下,地質(zhì)體特征需要借助不同地震屬性進(jìn)行多維度刻畫。以機(jī)器學(xué)習(xí)視角而言,通過多維屬性空間開展地震相分析是一個(gè)典型的模式識(shí)別問題。根據(jù)是否使用“標(biāo)簽”數(shù)據(jù)(如鉆井、巖心、露頭資料等)輔助地震相分析以及參與算法訓(xùn)練,地震相分析可分為有監(jiān)督和無監(jiān)督兩種類型。
無監(jiān)督地震相分析是一種純數(shù)據(jù)驅(qū)動(dòng)、不依賴于標(biāo)簽數(shù)據(jù)的方法,旨在將數(shù)據(jù)中呈現(xiàn)的自然模式通過算法表示出來。常用的無監(jiān)督算法包括K-Means聚類[5-6]、自組織映射(SOM)[7-8]等。該類方法可以反映不同地震反射特征之間的差別,其存在的主要問題是如何將已有的地質(zhì)認(rèn)識(shí)、鉆探成果與地震相相匹配。
有監(jiān)督地震相分析是通過建立地震反射特征與標(biāo)簽數(shù)據(jù)對(duì)之間的映射關(guān)系,將已證實(shí)的地質(zhì)認(rèn)識(shí)與地震相關(guān)聯(lián)。有監(jiān)督地震相分析的算法種類繁多,常用的有貝葉斯分類、隨機(jī)森林、支持向量機(jī)等。Wrona等[9]對(duì)比了20種機(jī)器學(xué)習(xí)算法,其中有監(jiān)督類地震相分析技術(shù)預(yù)測(cè)精度最高可達(dá)0.983。
許多學(xué)者研究了有監(jiān)督與無監(jiān)督地震相分析方法的優(yōu)劣及適用性[10-14]。其中,Ross等[14]認(rèn)為無監(jiān)督地震相分析技術(shù)適用于宏觀尺度、介觀尺度的沉積相描述,而有監(jiān)督地震相分析技術(shù)比較適合于儲(chǔ)層尺度的儲(chǔ)層描述。但無論是有監(jiān)督型還是無監(jiān)督型,地震相分析結(jié)果對(duì)地震屬性均具有極高的依賴性。
面對(duì)越來越多的地震屬性種類,選擇地震屬性或是地震屬性組合輔助地震相的研究變得越來越困難[15-16]。為了解決這個(gè)問題,Zhao等[17]和Qi等[18]研究了屬性種類的篩選方法,以規(guī)避解釋人員對(duì)于屬性選擇的主觀性。
地震相分析主要包括地震屬性提取和歸類兩個(gè)方面。以AlexNet網(wǎng)絡(luò)[19]為代表的深度學(xué)習(xí)技術(shù)通過逐層堆疊非線性神經(jīng)元,對(duì)大量原始數(shù)據(jù)進(jìn)行多層級(jí)的變換,自動(dòng)發(fā)現(xiàn)適用于聚類、分類、監(jiān)測(cè)目標(biāo)的數(shù)據(jù)表示[20]。因此,深度學(xué)習(xí)技術(shù)可以開展數(shù)據(jù)驅(qū)動(dòng)下的地震相分析,避開人為屬性選擇的主觀性。
利用合成數(shù)據(jù)或豐富的井?dāng)?shù)據(jù)作為地震相標(biāo)簽,建立端到端的卷積神經(jīng)網(wǎng)絡(luò)模型,可以直接輸出地震相的分類結(jié)果[21-23]。通常情況下,豐富的地震相標(biāo)簽數(shù)據(jù)是一項(xiàng)稀缺資源[24],而無監(jiān)督類的深度學(xué)習(xí)算法是一種對(duì)數(shù)據(jù)要求較低且具廣泛應(yīng)用前景的技術(shù)。Qian等[25]利用深度卷積自編碼網(wǎng)絡(luò),對(duì)疊前地震道集進(jìn)行數(shù)據(jù)特征的表示學(xué)習(xí),然后利用K-Means算法對(duì)學(xué)習(xí)得到的特征空間進(jìn)行聚類。Duan等[26-27]借鑒計(jì)算機(jī)視覺所發(fā)展的聚類網(wǎng)絡(luò)架構(gòu)[28],直接優(yōu)化特征空間,計(jì)算聚類中心點(diǎn),進(jìn)行平面地震相成圖工作。從網(wǎng)絡(luò)的訓(xùn)練角度來看,Duan等[26-27]所提方法是對(duì)Qian等[25]的進(jìn)一步發(fā)展,Qian等[25]提取的特征空間能夠恢復(fù)原始輸入地震信號(hào),注重對(duì)地震數(shù)據(jù)的表示能力; Duan等[26-27]在特征空間上的進(jìn)一步訓(xùn)練,更有利于特征空間的聚類,相對(duì)而言,忽略了特征空間的表示。
在前人研究基礎(chǔ)上,本文提出基于深度嵌入網(wǎng)絡(luò)的地震相聚類技術(shù)。以深度卷積自編碼網(wǎng)絡(luò)為架構(gòu),在網(wǎng)絡(luò)訓(xùn)練中引入聚類損失函數(shù)和重建損失函數(shù); 同時(shí),構(gòu)建聯(lián)合損失函數(shù)并加以優(yōu)化,兼顧地震數(shù)據(jù)的表示能力和聚類能力。本文首先介紹深度嵌入網(wǎng)絡(luò)技術(shù)的原理,然后將該方法應(yīng)用于A致密氣探區(qū)的地震相分析,最后討論其應(yīng)用效果。
(1)
式中:θ與φ是自編碼網(wǎng)絡(luò)參數(shù); 編碼器表示為z=fθ(x),z是隱藏編碼。
圖1 自編碼網(wǎng)絡(luò)結(jié)構(gòu)示意圖
(2)
由于隱藏編碼z維度遠(yuǎn)遠(yuǎn)低于輸入數(shù)據(jù)x,通過優(yōu)化重建損失函數(shù),保證隱藏編碼在捕捉輸入數(shù)據(jù)重要“抽象”特征基礎(chǔ)上,能夠通過解碼器恢復(fù)輸入信號(hào)。直觀地講,重建損失函數(shù)控制網(wǎng)絡(luò)的表示能力。
(3)
μj是待學(xué)習(xí)參數(shù),利用qij的2次冪定義輔助目標(biāo)概率分布,即
(4)
式(4)表明:對(duì)于接近聚類中心的隱藏編碼賦予高的概率; 對(duì)于遠(yuǎn)離聚類中心的隱藏編碼賦予低的概率。
對(duì)于隱藏編碼的實(shí)際類別概率分布Q與目標(biāo)概率分布P之間的接近程度,采用KL散度(Kullback-Leibler Divergence)度量。即
(5)
(pij-qij)(zi-μj)]
(6)
重建損失函數(shù)Lrec負(fù)責(zé)隱藏編碼對(duì)于輸入數(shù)據(jù)的有意義表示; 聚類損失函數(shù)Lc負(fù)責(zé)隱藏空間實(shí)現(xiàn)“物以類聚”的分布,使其類內(nèi)距離更緊密,類間距離更疏遠(yuǎn)。同時(shí)考慮隱藏空間的表示能力與聚類能力,可建立如下聯(lián)合損失函數(shù)
L=(1-λ)Lrec+λLc
(7)
式中λ∈[0,1]為權(quán)重超參數(shù),本文取值為0.1。過大的λ會(huì)破壞隱藏編碼對(duì)于輸入數(shù)據(jù)的表示能力,且造成損失函數(shù)梯度下降過于緩慢; 而過小的λ則會(huì)降低在隱藏編碼空間上的聚類程度。優(yōu)化聯(lián)合損失函數(shù),使目標(biāo)函數(shù)取得極小值
(8)
本文將以上網(wǎng)絡(luò)架構(gòu)以及損失函數(shù)構(gòu)成稱為地震相深度嵌入聚類網(wǎng)絡(luò)(圖2)。
圖2 地震相深度嵌入聚類網(wǎng)絡(luò)結(jié)構(gòu)
(9)
將本文方法應(yīng)用于鄂爾多斯盆地A致密氣探區(qū),以驗(yàn)證其效果。
研究區(qū)目的層為下二疊統(tǒng)太原組二段(本文簡(jiǎn)稱太二段),埋深約2000m,厚度為45~60m,為淺水海陸過渡相三角洲沉積環(huán)境,河道近南北向展布,水下分流河道砂體發(fā)育。太二段呈低頻、強(qiáng)振幅、連續(xù)反射的特征(圖3)。
圖3 研究區(qū)太二段地震反射特征黃色虛線為太二段底
根據(jù)鉆探成果和區(qū)域沉積演化特征,選擇6個(gè)類別對(duì)地震相聚類。優(yōu)化算法采用Adam算法,學(xué)習(xí)率為0.001。
表1 模型參數(shù)
利用T-SNE(T-Distributed Stochastic Neighbor Embedding)技術(shù)[31]對(duì)隱藏編碼進(jìn)行降維,將10維隱藏編碼降為2維,并進(jìn)行2維交會(huì)(圖4)。由圖可見,隨著迭代次數(shù)的增加,具有相似地震反射特征的地震道逐漸聚集,不同地震反射特征的地震道逐漸遠(yuǎn)離,證實(shí)了方法對(duì)于地震相的聚類能力。試驗(yàn)表明,500次迭代后,隱藏編碼能夠形成比較明顯的聚類特征。
通過解碼器對(duì)取得的隱藏編碼重建地震數(shù)據(jù)。由圖5可見,隱藏編碼能完全恢復(fù)原始地震信號(hào)的特征,殘差很小,相對(duì)誤差小于5%,證實(shí)了隱藏編碼對(duì)于地震數(shù)據(jù)的表示能力。
式(7)有兩種極端情況:①當(dāng)λ=0時(shí),即L=Lrec,本文方法退化為Qian等[25]提出的地震相聚類,即注重網(wǎng)絡(luò)對(duì)于地震數(shù)據(jù)的表示能力,而不考慮隱藏編碼的聚類能力(圖6a); ②當(dāng)λ=1時(shí), 即L=Lc,本文方法退化等價(jià)于Duan等[26-27]的地震相聚類方法,其在隱藏編碼空間上有較好的聚類能力,但無法兼顧地震數(shù)據(jù)的重建(圖6b)。
本研究區(qū)k=6,對(duì)應(yīng)6個(gè)地震相類別,不同方法成圖結(jié)果如圖7所示。相比于均方根振幅屬性(圖7a),本文方法(圖7b)優(yōu)勢(shì)體現(xiàn)在:①對(duì)河道的刻畫更為準(zhǔn)確,均方根振幅屬性比較清晰地刻畫了工區(qū)中部的兩條河道,而本文方法(圖7b)同樣刻畫了這兩條河道(相4、相6),同時(shí)還清晰地展示了工區(qū)西部的另一條河道(相6),并已被鉆井證實(shí); ②能展示河道間的差別,中部的西支河道(相6)不同于東支河道(相4),鉆井證實(shí)相6所代表的河道平均氣層厚度、平均孔隙度、平均含氣飽和度分別為5.4m、8.1%、53.4%,而相4所代表的河道平均氣層厚度、平均孔隙度、平均含氣飽和度分別為4.1m、7.7%、47.6%; ③細(xì)節(jié)更豐富,相3所代表的河道邊界以及相2代表的河道沉積局部加厚區(qū),可以反映河道內(nèi)部的非均質(zhì)性。
圖4 訓(xùn)練階段隱藏編碼T-SNE二維交會(huì)圖迭代次數(shù):(a)0; (b)100; (c)200; (d)300; (e)400; (f)500??v橫坐標(biāo)為降維后數(shù)據(jù)的聚集程度,無量綱。圖6同
圖5 地震剖面對(duì)比(a)輸入地震剖面; (b)重建地震剖面; (c)輸入剖面與重建剖面之差
相比K-Means聚類算法(圖7c),本文方法優(yōu)勢(shì)體現(xiàn)在:①信噪比更高,對(duì)地震數(shù)據(jù)的噪聲相對(duì)不敏感; ②更符合沉積規(guī)律,如圖7b展示的河道邊界(相3)僅僅圍繞著河道主體,而圖7c河道邊界與主體存在一定程度的混淆; ③井震符合率更高。在28口實(shí)鉆井的地震相標(biāo)定中,本文方法符合率為89.3%,而K-Means聚類算法符合率為78.6%。
地震相分析屬于模式識(shí)別范疇,需要考慮對(duì)原始數(shù)據(jù)進(jìn)行變換以及變換后的數(shù)據(jù)聚類特征,因此地震相聚類需要同時(shí)考慮數(shù)據(jù)變換的合理性以及數(shù)據(jù)變換后的聚類能力。
本文以兼顧數(shù)據(jù)變換的表示能力及數(shù)據(jù)的聚類能力為出發(fā)點(diǎn),采用卷積自編碼網(wǎng)絡(luò)結(jié)構(gòu),引入聚類損失函數(shù)與重建損失函數(shù),建立聯(lián)合損失函數(shù)并優(yōu)化,使網(wǎng)絡(luò)結(jié)構(gòu)兼顧兩類能力。
卷積自編碼網(wǎng)絡(luò)的編碼層和解碼層,在理論上可以類比地球物理信號(hào)的正、反變換。引入兩類損失函數(shù),通過編碼(正變換)后具有聚類的特征,再經(jīng)過解碼(反變換)后,也能逼近原始地震信號(hào)。
圖6 不同條件下隱藏編碼T-SNE二維交會(huì)圖(左)與重建地震剖面(右)(a)L=Lrec; (b)L=Lc
圖7 不同方法地震相分析結(jié)果對(duì)比(a)均方根振幅屬性; (b)本文方法; (c)K-Means方法。黑圓點(diǎn)為井位
將本文方法應(yīng)用到鄂爾多斯東緣A致密氣探區(qū),結(jié)果表明,本文方法比均方根振幅屬性刻畫河道更為準(zhǔn)確,能揭示河道內(nèi)部非均質(zhì)性; 比K-Means聚類算法預(yù)測(cè)結(jié)果井震符合率更高。