劉力輝,陸 蓉,楊文魁
(北京諾克斯達(dá)石油科技有限公司,北京100083)
在地震儲層預(yù)測中,復(fù)雜巖性預(yù)測一直是一個難點,如碎屑巖中鈣質(zhì)泥巖、碳酸鹽巖及火山巖[1-3]等。目前復(fù)雜巖性的預(yù)測技術(shù)[4]主要集中在疊前彈性參數(shù)反演,根據(jù)巖石物理多參數(shù)交會分析判定,但對于有些復(fù)雜巖性,難以找到線性相關(guān)且敏感有效的彈性參數(shù)。對于屬性或疊后反演分析復(fù)雜巖性來說技術(shù)挑戰(zhàn)更大。通過研究地震波形的聚類分析進行復(fù)雜巖性的預(yù)測[5],需井震對比以建立巖性和波形的對應(yīng)關(guān)系,然而實際巖性與地震波形之間的關(guān)系存在著一系列復(fù)雜的響應(yīng)機制,很難一一對應(yīng),人工井震標(biāo)定方式轉(zhuǎn)化巖性反演結(jié)果多解性強。機器學(xué)習(xí)的非線性反演方法[6-7]通過計算特征曲線識別復(fù)雜巖性,常用機器學(xué)習(xí)的方法有BP神經(jīng)網(wǎng)絡(luò)、支持向量機等。這些學(xué)習(xí)方法都存在易陷入局部最小、效果不穩(wěn)定、多次實現(xiàn)結(jié)果相差很大的局限。
近年來,深度學(xué)習(xí)受到國內(nèi)外學(xué)者的廣泛關(guān)注。深度學(xué)習(xí)的概念最早由HINTON等[8]提出,是指基于樣本數(shù)據(jù)通過一定的訓(xùn)練方法得到包含多個層級的深度網(wǎng)絡(luò)結(jié)構(gòu)的機器學(xué)習(xí)過程[9-10]。之后,深度學(xué)習(xí)率先在語音識別以及圖像識別中取得了杰出成果。如今,深度學(xué)習(xí)除了在圖像、語音、自然語言處理等方面繼續(xù)向前發(fā)展之外[11],在CTR(click through rate)預(yù)估、大數(shù)據(jù)特征提取、醫(yī)療、金融、無人駕駛等方面也得到廣泛應(yīng)用。同樣,在石油勘探領(lǐng)域,深度學(xué)習(xí)也受到了學(xué)者的青睞,如在2017年青島國際會議和SEG年會上開設(shè)了專門的深度學(xué)習(xí)專題[12-14],一些大的石油公司也開始利用這項技術(shù)解決地質(zhì)問題。
深度學(xué)習(xí)通常面向大數(shù)據(jù)。大數(shù)據(jù)并非是單指海量數(shù)據(jù),除了需要大量數(shù)據(jù)外,更重要的是各種類型的數(shù)據(jù)都應(yīng)具備,網(wǎng)絡(luò)模型才可能建得合理,即數(shù)據(jù)應(yīng)具備完備性。將深度學(xué)習(xí)用于非線性反演的關(guān)鍵是如何滿足數(shù)據(jù)的完備性要求。反演過程首先通過井旁地震道(屬性)與特征測井曲線建立的一一對應(yīng)的樣本集,再采用隨機采樣方式產(chǎn)生訓(xùn)練樣本集和測試樣本集,這種方式可能導(dǎo)致一些特殊巖性沒有被抽樣到而影響樣本集的完備性和代表性;其次,樣本集根據(jù)井點建立,井在空間分布不均勻,只根據(jù)井建立樣本集會漏掉一些巖性帶的抽樣,從而影響樣本集的完備性;再則,深度學(xué)習(xí)在大樣本(大數(shù)據(jù))上有明顯的優(yōu)勢,但地震儲層預(yù)測中井震樣本往往是一個小樣本問題,并不滿足深度學(xué)習(xí)大數(shù)據(jù)條件。
針對這些問題,本文采用優(yōu)化樣本采樣、抽取相控偽井以及增量學(xué)習(xí)的策略解決上述問題,提高了深度學(xué)習(xí)預(yù)測模型的精度。常規(guī)網(wǎng)絡(luò)學(xué)習(xí)多以測井特征曲線(伽馬曲線等)為目標(biāo)曲線,存在井震分辨率不匹配的問題,為此,我們采用了地震巖相的概念[15],一是通過測井巖相解釋,對測井巖性曲線粗化,解決井震分辨率匹配問題,二是通過地震地質(zhì)結(jié)合,合理劃分巖性-地震屬性可識別的巖相類別,降低建模難度,增加樣本集的合理性?;谏疃葘W(xué)習(xí)的地震巖相反演方法通過輸入地震的低、中、高頻分頻剖面及巖相曲線作為樣本集,經(jīng)過完備性采樣,訓(xùn)練獲得穩(wěn)定的深度網(wǎng)絡(luò),應(yīng)用于整個地震數(shù)據(jù)上,從而獲得高分辨率的地震巖相反演結(jié)果。
BP(back propagation)神經(jīng)網(wǎng)絡(luò),被稱作多層感知機(multi-layer perceptron),但實際上是一種只含有一層隱層節(jié)點的淺層模型。其應(yīng)用于地震反演時存在的問題是:①網(wǎng)絡(luò)結(jié)構(gòu)單一,非線性表征能力較差,容易出現(xiàn)過度擬合現(xiàn)象;②神經(jīng)網(wǎng)絡(luò)初始化中的隨機權(quán)值,導(dǎo)致網(wǎng)絡(luò)很容易收斂到局部最小值,隨機性強。BP神經(jīng)網(wǎng)絡(luò)代表的是“大數(shù)據(jù)+簡單模型”的傳統(tǒng)工業(yè)界學(xué)習(xí)模式(圖1a)。較常規(guī)的BP神經(jīng)網(wǎng)絡(luò)而言,深度學(xué)習(xí)的網(wǎng)絡(luò)結(jié)構(gòu)更復(fù)雜,代表的是“大數(shù)據(jù)+復(fù)雜模型”的學(xué)習(xí)模式(圖1b),可以充分挖掘數(shù)據(jù)背后的信息,目前已經(jīng)成為主流模式。該模式通過組合低層特征形成更加抽象的高層特征,有效改善BP神經(jīng)網(wǎng)絡(luò)反演結(jié)果隨機性和容易陷入局部最小的缺點。
圖1 BP神經(jīng)網(wǎng)絡(luò)(a)和深度學(xué)習(xí)網(wǎng)絡(luò)(b)
目前深度學(xué)習(xí)的主流神經(jīng)網(wǎng)絡(luò)有很多種,其中常見的有卷積神經(jīng)網(wǎng)絡(luò)(convolution neutral network,CNN)、深度信念網(wǎng)絡(luò)(deep belief netwook,DBN)、循環(huán)神經(jīng)網(wǎng)絡(luò)(recurrent neural networks,RNN)等[16],不同的網(wǎng)絡(luò)結(jié)構(gòu)不同,適應(yīng)的任務(wù)不同。CNN主要用于圖像處理,也可用于其它類型的輸入,如音頻,主要應(yīng)用有監(jiān)督場景。RNN是基于時間的前饋神經(jīng)網(wǎng)絡(luò),主要應(yīng)用于自然語言處理方面,同樣需要大量的有標(biāo)注的樣本信息進行有監(jiān)督訓(xùn)練。上述兩種模型屬于有監(jiān)督的判別模型,而DBN是一種半監(jiān)督生成模型。所謂半監(jiān)督就是指DBN的訓(xùn)練需要通過“無監(jiān)督+有監(jiān)督”的方式分兩步進行訓(xùn)練。首先,通過無監(jiān)督的方式訓(xùn)練其神經(jīng)元間的權(quán)重,整個神經(jīng)網(wǎng)絡(luò)按照最大概率生成數(shù)據(jù),形成聚類信息,然后使用反向傳播指導(dǎo)DBN進行微調(diào),即有監(jiān)督地進行調(diào)優(yōu),賦予DBN具體類別信息,最終建立樣本與類別之間的聯(lián)合概率分布。
本文采用了DBN,原因如下:①巖相預(yù)測過程也可認(rèn)為是先聚類再賦予類別信息的過程;②井旁分頻數(shù)據(jù)及井巖相樣本數(shù)量少,采用有監(jiān)督方法難以取得有效成果;③面對巖相預(yù)測這樣的數(shù)值計算而言,相比于CNN以及RNN,DBN具有更強的適用性。
采用DBN對地震巖相進行學(xué)習(xí)的過程是:①自下而上進行RBM(restricted boltzmann machine)無監(jiān)督學(xué)習(xí),充分訓(xùn)練每一層,一層一層獲得各層網(wǎng)絡(luò)連線的權(quán)值參數(shù);②各層訓(xùn)練完成后,依靠樣本標(biāo)簽,將誤差自上而下反向傳遞進行訓(xùn)練,對多層的連接權(quán)重參數(shù)調(diào)優(yōu),形成有監(jiān)督的訓(xùn)練過程,最終確定巖相學(xué)習(xí)的DBN網(wǎng)絡(luò)。再通過這個網(wǎng)絡(luò)進行整個地震數(shù)據(jù)體范圍的巖相體反演。
首先將分頻屬性作為輸入,多井地震巖相曲線作為學(xué)習(xí)目標(biāo),也就是標(biāo)簽。然后利用深度學(xué)習(xí)方法,先從分頻數(shù)據(jù)出發(fā),從網(wǎng)絡(luò)底層開始訓(xùn)練數(shù)據(jù),逐層將數(shù)據(jù)進行抽象表征,直到網(wǎng)絡(luò)頂部,這是無監(jiān)督的訓(xùn)練過程;再從多井地震巖相曲線出發(fā),將誤差逐步以反向傳播的形式從網(wǎng)絡(luò)頂部傳遞至底部,逐層對網(wǎng)絡(luò)進行調(diào)優(yōu),最終建立兩者之間的模型。之后進行質(zhì)量監(jiān)控,進一步根據(jù)結(jié)果對模型進行調(diào)整。最終獲得成熟網(wǎng)絡(luò),可用于預(yù)測,將分頻屬性轉(zhuǎn)化為地震巖相體。圖2是深度學(xué)習(xí)計算地震巖相的流程,其核心部分在于樣本集優(yōu)化方式,使得深度學(xué)習(xí)能充分發(fā)掘分頻屬性與多井地震巖相曲線之間的聯(lián)系,以下逐步詳述。
圖2 深度學(xué)習(xí)計算地震巖相的流程
2.2.1 以井及巖相為分組的均勻采樣方式提取樣本集
常規(guī)訓(xùn)練樣本及測試樣本是通過混合多井樣本點隨機抽樣的方式抽取,當(dāng)某些井樣本點少或者某種巖相的樣本點少,就容易漏采巖相。同時隨機抽樣也破壞了地震波形的完整性,影響了數(shù)據(jù)的完備性。為此,本文通過以井及巖相為分組的均勻采樣方式解決漏采某種巖相信息的問題。以一口井為例,以巖相為分組均勻采樣(圖3)。井1中井巖相曲線分為3類,提取井旁道m(xù)個分頻數(shù)據(jù)組成一個向量(x1,x2,x3,…,xm),井旁道數(shù)按照時間順序(1,2,…,n)進行編號。根據(jù)該向量對應(yīng)的巖相類別,將其放置在對應(yīng)巖相集合中,這就是一條樣本。如圖3所示,巖相1集合中將會有4條樣本,分別是第1,2,3,9時間點處的數(shù)據(jù);巖相2集合中將會有6條樣本,分別是第4,5,6,7,14,15時間點處的數(shù)據(jù);巖相3將會有7條樣本,分別是第10,11,12,13,16,17,18時間點處的數(shù)據(jù)。經(jīng)過這樣的處理,形成3個集合的數(shù)據(jù)。最后分別從這3個集合中,對每個集合按照等時間間隔選取訓(xùn)練集及測試集。
2.2.2 相控偽井抽取樣本集
人工智能反演方法,依賴井點處地震數(shù)據(jù)與井?dāng)?shù)據(jù)之間的映射關(guān)系,如果井點稀疏,難以覆蓋整個反演工區(qū),勢必造成平面上有些相帶沒有抽取到樣本,影響數(shù)據(jù)的完備性,導(dǎo)致反演結(jié)果外推能力差、平面連續(xù)性差的問題。這里,我們通過輸入基于相邊界控制下的巖相插值模型進行平面控制,以平面網(wǎng)格化方式均勻抽取模型體作為偽井井曲線,填充樣本集,如圖4所示,一方面能夠解決井網(wǎng)分布不勻的問題,擴充樣本采樣在平面上的均勻性,樣本集受相帶約束,可確保反演結(jié)果的橫向穩(wěn)定性;另一方面樣本集中樣本個數(shù)大大增加,有利于深度學(xué)習(xí)建立準(zhǔn)確的網(wǎng)絡(luò)模型在一個相對穩(wěn)定的映射關(guān)系上進行擾動修正,獲得最優(yōu)解。
圖3 一口井巖相分組的均勻抽樣
圖4 偽井抽取示意
增量學(xué)習(xí)是指一個學(xué)習(xí)系統(tǒng)能不斷地從新樣本中學(xué)習(xí)新的知識,并能保存大部分已經(jīng)學(xué)習(xí)到的知識,根據(jù)新的知識會對舊知識進行調(diào)優(yōu),從而使得整個系統(tǒng)更加趨于穩(wěn)定和全局最優(yōu),其過程如圖5所示。
圖5 增量學(xué)習(xí)策略
我們可以利用增量學(xué)習(xí)的思想,區(qū)別對待真井和偽井。利用偽井作為老知識進行學(xué)習(xí),得到一個初始的網(wǎng)絡(luò)模型,然后在這個初始網(wǎng)絡(luò)模型的基礎(chǔ)上利用真井作為新知識對網(wǎng)絡(luò)進一步學(xué)習(xí)調(diào)優(yōu),最終獲得成熟的網(wǎng)絡(luò)用于預(yù)測巖相。
研究區(qū)屬于典型的深水陸坡水道沉積,其中陸坡區(qū)主要發(fā)育的水道以及扇體等復(fù)合沉積體系為優(yōu)質(zhì)儲層。因為水道空間展布形態(tài)復(fù)雜,常規(guī)層狀插值建模困難,影響了反演的精度。同時研究區(qū)巖性多樣,有灰?guī)r、鈣質(zhì)砂巖、砂巖和泥巖4種巖石類型,其中灰?guī)r、鈣質(zhì)砂巖表現(xiàn)為高阻抗特征,砂巖和泥巖表現(xiàn)為低阻抗特征,巖石物理規(guī)律復(fù)雜,巖性區(qū)分困難。
如圖6所示,井A鉆遇鈣質(zhì)砂巖-干層,井B鉆遇砂巖-氣層。而兩口井之間發(fā)現(xiàn)一個巖性圈閉目標(biāo)(白圈中所示),該目標(biāo)巖性類型成為儲層物性評價的關(guān)鍵。另外該目標(biāo)位于構(gòu)造底部位,井B已鉆遇氣水界面,因此該目標(biāo)巖性上傾方向是否尖滅是成藏的關(guān)鍵。綜合以上兩個問題,本區(qū)勘探的重點為巖性分類預(yù)測及砂巖邊界刻畫。以-90°地震數(shù)據(jù)以及20,30,40,50Hz分頻體作為輸入,以兩口井地震巖相結(jié)果以及這兩口井相控插值建模結(jié)果抽取的偽井作為學(xué)習(xí)目標(biāo),如圖7所示。分別采用BP和深度學(xué)習(xí)方法進行巖相反演。圖8為BP神經(jīng)網(wǎng)絡(luò)反演巖相體剖面,可以看出,經(jīng)過井震標(biāo)定,井點反演吻合率較高,但橫向外推能力欠佳,反演同相軸剖面連續(xù)性差,砂體邊界不清晰(紅色箭頭所示)。圖9為深度學(xué)習(xí)方法反演巖相體剖面,井震標(biāo)定結(jié)果表明,過井點反演結(jié)果與測井解釋結(jié)果基本吻合,同時井點外推效果較好,砂體邊界清楚,解釋目的層(白圈中所示位置)為砂巖沉積,且沿高部位上傾尖滅(紅色箭頭所示),與井B發(fā)育的砂巖為兩套油水界面,具備成藏條件。圖10為疊前彈性阻抗反演出聲波阻抗(AI)和橫波阻抗(SI),經(jīng)過巖石物理交會得到的地震巖相體剖面。和深度學(xué)習(xí)反演剖面相比,疊前反演巖性體剖面對巖相類型區(qū)分不夠,鈣質(zhì)砂巖與灰?guī)r區(qū)分度不高,且分辨率低。
圖6 研究區(qū)重點井連井原始剖面
圖7 已知井建立巖相模型及偽井分布剖面
圖8 BP神經(jīng)網(wǎng)絡(luò)反演巖相體剖面
圖9 深度學(xué)習(xí)反演巖相體剖面
圖10 疊前反演巖相體剖面
基于DBN深度學(xué)習(xí)的地震巖相反演方法是復(fù)雜巖性預(yù)測的有效手段,優(yōu)點在于:①深度學(xué)習(xí)方式是包含多個隱層的深度結(jié)構(gòu)網(wǎng)絡(luò),可從大樣本中提取有效特征信息與巖相建立非線性關(guān)系進行反演,比傳統(tǒng)神經(jīng)網(wǎng)絡(luò)(如BP神經(jīng)網(wǎng)絡(luò))反演效果更為穩(wěn)定,不容易陷入局部最小;②深度學(xué)習(xí)有很強的非線性表征能力,通過分頻屬性即可反演出兩類以上復(fù)雜巖性,和疊前彈性參數(shù)判定結(jié)果非常相似,但分辨率更高;③DBN善于處理分類問題,故將其應(yīng)用于巖相判定,實際資料應(yīng)用結(jié)果證實其巖相反演結(jié)果精度高。這種方法也存在一些局限:深度學(xué)習(xí)在大樣本上才能展現(xiàn)其優(yōu)勢,但反演中樣本數(shù)受井?dāng)?shù)限制,一般為小樣本,所以該方法更適合在開發(fā)區(qū)應(yīng)用;同時為了擴大樣本量我們采用了相控插值模型抽取偽井,雖然使用了增量學(xué)習(xí)方法區(qū)別對待真井和偽井,但反演結(jié)果勢必受到模型精度影響。