宋隨宏 ,史燕青 ,侯加根 *
1 中國石油大學(xué)(北京)地球科學(xué)學(xué)院,北京 102249
2 中國石油大學(xué)(北京)人工智能學(xué)院,北京 102249
3 鵬城實驗室, 深圳 518055
4 中國石油大學(xué)(北京)油氣資源與探測國家重點實驗室,北京 102249
儲層地質(zhì)建模本質(zhì)上是一個融合井筒、地震和地質(zhì)模式等多類地質(zhì)信息對地下儲層的空間分布進行精細預(yù)測的過程,是油氣儲量評價、鉆井設(shè)計和油氣田開采方案調(diào)整的關(guān)鍵。儲層離散相(包括但不限于沉積相)建模是儲層屬性建模的基礎(chǔ),本文所提及的儲層建模特指離散相地質(zhì)建模。
長期以來,諸多地質(zhì)統(tǒng)計學(xué)方法被應(yīng)用于各類儲層的地質(zhì)建模[1],包括基于變差函數(shù)的方法[2-3]、基于目標(biāo)的方法[4-6]和仿沉積過程的方法[7-8]。其中,基于變差函數(shù)的方法雖然可以較好地吻合井筒、地震等條件數(shù)據(jù),但無法刻畫地質(zhì)體的復(fù)雜幾何形態(tài);而基于目標(biāo)的和仿沉積過程的方法雖然可以很好地復(fù)現(xiàn)地質(zhì)體的地質(zhì)模式(如幾何形態(tài)和沉積相接觸關(guān)系等),但在融合井點等條件數(shù)據(jù)上存在較大的不足[9]。
近年來,基于多點地質(zhì)統(tǒng)計學(xué)的建模思路被提出并廣泛應(yīng)用,如SNESIM方法[10]、SIMPAT方法[11]、FILTERSIM方法[12]、HYPPS方法[13]和直接采樣方法(Direct Sampling)[14]?;诙帱c地質(zhì)統(tǒng)計學(xué)的建模方法通過掃描訓(xùn)練圖像獲取地質(zhì)空間內(nèi)的多點統(tǒng)計數(shù)據(jù),以此作為地質(zhì)模式信息,生成的地質(zhì)模型可在忠實于井點和概率體條件數(shù)據(jù)的基礎(chǔ)上一定程度地復(fù)現(xiàn)地質(zhì)體的模式特征。但是,由于其對于地質(zhì)模式的表達僅限于訓(xùn)練圖像小范圍內(nèi)的多點統(tǒng)計信息,缺乏對更大范圍地質(zhì)模式特征的完整抽象和總結(jié),當(dāng)井點數(shù)據(jù)稠密或地質(zhì)體結(jié)構(gòu)較為復(fù)雜時,基于多點地質(zhì)統(tǒng)計學(xué)的方法建模效果并不理想,如出現(xiàn)河道相儲層斷斷續(xù)續(xù)的現(xiàn)象。
如何讓構(gòu)建的地質(zhì)模型既能完整有效地復(fù)現(xiàn)地質(zhì)模式特征又能很好地吻合各類條件數(shù)據(jù),是地質(zhì)建模的核心問題,其中對空間地質(zhì)模式特征的復(fù)現(xiàn)是最大的難點。人工智能(深度學(xué)習(xí))中的生成對抗網(wǎng)絡(luò)框架(GANs)[15]與卷積神經(jīng)網(wǎng)絡(luò)(CNN)[16]相結(jié)合,可以很好地抽象并復(fù)現(xiàn)物體完整的空間模式特征,即生成非常逼真的虛擬物體(如人臉圖片),在圖像生成[17-20]、云層空間形態(tài)預(yù)測[21]、巖石微觀模型重建[22]等領(lǐng)域有著成功的應(yīng)用。近幾年,多位學(xué)者將此方法應(yīng)用于儲層地質(zhì)建模,在生成對抗網(wǎng)絡(luò)框架下去訓(xùn)練得到由卷積神經(jīng)網(wǎng)絡(luò)構(gòu)成的地質(zhì)模型模擬器,讓其學(xué)習(xí)地質(zhì)體完整的空間模式特征,并生成吻合該模式特征的地質(zhì)模型[23-32];這類方法被稱為基于生成對抗網(wǎng)絡(luò)的地質(zhì)建模方法。劉彥鋒等[33]已就該方法的特點、應(yīng)用和未來發(fā)展方向做了概述。根據(jù)有無條件約束,基于生成對抗網(wǎng)絡(luò)的地質(zhì)建模方法可具體分為無條件約束和有條件約束兩種情況,本文深入討論每種情況的核心思想、應(yīng)用效果以及未來研究應(yīng)用的展望。
將原始生成對抗網(wǎng)絡(luò)直接應(yīng)用于地質(zhì)建模,便可形成無條件約束的地質(zhì)建模方法。生成對抗網(wǎng)絡(luò)的訓(xùn)練過程可分為傳統(tǒng)訓(xùn)練過程和漸進增長的訓(xùn)練過程,與之相對應(yīng),無條件約束建模方法也可分為傳統(tǒng)生成對抗網(wǎng)絡(luò)地質(zhì)建模方法和漸進增長的生成對抗網(wǎng)絡(luò)地質(zhì)建模方法。下文依次簡要介紹生成對抗網(wǎng)絡(luò)框架、傳統(tǒng)生成對抗網(wǎng)絡(luò)地質(zhì)建模方法和漸進增長的生成對抗網(wǎng)絡(luò)地質(zhì)建模方法。
生成對抗網(wǎng)絡(luò)(GANs)是深度學(xué)習(xí)中的一種訓(xùn)練神經(jīng)網(wǎng)絡(luò)的框架,由Goodfellow[15]提出。其根本目的是:訓(xùn)練神經(jīng)網(wǎng)絡(luò)從觀測樣本中學(xué)習(xí)到樣本的一般模式知識(如人臉的模式),并據(jù)此生成與該模式吻合的虛擬樣本(如逼真的人臉圖片)。目前已有多個生成對抗網(wǎng)絡(luò)變種框架[17-19,34-36]。
生成對抗網(wǎng)絡(luò)主要包含生成器神經(jīng)網(wǎng)絡(luò)、判別器神經(jīng)網(wǎng)絡(luò)和損失函數(shù)。生成器將低維隨機數(shù)組生成為虛擬樣本,判別器則將真實或虛擬樣本轉(zhuǎn)化為一個代表輸入樣本真假程度的數(shù)值,稱為逼真度,損失函數(shù)則為真假樣本對應(yīng)的逼真度間的某種距離。生成器和判別器的神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)可以是全連接神經(jīng)網(wǎng)絡(luò)、卷積神經(jīng)網(wǎng)絡(luò)(CNN)或循序神經(jīng)網(wǎng)絡(luò)(RNN)[37]。針對圖片或地質(zhì)模型等具有空間結(jié)構(gòu)的樣本數(shù)據(jù)形式,一般采用卷積神經(jīng)網(wǎng)絡(luò)作為生成器和判別器[25-26,34,38]?;谡婕贅颖颈普娑乳g不同的距離計算方式,多類損失函數(shù)已被提出[39-41],其中基于梯度懲罰的Wasserstein損失函數(shù)(Wasserstein loss with gradient penalty)[41]取得了很好地應(yīng)用效果。
對于生成對抗網(wǎng)絡(luò)的訓(xùn)練可分為傳統(tǒng)訓(xùn)練過程和漸進增長的訓(xùn)練過程[17]。傳統(tǒng)過程中,把生成器和判別器神經(jīng)網(wǎng)絡(luò)分別當(dāng)作不可拆分的整體,依次循環(huán)訓(xùn)練判別器和生成器,來分別增大和減小損失函數(shù)。該過程中,生成器不斷學(xué)習(xí)真實樣本中的模式知識,進而生成與真實樣本極為相像的虛擬樣本。而樣本的模式特征具有尺度性,大尺度模式特征控制或影響著小尺度模式特征。但是傳統(tǒng)訓(xùn)練過程沒有考慮模式的尺度性,而讓生成器完全自主地學(xué)習(xí)所有尺度的模式知識;生成器有可能先學(xué)習(xí)小尺度模式特征后學(xué)習(xí)大尺度模式特征,限制了生成器的學(xué)習(xí)效率和最終生成效果。
Karras[17]提出了漸進增長的生成對抗網(wǎng)絡(luò)訓(xùn)練方法(progressive growing of GANs)。該方法中,生成器中的神經(jīng)網(wǎng)絡(luò)被逐層加以訓(xùn)練,來依次從大到小地學(xué)習(xí)不同尺度的模式特征;比如第一層神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)大尺度模式特征,第二層神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)中尺度模式特征。該方法考慮了不同尺度模式特征之間的控制和依附關(guān)系,極大地提升了生成對抗網(wǎng)絡(luò)的訓(xùn)練效率和最終生成效果,在訓(xùn)練時間、穩(wěn)定性和生成效果等方面遠超傳統(tǒng)訓(xùn)練方法[17]。
傳統(tǒng)生成對抗網(wǎng)絡(luò)地質(zhì)建模方法主要強調(diào)應(yīng)用傳統(tǒng)過程去訓(xùn)練生成對抗網(wǎng)絡(luò)。Song[30]之前的生成對抗網(wǎng)絡(luò)建模方法[23-29]均采用傳統(tǒng)訓(xùn)練過程。下文依次介紹傳統(tǒng)生成對抗網(wǎng)絡(luò)地質(zhì)建模方法的核心思想及典型應(yīng)用。在地質(zhì)建模中,生成對抗網(wǎng)絡(luò)的生成器和判別器均采用卷積神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)。
1.2.1核心思想
圖1以暗河溶洞二維(水平切面)地質(zhì)模型作為樣本的情況為例,直觀展示了傳統(tǒng)生成對抗網(wǎng)絡(luò)地質(zhì)建模的核心思想。給定諸多吻合暗河溶洞地質(zhì)模式的原型模型作為訓(xùn)練數(shù)據(jù)(真實樣本),這些訓(xùn)練地質(zhì)模型在對應(yīng)的高維空間中具有特定的分布范圍。此處的“高維”特指表征地質(zhì)模型所有可能性的維度空間,比如,一個100×100×100的河道與非河道兩相地質(zhì)模型的維度則為2100×100×100。生成器神經(jīng)網(wǎng)絡(luò)的根本目的就是從這些訓(xùn)練地質(zhì)模型中學(xué)習(xí)到暗河溶洞的地質(zhì)模式知識,并應(yīng)用該知識生成具有相同模式特征的地質(zhì)模型。
圖1 生成對抗網(wǎng)絡(luò)地質(zhì)模型生成器(模擬器)訓(xùn)練過程示意圖Fig. 1 Schematic diagram of training process of the geomodel generator based on Generative Adversarial Networks
首先,在未經(jīng)訓(xùn)練時,生成器G0尚未學(xué)習(xí)到任何地質(zhì)模式知識,其由隨機向量生成的虛擬地質(zhì)模型S0非常雜亂,不顯現(xiàn)任何地質(zhì)模式特征。隨后,判別器首次得到訓(xùn)練(D1),將虛擬的地質(zhì)模型S0與真實的訓(xùn)練地質(zhì)模型集分割開來。然后,生成器得到訓(xùn)練(G1),通過學(xué)習(xí)訓(xùn)練地質(zhì)模型集中的部分模式知識,來生成具有一定模式特征的地質(zhì)模型S1,以讓此時的判別器D1無法區(qū)分虛擬地質(zhì)模型S1和訓(xùn)練地質(zhì)模型集。隨后,判別器再次得到訓(xùn)練(D2)來將新的虛擬地質(zhì)模型S1與訓(xùn)練地質(zhì)模型集分割開。而后,生成器再次得到訓(xùn)練(G2),通過學(xué)習(xí)更多的地質(zhì)模式知識,來生成更為真實的地質(zhì)模型S2。通過對判別器和生成器的循環(huán)訓(xùn)練,生成器逐漸學(xué)習(xí)到越來越多的地質(zhì)模式知識,并最終生成與訓(xùn)練地質(zhì)模型極為相像的虛擬地質(zhì)模型,以至于判別器再也無法將虛擬的地質(zhì)模型與真實的訓(xùn)練地質(zhì)模型區(qū)分開來。
最終的生成器(GN)便學(xué)習(xí)到了訓(xùn)練模型集中暗河溶洞發(fā)育的全部地質(zhì)模式知識,可將任意低維向量生成為吻合暗河溶洞地質(zhì)模式的、逼真的地質(zhì)模型。該生成器則可作為地質(zhì)模型的模擬器在無條件約束的地質(zhì)建模實際中加以應(yīng)用。為了便于地質(zhì)領(lǐng)域研究人員的理解,本文將生成器統(tǒng)稱為地質(zhì)模型模擬器。生成對抗網(wǎng)絡(luò)本質(zhì)上是通過對判別器和模擬器“博弈式”的交替優(yōu)化,來將訓(xùn)練地質(zhì)模型集中的地質(zhì)模式知識遷移到模擬器神經(jīng)網(wǎng)絡(luò)中來,以定量參數(shù)的形式保存下來。
1.2.2應(yīng)用效果分析
Laloy[25]最早將生成對抗網(wǎng)絡(luò)應(yīng)用于地質(zhì)建模,將一個大型訓(xùn)練圖像經(jīng)過若干次切割而形成諸多小型訓(xùn)練地質(zhì)模型,應(yīng)用傳統(tǒng)生成對抗網(wǎng)絡(luò)訓(xùn)練方法得到模擬器卷積神經(jīng)網(wǎng)絡(luò);訓(xùn)練完成的模擬器可將任意隨機向量生成為與訓(xùn)練地質(zhì)模型非常相像的地質(zhì)模型,如圖2所示。Zhang[26]應(yīng)用基于目標(biāo)的方法構(gòu)建了大量的訓(xùn)練地質(zhì)模型,去訓(xùn)練模擬器;而后將模擬器應(yīng)用于無條件約束的三維地質(zhì)建模,如圖3所示。Nesvold[27]通過對地表衛(wèi)星照片的處理來獲取河道相水平切片二維訓(xùn)練地質(zhì)模型集,去訓(xùn)練模擬器,進而進行無條件約束的隨機模擬。在這些研究中,模擬器產(chǎn)生的地質(zhì)模型均與訓(xùn)練地質(zhì)模型非常相像,即生成的地質(zhì)模型與訓(xùn)練地質(zhì)模型具有相同的地質(zhì)模式特征,表明模擬器學(xué)習(xí)到了完整的地質(zhì)模式知識。
圖2 河道相二維訓(xùn)練地質(zhì)模型與模擬器生成的地質(zhì)模型實現(xiàn)示例[25]Fig. 2 Examples of 2D training facies models of channel reservoirs and the corresponding generator-produced facies models[25]
圖3 河道相三維訓(xùn)練地質(zhì)模型與模擬器生成的地質(zhì)模型實現(xiàn)示例[26]Fig. 3 Examples of 3D training facies models of channel reservoirs and the corresponding generator-produced facies models[26]
Song[30]首次將生成對抗網(wǎng)絡(luò)漸進增長的訓(xùn)練過程與地質(zhì)建模相結(jié)合,形成了漸進增長的生成對抗網(wǎng)絡(luò)地質(zhì)建模方法,并將其與傳統(tǒng)方法進行了應(yīng)用對比分析。下文簡述了該方法的思想步驟及應(yīng)用分析。
1.3.1核心思想
該方法包括訓(xùn)練地質(zhì)模型多精度粗化和漸進增長的模擬器訓(xùn)練兩個步驟;前者是為了獲得能夠代表不同尺度地質(zhì)模式特征的訓(xùn)練地質(zhì)模型集,后者則是讓模擬器從這些訓(xùn)練地質(zhì)模型集中依次學(xué)習(xí)到不同尺度的地質(zhì)模式知識。比如,針對圖4所示的模擬器和判別器結(jié)構(gòu)(原始訓(xùn)練地質(zhì)模型和模擬器最終生成的地質(zhì)模型均為64×64的暗河溶洞水平切片二維模型),首先將原始訓(xùn)練地質(zhì)模型粗化到32×32、16×16、8×8和4×4不同精度,精度越低的訓(xùn)練地質(zhì)模型代表的模式尺度越大;然后從左到右依次激活模擬器和判別器中的卷積神經(jīng)網(wǎng)絡(luò)層,即卷積1、卷積2、…,同時應(yīng)用從低到高不同精度的訓(xùn)練地質(zhì)模型去訓(xùn)練當(dāng)時的模擬器和判別器,來讓模擬器依次學(xué)習(xí)從大到小不同尺度的地質(zhì)模式知識;訓(xùn)練完成后,把模擬器中的所有卷積層當(dāng)作一個整體在實際建模中加以應(yīng)用,生成64×64的暗河溶洞二維地質(zhì)模型。
圖4 漸進增長生成對抗網(wǎng)絡(luò)地質(zhì)建模方法示意圖Fig. 4 Schematic diagram of the geomodelling approach based on progressive growing of GANs
1.3.2應(yīng)用效果分析
Song[30]將漸進增長生成對抗網(wǎng)絡(luò)地質(zhì)建模方法應(yīng)用于河道及暗河溶洞儲層水平切片二維地質(zhì)建模,并與傳統(tǒng)生成對抗網(wǎng)絡(luò)地質(zhì)建模方法進行了對比。圖5展示了漸進增長的訓(xùn)練過程中模擬器依次生成的河道儲層地質(zhì)模型;可以看出,隨著模擬器中越來越多的卷積層被激活和訓(xùn)練,模擬器學(xué)到越來越精細的地質(zhì)模式特征,而生成越來越逼真的地質(zhì)模型(從第1列到第5列),最終生成的地質(zhì)模型(第5列)與訓(xùn)練地質(zhì)模型(最后兩列)極為相似。
圖5 漸進增長訓(xùn)練過程中模擬器生成的河道儲層地質(zhì)模型與訓(xùn)練地質(zhì)模型對比[30]Fig. 5 Comparison between the generated channel reservoirs during progressively training of the generator and the corresponding training facies models[30]
圖6把漸進增長生成對抗網(wǎng)絡(luò)地質(zhì)建模方法產(chǎn)生的地質(zhì)模型、傳統(tǒng)生成對抗網(wǎng)絡(luò)地質(zhì)建模方法產(chǎn)生的地質(zhì)模型與訓(xùn)練地質(zhì)模型進行了對比,可以看到兩種方法產(chǎn)生的地質(zhì)模型都與訓(xùn)練地質(zhì)模型極為相像,且都具有很強的多樣性,表明兩種方法中的模擬器都學(xué)習(xí)到了訓(xùn)練地質(zhì)模型中完整的地質(zhì)模式知識。但漸進增長的建模方法中訓(xùn)練模擬器所需的時間(6.03 h)僅是傳統(tǒng)方法所需時間(15.4 h)的39.2%,證明漸進增長方法在訓(xùn)練時間上的明顯優(yōu)勢。在模擬效果上,Song[30]應(yīng)用基于Wasserstein距離的多尺度標(biāo)量圖法定量評價了兩種建模方法產(chǎn)生的地質(zhì)模型與訓(xùn)練地質(zhì)模型的分布關(guān)系。如圖7所示,每個樣點代表40個地質(zhì)模型,可以看到,相比于傳統(tǒng)建模方法,漸進增長方法產(chǎn)生的地質(zhì)模型分布更接近訓(xùn)練地質(zhì)模型分布,表明漸進增長方法產(chǎn)生的地質(zhì)模型的地質(zhì)模式與訓(xùn)練地質(zhì)模型更吻合。
圖6 漸進增長與傳統(tǒng)生成對抗網(wǎng)絡(luò)地質(zhì)建模方法生成地質(zhì)模型的對比[30]Fig. 6 Comparison of the simulated reservoir geomodels between the progressive GANs training and the conventional GANs training approaches[30]
圖7 傳統(tǒng)和漸進增長生成對抗網(wǎng)絡(luò)地質(zhì)建模方法所得的地質(zhì)模型與訓(xùn)練地質(zhì)模型之間關(guān)系的分布圖[30]Fig. 7 The relationship map among facies models generated from the conventional and progressive geomodeling methods and the training facies models[30]
有條件約束的地質(zhì)建模方法是在無條件約束方法的基礎(chǔ)上發(fā)展而來的,本文把目前學(xué)術(shù)界關(guān)于有條件約束地質(zhì)建模方法的研究成果歸結(jié)為兩大類:基于模擬器輸入向量搜尋的條件化方法和模擬器直接條件化的地質(zhì)建模方法。學(xué)術(shù)界對于前者的研究和應(yīng)用較多[24-29],后者則是為了解決前者存在的一般性缺陷,由Song[31-32]最新提出。
2.1.1核心思想
在無條件約束的建模方法中,訓(xùn)練得到的模擬器可將任意低維向量生成為吻合特定地質(zhì)模式的地質(zhì)模型。這些地質(zhì)模型分布在對應(yīng)高維空間中的一個特定區(qū)域內(nèi),該區(qū)域內(nèi)的每一個地質(zhì)模型都與輸入的低維向量一一對應(yīng),如圖8所示。針對任意給定的條件數(shù)據(jù)(如井點數(shù)據(jù)),在地質(zhì)模型區(qū)域內(nèi)必然存在一個小型區(qū)域(記為區(qū)域1),該區(qū)域內(nèi)的所有地質(zhì)模型均與該條件數(shù)據(jù)吻合。同時,在低維輸入向量空間中也必然存在一個對應(yīng)的區(qū)域(記為區(qū)域2),該區(qū)域內(nèi)的向量值可通過模擬器生成為區(qū)域1中的地質(zhì)模型。條件約束地質(zhì)建模的目的則是找出區(qū)域1中的地質(zhì)模型。由于地質(zhì)模型的維度遠大于輸入向量的維度,所以通常會去搜尋區(qū)域2中的向量值,然后通過模擬器將這些向量生成為區(qū)域1中的地質(zhì)模型。
目前,在學(xué)術(shù)界存在兩大類方法來尋找區(qū)域2中的向量值,一類是向量優(yōu)化的方法,還有一類是神經(jīng)網(wǎng)絡(luò)映射的方法。在第一類方法中,首先構(gòu)建一個目標(biāo)函數(shù),如式(1),該目標(biāo)函數(shù)反映了模擬器生成的地質(zhì)模型與給定條件數(shù)據(jù)之間的差距;然后通過優(yōu)化該目標(biāo)函數(shù)中輸入的低維向量z來最小化目標(biāo)函數(shù)。常用的兩種優(yōu)化方法包括馬爾科夫鏈蒙特卡洛方法(MCMC)[25,27,29]和梯度下降的方法[24,26]。每次優(yōu)化只能尋找到一個位于區(qū)域2中的輸入向量,通過模擬器可計算得到一個與條件數(shù)據(jù)吻合的地質(zhì)模型(位于區(qū)域1內(nèi))。不確定性地質(zhì)建模需要得到多個地質(zhì)模型實現(xiàn),因而需要進行多次優(yōu)化,每次選擇不同的初始值來獲得多個合適的輸入向量,這些向量通過模擬器則可生成多個與條件數(shù)據(jù)一致的地質(zhì)模型。
式中,O為目標(biāo)函數(shù),Dist為某種距離,G為訓(xùn)練好的模擬器卷積神經(jīng)網(wǎng)絡(luò),z為輸入的低維向量,cond為給定的條件數(shù)據(jù),M為地質(zhì)模型到條件數(shù)據(jù)的映射方程,比如針對井筒產(chǎn)量條件數(shù)據(jù),M即為儲層滲流的正演方程,而針對井點條件數(shù)據(jù),M則為對地質(zhì)模型G(z)進行井點抽樣的算子。
考慮到多次優(yōu)化速度較慢且操作繁瑣,Chan[28]提出了神經(jīng)網(wǎng)絡(luò)映射的方法。具體來說,針對給定的條件數(shù)據(jù),訓(xùn)練一個額外的小型神經(jīng)網(wǎng)絡(luò),將一個已知區(qū)域(如0至1的區(qū)域)映射到區(qū)域2上,如圖8。此時,該已知區(qū)域內(nèi)的任意數(shù)值都可通過這個額外的神經(jīng)網(wǎng)絡(luò)轉(zhuǎn)化成區(qū)域2內(nèi)的輸入向量,進而通過模擬器生成與條件數(shù)據(jù)一致的地質(zhì)模型(位于區(qū)域1內(nèi))。這樣,便可同時獲得大量模型實現(xiàn)。
圖8 基于模擬器輸入向量搜尋的條件化方法示意圖Fig. 8 Schematic diagram of conditioning approach based on searching of the input latent vector of the trained generator
2.1.2應(yīng)用效果分析
圖9為Zhang[26]應(yīng)用梯度下降方法產(chǎn)生的井筒數(shù)據(jù)約束的三維河道儲層地質(zhì)模型實現(xiàn),模型實現(xiàn)與井點數(shù)據(jù)完全吻合[26]。圖10為Mosser[29]應(yīng)用馬爾科夫鏈蒙特卡洛方法得到的井筒和地震數(shù)據(jù)共同約束的河道儲層縱切片二維地質(zhì)模型;其中,地質(zhì)模型與井筒數(shù)據(jù)完全吻合,由地質(zhì)模型正演而來的合成地震記錄也與地震觀測條件數(shù)據(jù)完全一致。Zhang[26]還通過實例證實了生成對抗網(wǎng)絡(luò)方法相比于多點地質(zhì)統(tǒng)計學(xué)建模方法在地質(zhì)模式復(fù)現(xiàn)上的優(yōu)越性。
圖9 基于梯度下降方法產(chǎn)生的與給定井點條件數(shù)據(jù)一致的多個三維河道儲層地質(zhì)模型實現(xiàn)[26]Fig. 9 Multiple 3D channel reservoir geomodels conditioned to given well data produced by gradient descent approach[26]
圖10 (a)和(b)為井筒解釋和地震觀測條件數(shù)據(jù),(c)為井筒和地震數(shù)據(jù)約束的地質(zhì)模型,(d)為由地質(zhì)模型正演而來的合成地震記錄[29]Fig. 10 (a) and (b) are the observed well interpretation and partial seismic conditioning data, (c) is a produced geomodel conditioned to the given well and seismic data, (d) is the seismic data synthesized from the geomodel in (c) using forward modelling[29]
基于模擬器輸入向量搜尋的條件化方法最大的問題就是:每次針對一個新的井區(qū)或新的條件數(shù)據(jù)時,需要重新去尋找合適的向量值,而尋找的過程比較繁瑣耗時、且需要較大的算力。因而,Song[31-32]在漸進增長生成對抗網(wǎng)絡(luò)地質(zhì)建模的基礎(chǔ)上提出了模擬器直接條件化的地質(zhì)建模方法(GANSim)。
2.2.1核心思想
模擬器直接條件化的地質(zhì)建模方法(GANSim)的提出主要受“地質(zhì)專家手繪沉積相圖”這一過程的啟發(fā):給定特定條件數(shù)據(jù)(如井點數(shù)據(jù)),地質(zhì)專家可以直接畫出既吻合地質(zhì)模式又與給定條件數(shù)據(jù)一致的沉積相圖,而無需專門的條件化操作;這是因為地質(zhì)專家的大腦中除了保存地質(zhì)模式知識以外,還有條件數(shù)據(jù)與地質(zhì)模型之間關(guān)系的知識(即條件數(shù)據(jù)對地質(zhì)模型約束規(guī)則的知識)。與地質(zhì)專家相類比,在無條件約束情況下訓(xùn)練所得的模擬器只學(xué)習(xí)到了地質(zhì)模式知識,還欠缺條件數(shù)據(jù)與地質(zhì)模型之間關(guān)系的知識。那么,能否讓模擬器在學(xué)習(xí)地質(zhì)模式知識的同時還學(xué)習(xí)到這種關(guān)系知識呢?這樣,當(dāng)把任意實際地質(zhì)條件數(shù)據(jù)輸入到模擬器中時,模擬器便可以像地質(zhì)專家一樣,直接生成吻合輸入條件數(shù)據(jù)和特定地質(zhì)模式的地質(zhì)模型,而無需對模擬器的輸入向量進行繁瑣的搜尋操作。這便是模擬器直接條件化地質(zhì)建模的核心思想。
具體來說,如圖11所示,首先設(shè)計條件數(shù)據(jù)輸入模擬器的接口結(jié)構(gòu),把條件數(shù)據(jù)和低維隨機向量一起輸入到模擬器中;然后定義專門的條件損失函數(shù),生成對抗網(wǎng)絡(luò)原損失函數(shù)促使模擬器學(xué)習(xí)地質(zhì)模式知識(進行無條件約束的地質(zhì)建模),而條件損失函數(shù)則促使模擬器學(xué)習(xí)條件數(shù)據(jù)與生成地質(zhì)模型之間關(guān)系的知識。最終訓(xùn)練得到的模擬器便可將任意條件數(shù)據(jù)直接生成為同時吻合地質(zhì)模式知識和輸入條件的地質(zhì)模型。
圖11 模擬器直接條件化的地質(zhì)建模方法示意圖[31]Fig. 11 Schematic diagram of the direct conditioning approach based on GANs (GANSim)[31]
Song[31-32]和宋隨宏[42]分別就條件類型為全局特征變量(如相比例、河道彎曲度、河道寬度)、離散井點數(shù)據(jù)和地球物理解釋的概率體數(shù)據(jù)的情況,形成了這幾類條件數(shù)據(jù)單獨約束以及聯(lián)合約束的模擬器直接條件化地質(zhì)建模方法。
2.2.2應(yīng)用效果分析
Song[31-32]將模擬器直接條件化的地質(zhì)建模方法應(yīng)用于河道寬度和彎曲度、泥巖相比例、井點以及概率圖多類條件約束的河流相水平切片二維地質(zhì)建模,取得了非常好的效果。比如在圖12(a)中,將泥巖比例、井點數(shù)據(jù)、河道堤岸復(fù)合體概率圖和低維隨機向量共同輸入到訓(xùn)練好的模擬器中,生成的地質(zhì)模型與所有條件數(shù)據(jù)和對應(yīng)地質(zhì)模式都非常吻合,當(dāng)輸入的隨機向量發(fā)生任意變化時,模擬器則可生成不同的地質(zhì)模型實現(xiàn)(圖12(a)中地質(zhì)模型的每一列對應(yīng)一個不同的輸入向量)。在圖12(b)中,保持輸入的井點數(shù)據(jù)和概率圖不發(fā)生變化(與圖12(a)中一致),只改變輸入的泥巖比例數(shù)值,生成的地質(zhì)模型也相應(yīng)地發(fā)生改變,即從左到右地質(zhì)模型中的河道數(shù)量逐漸減少。
圖12 泥巖比例、井點數(shù)據(jù)和概率圖共同約束的河流相水平切片二維地質(zhì)模型[32]Fig. 12 2D GANSim-produced 2D channel reservoirs conditioned to mud proportion, well data, and probability maps[32]
宋隨宏[42]將該方法應(yīng)用于塔河油田奧陶系暗河溶洞儲集體的不確定性三維地質(zhì)建模?;?萬多個訓(xùn)練數(shù)據(jù)(64×64×64),應(yīng)用4塊GPU(NVIDIA Tesla V100-PCIE-32GB)耗時25個小時訓(xùn)練得到針對塔河暗河溶洞儲層的三維地質(zhì)模型(64×64×64)模擬器。如圖13所示,將塔河油田TK6112井區(qū)的井筒解釋、地震所得溶洞概率體和一個低維隨機向量一起輸入到訓(xùn)練好的模擬器中,任意改變隨機向量的數(shù)值大小則可產(chǎn)生不同的三維地質(zhì)模型實現(xiàn)。這些實現(xiàn)與輸入的井筒解釋數(shù)據(jù)吻合率為100%,與概率體數(shù)據(jù)也非常吻合;生成的暗河溶洞在形態(tài)、走向等方面也與研究區(qū)的地質(zhì)認識非常一致,如廳堂洞的發(fā)育、階梯狀的形態(tài)以及NNE、NNW和近EW的溶洞段走向。
圖13 塔河油田TK6112井區(qū)井筒和地震概率體數(shù)據(jù)共同約束的暗河溶洞儲集體三維地質(zhì)建模(儲層大小為800 m×800 m×64 m,網(wǎng)格數(shù)為64×64×64)[42]Fig. 13 GANSim-produced 3D geomodels of the underground river karst cave reservoir in TK6112 well block of Tahe Oilfield conditioned to well data and seismic probability maps (the size of the reservoir is 800 m×800 m×64 m and the cell number of each geomodel is 64×64×64)[42]
Song[43]進一步改進該方法形成GANSim-3D框架,來讓模擬器直接產(chǎn)生任意尺寸的三維地質(zhì)模型,其核心在于保證模擬器中只包含卷積神經(jīng)網(wǎng)絡(luò)層(剔除全連接層)。如圖14所示,訓(xùn)練所得的模擬器則可針對任意大小的實際儲層,將井筒解釋和地震概率體數(shù)據(jù)生成為多個對應(yīng)的三維地質(zhì)模型實現(xiàn)。同樣,這些實現(xiàn)既吻合實際地質(zhì)模式特征也與輸入的條件數(shù)據(jù)一致,地震概率體中的噪聲被有效地壓制,模擬速度也非??欤阂粋€網(wǎng)格為336×256×96的三維地質(zhì)模型只需0.988 s來產(chǎn)生。
圖14 塔河油田某大型區(qū)塊井筒和地震概率體數(shù)據(jù)共同約束的三維地質(zhì)建模(儲層大小為4200 m×3200 m×96 m,網(wǎng)格數(shù)為336×256×96)[43]Fig. 14 GANSim-produced 3D geomodels of the underground river karst cave reservoir in a large block of Tahe Oilfield conditioned to well data and seismic probability maps (the size of the reservoir is 4200 m×3200 m×96 m and the cell number of each geomodel is 336×256×96)[43]
相比于基于模擬器輸入向量搜尋的條件化方法,模擬器直接條件化的地質(zhì)建模方法在操作的簡便性和耗時上具有明顯的優(yōu)勢;其缺點在于目前還無法實現(xiàn)地震及生產(chǎn)動態(tài)等間接條件數(shù)據(jù)的直接約束,而基于模擬器輸入向量搜尋的條件化方法卻可以實現(xiàn)這些數(shù)據(jù)的約束。當(dāng)然,兩種方法也可以結(jié)合使用,在模擬器實現(xiàn)井點等數(shù)據(jù)直接條件化的基礎(chǔ)上,應(yīng)用輸入向量搜尋的方法實現(xiàn)間接條件數(shù)據(jù)的約束。
(1)生成對抗網(wǎng)絡(luò)地質(zhì)建模方法可以很好地復(fù)現(xiàn)地質(zhì)體的空間模式特征,其模擬效果優(yōu)于多點地質(zhì)統(tǒng)計學(xué)建模方法。
(2)無條件約束時,漸進增長生成對抗網(wǎng)絡(luò)地質(zhì)建模方法在地質(zhì)模型模擬器訓(xùn)練時間和模擬效果上都優(yōu)于傳統(tǒng)生成對抗網(wǎng)絡(luò)地質(zhì)建模方法。
(3)模擬器直接條件化的建模方法在操作便捷性和建模速度上遠優(yōu)于基于模擬器輸入向量搜尋的條件化方法,已形成了全局變量(如河道彎曲度、相比例)、井點和概率體約束的模擬器直接條件化地質(zhì)建模方法;但目前,前者無法實現(xiàn)地震及生產(chǎn)數(shù)據(jù)等間接條件數(shù)據(jù)的約束,而后者可以實現(xiàn)。
(1)模擬器直接條件化的地質(zhì)建模方法(GANSim和GANSim-3D)是一個開放的方法體系,可通過進一步深入研究,將地質(zhì)力學(xué)、原始地震、生產(chǎn)動態(tài)以及原始沉積水動力等間接數(shù)據(jù)融合進來作為條件數(shù)據(jù),實現(xiàn)對地質(zhì)建模全方位多角度的綜合約束,以最大限度地降低儲層預(yù)測的不確定性。
(2)生成對抗網(wǎng)絡(luò)地質(zhì)建模方法雖然在訓(xùn)練模擬器時需要構(gòu)建大量的訓(xùn)練地質(zhì)模型并且需要在多塊高端GPU上訓(xùn)練較長的時間(如圖13的例子中應(yīng)用4塊Tesla V100 GPU耗時25小時),但是這些工作都只需完成一次即可,而訓(xùn)練所得的模擬器卻可以在任何相似地質(zhì)模式區(qū)進行無數(shù)次應(yīng)用。考慮到GPU的市場價格,石油公司、科研單位或個人有能力進行生成對抗網(wǎng)絡(luò)地質(zhì)建模方法的大規(guī)模研究和應(yīng)用。
(3)從工業(yè)落地應(yīng)用的角度來看,有如下兩個問題需要重點關(guān)注:一個是如何獲得大量能夠代表真實地下儲層的訓(xùn)練數(shù)據(jù)(訓(xùn)練地質(zhì)模型)?基于過程的方法能捕捉地質(zhì)體不同尺度的細節(jié),但對于很多地質(zhì)過程的認識尚不清楚,且運算速度過慢需要消耗大量運算資源;針對具體儲層特征,研究專門的基于目標(biāo)或基于仿過程的模擬方法或是解決訓(xùn)練數(shù)據(jù)問題的重要思路。另一個問題是自然界的儲層類型非常多樣,是否要構(gòu)建針對每種儲層類型的地質(zhì)模型模擬器,而又該如何劃分儲層類型?筆者的一個不成熟的想法是:能否構(gòu)建一個針對全球各種儲層類型、放之四海而皆準(zhǔn)的大型地質(zhì)模型模擬器,那么在未來工程師只須將目標(biāo)區(qū)塊的條件數(shù)據(jù)和儲層類型等基礎(chǔ)數(shù)據(jù)上傳云端,便可在幾秒內(nèi)傳回大量可能的地質(zhì)模型實現(xiàn)和不確定性分析結(jié)果。目前,人類已經(jīng)在語言等領(lǐng)域構(gòu)建了諸多千百億參數(shù)的人工智能“大模型”(如GPT-3、鵬城-百度·文心等),獲得了極為出色的效果,此處所提的“模擬器大模型”或是地學(xué)領(lǐng)域一個重要、可實現(xiàn)、具有巨大應(yīng)用和商業(yè)潛力的努力方向。
(4)從地質(zhì)知識的角度來看,模擬器實際上是把抽象的地質(zhì)模式知識(和條件對地質(zhì)模型的約束規(guī)則知識)以定量參數(shù)(即神經(jīng)網(wǎng)絡(luò)參數(shù))的形式保存下來,形成可靈活操縱和應(yīng)用的數(shù)字化知識。這些數(shù)字化知識除了直接應(yīng)用于本文所述的地質(zhì)建模以外,或許還可通過神經(jīng)網(wǎng)絡(luò)遷移學(xué)習(xí)等方式應(yīng)用于其它實踐,并為“地學(xué)知識數(shù)字化”相關(guān)課題的研究提供重要的借鑒和實踐意義。