張 挺, 王先武, 杜 奕, 彭 源
(1.上海電力大學(xué) 計(jì)算機(jī)科學(xué)與技術(shù)學(xué)院, 上海 200090;2.上海第二工業(yè)大學(xué) 工學(xué)部, 上海 201209)
隨著常規(guī)油氣資源的日益枯竭,頁(yè)巖氣等非常規(guī)油氣能源的勘探與開發(fā)越來(lái)越受到人們的重視。目前我國(guó)頁(yè)巖氣的主要產(chǎn)區(qū)是涪陵、長(zhǎng)寧、威遠(yuǎn)等地,較多資源埋深超過(guò)3 500 m,地質(zhì)條件復(fù)雜,了解和掌握頁(yè)巖儲(chǔ)層的內(nèi)部結(jié)構(gòu)是開采頁(yè)巖氣的基礎(chǔ)[1]。頁(yè)巖儲(chǔ)層結(jié)構(gòu)復(fù)雜,其巖石組成包含有機(jī)質(zhì)、黏土礦物、石英等脆性礦物以及碳酸鹽礦物,并含有一定量的長(zhǎng)石、云母、方解石、白云石、黃鐵礦等礦物。對(duì)頁(yè)巖儲(chǔ)層內(nèi)部結(jié)構(gòu)的評(píng)價(jià)存在著諸多問(wèn)題,如孔隙和裂縫結(jié)構(gòu)非常復(fù)雜、非均質(zhì)性強(qiáng)、物性變化大等。目前可以通過(guò)CT成像的方式觀察頁(yè)巖內(nèi)部結(jié)構(gòu),但CT成像需要專用且昂貴的設(shè)備,且通常只能獲取所研究巖石樣本的小范圍圖像,難以重建較大區(qū)域的頁(yè)巖結(jié)構(gòu)。為了評(píng)估頁(yè)巖儲(chǔ)層,必須進(jìn)行大量物理實(shí)驗(yàn),以獲得更大范圍的分布情況,成本較大[2]??臻g數(shù)據(jù)建模已被廣泛用于巖石重構(gòu)。原始的空間數(shù)據(jù)建模方法依賴兩點(diǎn)概率函數(shù)度量空間變異性,使用訓(xùn)練圖像作為樣本特征提取的方式是目前空間數(shù)據(jù)建模方法的主流[3-5]。通常假定這些訓(xùn)練圖像具有平穩(wěn)的特征分布,并依賴學(xué)習(xí)訓(xùn)練圖像特征來(lái)重構(gòu)空間數(shù)據(jù)。
深度學(xué)習(xí)具有很強(qiáng)的提取特征能力,可以用于提取訓(xùn)練圖像的結(jié)構(gòu)特征,而生成對(duì)抗網(wǎng)絡(luò)(Generative Adversarial Networks,GANs)是深度學(xué)習(xí)的一個(gè)重要分支。深度卷積生成對(duì)抗網(wǎng)絡(luò)(Deep Convolutional Generative Adversarial Networks,DCGANs)是GANs的一種主要變體,整體結(jié)構(gòu)與GANs基本相同,是一種無(wú)監(jiān)督機(jī)器學(xué)習(xí)方法,可在給定一組訓(xùn)練圖像的情況下重構(gòu)未知圖像。本文提出了一種基于DCGANs重建頁(yè)巖的新方法,雖然DCGANs的訓(xùn)練要確定一組相對(duì)穩(wěn)定的超參數(shù),但是用于生成圖像的參數(shù)集可以在訓(xùn)練后存儲(chǔ),從而可以快速生成新的重構(gòu)樣本。
GANs是在深度學(xué)習(xí)的背景下提出的,是一種從訓(xùn)練圖像中學(xué)習(xí)高維概率分布表示的方法[6]。訓(xùn)練圖像呈現(xiàn)了圖像空間中表示概率分布的代表性樣本。GANs包含兩個(gè)可區(qū)分的函數(shù):鑒別器D和生成器G。生成器G將隨機(jī)變量從隨機(jī)噪聲z映射到圖像空間得到生成圖像G(z)。z通常由正態(tài)分布pz的獨(dú)立實(shí)數(shù)隨機(jī)組成,代表生成器的隨機(jī)輸入。鑒別器D的作用是計(jì)算隨機(jī)樣本來(lái)自“真實(shí)”數(shù)據(jù)的概率分布pdata。鑒別器嘗試正確標(biāo)記每個(gè)樣本,而生成器嘗試“欺騙”鑒別器,標(biāo)記生成圖像G(z)作為真實(shí)數(shù)據(jù)分布的一部分,即實(shí)現(xiàn)D(G(z))接近1。GANs結(jié)構(gòu)如圖1所示[7-8]。
圖1 GANs結(jié)構(gòu)
根據(jù)鑒別器輸出結(jié)果,得到GANs的損失。通常情況下把最小化GANs的損失函數(shù)當(dāng)作最小化-最大化問(wèn)題,即
(1)
該優(yōu)化問(wèn)題的解決方案為納什均衡[7],其中每個(gè)參與者就其參數(shù)而言達(dá)到其損失函數(shù)的局部最小值。利用可梯度下降的優(yōu)化方法訓(xùn)練的卷積神經(jīng)網(wǎng)絡(luò)來(lái)表示G和D。訓(xùn)練分兩個(gè)步驟。
首先訓(xùn)練鑒別器函數(shù)使其最大化,即
J(D)=X~pdata(X)[lg(D(X))]+
(2)
然后固定生成器的參數(shù)。通過(guò)從100維正態(tài)分布的隱藏空間中抽取向量z來(lái)生成向量G(z),并訓(xùn)練生成器函數(shù)以使其最大化,即
J(G)=z~pz[lg(1-D(G(z)))]
(3)
保持鑒別器參數(shù)固定,通過(guò)式(3)的生成器來(lái)“欺騙”鑒別器,使其認(rèn)為樣本G(z)是真實(shí)數(shù)據(jù)樣本,使生成器盡可能接近實(shí)際數(shù)據(jù)分布pdata(X)的分布pg(X),其中pg(X)表示生成器所生成圖像的概率分布。當(dāng)達(dá)到收斂pg(X)=pdata(X)時(shí),鑒別器的值變?yōu)?.5,無(wú)法再區(qū)分兩者。由于最初鑒別器D的性能明顯優(yōu)于生成器,訓(xùn)練生成器的梯度接近于零,因此保證lg(D(G(z)))最大化優(yōu)于保證生成器的lg(1-D(G(z)))最小化[7]。GANs需要進(jìn)行反復(fù)訓(xùn)練才能找到最佳的超參數(shù)集,以實(shí)現(xiàn)穩(wěn)定的訓(xùn)練。目前許多改進(jìn)方法可以加速GANs訓(xùn)練[8]。
DCGANs是GANs的一種主要變體,整體結(jié)構(gòu)與GANs類似,只是DCGANs的鑒別器和生成器都使用了卷積神經(jīng)網(wǎng)絡(luò)來(lái)替代GANs中的多層感知機(jī),同時(shí)為了使整個(gè)網(wǎng)絡(luò)可導(dǎo),采用全卷積神經(jīng)網(wǎng)絡(luò),避免在卷積層之后使用全連接層。在生成器和鑒別器中都添加了批量歸一化操作[9]。同時(shí),生成器的輸出層使用Tanh激活函數(shù),其他層使用ReLU激活函數(shù)。鑒別器的所有層都使用LeakyReLU激活函數(shù)[10-11]。
步驟1 首先初始化生成器G和鑒別器D的超參數(shù)。
步驟2 由100維隨機(jī)噪聲向量z通過(guò)全連接層學(xué)習(xí),變形成4×4×1 024的矩陣輸出,之后通過(guò)4個(gè)反卷積層操作,重構(gòu)生成64×64×3的巖石圖像。生成器結(jié)構(gòu)如圖2所示,其中全卷積神經(jīng)網(wǎng)絡(luò)(Fully Convolutional Networks,FCNN)表示全連接神經(jīng)網(wǎng)絡(luò),DeConv2d表示反卷積。
圖2 生成器結(jié)構(gòu)示意
步驟3 鑒別器輸入64×64像素的圖像,經(jīng)過(guò)4次卷積,將分辨率降低為4×4像素,借用此功能來(lái)確定此圖像是來(lái)自真實(shí)圖像還是來(lái)自生成器。利用鑒別器反向傳播更新超參數(shù),提高鑒別器鑒別真實(shí)圖像與“假”圖像的能力。
步驟4 當(dāng)鑒別器具有較高鑒別能力時(shí),固定鑒別器的超參數(shù),并不斷更新生成器超參數(shù)促使生成圖像的質(zhì)量逐漸接近于真實(shí)圖像。這樣鑒別器就難以區(qū)分真實(shí)圖像和生成圖像,即生成器達(dá)到“欺騙”鑒別器的效果。
步驟5 重復(fù)步驟3和步驟4,直至生成器G和鑒別器D達(dá)到納什平衡,模型收斂。
本文實(shí)驗(yàn)數(shù)據(jù)來(lái)自納米CT掃描獲取得到的真實(shí)頁(yè)巖圖像數(shù)據(jù)。圖3是一幅大小為1 016×1 024像素的二值化頁(yè)巖截面,分辨率為每像素65 nm。圖像邊緣四周的黑色部分作為無(wú)效數(shù)據(jù)進(jìn)行剔除,白色表示頁(yè)巖的骨架。
圖3 真實(shí)頁(yè)巖數(shù)據(jù)
頁(yè)巖內(nèi)部結(jié)構(gòu)復(fù)雜,很難定量描述其內(nèi)部特征。對(duì)頁(yè)巖重構(gòu)質(zhì)量進(jìn)行評(píng)價(jià)主要是考察其結(jié)構(gòu)特征是否得到重構(gòu),而并非在相同的位置具有相同的狀態(tài)值,即要求重構(gòu)數(shù)據(jù)可以體現(xiàn)出訓(xùn)練圖像的結(jié)構(gòu)特征。本文采取變差函數(shù)和孔隙度兩個(gè)巖石主要屬性對(duì)重構(gòu)質(zhì)量進(jìn)行評(píng)價(jià)[12]。
變差函數(shù)用于描述數(shù)據(jù)值的空間相關(guān)性。數(shù)據(jù)點(diǎn)在空間上的距離越遠(yuǎn),相關(guān)性就變得越小。變差函數(shù)的定義為:區(qū)域化變量Z(x)和Z(x+h)表示兩點(diǎn)之差的方差之半,其中x表示空間位置向量值,h表示空間向量值,具體含義可參見文獻(xiàn)[13]。孔隙度是指巖石中所有孔隙空間體積之和與巖石總體積的比值,以百分?jǐn)?shù)表示。變差函數(shù)與孔隙度是頁(yè)巖重要的特征參數(shù),利用變差函數(shù)和孔隙度對(duì)重構(gòu)質(zhì)量進(jìn)行評(píng)估,可有效地對(duì)頁(yè)巖重構(gòu)質(zhì)量進(jìn)行評(píng)估。
本文利用頁(yè)巖截面作為訓(xùn)練圖像進(jìn)行DCGANs訓(xùn)練,實(shí)現(xiàn)網(wǎng)絡(luò)能夠自行生成符合真實(shí)頁(yè)巖結(jié)構(gòu)特征的重構(gòu)圖像。通過(guò)CT掃描獲取1 021幅二值化頁(yè)巖截面圖像,從每幅圖中的相同(x,y)位置截取大小為64×64像素的圖像,作為實(shí)驗(yàn)所需的頁(yè)巖訓(xùn)練圖像,可得到1 021幅64×64像素的二值化真實(shí)圖像。真實(shí)圖像與重構(gòu)圖像比較如圖4所示,其中,藍(lán)色部分表示孔隙,白色表示骨架。對(duì)比Filstersim[14]重構(gòu)得到的頁(yè)巖圖像圖4(d),可以發(fā)現(xiàn)DCGANs與真實(shí)圖像結(jié)構(gòu)特征的相似性更高。
圖4 真實(shí)圖像與重構(gòu)圖像比較
圖5所示為重構(gòu)圖像與真實(shí)圖像的平均變差函數(shù)。相較于Filstersim重構(gòu)圖像,DCGANs重構(gòu)圖像在x和y方向平均變差函數(shù)與真實(shí)圖像更加接近。
圖5 真實(shí)圖像與重構(gòu)圖像的平均變差函數(shù)
表1為真實(shí)圖像和DCGANs及Filstersim重構(gòu)圖像的孔隙度。由表1可以發(fā)現(xiàn),重構(gòu)圖像與真實(shí)圖像孔隙度均較為接近。DCGANs訓(xùn)練結(jié)束后,由于超參數(shù)可以保存以避免再次訓(xùn)練參數(shù),因此后繼重構(gòu)頁(yè)巖時(shí)將無(wú)需再次進(jìn)行模型訓(xùn)練。這是DCGANs的一個(gè)優(yōu)勢(shì)。
表1 真實(shí)圖像與重構(gòu)圖像的孔隙度
本文提出了一種基于DCGANs的二維頁(yè)巖圖像重構(gòu)方法,即利用DCGANs生成與原始頁(yè)巖結(jié)構(gòu)特征相似的重構(gòu)圖像。實(shí)驗(yàn)證明,DCGANs可以提取頁(yè)巖圖像中的結(jié)構(gòu)特征,重構(gòu)圖像與訓(xùn)練圖像的變差函數(shù)和孔隙度相似。由于DCGANs網(wǎng)絡(luò)的超參數(shù)可以保存,因此這些參數(shù)可以多次重復(fù)使用,較傳統(tǒng)方法具有一定的優(yōu)勢(shì)。