杜 昕 范廷恩 董建華 聶 妍 范洪軍 郭泊洋
(①海洋石油高效開發(fā)國家重點實驗室,北京 100020; ②中海油研究總院有限責(zé)任公司,北京 100020; ③中國地質(zhì)大學(xué)(北京)能源學(xué)院,北京 100083)
薄儲層的預(yù)測和表征是油田勘探開發(fā)的重點,目前主要有三種策略: ①基于譜分解技術(shù)的薄層預(yù)測[1-3],根據(jù)薄層頂、底反射界面干涉特點優(yōu)選時窗,以振幅譜出現(xiàn)的兩個頻陷之間的距離作為薄層的時間厚度。②基于地震反演技術(shù)的薄層預(yù)測[4-6],如沈洪濤等[7]利用地震資料高橫向分辨率與地質(zhì)、測井資料高縱向分辨率的優(yōu)勢進行互補,應(yīng)用地質(zhì)統(tǒng)計學(xué)反演技術(shù)預(yù)測薄砂巖儲層;高君等[8]通過波形指示反演技術(shù)將地震波形橫向變化融入薄儲層預(yù)測中。③基于多屬性回歸方法的薄層預(yù)測[9],有監(jiān)督地學(xué)習(xí)輸入地震屬性與測井儲層參數(shù)之間的模型表征,從而實現(xiàn)井間儲層預(yù)測,如張顯文等[10]預(yù)測碳酸鹽巖儲層孔隙因子參數(shù)刻畫儲層有利區(qū);張晶玉等[11]對多屬性預(yù)測三個關(guān)鍵環(huán)節(jié)進行優(yōu)化與質(zhì)控。相比于前兩種策略,多屬性回歸方法能夠避免時窗難確定、子波不準確、預(yù)測結(jié)果分辨率低與模型化嚴重等問題;同時,由于能夠表征儲層特征與輸入屬性之間的非線性關(guān)系,因此具有提高預(yù)測結(jié)果精度的潛能。然而,傳統(tǒng)多屬性回歸方法非線性表征能力仍然較弱,訓(xùn)練模型泛化能力不足,常導(dǎo)致井間薄儲層預(yù)測結(jié)果可靠性不足。
近年來,深度學(xué)習(xí)技術(shù)在分類[12-13]、目標檢測[14-15]、分割圖像處理[16-17]等方面取得了成功,在地球物理勘探領(lǐng)域也逐漸推廣運用,如地震資料處理[18-20]與解釋[21-23]、地震反演[24-26]等。深度學(xué)習(xí)技術(shù)訓(xùn)練的模型完全基于數(shù)據(jù)驅(qū)動,能夠挖掘輸入數(shù)據(jù)與期望輸出之間的深層聯(lián)系,常具有非線性、高分辨、去模型化等特點。
多層感知機(Multi-Layer Perceptron,MLP)是一種經(jīng)典的深度學(xué)習(xí)網(wǎng)絡(luò)模型,也是現(xiàn)階段所有主流深度學(xué)習(xí)網(wǎng)絡(luò)的基礎(chǔ)。該網(wǎng)絡(luò)包含輸入層、輸出層以及多個隱含層,以神經(jīng)元為最小單位,將輸入的多個節(jié)點信息非線性映射到單一輸出上。
本文將多層感知機深度學(xué)習(xí)網(wǎng)絡(luò)與多屬性回歸方法相結(jié)合,預(yù)測砂巖薄儲層。通過基于數(shù)據(jù)驅(qū)動的新方法訓(xùn)練具有高泛化能力的模型,以進一步提升薄儲層預(yù)測分辨率與井間預(yù)測結(jié)果合理性。同時,從三方面優(yōu)化多屬性回歸方法:①屬性輸入方面,除原始地震數(shù)據(jù)外,將90°相移數(shù)據(jù)成果[27]用于儲層結(jié)構(gòu)近似估計,代替常規(guī)的反演阻抗體,并作為外部屬性;同時將儲層不連續(xù)界限地震屬性[28]用于分析儲層空間的展布。②目標預(yù)測方面,以對巖性最為敏感的自然伽馬參數(shù)作為期望輸出,同時保留自然伽馬曲線高頻成分進行模型學(xué)習(xí),以提高薄儲層預(yù)測分辨率。③樣本規(guī)模與模型評價方面,選擇多種類型、多口井組成訓(xùn)練集和驗證集,保障模型泛化能力;同時避免預(yù)測結(jié)果過擬合。最后,通過在A油田的測試驗證該方法的應(yīng)用效果。
多屬性回歸方法的本質(zhì)是有監(jiān)督學(xué)習(xí),是一種將地震資料及其屬性體(如反演體、分頻體等)轉(zhuǎn)化為儲層表征參數(shù)體(如阻抗體、自然伽馬體等)的方法。該方法通過從井旁地震道中提取各類屬性進行優(yōu)選與組合,訓(xùn)練并獲得優(yōu)選屬性與井點測量參數(shù)(如密度、自然伽馬等)之間的模型表征,并外推應(yīng)用于井間儲層參數(shù)預(yù)測。其中有兩個重要環(huán)節(jié)。
(1)優(yōu)選地震屬性組合。常采用“專家法”(根據(jù)人工經(jīng)驗主觀選擇屬性組合)與“步聰法”(通過誤差最小準則,依次優(yōu)選與儲層參數(shù)相關(guān)度更高的屬性進行組合)結(jié)合方式[9],通過“專家法”主觀地初篩出被認為與儲層參數(shù)具有高關(guān)聯(lián)度的屬性集合,通過“步聰法”逐個計算初篩屬性與儲層參數(shù)的關(guān)聯(lián)程度,保留相關(guān)程度最高的屬性,然后按照最小二乘誤差準則依次確定后續(xù)屬性,直至誤差滿足要求或達到預(yù)設(shè)最大屬性個數(shù)。
(2)模型表征。常利用多元線性回歸或經(jīng)典神經(jīng)網(wǎng)絡(luò)非線性回歸方法表征模型,其中線性回歸模型為
(1)
式中:P為預(yù)測的井點儲層參數(shù)向量;Ak為優(yōu)選出的第k個地震屬性(二維或三維矩陣);M為優(yōu)選屬性總個數(shù);uk=[u1u2…uk]T和vk=[v1v2…vk]T分別為待求的Ak的權(quán)重系數(shù)和尺度常數(shù)組成的列向量。通過誤差最小二乘準則建立凸優(yōu)化目標泛函
(2)
式中:‖·‖2代表L2范數(shù);d為測井實測儲層參數(shù)向量。通常應(yīng)用梯度下降類算法(共軛梯度法、最速下降法)快速求解式(2)得到uk與vk,從而完成模型表征。
訓(xùn)練非線性模型表征屬性組合與儲層參數(shù)的關(guān)系,經(jīng)典神經(jīng)網(wǎng)絡(luò)包含1個輸入層、1個輸出層及1個隱含層。輸入層有3個節(jié)點、隱含層有4個節(jié)點的網(wǎng)絡(luò)結(jié)構(gòu)如圖1所示,各層之間以連接系數(shù)ai,j,k與偏置常數(shù)ci,j,k相連接。其中,下標(i,j,k)為第k-1層第i個元素與第k層第j個神經(jīng)元之間的連接。與式(2)類似,通過最小化網(wǎng)絡(luò)輸出y與實測值的誤差,獲得ai,j,k和ci,j,k,建立非線性模型。經(jīng)典神經(jīng)網(wǎng)絡(luò)的模型表征能力在線性回歸基礎(chǔ)上得到了較大提升,但常由于訓(xùn)練樣本多樣性的不足和網(wǎng)絡(luò)泛化能力有限,導(dǎo)致井間薄儲層預(yù)測結(jié)果出現(xiàn)同向軸破碎、連續(xù)性過差等問題。
圖1 經(jīng)典神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)
圖2示意了一種多層感知機網(wǎng)絡(luò)結(jié)構(gòu),輸入層為3分量,輸出層為1分量,具有4層隱含層,每層包含4個神經(jīng)元。f(x)代表激活函數(shù),可以為Sigmoid、Tanh或者ReLu函數(shù)中的一種,其表達式及函數(shù)形態(tài)如圖3所示。激活函數(shù)的作用是向?qū)W習(xí)網(wǎng)絡(luò)中引入非線性運算,使網(wǎng)絡(luò)能夠逼近任何非線性函數(shù),大幅度提升模型泛化能力。目前使用最廣泛的是ReLu激活函數(shù),相比于Sigmoid、Tanh函數(shù),避免了“梯度消失”缺陷,即x取值很大以后,y對x的增大不再敏感。
圖2 多層感知機深度學(xué)習(xí)網(wǎng)絡(luò)結(jié)構(gòu)示意圖
圖3 Tanh(上)、Sigmoid(中)、ReLu(下)
以圖2所示網(wǎng)絡(luò)結(jié)構(gòu)為例,第1個隱含層的4個神經(jīng)元與輸入層3個分量(x1,x2,x3)的解析表達式為
(3)
(4)
(5)
式中:yj代表輸出層第j個分量;M為隱含層總層數(shù)。本例中j≡1、M=4。結(jié)合式(3)~式(5),可建立多層感知機網(wǎng)絡(luò)結(jié)構(gòu)的由輸入x到輸出y的正演模型。
MLP模型中待求解參數(shù)是連接權(quán)重wi,j,k和偏置常數(shù)bi,j,k。首先通過預(yù)測誤差最小二乘準則及正則化約束條件建立MLP模型凸優(yōu)化目標泛函
(6)
式中:di代表真實值;yi為預(yù)測值。該方程采用誤差反向傳播(Back Propagation,BP)策略進行求解(圖4)。多層感知機網(wǎng)絡(luò)由于具有多隱含層、多神經(jīng)節(jié)點以及激活函數(shù)等模塊,非線性表征能力、模型泛化能力及預(yù)測精度較經(jīng)典神經(jīng)網(wǎng)絡(luò)模型均有顯著提升。
圖4 多層感知機深度學(xué)習(xí)網(wǎng)絡(luò)求解算法流程
將多層感知機深度學(xué)習(xí)網(wǎng)絡(luò)移植于地震多屬性回歸方法,可以預(yù)測砂巖薄儲層。
1.3.1 輸入屬性
傳統(tǒng)多屬性回歸方法常以地震數(shù)據(jù)及反演的阻抗體作為輸入,加入阻抗體的目的是提升預(yù)測結(jié)果與測井參數(shù)的吻合程度。然而,由于阻抗反演過程中子波提取、時深標定、模型插值、反演參數(shù)等環(huán)節(jié)引起的不確定性誤差,容易造成多屬性回歸結(jié)果過于模型化,井間預(yù)測結(jié)果合理性不足。
地震90°相移技術(shù)已被證實在儲層結(jié)構(gòu)相對簡單的條件下(泥包砂)能夠較理想地描述λ/4~λ(波長)厚度的薄儲層[27]。與地震反演技術(shù)相比,該技術(shù)高效、簡單。更為重要的是,90°相移技術(shù)完全基于地震數(shù)據(jù)而不破壞地震信息的保幅和保真處理。基于此,本文提出以地震90°相移數(shù)據(jù)代替阻抗,作為提供儲層結(jié)構(gòu)近似信息的外部屬性,加入到多屬性回歸方法中。
范廷恩[28]提出的儲層不連續(xù)界限地震屬性能夠表征沉積作用、成巖改造及構(gòu)造運動等因素形成的巖性尖滅、砂體疊置、物性變化及小斷層等,本文將儲層不連續(xù)界限屬性作為多屬性回歸輸入之一,分析儲層空間展布。
1.3.2 預(yù)測目標
傳統(tǒng)多屬性回歸方法常需要對預(yù)測目標參數(shù)(如密度、自然伽馬等)進行低通濾波以匹配井震頻率,提高訓(xùn)練結(jié)果與測井實際資料的吻合程度,但這種做法降低了預(yù)測結(jié)果的分辨率,不利于薄儲層預(yù)測。
由于測井資料采樣率為0.125m,有效高截頻至少在150Hz以上;以40Hz主頻、0~60Hz有效頻帶地震資料為例,傳統(tǒng)多屬性回歸方法預(yù)測結(jié)果難以包含測井資料攜帶的60~150Hz高頻信息。很多油田砂巖薄儲層厚度在10m以下,如果以渤海地區(qū)2.5km/s地層速度估算,分辨10m薄層需要地震視主頻至少達到65Hz以上,這使傳統(tǒng)多屬性回歸方法應(yīng)用受限。
多層感知機深度學(xué)習(xí)網(wǎng)絡(luò)具有高度非線性特征,一定程度上能夠?qū)W習(xí)到由低頻數(shù)據(jù)到高頻信息之間的模型表征。本文以有效高截頻(150Hz)以內(nèi)的測井數(shù)據(jù)為預(yù)測目標,建立由有限帶寬地震數(shù)據(jù)到高頻測井數(shù)據(jù)的映射,以期改善預(yù)測結(jié)果縱向分辨率,提升薄儲層刻畫能力。
1.3.3 數(shù)據(jù)預(yù)處理
深度學(xué)習(xí)網(wǎng)絡(luò)對數(shù)據(jù)的分布規(guī)律相當敏感,一般要求輸入數(shù)據(jù)與期望輸出都服從(0,1)正態(tài)分布。本文采用以下步驟進行數(shù)據(jù)預(yù)處理:
(1)測井數(shù)據(jù)標準化,保證訓(xùn)練集與驗證集自然伽馬曲線的泥巖基線基本一致;
(2)輸入數(shù)據(jù)與期望輸出的歸一化,采用u1=[u0-mean(u0)]/std(u0)(u0為原始數(shù)據(jù),u1為歸一化結(jié)果,mean、std分別為均值、方差函數(shù))的歸一化方式,依次實現(xiàn)對輸入屬性(地震數(shù)據(jù)、90°相移數(shù)據(jù)、儲層不連續(xù)界限屬性)與期望輸出(訓(xùn)練集和驗證集的自然伽馬測井數(shù)據(jù))的歸一化處理,保證輸入與輸出服從(0,1)正態(tài)分布。
1.3.4 樣本規(guī)模與模型評價
訓(xùn)練樣本的多樣性直接影響深度學(xué)習(xí)算法中模型的泛化能力。以不同鉆遇結(jié)果和鉆遇靶點盡可能覆蓋研究區(qū)為訓(xùn)練集組成原則,建立類型豐富的訓(xùn)練樣本,樣本規(guī)模達到10口井以上。
此外,將數(shù)據(jù)樣本劃分為訓(xùn)練集和測試集,基于前者訓(xùn)練模型,再利用后者的預(yù)測結(jié)果與實際數(shù)據(jù)的誤差評估模型。
1.3.5 模型建立
以疊前時間偏移數(shù)據(jù)及其90°相移數(shù)據(jù)、相移數(shù)據(jù)的儲層不連續(xù)界限屬性為輸入,井點高頻自然伽馬數(shù)據(jù)為期望輸出。10口井組成訓(xùn)練集,兩口井組成驗證集。通過試錯法在小規(guī)模數(shù)據(jù)集上試驗,確定具有7個隱含層,每層15個神經(jīng)元的多層感知機深度學(xué)習(xí)網(wǎng)絡(luò)具有最佳效果,同時采用ReLu激活函數(shù)搭建深度學(xué)習(xí)網(wǎng)絡(luò),預(yù)測井間自然伽馬值。
利用中國A油田實際資料測試該方法。A油田位于渤海海域,井網(wǎng)密集(圖5),館陶組上段(L40~L80,圖6)砂泥巖薄互層發(fā)育,單砂體厚度不足5m。選取12口井,其中探井兩口(E1井、E2井),定向開發(fā)井10口(D1井~D10井)(圖5)。
圖5 研究區(qū)井點分布及地震測線位置
圖6 AA′線地震剖面
對比疊前地震時間偏移剖面(圖6)與其90°相移剖面(圖7),可見90°相移剖面與L50段相對較厚的儲層對應(yīng)關(guān)系較好,反射波谷能夠代表砂巖響應(yīng)。但對于L60、L80段薄互層,波谷對應(yīng)整套復(fù)合砂體的響應(yīng),依靠相移剖面難以識別其中的單砂體?;?0°相移數(shù)據(jù)提取的不連續(xù)界限屬性(圖8)能夠刻畫三類不連續(xù)界限,即斷裂(紅色)、尖滅型砂體接觸關(guān)系(綠色)、疊置型或側(cè)疊型砂體接觸關(guān)系(黃色),以及圖8中灰色表示的連續(xù)層段。對比圖8與圖7方框區(qū)域可知,E1井測井解釋結(jié)果表明L60層段多期砂體疊置,引起90°相移剖面上地震反射產(chǎn)狀與振幅能量發(fā)生改變,而不連續(xù)界限屬性表現(xiàn)為砂體尖滅型與側(cè)疊型接觸關(guān)系,與相移剖面信息吻合。
圖7 AA′線90°相移剖面
圖8 AA′線不連續(xù)界限屬性剖面
本文以1口探井(E1井)和9口開發(fā)井(D1~D5井、D7~D9井)作為訓(xùn)練集,1口探井(E2井)和1口開發(fā)井(D6井)作為驗證集,利用多層感知機深度學(xué)習(xí)網(wǎng)絡(luò)訓(xùn)練模型,預(yù)測L40~L80段自然伽馬值。
由圖9可知,深度學(xué)習(xí)模型訓(xùn)練集和驗證集的預(yù)測結(jié)果與實測結(jié)果吻合較好,未出現(xiàn)過擬合(圖9上);采用傳統(tǒng)多屬性回歸方法建立的模型在各井的預(yù)測結(jié)果與實測吻合程度不如前者(圖9下)。圖10進一步揭示了深度學(xué)習(xí)模型預(yù)測效果明顯優(yōu)于傳統(tǒng)多屬性回歸方法,前者預(yù)測值與真實值平均相關(guān)系數(shù)達到86.4%(訓(xùn)練集)和85.5%(驗證集),而傳統(tǒng)多屬性回歸結(jié)果預(yù)測值與真實值平均相關(guān)系數(shù)僅為65.1%(訓(xùn)練集)和59.3%(驗證集)。
通過聯(lián)井剖面可評估多層感知機模型井間自然伽馬預(yù)測效果。由圖11可知,自然伽馬剖面較90°相移剖面垂向分辨率有較大程度提升,并與實鉆結(jié)果較吻合,同時反射同向軸橫向連續(xù)性較好。圖11b剖面中紅色虛線框標記的一套儲層在90°相移剖面難以識別,而自然伽馬剖面滿足砂體解釋精度要求,可以進一步精細刻畫該砂體。
圖10 多層感知機網(wǎng)絡(luò)(a)與傳統(tǒng)多屬性回歸模型(b)訓(xùn)練集(左)、驗證集(右)自然伽馬預(yù)測值與實測值交會對比
圖11 BB′線90°相移剖面(a)與預(yù)測自然伽馬剖面(b)對比
應(yīng)用自然伽馬數(shù)據(jù)體對L50~L60儲層段開展小層研究,精細解釋L50、L54、L56、L58、L60、L64等6套小層頂面層位(圖12)。
圖12 CC′線小層頂面解釋結(jié)果
從圖12可以看出,自然伽馬剖面與鉆井各小層巖性解釋結(jié)果吻合度較高,基本可以預(yù)測薄儲層;在90°相移剖面上,L50、L54、L56、L58、L60等5套小層頂面較難追蹤解釋。由于L60~L64小層儲層厚度較大,在相移數(shù)據(jù)中能夠追蹤解釋L64頂面,但自然伽馬剖面反映的L60~L64儲層視厚度與鉆井巖性解釋厚度視覺上更為吻合。
應(yīng)用自然伽馬數(shù)據(jù)體解釋的小層頂面開展儲層平面展布研究,本文展示L54~L56層儲層預(yù)測成果。
分別提取基于自然伽馬數(shù)據(jù)體與相移數(shù)據(jù)體的沿層敏感屬性(總負振幅),與訓(xùn)練集和測試集12口井鉆遇的累計砂巖厚度疊合(圖13)。由圖可知,自然伽馬數(shù)據(jù)體對于薄儲層刻畫能力明顯優(yōu)于90°相移數(shù)據(jù)體,在研究區(qū)中央斷層以北區(qū)域尤為突出。D5、D4、D3、D2、E1、D1等井實鉆累計砂巖厚度與自然伽馬數(shù)據(jù)體總負振幅屬性均有較好對應(yīng)關(guān)系,而在90°相移數(shù)據(jù)中,上述6口井二者之間對應(yīng)關(guān)系較差。中央斷層以南,在D6、D7、D8、D9井東南側(cè),自然伽馬數(shù)據(jù)體總負振幅屬性可見河道外形。除D8井累計砂巖厚度與自然伽馬數(shù)據(jù)體總負屬性對應(yīng)關(guān)系較差之外,斷層以南其余5口井累計砂巖厚度與自然伽馬數(shù)據(jù)體總負振幅屬性均對應(yīng)較好; 90°相移數(shù)據(jù)體總負振幅屬性與這6口井累積厚度對應(yīng)關(guān)系普遍較差。D8井自然伽馬與砂巖厚度對應(yīng)較差的原因可能是在該井附近由于波峰消失導(dǎo)致了L54層位解釋(追蹤波峰)偏高(圖12a)。
圖13 L54~L56層總負振幅屬性與井點砂巖厚度疊合
研究區(qū)其余共156口井在L54~L56小層鉆遇砂巖厚度與總負振幅屬性值的相關(guān)程度如圖14所示。由圖可知,自然伽馬數(shù)據(jù)體總負振幅屬性與砂巖厚度相關(guān)程度更好,90°相移數(shù)據(jù)體總負振幅屬性對砂巖厚度不敏感。自然伽馬數(shù)據(jù)體總負振幅屬性與砂巖厚度的相關(guān)系數(shù)比90°相移數(shù)據(jù)體的高約38%。考慮到本文訓(xùn)練只采用了10口井的訓(xùn)練樣本,樣本數(shù)量與類型對于預(yù)測全工區(qū)156口大斜度定向井而言仍然能力有限,還存在較大提升空間。
圖14 L54~L56小層156口井砂巖厚度與自然伽馬數(shù)據(jù)體(a)、90°相移數(shù)據(jù)體(b)總負振幅屬性交會圖
基于深度學(xué)習(xí)的多屬性回歸方法結(jié)果分辨率更高,模型泛化能力更強。運用該方法預(yù)測砂巖薄儲層,在提升薄層刻畫能力與保證井間儲層連續(xù)性方面優(yōu)勢較為明顯?;诙鄬痈兄獧C深度學(xué)習(xí)網(wǎng)絡(luò)的薄儲層預(yù)測方法效果較好,儲層敏感屬性與井點砂巖厚度相關(guān)性提升較為明顯。由于文中只采用10口井的訓(xùn)練樣本,在樣本數(shù)量與多樣性方面都還存在進一步升級優(yōu)化的潛力。未來將嘗試采用規(guī)模更大、類型更豐富的鉆井樣本,同時考慮利用疊前深度偏移資料直接在深度域?qū)W習(xí),可進一步提升薄層預(yù)測表征精度。