關(guān)鍵詞:地震屬性,儲(chǔ)層預(yù)測(cè),Stacking集成學(xué)習(xí),分頻,智能融合
0引言
地震屬性能有效反映地下地質(zhì)信息,在油氣勘探、開發(fā)的各個(gè)階段均扮演著重要角色,已廣泛應(yīng)用于構(gòu)造與地層解釋[1-3]、儲(chǔ)層預(yù)測(cè)[4-6]、烴類檢測(cè)[7-8]等方面。目前地震屬性分析技術(shù)主要有兩個(gè)研究方向[9],分別是研發(fā)新的地震屬性[10-11]和發(fā)展地震多屬性融合技術(shù)[6,12-13]。地震屬性種類繁多,能夠在不同角度表征油氣儲(chǔ)層。新研發(fā)的地震屬性易與現(xiàn)有的地震屬性之間存在“明顯”的數(shù)據(jù)冗余問題,由此增加了研發(fā)“高優(yōu)勢(shì)”地震屬性的難度。相反,地震多屬性融合技術(shù)在儲(chǔ)層預(yù)測(cè)領(lǐng)域已取得良好的應(yīng)用效果,其方法眾多,可大致分為線性模型融合、非線性模型融合和顏色模型融合(如RGB顏色模型)等[9,14-15]。近年來,隨著人工智能技術(shù)的迅速發(fā)展,機(jī)器學(xué)習(xí)方法逐步用于地震多屬性融合。此類方法主要是通過學(xué)習(xí)井點(diǎn)儲(chǔ)層的先驗(yàn)信息,建立井、震數(shù)據(jù)之間的非線性映射關(guān)系,再利用支持向量機(jī)(SVR)[16-17]、BP神經(jīng)網(wǎng)絡(luò)[18]、極限學(xué)習(xí)機(jī)[19-20]和隨機(jī)森林[21]等機(jī)器學(xué)習(xí)方法定量預(yù)測(cè)儲(chǔ)層。
常見的地震屬性融合方法主要是基于單類機(jī)器學(xué)習(xí)算法,缺少對(duì)多類算法的集成[16-18,21]。由于地下儲(chǔ)層結(jié)構(gòu)復(fù)雜、非均質(zhì)性強(qiáng)[22-23],不同油氣田甚至同一油氣田的不同位置或不同層段,適合的融合算法也不同,因此亟需探索多算法集成的屬性融合方法,以提升地震屬性融合方法的泛化能力。
為此,本文提出了一種基于Stacking集成學(xué)習(xí)的分頻地震屬性融合方法,旨在提高儲(chǔ)層預(yù)測(cè)精度。首先,將地震資料進(jìn)行分頻處理,分析不同頻段數(shù)據(jù)體的地震屬性特征;其次,采用相關(guān)性分析和無監(jiān)督聚類技術(shù),優(yōu)選地震屬性;然后,設(shè)計(jì)Stacking框架,集成Bagging-SVR(Bg-SVR)、Multi-LayerPerceptron(MLP)、LightGBM(LGB)、Bagging-KNearestNeighbor(Bg-KNN)和核主成因多層感知機(jī)(KPCA-MLP)模型,并利用集成后的模型融合多個(gè)頻段的地震屬性,實(shí)現(xiàn)儲(chǔ)層定量預(yù)測(cè);最后,使用線性公式定量分析等方法評(píng)估Stacking模型的預(yù)測(cè)性能,并通過渤海灣盆地埕島油田河流相儲(chǔ)層的實(shí)例應(yīng)用驗(yàn)證Stacking分頻屬性融合方法的可靠性。
1儲(chǔ)層智能預(yù)測(cè)模型
首先,優(yōu)選在儲(chǔ)層預(yù)測(cè)領(lǐng)域具有良好應(yīng)用效果并存在明顯差異的幾類模型:SVR、KNN(KNearestNeighbor)、LGB和MLP;然后,根據(jù)儲(chǔ)層預(yù)測(cè)需求,分別對(duì)SVR、KNN和MLP模型進(jìn)行改進(jìn),并綜合這幾類模型優(yōu)勢(shì)設(shè)計(jì)出Stacking集成學(xué)習(xí)框架,以得到更準(zhǔn)確、穩(wěn)定的預(yù)測(cè)結(jié)果。
2.1常規(guī)預(yù)測(cè)模型
2.1.1單類模型算法
(1)Bg-SVR和Bg-KNN模型。傳統(tǒng)的SVR和KNN模型在小樣本預(yù)測(cè)方面均具有獨(dú)特的優(yōu)勢(shì)。其中,SVR模型可利用核函數(shù)(通常是徑向基函數(shù))將地震數(shù)據(jù)從低維映射到高維,并在高維空間建立回歸擬合模型,實(shí)現(xiàn)地震屬性到儲(chǔ)層信息的非線性映射;KNN模型能夠基于相鄰井點(diǎn)的數(shù)據(jù)關(guān)系,充分挖掘井震數(shù)據(jù)特征。但在儲(chǔ)層預(yù)測(cè)時(shí),SVR模型的非線性表達(dá)能力容易受少數(shù)幾個(gè)支撐向量的影響,而KNN模型也只是考慮了鄰近幾口井的樣本數(shù)據(jù)。因此,上述兩類模型的泛化能力仍有不足,需要進(jìn)一步改進(jìn)。
大量研究實(shí)例表明集成學(xué)習(xí)模型普遍具備更好的預(yù)測(cè)性能[24],其中Bagging模型便是一種能夠降低模型泛化誤差的集成方式。這種方式通常是基于同類模型的集成,在地震屬性融合時(shí),能夠?qū)崿F(xiàn)地震數(shù)據(jù)樣本、特征的隨機(jī)抽選,可提高模型的泛化性能。
因此,本文利用Bagging算法,以相同的方式分別對(duì)SVR模型和KNN模型進(jìn)行改進(jìn)。以改進(jìn)的KNN模型,即Bg-KNN模型為例(圖1),其預(yù)測(cè)流程可分為4步:①訓(xùn)練時(shí),進(jìn)行N次最大采樣率為η1的樣本自助采樣(Bootstrap),每次形成一個(gè)新訓(xùn)練樣本集,其中N為采樣次數(shù);②按照η2的最大特征抽樣率,為每個(gè)樣本隨機(jī)選取輸入特征;③分別在每個(gè)子訓(xùn)練集上開展模型訓(xùn)練,得到N個(gè)KNN模型;④將N個(gè)模型的預(yù)測(cè)結(jié)果取平均作為最終的輸出結(jié)果。
(2)MLP模型。MLP模型是一種前饋式監(jiān)督學(xué)習(xí)神經(jīng)網(wǎng)絡(luò),包含輸入層、隱層和輸出層。如圖2所示,該MLP模型的輸入層為6分量,輸出層為1分量,具有4個(gè)隱層,每層分別包含10、6、4和3個(gè)神經(jīng)元,并選用ReLU作為激活函數(shù),以增強(qiáng)模型的非線性表達(dá)能力。MLP算法主要分為兩個(gè)步驟,分別是正向傳播和反向傳播。正向傳播公式為
誤差δhv由下層誤差δh+1v反向計(jì)算得到。通過反向傳播,不斷調(diào)整系數(shù),使輸出結(jié)果不斷逼近真實(shí)數(shù)據(jù)。模型訓(xùn)練時(shí),采用Adam(AdaptiveMomentEstimation)作為優(yōu)化器,其參數(shù)更新不受梯度伸縮變換的影響,適用于復(fù)雜的儲(chǔ)層預(yù)測(cè)場(chǎng)景。
(3)LGB模型。LGB模型是基于梯度提升決策樹的集成算法,能夠通過梯度下降算法更新殘差,隨著迭代次數(shù)增加,可擬合復(fù)雜的鉆井、地震數(shù)據(jù)。此外,LGB模型還在原有梯度提升樹算法上進(jìn)行了改進(jìn),采用互斥特征捆綁稀疏化地震屬性特征以增強(qiáng)模型的數(shù)據(jù)處理性能。
2.1.2KPCA?MLP組合模型算法原理
當(dāng)數(shù)據(jù)維度較高、非線性關(guān)系復(fù)雜時(shí),模型容易為了追求擬合效果而出現(xiàn)過擬合現(xiàn)象。為此,設(shè)計(jì)了一個(gè)兼?zhèn)涓咝?shù)據(jù)降維和強(qiáng)非線性擬合能力的KPCA-MLP模型(圖3)。
KPCA模型可利用核函數(shù)將地震屬性樣本向高維特征空間映射,并在高維空間實(shí)現(xiàn)數(shù)據(jù)降維,其核函數(shù)可表示為
式中:k(xi,xj)為核函數(shù)矩陣,其中xi、xj分別表示第i、第j個(gè)多維地震屬性樣本;σ為核函數(shù)的寬度。
KPCA-MLP模型便是在MLP模型的輸入端加入了KPCA模型(圖3),利用KPCA模型對(duì)輸入數(shù)據(jù)進(jìn)行非線性降維與特征提取,然后基于MLP模型分析KPCA模型提取的主成分,從而有效挖掘復(fù)雜數(shù)據(jù)特征信息。因此,本文將使用KPCA-MLP模型算法進(jìn)一步處理Bg-SVR、MLP、LGB和Bg-KNN模型的預(yù)測(cè)結(jié)果。
2.2Stacking集成學(xué)習(xí)模型結(jié)構(gòu)
盡管上述幾類模型在儲(chǔ)層預(yù)測(cè)中具有良好的應(yīng)用性能,但這些模型多屬于單類預(yù)測(cè)模型,并且設(shè)計(jì)的組合模型(圖3)也未能基于高效架構(gòu)實(shí)現(xiàn)多模型融合。因此,各模型的預(yù)測(cè)精度容易呈現(xiàn)邊際效用遞減的趨勢(shì)[25]。為了提高儲(chǔ)層預(yù)測(cè)準(zhǔn)確率,本文將采用Stacking集成學(xué)習(xí)方式,實(shí)現(xiàn)多模型優(yōu)勢(shì)互補(bǔ)、深度協(xié)同。
該Stacking集成學(xué)習(xí)模型主要包含兩層結(jié)構(gòu)(圖4)。第一層結(jié)構(gòu)由多個(gè)基學(xué)習(xí)器模型組成,為了使各模型間能夠“取長(zhǎng)補(bǔ)短”,需選取泛化效果良好且存在明顯差異的幾類模型,因而將Bg-SVR、MLP、LGB和Bg-KNN作為基學(xué)習(xí)器模型。第二層結(jié)構(gòu)由元學(xué)習(xí)器模型組成,其數(shù)據(jù)集來自上層的預(yù)測(cè)結(jié)果。若直接將基學(xué)習(xí)器模型的訓(xùn)練集預(yù)測(cè)結(jié)果作為元學(xué)習(xí)器的輸入,可能會(huì)造成過擬合。因此,在第一層的基學(xué)習(xí)器模型訓(xùn)練前,利用5折交叉驗(yàn)證將數(shù)據(jù)劃分為不重疊的5等份。當(dāng)每個(gè)基學(xué)習(xí)器訓(xùn)練時(shí),選取不重復(fù)的4等份作為訓(xùn)練集,余下的1等份作為驗(yàn)證集。訓(xùn)練完畢后,將5份基于驗(yàn)證集的預(yù)測(cè)結(jié)果重新組合,以得到與原數(shù)據(jù)集相同樣本量的新數(shù)據(jù)集。新數(shù)據(jù)集來源于上層模型對(duì)驗(yàn)證集的預(yù)測(cè)結(jié)果,因此具有較強(qiáng)的客觀性。
然而,各基學(xué)習(xí)器模型的自身性能不同,當(dāng)部分模型預(yù)測(cè)誤差較大時(shí),會(huì)增加元學(xué)習(xí)器輸入數(shù)據(jù)的噪聲,直接影響模型的預(yù)測(cè)精度。鮑海波等[26]提出了為預(yù)測(cè)結(jié)果賦予權(quán)重的方法以抑制各模型中預(yù)測(cè)效果較差的部分,能夠提高集成模型的預(yù)測(cè)性能。但這種方式是一種主觀的線性加權(quán),并且賦予的權(quán)重值也難以充分表征各模型的預(yù)測(cè)性能。為了降低噪聲數(shù)據(jù)的影響、充分挖掘基學(xué)習(xí)器模型預(yù)測(cè)結(jié)果的關(guān)鍵信息和擬合復(fù)雜的非線性數(shù)據(jù),本文將選用KPCAMLP模型作為元學(xué)習(xí)器模型。
Stacking模型的實(shí)現(xiàn)流程(圖4)如下。
(1)利用RobustScaler對(duì)輸入的地震屬性進(jìn)行數(shù)據(jù)預(yù)處理,即
式中:x和x′分別對(duì)應(yīng)數(shù)據(jù)預(yù)處理前、后的多維地震屬性樣本;median為多維地震屬性數(shù)據(jù)的中位數(shù),IQR為多維地震屬性數(shù)據(jù)的四分位距。
(2)使用5折交叉驗(yàn)證隨機(jī)劃分?jǐn)?shù)據(jù)集,并利用Bg-SVR、MLP、LGB和Bg-KNN模型分別訓(xùn)練數(shù)據(jù),訓(xùn)練過程中基于隨機(jī)搜索[27]為每個(gè)基學(xué)習(xí)器模型優(yōu)選超參數(shù)。
(3)將交叉驗(yàn)證的驗(yàn)證集在基學(xué)習(xí)器上的預(yù)測(cè)結(jié)果組合為新訓(xùn)練數(shù)據(jù)集。
(4)利用KPCA-MLP模型處理新訓(xùn)練數(shù)據(jù)集,生成訓(xùn)練集的最終預(yù)測(cè)結(jié)果。
(5)將測(cè)試集經(jīng)過訓(xùn)練好的基學(xué)習(xí)器處理、數(shù)據(jù)平均和訓(xùn)練好的KPCA-MLP模型處理等步驟,得到測(cè)試集的預(yù)測(cè)結(jié)果。
(6)根據(jù)訓(xùn)練集和測(cè)試集的預(yù)測(cè)結(jié)果,評(píng)估模型合理性,若合格,便輸出模型;反之,則返回步驟(2)。
3分頻地震屬性融合方法
以埕島油田中區(qū)為研究區(qū),基于Stacking集成學(xué)習(xí)模型,開展分頻地震屬性智能融合儲(chǔ)層預(yù)測(cè)方法。
研究區(qū)面積約30km2,主力含油層館陶組上段為河流相沉積,砂體較薄,儲(chǔ)層非均質(zhì)性強(qiáng),平均埋深約為1500m。地震資料主頻為33Hz,頻寬為17~49Hz。
具體應(yīng)用過程中,本文方法主要包含3個(gè)模塊:地震頻段優(yōu)選、地震屬性優(yōu)選和多屬性智能融合儲(chǔ)層預(yù)測(cè)(圖5)。
3.1地震頻段優(yōu)選
不同頻段地震數(shù)據(jù)體蘊(yùn)含不同的地質(zhì)信息,深度挖掘不同頻段地震數(shù)據(jù)與儲(chǔ)層之間的關(guān)系,有利于提高儲(chǔ)層預(yù)測(cè)精度。
根據(jù)不同厚度儲(chǔ)層的振幅與頻率關(guān)系[4,9,14]可知:當(dāng)砂體厚度小于1/4波長(zhǎng)時(shí),振幅與砂體厚度具有明顯的正相關(guān)趨勢(shì);高頻地震信息的分辨率較高,能夠更好地反映薄砂體分布特征;低頻數(shù)據(jù)體的分辨率較低,能夠更好地反映厚砂體分布特征。采用小波分頻技術(shù),可將原始地震資料分為不同頻段的地震數(shù)據(jù)體(圖5,A部分),但在分頻的過程中需要注意兩個(gè)原則:①分頻數(shù)據(jù)體的總頻寬需控制在原始地震資料的有效帶寬內(nèi),以保留有效信息;②分頻數(shù)據(jù)體數(shù)量不宜太多,防止地震數(shù)據(jù)冗雜[9]。綜合考慮不同頻段的地震信息,可降低地震資料的多解性。
由于館陶組上段砂體厚度差異大,原始地震資料難以識(shí)別薄層砂體,所以在分頻時(shí)需在有效頻寬內(nèi)盡可能保留高頻數(shù)據(jù)體。對(duì)原始地震數(shù)據(jù)體(圖6a)進(jìn)行分頻,高頻地震數(shù)據(jù)的主頻為40Hz(圖6b),對(duì)應(yīng)的頻寬為30~50Hz,可反映原始數(shù)據(jù)中的高頻信息。為了避免分頻數(shù)據(jù)體過多和有效信息缺失,優(yōu)選出主頻為20Hz、頻寬為13~30Hz的低頻數(shù)據(jù)體(圖6c),可反映原始數(shù)據(jù)中的低頻信息。優(yōu)選的兩個(gè)分頻數(shù)據(jù)體總頻寬可覆蓋原始地震數(shù)據(jù),既保留了原始數(shù)據(jù)的有效信息,又減少了重復(fù)信息。
3.2地震屬性優(yōu)選
不同地震屬性能夠從不同角度表征儲(chǔ)層特征,其中振幅類屬性可以有效指示巖性、刻畫砂體厚度;相位類屬性有助于識(shí)別儲(chǔ)層邊界、斷層等;頻率類屬性更適合反映儲(chǔ)層在垂向上的巖性變化[6,9,28]。由于部分地震屬性間共線性較強(qiáng)(較強(qiáng)的相關(guān)性),因而在地震多屬性融合前需要優(yōu)選屬性(圖5,B部分)。
選取測(cè)井資料齊全的317口井,從井旁道目的層段提取不同類別的12種地震屬性,分析各屬性與砂體厚度相關(guān)性,共得到6種與砂體厚度相關(guān)系數(shù)大于0.15的地震屬性(圖7a);然后利用無監(jiān)督聚類技術(shù)將6種地震屬性進(jìn)一步劃分為3類(圖7b),結(jié)合各類地震屬性與砂體厚度的相關(guān)系數(shù)(圖7a),最終優(yōu)選出的敏感屬性分別為平均谷值振幅、最大振幅和平均瞬時(shí)頻率。
從分頻地震數(shù)據(jù)體中分別提取上述三種屬性。以最大振幅為例,可以看出,原始數(shù)據(jù)體最大振幅高值區(qū)能體現(xiàn)主河道砂體的分布,但反映的砂體連續(xù)性差,并且河道邊界不清晰(圖8a)。由于目的層段砂體較薄,低頻數(shù)據(jù)體的最大振幅只能體現(xiàn)主河道上局部厚砂體的分布(圖8b)。高頻數(shù)據(jù)體的最大振幅高值區(qū)明顯增多,主河道邊界更加清晰(圖8c),砂體連續(xù)性也更好(圖8c紅色箭頭所指)。
3.3多屬性智能融合儲(chǔ)層預(yù)測(cè)
計(jì)算半徑為25m范圍的井旁道地震屬性值,將測(cè)井資料解釋的砂體厚度與井旁道地震屬性作為智能屬性融合的數(shù)據(jù)樣本,按照8:2的比例分別劃分為訓(xùn)練集和測(cè)試集;再利用Stacking集成學(xué)習(xí)模型(圖5,C部分)融合低頻、高頻地震屬性(平均谷值振幅、最大振幅和平均瞬時(shí)頻率),建立砂體厚度與分頻地震屬性數(shù)據(jù)的映射關(guān)系;最后,將訓(xùn)練好的Stacking模型應(yīng)用于館陶組上段儲(chǔ)層的定量預(yù)測(cè)。
4方法評(píng)估
4.1井點(diǎn)儲(chǔ)層預(yù)測(cè)結(jié)果
井點(diǎn)處的儲(chǔ)層預(yù)測(cè)結(jié)果能夠用于定量化評(píng)估模型預(yù)測(cè)精度和可靠性。為證實(shí)Stacking集成學(xué)習(xí)模型具備較強(qiáng)的預(yù)測(cè)性能,將Bg-SVR、MLP、LGB和Bg-KNN等4個(gè)基學(xué)習(xí)器模型作為參照組進(jìn)行對(duì)比。訓(xùn)練過程中各模型的超參數(shù)設(shè)置見表1。
評(píng)估指標(biāo)除了皮爾遜相關(guān)系數(shù)(R)、平均絕對(duì)誤差(MeanAbsoluteError,MAE)和均方根誤差(RootMeanSquaredError,RMSE)外,本文還引入了決定系數(shù)(R2_score)和校正決定系數(shù)(R2_adjusted)。其中R2_score用來表示回歸分析中自變量對(duì)因變量的解釋程度,取值為0~1,越接近1表示解釋效果越好;R2_adjusted是在R2_score基礎(chǔ)上,將特征數(shù)量納入了分析。部分指標(biāo)的公式分別為
式中:yi、y?i分別為第i個(gè)樣本的測(cè)井資料解釋的砂體厚度(實(shí)際值)和預(yù)測(cè)值;yˉ表示測(cè)井資料解釋砂體厚度的均值;m為樣本數(shù)量;p為地震屬性特征數(shù)量。
由圖9可見,Bg-SVR、MLP、LGB和Bg-KNN模型屬性融合預(yù)測(cè)結(jié)果與實(shí)際砂體厚度的MAE分別為1.81、1.72、1.98和1.47m,而Stacking模型屬性融合結(jié)果與實(shí)際砂體厚度的MAE僅為1.30m。盡管地震屬性能夠反映儲(chǔ)層厚度,但是兩者間的映射關(guān)系較為復(fù)雜,因而導(dǎo)致單類模型的預(yù)測(cè)精度不夠,其中LGB模型的屬性融合結(jié)果與實(shí)際砂體厚度的RMSE達(dá)到了2.48m,遠(yuǎn)高于Stacking模型的1.69m(圖9)。由此可看出Stacking集成學(xué)習(xí)模型的屬性融合結(jié)果平均誤差較小,預(yù)測(cè)性能比其他單類模型更穩(wěn)健。
以測(cè)試集為例,Stacking集成模型的屬性融合結(jié)果與實(shí)際砂體厚度的R為0.916、R2_score為0.814、R2_adjusted為0.794(圖10),較Bg-SVR、MLP、LGB和Bg-KNN模型的提升率范圍分別為:3.6%~15.4%、9.6%~35.4%和10.9%~42.0%(表2),這表明了Stacking模型具有更高的儲(chǔ)層預(yù)測(cè)精度。
地震多屬性融合儲(chǔ)層預(yù)測(cè)時(shí)需要將模型建立的井震數(shù)據(jù)映射關(guān)系應(yīng)用于全研究區(qū),因而基于多屬性融合的儲(chǔ)層預(yù)測(cè)準(zhǔn)確度受映射關(guān)系影響。通常來說,模型在訓(xùn)練集上學(xué)習(xí)數(shù)據(jù)特征,然后利用測(cè)試集檢驗(yàn)?zāi)P偷暮侠硇?。本文的?xùn)練集和測(cè)試集都是按照特定比例隨機(jī)、均勻劃分,因而當(dāng)模型在訓(xùn)練集和測(cè)試集的預(yù)測(cè)結(jié)果與真實(shí)砂體厚度之間展現(xiàn)相似的數(shù)據(jù)分布規(guī)律時(shí),便可證明該模型建立的井震映射關(guān)系具有可靠性。為了有效評(píng)估模型的可靠性,本文利用線性關(guān)系式定量表征這種映射關(guān)系,即式中:a為權(quán)重;b為偏置。如表3所示,相較于單類預(yù)測(cè)模型,Stacking集成學(xué)習(xí)模型對(duì)應(yīng)的線性擬合公式差距最小,其訓(xùn)練集和測(cè)試集的線性擬合公式的權(quán)重相差小于0.003,偏置相差小于0.03,反映了Stacking模型在訓(xùn)練集上建立的井、震映射關(guān)系,完全適用于測(cè)試集的數(shù)據(jù)預(yù)測(cè),相應(yīng)的預(yù)測(cè)結(jié)果與實(shí)際數(shù)據(jù)的分布規(guī)律具有較高的一致性。這是因?yàn)閱晤惸P偷臄?shù)據(jù)分析角度單一,難以深挖井、震數(shù)據(jù)關(guān)系,在模型優(yōu)化時(shí)容易陷入局部極值點(diǎn),而Stacking模型可以綜合多類模型的算法對(duì)井、震數(shù)據(jù)全局尋優(yōu),在相同數(shù)據(jù)集上具有更低的泛化誤差。由此可證明,本文Stacking模型能精確表征地震屬性與儲(chǔ)層信息的非線性關(guān)系,對(duì)應(yīng)的儲(chǔ)層定量預(yù)測(cè)結(jié)果可靠性較強(qiáng)。
4.2屬性融合結(jié)果綜合分析
原始數(shù)據(jù)體最大振幅屬性與砂體厚度相關(guān)性較低(圖11a),雖然能夠初步反映主河道的展布趨勢(shì),但是河道邊界模糊,并且屬性高值區(qū)連續(xù)性較差(圖12a)。
Bg-SVR模型的屬性融合圖上可見河道形態(tài)(圖12b),主河道的邊界較為清晰,但在CD5井處顯示為屬性低值,指示河道斷開,與單井砂體解釋結(jié)論不符(圖12g)。同時(shí),該屬性圖中的E區(qū)域的屬性呈現(xiàn)零散分布,無明顯的分支河道形態(tài)(圖12b)。MLP和LGB模型的屬性融合結(jié)果展現(xiàn)出主河道砂體連續(xù)性較好(圖12c,圖12d),能夠準(zhǔn)確表現(xiàn)E區(qū)域的分支河道展布特征,但是與Bg-SVR模型的屬性融合結(jié)果(圖12b)相比,MLP和LGB的屬性融合結(jié)果中主河道外的屬性分布更為雜亂。根據(jù)測(cè)井解釋結(jié)果,在CD2井附近發(fā)育厚砂體(圖12g),在F區(qū)域內(nèi),MLP模型的屬性融合結(jié)果展現(xiàn)了“大面積”的低值分布(圖12c),并且圖12b和圖12d的對(duì)應(yīng)位置也體現(xiàn)了不同程度的屬性低值特征,反映的砂體連續(xù)性較差。Bg-KNN算法能基于相鄰井的空間位置關(guān)系,挖掘井旁道地震屬性和儲(chǔ)層信息特征。如圖12e所示,Bg-KNN模型的屬性融合圖中主河道分布更加明確,主河道外的屬性雜亂度明顯降低,同時(shí)F區(qū)域的砂體連續(xù)性變好。由于分支河道對(duì)應(yīng)的屬性為窄條帶狀,其鄰近區(qū)域尤其是邊界位置的屬性差異較大,因而基于Bg-KNN的屬性融合方法難以通過分析鄰近空間數(shù)據(jù)精確預(yù)測(cè)分支河道砂體(圖12e紫色箭頭所指區(qū)域)。
與單類預(yù)測(cè)模型的屬性融合結(jié)果相比,Stacking集成模型的屬性融合結(jié)果在E、F區(qū)域的砂體連續(xù)性更好,屬性圖的高值區(qū)形態(tài)清晰,分支河道砂體展布特征也更加明確。同時(shí),該模型的屬性融合結(jié)果的單井吻合率更高,與實(shí)際砂體厚度相關(guān)性也可達(dá)到0.92(圖11b)。一方面是因?yàn)閮?yōu)選的單類模型自身預(yù)測(cè)性能較強(qiáng),另一方面是由于各模型在屬性分析時(shí)存在相應(yīng)的“預(yù)測(cè)短板”,而Stacking模型能高效融合多個(gè)單類模型并實(shí)現(xiàn)“優(yōu)勢(shì)互補(bǔ)”,由此提升了集成模型的預(yù)測(cè)精度。
根據(jù)Stacking集成模型的屬性融合結(jié)果(圖12f),結(jié)合單井沉積微相解釋結(jié)果(圖12g),可刻畫出目的層沉積微相平面展布特征(圖12h)。由圖可見,主河道呈寬條帶狀分布,分支河道為窄條帶狀分布,在主河道北西方向發(fā)育1條分支河道,南東方向發(fā)育有2條分支河道,分支河道延伸較遠(yuǎn)且有一定擺動(dòng)幅度。主河道擺動(dòng)不頻繁,兩側(cè)均發(fā)育有天然堤,河漫灘砂呈孤立狀分布在泛濫平原內(nèi)部,展現(xiàn)了典型的河流相沉積特征。
5結(jié)論
(1)基于Stacking集成學(xué)習(xí)的分頻地震屬性融合方法,能夠綜合考慮不同頻段的“優(yōu)勢(shì)”地震屬性信息,并可以對(duì)多個(gè)差異化模型“取長(zhǎng)補(bǔ)短”,有利于提高儲(chǔ)層預(yù)測(cè)精度。
(2)本文提出的線性公式定量分析法,可以有效評(píng)估模型的預(yù)測(cè)性能。在埕島油田的實(shí)例應(yīng)用中,相對(duì)于單類預(yù)測(cè)模型,Stacking集成學(xué)習(xí)模型的預(yù)測(cè)性能和可靠性均有顯著提升,其屬性融合結(jié)果高值區(qū)形態(tài)清晰,砂體連續(xù)性更好。
(3)本文基于Stacking分頻屬性融合儲(chǔ)層預(yù)測(cè)方法具有良好的應(yīng)用前景,可為類似研究區(qū)的儲(chǔ)層預(yù)測(cè)提供借鑒。