陸智卿, 李忠偉
(中國石油大學(xué)(華東) 計(jì)算機(jī)與通信工程學(xué)院,青島 266580)
沉積相是油氣儲(chǔ)層研究的基礎(chǔ),對(duì)預(yù)測(cè)砂體分布及儲(chǔ)層物性差異具有指導(dǎo)意義。單井相分析是沉積相研究的關(guān)鍵環(huán)節(jié)之一,而利用巖心標(biāo)定的典型測(cè)井相識(shí)別沉積微相是單井相分析的最常用方法。但是依靠人工識(shí)別測(cè)井相并解釋沉積微相,存在兩個(gè)問題:①工作量大;②對(duì)研究人員的經(jīng)驗(yàn)要求高,結(jié)果的主觀性強(qiáng)。
筆者以辮狀河三角洲為例,將本體和語義識(shí)別的方法應(yīng)用于測(cè)井相識(shí)別及沉積微相解釋,探討基于本體信息量的單井辮狀河三角洲沉積微相語義識(shí)別方法,建立沉積微相的自動(dòng)解釋方法,在東海凹陷X氣田的辮狀河三角洲沉積中實(shí)驗(yàn)驗(yàn)證應(yīng)用,取得了良好效果,從而驗(yàn)證方法的有效性。
隨著沉積學(xué)和巖相古地理學(xué)的發(fā)展,沉積相研究也不斷完善,形成了一套成熟的沉積相劃分體系。該體系按照“相-亞相-微相”劃分三個(gè)不同的級(jí)次。辮狀河三角洲可細(xì)分為三個(gè)亞相:①辮狀河三角洲平原;②辮狀河三角洲前緣;③前辮狀河三角洲亞相[1-2]。辮狀河三角洲的沉積物較粗,砂和含礫砂為主,砂/泥比高,通常大于1。辮狀河三角洲平原主要發(fā)育辮狀河道和泛濫平原。辮狀河道主要發(fā)育砂巖,也常見礫巖或含礫砂巖。辮狀河道內(nèi)部往往發(fā)育多個(gè)砂壩及其復(fù)合體。辮狀河三角洲前緣與正常三角洲一樣,水下分流河道活躍,其沉積物在前緣亞相中往往占總量的90%以上。前三角洲沉積物一般粒度較細(xì),以泥質(zhì)沉積物為主。
巖性和測(cè)井曲線是地下儲(chǔ)層沉積相研究中最常用的資料[3]。其中巖性信息主要來自于巖心和巖屑錄井等,包含了反映沉積環(huán)境及其產(chǎn)物的最直接信息,包括顏色、粒度、結(jié)構(gòu)等信息[4-5]。在利用測(cè)井信息進(jìn)行沉積相研究中,測(cè)井相發(fā)揮著重要的作用,在常用自然伽馬、電阻率、自然電位等測(cè)井曲線上,不同的沉積體及其組合被模式化為幾種典型的形態(tài)類型,也就是所謂的“測(cè)井相”,這些典型的曲線形態(tài)類型包括箱形、鐘形、漏斗形、齒形、指形、復(fù)合形以及直線形等[6]。在區(qū)域沉積相背景和巖心分析的基礎(chǔ)上,利用常見的巖石粒度和自然伽馬、電阻率及自然電位等測(cè)井曲線形態(tài)可以確定沉積相類型[7]。在辮狀河三角洲中,三角洲前緣亞相的水下分流河道沉積微相,巖性往往以砂巖為主,而且電阻率、自然伽馬和自然電位的曲線形態(tài)以箱形與鐘形的復(fù)合形態(tài)為主,在沉積環(huán)境背景確定的基礎(chǔ)上,通過巖性和測(cè)井相可以直接識(shí)別沉積微相類型。
在實(shí)際單井沉積相劃分工作中,前面所述的巖性信息以及三種常用曲線常存在資料不齊全或者某一項(xiàng)特征不典型的情況,尤其是在沉積相自動(dòng)識(shí)別中,制約了沉積相識(shí)別結(jié)果的可靠性。另外,在實(shí)際測(cè)井工作中,每種測(cè)井方法的成本代價(jià)都不低,不可能對(duì)每口井測(cè)量使用每一種測(cè)井技術(shù)。通過缺項(xiàng)實(shí)驗(yàn)(實(shí)際作用是降維),可以實(shí)現(xiàn)減少對(duì)單井的一種測(cè)井方法的測(cè)量,從而節(jié)約實(shí)際工程中的成本。所以,筆者提出一種基于本體信息量的單井辮狀河三角洲沉積微相語義推理方法。首先,根據(jù)辮狀河三角洲相劃分體系以及上述特征,建立辮狀河三角洲相本體。在此基礎(chǔ)上,將每種沉積微相的上述四項(xiàng)特征依次計(jì)算概率、信息量,得到每種微相的四維信息量矢量。最后,在缺項(xiàng)實(shí)驗(yàn)中,通過設(shè)計(jì)的語義距離公式,得到沉積相語義推理結(jié)果。該方法提供了一種單井沉積相自動(dòng)識(shí)別的有效途徑。
本體是一種能在語義和知識(shí)層次上描述信息系統(tǒng)的概念模型建模工具[8]。OWL2 Web本體語言于2009年10月成為一項(xiàng)W3C(World Wide Web Consortium)的推薦標(biāo)準(zhǔn)。通過本體的無歧義性(用特定的形式化語言對(duì)本體模型進(jìn)行描述),使機(jī)器和用戶都能達(dá)到統(tǒng)一的理解[9]。
領(lǐng)域本體是用于描述指定領(lǐng)域知識(shí)的一種專門本體[10]。它明確了領(lǐng)域內(nèi)共同認(rèn)可的概念術(shù)語,利用領(lǐng)域知識(shí)的語義模型表達(dá)了概念含義,并在內(nèi)部層次當(dāng)中規(guī)定了這些概念之間的關(guān)系,為知識(shí)獲取以及表示奠定了基礎(chǔ)。領(lǐng)域本體是一個(gè)五元組,記作O={C,A,R,I,M}[11]。其中,C是概念集,指特定領(lǐng)域中屬于概念的集合;A是屬性集,主要用來表現(xiàn)概念自身的特征;R是關(guān)系,指領(lǐng)域中概念間的相互作用;I為實(shí)例集;M是實(shí)例與概念之間的映射關(guān)系集合。
辮狀河三角洲相本體是包含辮狀河三角洲相在識(shí)別分類的總結(jié)與知識(shí)的經(jīng)驗(yàn)性模型。在沉積相本體中,C即是各種沉積微相,A為包括巖性和測(cè)井響應(yīng)特征的在內(nèi)各種屬性,R即為各種沉積相之間的關(guān)系集合,I為實(shí)際油氣田中的劃分的地層或沉積相,M為I集合中各類劃分的地層的巖性和測(cè)井響應(yīng)參數(shù)。
根據(jù)斯坦福大學(xué)開發(fā)的七步法[12],利用Protégé工具,結(jié)合沉積相領(lǐng)域知識(shí)和知識(shí)體系的特點(diǎn),構(gòu)建辮狀河三角洲相本體。實(shí)現(xiàn)過程如下:
1)確定辮狀河三角洲相本體的知識(shí)范疇,劃分出一個(gè)能夠清楚表達(dá)和解釋沉積相內(nèi)各類現(xiàn)象與專業(yè)術(shù)語的知識(shí)范圍。
2)根據(jù)相關(guān)搜索與考查,沒有可以復(fù)用的現(xiàn)有的辮狀河三角洲相本體。
3)列出沉積相中的重要術(shù)語,主要包括:相、相標(biāo)志、沉積類型、沉積巖類型以及各類測(cè)井方法和特征。
4)定義各類相和相之間的等級(jí)體系,采用目前公認(rèn)度最高的“相-亞相-微相”三級(jí)體系。首先,以辮狀河三角洲相為相級(jí)別的沉積相類型。其次,根據(jù)地形相對(duì)位置,劃分前三角洲亞相、三角洲平原亞相和三角洲前緣亞相,建立亞相級(jí)別的沉積相類型。最后,建立對(duì)應(yīng)亞相下所有可能存在的微相級(jí)別的沉積相類型。如圖1所示,本體中辮狀河三角洲前緣亞相下的席狀砂微相、水下分流河道、水下分流間灣、遠(yuǎn)砂壩和河口壩。其中,箭頭代表分屬關(guān)系。
5)定義沉積相的屬性,包括巖性特征,測(cè)井響應(yīng)特征(自然伽馬、電阻率、自然電位)等。
圖1 辮狀河三角洲相及其亞相微相
6)定義屬性之間的關(guān)系和分面,各個(gè)特征之間的相互獨(dú)立,且規(guī)定屬性特征取值范圍。
7)加入實(shí)例,將實(shí)際油田中已知?jiǎng)澐趾玫某练e相實(shí)例加入到辮狀河三角洲相本體。
語義識(shí)別是以事物的描述邏輯為基礎(chǔ),根據(jù)事物相關(guān)屬性特征以及之間的關(guān)聯(lián)規(guī)則,得到事物的判斷結(jié)果即分類結(jié)果的一個(gè)過程。其中,語義相似度和語義距離是主要的衡量標(biāo)準(zhǔn)。語義相似度表示相同真實(shí)對(duì)象或想法的兩個(gè)文本表達(dá)式之間的相似度[13]。語義相似度和語義距離之間成反比關(guān)系:兩個(gè)概念的語義距離越大,其相似度越低;反之,兩個(gè)概念的語義距離越小,其相似度越大。
目前,基于本體的語義相似度計(jì)算方法主要?jiǎng)澐譃?類:①基于結(jié)構(gòu)距離的計(jì)算方法;②基于內(nèi)容的計(jì)算方法;③基于屬性的計(jì)算方法[14-16]。其中,基于結(jié)構(gòu)距離的計(jì)算方法的基本思想是通過兩個(gè)概念在本體樹狀分類體系中的路徑長(zhǎng)度量化它們之間的語義距離,從而得到相似度。基于內(nèi)容的計(jì)算方法的基本思想是如果兩個(gè)概念詞共享的信息越多,兩者之間的語義相似度也越大;反之,共享的信息越少,相似度也越小?;趯傩缘挠?jì)算方法的基本思想是事物之間的關(guān)聯(lián)程度與其所具有的公共屬性數(shù)相關(guān)。事物由其屬性特征反映其本身,人們用以辨識(shí)或區(qū)分該事物的標(biāo)志就是屬性特征。對(duì)于兩個(gè)被比較概念而言,公共屬性項(xiàng)越多,相似度越大[17]。
筆者提出的基于本體信息量的語義識(shí)別方法是上述方法的結(jié)合,其基本思想是根據(jù)每個(gè)結(jié)點(diǎn)上對(duì)應(yīng)相同屬性特征里的內(nèi)容,統(tǒng)計(jì)概率,進(jìn)而,引入信息量公式[18,19],計(jì)算其信息量,用信息量代表其屬性,通過語義距離公式得到語義相似度。同樣,語義距離越小,代表相似度越大。相似度最大的沉積相類型即為語義識(shí)別的分類結(jié)果[20-21]。
這里提出的語義識(shí)別方法分為四個(gè)個(gè)步驟:
1)根據(jù)之前對(duì)沉積特征的描述,巖石粒度可劃分為礫、砂、粉砂和泥四個(gè)級(jí)別,自然伽馬、電阻率和自然電位曲線形態(tài)有箱形、鐘形和漏斗形等共七種形狀。建立的辮狀河三角洲相本體中包含每種沉積相所對(duì)應(yīng)的巖性特征和測(cè)井響應(yīng)特征。因此,結(jié)合沉積相本體,統(tǒng)計(jì)實(shí)際油田數(shù)據(jù)中每種形狀和粒度級(jí)別在每個(gè)屬性特征中出現(xiàn)的頻率,得到相應(yīng)的出現(xiàn)概率Pi(i=1,2,3,4),其中,i代表用到的四種特征。
2)由信息量公式可知,事件發(fā)生的概率可以轉(zhuǎn)換為該事件含有的信息量,并且一個(gè)事件發(fā)生的概率越小,代表其信息量越大。因此,將所得到的概率Pi代入信息量公式,得到每種形狀和粒度級(jí)別所對(duì)應(yīng)的信息量Ii(i=1,2,3,4),公式中a為底數(shù),通常取為自然數(shù)e。
Ii=-loga(Pi)i=1,2,3,4
(1)
3)用得到的信息量Ii代替沉積特征,結(jié)合辮狀河三角洲相本體,進(jìn)而,每種沉積相得到一個(gè)以信息量為坐標(biāo)的四維向量So={I1,I2,I3,I4}。在計(jì)算兩個(gè)沉積相向量之間的語義相似度時(shí),比如Sp={Ip1,Ip2,Ip3,Ip4}和Sp={Iq1,Iq2,Iq3,Iq4},將其帶入語義距離計(jì)算公式(2),從而,得到兩者之間的語義距離Lw。公式中k為語義參數(shù),通常k取為0.5。該公式在語義識(shí)別測(cè)試數(shù)據(jù)時(shí),取Sp為未知的測(cè)試數(shù)據(jù)相,依次將該未知相的四維向量Sp與已知沉積微相類型相的四維向量Sp帶入語義距離公式(2)。
(2)
逐次計(jì)算,依次得到該未知相與每種沉積微相之間的語義距離Lw,其中語義距離最小者,即語義相似度最大者,即為最終的語義識(shí)別的沉積相類型。
為了驗(yàn)證方法和本體模型的有效性,取東海凹陷X氣田的砂質(zhì)辮狀河三角洲的相關(guān)巖性和測(cè)井?dāng)?shù)據(jù),對(duì)提出的沉積微相語義識(shí)別方法,進(jìn)行缺項(xiàng)實(shí)驗(yàn)驗(yàn)證和交叉缺項(xiàng)實(shí)驗(yàn)驗(yàn)證。
實(shí)驗(yàn)所用的數(shù)據(jù)是該氣田花崗組地層中約700 m長(zhǎng)度,共4口井的巖性和測(cè)井相關(guān)數(shù)據(jù)。經(jīng)過專家和工作人員的勘探分析,對(duì)這些數(shù)據(jù)進(jìn)行了沉積相類型劃分。其中,主要以辮狀河三角洲前緣亞相下的各種水下沉積微相為主,詳細(xì)統(tǒng)計(jì)見表1。其中,數(shù)字代表該種微相在每口井中出現(xiàn)的次數(shù),總共101條數(shù)據(jù)。
根據(jù)語義識(shí)別方法的前兩步,統(tǒng)計(jì)頻率,得到概率Pi(i=1,2,3,4),計(jì)算信息量Ii(i=1,2,3,4),可以得到四種特征出現(xiàn)頻率、概率和信息量表,見表2。在此基礎(chǔ)上,結(jié)合建立的辮狀河三角洲相本體,進(jìn)行第三步,得到辮狀河三角洲前緣亞相下的所有存在的沉積微相的四維信息量向量,見表3。在此基礎(chǔ)上,進(jìn)行缺項(xiàng)實(shí)驗(yàn)驗(yàn)證。缺項(xiàng)實(shí)驗(yàn)是指隨機(jī)在上述101條數(shù)據(jù)中抽取一條,作為測(cè)試相So。隨機(jī)將So的一個(gè)沉積特征設(shè)為未知,比如,將自然伽馬曲線形態(tài)設(shè)為未知,即得到一條測(cè)試數(shù)據(jù)So={I1,未知,I3,I4}。將So與表3中的各種沉積微相類型Si(i=a,b,c,d,e)依次通過語義距離公式,計(jì)算語義距離Lw,取語義距離最小者,即作為語義識(shí)別的沉積相類型結(jié)果。
TOP-1代表著方法計(jì)算出分?jǐn)?shù)最高的對(duì)象A是實(shí)際所需要對(duì)象的概率統(tǒng)計(jì),是一種準(zhǔn)確率。在本文中,準(zhǔn)確率來自于缺項(xiàng)驗(yàn)證實(shí)驗(yàn)。取已有地質(zhì)認(rèn)識(shí)的沉積相的巖性和測(cè)井響應(yīng)數(shù)據(jù),每組數(shù)據(jù)都對(duì)應(yīng)一個(gè)沉積微相類型。以該劃分的沉積相結(jié)果作為正確的標(biāo)簽。然后,每組數(shù)據(jù)中隨機(jī)丟棄一個(gè)特征,通過文中提出的語義識(shí)別方法,得到與每種沉積微相之間的語義距離。默認(rèn)語義距離最小的沉積微相為得到的TOP-1結(jié)果,默認(rèn)語義距離最小和第二小的沉積微相為得到的TOP-2結(jié)果。圖2展示了一條測(cè)試相So={砂,箱形,未知,箱形}與辮狀河三角洲前緣亞相下各個(gè)微相之間的語義距離。由圖可知,席狀砂沉積微相為TOP-1結(jié)果,水下分流
表1 實(shí)驗(yàn)數(shù)據(jù)統(tǒng)計(jì)表
表2 沉積特征出現(xiàn)頻率、概率與信息量表
表3三角洲前緣微相的四維信息量表
Tab. 3 Four-dimensional information scale table of delta front microfacies
沉積微相類型巖性GRSPRS水下分流間灣0.9260.9020.9260.902水下分流河道0.5210.7440.7440.765席狀砂0.5210.9260.9020.765遠(yuǎn)砂壩0.9262.0480.7650.765河口壩0.5212.0482.0482.130
河道沉積微相與席狀砂沉積微相為TOP-2結(jié)果。
在上述基礎(chǔ)上,遍歷101條數(shù)據(jù),進(jìn)行缺項(xiàng)實(shí)驗(yàn)驗(yàn)證。最終,語義識(shí)別TOP-1準(zhǔn)確率為91.1%,語義識(shí)別TOP-2準(zhǔn)確率為100%。
圖2 測(cè)試相So與各種沉積微相之間的語義距離
表4 交叉驗(yàn)證與交叉缺項(xiàng)驗(yàn)證準(zhǔn)確率結(jié)果表
圖3 部分實(shí)驗(yàn)驗(yàn)證結(jié)果
為了進(jìn)一步證明語義推理方法的有效性,在上述實(shí)驗(yàn)數(shù)據(jù)上進(jìn)行交叉驗(yàn)證和交叉缺項(xiàng)驗(yàn)證。由于數(shù)據(jù)取自同一地層且長(zhǎng)度規(guī)格一致。所以交叉驗(yàn)證時(shí),采用3口井的數(shù)據(jù),通過語義識(shí)別方法,結(jié)合辮狀河三角洲本體,得到三角洲前緣亞相下各種沉積微相的四維信息量向量。然后去語義識(shí)別預(yù)測(cè)另一口井的沉積微相類型。
在此基礎(chǔ)上,進(jìn)行交叉缺項(xiàng)驗(yàn)證,任意在測(cè)試井?dāng)?shù)據(jù)中取So為測(cè)試相,隨機(jī)將一個(gè)沉積特征設(shè)為未知,即得到測(cè)試數(shù)據(jù)So。通過語義距離計(jì)算公式,計(jì)算So與每個(gè)沉積相之間的語義距離Lw,取距離最小者,即相似度最大者,即推理結(jié)果。重復(fù)上述驗(yàn)證過程,部分實(shí)驗(yàn)結(jié)果如圖3所示。
經(jīng)交叉驗(yàn)證和交叉缺項(xiàng)驗(yàn)證的沉積相語義推理分類預(yù)測(cè)實(shí)驗(yàn),實(shí)驗(yàn)結(jié)果準(zhǔn)確率如表4所示。由表4中結(jié)果分析可知,在4維特征都知道的情況下,交叉驗(yàn)證的語義識(shí)別預(yù)測(cè)結(jié)果為100%,也就是說每個(gè)特征結(jié)點(diǎn)的信息量都沒有丟失,從而證明了用4維信息量向量表示某一種沉積微相類型是可行的。然后,進(jìn)一步的交叉缺項(xiàng)驗(yàn)證實(shí)驗(yàn)的平均準(zhǔn)確率為83.3%。
但是存在某一口井準(zhǔn)確率波動(dòng)較大的情況??赡艿脑蚴?,整體語義識(shí)別實(shí)驗(yàn)環(huán)境和條件是一致的。在一個(gè)工區(qū)的沉積環(huán)境可能由于短時(shí)間內(nèi)發(fā)生沉積過程突變(地震、泥石流等),導(dǎo)致在某一小塊橫向區(qū)域內(nèi)同一深度區(qū)段內(nèi)測(cè)井響應(yīng)特征上發(fā)生突變,從而影響了某一口井的語義推理預(yù)測(cè)準(zhǔn)確率。
筆者針對(duì)單井辮狀河三角洲環(huán)境下的沉積微相識(shí)別問題,尤其是測(cè)井資料不完整(缺少一項(xiàng)特征)情況下的識(shí)別問題,利用本體和語義距離計(jì)算的相關(guān)技術(shù),并將兩者結(jié)合,提出了基于本體信息量的單井辮狀河三角洲沉積微相語義識(shí)別方法。經(jīng)過缺項(xiàng)實(shí)驗(yàn)驗(yàn)證,識(shí)別結(jié)果與已有的地質(zhì)認(rèn)識(shí)的對(duì)比準(zhǔn)確率為91.1%,交叉缺項(xiàng)實(shí)驗(yàn)驗(yàn)證的平均準(zhǔn)確率為83.3%,基本滿足單井沉積相研究工作中的需要,方便且較為準(zhǔn)確的為相關(guān)研究人員提供一定的參考。
在適用性方面上,該方法對(duì)同一地層下發(fā)育比較穩(wěn)定且單一沉積體系下的沉積微相識(shí)別效果較好。在應(yīng)用該方法時(shí),仿照本文對(duì)辮狀河三角洲的實(shí)驗(yàn)為例,只需對(duì)所研究的數(shù)據(jù),劃分出合適的分類體系,進(jìn)而建立相對(duì)應(yīng)的本體,最終進(jìn)行沉積相語義識(shí)別工作。對(duì)于多種沉積相與亞相頻繁更換的情況,該方法具有一定的局限性??傊摴ぷ鳛檫M(jìn)一步的連井沉積相研究打下基礎(chǔ),對(duì)實(shí)際地質(zhì)勘探與研究有一定的意義。