尚福華 薛誠 曹茂俊
摘要:為提高測井處理解釋軟件的智能性,如何以一種顯示的、形式化的方式來表示測井領(lǐng)域知識是面臨的一個重要問題。在研究測井處理解釋業(yè)務(wù)流程的基礎(chǔ)上引入本體的概念,將領(lǐng)域本體與測井處理解釋的具體應(yīng)用需求相結(jié)合提出了一種基于業(yè)務(wù)流程的領(lǐng)域本體構(gòu)建方法,實現(xiàn)了測井處理解釋領(lǐng)域本體的構(gòu)建,解決了傳統(tǒng)知識表示方法難以適應(yīng)大規(guī)模信息的處理和表示的問題。該方法使知識與測井處理解釋流程緊密關(guān)聯(lián),更加高效的滿足應(yīng)用需求。以地層評價業(yè)務(wù)流程為例,詳細(xì)介紹了領(lǐng)域本體的構(gòu)建過程。
關(guān)鍵詞:測井處理解釋,領(lǐng)域本體,業(yè)務(wù)流程,知識表示
中圖分類號:TP18
文獻(xiàn)標(biāo)識碼:A
1 引言
隨著計算機技術(shù)的飛速發(fā)展,測井處理與解釋軟件已經(jīng)成為測井資料儲層評價工作中不可缺少的重要工具,同時勘探開發(fā)的油氣藏越來越復(fù)雜,對測井及資料處理解釋的要求也越來越高,地下儲集層的隱蔽性與非均質(zhì)性,造成測井解釋對地下地質(zhì)特性的分析與還原能力,很大程度上取決于測井分析專家的經(jīng)驗、技能與判斷力,然而,具有這種經(jīng)驗的專家要花很長的時間才能形成,且形成之后往往有流失的可能,所以測井資料處理與解釋自動化及智能化是當(dāng)前測井解釋領(lǐng)域追求的目標(biāo)之一。目前,國內(nèi)外測井軟件如CIFLog、TechLog和GeoLog已經(jīng)在知識庫方面進(jìn)行了思考和工作的開展[1-2],但是面臨的一個主要的問題是如何對測井處理解釋領(lǐng)域龐大的知識進(jìn)行表示,以便能夠在知識庫中快速獲取目標(biāo)知識。傳統(tǒng)的知識表示方法[3]如產(chǎn)生式表示法無法呈現(xiàn)完整的知識,只能用單一的規(guī)則描述部分的知識,但是在測井解釋過程中不僅要有推理邏輯,還要進(jìn)行許多算術(shù)運算,純粹的產(chǎn)生式表示法無法滿足要求。知識庫的發(fā)展面臨的重要問題是如何讓計算機能理解和處理知識,解決這個問題的難點是建立怎樣的模型來描述知識,實現(xiàn)領(lǐng)域知識的共享與重用[4]。
本體(Ontology)是共享概念模型的明確確的形式化規(guī)范說明,定義了組成主題領(lǐng)域的基本術(shù)語和關(guān)系等。誕生以來就在信息科學(xué)領(lǐng)域受到廣泛的關(guān)注,其重要性也在許多方面表現(xiàn)出來,其應(yīng)用研究已經(jīng)延伸到多個領(lǐng)域,如知識工程、自然語言處理、軟件工程領(lǐng)域。國內(nèi)對本體論的研究,主要有信息檢索[5]、常識知識庫等方面。國外較為成熟的通用本體庫系統(tǒng)有WordNet,Dbpedia,Cyc,以及生物醫(yī)學(xué)領(lǐng)域本體、企業(yè)領(lǐng)域本體,國內(nèi)比較著名的通用本體庫系統(tǒng)是HowNetc6]、浙江大學(xué)人工智能研究所基于本體論的產(chǎn)品信息集成研究等[7]。由于在測井解釋過程中不僅需要進(jìn)行知識的推理還要進(jìn)行很多算術(shù)運算,領(lǐng)域本體在該領(lǐng)域中的應(yīng)用很好的滿足了要求,同時實現(xiàn)了測井領(lǐng)域知識的重用,以及測井領(lǐng)域信息知識內(nèi)容的集成、挖掘和關(guān)聯(lián)。
本文研究了測井處理解釋業(yè)務(wù)流程,提出了基于業(yè)務(wù)流程的測井處理解釋領(lǐng)域本體構(gòu)建方法,實現(xiàn)了測井領(lǐng)域本體的構(gòu)建。并以地層評價為例,闡述了其在構(gòu)建領(lǐng)域本體中的具體應(yīng)用。
2 測井處理解釋領(lǐng)域本體概述
2.1 本體概述
本體最為廣泛接受的概念是:本體是對共同的概念進(jìn)行規(guī)范化的說明[8,9]。本體的表示方式有很多種,其中最常見的表示形式是一個五元組的集合O=(C,R,σ,A,I)。其中:C為概念集合,也稱為類的集合。R是領(lǐng)域中概念之間的關(guān)系。σ表示函數(shù)。A表示公理,用來說明函數(shù)之間或關(guān)系之間存在的關(guān)聯(lián)和約束。I是指實例,即概念中的具體例子。本體的目標(biāo)是捕獲相關(guān)領(lǐng)域的知識,提供對該領(lǐng)域知識的共同理解,確定該領(lǐng)域內(nèi)共同認(rèn)可的詞匯,并從不同層次的形式化模式上給出這些詞匯和詞匯之間相互關(guān)系的明確定義。
本體可以劃分為頂層本體、領(lǐng)域本體和應(yīng)用本體,其中頂層本體描述的是通用的概念即概念之間的關(guān)系,比如時間,空間等;領(lǐng)域本體描述的是特定領(lǐng)域如測井處理解釋領(lǐng)域的概念和概念間的關(guān)系;應(yīng)用本體描述的是依賴于特定領(lǐng)域和任務(wù)的概念和概念間關(guān)系。本文在測井處理解釋系統(tǒng)中引入本體,通過對測井處理解釋流程的具體分析,構(gòu)建面向測井處理解釋的領(lǐng)域本體,實現(xiàn)了知識的重用和邏輯推理,提高了測井處理解釋軟件的智能性。
2.2 測井處理解釋概述
測井?dāng)?shù)據(jù)處理與綜合解釋,就是按照預(yù)定的地質(zhì)任務(wù),用計算機對測井資料進(jìn)行自動處理,并綜合地質(zhì)、錄井和開發(fā)資料進(jìn)行綜合分析解釋,以解決地層劃分、油氣儲集層和有用礦藏的評價及其勘探開發(fā)中的其它地質(zhì)與工程技術(shù)問題[10]。
測井處理解釋領(lǐng)域本體,就是通過引入本體和描述邏輯對測井處理解釋領(lǐng)域的知識進(jìn)行形式化和規(guī)范化的描述。通過在測井處理解釋軟件框架的支持層中引入測井處理解釋領(lǐng)域本體,實現(xiàn)在領(lǐng)域本體中定義測井領(lǐng)域基礎(chǔ)信息本體概念如:骨架密度、壓實系數(shù)、孔隙度和滲透率等,同時還要從概念中抽取關(guān)系。領(lǐng)域本體為解決語義異構(gòu)問題提供了解決方法,不同測井處理解釋領(lǐng)域?qū)嶓w通過領(lǐng)域本體實現(xiàn)了語義共享。所以將本體與測井處理解釋領(lǐng)域相結(jié)合,明確領(lǐng)域概念及其之間的關(guān)系,實現(xiàn)了測井處理解釋領(lǐng)域的集成和共享。
3 測井處理解釋領(lǐng)域本體構(gòu)建
目前比較流行的領(lǐng)域本體構(gòu)建方法有:“骨架法”、“評估法”、“Bernaras”、“Methontology”、“Sen-sus”以及斯坦福大學(xué)的“七步法”[11-15],比較這些本體構(gòu)建方法,它們的特點如下[16].
1)本體構(gòu)建大致可劃分為階段法(如骨架法)和原型演化法(如Methontology淺}等;
2)在構(gòu)建過程中可分為“非形式化描述本體”和用正規(guī)描述語言“形式化描述本體”前后兩個階段;
3)希望通過累積的方法來構(gòu)建本體,即先構(gòu)建一個基礎(chǔ)本體,然后做進(jìn)一步開發(fā)。
但是目前的本體構(gòu)建方法還未能像軟件工程那樣形成一種統(tǒng)一的、標(biāo)準(zhǔn)的、通用的本體方法論。本文的研究是在骨架法以及“七步法”的基礎(chǔ)上,結(jié)合測井處理解釋業(yè)務(wù)流程提出一套基于業(yè)務(wù)流程領(lǐng)域的本體構(gòu)建方法。該方法的核心是:將領(lǐng)域本體的構(gòu)建與業(yè)務(wù)需求緊密的聯(lián)系起來,以具體的測井處理解釋業(yè)務(wù)為起點,并且貫穿于本體構(gòu)建的全部過程,這樣易于知識的獲取和本體功能的描述。本體的概念以及關(guān)系的抽取是一個不斷循環(huán)迭代的過程,先以應(yīng)用需求抽取規(guī)則,然后輔助完善領(lǐng)域本體,直至本體趨于完善。同時結(jié)合傳統(tǒng)方法采用從上到下的方式,首先構(gòu)建頂層本體,然后是領(lǐng)域本體,后是應(yīng)用本體,通過這一系列過程構(gòu)建的領(lǐng)域本體在滿足應(yīng)用需求的前提下,還具有一定的通用性、完整性和共享性。
3.1 測井處理解釋領(lǐng)域本體構(gòu)建框架
隨著人工智能等技術(shù)的發(fā)展,測井處理解釋也逐漸向著自動化和智能化轉(zhuǎn)變,利用本體方法可以構(gòu)建測井處理解釋領(lǐng)域的知識脈絡(luò),能更好地繼承共享已有的知識。結(jié)合測井處理解釋業(yè)務(wù)流程提出基于業(yè)務(wù)流程的領(lǐng)域本體構(gòu)建方法,具體過程如圖1所示:
1)明確所屬領(lǐng)域及應(yīng)用范圍:為后續(xù)構(gòu)建過程的明確方向。領(lǐng)域本體構(gòu)建的目的是把領(lǐng)域的概念、屬性和規(guī)則等形式化的表達(dá)出來,為知識的共享和推理提供基礎(chǔ)。
2)需求分析:從業(yè)務(wù)功能需求方面入手使本體與應(yīng)用緊密結(jié)合。采用軟件工程方法,細(xì)化業(yè)務(wù)需求,形成詳細(xì)的說明文檔以便后續(xù)應(yīng)用。例如單孔隙度測井泥沙巖分析,需要首先對該過程進(jìn)行詳細(xì)的說明,如:期望輸出的結(jié)果和涉及到的領(lǐng)域信息如參數(shù)、公式等。
信息收集:包含兩個部分,一是對輸入的文檔進(jìn)行先期處理(如斷句,分詞等),二是要考慮本體的復(fù)用,即對已有領(lǐng)域本體的使用,可以省去元本體和頂層本體的建立,專注于領(lǐng)域本體的構(gòu)建。
3)概念、屬性抽?。褐饕δ苁菑妮斎胛谋局刑崛∧切┖湍繕?biāo)領(lǐng)域高度相關(guān)的概念。概念的抽取主要分為兩部分:一是從第一步確定的領(lǐng)域范圍內(nèi)的相關(guān)詞典和相關(guān)文獻(xiàn)中直接抽取;二是結(jié)合建立的業(yè)務(wù)流程模型,根據(jù)具體業(yè)務(wù)步驟抽取每一步驟中涉及到的術(shù)語。這樣得到的本體概念更加完整,覆蓋度高。
4)關(guān)系抽?。喊▽哟侮P(guān)系抽取和非層次關(guān)系抽取。關(guān)系抽取的核心在于怎樣選擇和提取關(guān)系特征[17],為解決該問題從業(yè)務(wù)流程入手,分析每一步驟涉及到的概念,從中抽取本體概念關(guān)系。從語義上來說概念之間的基本關(guān)系有整體一部分關(guān)系、分類關(guān)系、實例與概念關(guān)系和屬性關(guān)系,但是實際建模過程中并不止這四種,可以根據(jù)領(lǐng)域的具體情況來定義。
5)本體的形式化:采用OWL DL語言,在保證描述能力的同時也兼顧了推理能力。構(gòu)建領(lǐng)域本體文檔,可以對后續(xù)的領(lǐng)域本體優(yōu)化奠定基礎(chǔ)。
6)本體評價和本體應(yīng)用:對形成的本體進(jìn)行一致性,完整性等的評價,然后針對某一具體業(yè)務(wù),進(jìn)行初始領(lǐng)域本體的試運行,來驗證是否滿足業(yè)務(wù)需求,若符合則可以投入實際應(yīng)用,否則根據(jù)試運行結(jié)果進(jìn)行更改。
3.2 測井處理解釋領(lǐng)域本體構(gòu)建
地層評價是一種復(fù)雜的、運用多學(xué)科知識和實踐經(jīng)驗對地層進(jìn)行綜合分析的過程,涉及到大量的數(shù)值運算及復(fù)雜的推理,是測井資料處理與解釋過程中最為重要和關(guān)鍵的一個環(huán)節(jié)。下面以地層評價為例說明測井領(lǐng)域本體的構(gòu)建過程。使用protege
4.3 作為構(gòu)建工具,OWL DL為構(gòu)建語言。
1)明確所屬領(lǐng)域以及需求分析
(1)本體構(gòu)建目標(biāo):解決測井處理解釋領(lǐng)域的知識表示的不足,使系統(tǒng)更好的輔助操作人員進(jìn)行綜合分析以及演繹推理最后做出決策得到地層評價結(jié)果。
(2)應(yīng)用需求分析:首先構(gòu)建地層評價的整體知識模型,然后對每一階段進(jìn)行具體分析形成詳細(xì)的功能說明以及所涉及到的概念說明。例如在劃分儲集層時的巖性識別過程,在淡水泥漿的井內(nèi)可以根據(jù)自然電位曲線、微電極曲線、聲波時差曲線和電阻率來劃分,首先如果SP有明顯負(fù)異常微電極有正幅度差,則為砂巖或者生物灰?guī)r;如果聲波時差高則為砂巖其次為生物巖。在這個過程中明確了業(yè)務(wù)需要的信息,為后續(xù)的構(gòu)建提供了基礎(chǔ)。地層評價的知識模型如圖2所示。
為了保證領(lǐng)域本體的完整性,信息收集要從多方面進(jìn)行。本領(lǐng)域的基本信息主要來自兩方面:一是測井基礎(chǔ)信息數(shù)據(jù)庫,二是本領(lǐng)域行業(yè)規(guī)范相關(guān)詞典,如《測井原始資料質(zhì)量要求》、《測井解釋報告編寫規(guī)范》和《裸眼井單井測井?dāng)?shù)據(jù)處理流程》等。
2)概念、屬性的抽取
概念的抽取主要采用兩種方式,一種是根據(jù)建立好的業(yè)務(wù)流程框架從上到下順序抽取,逐步細(xì)化。在概念的抽取過程中要緊密的結(jié)合測井處理解釋的具體業(yè)務(wù)流程,如在進(jìn)行儲集層評價時,非儲集層判別過程中,需要根據(jù)不同測井曲線在不同巖性中表現(xiàn)出來的不同測井特征來劃分巖性,測井曲線是屬于測井信息。首先需要建立測井曲線的概念本體,例如:自然電位曲線(SP)、自然伽馬曲線(GR)和微電極曲線(MD,而測井曲線是由各種不同的測井方法生成的,所以需要抽取測井方法的概念本體,自然電位測井、微電極測井、中子伽馬測井等,同時還需要構(gòu)建巖性本體例如泥巖、煤、砂巖等。
另一種是采用搜索的方法,對所收集的信息進(jìn)行搜索包括基礎(chǔ)信息數(shù)據(jù)庫、文檔等,來獲得需要定義的概念。如:對“處理參數(shù)”進(jìn)行搜索,可以查到的結(jié)果可能有“AMN”、“骨架密度”、“GRmin”、“GRmax”、“壓實系數(shù)”等,這些結(jié)果可以作為本體中的概念進(jìn)行直接定義。在定義這些概念后,需要根據(jù)具體情況進(jìn)行分析,區(qū)分概念和屬性,調(diào)整類的層次結(jié)構(gòu)。得到的概念模型包括,參數(shù)、模型和圖版,其中參數(shù)包括孔隙度、滲透率、飽和度、沉積特征等;模型有李寧通解方程、雙水模型、Archie公式等;圖版有標(biāo)準(zhǔn)解釋圖版和地區(qū)解釋圖版等。
這樣抽取出來的概念能夠最大程度的確保覆蓋率,同時還能為后續(xù)的本體的應(yīng)用建立良好的基礎(chǔ)。
3)關(guān)系的定義
關(guān)系是領(lǐng)域中概念之間的交互作用,由于在類中所涉及到的屬性及關(guān)系較多,會形成一個層次關(guān)系,這種層次關(guān)系反映了屬性的類別知識,我們采用屬性本體結(jié)構(gòu)以及聚類屬性的方式來表示這種屬性關(guān)系間的分類關(guān)系。POR分析程序是單孔隙度測井泥質(zhì)砂巖地層評價的一種常用方法,以此為例說明關(guān)系的抽取。
根據(jù)抽取的概念,以及需求分析中得到的結(jié)果,進(jìn)一步明確各類之間的關(guān)系。例如測井曲線與測井信息之間存在著is-part-of的關(guān)系,測井方法與測井曲線之間存在著generate(關(guān)系),模型和處理參數(shù)之間存在著calculate(計算)的關(guān)系,等等。在關(guān)系的定義過程中,業(yè)務(wù)的流程有著十分重要的作用,例如在POR分析程序中計算地層泥質(zhì)含量時采用的公式為
由此可得到處理參數(shù)與儲層參數(shù)的關(guān)系,儲層參數(shù)有處理彈數(shù)經(jīng)計算分析得到。同樣經(jīng)過對地層孔隙度計算和含水飽和度計算流程的分析,同樣能得到更加細(xì)化的關(guān)系。又如巖性的劃分需要根據(jù)測井曲線的響應(yīng)特征,所以巖性與測井曲線之間存在著divide(劃分巖性)。部分關(guān)系定義如表1所示。
4)本體形式化
采用OWL DL對本體進(jìn)行形式化的描述,根據(jù)測井處理解釋領(lǐng)域本體設(shè)計的基本原則,在對類進(jìn)行描述時主要包括類(categories),表示專業(yè)領(lǐng)域中的歸屬集體,每一個類中都有相應(yīng)的個體(indi-viduals)及實例Gnstances)。類間的基本關(guān)系是繼承Gnheritances)和為了描述類及類的個體及實例,我們使用屬性(attribute)及關(guān)系(relationship)的描述符,并對屬性及關(guān)系的值進(jìn)行限制
5)本體評價
對構(gòu)建完的本體進(jìn)行評價,評價通過后應(yīng)用本體。對本體的評價采用基于特定應(yīng)用的本體評價策略,即基于測井處理解釋業(yè)務(wù)的本體評價,其基本思想是直接將構(gòu)建的本體用于解決實際問題中去檢驗本體的質(zhì)量,即在底層評價過程中實際檢驗本體,這種評價策略雖然無法完全保證本體的質(zhì)量,但是簡單、直觀。
經(jīng)過如上的操作,得到構(gòu)建的測井處理解釋領(lǐng)域初始本體,如圖3展示的是部分與地層評價相關(guān)的領(lǐng)域本體。
4 結(jié)論
結(jié)合傳統(tǒng)本體構(gòu)建方法提出了適合測井處理解釋領(lǐng)域的基于業(yè)務(wù)流程領(lǐng)域本體構(gòu)建方法,并且初步構(gòu)建了測井處理解釋本體,很好的解決了知識重用性差以及邏輯推理困難的問題。在本體在測井領(lǐng)域的應(yīng)用進(jìn)行了初步的探索,同時為后續(xù)的研究工作打下了基礎(chǔ)。測井處理解釋領(lǐng)域本體庫的構(gòu)建是一個十分龐大的工程,涉及到各學(xué)科如人工智能、石油、地質(zhì)等,并不是一蹴而就的而是一個十分復(fù)雜的過程。領(lǐng)域本體的構(gòu)建與應(yīng)用又是其中最有廣闊發(fā)展前景的方面,本文對測井處理解釋領(lǐng)域本體的研究和應(yīng)用,希望對相關(guān)領(lǐng)域的同行有所借鑒。
參考文獻(xiàn)
[1] Li Ning,WANC Ming-chao,CUI Jian,et al.CifNet networkmulti-well data managenent system [J]. Applied Ceophysics,2004,1(2):129-131.
[2]尚福華,原野,王才志,等.基于知識庫的解釋模型智能優(yōu)選的測井?dāng)?shù)據(jù)處理方法[J].石油學(xué)報,2015,36 (11):1449-1454.
[3] 尚福華,李想,鞏淼.基于模糊框架一產(chǎn)生式知識表示及推理研究[J].計算機技術(shù)與發(fā)展,2014,24(7):38-42.
[4]魏春良.本體的構(gòu)建方法與應(yīng)用研究[D].成都:電子科技大學(xué),2011
[5]鄧志鴻,唐世渭,楊冬青.基于本體的多Agent分布式數(shù)字圖書館資源信息發(fā)現(xiàn)服務(wù)模型之研究[J].計算機工程,2002, 28(6):37-38
[6]楊月華,杜軍平,平源.基于本體的智能檢索系統(tǒng)[J].軟件學(xué)報,2015,26 (7) ,1677-1680
[7] CUO Ming,U Shan-ping,DONC Jin-xiang, et al.Ontology-based product data integration. In: Proc of the 17th Intrl Confon Ad -vanced Information Networking and Applications(AINA) .Xi'an, China:IEEE Coruputer Soc-ety, 2003.530-533
[8] CRUBE T R.Ontolingua:A Transla-tion Approach to Potahle On-tology Specifi cation [J]. Knowledge Acquisition,1993,5 (2): 199-200
[9]
STUDER R,BENJAMINS R,F(xiàn)ENSEL D.Knowledge engineering:principles and methods [J]. Data&knowledge engineering,1998,25(1):161-197
[10]常蕾.華慶油田測井技術(shù)系列評價及應(yīng)用研究[D].西安,西安石油大學(xué),2011
[11] USCHOLD M,KINC M.Towards a methodology for building on-tologies ECl.Proceedings of the Workshop on Basic OntologicalIssues in Knowledge Sharing, Intemational Joint Conference onArtificial Intelligence (IJCAI-95) ,1995.
[12] CRUNINCER M, FOX M S.Methodology for the design and e-valuation of ontologies ECl. Workshop on Basic Ontological Is-sues in Knowledge Sharing, (IJCAI-95) .1995
[13] BERNARAS A,LARESCOITI I,CORERA J."Build- ing andreusing ontologies forelectrical network applications" [C].Pro-ceedings of the European Conference on Artiicial Intelligence(ECAI'96).1996.
[14] GRUNINCER M,F(xiàn)OX M S.Methodology for the design and e-valuation of ontologies [C]. Workshop on Basic Ontological Is-sues in Knowledge Sharing,( UCAI-95) ,1995.
[15] KNICHT K,LUK S K.Building A Large-scale Knowledge Basefor Machine rrranslation [C].American Association of ArtificialIntelligence Conference (AAAI-94) ,1994.
[16]蔡皎潔,張玉峰,基于軟件工程開發(fā)的領(lǐng)域本體構(gòu)建研究[J].現(xiàn)代情報,2012,32 (8):37-40
[17]甘麗新,萬常選,劉德喜等.基于句法語義特征的中文實體關(guān)系抽取啪.計算機研究與發(fā)展.2016,53 (2):284-302.