張銳(長江大學, 湖北 武漢 430100)
關于對成巖知識庫建立的思考及建議
張銳(長江大學, 湖北 武漢 430100)
主要針對成巖作用的地質知識,對成巖知識進行采集、整合、處理從而形成巖知識庫,本文主要講述成巖知識庫的系統(tǒng)構架。成巖知識庫不僅有存儲、檢索、添加、刪除等主要功能,而且還有不同的子庫類型。可大大節(jié)約了時間,對成巖方向的研究提供了極大的便利。
成巖作用; 成巖知識庫; 系統(tǒng)構架
1.1 研究目的及意義
狹義的知識庫,主要指存放知識的倉庫,是一個知識集合[1]。而廣義的知識庫,則包含狹義知識庫的推理部分、用戶界面等,泛指知識庫系統(tǒng)[2]。總的來說知識庫(Knowledge base)是存儲、組織和處理知識以及提供知識服務的重要知識集合[4]。
作為成巖的知識庫,主要是將所有成巖內(nèi)容作為一個合集,主要的目的就是存儲、組織和處理以及提供知識服務。
受沉積物成分、組構、沉積環(huán)境、沉積盆地性質及盆地演化、古氣候等多種因素的影響,沉積物在沉積—成巖演化過程中經(jīng)歷各種成巖變化,有的改造儲層,有的破壞儲層研究儲層在地質歷史時期經(jīng)歷的成巖作用,對評價儲層性能及儲層的分布有著重要的指示意義[1]。同一個研究區(qū)域成巖演化的定性、定量比較多樣復雜,通過一般的文獻閱讀難以快速準確的掌握該研究區(qū)域的成巖演化?;诖朔N情況,提出了成巖地質知識庫的建立。
1.2 國內(nèi)外研究現(xiàn)狀
國內(nèi)關于知識庫的構建的理論研究,主要集中在構建原則、模型設計以及知識庫中的知識抽取、知識標引、知識標示、知識組織、知識檢索、知識發(fā)現(xiàn)以及知識庫整合等方面。
由于成巖作用的復雜性和多樣性。不便于收集,不容易建立統(tǒng)一的分類搜索形式。也不便建立統(tǒng)一的管理存儲模式。所以成巖知識庫系統(tǒng)的建立一直處于一個不明朗的狀態(tài)。
目前國外已經(jīng)實現(xiàn)了一些大型的、易維護并且可重用的知識庫系統(tǒng)。歐盟和多個國家合作開發(fā)的IBROW系統(tǒng)[6]以及美國國防部的HPKB系統(tǒng)[7]。IBROW系統(tǒng)主要涉及知識庫的建立,知識的分類、本體的建立等方面.HPKB系統(tǒng)主要涉及特定知識庫的建立和完善發(fā)展的過程。
1.3 研究內(nèi)容
由于知識庫需要獲取大量的內(nèi)容以及需要處理本文主要的研究內(nèi)容分為下面兩個方面原始數(shù)據(jù)的處理,主要是將大量的碎片化的知識進行整合,然后對其分類。分類之后的知識才能進行同類型的存儲和應用。知識庫的系統(tǒng)構建,一個知識庫的建立不僅僅是知識和經(jīng)驗的集合,而且還設計到知識的表示、知識的應用、知識的處理等多方面問題[8]。知識的表示部分主要采取關鍵詞分類法,將不同的知識放在不同的關鍵詞分類下,可以增加存儲知識的準確性。知識的應用主要就是通過關鍵詞索引的檢索,減少不必要的查詢和知識提取。知識庫的處理主要是存儲。對大量瑣碎的知識進行存儲以便于檢索有用信息。
2.1 成巖知識庫的知識來源
成巖庫主要來源為期刊、文獻類的數(shù)據(jù)、實驗室數(shù)據(jù)以及項目的原始數(shù)據(jù)。一部分是通過實驗室和科研項目等的成巖相關的數(shù)據(jù),另一部分是前人的研究,通過文獻的查閱和參考,獲得大量不同區(qū)域或者相同區(qū)域的數(shù)據(jù)。
2.2 成巖知識庫的模塊分類
成巖知識庫,分別為原始數(shù)據(jù)庫、統(tǒng)計數(shù)據(jù)庫、圖像數(shù)據(jù)庫、經(jīng)驗公式數(shù)據(jù)庫、參考文獻數(shù)據(jù)庫。原始數(shù)據(jù)庫:通過項目或者實驗室所得出的原始數(shù)據(jù)的集合。統(tǒng)計數(shù)據(jù)庫:來源與文獻等的數(shù)據(jù)與原始數(shù)據(jù)統(tǒng)計信息的集合。經(jīng)驗公式數(shù)據(jù)庫:主要是通過前人的文獻中查找得到的參數(shù)與參數(shù)之間對應關系的合集。圖像數(shù)據(jù)庫:圖像數(shù)據(jù)庫主要存儲相同類型不同區(qū)域的圖片的合集,方便用戶的調取和查閱。參考文獻庫:成巖作用相關的學術論文、期刊、報告、會議的集合,通過標題、作者、摘要、關鍵字等類別進行管理。方便用戶的查閱。
存儲:存儲大量數(shù)據(jù)庫內(nèi)容。
檢索:通過關鍵詞的查找,可查找出所需的多個樣本資料。
添加:公開式管理方便,方便用戶添加所需的數(shù)據(jù)庫內(nèi)容。
刪除:可刪除添加錯誤或者重復的數(shù)據(jù)庫內(nèi)容。
成巖知識庫可以對成巖方向的研究節(jié)省大量的時間提高效率。成巖知識庫的提出為大量零散冗雜的成巖知識提供了理論依據(jù)和存儲方式。不同子庫的類型可以提高檢索的準確性,也是成巖知識庫的一大亮點。但是成巖知識庫還需要大量的完善和改進。
[1]張平,藍海林,黃文彥.技術整合中知識庫的構建研究[J],科學學與科學技術管理,2004,(1).
[2]吳丹,易輝.知識庫系統(tǒng)中語義網(wǎng)知識的表示[J].電腦與信息技術,2004,(1).
[3]韓海濤,宋智軍.面向濱海新區(qū)服務的知識倉庫構建研究[J],圖書館工作與研究,2009,(2).
[4]張斌,魏扣,郝琦,等.國內(nèi)外知識庫研究現(xiàn)狀述評與比較,2016.
[5]劉峰,張曉林,孔麗華.科研數(shù)據(jù)知識庫研究述評,博士論壇,2014.
[6]An Intelligent Brokering Service for Knowledge Component Reuse on the World–Wide Web
[7]P.R.Cohen,R.Schrag,E.Jones,et al.The DARPA High Performance Knowledge Bases Project.Artificial Intelligence,1998,19(4):25-49.
[8]王璀民.本體知識庫的構建與進化方法研究,中國海洋大學,008.
[9]楊勇,鄒時林,蔡源.知識庫系統(tǒng)的原理[J].東華理工大學學報自然科學版,2001,24(4):334-337.
[10]劉冰,申麗紅,李濤.知識庫系統(tǒng)原理探討[J].軟件導刊,2009,(9):148-149.
[11]宋韋劍,丁群安,劉振鋒.地質調查成果知識庫系統(tǒng)建設,建設進展,2015,(6).