章維亞 楊世瀚
摘 ?要:智慧博物館的發(fā)展為藏品信息的知識(shí)化組織提出了新的需求,基于本體工程學(xué)的方法,提出博物館藏品信息的知識(shí)化結(jié)構(gòu)模型,構(gòu)建博物館領(lǐng)域本體,建立推理引擎,充分表達(dá)和發(fā)展博物館領(lǐng)域的知識(shí)體系,并開(kāi)發(fā)博物館領(lǐng)域的智能應(yīng)用系統(tǒng)。以博物館藏品信息為中心的博物館本體知識(shí)庫(kù)既克服了傳統(tǒng)的賬目式信息結(jié)構(gòu)的不足,又可表達(dá)藏品的展覽信息、文化信息、美學(xué)信息、傳播信息等重要的非物質(zhì)信息。本文基于博物館本體知識(shí)庫(kù)開(kāi)發(fā)了一個(gè)智能應(yīng)用。
關(guān)鍵詞:智慧博物館;藏品知識(shí)結(jié)構(gòu);本體工程;本體語(yǔ)言
中圖分類號(hào):TP391;G264 ? ? ?文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):2096-4706(2019)17-0001-05
Abstract:The development of wisdom museum has put forward new demands for the knowledge organization of collections information,which is based on ontology engineering method. This paper proposes a knowledge structure model of museum collection information,constructs museum domain ontology,establishes reasoning engine,fully expresses and develops museum domain knowledge system,and develops intelligent application system in museum domain. The museum ontology knowledge base centered on museum collection information not only overcomes the shortcomings of traditional accounting information structure,but also expresses important intangible information such as exhibition information,cultural information,aesthetic information and dissemination information. This paper develops an intelligent application based on museum ontology knowledge base.
Keywords:intelligent museum;collections’knowledge structure;ontology engineering;ontology language
0 ?引 ?言
博物館的核心是藏品,博物館信息管理系統(tǒng)中只有藏品的物質(zhì)信息,更有意義的非物質(zhì)信息從來(lái)沒(méi)有被組織起來(lái)。傳統(tǒng)的基于關(guān)系數(shù)據(jù)庫(kù)的藏品信息管理方法和技術(shù),曾經(jīng)對(duì)博物館信息化發(fā)展起到了巨大的作用[1]。隨著智慧博物館的發(fā)展和興起,傳統(tǒng)的關(guān)系數(shù)據(jù)庫(kù)信息結(jié)構(gòu)受到較大的挑戰(zhàn),新的博物館知識(shí)庫(kù)尚沒(méi)有建立起來(lái),智慧博物館還依然停留在概念階段。智慧博物館要求所有信息互聯(lián)互通,對(duì)知識(shí)分享和傳播提出更高的要求,“以人為本”的“物、人、數(shù)據(jù)”三者之間動(dòng)態(tài)雙向多元信息傳遞模式是智慧博物館的主要特征[2],這里的“多元信息”即可以理解為知識(shí),知識(shí)是信息更高層次的抽象,它提煉了信息之間的關(guān)系,它把相關(guān)信息組織在一起形成了知識(shí)化的信息結(jié)構(gòu),它是智慧博物館的數(shù)據(jù)結(jié)構(gòu)基礎(chǔ)之一。同時(shí),智慧博物館理念下的藏品信息外延也不斷擴(kuò)大,博物館藏品不僅具有物質(zhì)上的信息,如材質(zhì)、尺寸、年代等,更重要的是其背后的文化歷史信息、藝術(shù)信息、美學(xué)信息等,所以博物館藏品信息結(jié)構(gòu)不僅需要類目和管理信息,更需要包含藏品的其他相關(guān)信息,這也是對(duì)博物館的信息知識(shí)化組織的基本要求,而傳統(tǒng)的博物館信息系統(tǒng)對(duì)這些非物質(zhì)信息從來(lái)沒(méi)有組織起來(lái)。
信息的知識(shí)化組織是一個(gè)復(fù)雜的信息工程過(guò)程。作為知識(shí)描述的重要手段,本體是領(lǐng)域本體工程的核心概念。知識(shí)本體[3]是共享的概念模型之形式化規(guī)范說(shuō)明。博物館領(lǐng)域知識(shí)本體的構(gòu)建是博物館知識(shí)工程的一部分,是博物館界亟待建立的博物館領(lǐng)域本體,它必須兼容遺留的藏品物質(zhì)信息,也必須涵蓋藏品的非物質(zhì)信息。博物館領(lǐng)域本體工程是對(duì)博物館領(lǐng)域知識(shí)進(jìn)行構(gòu)建、組織、維護(hù)和管理的標(biāo)準(zhǔn)化軟件工程過(guò)程,這個(gè)過(guò)程包括領(lǐng)域知識(shí)分析原則與方法,領(lǐng)域本體設(shè)計(jì)、構(gòu)建、開(kāi)發(fā)之方法和工具,本體的維護(hù)、測(cè)試、驗(yàn)證、評(píng)價(jià)、共享與重用等內(nèi)容。
1 ?本體工程開(kāi)發(fā)模型
一個(gè)好的領(lǐng)域本體具有以下幾個(gè)特征[4-6]:客觀清晰、完整性、一致性、最小承諾和單調(diào)可擴(kuò)展性。領(lǐng)域本體工程是一個(gè)領(lǐng)域知識(shí)獲取的過(guò)程,一般分成需求分析和領(lǐng)域分析、確定領(lǐng)域范圍、考慮重用、列舉術(shù)語(yǔ)、定義類、定義屬性、定義限制、增加實(shí)例等幾個(gè)階段,在建模的每個(gè)階段都有驗(yàn)證或評(píng)估的要求動(dòng)作,這個(gè)過(guò)程是不斷迭代和不斷精化的過(guò)程。
1.1 ?需求分析和領(lǐng)域分析
進(jìn)行需求、領(lǐng)域和用例分析是任何軟件工程設(shè)計(jì)的關(guān)鍵階段。這個(gè)階段允許本體工程師夯實(shí)工作基礎(chǔ),并確定各個(gè)工作任務(wù)的優(yōu)先次序。領(lǐng)域?qū)<以谶@個(gè)階段的工作尤為重要,是起決定作用的。分析階段必須做到:明確定義知識(shí)的性質(zhì)和本體的能力,使即將要構(gòu)建的本體可以通過(guò)推理機(jī)能回答的問(wèn)題;確定體系結(jié)構(gòu);考量使用傳統(tǒng)知識(shí)工程方法的有效性問(wèn)題等。
這個(gè)階段的主要目的是要考慮基于本體的應(yīng)用程序能夠良好地進(jìn)行系統(tǒng)演化或者進(jìn)行動(dòng)態(tài)的知識(shí)演化、能夠支持與其他系統(tǒng)(如眾多的遺留系統(tǒng))的互操作性、促進(jìn)和增強(qiáng)系統(tǒng)與用戶的接口、促進(jìn)領(lǐng)域術(shù)語(yǔ)和概念的標(biāo)準(zhǔn)化工作等。
在處理知識(shí)的時(shí)候,特別強(qiáng)調(diào)要區(qū)別對(duì)待這些信息:聲明性領(lǐng)域知識(shí)和過(guò)程性領(lǐng)域知識(shí),即是什么和怎么樣的知識(shí);本體和解決問(wèn)題的方法,本體是知識(shí)的載體,解決問(wèn)題的方法是知識(shí)的使用過(guò)程;可變知識(shí)和不變知識(shí),一般背景知識(shí)是不可變的,行業(yè)的新理念、新方法、新技術(shù)等不斷發(fā)展變化的知識(shí);知識(shí)的來(lái)源和知識(shí)的可信任水平,一般知識(shí)的來(lái)源不同,則可信任水平不同。
1.2 ?確定領(lǐng)域范圍
這個(gè)階段要明確回答這些問(wèn)題:構(gòu)建的本體將被用來(lái)做什么?構(gòu)建智能應(yīng)用,語(yǔ)義查詢還是知識(shí)挖掘?軟件實(shí)現(xiàn)的時(shí)候本體將怎樣被使用?多用于推理還是查詢?本地使用還是分布式使用?共享方式是什么?我們希望本體知道什么,即表達(dá)什么樣的知識(shí)?我們想要的知識(shí)的范圍是什么?
1.3 ?考慮重用
要考慮兩個(gè)方面,一個(gè)是重用已經(jīng)被證明是好的本體或者本體片段,一個(gè)是即將構(gòu)建的本體要能方便地被重用。
1.4 ?列舉術(shù)語(yǔ)
通常從需求分析文檔中抽取名詞和動(dòng)詞,從領(lǐng)域?qū)<铱谥蝎@取專用術(shù)語(yǔ)等來(lái)進(jìn)行非正式的術(shù)語(yǔ)列舉。主要是名詞和動(dòng)詞,名詞將作為類定義的基礎(chǔ),動(dòng)詞將作為屬性定義的基礎(chǔ)。一種卡片歸類的非正式方法可以幫助列舉術(shù)語(yǔ):由領(lǐng)域?qū)<液捅倔w工程師組成一個(gè)小組,制作很多小卡片,每張卡片上寫(xiě)一個(gè)術(shù)語(yǔ),然后把這些卡片按照相關(guān)性大小分成一些小堆,把相關(guān)性較強(qiáng)的小堆放得靠近些,然后不斷地討論和重復(fù)這個(gè)過(guò)程,最后得出一個(gè)比較滿意的基本分類好的術(shù)語(yǔ)列表。
1.5 ?定義類
一個(gè)類就是領(lǐng)域中的一個(gè)概念,類是具有相似屬性的元素的一個(gè)集合,類中的元素叫作類的成員,類里面包含的是其成員的必要條件。首先需要對(duì)類進(jìn)行定義,定義類除了要明確地用文字進(jìn)行含義說(shuō)明之外,可能還需要形式化地用數(shù)學(xué)符號(hào)精確定義出其所有成員的必要條件來(lái)。除了顯而易見(jiàn)的領(lǐng)域概念之外,還要發(fā)現(xiàn)一些新的概念和類。發(fā)現(xiàn)類的方法通常有:
(1)可以獨(dú)立存在的事物是一個(gè)類,通常是名詞。
(2)修飾語(yǔ)有時(shí)可成為一個(gè)類,通常是副詞和形容詞。
(3)擴(kuò)展概念,把一組事物放在一起考慮它們的共同點(diǎn),往往可以擴(kuò)展出新的概念。如:從動(dòng)物和植物兩個(gè)概念,可以拓展出生物的概念,因?yàn)樗鼈兌加猩?/p>
(4)增加一些我們需要的抽象概念。
(5)標(biāo)識(shí)一些可以定義的事物。
第二個(gè)重要的工作是標(biāo)識(shí) 類之間的關(guān)系,這階段識(shí)別“整體-部分”關(guān)系和“繼承”關(guān)系,特別是類間的繼承層次關(guān)系,所有的類都應(yīng)該在繼承層次結(jié)構(gòu)中。典型的開(kāi)發(fā)類間層次關(guān)系的方法有:
(1)自頂向下法,先定義最一般的概念,然后再逐漸特殊化。
(2)自底向上法,先定義最特殊的概念,然后把它們歸類起來(lái),一般化為一般性的概念。
(3)組合法,即結(jié)合自頂向下和自底向上兩種方法,同時(shí)從深度和寬度上擴(kuò)展類。
1.6 ?定義屬性
這個(gè)步驟和上下兩個(gè)步驟(定義類和定義限制)要頻繁交互。屬性描述了類成員的特征,嚴(yán)格的本體要求,只要對(duì)A類的成員成立的屬性,如果B類是A類的子類,那么這些屬性對(duì)B類的所有成員也成立。在類層次中定義屬性時(shí),遵循最高層次類定義屬性原則,即把屬性定義盡量應(yīng)用到繼承層次中最高層次的類中去。客觀事物的屬性類型一般有:
(1)內(nèi)在屬性,如文物的質(zhì)地、顏色、重量等。
(2)外在屬性,如文物的名稱、年代、研究?jī)r(jià)值等。
(3)整體-部分屬性,如某帶蓋瓷器文物的蓋子是整體文物的一個(gè)組成部分。
(4)與其他對(duì)象的關(guān)系屬性,如同一個(gè)墓葬出土的兩個(gè)文物具有“相同文物來(lái)源”關(guān)系。
在本體中用兩種屬性來(lái)表示:
(1)數(shù)據(jù)屬性,即簡(jiǎn)單的數(shù)據(jù)類型屬性,包含基本數(shù)據(jù)類型的值,如文物的尺寸(數(shù)值)、名稱(字符串)等。用來(lái)定義客觀事物的內(nèi)在屬性和外在屬性。
(2)對(duì)象屬性,即復(fù)雜的屬性,它包含其他的對(duì)象。常用來(lái)定義整體-部分屬性和關(guān)系屬性。
從需求文檔中尋找屬性的方法一般就是兩個(gè),識(shí)別修飾詞和識(shí)別關(guān)系。修飾詞一般是形容詞和副詞,基本上形容詞和副詞都定義了對(duì)象的一個(gè)屬性;表示關(guān)系一般從動(dòng)詞入手,動(dòng)詞一般反映了兩個(gè)或多個(gè)對(duì)象之間的關(guān)系。
標(biāo)識(shí)屬性的方法一般是圍繞定義的類去問(wèn)一些問(wèn)題:這個(gè)類的所有成員具有什么特征?這個(gè)類的部分成員具有哪些特征?這個(gè)類的哪些屬性需要記錄和標(biāo)識(shí)?這個(gè)類的成員具有哪些動(dòng)作或者活動(dòng)?這個(gè)類的成員和其他類的成員有哪些關(guān)系,發(fā)生哪些互動(dòng),交互需要有什么條件和限制?等等。然后回答這些問(wèn)題并記錄下來(lái),討論并識(shí)別出屬性,對(duì)照屬性的特征,評(píng)估每個(gè)屬性具有的特征,并詳盡記錄下來(lái)。還需進(jìn)一步討論屬性之間的分類,并識(shí)別屬性之間的繼承層次關(guān)系等等。最后達(dá)成一個(gè)本體工程師和領(lǐng)域?qū)<叶蓟菊J(rèn)可的屬性定義成果。
1.7 ?定義限制
定義限制就是限制屬性的定義域和值域,也叫屬性限制。屬性限制一般有三種,全局限制,局部限制和基數(shù)限制。前面指定屬性的類型就是一種限制,這種限制是全局的,即這些限制會(huì)對(duì)屬性的所有實(shí)例都有效。其他限制都是局部的,它們只在包含它們的類中起作用,一個(gè)是全稱量詞限制,一個(gè)是存在量詞限制,還有一種限制就是基數(shù)限制。限制既可以在定義域上,也可以在值域上,也可以同時(shí)在定義域和值域上有限制。
定義限制的方法是,對(duì)關(guān)系屬性的定義域和值域問(wèn)這樣的問(wèn)題,然后正確回答:這個(gè)屬性是對(duì)所有的對(duì)象都成立嗎?是對(duì)部分對(duì)象成立嗎?還是只對(duì)某一個(gè)或者某幾個(gè)對(duì)象成立?這個(gè)屬性的定義域限制是復(fù)雜的,可以表示成一個(gè)公理嗎?這個(gè)屬性的值域限制是復(fù)雜的,也可以表示成一個(gè)公理嗎?等等。
1.8 ?實(shí)例化
在定義好類、屬性和限制之后,就可以添加類的實(shí)例了。這個(gè)填充實(shí)例到本體中的步驟和其他的過(guò)程相比相對(duì)獨(dú)立。一般地說(shuō)實(shí)例的數(shù)量遠(yuǎn)大于類的數(shù)量,手工添加是一個(gè)很大的挑戰(zhàn)。通常我們一般從遺留的關(guān)系數(shù)據(jù)庫(kù)中自動(dòng)獲取,或者開(kāi)發(fā)專門的工具從Excel表格等電子文檔中讀取,還有就是借助軟件工具從文本庫(kù)、資料庫(kù)中進(jìn)行自動(dòng)地抽取。
1.9 ?驗(yàn)證和評(píng)估
本體工程的每個(gè)階段的都該有驗(yàn)證和評(píng)估。在工程過(guò)程之初就該有驗(yàn)證和評(píng)估計(jì)劃,由專門的測(cè)試評(píng)估小組和開(kāi)發(fā)小組配合進(jìn)行評(píng)估和驗(yàn)證工作。驗(yàn)證和評(píng)估計(jì)劃要包含:階段驗(yàn)證目標(biāo)、評(píng)估要達(dá)到的目標(biāo)、驗(yàn)證的方法是工具自動(dòng)還是人工走查、驗(yàn)證結(jié)果的評(píng)估和反饋、再評(píng)估和再驗(yàn)證計(jì)劃等。
2 ?博物館本體設(shè)計(jì)
工程的方法為構(gòu)建好的領(lǐng)域本體提供了工程上的支撐。博物館領(lǐng)域本體的構(gòu)建就是要明確定義博物館領(lǐng)域的術(shù)語(yǔ)以及它們之間的關(guān)系,即主要開(kāi)發(fā)工作內(nèi)容有:用類定義博物館領(lǐng)域內(nèi)的概念;定義這些概念之間的層次關(guān)系;定義屬性和屬性類,為對(duì)象和關(guān)系增加限制;定義實(shí)例并指定它們的屬性值。
2.1 ?本體開(kāi)發(fā)環(huán)境和工具
本體的開(kāi)發(fā)是一項(xiàng)復(fù)雜的工程。設(shè)計(jì)思想先進(jìn)、結(jié)構(gòu)良好的開(kāi)發(fā)環(huán)境對(duì)于本體的開(kāi)發(fā)具有重要意義,本體開(kāi)發(fā)環(huán)境可以按照一定的開(kāi)發(fā)方法輔助本體工程師完成開(kāi)發(fā)工程的各個(gè)環(huán)節(jié),盡量減少本體工程師的工作,分析評(píng)價(jià)本體以減少本體中的錯(cuò)誤。本文的博物館領(lǐng)域本體的開(kāi)發(fā),按照上面介紹的迭代本體工程方法,采用Protégé[7]開(kāi)發(fā)工具和關(guān)系數(shù)據(jù)庫(kù)本體抽取工具RoBridge[8]來(lái)開(kāi)發(fā)。
2.2 ?博物館領(lǐng)域本體
從《博物館藏品信息指標(biāo)體系規(guī)范(試行)》[9]中的3個(gè)指標(biāo)群、33個(gè)指標(biāo)集、139個(gè)指標(biāo)項(xiàng)中初步抽取出175個(gè)概念,從需求分析文檔中手工提取了108個(gè)概念。把概念進(jìn)行工程化處理后定義了237個(gè)類,其中非物質(zhì)信息相關(guān)的類119個(gè);從規(guī)范指標(biāo)體系文檔中抽取,指標(biāo)項(xiàng)基本可以表示成指標(biāo)集的屬性,指標(biāo)群和指標(biāo)集是包含關(guān)系,直接抽取屬性189個(gè);從需求文檔中抽取動(dòng)詞、形容詞、數(shù)量關(guān)系詞等獲得屬性500多個(gè)。
根據(jù)類和屬性可以建立語(yǔ)義圖,其中的非物質(zhì)信息的語(yǔ)義圖片段如圖1所示,矩形表示復(fù)合概念,橢圓表示原子概念,箭頭表示關(guān)系,標(biāo)記的文字表示類名、關(guān)系名和屬性名。
限制反映了領(lǐng)域規(guī)則,通過(guò)分析逐步定義了89條限制,規(guī)則會(huì)隨著開(kāi)發(fā)過(guò)程的迭代逐漸增多,數(shù)量也逐漸穩(wěn)定下來(lái)。如:書(shū)畫(huà)有款識(shí);有的瓷器有款識(shí);有的瓷器有文字和款識(shí);有的青銅器有文字;只有出土文物有出土地和出土日期等等。藏品信息知識(shí)化模型的應(yīng)用過(guò)程,就是本體概念模型的實(shí)例化過(guò)程。根據(jù)定義好的模型,先把各個(gè)概念的實(shí)例遞增地逐個(gè)定義,如某博物館的瓷器藏品為2709件,就會(huì)定義2709個(gè)藏品的實(shí)例和2709個(gè)藏品信息的實(shí)例;再增加各種關(guān)系實(shí)例,包括對(duì)象關(guān)系和數(shù)據(jù)關(guān)系,這是一個(gè)遞增的過(guò)程;最后通過(guò)推理機(jī)會(huì)自動(dòng)發(fā)現(xiàn)一些新的概念和關(guān)系,也可以加入到知識(shí)庫(kù)中,這也是一個(gè)遞增的過(guò)程。這個(gè)將構(gòu)成知識(shí)庫(kù)的主要部分。本次的工程實(shí)踐中基于具體的一個(gè)博物館共定義了近10萬(wàn)個(gè)藏品實(shí)例和關(guān)系實(shí)例,涵蓋了所有沒(méi)有爭(zhēng)議的博物館藏品的信息,包含了大部分在博物館服務(wù)中高頻率使用的非物質(zhì)信息,包括展陳、交流、傳播、研究等。
3 ?本體存儲(chǔ)和表達(dá)
一種知識(shí)的本體表達(dá)語(yǔ)言可稱為OWL(Ontology Web Language)[10],可以用來(lái)方便地描述上述定義的信息結(jié)構(gòu),即博物館藏品知識(shí)庫(kù),這種規(guī)范的知識(shí)表達(dá)方式有利于知識(shí)的共享和傳播。藏品的物質(zhì)信息目前基本都存儲(chǔ)在關(guān)系數(shù)據(jù)庫(kù)中,第一全國(guó)文物普查之后,這個(gè)數(shù)據(jù)庫(kù)更加規(guī)范和完整了。根據(jù)文獻(xiàn)[8]的方法,可以自動(dòng)地把關(guān)系數(shù)據(jù)庫(kù)的結(jié)構(gòu)和記錄轉(zhuǎn)化成OWL表示,自動(dòng)生成的標(biāo)準(zhǔn)OWL文件,可以直接使用也可以用工具進(jìn)行編輯,這里我們采用工具Protégé來(lái)進(jìn)行編輯。博物館藏品的非物質(zhì)信息利用此工具建立的語(yǔ)義圖,自動(dòng)生成OWL文件,并進(jìn)行一致性和正確性驗(yàn)證。編輯好后的OWL文件以文件的形式存儲(chǔ)在服務(wù)器硬盤上。
4 ?基于本體知識(shí)庫(kù)的信息系統(tǒng)
4.1 ?信息系統(tǒng)體系結(jié)構(gòu)
建立了層次的博物館知識(shí)系統(tǒng)結(jié)構(gòu),如圖2所示。最底層是關(guān)系數(shù)據(jù)庫(kù)和知識(shí)庫(kù)并存的數(shù)據(jù)層,工具模塊R2O[8]會(huì)自動(dòng)地把關(guān)系數(shù)據(jù)庫(kù)的數(shù)據(jù)轉(zhuǎn)換成知識(shí)本體。在計(jì)算層,以知識(shí)推理引擎為核心,為具體的智能應(yīng)用提供知識(shí)和語(yǔ)義檢索服務(wù),同時(shí)知識(shí)管理模塊為管理員用戶提供本體知識(shí)庫(kù)和關(guān)系數(shù)據(jù)庫(kù)到本體轉(zhuǎn)換工具的操縱管理接口。各種基于知識(shí)庫(kù)推理的智能應(yīng)用系統(tǒng)構(gòu)成業(yè)務(wù)應(yīng)用層,普通用戶直接與應(yīng)用層的模塊進(jìn)行交互。
4.2 ?知識(shí)推理和語(yǔ)義檢索
知識(shí)推理和基于知識(shí)的語(yǔ)義檢索,是基礎(chǔ)設(shè)施的核心。Pellet[11]是一個(gè)完全支持OWL的Java語(yǔ)言開(kāi)源推理機(jī),可以方便地和Protégé集成,能嵌入Jena API和OWL API,為開(kāi)發(fā)人員提供了一個(gè)包含從構(gòu)建到推理全過(guò)程的開(kāi)發(fā)環(huán)境。我們的推理引擎建立在Pellet基礎(chǔ)之上,Pellet采用描述邏輯的包含關(guān)系推理作為理論基礎(chǔ),算法采用Tableau算法[12,13]。推理引擎基于OWL API和Pellet API接口向智能應(yīng)用開(kāi)發(fā)者提供基本的本體推理服務(wù)。推理引擎的結(jié)構(gòu)如圖3所示。
OWL API是提供給應(yīng)用開(kāi)發(fā)用戶操作本體文件的標(biāo)準(zhǔn)接口,是一系列函數(shù)的集合,是專門為應(yīng)用平臺(tái)中實(shí)現(xiàn)對(duì)OWL本體進(jìn)行創(chuàng)建、修改、刪除和查詢等操作的應(yīng)用程序接口,它主要包括本體解析器和編寫(xiě)器,推理機(jī)接口等等。其主要過(guò)程為:先創(chuàng)建本體管理器,再創(chuàng)建本體讀寫(xiě)器讀入本體文件,然后調(diào)用推理機(jī)執(zhí)行推理服務(wù),最后給出推理結(jié)果并清理運(yùn)行環(huán)境。
Pellet API是在OWL API的基礎(chǔ)上設(shè)計(jì)的推理機(jī)API,在包括了OWL API的所有推理功能的同時(shí)還提供了有效的屬性層次推理。其工作機(jī)理為:先進(jìn)行本體加載和解析,再進(jìn)行本體的驗(yàn)證或者修復(fù)(預(yù)處理),形成規(guī)則庫(kù)和事實(shí)庫(kù),然后再訪問(wèn)推理機(jī)并實(shí)現(xiàn)推理服務(wù)?;赑ellet API,推理引擎提供的基本推理服務(wù)有四類,各個(gè)服務(wù)都以封裝好的推理引擎的應(yīng)用程序接口形式提供。同時(shí)建立了基于知識(shí)推理的語(yǔ)義檢索機(jī)制。SPARQL[14]是本體結(jié)構(gòu)化查詢語(yǔ)言,我們把檢索關(guān)鍵字都封裝成SPARQL查詢語(yǔ)言來(lái)對(duì)本體進(jìn)行檢索,在檢索前,先進(jìn)行關(guān)鍵字預(yù)處理,把關(guān)鍵字與領(lǐng)域知識(shí)庫(kù)的內(nèi)容和推理結(jié)果進(jìn)行同義詞替換與匹配,擴(kuò)展SPARQL查詢語(yǔ)句,再來(lái)進(jìn)行本體查詢,實(shí)現(xiàn)語(yǔ)義檢索。
4.3 ?智能應(yīng)用系統(tǒng)開(kāi)發(fā)
領(lǐng)域內(nèi)的智能需求是無(wú)限的,基于知識(shí)和推理的可能,應(yīng)用程序也是無(wú)限的,其核心在于智能業(yè)務(wù)分析和對(duì)知識(shí)基礎(chǔ)設(shè)施的理解和應(yīng)用。
4.3.1 ?開(kāi)發(fā)策略
在知識(shí)平臺(tái)上的應(yīng)用開(kāi)發(fā)與傳統(tǒng)基于數(shù)據(jù)庫(kù)的信息系統(tǒng)開(kāi)發(fā)有很大的不同,其開(kāi)發(fā)重點(diǎn)不再是業(yè)務(wù)流程和限制,也不再是數(shù)據(jù)驅(qū)動(dòng),而是知識(shí)驅(qū)動(dòng)的開(kāi)發(fā),以提出問(wèn)題和解答問(wèn)題為中心,更像是一個(gè)問(wèn)答系統(tǒng)?;鹃_(kāi)發(fā)流程包括需求分析、問(wèn)題表達(dá)及期望答案設(shè)計(jì)、問(wèn)題形式化、推理開(kāi)發(fā)、答案解釋和展示等等過(guò)程。其中,問(wèn)題設(shè)計(jì)是一個(gè)把業(yè)務(wù)需求轉(zhuǎn)換成有序問(wèn)題集合的過(guò)程。對(duì)回答的設(shè)計(jì)是推理過(guò)程的一個(gè)人工預(yù)演,并給出預(yù)計(jì)答案的正確形式或可接受形式,也可以作為推理程序的一個(gè)測(cè)試計(jì)劃;而問(wèn)題形式化是指把問(wèn)題表示成SPARQL程序的過(guò)程。例如管理者想了解本館的所有國(guó)家二級(jí)以上的瓷器文物的基本情況,以準(zhǔn)備和兄弟館進(jìn)行一次古代瓷器聯(lián)展??梢詫⑵浞殖蓭讉€(gè)問(wèn)題,本館的所有二級(jí)文物有哪些?哪些是瓷器文物?哪些文物沒(méi)有外展?它們聯(lián)展歷史是什么?最常聯(lián)展文物的美學(xué)和研究情況有哪些?建立一個(gè)簡(jiǎn)單的評(píng)價(jià)瓷器文物參與聯(lián)展推薦程度的規(guī)則;依據(jù)規(guī)則查詢符合要求的文物作為推薦,并給出理由。
4.3.2 ?博物館宣教智能問(wèn)答機(jī)
基于知識(shí)庫(kù)系統(tǒng)開(kāi)發(fā)一個(gè)簡(jiǎn)單的博物館宣教智能問(wèn)答系統(tǒng),使普通參觀者能夠?qū)Σ┪镳^中館藏瓷器相關(guān)的知識(shí)進(jìn)行比較深入的咨詢。問(wèn)答系統(tǒng)的客戶端是基于觸摸屏的,不允許輸入文字,但是可以通過(guò)動(dòng)態(tài)出現(xiàn)的選項(xiàng)來(lái)提示用戶點(diǎn)擊探索進(jìn)一步的知識(shí)。在展示界面,選擇一件瓷器之后,會(huì)出現(xiàn)瓷器的基本介紹,然后在屏幕的右邊會(huì)列舉出一些選項(xiàng)供用戶選擇,如文物等級(jí)、出土情況、文物價(jià)值、文物鑒別、相關(guān)文物等,這些選項(xiàng)是根據(jù)知識(shí)庫(kù)隨機(jī)生成的,而且對(duì)不同的文物,出現(xiàn)的選項(xiàng)是不一樣的。進(jìn)一步選擇之后,再出現(xiàn)不確定的選項(xiàng)供用戶選擇,這個(gè)過(guò)程不斷循環(huán),模擬一個(gè)無(wú)限知識(shí)探索和學(xué)習(xí)的過(guò)程。
實(shí)現(xiàn)這個(gè)系統(tǒng)的基本原理就是,不斷地把用戶的選項(xiàng)組合成問(wèn)題,并把它表示成SPARQL查詢語(yǔ)句,到知識(shí)庫(kù)中查詢,把查詢的結(jié)果的第一項(xiàng)作為結(jié)果展示,從推理結(jié)果的對(duì)象中提取關(guān)聯(lián)度高的關(guān)鍵詞作為這個(gè)頁(yè)面的選項(xiàng)動(dòng)態(tài)生成出來(lái),在結(jié)果界面右側(cè)作為選擇項(xiàng)來(lái)提示用戶進(jìn)一步探索文物知識(shí)。
5 ?結(jié) ?論
本文應(yīng)用本體工程學(xué)的方法探索并建立了博物館領(lǐng)域本體知識(shí)庫(kù),把博物館藏品的非物質(zhì)信息作為重要的領(lǐng)域知識(shí)包含進(jìn)去,為智能博物館的建設(shè)和智能應(yīng)用開(kāi)發(fā)打好了基礎(chǔ)。今后的重點(diǎn)工作有:知識(shí)庫(kù)的管理維護(hù)、完善和擴(kuò)展,知識(shí)庫(kù)上智能應(yīng)用開(kāi)發(fā),問(wèn)題語(yǔ)料庫(kù)的建立等,為智能應(yīng)用快速開(kāi)發(fā)提供強(qiáng)力支撐。
參考文獻(xiàn):
[1] 王建平.論博物館藏品信息管理 [J].中國(guó)博物館,2001(2):82-91.
[2] 宋新潮.關(guān)于智慧博物館體系建設(shè)的思考 [J].中國(guó)博物館,2015,32(2):12-15+41.
[3] Studer R . Knowledge engineering:Principles and methods [J].Data & Knowledge Engineering,1998,25(1-2):161-197.
[4] Clancey,William J. The knowledge level reinterpreted:Modeling how systems interact [J].Machine Learning,1989,4(3-4):285-291.
[5] Morik K. Underlying assumptions of knowledge acquisition and machine learning [J].Knowledge Acquisition,1991,3(2):137-156.
[6] Gruber T R. Toward principles for the design of ontologies used for knowledge sharing? [J].International Journal of Human-Computer Studies,1995,43(5-6):907-928.
[7] Musen M. The Protégé project:A look back and a look forward [J].AI Matters,2015,1(4):4-12.
[8] Yang S,Wu J. Mapping Relational Databases into Ontologies through a Graph-based Formal Model [C]//Sixth International Conference on Semantics. IEEE Computer Society,2010:219-226.
[9] 國(guó)家文物局.博物館藏品信息指標(biāo)體系規(guī)范(試行)(文物博發(fā)[2001]81號(hào)) [S/OL].[2008-07-09].http://www.sach.gov.cn/art/2008/7/9/art_90_2819.html.
[10] Bechhofer S. OWL:Web Ontology Language [J].Encyclopedia of Information Science & Technology Second Edition,2004,63(45):990-996.
[11] Sirin E,Parsia B,Grau B C,et al. Pellet:a practical OWL-DL reasoned [J].Journal of Web Semantics,2007,5(2):51-53.
[12] Horrocks I,Sattler U,Tobies S. Practical Reasoning for Expressive Description Logics [M]// Logic for Programming and Automated Reasoning. Springer Berlin Heidelberg,1999.
[13] Horrocks I. Practical reasoning for very expressive description logics [J].Logic Journal of IGPL,2000,8(3):239-263.
[14] Angles R,Gutierrez C. The Expressive Power of SPARQL [C]//International Semantic Web Conference. Springer,Berlin,Heidelberg,2008:114-129.
作者簡(jiǎn)介:章維亞(1980-),女,漢族,湖北武漢人,碩士,研究方向:智慧博物館、瓷器保管與研究;楊世瀚(1972-),男,漢族,湖北荊門人,博士,研究方向:智能決策、智能信息處理。