楊夏柏 楊明
摘要:隨著語義Web的發(fā)展,基于RDF描述的知識(shí)日益增多,形成了各種各樣的數(shù)字圖書館、知識(shí)庫分布在網(wǎng)絡(luò)上,為了把這些現(xiàn)有的知識(shí)和正在產(chǎn)生的知識(shí)有機(jī)地融合在一起,實(shí)現(xiàn)面向語義Web的知識(shí)融合,本文基于Jena系統(tǒng)研究了面向語義Web的知識(shí)融合的并操作,并基于Jena系統(tǒng)對(duì)知識(shí)融合的并操作進(jìn)行實(shí)現(xiàn)和驗(yàn)證。
Abstract: With the development of semantic Web, the knowledge based on RDF description is increasing, a variety of digital libraries are formed the knowledge bases are distributed on the Internet. In order to organically fuse the existing knowledge and producting knowledge and realize the knowledge fusion for the semantic Web, this paper studies the incorporative operation of knowledge fusion for the semantic Web based on Jena system. And based on the incorporative operation of knowledge fusion by Jena system, the implementation and verification are carried out.
關(guān)鍵詞:語義Web;知識(shí)融合;并操作;RDF;RDFS
Key words: semantic Web;knowledge fusion;incorporative operation;RDF;RDFS
中圖分類號(hào):G719.21 文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):1006-4311(2016)07-0213-02
0 引言
RDF模型和RDFS規(guī)范是W3C的推薦標(biāo)準(zhǔn),基于這個(gè)標(biāo)準(zhǔn)和XML語法建立的資源、信息、知識(shí)越來越多,它們大多以RDF文件的格式描述并存放在網(wǎng)絡(luò)上,廣泛存在于數(shù)字圖書館、知識(shí)庫、本體等中。所以,如何保證一個(gè)RDF文件內(nèi)容、版本等的一致性和正確性是一個(gè)重要的問題,為了研究這個(gè)問題,Sarkar等人[1]提出了對(duì)一個(gè)RDF文件的五種更新操作(Add、InsertAfter、Delete、Remove、Replace),并給出了Add和InsertAfter的操作,這五種更新操作將有助于維護(hù)一個(gè)RDF文件總是處于正確信息狀態(tài)。但是,在RDF資源管理的過程中,如何把多個(gè)RDF文件進(jìn)行知識(shí)的融合是一個(gè)重要的研究問題,解決了兩個(gè)RDF文件之間的知識(shí)融合,就可以實(shí)現(xiàn)多個(gè)RDF文件之間的知識(shí)融合,因?yàn)閮蓛芍R(shí)融合是多個(gè)RDF文件進(jìn)行知識(shí)融合的前提。RDF文件ynu-lnic-3.rdf和ynu-lnic-4.rdf的文件內(nèi)容如圖4所示。圖1是ynu-lnic-3.rdf文件的RDF圖表示形式,圖2是ynu-lnic-4.rdf文件的RDF圖表示形式,兩個(gè)RDF文件在圖上可以明顯的看到有相同的知識(shí)和不同的知識(shí),如何把這兩個(gè)文件中相同的知識(shí)提取出來,不同的知識(shí)合并在一起,這是一個(gè)很值得研究的知識(shí)融合問題。本文以圖1和圖2為例,研究?jī)蓚€(gè)圖的并操作。圖3是ynu-lnic-3.rdf文件和ynu-lnic-4.rdf文件合并后的結(jié)果。
1 基于Jena系統(tǒng)開發(fā)環(huán)境的搭建
Jena是HP實(shí)驗(yàn)室開發(fā)的一個(gè)用來處理語義Web架構(gòu)的Java工具包[2][3],本文使用的版本是Jena2.1系統(tǒng)(以下簡(jiǎn)稱Jena)。Jena把RDF圖作為它的核心,在其外圍建立其他組件,Jena為語義Web研究提供了一個(gè)RDF平臺(tái)。Jena根據(jù)RDF模型和RDFS語法規(guī)范提供建立和操作RDF圖的Java API,支持集合的并、交、差操作。
jena系統(tǒng)的開放源碼包括jena.jar,xercesImpl.jar, xml-apis.jar,icu4j.jar,concurrent.jar, jakarta-oro-2.0.5.jar,antlr.jar,junit.jar,commons-logging.jar,log4j-1.2.7.jar, rdf-api-2001-01-19.jar共11個(gè)程序包,本論文用到的包主要是jena.jar。
用小穎Java源代碼反編譯專家V1.30中的“目錄級(jí)反編譯操作”反編譯Jena2.1系統(tǒng)中l(wèi)ib文件夾中的上述11個(gè)java包,就可以獲得Jena2.1系統(tǒng)源程序代碼。
知識(shí)融合的界面實(shí)現(xiàn)使用了Jcreate pro2.5、JbuilderX和Togerther6.1工具。Togerther6.1工具用來分析Jena系統(tǒng)的類圖(UML圖),JbuilderX配合Togerther6.1打開Jena系統(tǒng)的源程序代碼。
安裝Java sdk1.4.0和Jcreator Pro250,把Jena2.1系統(tǒng)中Lib下的11個(gè)jar包添加到Jcreator Pro250開發(fā)環(huán)境下。然后在Jcreator Pro250開發(fā)環(huán)境下設(shè)計(jì)知識(shí)融合的操作界面和編寫程序代碼。
2 兩個(gè)RDF文件知識(shí)融合的界面設(shè)計(jì)及實(shí)現(xiàn)
知識(shí)融合的界面設(shè)計(jì)如圖4所示,整個(gè)界面設(shè)計(jì)分上中下三個(gè)部分,上面部分和中間部分的設(shè)計(jì)相同,都是由一個(gè)命令按鈕和文本框組成,命令按鈕的功能負(fù)責(zé)從“打開文件對(duì)話框”中選擇一個(gè)RDF文件;文本框的功能負(fù)責(zé)顯示用命令按鈕打開的文件。這樣就可以把兩個(gè)RDF文件分別打開并顯示在兩個(gè)文本框中。下面部分由一個(gè)文本框和六個(gè)命令按鈕組成。合并預(yù)覽按鈕負(fù)責(zé)實(shí)現(xiàn)知識(shí)融合的并操作并把結(jié)果顯示在文本框中,合并導(dǎo)出按鈕負(fù)責(zé)把合并結(jié)果導(dǎo)出到文件系統(tǒng)的存儲(chǔ)介質(zhì)上。筆者基于Jena系統(tǒng)提供的Java API實(shí)現(xiàn)了知識(shí)融合的并操作(源程序代碼略)。圖4是RDF文件lnic-ynu-3.rdf和RDF文件lnic-ynu-4.rdf并操作的運(yùn)行結(jié)果顯示(用默認(rèn)輸出格式"RDF/XML-ABBREV")。
3 知識(shí)融合結(jié)果在線驗(yàn)證
為了驗(yàn)證知識(shí)融合結(jié)果是否正確,我們把通過可視化界面導(dǎo)出的RDF文件分別上傳到Experimental RDF Visualizer在線RDF解析器,解析結(jié)果表明我們的實(shí)現(xiàn)是正確的。
Experimental RDF Visualizer解析器是HP實(shí)驗(yàn)室開發(fā)的一個(gè)實(shí)驗(yàn)性RDF圖可視化器,用戶使用時(shí)需要自己搭建運(yùn)行環(huán)境。該解析器由五個(gè)Java程序文件組成:Analyzed Graph.java,NodeToSVG.java,ModelTo-SVG.java,Http VisualizeHandler.java, Http VisualizeServer.java。編譯和運(yùn)行該解析器需要的其它軟件有:
①Sun's Java SDK, version 1.4.1,下載網(wǎng)址為http://java.sun.com;②The Jetty HTTP Server,version 4.2.1,下載網(wǎng)址為http://jetty.mortbay.org;③The Jena RDF Library,version 2.1,下載網(wǎng)址為http://jena.sourceforge.net。
運(yùn)行的步驟:
①在Jcreator Pro250下運(yùn)行HttpVisualize Server.java,按提示輸入*.rdf,*.n3, *.owl文件所在的路徑,系統(tǒng)開始在DOS界面下檢測(cè)提供路徑的文件,正常后自動(dòng)啟動(dòng)遠(yuǎn)程服務(wù)器;②切換到IE瀏覽器,在地址欄輸入http://localhost:8181/visualize即可查看RDF文件夾中的RDF文件的RDF圖。
圖5是用Experimental RDF Visualizer解析器顯示的并操作結(jié)果,參與知識(shí)融合的源文件是RDF文件lnic-ynu-3.rdf和lnic-ynu-4.rdf,融合的結(jié)果文件是lnic-ynu-3-4-union.rdf。
4 結(jié)束語
基于Jena系統(tǒng)的知識(shí)融合技術(shù)研究包含的內(nèi)容很多,本文基于Jena系統(tǒng)實(shí)現(xiàn)了知識(shí)融合的并操作,下一步將基于Jena系統(tǒng)對(duì)知識(shí)的交、差操作進(jìn)行研究。
參考文獻(xiàn):
[1]Sarkar,S,Ellis,H,F(xiàn)ive Update Operations for RDF, RH-DOES-TR 03-04, September 2003.
[2]http://jena.sourceforge.net.
[3]http://www.hpl.hp.com.