〔摘 要〕傳統(tǒng)的知識管理工具、系統(tǒng)往往只側(cè)重知識管理的某一個(gè)方面,難以形成一個(gè)集成化的整體知識解決方案。本文提出了一種新的基于XML的面向集成的知識管理系統(tǒng),該系統(tǒng)能夠通過集成現(xiàn)有的各種知識管理工具構(gòu)建符合實(shí)際需求的知識管理平臺。通過XML相關(guān)技術(shù)將知識的獲取、存儲、交流、展示等集成到一個(gè)統(tǒng)一的體系當(dāng)中,同時(shí)在知識管理的各個(gè)環(huán)節(jié)提供相應(yīng)的XML文檔接口用于集成現(xiàn)有的知識管理工具。
〔關(guān)鍵詞〕知識管理;知識管理系統(tǒng);XML;面向集成
〔中圖分類號〕G35 〔文獻(xiàn)標(biāo)識碼〕B 〔文章編號〕1008-0821(2009)04-0210-04
XML-based Integrating-Oriented Knowledge Management System PlatformQiu Zhijun1,2Deng Yong2
(1.Graduate School of the Chinese Academy of Sciences,Beijing 100049,China;
2.Chengdu Branch,National Science Library of Chinese Academy of Sciences,Beijing 100049,China)
〔Abstract〕Traditional knowledge management tools and system often only focus on one special aspect,so its difficult to integrate them into a whole knowledge solution.This paper proposes the concept of XML-based integrating-oriented knowledge management system.This system can integrate kinds of existing knowledge management tools to construct knowledge management platform on demand.Thanks to XML relative skills,its possible to integrate knowledge acquisition,storage,communication,and display into a union architecture.
〔Key words〕knowledge management;XML;Integrating-Oriented
1 知識管理系統(tǒng)
知識管理是通過一組問答序列,即解決方案的集合尋找和識別與問題有關(guān)的關(guān)鍵性信息,并將這些信息進(jìn)行提取,形成對某一問題的專門知識,作為決策的依據(jù)。知識庫是企業(yè)知識管理系統(tǒng)的核心,它按照一定的知識表示方法,如基于規(guī)則的知識表示、基于邏輯的知識表示、基于語意網(wǎng)絡(luò)的知識表示等,集中存放關(guān)于企業(yè)內(nèi)部各專業(yè)領(lǐng)域的知識和與企業(yè)有關(guān)的外部環(huán)境的相關(guān)知識。
知識庫管理系統(tǒng)是管理知識庫的一組軟件,包括知識發(fā)現(xiàn)獲取系統(tǒng)、知識儲存分類系統(tǒng)和知識創(chuàng)新利用系統(tǒng),主要實(shí)現(xiàn)企業(yè)知識的獲取、儲存、分類、搜索等功能。知識可分為外顯知識和內(nèi)隱知識。在知識庫管理系統(tǒng)中,企業(yè)的外顯知識主要來源于業(yè)務(wù)數(shù)據(jù)倉庫,是由企業(yè)信息管理系統(tǒng)收集、傳遞、儲存、加工、維護(hù)和使用的數(shù)據(jù)或文件等信息,也有部分來源于知識專家的總結(jié)、歸納及知識管理人員由知識互動系統(tǒng)中的提取。企業(yè)的內(nèi)隱知識則主要來源于知識互動系統(tǒng)。
對于知識管理系統(tǒng)(KMS)目前還沒有統(tǒng)一的定義,學(xué)者各自基于其對知識管理的認(rèn)識提出了一系列的不同觀點(diǎn),大體上可以分為兩種觀點(diǎn):(1)技術(shù)與工具觀,(2)系統(tǒng)觀。技術(shù)與工具觀認(rèn)為KMS是實(shí)現(xiàn)知識管理的工具、知識管理技術(shù)或知識管理系統(tǒng)軟件,或上述幾項(xiàng)的集合,也可以稱之為狹義的知識管理系統(tǒng)觀。系統(tǒng)觀將系統(tǒng)的觀點(diǎn)引入知識管理的研究中,認(rèn)為KMS不僅僅是工具、技術(shù)和軟件等的集合,而是將知識管理的幾個(gè)要素如:技術(shù)、企業(yè)文化、人和知識運(yùn)動的過程等集成考慮的綜合系統(tǒng),也可稱之為廣義的知識管理系統(tǒng)觀。
2 XML和XML Schema
XML(eXtensible Markup Language)意為可擴(kuò)展標(biāo)記語言,它包含了一組定義語義標(biāo)記的規(guī)則,可以定義特定領(lǐng)域內(nèi)標(biāo)記語言的語法結(jié)構(gòu)。作為元標(biāo)記語言,XML允許開發(fā)者生成自己需要的標(biāo)記,這就使得標(biāo)記的含義可以很靈活,可以滿足不同開發(fā)者的需求。XML Schema則是W3C XML模式工作組創(chuàng)建的模式語言,是當(dāng)前創(chuàng)建特定領(lǐng)域內(nèi)標(biāo)記的兩種主要方式之一。
Schema與XML是緊耦合的,用于協(xié)作完成具有一定語義表示能力的結(jié)構(gòu)化的XML文檔,二者之間的關(guān)系如圖1所示。圖中,XML規(guī)范定義了用于描述標(biāo)記語言必須遵循的元語法結(jié)構(gòu),它描述的是底層語法結(jié)構(gòu)的規(guī)則。如何區(qū)分標(biāo)記和內(nèi)容,如何將屬性附加到元素上之類的規(guī)則,而不是描述這些標(biāo)記、元素和屬性是什么或者它們的含義是什么。Schema規(guī)范則主要用于描述XML文檔中的標(biāo)記、元素和屬性是什么,或者它們的含義是什么以及必須遵循什么樣的約束等,即用Schema模式語言描寫的模式文檔(一個(gè)模式文檔即定義了特定領(lǐng)域的一種具體標(biāo)記語言,又可稱為詞匯表或XML應(yīng)用)定義了可用在XML文檔中的元素、屬性、實(shí)體和標(biāo)記的表示方法,以及這些內(nèi)容之間可能的相互關(guān)系,它描述的是一種語義結(jié)構(gòu)。同時(shí),書寫模式文檔本身的元語法結(jié)構(gòu)遵循的是XML規(guī)范,即模式文檔本身也是一個(gè)XML文檔,只是該XML文檔所用的標(biāo)記是由Schema模式規(guī)范定義的而已。
3 基于XML的面向集成知識管理框架
3.1 國內(nèi)外研究
國內(nèi)學(xué)者李克胐在2001年提出了一種基于XML的知識管理系統(tǒng)模型。該模型由智能代理、多文檔轉(zhuǎn)化接口、內(nèi)容管理、知識發(fā)布與共享工作流協(xié)同、決策支持、XML與數(shù)據(jù)庫接口、知識管理數(shù)據(jù)庫8部分構(gòu)成。基于XML的知識管理系統(tǒng)與其他知識管理系統(tǒng)相比,具有如下優(yōu)勢:統(tǒng)一、良好的文檔結(jié)構(gòu);易于統(tǒng)一存儲,便于分類管理;采用Web瀏覽器;通過XML在Web上實(shí)現(xiàn)知識發(fā)布與共享;具有基于元數(shù)據(jù)的快速搜索,檢索效率高的特點(diǎn);能較好地實(shí)現(xiàn)異構(gòu)系統(tǒng)的傳遞;具有技術(shù)上的先進(jìn)性,代表未來的發(fā)展方向。由于基于XML知識管理系統(tǒng)的這一系列優(yōu)點(diǎn),國內(nèi)外學(xué)者、研究人員對基于XML知識管理系統(tǒng)的研究日益深入。
在國內(nèi),比較有代表性的是中國科學(xué)院計(jì)算技術(shù)研究所智能科學(xué)實(shí)驗(yàn)室研制的知識管理系統(tǒng)KMSphere。KMSphere系統(tǒng)主要采用OWL、RDF、語義網(wǎng)等XML技術(shù)作為知識的表達(dá)、存儲、展現(xiàn)基礎(chǔ),并提供通過本體的相應(yīng)推理機(jī)制,從現(xiàn)有信息、文獻(xiàn)中自動挖掘出相關(guān)知識的機(jī)制,大大簡化了知識本體的構(gòu)建。
在國外,早在2000年初,德國GMD-IPSI(德國國家信息技術(shù)研究中心集成出版和信息系統(tǒng)研究所)的研究小組,聯(lián)合西班牙、法國、奧地利等國的研究機(jī)構(gòu),開發(fā)了XML-KM(IST-12030)系統(tǒng)。圖2就是經(jīng)過了簡化的XML-KM(IST-12030)系統(tǒng)結(jié)構(gòu)。可以看出,信息的采集(集成)、知識的發(fā)現(xiàn)和抽取、知識的發(fā)布,3個(gè)層次較為分明地體現(xiàn)在系統(tǒng)中。該結(jié)構(gòu)基本概括了以XML為基礎(chǔ)的知識管理系統(tǒng)的主要內(nèi)容,因此在業(yè)界有著一定的影響,在一段時(shí)間以來成為研發(fā)知識管理系統(tǒng)的重要參考。
最近幾年,由于XML技術(shù)的發(fā)展、成熟,涌現(xiàn)出一批成功的商用XML知識管理系統(tǒng)(主要針對企業(yè)用戶)。國外的有,加拿大的IXIASOFT公司在北美市場推出的相關(guān)知識管理產(chǎn)品,美國IPEDO公司在美國和亞太地區(qū)推出的KCP(知識協(xié)同平臺)產(chǎn)品,國內(nèi)的產(chǎn)品中,較有代表性的有長沙麓谷數(shù)碼科技公司的基于 XML的企業(yè)協(xié)同工作與知識管理平臺。圖3顯示了當(dāng)前商用XML知識管理系統(tǒng)的基本框架。
這些商用基于XML知識管理系統(tǒng)的特點(diǎn)主要有:(1)異構(gòu)數(shù)據(jù)源的集成:通過各種適配器集成各種數(shù)據(jù)源。(3)知識建模和整理加工:應(yīng)用在XML數(shù)據(jù)庫基礎(chǔ)上的知識建模和知識發(fā)現(xiàn)過程,大量應(yīng)用了XML相關(guān)技術(shù)、規(guī)范。(3)企業(yè)級應(yīng)用的中間件組件庫。(4)基于XML的門戶系統(tǒng):一個(gè)企業(yè)或單位的XML知識管理系統(tǒng)的統(tǒng)一對外窗口就是門戶(Portal)系統(tǒng),門戶中集成了各種形式的知識展現(xiàn)形式。本文關(guān)注XML知識管理系統(tǒng)對外圍應(yīng)用的集成,為構(gòu)建可適應(yīng)性知識管理平臺提供保證。
3.2 基于XML面向集成的知識管理系統(tǒng)
知識管理的核心在于知識表示和知識庫的創(chuàng)建,通過對當(dāng)前基于XML知識管理系統(tǒng)的調(diào)研,可以發(fā)現(xiàn)它們都存在一個(gè)集中的知識庫和一個(gè)統(tǒng)一的知識表示形式。本文創(chuàng)新性的提出構(gòu)建一個(gè)知識管理框架,用以集成現(xiàn)有應(yīng)用,如Xwiki這樣的wiki系統(tǒng),這樣新的系統(tǒng)在獲得穩(wěn)定性的同時(shí)能夠隨知識管理的需求不斷擴(kuò)展。面向集成的知識管理系統(tǒng)只需要關(guān)注知識管理的核心功能——知識表示、知識庫,并通過提供XML文檔形式的集成入口提供外圍系統(tǒng)集成。
3.2.1 基于XML的知識表示
在XML中,數(shù)據(jù)對象使用元素描述,而數(shù)據(jù)對象的屬性可以描述為元素的子元素或元素的屬性。XML文檔由若干個(gè)元素構(gòu)成,數(shù)據(jù)間的關(guān)系通過父元素與子元素的嵌套形式體現(xiàn)。在基于XML的知識表示過程中,采用XML的DTD來定義一個(gè)知識表示方法的語法系統(tǒng),通過定制XML應(yīng)用來解釋實(shí)例化的知識表示文檔(圖4)。
3.2.2 基于XML數(shù)據(jù)庫的知識庫
近兩年來,隨著XML數(shù)據(jù)庫技術(shù)的不斷發(fā)展和成熟,基于XML的知識管理系統(tǒng)的研發(fā)和推廣日益深入。知識管理中初始文檔大多是半結(jié)構(gòu)化和非結(jié)構(gòu)化的文檔,例如Word格式、E-mail、Web頁等,而對于半結(jié)構(gòu)化的知識表示,XML是一種很好的描述語言。在對知識管理系統(tǒng)中的知識進(jìn)行表示時(shí),一方面要考慮用戶的習(xí)慣和差異性,另一方面要考慮到知識源的多樣性和對已有系統(tǒng)的利用。而XML技術(shù)的諸多特點(diǎn)適用于知識管理系統(tǒng)中知識的表達(dá)、集成與傳播,為分布、異構(gòu)的軟硬件環(huán)境下的知識管理提供了一個(gè)全新的思路。在知識利用過程中,通過維護(hù)數(shù)據(jù)字典和XML解析程序把特定標(biāo)簽所標(biāo)注的內(nèi)容解析出來,以“標(biāo)簽”+“內(nèi)容”的格式表示出具體的知識內(nèi)容。知識表示是構(gòu)建知識庫的關(guān)鍵,知識表示方法選取得合適與否不僅關(guān)系到知識庫中知識的有效存貯,而且也直接影響著系統(tǒng)的知識推理效率和對新知識的獲取能力,圖5中給出了基于XML的知識庫的創(chuàng)建過程。
3.2.3 基于XML的知識集成
在對知識管理系統(tǒng)中的知識進(jìn)行表示時(shí),一方面要考慮用戶的習(xí)慣和差異性,另一方面要考慮到知識源的多樣性和對已有系統(tǒng)的利用。而XML技術(shù)的諸多特點(diǎn)適用于知識管理系統(tǒng)中知識的表達(dá)、集成與傳播,為分布、異構(gòu)的軟硬件環(huán)境下的知識管理提供了一個(gè)全新的思路。因此,一個(gè)面形集成的知識管理系統(tǒng)的核心在于建立一個(gè)統(tǒng)一的基于XML的知識表示,和通過各種適配器將各種來源的數(shù)據(jù)統(tǒng)一轉(zhuǎn)化成特定模式并構(gòu)建出一個(gè)中央知識庫。圖6給出了基于XML的知識集成過程:
3.3 系統(tǒng)總體架構(gòu)方案
在解決了底層的知識表示、和知識庫的構(gòu)建問題后,本論文提出一個(gè)更高層的系統(tǒng)總體架構(gòu)形式。如圖7所示,新的系統(tǒng)架構(gòu)將主要包括以下4個(gè)模塊:
(1)知識集成模塊設(shè)計(jì)
(2)知識存儲(知識庫)模塊設(shè)計(jì)
(3)知識表示模塊設(shè)計(jì)
(4)上層應(yīng)用基礎(chǔ)接口API
在集成層我們采用了靈活的注冊數(shù)據(jù)源提供模式,只要針對特定的數(shù)據(jù)源格式做相應(yīng)的適配即可實(shí)現(xiàn)知識的有效集成,同時(shí)由于遵循一致的知識表示形式,使得知識的利用也極為方便。
4 在面向集成知識管理系統(tǒng)中集成常見的Web2.0工具范例Web2.0是涵蓋Blog(博客,包含聲音、文字、圖像、視頻、讓個(gè)人成為主體)、Wiki(維基)、RSS(簡易聚合)、Tag(分類分眾標(biāo)簽)、Social Bookmark(網(wǎng)摘)、SNS(社會性網(wǎng)絡(luò)系統(tǒng))等應(yīng)用元素以及XML-RPC、Web Service、開放式APIs(開放式應(yīng)用程序接口)、Folksonomy等技術(shù)范式,圍繞用戶參與、共享與協(xié)同而實(shí)現(xiàn)的新一代互聯(lián)網(wǎng)模式。本論文選取開源wiki系統(tǒng)Xwiki為集成研究示例。
Wiki指一種超文本系統(tǒng)。這種超文本系統(tǒng)支持面向社群的協(xié)作式寫作,同時(shí)也包括一組支持這種寫作的輔助工具。我們可以在Web的基礎(chǔ)上對Wiki文本進(jìn)行瀏覽、創(chuàng)建、更改,而且創(chuàng)建、更改、發(fā)布的代價(jià)遠(yuǎn)比HTML文本要?。煌瑫r(shí)Wiki系統(tǒng)還支持面向社群的協(xié)作式寫作,為協(xié)作式寫作提供必要幫助;最后,Wiki的寫作者自然構(gòu)成了一個(gè)社群,Wiki系統(tǒng)為這個(gè)社群提供簡單的交流工具。與其它超文本系統(tǒng)相比,Wiki有使用方便及開放的特點(diǎn),所以Wiki系統(tǒng)可以幫助我們在一個(gè)社群內(nèi)共享某領(lǐng)域的知識。XWiki是一個(gè)強(qiáng)大的Java開源的Wiki引擎。它支持一些受歡迎的特性如:(1)內(nèi)容管理;(2)版本控制;(3)全文本搜索;(4)RSS輸出與顯示外部的RSS feeds;(5)提供XML/RPC的API;(6)WYSIWYG HTML編輯器等。
由于Xwiki提供RSS輸出功能,因此我們可以很容易的將Xwiki集成到我們的知識管理系統(tǒng)中。如圖8所示,通過構(gòu)建適當(dāng)?shù)腦SLT轉(zhuǎn)換程序我們就能將采集到的RSS裝換成系統(tǒng)內(nèi)部的基于特定XML Schema的知識表示形式,然后存儲到XML知識庫實(shí)現(xiàn)Xwiki數(shù)據(jù)源的集成。
5 結(jié) 語
本論文通過基于XML的知識表示的核心概念,實(shí)現(xiàn)了一個(gè)知識管理的基礎(chǔ)平臺,該平臺僅關(guān)注知識管理中最核心的知識表示和知識存儲功能。通過給該平臺提供一個(gè)統(tǒng)一的數(shù)據(jù)源適配集成層,實(shí)現(xiàn)平臺同各種外圍數(shù)據(jù)源的有效集成。最后本文給出了一個(gè)集成Xwiki系統(tǒng)的集成范例。面向集成使得我們能夠從特定領(lǐng)域的細(xì)節(jié)中解脫出來,為構(gòu)建一個(gè)通用的知識管理框架提供了基礎(chǔ)。同時(shí),由于框
架本身的抽象性,系統(tǒng)獲得了更大的適應(yīng)性,能夠適應(yīng)各種特殊的復(fù)雜應(yīng)用環(huán)境。
參考文獻(xiàn)
[1]邱均平,段宇鋒.論知識管理與信息管理[J].中國圖書館學(xué)報(bào),1999,(6):12-18.
[2]王玨,袁小紅,等.關(guān)于知識表示的討論[J].計(jì)算機(jī)學(xué)報(bào),1995,18(3):212-224.
[3]吳勝,劉玉.基于XML知識管理的研究[J].福建電腦,2003,(11):9-11.
[4]鮑軍鵬,等.基于XML的知識融合與知識庫組織[J].計(jì)算機(jī)工程,2003,29(3):56-57.
[5]鄢珞青.知識庫的知識表達(dá)方式探討[J].情報(bào)雜志,2003,(4):63-64.