李 雷,張亞茹
(1西安醫(yī)學(xué)院圖書館,陜西 西安 710021;2.中國(guó)人民解放軍第451醫(yī)院,陜西 西安 710054)
知識(shí)組織并非脫離了信息組織而存在,而是信息組織發(fā)展到一定階段的產(chǎn)物。知識(shí)組織工具對(duì)自然語言的控制大致用兩種方式,一是建立知識(shí)結(jié)構(gòu),二是控制詞匯,用戶能夠以最簡(jiǎn)單、快捷的方式獲得所有符合需求的相關(guān)文獻(xiàn)資源。從廣義上來說,凡是對(duì)自然語言進(jìn)行了控制并有利于提高檢索效率的工具,無論其控制范圍、控制手段及類表的規(guī)模程度,都可以統(tǒng)稱為知識(shí)組織工具。
知識(shí)組織(Knowledge Organization,簡(jiǎn)稱KO)是在圖書館學(xué)、情報(bào)學(xué)的分類系統(tǒng)和敘詞表研究的基礎(chǔ)上發(fā)展起來的。知識(shí)組織的目標(biāo)是序化知識(shí),從而提供知識(shí)?!爸R(shí)組織”一詞,1929年由美國(guó)著名圖書館學(xué)家、分類法專家布利斯在其著作《知識(shí)組織和科學(xué)系統(tǒng)》、《圖書館的知識(shí)組織》中首先提出來的。著名圖書館學(xué)家謝拉也分別于1965年和1966年出版了《圖書館與知識(shí)組織》、《文獻(xiàn)與知識(shí)組織》兩部論著,對(duì)圖書館的知識(shí)組織表現(xiàn)及作用進(jìn)行了初步研究。1989年在德國(guó)法蘭克福成立了“國(guó)際知識(shí)組織協(xié)會(huì)”(ISKO),并多次以知識(shí)組織為主題召開學(xué)術(shù)研討會(huì),對(duì)知識(shí)組織的各個(gè)領(lǐng)域進(jìn)行深入探討。1993年,《國(guó)際分類法》期刊改名為《知識(shí)組織》,專門刊載有關(guān)知識(shí)組織的研究成果。在我國(guó),對(duì)知識(shí)組織的研究歷史并不長(zhǎng),所以其理論與方法體系均不成熟。也正因?yàn)榇?,目前?duì)知識(shí)組織問題的研究是當(dāng)前圖書情報(bào)界的一個(gè)熱點(diǎn)問題。
知識(shí)組織工具,也稱知識(shí)組織系統(tǒng)或者知識(shí)組織體系(Knowledge Organization Systems,簡(jiǎn)稱KOS),是目前國(guó)內(nèi)外研究的熱點(diǎn)。知識(shí)組織系統(tǒng)是各種對(duì)人類知識(shí)結(jié)構(gòu)進(jìn)行表達(dá)和有組織的闡述的語義工具(Semantic Tools)的統(tǒng)稱。包括傳統(tǒng)圖書館建立在文獻(xiàn)單元基礎(chǔ)上的分類法、標(biāo)題表、敘詞表以及更泛指的情報(bào)檢索語言、標(biāo)引語言,也包括網(wǎng)絡(luò)時(shí)代建立在概念單元或只是單元基礎(chǔ)上的概念地圖(Concept-Maps)、語義網(wǎng)(Semantic Networks)、概念本體(Ontologies)等。知識(shí)組織系統(tǒng)的功能主要通過對(duì)信息資源的組織、檢索與導(dǎo)航,發(fā)揮用戶與信息資源間的中介作用。知識(shí)組織已經(jīng)成為信息科學(xué)中一個(gè)重要的研究領(lǐng)域,一些重要的國(guó)際會(huì)議都針對(duì)知識(shí)組織領(lǐng)域成立了專門工作組。如國(guó)際數(shù)字圖書館聯(lián)合會(huì)議(JCDL)、歐洲數(shù)字圖書館會(huì)議(ECDL)、都柏林核心與元數(shù)據(jù)應(yīng)用國(guó)際會(huì)議(DCMA)等。從歷次會(huì)議的研究主題來看,分類表、敘詞表及知識(shí)本體等成為該領(lǐng)域的研究熱點(diǎn)。
分類表是以組織人類知識(shí)資源即圖書館館藏資源為主要目的,是一種根據(jù)資源內(nèi)容屬性對(duì)資源進(jìn)行分門別類、系統(tǒng)地組織和揭示的方法。其主要特征是覆蓋人類全部知識(shí)門類、帶有標(biāo)記符號(hào)和使用復(fù)雜。分類表強(qiáng)調(diào)的是概念之間的層級(jí)聚合與類別體系。
分類表在網(wǎng)絡(luò)環(huán)境下的發(fā)展主要表現(xiàn)為類表電子化、組織網(wǎng)絡(luò)資源、提供新的用途等。分類表的電子化,一是有利于使用,可直接檢索相關(guān)類目,類表和類目之間可以超文本進(jìn)行橫向鏈接,類表的體積問題不再引人關(guān)注。二是有利于與其他類表兼容,從而同時(shí)使用,也有利于類表更新。圖書分類表用于組織網(wǎng)絡(luò)資源并提供資源的瀏覽雖取得了不少進(jìn)展,但是必然會(huì)有一定的局限性,主要還是受限于圖書分類表的知識(shí)結(jié)構(gòu)。網(wǎng)絡(luò)資源表現(xiàn)出更多的靈活性和多元化,除了用來直接組織網(wǎng)絡(luò)資源外,還具有作為知識(shí)庫(kù)、結(jié)構(gòu)庫(kù)來編制新的知識(shí)組織工具的潛能。如機(jī)構(gòu)Taxonomy的編制。
網(wǎng)絡(luò)化的敘詞表聯(lián)機(jī)顯示是敘詞表在網(wǎng)絡(luò)環(huán)境下應(yīng)用的主要形式之一。我們可將應(yīng)用于網(wǎng)絡(luò)信息組織的敘詞表歸納為兩種類型:一是僅供選擇詞匯使用,獨(dú)立于檢索系統(tǒng)之外,通過選定的檢索詞作為檢索入口詞,不直接鏈接資源。二是敘詞表嵌入在檢索系統(tǒng)之中,作為檢索系統(tǒng)的一部分,直接使用選中詞鏈接相關(guān)資源。這種方法更符合用戶查找資源的易用性和便利性需求。網(wǎng)絡(luò)環(huán)境下敘詞表的作用可以提供超文本導(dǎo)航,輔助用戶檢索,減少用戶選擇檢索詞的負(fù)擔(dān),從而提高檢索效率。
網(wǎng)絡(luò)技術(shù)的出現(xiàn)使得網(wǎng)絡(luò)直接出版和使用的敘詞表越來越多,敘詞表由標(biāo)引工具逐漸發(fā)展為一種檢索工具,成為網(wǎng)絡(luò)版數(shù)據(jù)庫(kù)檢索和元數(shù)據(jù)標(biāo)引中不可缺少的一部分。與圖書分類表一樣,敘詞表也用來組織網(wǎng)絡(luò)資源,可以用來作為主題網(wǎng)關(guān)的標(biāo)引詞匯和瀏覽知識(shí)結(jié)構(gòu),還可以用來作為新的知識(shí)組織工具的詞庫(kù)或詞間關(guān)系庫(kù)。比如機(jī)構(gòu)Taxonomy和本體的編制。
Taxonomy作為一種知識(shí)組織工具,由分類結(jié)構(gòu)、概念語詞兩個(gè)元素組成,描述內(nèi)容對(duì)象的概念語詞被組織成一個(gè)等級(jí)結(jié)構(gòu)。Taxonomy可應(yīng)用于各種環(huán)境和支持各種用途。如檢索提問處理、檢索結(jié)果優(yōu)化、源信息自動(dòng)分類等。但它更常用于企業(yè)、機(jī)構(gòu)的知識(shí)分類和網(wǎng)站的瀏覽、導(dǎo)航。它與企業(yè)的知識(shí)管理、知識(shí)庫(kù)的建設(shè)密切相關(guān),也是網(wǎng)站信息構(gòu)建的重要組成部分。支持瀏覽是Taxonomy的一項(xiàng)重要功能,Taxonomy一詞就是以分類為基本手段支持瀏覽功能的各種工具如主題指南等的統(tǒng)稱體系的依據(jù)。在信息組織領(lǐng)域,Taxonomy特指對(duì)信息對(duì)象的分類組織。
Semantic Web是繼萬維網(wǎng)之后的新一代網(wǎng)絡(luò),體現(xiàn)了一種新的知識(shí)組織方法。Semantic Web又稱語義網(wǎng),是由全球信息網(wǎng)聯(lián)盟的蒂姆·伯納斯-李(Tim buerners-Lee)在1998年提出的一個(gè)概念。其核心是:通過給全球信息網(wǎng)上的文檔(如:HTML)添加能夠被計(jì)算器所理解的語義(Meta data),從而使整個(gè)因特網(wǎng)成為一個(gè)通用的信息交換媒介。語義網(wǎng)是由比現(xiàn)今成熟的網(wǎng)絡(luò)搜索引擎更加行之有效的、更加意義廣泛的,并且自動(dòng)聚集和搜集信息的文檔組成的。Semantic Web和Web 2.0的區(qū)別的是,Semantic Web著重于網(wǎng)絡(luò)本身,體現(xiàn)一種網(wǎng)絡(luò)標(biāo)準(zhǔn)和語言,而Web 2.0更著重于提倡用戶參與的網(wǎng)絡(luò)服務(wù)方式。Semantic Web最基本的元素就是語義聯(lián)結(jié),可以提升萬維網(wǎng)以及其互聯(lián)的資源的可用性和有效性。Semantic Web中的概念意義比我們所理解的傳統(tǒng)知識(shí)組織工具涵蓋的概念要寬泛很多。它是基于知識(shí)點(diǎn)、信息點(diǎn),而不是基于館藏或文獻(xiàn),包括任何可成為知識(shí)點(diǎn)和信息點(diǎn)的概念。Semantic Web之所以能夠?qū)崿F(xiàn)知識(shí)點(diǎn)、信息點(diǎn)之間的鏈接,就是因?yàn)樗峁┝烁拍钪g的關(guān)系。這種關(guān)系比敘詞表中的詞間語義關(guān)系要復(fù)雜很多,一是它表達(dá)了概念之間的具體關(guān)系,而不是籠統(tǒng)的等同、等級(jí)、相關(guān)關(guān)系。其次,它提供的概念之間的關(guān)系是網(wǎng)狀的,從理論上來說,概念和概念之間存在著各種可能的關(guān)系。
Ontology一詞來自于哲學(xué)領(lǐng)域,是對(duì)某一知識(shí)領(lǐng)域的概念化描述和說明。1991年Neches等人將Ontology定義為“給出構(gòu)成相關(guān)領(lǐng)域詞匯的基本術(shù)語和關(guān)系,以及利用這些術(shù)語和關(guān)系構(gòu)成詞匯外延的規(guī)則”。1998年Studer等人提出:“Ontology是共享概念模型的明確的形式化規(guī)范說明?!边@一定義已被多數(shù)人所認(rèn)同。這里包含4層意思:“概念模型”(Conceptualifation)指通過客觀世界中一些現(xiàn)象的相關(guān)概念而得到的模型;“明確”(Explicit)指所使用的概念及其約束都有明確的定義。Ontology可以理解為是Semantic Web理念的具體應(yīng)用和增強(qiáng),和Semantic Web一樣,它包括概念和概念之間的關(guān)系,是計(jì)算機(jī)可理解和操作的。但Ontology對(duì)概念之間關(guān)系展示的方式不同,并增加了其他元素來增強(qiáng)它的用途功能。有專家貼切地將Ontology描述為結(jié)合了Taxonomy和敘詞表的特點(diǎn)。Ontology首先將概念(entities)劃分為類型(classes),在以分類為主干的骨架下,揭示概念之間的關(guān)系。同時(shí) Ontology還包括規(guī)則(rules)和定理(axioms),從而具備了推理的功能。Ontology也被描述為是Taxonomy和推理規(guī)則的結(jié)合。在用途方面,和Taxonomy一樣,Ontology一般針對(duì)某一特定領(lǐng)域或范圍。由于它主要是基于概念的,而不是某一館藏或文獻(xiàn)庫(kù),因而在使用上有了更大的潛力,可用于兼容或整合不同系統(tǒng)。同時(shí)Ontology的推理功能使得它的用途超出了信息檢索的范疇,可用于回答問題、機(jī)器翻譯,企業(yè)模塊化、和數(shù)據(jù)挖掘等。
Topic maps是以圖形方式來展示某一資源庫(kù)的知識(shí)結(jié)構(gòu)從而提供信息的檢索。Topic maps改變了傳統(tǒng)意義上的匹配檢索模式。傳統(tǒng)知識(shí)組織工具主要用于標(biāo)引階段,所包含的知識(shí)結(jié)構(gòu)對(duì)用戶來說,是隱形的。用戶面對(duì)的是一個(gè)輸入界面,為了檢索到理想的信息資源,需要構(gòu)建出合適的、與標(biāo)引詞或符號(hào)相匹配的提問。在對(duì)資源庫(kù)知識(shí)結(jié)構(gòu)一無所知的情況下,圖書分類表和Taxonomies雖然也用于揭示資源庫(kù)的知識(shí)結(jié)構(gòu),但主要是類聚資源、提供資源的瀏覽而不是檢索。而Topic maps揭示信息資源的主題概念,并將主題概念作了鏈接,展示了整個(gè)資源庫(kù)的知識(shí)結(jié)構(gòu),使用戶可以在瀏覽關(guān)于該資源庫(kù)的知識(shí)結(jié)構(gòu)圖的前提下進(jìn)行信息資源的檢索。Semantic Web和Ontology也具備提供該功能的潛力。但由于Topic maps采用了圖形技術(shù),以及在組成上更為簡(jiǎn)單,因而更突出和具有優(yōu)勢(shì)。Topic maps由三個(gè)基本元素組成:主題(topics)、關(guān)系(associations)、鏈接的信息資源(occurrences)。主題也就是概念,可供檢索的信息點(diǎn)、知識(shí)點(diǎn),也是經(jīng)受控的標(biāo)引詞。關(guān)系是不同主題之間的關(guān)系,這種關(guān)系與敘詞表、Semantic Web、Ontology中的詞間語義關(guān)系不同。敘詞表、Semantic Web、Ontology反映的概念之間的關(guān)系是抽象、一般性的,Topic maps中主題之間的關(guān)系是具體的,類似于元數(shù)據(jù)中的關(guān)系型字段,同時(shí),Topic maps還包含其他元素來細(xì)化這三個(gè)基本元素和描述信息資源。
數(shù)字化和網(wǎng)絡(luò)化是新知識(shí)組織工具應(yīng)用于網(wǎng)絡(luò)環(huán)境的前提與基礎(chǔ)。采用數(shù)據(jù)庫(kù)方式存儲(chǔ)和表示,便于對(duì)知識(shí)組織工具的訪問和管理,也便于將其與相應(yīng)的電子資源集成在一起。由于組織對(duì)象的數(shù)字化和網(wǎng)絡(luò)技術(shù)的應(yīng)用,知識(shí)組織工具組織文獻(xiàn)資源的功能在淡化,揭示信息資源內(nèi)容特征的功能在強(qiáng)化。新知識(shí)組織工具主要是基于概念,而不是館藏文獻(xiàn),從而強(qiáng)化了知識(shí)組織工具的應(yīng)用潛力。
標(biāo)準(zhǔn)化是實(shí)現(xiàn)知識(shí)組織工具之間交流與互換的基石。國(guó)際上一直極為重視KOS標(biāo)準(zhǔn)化。2004年W3C發(fā)布的SKOS推薦標(biāo)準(zhǔn),是一個(gè)基于語義網(wǎng)技術(shù)表示受控詞表及其他知識(shí)組織工具的概念框架。它具有簡(jiǎn)潔、靈活、通用、易擴(kuò)展以及與語義網(wǎng)及傳統(tǒng)圖書情報(bào)領(lǐng)域聯(lián)系緊密的特點(diǎn)。對(duì)于促進(jìn)受控詞表在網(wǎng)絡(luò)環(huán)境下的使用有重要意義。
互操作性指的是兩個(gè)或兩個(gè)以上的系統(tǒng)相互使用已被交換信息的能力。就其本質(zhì)而言,互操作性是對(duì)異質(zhì)實(shí)體(包括異種體系結(jié)構(gòu)、異種操作系統(tǒng)、異種網(wǎng)絡(luò)和異種語言等)中可獲得資源的透明調(diào)用的能力。在這一領(lǐng)域當(dāng)前關(guān)注的焦點(diǎn)及發(fā)展趨勢(shì)是將多類型、多語種的知識(shí)組織體系通過相互映射集成整合在一起,并可被用于多個(gè)不同系統(tǒng),實(shí)現(xiàn)異地跨系統(tǒng)的瀏覽與檢索。例如我們所知道的,現(xiàn)在有些工作已經(jīng)可以在Semantic Web和Topic maps之間進(jìn)行互操作。
可視化是圖形可視化工具方式顯示知識(shí)組織系統(tǒng)的結(jié)構(gòu)??梢暬ぞ咧饕ǎ焊拍顖D、思維導(dǎo)圖、認(rèn)知地圖、語義網(wǎng)絡(luò)、思維地圖等。通過圖形可視化的方式展示本體中的網(wǎng)狀結(jié)構(gòu)的知識(shí)。其可視化檢索系統(tǒng)能夠?qū)⒈倔w中的類層次、屬性、實(shí)例等語義關(guān)系以圖形的方式直觀顯示,實(shí)現(xiàn)可視化語義檢索。
傳統(tǒng)的知識(shí)組織工具都采用規(guī)范的科學(xué)語言,針對(duì)某一領(lǐng)域進(jìn)行知識(shí)組織。能夠高效利用這些工具的通常是該領(lǐng)域內(nèi)的專家。而新的知識(shí)組織工具采用更接近人類自身的自然語言來描述知識(shí),將知識(shí)的建設(shè)由某個(gè)專業(yè)領(lǐng)域推廣到更廣闊的社會(huì)范圍,讓更多的人參與到知識(shí)體系的構(gòu)建之中,有效地促進(jìn)知識(shí)資源的共建。
隨著技術(shù)和經(jīng)濟(jì)的發(fā)展,人類對(duì)于世界的認(rèn)識(shí)逐步深入,所掌握的知識(shí)無時(shí)無刻不在發(fā)生變化。為了迎合知識(shí)的動(dòng)態(tài)性,知識(shí)組織工具必須是一個(gè)開放系統(tǒng),可以隨著知識(shí)的改變對(duì)相關(guān)概念進(jìn)行實(shí)時(shí)更新,對(duì)知識(shí)點(diǎn)進(jìn)行添加、刪除和修改。Ontology滿足了這樣的要求。這也是Ontology之所以能夠在知識(shí)組織中得以快速發(fā)展的一個(gè)重要因素。
[1]周寧.信息組織(第二版)[M].武漢:武漢大學(xué)出版,2004:15-20.
[2]司莉.KOS在網(wǎng)絡(luò)信息組織中的應(yīng)用與發(fā)展[M].武漢:武漢大學(xué)出版社,2007:4-13.
[3]司莉,舒欣.國(guó)外網(wǎng)絡(luò)知識(shí)組織系統(tǒng)研究現(xiàn)狀與發(fā)展趨勢(shì)[J].圖書情報(bào)知識(shí),2008(12):82-85.
[4]李景,錢平.敘詞表與本體的區(qū)別與聯(lián)系[J].中國(guó)圖書館學(xué)報(bào),2004(1):36-39.
[5]Horrocks,I.Ontologies and semantic web.Communication of The ACM,2008(12):58-67.
[6]劉植惠.本體(Ontology)與語義網(wǎng)(Semantic Web)(J).重慶圖情研究,2006(3):1-4.
[7]Zeng,L.Knowledge organization system(KOS).Knowledge Organization,2008,35(2-3):160-183.