亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        多種知識(shí)組織方法比較*

        2016-08-23 07:52:25娥,夏
        圖書館論壇 2016年8期
        關(guān)鍵詞:本體關(guān)聯(lián)語義

        常 娥,夏 婧

        多種知識(shí)組織方法比較*

        常娥,夏婧

        文章在闡述知識(shí)組織環(huán)境與目標(biāo)發(fā)生轉(zhuǎn)變的基礎(chǔ)上,比較各種知識(shí)組織方法。主要從概念表達(dá)方式、是否關(guān)聯(lián)資源、解決語義異構(gòu)的能力以及開放性等方面論述各種知識(shí)組織方法的特點(diǎn),重點(diǎn)探討關(guān)聯(lián)數(shù)據(jù)與元數(shù)據(jù)、知識(shí)本體整合的必要性與可行性。

        知識(shí)組織元數(shù)據(jù)知識(shí)本體關(guān)聯(lián)數(shù)據(jù)知識(shí)地圖

        引用本文格式常娥,夏婧.多種知識(shí)組織方法比較[J].圖書館論壇,2016(8):1-6.

        0 引言

        知識(shí)組織的概念最初由美國圖書館學(xué)家布利斯(H.E.Bliss)于1929年提出[1],他最早闡述了以圖書分類為基礎(chǔ)的知識(shí)組織思想。隨后,美國圖書館學(xué)家謝拉(J.H.Shera)全面論述了知識(shí)組織在圖書館工作中的重要作用和方法[2-3]。以此為基礎(chǔ),國內(nèi)外學(xué)者就知識(shí)組織的概念、原理、目標(biāo)、研究范圍、方法和技術(shù)等展開研究,取得了豐碩的成果。早期研究普遍認(rèn)為,理想的知識(shí)組織是將文獻(xiàn)中的知識(shí)單元抽取出來并進(jìn)行分析,找到人們創(chuàng)造與思考的相互影響與聯(lián)系的節(jié)點(diǎn)[4]。但由于未找到知識(shí)的有效表達(dá)方式,不得不退卻到文獻(xiàn)層次,用文獻(xiàn)間接地表示知識(shí)[5],并產(chǎn)生了一系列以文獻(xiàn)分類為代表的知識(shí)組織方法。文獻(xiàn)組織的實(shí)質(zhì)是知識(shí)組織,但它不完全等同于知識(shí)組織。

        隨著計(jì)算機(jī)和網(wǎng)絡(luò)技術(shù)的發(fā)展,人類社會(huì)已全面步入數(shù)字化時(shí)代,并不斷邁向數(shù)據(jù)化時(shí)代。如今數(shù)字資源成為文獻(xiàn)資源的主要形式,對(duì)于文獻(xiàn)知識(shí)內(nèi)容的分解與組合變得極為便利,知識(shí)的控制單位由文獻(xiàn)資源深化到文獻(xiàn)中的數(shù)據(jù)、公式、事實(shí)、結(jié)論等最小的獨(dú)立單位,即“知識(shí)單元”(或稱“數(shù)據(jù)單元”)。知識(shí)組織環(huán)境的變化使得知識(shí)組織不再局限于文獻(xiàn)層次,知識(shí)組織的目標(biāo)亦由文獻(xiàn)揭示與序化轉(zhuǎn)變?yōu)橹R(shí)單元的揭示與關(guān)聯(lián)。例如,電子書的內(nèi)容定位不再依賴任何形式的順序編碼,而是通過給每個(gè)內(nèi)容塊加上標(biāo)識(shí)這種完全結(jié)構(gòu)化的方式進(jìn)行組織[6]。

        有鑒于此,數(shù)字時(shí)代圖書館必須突破紙質(zhì)文獻(xiàn)組織理念與框架的樊囿,積極探尋新的知識(shí)組織方法,以滿足數(shù)字資源細(xì)粒度知識(shí)組織的需求。關(guān)聯(lián)數(shù)據(jù)(Linked Data)是近年來圖書館學(xué)領(lǐng)域最為推崇的知識(shí)組織方法,學(xué)者們從關(guān)聯(lián)數(shù)據(jù)的概念、發(fā)布與消費(fèi)技術(shù)、應(yīng)用協(xié)議、典型數(shù)據(jù)集等不同層面進(jìn)行了分析,然而鮮有文獻(xiàn)綜合各種知識(shí)組織方法,從早期的分類索引到MARC機(jī)讀目錄、DC元數(shù)據(jù)、本體模型,再到關(guān)聯(lián)數(shù)據(jù)這一系列知識(shí)組織方法的繼承與發(fā)展角度,論述關(guān)聯(lián)數(shù)據(jù)的時(shí)代適應(yīng)性。為了深入討論這一問題,本文在介紹各種知識(shí)組織方法的基礎(chǔ)上,主要從概念表達(dá)方式、是否關(guān)聯(lián)資源、解決語義異構(gòu)的能力以及開放性等方面對(duì)比分析不同知識(shí)組織方法的特點(diǎn),最后重點(diǎn)探討關(guān)聯(lián)數(shù)據(jù)與元數(shù)據(jù)、知識(shí)本體整合的必要性和可行性。

        1 常用知識(shí)組織方法

        在圖書情報(bào)領(lǐng)域中,知識(shí)組織方法多達(dá)數(shù)十種,知識(shí)組織工具和系統(tǒng)不勝枚舉。下文將知識(shí)組織方法劃分為元數(shù)據(jù)、知識(shí)本體、知識(shí)地圖和語義網(wǎng)絡(luò)4大類型予以介紹。由于分類法和主題法的知識(shí)組織思想已深刻內(nèi)化到其他知識(shí)方法之中,不再單獨(dú)闡述。

        1.1元數(shù)據(jù)

        元數(shù)據(jù)最簡(jiǎn)明抽象的定義是“關(guān)于數(shù)據(jù)的數(shù)據(jù)”(data about data)[7],其本質(zhì)含義是指按照相應(yīng)的句法結(jié)構(gòu)與語義結(jié)構(gòu)組織元素集,使其成為所描述對(duì)象的“縮影”或“替代物”,然后利用這個(gè)“縮影”或“替代物”來對(duì)相應(yīng)對(duì)象進(jìn)行識(shí)別、組織、檢索、保存與顯示等管理操作,這是元數(shù)據(jù)的本質(zhì)職能[8]。元數(shù)據(jù)方法擅長(zhǎng)揭示文獻(xiàn)資源的整體內(nèi)容,主要用于文獻(xiàn)資源的描述、定位、選擇與檢索。

        元數(shù)據(jù)的元素項(xiàng)主要為隸屬關(guān)系和相關(guān)關(guān)系,然而這種語義關(guān)系簡(jiǎn)單、粗糙,且隱含在元數(shù)據(jù)標(biāo)準(zhǔn)的語法結(jié)構(gòu)中,靈活性較差。元素與子元素之間的隸屬關(guān)系在定義具體元數(shù)據(jù)標(biāo)準(zhǔn)時(shí)得以確定,而這些元素所描述對(duì)象之間的復(fù)雜關(guān)系則需要借助外部程序?qū)崿F(xiàn)。例如,DC的“主題”元素、CNMARC的“主題附注”元素都是為了描述文獻(xiàn)資源的主題概念,然而所描述主題概念間的相互關(guān)系則需要通過其他途徑進(jìn)行顯示。元素之間的相關(guān)關(guān)系以及通過相關(guān)關(guān)系所描述的對(duì)象之間的復(fù)雜關(guān)系,同樣存在著無法進(jìn)一步識(shí)別的問題。例如,DC通過“關(guān)系”元素連接了在內(nèi)容、版本、形態(tài)等方面相關(guān)的文獻(xiàn)資源,然而這些文獻(xiàn)資源之間的復(fù)雜關(guān)系無法進(jìn)一步識(shí)別。這些是元數(shù)據(jù)方法的局限所在。

        此外,元數(shù)據(jù)在描述文獻(xiàn)資源時(shí),還存在著特殊性與一般性的矛盾,這亦是無法克服的困難。雖然DC、MARC等少數(shù)元數(shù)據(jù)格式占據(jù)主導(dǎo)地位,然而永遠(yuǎn)無法統(tǒng)一到僅有的少數(shù)幾種格式[9]。由于只有專業(yè)的元數(shù)據(jù)對(duì)于特定的領(lǐng)域應(yīng)用最合適,因此專業(yè)領(lǐng)域存在著大量的不同元數(shù)據(jù)方案,由此引發(fā)了不同元數(shù)據(jù)的映射與互操作問題,這是學(xué)術(shù)界和實(shí)踐機(jī)構(gòu)都致力于解決的難題。近年來,國外學(xué)者提出了建立“元數(shù)據(jù)的元數(shù)據(jù)”機(jī)制,以靈活地實(shí)現(xiàn)不同信息系統(tǒng)之間的互操作,如美國著名知識(shí)倉儲(chǔ)HathiTrust采用METS元數(shù)據(jù)來編碼和傳輸數(shù)據(jù)庫中的不同元數(shù)據(jù)標(biāo)準(zhǔn)。然而這只是一個(gè)將不同元數(shù)據(jù)標(biāo)準(zhǔn)整合在一起的上層元數(shù)據(jù)方案,仍無法完成不同元數(shù)據(jù)標(biāo)準(zhǔn)之間元素項(xiàng)的語義映射和轉(zhuǎn)換。

        1.2知識(shí)本體

        20世紀(jì)90年代初,起源于哲學(xué)范疇的知識(shí)本體(Ontology)逐漸被引入人工智能、知識(shí)工程等領(lǐng)域,而后進(jìn)入圖書情報(bào)領(lǐng)域,用于文獻(xiàn)資源的組織與檢索。知識(shí)本體定義眾多,但本質(zhì)區(qū)別不大,目前公認(rèn)的定義是Studer于1998年提出的:“知識(shí)本體是指概念體系的明確的、形式化、可共享的規(guī)范?!保?0]知識(shí)本體善于描述信息資源內(nèi)在的知識(shí)內(nèi)容,從功能上看,它與主題法、分類法相通,但比主題法、分類法更加靈活和復(fù)雜[11]。

        知識(shí)本體主要采用面向?qū)ο蟮姆治龇椒?,將事物(領(lǐng)域知識(shí))作為整體對(duì)象,對(duì)其屬性和過程進(jìn)行處理,而分類法和主題法則是將概念抽取出來進(jìn)行處理。例如,在描述一臺(tái)電腦時(shí),知識(shí)本體就會(huì)生成一臺(tái)電腦的對(duì)象,它包含電腦的品牌、CPU、硬盤、顯示器等屬性信息,還包含電腦的修理、采購等操作函數(shù);而主題詞表在描述電腦概念時(shí),則使用電腦的品牌、CPU型號(hào),以及用電腦加物品修理等多個(gè)概念進(jìn)行組配完成;分類法在描述電腦概念時(shí),則會(huì)按照學(xué)科將其進(jìn)行歸類處理。

        顯然,知識(shí)本體在描述領(lǐng)域知識(shí)時(shí),將領(lǐng)域知識(shí)的一些重要屬性和操作與知識(shí)本身緊密聯(lián)系,因此其表示方法更加形象、準(zhǔn)確與合理??傮w來說,知識(shí)本體充分吸收了面向?qū)ο缶幊陶Z言的經(jīng)驗(yàn),具有抽象、繼承和封裝的3大特征,是一種面向?qū)ο蟮闹R(shí)表示方法,某種程度上接近于分面分類法的思想,但明顯有別于主題法和分類法,因?yàn)榉诸惙ê椭黝}法本身雖包含了概念關(guān)系,但它們的關(guān)系描述簡(jiǎn)單而松散。

        知識(shí)本體雖可表達(dá)知識(shí)概念之間的各種復(fù)雜關(guān)系,解決語義異構(gòu)的問題,但它無法建立知識(shí)單元與資源實(shí)體之間的直接關(guān)聯(lián),這是知識(shí)本體與元數(shù)據(jù)方法的重要區(qū)別。原因在于,元數(shù)據(jù)側(cè)重信息資源的描述與定位,而知識(shí)本體擅長(zhǎng)于知識(shí)內(nèi)容的組織與管理,在元數(shù)據(jù)方法中設(shè)有“來源”項(xiàng),可以將一條元數(shù)據(jù)描述與資源實(shí)體進(jìn)行關(guān)聯(lián),而知識(shí)本體則較少考慮與資源實(shí)體的關(guān)聯(lián)與揭示。例如,對(duì)于《信息檢索與利用》這本書而言,元數(shù)據(jù)方法直接對(duì)其進(jìn)行描述,并使用“來源”項(xiàng)標(biāo)識(shí)這本書的空間位置,從而建立了與這本書的直接關(guān)聯(lián);知識(shí)本體則是將書中的特定知識(shí)內(nèi)容抽取出來,結(jié)合信息檢索這一特定領(lǐng)域,進(jìn)行統(tǒng)一的形式化定義,并對(duì)它們之間的關(guān)系進(jìn)行規(guī)范化描述,而對(duì)于這本書的實(shí)體特征與存在形式往往不做揭示。此外,和元數(shù)據(jù)方法一樣,知識(shí)本體亦無法解決特殊性和一般性的矛盾,目前以領(lǐng)域本體的構(gòu)建與應(yīng)用為主。

        1.3知識(shí)地圖

        在眾多知識(shí)組織方法中,除元數(shù)據(jù)和知識(shí)本體外,還包括知識(shí)地圖、主題地圖、概念地圖等方法,簡(jiǎn)稱知識(shí)地圖類組織方法。知識(shí)地圖概念最早由布魯克斯于1988年在其經(jīng)典著作《情報(bào)學(xué)的基礎(chǔ)》中提出,他認(rèn)為人類的客觀知識(shí)結(jié)構(gòu)可繪制成以各個(gè)單元概念為節(jié)點(diǎn)的學(xué)科認(rèn)知地圖[12]。由于概念地圖和主題地圖都以知識(shí)單元為節(jié)點(diǎn),并以圖解的方式提供知識(shí)結(jié)構(gòu)的可視化表達(dá),因此都可視作知識(shí)地圖的一種,然而這三者之間存在明顯的不同。

        知識(shí)地圖表達(dá)的知識(shí)結(jié)構(gòu)范圍廣于概念地圖和主題地圖。主題地圖和概念地圖主要針對(duì)一定學(xué)科領(lǐng)域或者主題范圍類的知識(shí)概念及其關(guān)系進(jìn)行揭示,不能實(shí)現(xiàn)所有類型的知識(shí)概念描述,如揭示整個(gè)組織知識(shí)資產(chǎn)分布狀況和結(jié)構(gòu)等,而知識(shí)地圖則可以。Eppler按功能將知識(shí)地圖分為知識(shí)資源圖、知識(shí)資產(chǎn)圖、知識(shí)結(jié)構(gòu)圖、知識(shí)應(yīng)用圖和知識(shí)開發(fā)圖5種類型[13]。

        主題地圖起源于計(jì)算機(jī)科學(xué),作為網(wǎng)絡(luò)資源知識(shí)結(jié)構(gòu)描述工具被提出,具有定位和導(dǎo)航某一知識(shí)概念所在資源位置的功能,ISO13250S是主題地圖的國際標(biāo)準(zhǔn)[14]。概念地圖起源于教育學(xué)領(lǐng)域,作為教與學(xué)的工具被提出,不具備知識(shí)資源導(dǎo)航和定位的功能。在主題地圖中,可通過“事件”來描述與主題相關(guān)的知識(shí)資源,而概念地圖并不存在類似的結(jié)構(gòu)來指明知識(shí)資源。有學(xué)者指出,以超文本方式存在的概念地圖可作為資源導(dǎo)航工具[15],但至今未見類似的概念地圖應(yīng)用成果報(bào)道。此外,在概念地圖中,知識(shí)概念及其關(guān)系類型的設(shè)計(jì)比知識(shí)本體要靈活,沒有嚴(yán)格定義概念之間的關(guān)系類型和約束函數(shù),正因?yàn)槿绱?,概念地圖不具備知識(shí)推理功能。

        1.4語義網(wǎng)絡(luò)

        語義網(wǎng)絡(luò)是萬維網(wǎng)創(chuàng)始人蒂姆·伯納斯-李(Tim Berners-Lee)于1998年提出的概念,完整的語義網(wǎng)絡(luò)模型從下至上包括Unicode與URI層、XML Schema層、RDF Schema層、Ontology Vocabulary層、Logic層、Proof層、Trust層這7層結(jié)構(gòu)[16]。由于語義網(wǎng)絡(luò)模型過于復(fù)雜,其應(yīng)用基本局限于學(xué)術(shù)研究領(lǐng)域的試驗(yàn)性開發(fā)[17],至今仍未在真實(shí)的計(jì)算機(jī)網(wǎng)絡(luò)世界中得以普及,但語義網(wǎng)架構(gòu)中的核心關(guān)鍵技術(shù)URI和RDF如同星星之火得以保存。

        2006年,蒂姆·伯納斯-李拋開語義網(wǎng)絡(luò)模型中的復(fù)雜成分,在URI和RDF技術(shù)基礎(chǔ)上,再次提出“關(guān)聯(lián)數(shù)據(jù)”的概念。關(guān)聯(lián)數(shù)據(jù)實(shí)質(zhì)上是一套應(yīng)用規(guī)范,它規(guī)定在網(wǎng)絡(luò)上發(fā)布的數(shù)據(jù)必須滿足4個(gè)原則:(1)使用URI作為任何事物的標(biāo)識(shí)名稱,不僅是標(biāo)識(shí)文檔;(2)使用Http URI,使任何人都可以參引這一全局唯一的名稱;(3)當(dāng)有人訪問名稱時(shí),以RDF形式提供有用的信息;(4)盡可能提供鏈接,指向其他的URI,以使人們發(fā)現(xiàn)更多的相關(guān)信息。

        由于關(guān)聯(lián)數(shù)據(jù)的框架簡(jiǎn)單,目前商業(yè)、媒體、出版、政府、圖書館等諸多領(lǐng)域的關(guān)聯(lián)數(shù)據(jù)集發(fā)展迅猛,構(gòu)建了龐大的數(shù)據(jù)網(wǎng)絡(luò)[18]。關(guān)聯(lián)數(shù)據(jù)技術(shù)上實(shí)現(xiàn)雖不困難,但圍繞數(shù)據(jù)集的發(fā)布、消費(fèi)與應(yīng)用而形成的開放應(yīng)用標(biāo)準(zhǔn)、URIs復(fù)用、RDF的動(dòng)態(tài)鏈接維護(hù)、RDF關(guān)聯(lián)發(fā)現(xiàn)等一系列重要問題,研究尚待深入[19]。值得注意的是,關(guān)聯(lián)數(shù)據(jù)僅僅是一套網(wǎng)絡(luò)數(shù)據(jù)發(fā)布原則,類似于行動(dòng)指南,對(duì)于不同應(yīng)用領(lǐng)域,還需設(shè)計(jì)具體數(shù)據(jù)關(guān)聯(lián)模型,以支持領(lǐng)域關(guān)聯(lián)數(shù)據(jù)集的發(fā)布。

        2 知識(shí)組織方法的比較

        大數(shù)據(jù)時(shí)代,文獻(xiàn)資源組織的對(duì)象由文獻(xiàn)單元轉(zhuǎn)變成知識(shí)單元,并將采用細(xì)粒度、關(guān)聯(lián)與開放的方式對(duì)其進(jìn)行組織。本文主要從概念表達(dá)方式、關(guān)聯(lián)資源、支持開放獲取、解決語義異構(gòu)等方面,詳細(xì)分析各種知識(shí)組織方法的功能特點(diǎn)。其中,概念表達(dá)方式指的是知識(shí)單元的顆粒度,以及知識(shí)單元間關(guān)聯(lián)最終產(chǎn)生的結(jié)果。文獻(xiàn)本身被認(rèn)為是粗粒度的知識(shí)單元,而文獻(xiàn)中的數(shù)據(jù)、公式、事實(shí)、結(jié)論等則被認(rèn)為是細(xì)粒度的知識(shí)單元。知識(shí)單元關(guān)聯(lián)的結(jié)果存在線性和網(wǎng)絡(luò)兩種形式。關(guān)聯(lián)資源指的是能否直接在知識(shí)單元與資源本身建立鏈接。無論館藏知識(shí)網(wǎng)絡(luò)中建立了多么豐富的關(guān)聯(lián),知識(shí)單元始終無法取代文獻(xiàn)資源本身,因此知識(shí)單元與資源的關(guān)聯(lián)必不可少。開放獲取指的是能否支持資源或知識(shí)單元的網(wǎng)絡(luò)訪問。一般來說,使用Http URI標(biāo)識(shí),并進(jìn)行了網(wǎng)絡(luò)發(fā)布的資源,才能進(jìn)行開放獲取。解決語義異構(gòu)指的是能否提供表達(dá)一詞多義或一義多詞的機(jī)制。各種知識(shí)組織方法的比較結(jié)果如表1所示。

        表1 知識(shí)組織方法的比較結(jié)果

        由表1可知,分類法與主題法起源于圖書情報(bào)學(xué),它們以文獻(xiàn)本身為知識(shí)單元進(jìn)行描述和組織,是最基本的知識(shí)組織方法,功能簡(jiǎn)單,兩者既無法直接關(guān)聯(lián)資源,又無法解決語義異構(gòu)問題,更無法支持資源的開放獲取。

        元數(shù)據(jù)亦是一種線性、粗粒度的知識(shí)組織方法,雖使資源有了基本的微觀結(jié)構(gòu)和語義基礎(chǔ),但無法解決資源描述的異構(gòu)性和語義性問題。而本體模型雖可實(shí)現(xiàn)資源的語義化描述和細(xì)粒度組織,但在資源關(guān)聯(lián)的廣度和深度上未能提供更多的幫助。元數(shù)據(jù)和本體模型,均不支持資源的開放獲取。

        概念地圖實(shí)質(zhì)是一種思維導(dǎo)圖,概念定義極其靈活,既無法關(guān)聯(lián)資源,又不能解決語義異構(gòu)問題,因此不適合館藏資源組織。

        主題地圖和關(guān)聯(lián)數(shù)據(jù)不僅可滿足資源概念的細(xì)粒度、多維網(wǎng)狀表達(dá),并且可關(guān)聯(lián)資源本身,因此兩者的組織功能較為接近,但也存在明顯區(qū)別:(1)主題地圖設(shè)有公共主題指示符(PSI),可以有效解決語義異構(gòu)和互操作問題[20],而關(guān)聯(lián)數(shù)據(jù)沒有這樣的機(jī)制,無法直接解決語義異構(gòu)問題。(2)主題地圖類是網(wǎng)絡(luò)資源的主題索引,不支持資源的網(wǎng)絡(luò)發(fā)布和獲取,而關(guān)聯(lián)數(shù)據(jù)則可通過萬維網(wǎng)直接存取資源。值得注意的是,雖然關(guān)聯(lián)數(shù)據(jù)本身無法直接解決語義異構(gòu)問題,但它可通過URI復(fù)用或借助RDF框架構(gòu)建領(lǐng)域數(shù)據(jù)關(guān)聯(lián)模型來實(shí)現(xiàn)概念的多元化表達(dá)。

        綜合而言,關(guān)聯(lián)數(shù)據(jù)最具時(shí)代適應(yīng)性,能滿足資源細(xì)粒度、關(guān)聯(lián)與開放的知識(shí)組織需求,然而由于它無法直接解決語義異構(gòu)問題,因此需要吸收其他知識(shí)組織方法的優(yōu)點(diǎn)。從分類索引,到MARC機(jī)讀目錄、DC元數(shù)據(jù)、本體模型,再到關(guān)聯(lián)數(shù)據(jù),這一系列知識(shí)組織方法都是在特定時(shí)代背景下產(chǎn)生的,它們之間本身就存在著一定的繼承與發(fā)展關(guān)系。下文將重點(diǎn)闡述各種知識(shí)組織方法的繼承與融合問題,尤其是關(guān)聯(lián)數(shù)據(jù)與元數(shù)據(jù)、知識(shí)本體等方法的融合,從而分析關(guān)聯(lián)數(shù)據(jù)的集成性和時(shí)代適應(yīng)性。

        3 知識(shí)組織方法的融合

        分類法開啟了文獻(xiàn)資源組織研究的先河,誕生于1876年的《杜威十進(jìn)分類法》(DDC)是世界上第一部正式出版的分類詞表。我國的圖書分類研究歷史更加久遠(yuǎn),可追溯到西漢時(shí)期劉向父子編制的《七略》。然而主題法研究相對(duì)較晚,世界上第一部主題詞表《美國國會(huì)圖書館標(biāo)題詞表》誕生于1909年。20世紀(jì)60年代中期開始,國外開始嘗試分類主題一體化研究與實(shí)踐,取得了諸多成果,奠定了早期知識(shí)組織方法融合的理論基礎(chǔ)。

        20世紀(jì)90年代中后期,網(wǎng)絡(luò)信息資源的蓬勃發(fā)展促進(jìn)了元數(shù)據(jù)方法的發(fā)展。通過設(shè)置“主題”“分類”等相關(guān)元數(shù)據(jù)項(xiàng),元數(shù)據(jù)將分類法與主題法自然地融于一體。然而元數(shù)據(jù)方法只是羅列了各種主題概念,如作者名、機(jī)構(gòu)名、文獻(xiàn)題名,無法解決其語義異構(gòu)問題。圖書館界的傳統(tǒng)作法是建設(shè)規(guī)范文檔數(shù)據(jù)庫,然而規(guī)范文檔數(shù)據(jù)庫的建設(shè)、更新與維護(hù),工作量極其浩大,并且無法從根本上解決元數(shù)據(jù)方法的局限性。

        21世紀(jì)初期,知識(shí)本體的出現(xiàn)使得圖書情報(bào)領(lǐng)域的研究重心曾集中于知識(shí)概念的表達(dá)以及語義關(guān)系的挖掘上,產(chǎn)生了一系列領(lǐng)域本體組織模型。同時(shí),學(xué)者們發(fā)現(xiàn)知識(shí)本體實(shí)際上與主題法相通,紛紛致力于研究如何將敘詞表轉(zhuǎn)化為知識(shí)本體,或者借助各種敘詞表構(gòu)建領(lǐng)域本體,由此可見知識(shí)本體可以整合主題法。然而,無論是知識(shí)本體,還是主題法,它們都忽視了知識(shí)概念與資源本身關(guān)聯(lián)的重要性,未提供資源鏈接。

        數(shù)字網(wǎng)絡(luò)時(shí)代,文獻(xiàn)資源組織與服務(wù)環(huán)境發(fā)生了深刻的變化,如何融合多種知識(shí)組織方法,以構(gòu)建新型資源組織框架,成為學(xué)界關(guān)注的焦點(diǎn)。元數(shù)據(jù)與知識(shí)本體的融合,主題地圖與RDF框架的轉(zhuǎn)換,尤其是關(guān)聯(lián)數(shù)據(jù)的應(yīng)用成為學(xué)界熱烈討論的課題。在眾多知識(shí)組織方法中,關(guān)聯(lián)數(shù)據(jù)最具代表性,可完全融合元數(shù)據(jù)與知識(shí)本體等方法,以克服自身無法解決語義異構(gòu)性之不足。主要原因是:關(guān)聯(lián)數(shù)據(jù)的核心技術(shù)之一是RDF框架,即采用“資源(Resource)-屬性(Property)-值(Value)”三元組的形式表達(dá)資源,該框架與所應(yīng)用領(lǐng)域無關(guān),是通用的,其中資源被定義為任何有URI標(biāo)識(shí)的東西,可以是一篇文檔、一個(gè)獨(dú)立的網(wǎng)頁,或是一個(gè)主題詞、一個(gè)作者。因此,關(guān)聯(lián)數(shù)據(jù)將知識(shí)概念與資源實(shí)體完全置于統(tǒng)一的RDF框架下進(jìn)行處理,屬性關(guān)系不再是資源實(shí)體與知識(shí)概念,或者知識(shí)概念與知識(shí)概念的一重語義關(guān)聯(lián),而是可實(shí)現(xiàn)知識(shí)概念與知識(shí)概念,資源實(shí)體與資源實(shí)體,以及知識(shí)概念與資源實(shí)體的三重語義關(guān)聯(lián)。換言之,若RDF框架的“屬性”項(xiàng)關(guān)聯(lián)的是資源實(shí)體與知識(shí)概念,那么各種元數(shù)據(jù)模型可置于關(guān)聯(lián)數(shù)據(jù)框架中。將元數(shù)據(jù)框架與關(guān)聯(lián)數(shù)據(jù)進(jìn)行融合,只需將各個(gè)元數(shù)據(jù)項(xiàng)轉(zhuǎn)換為RDF的第二組元“屬性”項(xiàng)即可。若“屬性”項(xiàng)關(guān)聯(lián)的是知識(shí)概念與知識(shí)概念,那么各種領(lǐng)域本體模型則可置于關(guān)聯(lián)數(shù)據(jù)框架中。本體模型與關(guān)聯(lián)數(shù)據(jù)的融合,需要將知識(shí)概念與語義關(guān)系分別轉(zhuǎn)換,即將知識(shí)概念轉(zhuǎn)化為RDF的第一組元“資源”和第三組元“屬性值”,而語義關(guān)系轉(zhuǎn)換為RDF的第二組元“屬性”項(xiàng)。因此,關(guān)聯(lián)數(shù)據(jù)天然具有集成性,可完全融合元數(shù)據(jù)和本體模型。以DC為代表的元數(shù)據(jù)方案與關(guān)聯(lián)數(shù)據(jù)融合后,將逐漸從一個(gè)面向萬維網(wǎng)的元數(shù)據(jù)集轉(zhuǎn)變?yōu)槊嫦蛘Z義萬維網(wǎng)和關(guān)聯(lián)數(shù)據(jù)的核心屬性詞匯表[21],而各種分類表、主題表和領(lǐng)域本體將成為關(guān)聯(lián)數(shù)據(jù)的概念取值和屬性關(guān)系的重要來源。

        此外,關(guān)聯(lián)數(shù)據(jù)的URI具有雙重功能:一是資源實(shí)體的導(dǎo)航與定位功能:二是知識(shí)概念的唯一標(biāo)識(shí)功能,通過URI復(fù)用可實(shí)現(xiàn)概念的多元化表達(dá)和規(guī)范控制。例如,若詞語A和B都表達(dá)了概念C的含義,那么則可使用概念C的URI來標(biāo)識(shí)詞語A和B,無需重新定義詞語A和B。

        4 結(jié)語

        現(xiàn)有知識(shí)組織方法,從文獻(xiàn)分類、主題、目錄、索引,到元數(shù)據(jù)、知識(shí)本體,以及關(guān)聯(lián)數(shù)據(jù)等,它們?cè)谥R(shí)組織與檢索功能上既有區(qū)別又有聯(lián)系。本文主要從原理上介紹了各種知識(shí)組織方法,并從概念表達(dá)方式、是否關(guān)聯(lián)資源、語義異構(gòu)的能力和開放性等方面分析了它們的功能特點(diǎn),重點(diǎn)探討了關(guān)聯(lián)數(shù)據(jù)與元數(shù)據(jù)、知識(shí)本體整合的必要性與可行性。本文研究結(jié)果表明,大數(shù)據(jù)時(shí)代,關(guān)聯(lián)數(shù)據(jù)最具適應(yīng)性和集成性,可完全融合元數(shù)據(jù)和本體模型,以滿足資源細(xì)粒度、語義化和開放性的知識(shí)組織需求。

        [1]Bliss H E,Dewey,John.The Organisation of Knowledge and the System of the Sciences[M].New York:HenryHoltandCompany,1929:356-357.

        [2]Shera J H.An epistemological foundation for library science[J].Frontiers of librarianship-syracuse university,1968(8):7.

        [3]Shera J H.Mechanization,Librarianship,and Bibliographic Enterprise[J].Journal of documentation,1974,30(2):153-169.

        [4]文庭孝,劉曉英,劉進(jìn)軍.知識(shí)關(guān)聯(lián)的理論基礎(chǔ)研究[J].圖書館,2010(4):9-11.

        [5]馬費(fèi)成.知識(shí)組織系統(tǒng)的演進(jìn)與評(píng)價(jià)[J].知識(shí)工程,1989(2):39-43.

        [6][21]趙亮,張春景.DC元數(shù)據(jù)年會(huì)綜述[J].數(shù)字圖書館論壇,2012(11):33-42.

        [7]Review of Metadata Formats[EB/OL].[2016-04-26]. http://www.ukoln.ac.uk/metadata/review.html.

        [8][11]王紹平.組織數(shù)字信息資源的元數(shù)據(jù)方法和Ontology方法[J].上海高校圖書情報(bào)工作研究,2005(4):10-13.

        [9]劉煒,李大玲,夏翠娟.元數(shù)據(jù)與知識(shí)本體[J].圖書館雜志,2004(6):50-54.

        [10]Studer R,Benjamins V R,F(xiàn)ensel D.Knowledge engineering: principles and methods[J].Data and KnowledgeEngineering,1998,25(1):161-197.

        [12]B C Brookers.情報(bào)學(xué)的基礎(chǔ)(四)——第四篇情報(bào)學(xué):變化中的范式[J].王崇德,鄧亞橋,劉繼剛,譯.情報(bào)科學(xué),1984,5(1):66-77.

        [13]Eppler M J.Toward a pragmatic taxonomy of knowledge maps:classification principles,sample typologies,and application examples[C]//Information Visualization,2006.IV 2006.Tenth International Conference on. IEEE,2006:195-204.

        [14]呂元智,王心裁,譚必勇.基于主題地圖的電子政務(wù)信息資源組織研究[J].中國圖書館學(xué)報(bào),2007(4):73-76.

        [15]李秀芬,路線.概念圖的研究及其應(yīng)用現(xiàn)狀[J].吉林工程技術(shù)師范學(xué)院學(xué)報(bào),2009(7):65-68.

        [16]李潔,丁穎.語義網(wǎng)關(guān)鍵技術(shù)概述[J].計(jì)算機(jī)工程與設(shè)計(jì),2007(4):1831-1836.

        [17]劉煒,胡小菁,張春景,等.RDA與關(guān)聯(lián)數(shù)據(jù)[J].中國圖書館學(xué)報(bào),2012(1):34-42.

        [18]Linking Open Data[EB/OL].[2016-03-20].http:// www.w3.org/wiki/SweoIG/TaskForces/Community Projects/LinkingOpenData.

        [19]Health T.Linked Data:Evolving the Web into a Global Data Space[M].San Rafael,California:Morgan& Claypool,2011.

        [20]劉茜.XML主題圖和資源描述框架的比較[J].現(xiàn)代情報(bào),2006(4):216-220.

        (責(zé)任編輯:付偉棠)

        Comparative Study of Knowledge Organization

        CHANG E,XIA Jing

        On the basis of explaining the change of knowledge organization environment and target,the article compares different kinds of knowledge organization methods.The article mainly discusses the characteristics and relations of various knowledge organization methods from the aspects of the concept expression,relevance to resources,the ability of solving semantic heterogeneity and openness.Finally,the article discusses the necessity and feasibility of the integration of linked data,metadata and ontology.

        knowledge organization;metadata;ontology;linked data;knowledge map

        *本文系國家社會(huì)科學(xué)基金項(xiàng)目“圖書館資源組織中的數(shù)據(jù)關(guān)聯(lián)機(jī)制研究”(項(xiàng)目編號(hào):14CTQ005)研究成果之一

        常娥,東南大學(xué)圖書館副研究館員;夏婧,南京郵電大學(xué)圖書館館員。

        2016-04-06

        猜你喜歡
        本體關(guān)聯(lián)語義
        Abstracts and Key Words
        對(duì)姜夔自度曲音樂本體的現(xiàn)代解讀
        語言與語義
        “一帶一路”遞進(jìn),關(guān)聯(lián)民生更緊
        奇趣搭配
        智趣
        讀者(2017年5期)2017-02-15 18:04:18
        “上”與“下”語義的不對(duì)稱性及其認(rèn)知闡釋
        《我應(yīng)該感到自豪才對(duì)》的本體性教學(xué)內(nèi)容及啟示
        認(rèn)知范疇模糊與語義模糊
        Care about the virtue moral education
        卷宗(2013年6期)2013-10-21 21:07:52
        日本一区二区在线高清| 2021国内精品久久久久精免费| 中文熟女av一区二区| 美女视频黄a视频全免费网站色| 中国少妇×xxxx性裸交| 成人性生交大全免费看| 丰满少妇作爱视频免费观看| 国产人妻无码一区二区三区免费| 国内精品久久久久久久久久影院| 中文人妻无码一区二区三区信息 | 亚洲精品午夜精品国产| 国产三级三级精品久久| 在线观看一区二区蜜桃| 无码人妻精品一区二区三区东京热| 亚洲精品无码成人片久久不卡| 欧美性福利| 久久久国产视频久久久| 日韩美女av一区二区三区四区| 免费观看国产短视频的方法| 免费观看羞羞视频网站| 7878成人国产在线观看| 国产精品亚洲av国产| 国产在线一区二区三区乱码| 精品久久欧美熟妇www| 推油少妇久久99久久99久久| 日本成人字幕在线不卡| 亚洲天堂一区二区三区| 日韩av高清在线观看| 毛片免费全部无码播放| 久久综合给合久久97色| 一区二区三区乱码专区| 女人脱了内裤趴开腿让男躁| 中国猛少妇色xxxxx| 无码人妻专区一区二区三区| 好看的日韩精品视频在线| 日韩人妻无码精品久久| chinese国产在线视频| 国产成人亚洲系列毛片| 丰满多毛的大隂户毛茸茸| 精品国产群3p在线观看| 亚洲情精品中文字幕有码在线|