〔摘要〕本文采用案例分析的方法,對(duì)數(shù)字圖書館知識(shí)整合模式進(jìn)行研究。以Web of Science知識(shí)整合系統(tǒng)為例,介紹知識(shí)整合的發(fā)展,并給出知識(shí)整合的涵義,通過對(duì)Web of Science知識(shí)整合模式以及現(xiàn)有的其他知識(shí)整合模式的比較分析,得出結(jié)論:基于知識(shí)本體的知識(shí)整合模式是未來的發(fā)展方向。
〔關(guān)鍵詞〕Web of Science;知識(shí)整合;引文索引;知識(shí)本體
〔中圖分類號(hào)〕G250.76〔文獻(xiàn)標(biāo)識(shí)碼〕A〔文章編號(hào)〕1008-0821(2013)01-0022-04
1知識(shí)整合的發(fā)展及其涵義
從上世紀(jì)90年代初美國科學(xué)家首次提出數(shù)字圖書館(Digital Library)這一概念以來,數(shù)字圖書館信息資源建設(shè)問題就一直受到了國內(nèi)外學(xué)者的關(guān)注,如何對(duì)網(wǎng)絡(luò)信息資源進(jìn)行積極有效的整合是圖書館提供信息服務(wù)的重要任務(wù)之一。知識(shí)經(jīng)濟(jì)時(shí)代的到來,掀起了知識(shí)服務(wù)的研究熱潮。2000年,張曉林提出了“圖書情報(bào)工作的核心能力應(yīng)定位于知識(shí)服務(wù)”的觀點(diǎn)[1],在知識(shí)服務(wù)的環(huán)境下,信息整合自然而然被提升到了知識(shí)整合的高度。
關(guān)于知識(shí)整合的涵義,已經(jīng)有不少學(xué)者做出了概括,王利蕊、陸靜等人認(rèn)為:所謂知識(shí)整合,是以知識(shí)組織方法為指導(dǎo),以數(shù)據(jù)整合、信息整合為基礎(chǔ),以知識(shí)組織體系為支撐,組織資源知識(shí)結(jié)構(gòu)中概念及概念關(guān)系的一種整合方式[2-3]。張喜征從組織的角度解釋了知識(shí)整合的涵義:知識(shí)整合就是以創(chuàng)新為目標(biāo),充分運(yùn)用各種組織措施、技術(shù)方法、企業(yè)文化或其他手段將組織內(nèi)外分屬于不同群體或個(gè)體的一般的、特質(zhì)的各種知識(shí)創(chuàng)造性地結(jié)合在一起,以獲得一種創(chuàng)新性成果的過程[4]。而馬文峰和杜小勇更把知識(shí)整合簡單的概括為:利用知識(shí)本體實(shí)現(xiàn)數(shù)字資源的概念/語義的組織[5]。
本人認(rèn)為,知識(shí)整合的涵義可概括為:知識(shí)整合是信息在“內(nèi)容”方面的整合,其要解決的問題是內(nèi)在于知識(shí)結(jié)構(gòu)中的概念及其概念之間的關(guān)系,其目標(biāo)是知識(shí)的揭示與利用。
2Web of Science知識(shí)整合系統(tǒng)分析
Web of Science是美國Thomson Scientific(湯姆森科技信息集團(tuán))基于Web開發(fā)的產(chǎn)品,是大型綜合性、多學(xué)科、核心期刊引文索引數(shù)據(jù)庫,包括三大引文數(shù)據(jù)庫(科學(xué)引文索引(Science Citation Index,簡稱SCI)、社會(huì)科學(xué)引文索引(Social Sciences Citation Index,簡稱SSCI)和藝術(shù)與人文科學(xué)引文索引(Arts Humanities Citation Index,簡稱AHCI))和兩個(gè)化學(xué)信息事實(shí)型數(shù)據(jù)庫(Current Chemical Reactions,簡稱CCR和Index Chemicus,簡稱IC)),以ISI Web of Knowledge作為檢索平臺(tái)。
Web of Science與許多專業(yè)數(shù)據(jù)庫相連接,從很大程度上擴(kuò)展了它的檢索能力和檢索范圍,如圖1。化學(xué)反應(yīng)與化合物信息(ISI Chemistry Server)數(shù)據(jù)庫揭示了化學(xué)反應(yīng)的整個(gè)歷史發(fā)展過程,也揭示了學(xué)術(shù)研究之間內(nèi)在的聯(lián)系,體現(xiàn)了知識(shí)整合的強(qiáng)大功能;基因與蛋白序列信息(NCBI GenBank)數(shù)據(jù)庫,包括由NCBI提供的所有公開DNA和蛋白質(zhì)序列的信息,約有4 028 000條基因序列記錄;專利信息(Derwent Innovations Index)數(shù)據(jù)庫提供了由40多個(gè)專利權(quán)威機(jī)構(gòu)發(fā)布的專利文獻(xiàn)信息,技術(shù)專利資料可以追溯到1963年;生命科學(xué)信息(BIOSIS Previews)數(shù)據(jù)庫是Web of Science采用全新技術(shù)構(gòu)架整合的兩大數(shù)據(jù)庫的總稱,利用Web of Science特有的引文索引機(jī)制揭示了相關(guān)研究信息及其內(nèi)在聯(lián)系;會(huì)議錄文獻(xiàn)信息(Web of Science Proceedings)數(shù)據(jù)庫也是Web of Science自行整合的數(shù)據(jù)庫集合,它還包括75萬個(gè)與Web of Science的雙向鏈接[6]。
Web of Science知識(shí)整合的核心是引文索引,同時(shí)也是資源整合的主要手段,其整合圖書館內(nèi)外資源的樞紐即是ISI Links。Web of Science通過引文之間的內(nèi)在關(guān)系,把所有資源整合成一個(gè)知識(shí)體系。知識(shí)之間的內(nèi)在聯(lián)系有很多種,Web of Science利用ISI Links將不同形式、不同來源的知識(shí)資源聯(lián)系起來,把各種傳統(tǒng)的和非傳統(tǒng)的知識(shí)整合起來,構(gòu)成了一個(gè)不斷完善的知識(shí)體系,如圖2。
對(duì)于任何一個(gè)檢索結(jié)果,Web of Science主要提供了4個(gè)鏈接:Times Cited,Related Records,Citing References,Cited References。Times Cited提供該文獻(xiàn)以及一系列被引文獻(xiàn)的被引次數(shù);Related Records提供相關(guān)文獻(xiàn)的檢索,其依據(jù)是文獻(xiàn)之間的共引度;Citing References提供引用該文獻(xiàn)的文獻(xiàn),即施引文獻(xiàn);Cited References提供該文獻(xiàn)引用的文獻(xiàn),即被引文獻(xiàn)。通過這4個(gè)重要的鏈接,Web of Science將所有文獻(xiàn)連接成為一個(gè)網(wǎng)狀結(jié)構(gòu),形成一個(gè)龐大的知識(shí)體系。Web of Science整合系統(tǒng)的特色之一就是提供引文之間的關(guān)系圖,同時(shí)也是網(wǎng)狀結(jié)構(gòu)的基礎(chǔ)。Web of Science提供的關(guān)系圖包括:
(1)前引證關(guān)系圖,能夠查看引用過所選中文獻(xiàn)的所有文獻(xiàn);
(2)后引證關(guān)系圖,能夠查看選中文獻(xiàn)引用文獻(xiàn)的記錄;
(3)雙向引證關(guān)系圖,同時(shí)查看施引文獻(xiàn)和被引文獻(xiàn)。
如圖3所示,Web of Science提供的雙向引證關(guān)系圖,它能將某一篇文獻(xiàn)的被引和引用情況全部展現(xiàn)出來,形成一個(gè)信息圖譜。在引文關(guān)系圖中,節(jié)點(diǎn)代表的文獻(xiàn),節(jié)點(diǎn)之間的連線代表的是文獻(xiàn)之間的關(guān)系,一級(jí)引用表示的是該文獻(xiàn)的引用和被引用情況,二級(jí)引用表示的是一級(jí)引用涉及文獻(xiàn)的引用和被引用情況。用戶可以通過引文關(guān)系圖擴(kuò)展檢索,通過前引和后引掌握相關(guān)學(xué)科的發(fā)展脈絡(luò),不同學(xué)科之間隱含的內(nèi)在聯(lián)系等等。從引文關(guān)系的角度對(duì)知識(shí)進(jìn)行整合,是Web of Science提供知識(shí)服務(wù)的主要途徑,它為用戶提供的最終結(jié)果是與用戶檢索文獻(xiàn)相關(guān)的所有文獻(xiàn)的鏈接,無形中擴(kuò)大了用戶所需要的知識(shí)的范圍。
基于引文索引的知識(shí)整合模式目前在數(shù)字圖書館中應(yīng)用也是比較廣泛的,如CNKI等系統(tǒng)都有所涉及,但是整合的程度都遠(yuǎn)遠(yuǎn)不如Web of Science。這種整合模式的優(yōu)勢(shì)是具有很強(qiáng)的聚集性,它從一個(gè)大的信息環(huán)境下將一條條孤立的信息聚集在一起,實(shí)現(xiàn)信息的增值。引文索引體現(xiàn)的是信息和知識(shí)之間的最自然的聯(lián)系,其形成的系統(tǒng)靈活性很大。但是知識(shí)整合的最終目的是體現(xiàn)概念以及概念之間的關(guān)系,而引文之間的關(guān)系與概念之間的關(guān)系并不能完全等同。
3知識(shí)整合的幾種模式
除了在上述案例中提到的基于引文索引的知識(shí)整合模式以外,還有其他幾種知識(shí)整合模式在數(shù)字圖書館中也都有所應(yīng)用。
3.1基于分類法和敘詞表的知識(shí)整合模式
當(dāng)前數(shù)字圖書館的知識(shí)整合模式幾乎都是以分類法和敘詞表為基礎(chǔ),如中國人民大學(xué)經(jīng)濟(jì)學(xué)學(xué)科知識(shí)門戶網(wǎng)站,就是以分類法為主,配合相應(yīng)的敘詞表的知識(shí)整合模式;如英國的Intute系統(tǒng),其基礎(chǔ)仍然是分類法和敘詞表,但是它突破了傳統(tǒng)上對(duì)分類法和敘詞表的理解,分類根據(jù)實(shí)際情況而定,它的分類體系是在多方調(diào)研和參考眾多分類法基礎(chǔ)上建立的,而且采用的敘詞表也根據(jù)各個(gè)學(xué)科體系的不同而有所不同。
圖3引證關(guān)系圖(上為一級(jí)引用圖,下為二級(jí)引用圖)
無論是傳統(tǒng)的資源,還是現(xiàn)在的數(shù)字資源,分類法都有其無可比擬的優(yōu)勢(shì),這是知識(shí)整合最有效也是最直接的的方法,雖然這種方法的概括性極強(qiáng),但是傳統(tǒng)的敘詞表有其本身的局限性,對(duì)概念之間關(guān)系的解讀并不是很深入,尤其是在數(shù)字資源環(huán)境下,概念之間的關(guān)系比較復(fù)雜。分類法和敘詞表在一定程度上能夠?qū)崿F(xiàn)知識(shí)整合,只是整合的程度不夠深入。
3.2基于主題圖的知識(shí)整合模式
主題圖是組織知識(shí)的一種技術(shù)、規(guī)范、方法和模型,它通過對(duì)主題和主題之間的關(guān)系以及資源關(guān)系的表現(xiàn)來組織知識(shí)。主題圖的主要功能就是能夠表示知識(shí)概念之間的相互聯(lián)系,并能定位某一知識(shí)概念所在的資源位置[7]。如由CDSL(中國科學(xué)院國家科學(xué)數(shù)字圖書館)建立的RESIP(Resources and Environmental information Portal),即資源環(huán)境學(xué)科信息門戶,采用的就是以主題詞表為基礎(chǔ),以主題圖為主的整合方式。
主題圖是在數(shù)字資源環(huán)境下比較適用的一種知識(shí)整合的方式,它用一種形象的方式表現(xiàn)概念之間的關(guān)系,表示知識(shí)之間的結(jié)構(gòu),形成概念網(wǎng)絡(luò)。但是,主題詞表歸根結(jié)底仍然是敘詞表的一種,它仍然是在敘詞表基礎(chǔ)上進(jìn)一步發(fā)展和完善而來的,仍然屬于敘詞表的范疇,仍然無法擺脫敘詞表的局限性。
3.3基于知識(shí)本體的知識(shí)整合模式
本體的概念源于哲學(xué)中的“本體論”(Ontology),知識(shí)本體就是描述概念以及概念之間的關(guān)系,其實(shí)質(zhì)是反映概念以及概念之間關(guān)系的知識(shí)系統(tǒng)。構(gòu)建知識(shí)本體是實(shí)現(xiàn)知識(shí)整合的關(guān)鍵,知識(shí)資源利用分類法或主題法進(jìn)行元數(shù)據(jù)標(biāo)引之后,在學(xué)科空間上可以呈現(xiàn)一個(gè)龐大復(fù)雜的“語義地圖”,采用不同的分類、主題方法可以呈現(xiàn)不同的語義地圖,因此,研究分類法以及敘詞表的進(jìn)一步開發(fā),以及不同分類法敘詞表之間的關(guān)聯(lián)和對(duì)應(yīng)機(jī)制,也是構(gòu)建知識(shí)本體的一種方式。構(gòu)建知識(shí)本體比較有效的方法是以現(xiàn)有的本體為基礎(chǔ)構(gòu)建新本體,分類法和詞表的傳統(tǒng)知識(shí)體系是簡單的知識(shí)本體,元數(shù)據(jù)方案也是本體的一種簡單形式。目前已有學(xué)者將知識(shí)本體應(yīng)用在了知識(shí)整合中,并建立了領(lǐng)域知識(shí)本體的知識(shí)整合模型等[8]。
知識(shí)本體能夠提供元數(shù)據(jù)有關(guān)語義描述的知識(shí)地圖,能夠?qū)?shù)據(jù)庫的領(lǐng)域知識(shí)本體進(jìn)行識(shí)別和規(guī)范描述,解決數(shù)據(jù)庫建設(shè)中存在的問題,能夠?qū)崿F(xiàn)基于語義理解的知識(shí)檢索過程。
3.4幾種知識(shí)整合模式的比較分析
Web of Science從引文關(guān)系的角度進(jìn)行知識(shí)整合,是一種比較特殊的知識(shí)整合系統(tǒng),它并不以學(xué)科或知識(shí)分類為基礎(chǔ),其知識(shí)整合的功能借助于引文之間的內(nèi)在關(guān)系呈現(xiàn)了出來;以分類法、敘詞表以及主題詞表等為基礎(chǔ)的知識(shí)整合,通過信息內(nèi)容本身以及信息和知識(shí)之間的關(guān)系來實(shí)現(xiàn)知識(shí)揭示,但是傳統(tǒng)的敘詞表和主題詞表在數(shù)字資源環(huán)境下是不適用的,針對(duì)此問題,許多機(jī)構(gòu)推出了電子版的分類法和敘詞表,甚至有分類敘詞對(duì)照詞表等,可是由于這些機(jī)構(gòu)沒有形成統(tǒng)一的數(shù)據(jù)格式標(biāo)準(zhǔn),而導(dǎo)致了在不同的詞表之間建立關(guān)系存在障礙,所以,分類法、敘詞表以及主題詞表并不是知識(shí)整合的很好的方式,而知識(shí)本體則能夠突破這種限制,實(shí)現(xiàn)對(duì)知識(shí)結(jié)構(gòu)的描述和揭示。
4結(jié)論
從以上的案例分析中可知,以學(xué)科信息或者學(xué)科知識(shí)的方式進(jìn)行知識(shí)整合是可行的,并且已經(jīng)取得了一定的成果。當(dāng)前數(shù)字圖書館知識(shí)整合的基礎(chǔ)仍然是分類法、敘詞表以及引文關(guān)系等等,而知識(shí)本體則跳出了傳統(tǒng)的束縛,提供了一種的新的揭示概念以及概念之間關(guān)系的方法。
知識(shí)本體在數(shù)字圖書館知識(shí)整合中的應(yīng)用還在不斷地研究中,知識(shí)整合追求的是知識(shí)的整體性和關(guān)聯(lián)性,通過構(gòu)建各個(gè)學(xué)科領(lǐng)域的知識(shí)本體概念模型,借助本體構(gòu)建工具或描述語言,最終形成一個(gè)覆蓋各個(gè)領(lǐng)域的知識(shí)體系,龐大的知識(shí)體系利用計(jì)算機(jī)以及網(wǎng)絡(luò)技術(shù)建立知識(shí)檢索平臺(tái),實(shí)現(xiàn)知識(shí)服務(wù),最終實(shí)現(xiàn)知識(shí)的有效利用。
參考文獻(xiàn)
[1]張曉林.走向知識(shí)服務(wù):尋找新世紀(jì)圖書情報(bào)工作的生長點(diǎn)[J].中國圖書館學(xué)報(bào),2000,(5):32-37.
[2]陸靜.基于知識(shí)網(wǎng)格的知識(shí)整合研究[J].農(nóng)業(yè)圖書情報(bào)學(xué)刊,2009,21(10):19-21,28.
[3]王利蕊.高校圖書館數(shù)字資源整合方式研究[J].現(xiàn)代情報(bào),2009,29(2):75-77.
[4]張喜征.組織內(nèi)不同群體間的知識(shí)整合研究[J].情報(bào)雜志,2004,(9):16-18.
[5]馬文峰,杜小勇.數(shù)字資源整合方式研究[J].圖書情報(bào)工作,2005,(5):67-71.
[6]周西平,石衛(wèi).知識(shí)整合平臺(tái)——Web of Science[J].圖書館學(xué)研究,2003,(3):45-48.
[7]馬文峰,杜小勇,盧曉惠.基于知識(shí)的資源整合[J].情報(bào)資料工作,2007,(1):51-56.
[8] 徐德斌.基于領(lǐng)域本體的知識(shí)整合淺析[J].現(xiàn)代情報(bào),2011,31(12):27-29,33.
(本文責(zé)任編輯:馬卓)