[摘要]數(shù)字圖書館時(shí)代資源整合是十分必要的,目前各個(gè)圖書館所使用的各類整合策略各有優(yōu)缺點(diǎn)。但是基于語義的資源整合無疑是最終的發(fā)展趨勢。傳統(tǒng)圖書館領(lǐng)域的規(guī)范控制工作應(yīng)該積極適應(yīng)數(shù)字圖書館時(shí)代發(fā)展,構(gòu)建基于語義資源整合的基礎(chǔ)環(huán)境,從而在數(shù)字資源整合中繼續(xù)發(fā)揮作用。
[關(guān)鍵詞]數(shù)字圖書館;規(guī)范控制;資源整合
DOl:10.3969/i.issn.1008—0821.2010.06.008
[中圖分類號]G253 [文獻(xiàn)標(biāo)識碼]A [文章編號]1008—0821(2010)06—0031—02
1 數(shù)字圖書館時(shí)代資源整合的必要性
自20世紀(jì)90年代以來,隨著網(wǎng)絡(luò)的不斷拓展,信息時(shí)代迅速來臨,數(shù)字資源大量涌現(xiàn)。圖書館作為信息的收藏及傳播者,更是受到了前所未有的沖擊。第一,數(shù)字圖書館的收藏范圍已經(jīng)擴(kuò)大。圖書館的收藏范圍已經(jīng)從單純收藏印本文獻(xiàn),到收藏印本文獻(xiàn)、縮微文獻(xiàn)、非書文獻(xiàn)、電子文獻(xiàn)四大類型資源。其中電子資源又包括印本的數(shù)字化、原生電子資源、虛擬電子資源三種類型。第二,數(shù)字資源之間不兼容。目前隨著數(shù)字化進(jìn)程的不斷發(fā)展,各種各樣的數(shù)字資源紛紛涌現(xiàn),但由于來自不同資源提供商的數(shù)字資源擁有獨(dú)立的數(shù)據(jù)源、應(yīng)用系統(tǒng),因此盡管圖書館購買了大量數(shù)字資源,卻無法有效結(jié)合在一起,用戶需登錄不同站點(diǎn),使用不同的檢索方法,浪費(fèi)大量時(shí)間。再加之由于商業(yè)利益的存在,各資源提供商一般不愿意公開詳細(xì)的數(shù)據(jù)結(jié)構(gòu)和文件格式等,也不愿意兼容其他提供商的格式。這也就使得圖書館必須對這些數(shù)字資源進(jìn)行必要的整合。第三,數(shù)字資源元數(shù)據(jù)格式多樣化。圖書館信息資源的多樣化,使得描述信息;源的元數(shù)據(jù)格式亦呈現(xiàn)多樣化的趨勢。目前國際上除了圖書館界較為熟悉的MARC和DC外,還有用于電子文本的TEl,用于可視資源的Ⅵ認(rèn)Core,等多種各類資源的數(shù)據(jù)格式。因此,毫無疑問數(shù)字圖書館時(shí)代資源整合不僅是必須的,而且是迫切的。
2 數(shù)字圖書館時(shí)代資源整合策略及發(fā)展趨勢
目前,實(shí)現(xiàn)信息資源整合方式有很多種,而且沒有統(tǒng)一定義。一般分為4個(gè)層次,即基于導(dǎo)航的資源整合、基于OPAC的資源整合、基于異構(gòu)統(tǒng)一平臺的資源整合和基于語義的資源整合。從整合程度來講這四種整合方式是逐漸深入的。
具體的講,“導(dǎo)航式整合”是提供按字母和主題等的人口方式將數(shù)字資源的檢索入口整合在一起,這樣讀者一次輸入可以了解到數(shù)字圖書館的資源概貌,然后再按照個(gè)人喜好進(jìn)入具體的數(shù)據(jù)庫進(jìn)行檢索;“OPAC式整合”,就是在原有OPAC系統(tǒng)的基礎(chǔ)上通過MARC中的856字段來反映資源的鏈接地址,使用戶可直接鏈接到圖書原文;“異構(gòu)統(tǒng)一平臺式整合”,就是借助中間層將檢索式翻譯成各個(gè)數(shù)據(jù)庫的檢索語句,同時(shí)調(diào)用各個(gè)數(shù)據(jù)庫進(jìn)行檢索,能夠使用戶利用統(tǒng)一的檢索方法同時(shí)檢索多種異構(gòu)的分布式數(shù)字資源。三者的共性是建立整合系統(tǒng)即在不改變現(xiàn)有信息系統(tǒng)的數(shù)據(jù)組織結(jié)構(gòu)和檢索方法的條件下,實(shí)現(xiàn)對異構(gòu)的多數(shù)據(jù)源統(tǒng)一的訪問。
而基于語義的資源整合,則需要建立整合系統(tǒng),實(shí)際上就是對現(xiàn)有的數(shù)字信息資源重新組織、深度加工、二次開發(fā)和創(chuàng)造新知識的過程。具體的講就是主要采用了本體的技術(shù),借助XML語法,以元數(shù)據(jù)為基礎(chǔ)構(gòu)建知識本體,通過RDF(Resouoe DescriPtion Framework)/RDFs(RDFSchema)來實(shí)現(xiàn)元數(shù)據(jù)描述和交換,這樣能夠最大可能地解決一詞多義和同義詞的問題,減少漏檢和錯(cuò)檢,同時(shí)發(fā)現(xiàn)資源之間潛在的相互聯(lián)系,能夠?qū)崿F(xiàn)資源更大范圍的整合。
數(shù)字圖書館只有實(shí)現(xiàn)了基于語義的資源整合,才能在此基礎(chǔ)上去更好的服務(wù)用戶。
3 規(guī)范控制工作與數(shù)字圖書館時(shí)代的資源整合
在上述的資源整合策略當(dāng)中,基于語義的資源整合無疑是數(shù)字資源整合的最高境界。那是不是在進(jìn)行數(shù)字資源整合時(shí),傳統(tǒng)圖書館使用的目錄組織方法全都失效了呢?其實(shí)如果我們能夠透過現(xiàn)象去剖析數(shù)字時(shí)代資源整合的本質(zhì),我們不難發(fā)現(xiàn),無論上述的哪一種資源整合方式,其立足點(diǎn)都是我們傳統(tǒng)的圖書館學(xué)最擅長的武功——目錄學(xué),只是現(xiàn)在變成了數(shù)字目錄學(xué)罷了。其實(shí)質(zhì)就是借助計(jì)算機(jī)超強(qiáng)的運(yùn)算速度,以目錄學(xué)的思維,即利用有序的較少的資源管理無序的海量的信息資源。因此進(jìn)入數(shù)字圖書館時(shí)代,并非所有的規(guī)則都要重新建立,傳統(tǒng)圖書館時(shí)代的很多好的理念仍然是可以借鑒和傳承,比如說規(guī)范控制工作在數(shù)字圖書館來臨的時(shí)候,為其發(fā)展提供了更廣闊的空間。
3.1 規(guī)范控制工作能夠延伸到數(shù)字圖書館時(shí)代的原因
無論傳統(tǒng)圖書館還是數(shù)字圖書館,主要“檢索點(diǎn)”受控都是有必要的。規(guī)范控制工作是伴隨著書目產(chǎn)生、發(fā)展的。書目的作用起初僅作為圖書清冊,留于客觀揭示,并不著重標(biāo)目規(guī)范控制去實(shí)現(xiàn)目錄的集中職能。由于文獻(xiàn)數(shù)量日趨增加,著者同人異名、同書異名,或同名異人、同名異書的情況逐漸增多,為了辨明各種名稱,提高書目檢索效率,編目人員有意識地按照一定的序列排列書目卡片,并加以各種注釋,這就是規(guī)范控制最初的萌芽。眾所周知,書目數(shù)據(jù)描述的是文獻(xiàn),而規(guī)范數(shù)據(jù)描述的則是書目款目中的標(biāo)目。因此標(biāo)目的選擇和形式的確定,無疑是非常重要的。進(jìn)入數(shù)字圖書館時(shí)代,只是“標(biāo)目”的概念就逐漸轉(zhuǎn)化為“檢索點(diǎn)”,MARC格式變成了形式上和內(nèi)容上很靈活的元數(shù)據(jù),但是有一點(diǎn)沒有變,無論什么樣的數(shù)據(jù)格式都是用來檢索的,尤其信息資源的數(shù)量更加龐大,必然使著者同人異名、同書異名,或同名異人、同名異書的情況逐漸增多。因此為了降低信息資源的誤檢率和漏檢率,提高信息資源的查準(zhǔn)率和查全率,引入規(guī)范控制更是十分必要。
3.2 規(guī)范控制相關(guān)標(biāo)準(zhǔn)正在積極適應(yīng)數(shù)字圖書館時(shí)代發(fā)展
圖書館行業(yè)外部正在發(fā)生著日新月異的變化,導(dǎo)致其自身的編目規(guī)則和標(biāo)準(zhǔn)也在不斷變化,1996年3月,美國聯(lián)機(jī)編目中心(0CLC)召開了21世紀(jì)的規(guī)范控制研討會,對數(shù)字圖書館的規(guī)范控制以及未來的規(guī)范控制的發(fā)展趨勢進(jìn)行了探討。之后不久,1999年4月,IFLA又成立一個(gè)新的工作組,即“規(guī)范記錄的功能要求和編號”(Functional Requirements and Numbering 0f Authority Records,簡稱FRA-NAll)工作組。該工作組于2007年4月提交了《規(guī)范數(shù)據(jù)的功能需求》(FRAD)的報(bào)告,該概念模型主要是涉及名稱規(guī)范的內(nèi)容。
因此,不難看出規(guī)范控制工作的相關(guān)操作標(biāo)準(zhǔn)正在不斷的更新進(jìn)程,一定會越來越適應(yīng)數(shù)字時(shí)代的要求。
3.3 規(guī)范控制在數(shù)字時(shí)代資源整合中的應(yīng)用模式
3.3.1 結(jié)合數(shù)字資源特性,擴(kuò)大規(guī)范控制范圍
雖然數(shù)字圖書館與傳統(tǒng)圖書館時(shí)代規(guī)范控制的基本含義是一致的,但是畢竟控制的對象相差迥異,因此控制的元素肯定會有所區(qū)別。比如在傳統(tǒng)圖書館獲得文獻(xiàn)主要是依據(jù)對應(yīng)本地館藏位置的索取號,而這種索取號在本地館藏一般是惟一的,因此根本不需要進(jìn)行規(guī)范控制,而在數(shù)字圖書館中對于遠(yuǎn)程檢索電子資源來講,必須通過一個(gè)準(zhǔn)確的某類標(biāo)識符來保證準(zhǔn)確獲取資源。目前,這類標(biāo)識符通常是統(tǒng)一資源定位器(URL),它嵌于書目記錄中。URL能成功地作為一種檢索實(shí)體的方法主要在于它在定位信息上的準(zhǔn)確性,但它最大的缺點(diǎn)是不穩(wěn)定。相對數(shù)字資源來講,索取標(biāo)識符是一項(xiàng)極為重要的檢索點(diǎn),因此未來也許會把數(shù)字資源的索取符號納入到規(guī)范控制的范圍來。類似這類的元素,應(yīng)該在具體的工作中,逐漸發(fā)現(xiàn)并積累,并應(yīng)盡快的反映到編目規(guī)則中。
3.3.2 細(xì)化規(guī)范元素屬性,構(gòu)建基于語義的資源整合的基礎(chǔ)
基于語義的資源整合,最重要的一個(gè)環(huán)節(jié)就是領(lǐng)域本體的構(gòu)建。而規(guī)范控制的對象正是構(gòu)建本體的基本要素之一,而且規(guī)范數(shù)據(jù)可以是一次建立,多次輸出,節(jié)約構(gòu)建本體庫的成本。以個(gè)人名稱規(guī)范為例,構(gòu)建大多數(shù)領(lǐng)域本體時(shí)都離不開“個(gè)人”的要素,而名稱規(guī)范就是用來描述“個(gè)人”屬性的。以2007年4月出臺的《規(guī)范數(shù)據(jù)的功能需求》(FRAD)中定義的“個(gè)人”實(shí)體的屬性為例,其屬性包括個(gè)人的日期、個(gè)人的稱呼、個(gè)人的其它名稱、性別、出生地、死亡地、居住地、所屬單位、傳記/歷史等。編目員通過上述的屬性描述形成名稱規(guī)范數(shù)據(jù),然后可以通過計(jì)算機(jī)軟件,轉(zhuǎn)化成構(gòu)建本體庫所需要的形式化描述語言,以作為構(gòu)建語義檢索模式的基礎(chǔ),而且規(guī)范控制對象的屬性越詳細(xì)越有利于提高信息資源檢索的正確性。
3.3.3 強(qiáng)化規(guī)范元素關(guān)系,發(fā)現(xiàn)數(shù)字資源之間的相互聯(lián)系
在傳統(tǒng)圖書館領(lǐng)域,規(guī)范工作重視的是檢索點(diǎn)形式,以便進(jìn)行區(qū)分標(biāo)目,進(jìn)而在區(qū)分的基礎(chǔ)上進(jìn)行集中相關(guān)文獻(xiàn)。但是在數(shù)字圖書館時(shí)代,規(guī)范控制工作的重心則是揭示語義檢索模型中本體間的關(guān)系。例如與個(gè)人有關(guān)的相關(guān)參照關(guān)系,即個(gè)人一個(gè)人的關(guān)系,可能包括筆名關(guān)系、歸屬關(guān)系、合作關(guān)系、兄弟關(guān)系、父母/兒女關(guān)系;個(gè)人與團(tuán)體、個(gè)人與家族的成員關(guān)系;以及與個(gè)人有關(guān)的單純參照關(guān)系:實(shí)名關(guān)系、筆名關(guān)系、俗名關(guān)系、教名關(guān)系、職務(wù)名稱關(guān)系、舊名稱關(guān)系、新名稱關(guān)系、交替語言形式關(guān)系、其它變異名稱關(guān)系等等。通過在規(guī)范記錄里將這些復(fù)雜的關(guān)系細(xì)化,并通過符號的形式表達(dá)清楚,無疑是有利于在基于語義網(wǎng)檢索的時(shí)候,提高信息資源查全率。
總之,數(shù)字圖書館時(shí)代的來臨,并不是將傳統(tǒng)圖書館的相關(guān)技術(shù)全部摒棄,而是應(yīng)該積極的開拓思路,抓住時(shí)代帶來的機(jī)遇,將類似于規(guī)范控制這些既有的經(jīng)驗(yàn)和技術(shù)繼續(xù)傳承并發(fā)揚(yáng)光大。
參考文獻(xiàn)
[1]趙悅。富平,數(shù)字資源與傳統(tǒng)文獻(xiàn)元數(shù)據(jù)整合[J],國家圖書館學(xué)刊,2(J07,(2):63-65。
[2]富平,從文獻(xiàn)編目到資源整合[J],圖書情報(bào)論壇,2006,(1):3—5。
[3]韓裁,樊志偉,李健,數(shù)字圖書館的信息資源發(fā)現(xiàn)與組織[J],情報(bào)資料工作,2006,(5):65—67。
[4]武永娜,規(guī)范控制范圍的擴(kuò)展——從書目記錄的規(guī)范控制到元數(shù)據(jù)的規(guī)范控制[J],新世紀(jì)圖書館,2003,(5):20—22。
[5]黃曉斌。夏明春,數(shù)字資源整合方式的比較與選擇[J],情報(bào)科學(xué),2005,23(5):690—695。
[6]林明,規(guī)范控制的發(fā)展歷程[J],圖書館工作與研究,2001,(5):2—6。
[7]鄧三鴻,金瑩,秦嘉杭,基于知識管理的數(shù)字資源墊合策略[J],情報(bào)科學(xué),2006,24(10):1489—1493。