肖陽
摘 要:隨著信息網(wǎng)絡(luò)技術(shù)的普及和科技的飛速發(fā)展,使得信息爆炸性增長,浩如煙海的信息成多樣性、無序性增長,因而用戶不能迅速、有效地獲取自己所需的信息,在這種情況下數(shù)字圖書館應(yīng)運而生。然而在數(shù)字圖書館建設(shè)的過程中存在諸多問題,如何建設(shè)好數(shù)字圖書館已成為當(dāng)代圖書館學(xué)研究的一個熱門話題。
關(guān)鍵詞:數(shù)字圖書館;圖書館建設(shè);數(shù)字信息
中圖分類號:C93 文獻(xiàn)標(biāo)志碼:A 文章編號:1673-291X(2012)36-0215-02
一、數(shù)字圖書館的概念
所謂數(shù)字圖書館是指建立在內(nèi)部業(yè)務(wù)高度自動化基礎(chǔ)上,不僅能使本地和遠(yuǎn)程用戶聯(lián)機(jī)存取其聯(lián)機(jī)公共檢索目錄以查詢傳統(tǒng)圖書館藏(非數(shù)字化和數(shù)字化的),而且也能使用戶通過網(wǎng)絡(luò)聯(lián)機(jī)存取圖書館內(nèi)外的其他電子信息資源,信息實時更新并且高度共享的現(xiàn)代化圖書館。數(shù)字圖書館是由數(shù)字化的有序化信息和信息部門等構(gòu)成,它強調(diào)數(shù)字化支持技術(shù)、數(shù)字化資源和數(shù)字服務(wù),本質(zhì)上是一種實體性的信息機(jī)構(gòu)。數(shù)字圖書館的研究和建設(shè)已經(jīng)在全球范圍內(nèi)引起了廣泛的關(guān)注。近代數(shù)字圖書館可以稱作資料中心、信息中心和研究中心,這跟過去以藏書為目的的圖書館相比,有了一個很大的提高。
二、數(shù)字圖書館的功能
數(shù)字圖書館的功能應(yīng)該說在近現(xiàn)代以來發(fā)揮的越來越好,尤其是21世紀(jì)以來,信息化、數(shù)字化時代的到來越來越快,這個過程中互聯(lián)網(wǎng)的發(fā)展給圖書館提供了一個新的發(fā)展契機(jī),也是一個新的挑戰(zhàn)[1]。因此筆者認(rèn)為現(xiàn)代數(shù)字圖書館在功能上、定位上都發(fā)生了變化,而功能上的變化,從讀者的需求上來說,主要有以下三種。
1.提供數(shù)字化的圖書資料,過去紙本的圖書通過掃描、攝像等手段形成數(shù)字化即一個抽象的東西。過去圖書館主要是借用紙本圖書,現(xiàn)在數(shù)字圖書館主要是提供圖書的圖像文件,甚至是電子文稿,這樣可以方便用戶研究。
2.整理并提供數(shù)字化的歷史文獻(xiàn)。浩如煙海的歷史文獻(xiàn)經(jīng)過掃描方式的數(shù)字化處理形成電子版圖書,這樣圖書占用空間不大,但信息量很大。很多寶貴的珍本或孤本,進(jìn)過數(shù)字化以后,可以提供給眾多的研究者,這樣可以使我們更好地利用過去的這些文獻(xiàn)。
3.數(shù)字圖書館能夠提供快捷的數(shù)字化信息。圖書館通過互聯(lián)網(wǎng)發(fā)布信息,使研究者在資料信息及研究方法上得到有價值的東西,加快學(xué)術(shù)成果及信息的交流,我認(rèn)為這也是現(xiàn)代圖書館和數(shù)字圖書館為學(xué)術(shù)研究者提供的最大的方便。
三、建設(shè)數(shù)字圖書館中存在的問題
1.所建數(shù)據(jù)庫服務(wù)質(zhì)量不高。雖然高校圖書館已經(jīng)基本上實現(xiàn)了采訪、編目、流通、檢索等業(yè)務(wù)自動化管理,但仍有一些館處于自動化集成系統(tǒng)的初步實用階段。從整體上看,尚未形成以網(wǎng)絡(luò)化為龍頭帶動整個圖書館數(shù)字化建設(shè)的局面,對現(xiàn)有的館藏數(shù)字化比例不高,可提供服務(wù)的虛擬資源仍十分不足,多數(shù)圖書館能夠上網(wǎng)的數(shù)字化資源仍局限于館藏書目的層面上,并有一半以上的圖書館尚未實施專題特色數(shù)據(jù)庫的開發(fā)建設(shè)。從已經(jīng)上網(wǎng)并提供服務(wù)自建的專題數(shù)據(jù)庫使用情況來看,除記錄太少外,多數(shù)也只能提供二次文獻(xiàn)及簡單檢索服務(wù),很難滿足用戶深層次的需求。這就表明數(shù)據(jù)庫的內(nèi)容有待擴(kuò)大,開發(fā)深度及檢索質(zhì)量等方面有待于進(jìn)一步提高。
2.自動化專業(yè)人員結(jié)構(gòu)不合理。數(shù)字圖書館建設(shè)人員應(yīng)是圖書情報、學(xué)科專業(yè)人員、計算機(jī)專業(yè)人員相結(jié)合。數(shù)字圖書館建設(shè)牽涉到的方面較多,內(nèi)容的收集與篩選需圖書情報人員與學(xué)科專業(yè)人員共同確定,以保證收錄內(nèi)容的完整、合理、先進(jìn)、使用 [2]。然而現(xiàn)在從事圖書館相關(guān)工作中計算機(jī)、自動化專業(yè)的大學(xué)本科以上畢業(yè)生所占的比例極少,而非專業(yè)技術(shù)人員卻占的比例較大。圖書館數(shù)字化建設(shè)缺乏大批具備計算機(jī)技術(shù)、網(wǎng)絡(luò)技術(shù)的高素質(zhì)專業(yè)人才,目前這種人員狀況影響了高校數(shù)字圖書館建設(shè)的發(fā)展。
3.數(shù)字圖書館中館藏資源的合法性問題。現(xiàn)實圖書館合法取得復(fù)本,加上國家并未規(guī)定“公共借閱權(quán)”,因此一般不存在入藏資料的合法性問題。數(shù)字圖書館情況則不同,將圖書數(shù)字化,行使的是版權(quán)人的復(fù)制權(quán),這種復(fù)制權(quán)由作者控制 [3]。所以,數(shù)字圖書館所收藏文獻(xiàn)必須取得法律或著作權(quán)人的授權(quán)。信息資源的社會共享和知識產(chǎn)權(quán)的保護(hù),是網(wǎng)絡(luò)信息時代不可避免的兩個問題,兩者是對立和統(tǒng)一的關(guān)系,過分嚴(yán)厲的保護(hù)著作權(quán),只會抑制信息的傳播,并不能給權(quán)利人帶來更多的利益,使每個人都可以自由的獲取信息,才是人類社會的根本要求。但是給予作者和著作權(quán)有關(guān)的權(quán)利人信息網(wǎng)絡(luò)著作權(quán)是必要的,否則,就打破了著作權(quán)人的創(chuàng)作動力。當(dāng)然,還應(yīng)對這一權(quán)利進(jìn)行適當(dāng)?shù)南拗?,已達(dá)到社會利益和權(quán)利人個人利益的平衡。就數(shù)字圖書館而言,它的活動不是以營利為目的的,在要求信息資源共享的社會公眾利益和要求著作權(quán)保護(hù)的創(chuàng)作者個人利益之間,起著維護(hù)社會公眾利益的目的。因此,給予數(shù)字圖書館特殊的法律,通過圖書館獨特的傳播者地位,以保護(hù)公眾獲取信息的權(quán)利。
4.數(shù)字信息的長期存取問題。對于數(shù)字圖書館來說,保存文獻(xiàn)與保存文獻(xiàn)中的信息并不完全相同。早期,工作人員只是將數(shù)字信息長期存取的關(guān)鍵歸于數(shù)字媒體的保存上,呼吁改進(jìn)數(shù)字媒體的耐久性。然而,隨著數(shù)字技術(shù)變革速度的不斷加快,技術(shù)淘汰比數(shù)字媒體的形體損壞,對數(shù)字信息的長期存取具有更大的威脅。如何維護(hù)保證數(shù)字信息的長期存取,是中國數(shù)字圖書館建設(shè)中的關(guān)鍵所在。與傳統(tǒng)文獻(xiàn)一樣,數(shù)字信息的長期保存與其依附的媒體材料是不可分的,存儲媒體的損壞會導(dǎo)致數(shù)字信息的丟失。雖然媒體現(xiàn)有的壽命已超過了讀寫它的軟硬件的技術(shù)期限,但仍需要改進(jìn)媒體的穩(wěn)定性、存儲能力和延長使用壽命,以減少數(shù)字信息的丟失和降低存儲費用。
四、高校圖書館數(shù)字化建設(shè)的改進(jìn)
雖然數(shù)字化建設(shè)對圖書館而言是一個全新的實踐,但是在中國經(jīng)濟(jì)較發(fā)達(dá)的上海、廣東等省市的高校圖書館已經(jīng)率先進(jìn)行了一些探索和嘗試,我們應(yīng)該在汲取和借鑒其經(jīng)驗的基礎(chǔ)上,根據(jù)自身的特點科學(xué)的制定出一整套發(fā)展策略。
1.組建異構(gòu)數(shù)據(jù)的集成架構(gòu)。所謂異構(gòu)數(shù)據(jù)的集成是指對已經(jīng)存在的多個異構(gòu)數(shù)據(jù)庫,在盡可能少地影響其本地自治性的基礎(chǔ)上,構(gòu)造具有用戶所需要的某種透明性的分布式數(shù)據(jù)庫,以支持對物理上分布的多個數(shù)據(jù)庫的全局訪問和數(shù)據(jù)庫之間的互操作性。異構(gòu)數(shù)據(jù)集成技術(shù)是將各類信息通過一定的技術(shù)手段進(jìn)行整合,以更好地提供給人們利用的一種技術(shù)。為了更好地為讀者服務(wù),許多圖書館都建立了不同規(guī)模的應(yīng)用信息系統(tǒng),自建或引進(jìn)了大量的數(shù)據(jù)庫、資料庫。數(shù)字圖書館也同樣面臨著嚴(yán)峻的信息集成問題。圖書館要整合的數(shù)據(jù)庫主要包括書目數(shù)據(jù)庫、題錄/文摘數(shù)據(jù)庫、全文數(shù)據(jù)庫、電子期刊和電子圖書、相關(guān)的Web網(wǎng)站等。這些數(shù)據(jù)庫分布在不同的服務(wù)器,由不同的信息服務(wù)公司和出版社提供或由圖書館自建,成為各具不同特性的異構(gòu)數(shù)據(jù)庫,其異構(gòu)特征表現(xiàn)為數(shù)據(jù)模型異構(gòu)、數(shù)據(jù)結(jié)構(gòu)異構(gòu)、系統(tǒng)控制方式異構(gòu)、計算機(jī)平臺異構(gòu)、通信協(xié)議異構(gòu)、通信結(jié)構(gòu)模式異構(gòu)、操作系統(tǒng)異構(gòu)及網(wǎng)絡(luò)的異構(gòu) [3]。為了更好的為讀者服務(wù),許多圖書館都建立了各式各樣的應(yīng)用系統(tǒng),也引進(jìn)了大量的數(shù)據(jù)庫。由于這些應(yīng)用系統(tǒng)所基于的技術(shù)環(huán)境和針對的需求不同,彼此之間分離獨立,互操作困難,造成了資源浪費,信息得不到有效利用。如果使用信息集成技術(shù),將不同的數(shù)據(jù)庫中的信息進(jìn)行整合,統(tǒng)一到應(yīng)用需要的全局模式上,可以做到整合已有資源,發(fā)揮現(xiàn)有信息的更大作用。因此,設(shè)計數(shù)字圖書館的異構(gòu)數(shù)據(jù)集成架構(gòu)時,應(yīng)立足于對書目數(shù)據(jù)的集成,在集成架構(gòu)中加入數(shù)據(jù)倉庫元素,利用數(shù)據(jù)倉庫對集成的數(shù)目數(shù)據(jù)進(jìn)行統(tǒng)一視圖的組織和管理[3];用MARC作為集成的元數(shù)據(jù),利用MARC對書目數(shù)據(jù)進(jìn)行描述,并在MARC基礎(chǔ)上建立各類視圖;通過圖書館分類體系和主題詞表將書目數(shù)據(jù)按照不同的主題進(jìn)行組織。
2.開展信息檢索與跨庫檢索研究。作為一門學(xué)科的信息檢索,其檢索技術(shù)的不斷研究與應(yīng)用,一直對信息檢索領(lǐng)域產(chǎn)生著重要影響。目前研制的中文信息檢索方法或網(wǎng)上搜索引擎,無論是關(guān)鍵字符的機(jī)械式匹配,還是結(jié)合布爾邏輯運算提供更為復(fù)雜的查詢表達(dá)方式,多數(shù)是以關(guān)鍵詞匹配為基礎(chǔ)的。這種方式存在兩個缺陷:一是檢索結(jié)果只是在字面上符合用戶的要求,實際內(nèi)容往往偏離用戶的實際需要;二是用戶輸入的查詢詞稍有偏差,檢索系統(tǒng)就無法確定用戶的真正需要,因而無法提交正確的結(jié)果。
跨庫檢索系統(tǒng)為用戶提供了從統(tǒng)一界面訪問數(shù)字圖書館各類資源的便利。其中主要由研究模塊、用戶認(rèn)證管理和使用跟蹤模塊組成。研究模塊使用戶可從統(tǒng)一的界面檢索所選擇的各種信息資源,檢索結(jié)果可以排序和組織,檢索界面可由用戶定制,系統(tǒng)可以保存檢索策略、定期發(fā)送定題情報服務(wù)及E-mail發(fā)送檢索結(jié)果;用戶認(rèn)證管理模塊使系統(tǒng)管理員能夠很方便地設(shè)置和修改用戶的訪問權(quán)限,并針對不同用戶調(diào)整不同的訪問權(quán)限,或設(shè)置訪問特權(quán);使用跟蹤模塊用來獲取用戶訪問各種信息資源的使用信息,包括登錄或退出檢索系統(tǒng)的次數(shù)和時間、用戶的各種輸入和檢索信息。
五、總結(jié)
近年來從概念分析到現(xiàn)實技術(shù)的研究,各地方圖書情報理論學(xué)者對數(shù)字圖書館建設(shè)做了不少深入的探討。數(shù)字圖書館的出現(xiàn),不僅為我們帶來嶄新的思維理念,而且拓展了傳統(tǒng)圖書館的資源體系與服務(wù)模式,使得各種信息資源得到開發(fā)利用及社會共享,但我們也必須清醒意識到,數(shù)字圖書館建設(shè)畢竟是一項長期的系統(tǒng)的工程,它的發(fā)展有賴于現(xiàn)代信息技術(shù)的進(jìn)步和圖書館員自身素質(zhì)的提高,同時還面臨著信息增長與成本效益的矛盾、知識產(chǎn)權(quán)糾紛的問題。而我們目前理論界在對數(shù)字圖書館現(xiàn)實研究上還存在不少薄弱環(huán)節(jié),這些都有待于我們今后的研究與探討。我相信,未來數(shù)字圖書館的研究將逐步走向成熟與深入。
參考文獻(xiàn):
[1] 馮長根.數(shù)字時代圖書館的創(chuàng)新與共享[M].北京:中國科學(xué)技術(shù)出版社,2009:49-51.
[2] 崔慕岳.河南省數(shù)字化圖書情報系統(tǒng)研究[M].鄭州:鄭州大學(xué)出版社,2005:92-137.
[3] 王蘭成,敖毅.數(shù)字圖書館技術(shù):信息集成與信息檢索[M].北京:國防工業(yè)出版社,2007:83-256.[責(zé)任編輯 王玉妹]