宋麗斌
(營口市圖書館,遼寧 營口 115000)
自上世紀(jì)90年代中期以后,我國圖書館界開始步入數(shù)字化建設(shè)的軌道。十幾年來,在建設(shè)計算機(jī)通信網(wǎng)絡(luò)、應(yīng)用先進(jìn)的信息技術(shù)、建設(shè)數(shù)據(jù)庫等方面都取得了很大成績,但同時也存在許多問題。
眾所周知,數(shù)字圖書館不能脫離網(wǎng)絡(luò)而存在,數(shù)字文獻(xiàn)的一個重要優(yōu)勢就是能夠通過計算機(jī)通信網(wǎng)絡(luò)進(jìn)行遠(yuǎn)距離傳輸,任何脫離網(wǎng)絡(luò)的數(shù)字文獻(xiàn)的存儲場所都不能稱為真正意義上的數(shù)字圖書館,這種數(shù)字文獻(xiàn)的存儲場所和傳統(tǒng)圖書館沒有什么質(zhì)的區(qū)別。網(wǎng)絡(luò)把各個個體的數(shù)字圖書館連成一個整體,從而才能使人們一直向往的文獻(xiàn)資源共享有可能真正實(shí)現(xiàn)。因此,在進(jìn)行數(shù)字化建設(shè)時,必須遵循整體性這樣一個重要原則。在信息資源的建設(shè)和保存、網(wǎng)絡(luò)技術(shù)的應(yīng)用、自動化集成管理系統(tǒng)的選擇、分類和主題標(biāo)引、書目數(shù)據(jù)格式的標(biāo)準(zhǔn)等方面都必須遵循整體性原則。例如CALIS項目的實(shí)施以及當(dāng)前一些地區(qū)的圖書館統(tǒng)一采購數(shù)據(jù)庫,實(shí)際上正是自然地服從了數(shù)字圖書館的整體原則。各圖書館的數(shù)字資源建設(shè)應(yīng)該在一個大范圍內(nèi)全盤考慮,不能追求“小而全”、“大而全”,或者因為“條塊分割”,造成全文數(shù)據(jù)庫重復(fù)建設(shè)的巨大浪費(fèi)。
這個問題有廣義和狹義兩個方面。從廣義來看,涉及到對圖書館數(shù)字化發(fā)展趨勢的認(rèn)識,曾有兩種觀點(diǎn)。一種認(rèn)為數(shù)字文獻(xiàn)最終將會取代紙質(zhì)文獻(xiàn),而另一種則認(rèn)為,所謂“數(shù)字圖書館”是繼20世紀(jì)70年代“縮微圖書館”之后的又一個神話,圖書館數(shù)字化發(fā)展是一種時尚,它將會隨著時間的推移而逐漸淡化。這兩種觀點(diǎn)現(xiàn)在看來并不科學(xué)。因為紙質(zhì)文獻(xiàn)和數(shù)字文獻(xiàn)各有優(yōu)勢,紙質(zhì)文獻(xiàn)便于長期保存、便于閱讀;而數(shù)字文獻(xiàn)能進(jìn)行遠(yuǎn)距離傳遞,檢索方便,能被隨意編輯,并能同時被數(shù)量較多的人使用。所以二者不能互相取代,應(yīng)該是各成系統(tǒng),優(yōu)勢互補(bǔ)。從狹義上看,涉及到一個圖書館中紙質(zhì)和數(shù)字兩種文獻(xiàn)在館藏中各占多少比例最為合適的問題。這可能與讀者的需求、讀者的設(shè)備條件、網(wǎng)絡(luò)條件和對各類圖書館的職能要求(如大型的公共圖書館往往擔(dān)負(fù)一個地區(qū)的文獻(xiàn)保存職能)有密切關(guān)系,因此,各類圖書館的比例是不同的。比較而言,公共圖書館數(shù)字文獻(xiàn)所占的比例應(yīng)該最低,高校館要高一些,科學(xué)院圖書館最高。
這個問題涉及到兩個方面:一是要接受“能獲取,但不擁有”的理念;二是要對各類圖書館的保存職能進(jìn)行重新探討,后者實(shí)際是前者的延續(xù)。虛擬館藏具有及時高效,又不需添置許多昂貴設(shè)備和增加維護(hù)人員的優(yōu)點(diǎn),但同時具有如果供應(yīng)方出現(xiàn)問題,就有可能永遠(yuǎn)失去這部分館藏的缺陷。虛擬館藏是數(shù)字文獻(xiàn)優(yōu)勢的體現(xiàn),要進(jìn)行數(shù)字化,就必須接受虛擬館藏,同時接受“能獲取,但不擁有”的理念,此外,也要尋找預(yù)防失去館藏的對策。需要重新審視各類圖書館的保存職能,有些館可以以用為主;有些館甚至可以只用不藏;而有些館則應(yīng)該擔(dān)負(fù)起保存人類文化遺產(chǎn)的職能。比如,在一個地區(qū)中,不能所有的圖書館都只有虛擬館藏,必須有一個館收藏有同樣種類的實(shí)體館藏。這是人類社會賦予圖書館的一個極其重要的職能。以上一些認(rèn)識問題都是由于忽視對基礎(chǔ)理論的研究而產(chǎn)生的。筆者認(rèn)為,在目前圖書館數(shù)字化(或數(shù)字圖書館)建設(shè)的領(lǐng)域中,存在輕基礎(chǔ)理論研究、重技術(shù)研究的傾向。這實(shí)際上又是一種思想認(rèn)識上的問題。
這種傾向表現(xiàn)在兩個方面:一是從整體上來說,較為重視技術(shù)問題的研究。有關(guān)研究數(shù)字信息采集、整理、保存、傳遞等技術(shù)的文章所占的比例較大,這似乎給人們一種印象,研究數(shù)字圖書館就是研究和數(shù)字圖書館相關(guān)的各種技術(shù)。二是表現(xiàn)在研究有關(guān)理論的時候,完全忽視了圖書館的人文因素和專業(yè)人員的作用。如在討論“數(shù)字圖書館”的定義時,很多觀點(diǎn)都認(rèn)為圖書館就是一種網(wǎng)絡(luò)化的計算機(jī)系統(tǒng)。有的認(rèn)為:“數(shù)字圖書館是國際網(wǎng)絡(luò)將由分布式的計算機(jī)節(jié)點(diǎn)演進(jìn)分布式的信息資源。該網(wǎng)絡(luò)將提供由信息物品相互聯(lián)結(jié)而構(gòu)成的信息空間?!庇械恼J(rèn)為:“數(shù)字圖書館是一種多媒體制作的分布式信息系統(tǒng)。它把不同載體、不同地理位置的信息資源用數(shù)字技術(shù)存儲,以網(wǎng)絡(luò)查詢和傳播的一個大型信息系統(tǒng)?!边€有的認(rèn)為:“構(gòu)成數(shù)字圖書館的基本要素是數(shù)字化資源、網(wǎng)絡(luò)存取和分布式管理?!庇脩艉蛯I(yè)人員的因素在這里都淡化了。
幾千年來,人類記錄、整理、傳播信息的技術(shù)手段不斷發(fā)生變化。從歷史上看,每一次技術(shù)革新,其難度和復(fù)雜程度以及個性化程度都比前一次有所提高,從而迫使圖書館專業(yè)人員的參與程度也相應(yīng)隨之提高。例如,對印刷技術(shù)和造紙技術(shù),圖書館專業(yè)人員基本上是拿來就用,不需要了解和掌握這些技術(shù);然而,縮微技術(shù)和視聽技術(shù)就需要圖書館專業(yè)人員不僅要熟悉應(yīng)用方法,而且還要了解其工作原理,這是因為一方面需要圖書館專業(yè)人員能承擔(dān)起日常維護(hù)縮微或視聽設(shè)備的任務(wù);另一方面是由于這些技術(shù)已經(jīng)使信息的記錄具有個性化的特點(diǎn),所以圖書館專業(yè)人員還需要具有利用這些技術(shù)制作文獻(xiàn)的能力;數(shù)字化技術(shù)更為復(fù)雜,個性化程度更強(qiáng),圖書館專業(yè)人員的參與程度也就更高,圖書館專業(yè)人員不僅要知道如何應(yīng)用,而且還要了解甚至精通有關(guān)計算機(jī)技術(shù)、網(wǎng)絡(luò)技術(shù)、軟件技術(shù)等等,才能使數(shù)字化建設(shè)得以順利進(jìn)行。因此,在圖書館數(shù)字化進(jìn)程中加強(qiáng)或重視對技術(shù)的研究勢所必然,無可厚非。
可是,技術(shù)問題歸根結(jié)底還是手段問題,是幫助人類實(shí)現(xiàn)某種目的的手段。圖書館是人類社會保存、整理、傳播知識的一種機(jī)構(gòu),圖書館的出現(xiàn)與發(fā)展是一種社會現(xiàn)象,因此,在圖書館數(shù)字化的進(jìn)程中,必須深入地研究數(shù)字圖書館建設(shè)的原則,數(shù)字化對圖書館的性質(zhì)、職能產(chǎn)生的影響,數(shù)字化對傳統(tǒng)圖書館的管理模式和工作機(jī)制產(chǎn)生的影響,讀者和圖書館專業(yè)人員的關(guān)系會發(fā)生的變化等基礎(chǔ)理論問題,為圖書館數(shù)字化建設(shè)構(gòu)建一個完整的理論體系,只重視技術(shù)則有可能將圖書館數(shù)字化進(jìn)程引向歧路。
目前的轉(zhuǎn)換技術(shù)主要有兩種:圖像處理和文本處理,或者兩者結(jié)合。前者準(zhǔn)確率高,制作速度快,又能保持原貌,但占用空間大,不能進(jìn)行全文檢索;后者需要校對時間,轉(zhuǎn)換成本高,但能進(jìn)行全文檢索,占用空間小。最理想的是將兩者結(jié)合起來,也就是既能看到原貌,又能進(jìn)行全文檢索,但是這樣的轉(zhuǎn)換成本就更高??梢哉f,目前沒有一種理想的、成本又低的轉(zhuǎn)換技術(shù)。現(xiàn)在要進(jìn)行紙質(zhì)文獻(xiàn)數(shù)字化轉(zhuǎn)化,需要根據(jù)文獻(xiàn)的不同情況來選擇轉(zhuǎn)換技術(shù)。一般來說質(zhì)量較高或利用率較高的紙質(zhì)文獻(xiàn)可以用文本處理或兩者結(jié)合的處理方法。
網(wǎng)絡(luò)資源的加盟使傳統(tǒng)的整序技術(shù)無法適應(yīng)對數(shù)字文獻(xiàn)整序的需要。為適應(yīng)這種情況,目前已經(jīng)出現(xiàn)了很多方法,如利用機(jī)器自動抽詞,對MARC進(jìn)行改進(jìn)等等。可以說目前在對數(shù)字文獻(xiàn)整序的技術(shù)領(lǐng)域中,已經(jīng)形成了一種多元化的格局。這樣將會影響標(biāo)引的質(zhì)量和檢索利用的效果,為用戶和圖書館工作者都帶來麻煩,因此需要對這些方法進(jìn)行整合,根據(jù)具體情況制定統(tǒng)一標(biāo)準(zhǔn)。
這里指的是“無縫”跨庫檢索技術(shù)。對用戶來說,這種檢索技術(shù)可以使他們在面對所有相關(guān)數(shù)據(jù)庫時,不需要逐一對每個數(shù)據(jù)庫進(jìn)行檢索??鐜鞕z索技術(shù)應(yīng)該不僅使用戶能對同一節(jié)點(diǎn)的不同數(shù)據(jù)庫同時進(jìn)行檢索,而且也能用于檢索分布在不同地域的各種不同的然而又相關(guān)的數(shù)據(jù)庫。這樣就能節(jié)省用戶的檢索時間,提高檢索效率;同時也可以節(jié)省圖書館專業(yè)人員的時間(不需要對用戶逐一介紹每一個數(shù)據(jù)庫的使用方法。
解決跨庫檢索要做好兩項工作。一是各種數(shù)據(jù)庫都要使用通用的程序語言,遵循統(tǒng)一的格式,向標(biāo)準(zhǔn)化發(fā)展;另一方面是建立高層信息搜索管理中間件系統(tǒng)。這種中間件系統(tǒng)作為用戶界面和數(shù)據(jù)圖書館底層信息服務(wù)的中間層,將用戶查詢翻譯為通用查詢語言,根據(jù)不同的條件選擇并調(diào)用合適的信息服務(wù)設(shè)施,最后將底層返回的信息匯總,提交給用戶。具體來說,目前要做的工作有:建立統(tǒng)一的元數(shù)據(jù)及元對象庫;組織開放體系結(jié)構(gòu)的數(shù)字對象庫,建立通用的庫訪問協(xié)議;實(shí)驗建立分布式不同數(shù)字對象的調(diào)度系統(tǒng);設(shè)計實(shí)現(xiàn)方便的網(wǎng)絡(luò)用界面及實(shí)用的系統(tǒng)管理界面;數(shù)字對象的描述方式要支持不同源的分布式查詢和檢索等等。
數(shù)字文獻(xiàn)要做到長期存取是很不容易的,這是因為載體的壽命有限。目前壽命最長的是光盤,據(jù)說有70年,磁盤、磁帶一般就只有10多年,其中有技術(shù)過時問題。計算機(jī)軟硬件一直在發(fā)展,軟硬件環(huán)境不同,文獻(xiàn)就不能被讀出,可靠性較差,容易被不留痕跡地修改,并極易受到外力的干擾和破壞。計算機(jī)病毒、磁場、電磁脈沖對數(shù)字信息和計算機(jī)系統(tǒng)都具有極大的破壞性。由此可見,人們發(fā)出“脆弱的數(shù)字圖書館”的感嘆不是沒有道理的。數(shù)字文獻(xiàn)的長期存取問題如得不到解決,就會成為埋藏在圖書館數(shù)字化進(jìn)程中的一顆定時炸彈。
目前認(rèn)為最好的解決方法是“遷移”。這種“遷移”不是簡單的復(fù)制,它是一種隨著技術(shù)變化定期改變數(shù)字信息格式的處理過程。它要將數(shù)字信息從穩(wěn)定性低的媒體遷移到穩(wěn)定性更高的載體上,從對軟件依賴性強(qiáng)的格式遷移到對軟件依賴性低的格式上;將數(shù)字信息從各式各樣的格式上遷移至更容易管理的標(biāo)準(zhǔn)格式中。此外,對計算機(jī)系統(tǒng)需要不斷加強(qiáng)在安全方面的投入。
[1] 吳志榮.試論數(shù)字圖書館時代的新理念和新方法.圖書情報知識,2002(1).
[2] 吳傳爐.數(shù)字圖書館建設(shè)項目綜述.情報科學(xué),2000(4).
[3] 呂行.關(guān)于我國數(shù)字圖書館建設(shè)問題和對策的思考.圖書館論壇,2004(2).
[4]吳恒岱.關(guān)于數(shù)字圖書館幾個問題的思考.海洋信息,2005(2).
[5]馬啟花.關(guān)于數(shù)字圖書館建設(shè)的思考.廣西社會科學(xué),2002(2).