徐輦
【摘 要】建設(shè)發(fā)展有價值的數(shù)字圖書館,是數(shù)字圖書館對用戶的承諾。遵循數(shù)字圖書館建設(shè)發(fā)展原則,以及從之而來的實踐經(jīng)驗,有利于建設(shè)、維護(hù)和發(fā)展數(shù)字圖書館。建設(shè)合理的組織、使用合適的標(biāo)準(zhǔn)和自動化系統(tǒng),能高質(zhì)量地處理和保存有價值的內(nèi)容,保護(hù)數(shù)字材料和版權(quán),使數(shù)字圖書館的內(nèi)容能夠持久保存且易于訪問。
【關(guān)鍵詞】數(shù)字圖書館;元數(shù)據(jù);開放獲??;數(shù)字版權(quán)
【中圖分類號】G252 【文獻(xiàn)標(biāo)識碼】A 【文章編號】1674-0688(2018)05-0228-02
0 引言
數(shù)字圖書館建設(shè)需要高昂的投資和海量的資源,因此針對數(shù)字圖書館的建設(shè)、維護(hù)和發(fā)展,相關(guān)方都會有一些基本的考慮和必須遵循的原則,這些原則不僅適用于將模擬對象轉(zhuǎn)換為數(shù)字形式,也適用于數(shù)字圖書館。遵循這些原則,并吸取從之而來的實踐經(jīng)驗,會使設(shè)計、建設(shè)和維護(hù)開發(fā)數(shù)字圖書館的工作受益。
1 數(shù)字圖書館發(fā)展原則
數(shù)字圖書館要適應(yīng)和迎合變革。持續(xù)變化的技術(shù)環(huán)境對于數(shù)字圖書館來說是一個巨大的挑戰(zhàn),紙質(zhì)文檔被轉(zhuǎn)換成數(shù)字格式。隨著技術(shù)的變革,當(dāng)市場不再支持相應(yīng)的系統(tǒng)和格式時,該格式的數(shù)字化文檔就會逐漸被淘汰。如果在某特定程序中創(chuàng)建一個重要文檔,那么為了訪問附件就會依賴這個特定程序,假設(shè)我們的目的是為后人保留重要信息,而未來技術(shù)的變革可能意味著普通用戶無法訪問這個文檔。
互聯(lián)網(wǎng)和Web技術(shù)使數(shù)字圖書館成為可能,數(shù)字圖書館設(shè)計者依賴現(xiàn)有的范例和工具,依然會出現(xiàn)不可預(yù)見的問題。比如,用HTML創(chuàng)建Web站點便于訪問數(shù)字圖像和文檔,但是也會因為HTML更改或被其他技術(shù)取代而過時。技術(shù)變革的速度超過管理者維護(hù)數(shù)字圖書館的能力,所以數(shù)字圖書館需要方法和計劃以應(yīng)對改變,保持對信息提供持久的訪問能力。
發(fā)展數(shù)字圖書館要切實了解“內(nèi)容”。對于用戶來說,內(nèi)容是數(shù)字圖書館中最值得關(guān)注的部分。創(chuàng)建者需要管理和決定數(shù)字圖書館的內(nèi)容,選擇包含的對象、數(shù)字化模擬形式,用標(biāo)準(zhǔn)語言(例如SGML)標(biāo)記項目,并分配元數(shù)據(jù),用以描述每個對象的內(nèi)容和其他屬性。
對于開發(fā)人員來說,在項目伊始確定元數(shù)據(jù)元素的性質(zhì)和數(shù)量非常重要。一些元數(shù)據(jù)元素描述了項目的內(nèi)容,包括標(biāo)題、創(chuàng)建者、發(fā)布日期和討論主題,其他元素可能被分配來管理集合,包括掃描狀態(tài)、質(zhì)量控制狀態(tài)和內(nèi)部注釋,以及數(shù)字對象的技術(shù)方面,例如文件格式和大小。
數(shù)字圖書館建設(shè)團(tuán)隊,需要包容不同背景及提供各種專業(yè)知識的成員。從多個領(lǐng)域獲得構(gòu)建系統(tǒng)的建議和幫助,從而建立更好的數(shù)字圖書館。
計算機(jī)科學(xué)和圖書館學(xué)是用于構(gòu)建數(shù)字圖書館最關(guān)鍵的兩個學(xué)科領(lǐng)域。計算機(jī)專家能領(lǐng)會和鑒別技術(shù)的可行性和局限性,關(guān)心數(shù)字圖書館元數(shù)據(jù)標(biāo)準(zhǔn)在龐大互聯(lián)網(wǎng)信息空間中提供的語義互操作性;而圖書館員是信息資源的管理者,具有豐富的編目和索引經(jīng)驗,并能認(rèn)識到這些概念對于信息檢索的重要性,而且他們了解用戶的信息需求,關(guān)心保存材料以繼續(xù)獲取和使用的問題。此外,能夠提供長期財政、材料、人力支持的組織和高層管理人員同樣重要。
設(shè)計“易用的系統(tǒng)”。大多數(shù)數(shù)字圖書館是通過網(wǎng)絡(luò)技術(shù)在互聯(lián)網(wǎng)Web上提供的。成功的Web站點設(shè)計包括許多因素,例如,計算機(jī)和瀏覽器之間的技術(shù)差異、訪問速度和用戶之間的差異、Web導(dǎo)航偏好等。瀏覽器在顯示信息的方式上有所不同,即使它們使用相同的基本通信協(xié)議(如Http、Https)和標(biāo)準(zhǔn)標(biāo)記語言(比如HTML或XML)。由于用戶可能會更改默認(rèn)設(shè)置,所以最好創(chuàng)建盡可能簡單的接口,并避免服務(wù)器端對數(shù)據(jù)的精確顯示進(jìn)行控制。此外,開發(fā)面向數(shù)字圖書館的接口時,對于具有一定物理缺陷的用戶來說,可訪問性也是一個問題。
確保開放存取的原則。確保開放存取與可用性問題密切相關(guān),包括對數(shù)字圖書館的內(nèi)容及對數(shù)字圖書館本身的訪問。確保對內(nèi)容開放存取的一種方法是避免使用專有的軟硬件解決方案。許多用于創(chuàng)建數(shù)字圖像的收費軟件,同時允許軟件接口免費使用,數(shù)字圖書館開發(fā)人員可以清楚地知道需要哪些軟件來查看這些圖像,可以方便地訪問這些內(nèi)容。為了確保持續(xù)可訪問性,開放的非專有系統(tǒng)是建設(shè)數(shù)字圖書館的首選。
數(shù)字版權(quán)意識。我國的版權(quán)法和著作權(quán)法保護(hù)數(shù)字知識產(chǎn)品,而開放獲取信息可能會威脅知識產(chǎn)權(quán)。數(shù)字信息基礎(chǔ)設(shè)施易于獲得大量信息,但是信息的不當(dāng)復(fù)制和訪問控制存在不確定途徑的風(fēng)險。創(chuàng)建數(shù)字圖書館應(yīng)關(guān)注這個問題,并參與討論相關(guān)的解決方案,盡可能地建立管理程序以保護(hù)館藏資源。例如,在數(shù)字轉(zhuǎn)換項目中,應(yīng)該得到實體版權(quán)所有者的許可。考慮個人隱私問題,當(dāng)重要的私人文件被數(shù)字化的時候,要根據(jù)捐贈者標(biāo)記出的敏感物品及處置說明,仔細(xì)地跟蹤權(quán)限和隱私信息,確保這些信息不存在法律風(fēng)險。
系統(tǒng)自動化程度。建立數(shù)字圖書館需要系統(tǒng)創(chuàng)建者進(jìn)行大量的腦力勞動,構(gòu)建和使用自動化工具越多,就能更好地利用寶貴的人力資源;這些工具使內(nèi)容專家能夠?qū)W⒂谥R任務(wù)(如圖1所示),只需使用元數(shù)據(jù)輸入系統(tǒng)向主數(shù)據(jù)庫一次性添加元數(shù)據(jù),然后根據(jù)訪問用戶的需要從主數(shù)據(jù)庫提取和組合這些信息,生成HTML頁面、搜索索引和報告。一次性輸入數(shù)據(jù)可以節(jié)省人力和時間,降低錯誤率,并允許最大的靈活性。幾乎整個Web界面都是由數(shù)據(jù)庫生成的,只要有必要就允許更新,同時能遵循最新的Web標(biāo)準(zhǔn)。系統(tǒng)進(jìn)行模塊化設(shè)計時,要求現(xiàn)有模塊易于修改,易于為新功能添加新模塊。
采用并遵循標(biāo)準(zhǔn)。在系統(tǒng)構(gòu)建中遵循標(biāo)準(zhǔn)使應(yīng)用程序易于擴(kuò)展、可互操作和可移植,這些特性對于數(shù)字圖書館的設(shè)計、實現(xiàn)和維護(hù)非常重要。使用標(biāo)準(zhǔn)對于數(shù)字圖書館來說尤其重要,掃描、元數(shù)據(jù)輸入和文檔標(biāo)記,集合中所有涉及需要評估和處理的單個項目,都是資源任務(wù)密集型的工作,需要一次性完成。遵循標(biāo)準(zhǔn)將使今后可能發(fā)生的數(shù)據(jù)遷移更加容易實現(xiàn)。此外,使用標(biāo)準(zhǔn)文件格式保存的信息,比用專有格式編碼的信息更容易訪問。
對于開發(fā)人員來說,使用標(biāo)準(zhǔn)更易于實現(xiàn)互操作性。通過使用標(biāo)準(zhǔn)通用的數(shù)據(jù)標(biāo)簽和Web技術(shù),發(fā)布數(shù)字圖書館的內(nèi)容,增加其他Web搜索引擎訪問圖書館及其中具體條目的機(jī)會。未來數(shù)字圖書館或許能成為某個更寬泛的系統(tǒng)組成部分,那么開放的標(biāo)準(zhǔn)設(shè)計,將使未來的轉(zhuǎn)換和重組更加平順。
保證質(zhì)量的原則。質(zhì)量度量可以應(yīng)用于創(chuàng)建一個數(shù)字圖書館所涉及的所有過程和結(jié)果。它們與選擇、元數(shù)據(jù)條目、圖像捕獲及系統(tǒng)的總體可用性有關(guān)。完整和正確的元數(shù)據(jù)會帶來許多好處;不完全或不正確的元數(shù)據(jù)會影響整個數(shù)字圖書館的建設(shè)質(zhì)量。元數(shù)據(jù)在資源發(fā)現(xiàn)和集合管理方面都扮演著重要角色,如果主題代碼被隨意或不正確地應(yīng)用,那么根據(jù)這些代碼生成瀏覽層次結(jié)構(gòu)的嘗試可能會被阻止,訪問可能會更加困難。
轉(zhuǎn)換項目中掃描過程的指導(dǎo)方針,如果包括對被掃描圖像的外觀標(biāo)準(zhǔn),如方向、分辨率、色調(diào),將會減少很多潛在的問題。一些質(zhì)量控制指標(biāo)可以實現(xiàn)自動化,有些則需要人工審查。數(shù)字圖書館項目應(yīng)定義并堅持實施質(zhì)量控制方法,確保質(zhì)量評估成為構(gòu)建和維護(hù)數(shù)字圖書館的重要組成部分。
內(nèi)容持久性原則。對于數(shù)字圖書館而言,首先是數(shù)字對象的“遷移策略”,它要求將數(shù)據(jù)從一個文件格式轉(zhuǎn)換為另一個文件格式,從一個軟件環(huán)境轉(zhuǎn)換為另一個軟件環(huán)境,或者從一個物理介質(zhì)轉(zhuǎn)移到另一個物理介質(zhì)。遷移意味著機(jī)構(gòu)強(qiáng)大持久的承諾和支持,不斷刷新其集合以跟上技術(shù)進(jìn)步的步伐。其次是數(shù)字對象的保存和持久性,保存是指對象的技術(shù)壽命和質(zhì)量;持久性則是一個更廣泛的概念,包含保存,也包括這個對象將來是否還會以其他形式存在。數(shù)字信息的持久性意味著存儲信息并保持其可訪問。
2 結(jié)語
遵循以上原則,以及從這些原則演變而來的實踐經(jīng)驗,可以讓我們更加方便、順利地建設(shè)、維護(hù)和發(fā)展數(shù)字圖書館,保護(hù)高質(zhì)量有價值的信息資源,為用戶持續(xù)提供開放的訪問服務(wù)而努力。
參 考 文 獻(xiàn)
[1]阿姆斯.數(shù)字圖書館概論[M].北京:電子工業(yè)出版社,2001.
[2]張樹忠.人、組織、技術(shù)共同演繹的精彩故事——《數(shù)字圖書館概論》評介[J].大學(xué)圖書館學(xué)報,2001(5):84.
[3]曾蕾,張甲,楊宗英.數(shù)字圖書館:路在何方?——關(guān)于數(shù)字圖書館定義、結(jié)構(gòu)及實際項目的分析[J].情報學(xué)報,2000(1):67-76.
[4]邱均平,朱少強(qiáng).數(shù)字圖書館版權(quán)保護(hù)技術(shù)及其規(guī)避行為的法律對策[J].情報科學(xué),2006(1):1-7.
[5]杜文才.數(shù)字圖書館建設(shè)中的數(shù)據(jù)交換標(biāo)準(zhǔn)問題芻議[J].現(xiàn)代圖書情報技術(shù),2003(S1):14-16.
[責(zé)任編輯:高海明]