易炳明
重慶市開縣圖書館,重慶 634400
隨著網絡技術及信息技術的不斷發(fā)展,信息的種類及其形式也越來越多樣化,傳統(tǒng)圖書館模式已經不能很好地滿足這些需求,數字圖書館應運而生。數字圖書館是經過電子化處理的信息倉儲資源,可以存儲并組織大量的信息,用戶可以不受時間與空間的限制,通過網絡方便地訪問所需要的信息資源。本文將著重探討一下有關數字圖書館的發(fā)展及應用。
數字圖書館屬于高技術發(fā)展下的產物之一,信息技術的集成是數字圖書館建設中的重要功能。細化而言,數字圖書館涉及到許多關鍵技術,比如:數字化技術、網絡技術、多媒體技術、安全保密技術、檢索技術、自然語言理解技術以及海量數據庫技術等等。
數字圖書館的內涵比較廣,其并不是單純的基于網絡的圖書館主頁,而是一個整合的數字化資源集合,是將傳統(tǒng)的資源進行數字化轉化或者以電子化形式呈現的信息資源。
數字圖書館的組成結構是系統(tǒng)建設的基礎,是借助于網絡以及計算機技術實現的關鍵。它的目標是能夠更好地與下一代互聯網相匹配,從而發(fā)展成為一個開放、實用的系統(tǒng)結構。其組成主要包括四大部分,如下描述:
1)資源加工系統(tǒng)。該部分能夠對傳統(tǒng)資源進行數字化處理,并多媒體信息進行格式方面的規(guī)范處理及整理;
2)存儲管理系統(tǒng)。該部分主要負責對數字化信息資源進行分類、組織及存儲,并提供信息數據的安全備份服務;
3)資源調度系統(tǒng)。該部分主要是針對于分布式存儲的數據資源,實現共享、協調以及檢索等核心功能;
4)網絡運營系統(tǒng)。該部分可能為數字圖書館系統(tǒng)的用戶提供一些在線服務,比如:在線檢索、在線下載、信息發(fā)布等等。
在數字化的發(fā)展浪潮中,我國與世界發(fā)展步伐緊緊跟隨,越來越多的單位企業(yè)都在積極建設各種類型、各種規(guī)模的數字圖書館項目,其中有國家級、省市級以及單個子項目等。下面根據我國主要的數字圖書館項目,闡述一下我國數字圖書館的發(fā)展現狀。
首先,中國數字化圖書館工程。中國數字化圖書館工程是一個宏大的系統(tǒng)工程,是基于寬帶網絡的信息資源庫群。該工程的建設思路是:先建設急需求的、容易的,從小到大循序漸進。而在技術實現的途徑方面,則是采用與國際同類主流技術相一致的方案,如:通用化的置標語言、公共對象請求代理模式、統(tǒng)一化的資源名稱等等,選擇支持分布式面向對象的軟件技術,為用戶提供對各種信息資源的檢索服務。
其次,國家科技數字圖書館。國家科技數字圖書館是虛擬化的科技信息資源機構,主要是根據國家科技發(fā)展的需求,收集、組織并管理有關理、工、農、醫(yī)等各個學科文獻資源,并面向全國提供服務,不斷促進科技資源的有效傳播及共享。
另外,中國知識基礎設施工程。中國知識基礎設施工程簡稱CNKI,主要是由清華同方與中國學術期刊研究院聯合承擔創(chuàng)建的,也是一項很大的系統(tǒng)工程。其涉及到的主要信息資源有:資源的數字化建設和挖掘、知識整合、知識倉庫的建設、網絡傳播體系以及數據庫生產基地建設等。CNKI項目是以中國學術期刊最為有名,已經成為我國最大的期刊文獻檢索系統(tǒng),并形成了完整的經營鏈,建立了產業(yè)化的服務體系。
首先,當前大部分的數字圖書館可以為每一個數據源提供獨立的檢索界面,如:超星電子圖書館系統(tǒng)、期刊圖書館系統(tǒng)都有各自不同的界面。但數據庫資源類別越來越多,對于每個數據源都有一個對應的界面,顯然會帶來一些不便。因此,建立一個統(tǒng)一的快速檢索平臺,并提供異構數據庫以及分布式數據庫快速檢索的需求是必須的。
其次,全文檢索技術能夠很好地彌補單純以字段為關鍵詞進行檢索的不足,其可以根據文件信息資源生成對應的索引數據庫,當用戶進行檢索時,就可以直接從全文索引數據庫中進行匹配定位。
另外,數字圖書館系統(tǒng)中的電子信息資源還涉及到了音視頻等多媒體信息資源,對其采用類似于編目的方式進行結構化標注可以實現多媒體信息的檢索,其關鍵之處在于多媒體信息的特征提取。比如:基于內容的檢索就需要對多媒體信息進行語義分析;視覺特征的提取涉及到顏色、形狀以及紋理等。
數字參考系統(tǒng)是伴著近代圖書室的發(fā)展而得到應用的,其應用形式也從原先的BBS模式發(fā)展到了多樣化模式,是個性化服務的很好體現。目前,數字參考系統(tǒng)所涉及到的參考對象、服務模式以及服務層次都有了很大的應用擴展,其中服務應用模式主要涉及到:幫助系統(tǒng)、FAQ模式、實時網上參考、同步咨詢的決策支持以及信息調查等。另外,在數字參考系統(tǒng)的實現方面也有多種方式,比如:用戶登陸系統(tǒng)可獲得參考結果的自動反饋信息;系統(tǒng)可提供關鍵問題的檢索目錄以及歷史記錄等。
信息過濾是數字圖書館應用過程中的一個系統(tǒng)化分析方法,可以根據動態(tài)的多元信息流,獲取與用戶需要相匹配的信息。信息過濾需要考慮多種因素,如:用戶的歷史檢索記錄、用戶間的相似性、資料間的相似性等。通常情況下,信息過濾的數據源是動態(tài)非結構或者半結構的數據,而信息需求則會以用戶的興趣為參考進行定義,過濾行為就是將與用戶無關的信息進行過濾。
數字圖書館系統(tǒng)中涉及到的文獻間相關性分析、用戶需求模型的優(yōu)化、用戶的訪問序列、Web頁面采集、近期熱點文獻分析等問題都可以依靠數據挖掘技術的應用來解決。特別是近來的數據挖掘技術可以很地為個性化服務提供良好地支持。一個完善圖書館的個性化系統(tǒng)能為用戶自動推薦用戶感興趣的文獻、能統(tǒng)計分析用戶的文獻需求規(guī)律、能自動整合不同的信息源、能發(fā)現不為人知的有用的知識,這些也都可以依靠數據挖掘技術的應用來實現。
數字圖書館的發(fā)展正處于一個充滿機遇和挑戰(zhàn)的時代。在這種情況下,分析數字圖書館發(fā)展現狀及應用、探究其未來發(fā)展情景,將有助于進一步理清發(fā)展戰(zhàn)略、明確建設發(fā)展方向,具有重要的理論和現實意義。
[1]周欣穎.數字化圖書館建設的發(fā)展[J].中國新技術新產品, 2009(24).
[2]黃煒宇.我國數字圖書館資源數字化建設研究[J].內蒙古科技與經濟, 2009(14).