〔摘 要〕本文介紹了開放源碼軟件Dspace及在圖書館的應用,并介紹了DSpace的功能特征及在圖書館操作中的流程,并談了開源軟件DSpace使用的利與弊。
〔關鍵詞〕開源軟件;Dspace;機構倉儲
〔中圖分類號〕G250.7 〔文獻標識碼〕B 〔文章編號〕1008-0821(2009)03-0150-02
“開放源碼”(open source)用于描述那些源碼可以被公眾使用的軟件,并且此軟件的使用、修改和發(fā)行也不受許可證的限制。由于Internet發(fā)展的推動,開放源碼軟件正在許多日常工作的幕后扮演著日益重要的角色,比如Web瀏覽和E-mail。軟件開發(fā)者開始攜手支持linux這種開放源碼操作系統(tǒng),使用者也開始認識開放源碼軟件,這些意味著你將會看到越來越多的開放源碼軟件。
開源軟件同時涉及源碼本身和開發(fā)過程,涵蓋了3個方面的意義:免費分發(fā)的源代碼、模塊化的體系和集市式的開發(fā)——在這種開發(fā)方式中,任何地方的任何人都可以參與最終產品的制造;另一方面,任何人都可以復用和發(fā)行開源軟件的代碼這一事實又支持了公眾利益,因為創(chuàng)新的觀念被所有用戶所共享。
目前在圖書館數(shù)字化的流程中許多圖書館采用了不同的開源軟件,使用最多的是數(shù)據(jù)庫底層 軟件和一些數(shù)圖的應用軟件。如:我的圖書館軟件、門戶軟件、DSpace開放獲取數(shù)據(jù)庫的設 置等。本文重點介紹DSpace軟件在圖書館機構倉儲中的應用。DSpace已被學術機構廣泛使用 ,以達到學術資源的有效管理與再利用的工具軟件,DSpace不僅實用與單一的圖書館數(shù)據(jù)庫 的建設,也適用于跨組織的機構存儲。
機構倉儲(Institutional Repository(簡稱IR)又稱機構庫是收集、存放由某個或多個學術機構(例如大學、研究所、圖書館、博物館等)專家、教授、學生創(chuàng)造的、可供機構內外用戶共享的學術文獻的數(shù)據(jù)庫[1]。機構倉儲可以由一個機構或聯(lián)合許多機構組成聯(lián)盟一起創(chuàng)建。它隨著計算機的普及、學術出版的電子化以及網(wǎng)絡技術的快速發(fā)展、為實現(xiàn)科學信息資料開放獲取而產生。國外用于機構存儲的創(chuàng)建工具已比較成熟,代表性的工具有DSpace和Greenstone。DSpace是美國麻省理工學院圖書館與惠普科技公司共同合作,遵循Mozilla協(xié)議基于BSD開放原代碼(open source)許可的DSpace源碼方式開發(fā)的。其他使用者,可以直接利用或改寫軟件的方式,便可利用DSpace來創(chuàng)建自己的機構存儲知識庫。
1 DSpace系統(tǒng)功能特點
1.1 存儲內容格式類型不限
DSpace系統(tǒng)主要用于長期保存機構的各種數(shù)字化資源,包括期刊論文、圖書、圖書章節(jié)、數(shù)據(jù)集、學習資源、圖像、3D圖像、地圖、樂譜、設計圖、預印本、錄音記錄、音樂錄音、軟件、技術報告、論著、視頻、工作文檔等等。DSpace系統(tǒng)可以存儲幾乎所有格式的數(shù)字化的文字、圖像、音頻和視頻資源。
1.2 DSpace的支撐軟件
DSpace的安裝和正常運行需要如下的軟件來配套:①操作系統(tǒng)安裝:RedHat Enterprise 4.0,作為裸機的支撐系統(tǒng);②DSpace:安裝之前先下載DSpace安裝源代碼和上述PostgreSQL數(shù)據(jù)庫版本相對應版本的PostgreSQL JDBC驅動程序;③DNS服務器安裝與配置;④Jakarta Tomcat安裝與配置:安裝之前先下載2個安裝包,分別是jakarta tomcat和jdk;⑤E-mail 服務器安裝與配置:若需要E-mail進行注冊驗證時,服務器在操作系統(tǒng)安裝時就安裝好E-mail服務器了,可以下載最新的Sendmail或Postfix源代碼安裝包(現(xiàn)在最新版本分別是8.13 .5和2.2.5);⑥數(shù)據(jù)庫安裝與配置:使用PostgreSQL數(shù)據(jù)庫配置或者Oracle數(shù)據(jù)庫配置 作為底層數(shù)據(jù)庫。
1.3 數(shù)據(jù)組織模型
DSpace系統(tǒng)中有5種數(shù)據(jù)模型,分別是社區(qū)(community)、合集(collection)、條目(item)、數(shù)字包(bundle)和比特流(bitstream)。
1.4 規(guī)范的元數(shù)據(jù)標引
DSpace系統(tǒng)采用DC元數(shù)據(jù)來標引上述各種數(shù)據(jù)模型。在創(chuàng)建上述數(shù)字對象或者提交學術資源時,系統(tǒng)將要求提交人員同時提供該學術資源的元數(shù)據(jù)信息,或者由專門負責標引審核的人員對提交的學術資源的元數(shù)據(jù)進行編輯或修改。運用DC元數(shù)據(jù)對這些學術資源進行充分的標引,對這些資源的保存、揭示、檢索和利用提供了良好的基礎。
1.5 支持OAI協(xié)議和OpenURL協(xié)議
通過OAI接口,有關機構(如Google Scholar和OAIster)可以定期或不定期對DSpace系統(tǒng)的元數(shù)據(jù)進行收割(DSpace系統(tǒng)中DC元數(shù)據(jù)默認是公開的,并允許其他系統(tǒng)對其收割)。通過對元數(shù)據(jù)的收割利用,無疑加快和提高了相關資源的傳播與利用,促進了學術成果的交流和 科研的發(fā)展。
另外,由于DSpace系統(tǒng)支持OpenURL協(xié)議,對于擁有SFX服務器的機構,通過設置DSpace系統(tǒng),系統(tǒng)將在每個條目頁面上顯示一個OpenURL鏈接,同時能夠響應外來的OpenURL請求,這些都有利于相關信息的被檢索與利用。
1.6 良好人機界面與管理功能
在Web界面下,可以方便地按不同的方式瀏覽DSpace資料庫中的條目。管理員可以在DSpace系統(tǒng)管理界面中創(chuàng)建或刪除相關的數(shù)字對象,對數(shù)字對象的權限進行控制管理,對用戶與群組進行控制管理,對數(shù)字對象的相關元數(shù)據(jù)進行編輯,以及DSpace系統(tǒng)一些相關設置等。
1.7 統(tǒng)計分析
DSpace系統(tǒng)有一個強大的日志記錄功能,對系統(tǒng)的安裝、運行和使用情況都有詳細的日志記錄。使用DSpace系統(tǒng)自帶的日志分析工具自動對系統(tǒng)使用情況部分進行統(tǒng)計分析,可以得到對管理員或用戶有幫助意義的統(tǒng)計報表。
2 DSpace在機構存儲系統(tǒng)的應用
DSpace是用于自行存儲開放獲取資源的軟件,目前DSpace1.3a已經發(fā)布,可訪問http:∥sourceforge.net/projects/dspace/目前版本有日志分析、可翻譯用戶界面等。全球的科研機構都可以免費獲取該軟件,可以用它來構建機構存儲、學習對象庫、電子論文庫、電子記錄管理、數(shù)字保存、數(shù)字出版及其他更多領域。
DSpace實現(xiàn)主要步驟:
3 DSpace系統(tǒng)目前存在的不足與展望
安裝DSpace系統(tǒng)并使之正常運行,需要比較熟練操作Linux操作系統(tǒng)、各種服務器的安裝與配置、軟件編程,以及相關數(shù)據(jù)庫應用與管理等。
用戶注冊信息少。新用戶注冊后,若事先不知道用戶,或沒有其他方式通知管理員,則管理員無法判斷新用戶身份,也就不能給新用戶授予相應的權限。
DSpace系統(tǒng)雖然具有條目導入導出功能,但是只能在操作系統(tǒng)的文本模式下操作,而不能在Web界面下操作,操作比較復雜。
不能對某些類型的數(shù)字資源提供存儲,例如動態(tài)類型的網(wǎng)頁。
DSpace底層是3層架構,但只適應中等或少量的數(shù)據(jù)存儲,對于大數(shù)據(jù)量的運算會產生數(shù)據(jù)的冗余。
系統(tǒng)設置字段很難增加和更改,如增加字段庫結構和發(fā)布達不到一致。
DSpace系統(tǒng)是開源軟件,與商業(yè)軟件相對比,MIT和HP沒有義務對該系統(tǒng)的一些問題承擔責任,但是承諾繼續(xù)提供一些技術方面的支持,另外,基于DSpace系統(tǒng)的開源社區(qū)也日趨活躍,他們不斷對DSpace的一些功能進行改進,修復已知bug等等。
DSpace的優(yōu)勢:系統(tǒng)結構合理、具有較為完善的功能、遵從相關標準、支持任意類型的的內容存儲、在國外學術機構中的得到最為廣泛的應用。目前,新版本正在出臺。
由于DSpace系統(tǒng)支持OAI-PMH協(xié)議,一些大型的目錄服務機構(如Google Scholar和OAIster)可以定期或不定期對收割DSpace系統(tǒng)的元數(shù)據(jù),為DSpace系統(tǒng)中的數(shù)字資源的傳播與利用提供了便利。
4 選擇開源軟件的問題與利弊
選擇軟件時,是選擇商業(yè)軟件還是開源軟件進行圖書館數(shù)字化建設,應考慮多方面的因素:
圖書館的資金投入;
使用單位的技術力量,是否有能力開發(fā)開源軟件;
開源軟件的開放性,權威性,可用性,標準性和規(guī)范性;
開源軟件被用到的用戶是那些(大用戶),使用的背景;
開源軟件要使用的對象;
是否有一個技術支撐體系支持,是松散的組織,還是有后續(xù)的服務和支撐。
參考文獻
[1]黃凱文,劉芳.網(wǎng)絡科學信息資源“公開獲取運動”的模式與方法[J].大學圖書館學報,2005,(2):38-41.
[2]http:∥archives.eprints.org/eprints.php?action=browse[EB].2005-07-15.
[3]http:∥dspace.xmu.edu.cn/dspace/register[EB].
[4]李愛國,陸美.學術圖書館機構知識庫的創(chuàng)建[J].圖書情報工作,2006,(6):119-121.
[5]葉鷹,黃晨.基于DSpace的Lib2.0[J].大學圖書館學報,2006,(3):2-5.
[6]圖1:Paul Gandel.Technology——Converging Changes.The 4th Annual Library Leadership Institute:The 21st Century Digital/Print Hybrid Research Library:Challenges for Leadership.
[7]范并思,胡小青.圖書館2.0:構建新的圖書館服務[J].大學圖書館學報,2006,(1):2-7.
[8]Web2.0技術探源.
[9]任樹懷.Web2.0與信息服務,2006-05-25.上海:構建以dSpace為核心的校內學術信息存儲倉庫.
[10]孫衛(wèi).2006年數(shù)字圖書館前沿問題高級研討班講話.國家圖書館二期工程暨國家數(shù)字圖書館工程介紹.
[11]陳和.2006年數(shù)字圖書館前沿問題高級研討班講話.廈門大學機構存儲系統(tǒng).