劉衛(wèi)利 易峰
〔摘 要〕將網(wǎng)絡(luò)環(huán)境、軟硬件設(shè)備建設(shè)集成于區(qū)域數(shù)字圖書館框架搭建中,以資源建設(shè)、資源管理、資源服務(wù)為主線來調(diào)理數(shù)字圖書館平臺建設(shè)的思路,對區(qū)域數(shù)字圖書館門戶建設(shè)中的若干問題作了探討。
〔關(guān)鍵詞〕區(qū)域數(shù)字圖書館;框架搭建;平臺建設(shè)
DOI:10.3969/j.issn.1008-0821.2012.06.014
〔中圖分類號〕G250保罰 〔文獻(xiàn)標(biāo)識碼〕B 〔文章編號〕1008-0821(2012)06-0055-03
區(qū)域數(shù)字圖書館是數(shù)字圖書館聯(lián)盟的高級形式,是由一大批共同遵循某種協(xié)議的計算機(jī)網(wǎng)絡(luò)互聯(lián)而成的龐大網(wǎng)絡(luò)。它的基本目標(biāo)是提供一個良好的基于數(shù)字化的信息環(huán)境,提供對分布式存儲的信息的知識化組織、智能化服務(wù)。其體系結(jié)構(gòu)包括基礎(chǔ)設(shè)施建設(shè)、平臺門戶建設(shè)(含文獻(xiàn)資源建設(shè))兩大部分。其中基礎(chǔ)設(shè)施建設(shè)包括網(wǎng)絡(luò)環(huán)境、各類硬軟件系統(tǒng)建設(shè),是區(qū)域數(shù)字圖書館建設(shè)的基礎(chǔ);平臺門戶是圖書館資源與服務(wù)的集成,是區(qū)域數(shù)字圖書館全部資源和服務(wù)的訪問接入點,它使得用戶通過一個接口友好地訪問圖書館所有的資源和服務(wù)[1],是快速構(gòu)建各種信息服務(wù)的核心工具。此外,建設(shè)區(qū)域數(shù)字圖書館還需要通過信息安全體系和標(biāo)準(zhǔn)規(guī)范體系來協(xié)調(diào)維護(hù)區(qū)域數(shù)字圖書館各分中心與中心的互操作等。
1 系統(tǒng)架構(gòu)與基礎(chǔ)設(shè)施
1.1 系統(tǒng)硬件架構(gòu)
系統(tǒng)硬件架構(gòu)主要包括集群服務(wù)器架構(gòu)和海量存儲器架構(gòu)。集群服務(wù)器架構(gòu)考慮采用兩臺多層交換機(jī)作為主干交換機(jī),它們之間采用Fast EtherChannel或Gigabit EtherChannel連接,保證負(fù)載均衡及線路備份,當(dāng)兩個交換機(jī)之間的一條線路出現(xiàn)故障,傳輸?shù)臄?shù)據(jù)會快速自動切換到另外一條線路上進(jìn)行傳輸,不影響網(wǎng)絡(luò)系統(tǒng)的正常工作,無需人工干預(yù)。主機(jī)及備機(jī)分別接到兩個主干交換機(jī)上,當(dāng)主機(jī)出現(xiàn)故障、主機(jī)的兩塊網(wǎng)卡出現(xiàn)故障或主機(jī)所連接的交換機(jī)兩個端口甚至交換機(jī)整個出現(xiàn)故障,系統(tǒng)會快速自動切換到備機(jī)及另一個交換機(jī)進(jìn)行工作,從而保證整個系統(tǒng)安全有效的運行。
海量存儲器架構(gòu)考慮采用以存儲區(qū)域網(wǎng)絡(luò)SAN構(gòu)架為基礎(chǔ),通過核心的光通道交換機(jī)作為SAN的連接核心設(shè)備,將多個主機(jī)和多個存儲設(shè)備連接起來的方案。SAN架構(gòu)可以實現(xiàn)系統(tǒng)中的任何服務(wù)器、陣列子系統(tǒng)、磁帶系統(tǒng)之間的互連。SAN建造存儲池,使多個服務(wù)器共享一個陣列子系統(tǒng)、共享一個自動帶庫,實現(xiàn)數(shù)據(jù)的共享和集中的管理。它有效地改善了存儲資源的共享特性,非常適合管理動態(tài)數(shù)據(jù)。它獨立于應(yīng)用服務(wù)器網(wǎng)絡(luò)系統(tǒng)之外,擁有幾乎無限的可擴(kuò)展性。開放性和可擴(kuò)展性是系統(tǒng)硬件架構(gòu)的設(shè)計原則。
1.2 系統(tǒng)軟件架構(gòu)
平臺軟件系統(tǒng)應(yīng)通過國際工業(yè)標(biāo)準(zhǔn)JSR168來實現(xiàn)應(yīng)用集成,門戶支持XML/XSL、ODL、HTML、JSP、WEBSERVICES等整合模式[2]。整個系統(tǒng)可考慮采用業(yè)界領(lǐng)先的TRS數(shù)字圖書館解決方案,包含表現(xiàn)層、邏輯處理層和數(shù)據(jù)層等3個層次。
表現(xiàn)層是整個資源平臺與用戶的接口,負(fù)責(zé)用戶界面以及用戶的接入。表現(xiàn)層的最終表現(xiàn)形式是整個數(shù)字圖書館的門戶。該層采用TRS內(nèi)容管理協(xié)作平臺(TRS WCM),它是一套完全基于Java技術(shù)和瀏覽器技術(shù)的網(wǎng)絡(luò)內(nèi)容管理軟件,集瀏覽器內(nèi)容創(chuàng)建和寫作、內(nèi)容交付、基于模板的內(nèi)容發(fā)布、強(qiáng)大的站點管理于一身,并提供企業(yè)級的團(tuán)隊協(xié)作能力,使信息發(fā)布簡單化、自動化、智能化;邏輯處理層是整個資源平臺的應(yīng)用服務(wù)邏輯事務(wù)層,負(fù)責(zé)完成應(yīng)用系統(tǒng)所要完成的功能。它提供對資源發(fā)現(xiàn)的通用檢索、對象代理發(fā)布以及其它用戶服務(wù)(如個性化定制)等,同時負(fù)責(zé)在應(yīng)用層上對資源進(jìn)行存取。該層使用TRS內(nèi)容分發(fā)平臺(TRS CDS),該平臺是TRS內(nèi)容管理平臺中的一個重要組成部分,其主要功能就是實現(xiàn)內(nèi)容的分發(fā)及后續(xù)階段的評估反饋,以實現(xiàn)整合多種數(shù)據(jù)源,為表現(xiàn)層提供多種異構(gòu)數(shù)據(jù)源的內(nèi)容,即實現(xiàn)靈活、無縫、透明的數(shù)據(jù)整合;數(shù)據(jù)層負(fù)責(zé)存儲與管理各種信息數(shù)據(jù)資源,通過相應(yīng)的存取協(xié)議來進(jìn)行訪問。由于數(shù)字圖書館的數(shù)據(jù)庫需求和其它系統(tǒng)的差異性,需要提供在海量非結(jié)構(gòu)化信息中快速、準(zhǔn)確獲得用戶所需信息的全文檢索功能。
1.3 網(wǎng)絡(luò)傳輸環(huán)境
網(wǎng)絡(luò)出口帶寬主要依據(jù)在線用戶數(shù)來配置,可建立Chinanet和Cernet雙通道出口。為使公網(wǎng)用戶訪問更為順暢,前者帶寬應(yīng)大于后者。
橫向上IP網(wǎng)可分為核心層、邊緣層、接入層。核心層是由核心路由器或異步轉(zhuǎn)移模式骨干交換機(jī)以及承載這些設(shè)備的光纖傳輸網(wǎng)組成;邊緣層由邊緣路由器或ATM交換機(jī)組成,邊緣層設(shè)備可以通過光纖直接與核心設(shè)備連接;接入層包括局域網(wǎng)、公眾電信網(wǎng)、綜合業(yè)務(wù)數(shù)字網(wǎng)、移動網(wǎng)直接面向用戶連接或訪問的部分,由無線網(wǎng)卡、AP和L2Switch組成,主要功能是完成用戶流量的接入和隔離。
湖北高校數(shù)字圖書館建立了一個公共網(wǎng)數(shù)據(jù)中心和一個教育科研網(wǎng)數(shù)據(jù)中心,采用分布式架構(gòu)在數(shù)據(jù)中心建立數(shù)據(jù)資源存儲與服務(wù)系統(tǒng),并以專線方式在兩個中心之間實現(xiàn)光纖直聯(lián),實現(xiàn)了兩個中心的硬件及數(shù)據(jù)互為冗余備份,解決了異構(gòu)設(shè)備及網(wǎng)絡(luò)互聯(lián)、城域光纜連接、負(fù)載均衡與切換數(shù)據(jù)同步等技術(shù)難點[3],這種雙數(shù)據(jù)中心架構(gòu)的方式,為區(qū)域數(shù)字圖書館網(wǎng)絡(luò)建設(shè)提供了有益的思考。
2 平臺建設(shè)的邏輯結(jié)構(gòu)
2.1 信息資源建設(shè)層(數(shù)據(jù)層)
資源建設(shè)包括各類電子圖書庫、期刊庫、報紙庫、文獻(xiàn)庫、光盤庫、素材庫、課件庫、試題庫、案例庫、答疑庫及圖書館內(nèi)部管理信息系統(tǒng)、館藏資源的數(shù)字制作、格式轉(zhuǎn)換等等,是數(shù)字圖書館的核心;從來源上可分為商業(yè)數(shù)據(jù)庫、免費數(shù)據(jù)庫、自建數(shù)據(jù)庫等類型,它處于整個平臺架構(gòu)的底層,包括了信息資源交換的體系和規(guī)則,是區(qū)域資源共享的基礎(chǔ)。在實踐中,應(yīng)考慮以下幾個方面:①為體現(xiàn)資源的學(xué)科特性,應(yīng)加強(qiáng)各學(xué)科文獻(xiàn)資源中心建設(shè);②各分中心根據(jù)本館特點進(jìn)行分工協(xié)調(diào),購買安裝相關(guān)數(shù)據(jù)庫并負(fù)責(zé)買斷該數(shù)據(jù)庫的區(qū)域內(nèi)使用權(quán),實體文獻(xiàn)建設(shè)保持現(xiàn)有機(jī)制,以館際互借和文獻(xiàn)傳遞方式來解決共享問題[4];③要堅持引進(jìn)和自建相結(jié)合的原則。
2.2 信息資源管理層(應(yīng)用層及應(yīng)用支撐層)
應(yīng)用層包括為了實現(xiàn)共享平臺的諸多功能而開發(fā)的應(yīng)用程序模塊,如統(tǒng)一認(rèn)證、統(tǒng)一檢索、文獻(xiàn)傳遞、推送服務(wù)、資源導(dǎo)航、個人圖書館、專題圖書館、信息交流、創(chuàng)作出版、區(qū)域流通、聯(lián)合咨詢、產(chǎn)業(yè)資訊等應(yīng)用功能[5]。數(shù)字圖書館的最終服務(wù)主要體現(xiàn)在資源的整合和重組上,整合的概念體現(xiàn)在兩個方面,即數(shù)據(jù)與應(yīng)用。數(shù)據(jù)級的整合需要將可抽取的元數(shù)據(jù)按照一定的標(biāo)準(zhǔn)和規(guī)范集中存放以實現(xiàn)統(tǒng)一檢索和全文檢索;應(yīng)用層的整合主要涉及讀者的認(rèn)證、系統(tǒng)檢索出口數(shù)據(jù)的分析與整理,然后再統(tǒng)一數(shù)據(jù)顯示格式。整合層是數(shù)字圖書館實施中的重點和難點,需要針對不同的數(shù)據(jù)資源進(jìn)行定制[6]。
聯(lián)合目錄檢索與基于元數(shù)據(jù)的統(tǒng)一檢索是針對各種異構(gòu)數(shù)字資源進(jìn)行應(yīng)用檢索整合。強(qiáng)調(diào)基于元數(shù)據(jù)的統(tǒng)一檢索,可通過先進(jìn)的組織體系和語義檢索獲取信息,為用戶提供統(tǒng)一的檢索界面和檢索語言,實現(xiàn)對匯總資源元數(shù)據(jù)聯(lián)合倉庫的跨庫檢索,同時提供異構(gòu)數(shù)據(jù)庫統(tǒng)一檢索功能,使發(fā)布分散的數(shù)字圖書館資源充分發(fā)揮整體效益,進(jìn)一步用于增值性的應(yīng)用。資源調(diào)度模塊能夠自動更新知識庫,允許自定義本地調(diào)度規(guī)則并定制個性化調(diào)度服務(wù),向第三方提供資源注冊標(biāo)準(zhǔn)和接口,方便數(shù)據(jù)商批量更新資源注冊信息。
參考咨詢與文獻(xiàn)傳遞模塊集成了OPAC系統(tǒng)、中外文期刊、中外文數(shù)據(jù)庫及電子書系統(tǒng),用戶在網(wǎng)上提交館際互借申請,通過所在館獲取文獻(xiàn)傳遞網(wǎng)成員館的文獻(xiàn)資源。如何使整合后的各種數(shù)據(jù)資源發(fā)揮作用并進(jìn)行高效的知識管理以及增值性服務(wù),是信息服務(wù)的主要目的。數(shù)據(jù)資源服務(wù)系統(tǒng)將各種數(shù)據(jù)資源通過多種數(shù)據(jù)服務(wù)方式提供給服務(wù)團(tuán)體或個人用戶,包括:虛擬參考咨詢服務(wù),館際互借服務(wù),個性化服務(wù)等。
應(yīng)用支撐層指工作流、內(nèi)容管理、通用表單、知識管理、統(tǒng)一交換平臺、統(tǒng)一消息平臺認(rèn)證和權(quán)限管理。支撐層是基于靈活的目錄服務(wù)體系和標(biāo)準(zhǔn)規(guī)范的信息交換格式構(gòu)建應(yīng)用集成、信息管理和共性服務(wù)系統(tǒng),包括工作流引擎和中間件。中間件支持跨平臺的分布式異構(gòu)數(shù)據(jù)的訪問,從而向應(yīng)用業(yè)務(wù)層提供統(tǒng)一的數(shù)據(jù)服務(wù)。工作流系統(tǒng)通過工作流引擎驅(qū)動數(shù)據(jù)在應(yīng)用業(yè)務(wù)層的各種應(yīng)用之間流轉(zhuǎn),以便根據(jù)分工合理高效和完整的分配信息。應(yīng)用支撐層采用面向?qū)ο?、組件式設(shè)計等多項技術(shù),提供的構(gòu)建系統(tǒng)是跨領(lǐng)域、與具體業(yè)務(wù)無關(guān)、通用的基礎(chǔ)服務(wù),能隨著電子政務(wù)系統(tǒng)的發(fā)展而擴(kuò)展伸縮,應(yīng)用系統(tǒng)一般通過應(yīng)用開發(fā)接口或聲明性的描述來使用這些構(gòu)件服務(wù)[7]。
2.3 信息資源服務(wù)層
現(xiàn)代技術(shù)條件下圖書館工作效果的一個衡量標(biāo)準(zhǔn)可能是:大部分的服務(wù)是否都可以通過門戶網(wǎng)站來完成?我們可以大膽推測:假如某實體館一天不開放,會有N位讀者感覺不適的話,那么其平臺門戶癱瘓一天,應(yīng)該有2N位讀者抱怨。公共服務(wù)平臺就是要搭建一個面向全區(qū)域用戶的網(wǎng)絡(luò)服務(wù)系統(tǒng),擁有裝載各類型文獻(xiàn)數(shù)據(jù)庫的服務(wù)器群,連接各個圖書館的自動化管理系統(tǒng)。構(gòu)建統(tǒng)一的網(wǎng)絡(luò)檢索及異構(gòu)數(shù)據(jù)庫檢索共享網(wǎng)絡(luò)平臺是現(xiàn)代圖書館聯(lián)盟的必要技術(shù)支持。數(shù)字圖書館聯(lián)盟服務(wù)平臺建立的目的是要打破館際界限和信息分割,集成各類數(shù)字信息資源,協(xié)同各成員館間的業(yè)務(wù)處理,為用戶提供一站式的信息服務(wù)。其工作重點是面向分布式和異構(gòu)化的數(shù)字信息資源,通過服務(wù)集成構(gòu)造統(tǒng)一的信息服務(wù)平臺,實現(xiàn)信息服務(wù)的集成與數(shù)字信息資源的共建共享[8]。
門戶的核心要素包括認(rèn)證、檢索、導(dǎo)航、鏈接、咨詢、個性服務(wù)等等,其建設(shè)應(yīng)處處以用戶使用為主導(dǎo),強(qiáng)調(diào)資源和服務(wù)的集成,突出資源的學(xué)科性,同時還要注意系統(tǒng)架構(gòu)的開放性和與傳統(tǒng)服務(wù)的平滑過渡問題[9]。應(yīng)從兩個方面來評價門戶建設(shè)的滿意度,即用戶界面和服務(wù)功能。用戶界面包括屏幕布局、幫助和容錯能力、可學(xué)習(xí)和可記憶能力等指標(biāo),服務(wù)功能則包括資源檢索、資源導(dǎo)航、個性化服務(wù)、用戶認(rèn)證等指標(biāo)[10]。門戶建設(shè)的最終目標(biāo)是要把圖書館的資源和服務(wù)做到無縫連接,使讀者通過門戶可以享受幾乎所有的服務(wù)項目。
3 問題與思考
文化部打造的數(shù)字圖書館推廣工程,是區(qū)域數(shù)字圖書館建設(shè)的重要實踐。它將構(gòu)建以國家數(shù)字圖書館為中心、以各級數(shù)字圖書館為節(jié)點、覆蓋全國的數(shù)字圖書館虛擬網(wǎng),借助網(wǎng)絡(luò)及各式新興媒體,向公眾提供數(shù)字圖書館服務(wù),在全國范圍內(nèi)形成有效的數(shù)字資源保障體系。全國省級數(shù)字圖書館平臺搭建工作預(yù)計2012年完成,屆時全國所有省級數(shù)字圖書館和部分市級數(shù)字圖書館的硬件平臺搭建工作將完成,2013-2015年則進(jìn)入全面推廣階段[11]。如此眾多的分中心的加盟,在擴(kuò)大資源共享范圍的同時,必然帶來一些問題引發(fā)一些思考,這些問題和思考對區(qū)域數(shù)字圖書館建設(shè)有著積極的意義。
3.1 IP地址限制的弊端
以高校系統(tǒng)建設(shè)的數(shù)字圖書館為例,幾乎都是受IP地址限制的圍墻式封閉館模式,它并非為技術(shù)所限制,而是數(shù)據(jù)供應(yīng)商保護(hù)自身經(jīng)濟(jì)利益的一種不成文的行規(guī)。而讀者訪問數(shù)字資源恰恰有隨時隨地的需求,無疑這種限制是致命的。打破這種禁錮,開放資源,是建設(shè)者必須面對的現(xiàn)實?,F(xiàn)時通常采取兩種方式實現(xiàn)IP地址限制的突破:對自身用戶采用免費注冊授權(quán),實行系統(tǒng)統(tǒng)一身份認(rèn)證;對公眾用戶,另作用戶編碼,通過售卡與供應(yīng)商共享利益。但是,長久看這并不符合資源共享的本意,這種狀況降低了數(shù)字資源的傳播擴(kuò)散優(yōu)勢。在更大范圍內(nèi)解除IP限制才可以使區(qū)域數(shù)字圖書館使用走上正途。
3.2 數(shù)據(jù)存儲方式的弱點
無論是中心還是分中心,都存在存儲方式的選擇問題。資源的本地鏡像存在知識產(chǎn)權(quán)問題,也會帶來存儲設(shè)備的持久壓力;而遠(yuǎn)程訪問又面臨受制于人的尷尬。所以,在區(qū)域內(nèi)對各種資源的存儲使用方式的協(xié)調(diào)統(tǒng)籌,應(yīng)該多體現(xiàn)“計劃”的色彩,確定好各種資源的保存級別,分清輕重緩急,做到“有取有舍”。
3.3 技術(shù)條件復(fù)雜引發(fā)的被動
計算機(jī)技術(shù)、網(wǎng)絡(luò)技術(shù)牽引著數(shù)字圖書館建設(shè)的方向,它們走到哪一步,數(shù)字圖書館跟進(jìn)到哪一步,“技術(shù)推進(jìn)”原理體現(xiàn)得非常充分。但技術(shù)環(huán)境復(fù)雜也導(dǎo)致資源組織、資源管理、資源發(fā)布工作運行成本高企,也引發(fā)人文與技術(shù)的對抗。商業(yè)數(shù)據(jù)庫由于開發(fā)商不同,往往使用不同的硬件系統(tǒng)和軟件平臺,技術(shù)規(guī)范、數(shù)據(jù)標(biāo)準(zhǔn)不一。而自建數(shù)據(jù)庫的質(zhì)量差異較大,除少數(shù)建設(shè)質(zhì)量較高外,大多存在功能單一或不夠完善,資源收錄不全,后續(xù)管理難以到位等問題。由于商業(yè)數(shù)據(jù)庫的技術(shù)異構(gòu)和自建數(shù)據(jù)庫的質(zhì)量差異,致使圖書館聯(lián)盟電子資源的共享環(huán)境復(fù)雜,資源整合、多館協(xié)作和服務(wù)共享等方面存在一定困難,自建特色數(shù)據(jù)庫整合、資源開發(fā)利用、服務(wù)評估困難。
3.4 門戶建設(shè)的隨意性
門戶建設(shè)規(guī)范性不夠,指標(biāo)分散雜亂,對圖書館工作內(nèi)容體現(xiàn)的充分程度差異很大,折射出圖書館建設(shè)者、管理者對圖書館工作認(rèn)識上的較大差別。這種認(rèn)識上的差別對區(qū)域數(shù)字圖書館建設(shè)起到了反作用。門戶為用戶提供的服務(wù)種類呈現(xiàn)出五花八門、繁簡無序、參差不齊、良莠不分的狀態(tài)。所以,有必要對圖書館工作的服務(wù)項目制定一個規(guī)范性的指標(biāo),以此引領(lǐng)門戶建設(shè),從而規(guī)范并提升圖書館服務(wù)水平。
參考文獻(xiàn)
[1]林芳.?dāng)?shù)字圖書館門戶可用性評估指標(biāo)體系[J].圖書情報工作,2008,(4):25-28.
[2]顏務(wù)林 李亞芬.寧波數(shù)字圖書館建設(shè)模式與運行機(jī)制研究[J].圖書館,2009,(3):84-85.
[3]燕今偉.湖北省高等學(xué)校數(shù)字圖書館建設(shè)方案及其實施.陜西:PPT,2009-05-21.
[4]徐力文.湖北數(shù)字圖書館區(qū)域合作發(fā)展模式探討[J].圖書館論壇,2003,(5):57-59.
[5]何繼紅.區(qū)域數(shù)字圖書館平臺建設(shè)的研究[J].蘇州大學(xué)學(xué)報,2011,(4):23-27.
[6]白廣思.?dāng)?shù)字圖書館平臺建設(shè)研究[J].情報理論與實踐,2010,(4):102-105.
[7]電子政務(wù)PPT教案[EB].http:∥www.doc88.com/p-968199123979.html
[8]易菲,龍朝陽.基于SOA的數(shù)字圖書館聯(lián)盟信息服務(wù)平臺構(gòu)建[J].圖書館工作與研究,2011,(6):4-7.
[9]肖瓏,等.?dāng)?shù)字圖書館門戶的構(gòu)建與服務(wù)[J].大學(xué)圖書館學(xué)報,2007,(4):41-48.
[10]林芳.?dāng)?shù)字圖書館門戶可用性評估指標(biāo)體系[J].圖書情報工作,2008,(4):25-28.
[11]游雪晴.科技日報[N].2011-09-13.
(本文責(zé)任編輯:張麗娟)