□周明明
從1998年美國啟動NSDL項(xiàng)目開始,數(shù)字圖書館門戶經(jīng)歷了十多年的發(fā)展,國外知名的有亞利桑那大學(xué)利用ZPORTAL建成的門戶、衣阿華州立大學(xué)的E-Library、哈佛大學(xué)的LDI二期項(xiàng)目和斯坦福大學(xué)的Google數(shù)字圖書館計劃;國內(nèi)知名的有廈門大學(xué)的知識資源港、北京航空航天大學(xué)利用TRS建立的門戶、清華大學(xué)圖書館以 MetaLib+SFX+EMS為基礎(chǔ)的數(shù)字圖書館整體解決方案,北京師范大學(xué)圖書館以MetaLib和SFX為入口構(gòu)建的數(shù)字圖書館等[1]。
但國內(nèi)眾多的圖書館門戶建設(shè)目前還僅僅停留在本單位的數(shù)字圖書館門戶建設(shè)上,如何整合多家不同類型圖書館的資源到一個平臺上,實(shí)現(xiàn)數(shù)字圖書館聯(lián)盟體的資源在更廣更深范圍內(nèi)的共享,最終做到給讀者“全球范圍內(nèi)的信息發(fā)現(xiàn),本地和區(qū)域?qū)用嫔系奈墨I(xiàn)保障,讓盡可能多的資源通過一個平臺來讓用戶能夠找到”[2]。這是目前國內(nèi)區(qū)域數(shù)字圖書館聯(lián)盟面對的新課題。
2009年上半年,隨著寧波市數(shù)字圖書館門戶、深圳文獻(xiàn)港門戶的先后面世[3][4]。區(qū)域數(shù)字圖書館門戶建設(shè)的一種新模式展現(xiàn)在用戶面前,本文以深圳區(qū)域數(shù)字圖書館門戶“深圳文獻(xiàn)港”(www.szdnet.org.cn)的建設(shè)為例,探討基于“讀秀數(shù)字圖書館平臺”建設(shè)的區(qū)域數(shù)字圖書館門戶整合方案,以期為數(shù)字圖書館聯(lián)盟建設(shè)提供一種新的資源共享、讀者服務(wù)模式。
數(shù)字圖書館門戶是通過統(tǒng)一檢索、數(shù)據(jù)收割、推送服務(wù)等技術(shù)手段,將分布在不同信息源的內(nèi)容整合在一起集中提供給用戶的網(wǎng)絡(luò)服務(wù)[5]。它既是數(shù)字圖書館聯(lián)盟資源與服務(wù)整合的載體,也是用戶利用圖書館資源和服務(wù)的訪問接入點(diǎn)。數(shù)字圖書館聯(lián)盟建設(shè)的目的是為用戶提供區(qū)域?qū)用娴奈墨I(xiàn)保障,而統(tǒng)一的門戶建設(shè)的目的則是支持用戶檢索,方便用戶利用數(shù)字資源,它是一個資源集成的平臺,提供一站式的信息服務(wù)、統(tǒng)一的檢索認(rèn)證,以及個性化服務(wù)。因此數(shù)字圖書館門戶的建設(shè)對數(shù)字圖書館聯(lián)盟具有重要意義。
基于對“深圳文獻(xiàn)港”數(shù)字圖書館戶門的分析,筆者總結(jié)出數(shù)字圖書館門戶的功能特點(diǎn):
(1)統(tǒng)一檢索:門戶需具有支持多個異構(gòu)資源的跨庫檢索功能,包括OPAC、書目數(shù)據(jù)庫、外部異構(gòu)的商用資源和免費(fèi)web資源等,要具備的檢索協(xié)議應(yīng)該包括H TTP 、Z39.50、Zing、CA LIS-ODL 等,支持的元數(shù)據(jù)應(yīng)該包括DC、MARK、EAD等;
(2)資源鏈接:應(yīng)該具有及時調(diào)度資源的功能,使電子資源之間實(shí)現(xiàn)無縫連接,提供一站式的檢索,并能夠?qū)z索結(jié)果進(jìn)行揭示,推送給用戶;
(3)資源導(dǎo)航:給用戶提供多種資源的多種分類導(dǎo)航瀏覽方式,如提供學(xué)科導(dǎo)航、資源類型導(dǎo)航等,便于用戶快速定位所需資源和服務(wù);
(4)內(nèi)容聚合:將其他資源、數(shù)據(jù)庫中的結(jié)構(gòu)與非結(jié)構(gòu)化數(shù)據(jù)通過收割、復(fù)制、導(dǎo)入等技術(shù)聚合起來,建立聯(lián)合資源倉儲。這些內(nèi)容可包括導(dǎo)航數(shù)據(jù)、元數(shù)據(jù)、全文數(shù)據(jù)、多媒體數(shù)據(jù)等,提供對聯(lián)合倉儲中多種類型元數(shù)據(jù)的聯(lián)合檢索;
(5)統(tǒng)一認(rèn)證:通過一次登陸訪問,向用戶提供各種類型的資源和服務(wù),即支持統(tǒng)一檢索,能夠同時檢索多個IP認(rèn)證、密碼認(rèn)證的商用資源,而無需用戶自己登錄這些資源;
(6)流量報表:能夠記錄用戶對數(shù)字資源的使用情況、創(chuàng)建分析日志系統(tǒng),實(shí)現(xiàn)用戶信息使用行為挖掘。
“深圳文獻(xiàn)港”于2009年6月正式推出,將深圳區(qū)域內(nèi)的文獻(xiàn)資源有效整合在“讀秀”平臺上,實(shí)現(xiàn)面向用戶的區(qū)域數(shù)字圖書館聯(lián)盟的服務(wù)。深圳文獻(xiàn)港門戶構(gòu)建模型如圖1。
圖1 深圳文獻(xiàn)港(區(qū)域數(shù)字圖書館聯(lián)盟門戶構(gòu)建模型)
該模型的整體架構(gòu)分三層,分別是應(yīng)用層、業(yè)務(wù)層和數(shù)據(jù)層。全面整合了包括深圳圖書館(公共館)、深圳市科技圖書館(專業(yè)館)、深圳大學(xué)圖書館(高校館)三家圖書館的各種文獻(xiàn)資源,為區(qū)域內(nèi)的企業(yè)、學(xué)校、科研單位和用戶構(gòu)建了一個基于網(wǎng)絡(luò)、遠(yuǎn)程利用資源的和諧使用環(huán)境,同時通過系統(tǒng)平臺、技術(shù)手段和圖書館員工作,對信息資源進(jìn)行充分的挖掘和關(guān)聯(lián),從而實(shí)現(xiàn)對資源的整體性揭示,將信息以更加細(xì)化和便捷的方式呈現(xiàn)給用戶。
都柏林核心(Dublin Core,簡稱DC)是一個由15個元數(shù)據(jù)組成的元數(shù)據(jù)標(biāo)準(zhǔn),目的是促進(jìn)網(wǎng)絡(luò)資源(包括文本及多媒體資源)的發(fā)現(xiàn)。DC元數(shù)據(jù)在網(wǎng)絡(luò)資源檢索中的主要功能為:側(cè)重于對信息資源的描述、整合和控制,在描述過程中特別強(qiáng)調(diào)忠實(shí)于原有資源和標(biāo)引過程中的標(biāo)準(zhǔn)形式和詞表的采用,這與現(xiàn)行的用于網(wǎng)絡(luò)資源檢索的搜索引擎相比,無疑將大大提高檢索效率[6]。深圳文獻(xiàn)港基于對元數(shù)據(jù)進(jìn)行存儲和預(yù)處理,經(jīng)過去重排序、索引處理,為用戶提供了搜索引擎方式的檢索體驗(yàn),元數(shù)據(jù)的應(yīng)用流程如圖2。
圖2 元數(shù)據(jù)應(yīng)用流程圖
元數(shù)據(jù)的建設(shè)是實(shí)現(xiàn)這一搜索方式的基礎(chǔ),如表1。
表1 元數(shù)據(jù)建設(shè)對象
元數(shù)據(jù)建設(shè)不僅保障了格式的統(tǒng)一,而且數(shù)據(jù)結(jié)構(gòu)清晰,可以按照用戶的需求建立各種分類體系,或者按照更高級的知識本體對數(shù)據(jù)進(jìn)行再組織和管理?;谠獢?shù)據(jù)的深圳文獻(xiàn)港保障了搜索的效率和系統(tǒng)性。
深圳文獻(xiàn)港針對各種異構(gòu)數(shù)字資源進(jìn)行整合檢索,一次檢索可以得到8種相關(guān)聯(lián)的文獻(xiàn)的檢索結(jié)果,如圖3。
圖3 統(tǒng)一檢索資源類型揭示圖
門戶的全文搜索引擎可對文章題名、主題、作者等進(jìn)行分析型檢索,特別是實(shí)現(xiàn)了全文檢索。統(tǒng)一的檢索界面和統(tǒng)一的檢索語言,使用戶能對本地和異地的各種資源系統(tǒng)同時檢索。不同的檢索范圍對應(yīng)相應(yīng)的檢索模式,包括基本檢索、二次檢索及高級檢索;在檢索任一種資源時,同時顯示其他相關(guān)資源信息,并自動形成聚類分類,如圖4。
圖4 中文期刊統(tǒng)一檢索頁面
用戶在數(shù)字資源平臺中最期望得到的是一站式服務(wù)。在一個提供信息查找的門戶中,用戶希望得到學(xué)科知識導(dǎo)航服務(wù)、多類型文獻(xiàn)的關(guān)聯(lián)鏈接、異構(gòu)數(shù)據(jù)庫的跨庫檢索服務(wù),以及獲取目標(biāo)信息的服務(wù)[6]。系統(tǒng)對資源的調(diào)度是滿足讀者需求的基礎(chǔ)。
深圳文獻(xiàn)港的資源調(diào)度系統(tǒng)有效地實(shí)現(xiàn)了原文鏈接和文獻(xiàn)上下文敏感信息的揭示。該系統(tǒng)是基于OpenURL標(biāo)準(zhǔn)的多級調(diào)度系統(tǒng),能夠自動更新知識庫。資源調(diào)度系統(tǒng)以動態(tài)腳本技術(shù)制定調(diào)度規(guī)則,便于增加新的資源和新的服務(wù),更有效地實(shí)現(xiàn)服務(wù)的調(diào)度。
資源調(diào)度遵循以下規(guī)則:
(1)授權(quán)方便原則:用戶通過統(tǒng)一認(rèn)證后,系統(tǒng)自動判斷該用戶的授權(quán)使用資源,若用戶需要獲取非授權(quán)資源時,系統(tǒng)自動提示可授權(quán)的成員館名稱,并提供資源調(diào)度申請表;
(2)就近最快原則:給資源設(shè)立權(quán)重,根據(jù)用戶端情況判斷,優(yōu)先調(diào)度最快資源,權(quán)重依次為本地已有資源、成員館遠(yuǎn)程資源、文獻(xiàn)傳遞資源;
(3)自動傳遞原則:常用資源實(shí)現(xiàn)自動傳遞,無法判斷是否可以自動傳遞的請求,自動轉(zhuǎn)到人工傳遞隊(duì)列;
(4)全文傳遞原則:對于權(quán)限內(nèi)的用戶直接提供全文訪問連接,無法直接訪問的用戶,通過填寫表單,提供區(qū)域共享和文獻(xiàn)傳遞服務(wù),將用戶的傳遞需求分發(fā)到收藏該資源的成員館進(jìn)行傳遞服務(wù)。
統(tǒng)一認(rèn)證、文獻(xiàn)服務(wù)統(tǒng)計管理系統(tǒng)實(shí)現(xiàn)區(qū)域范圍內(nèi)的用戶的統(tǒng)一管理與文獻(xiàn)服務(wù)統(tǒng)計,并通過接口開發(fā)與定制,將數(shù)字圖書館內(nèi)其他應(yīng)用系統(tǒng)集成到平臺中來。建設(shè)模塊內(nèi)容見表2。
(1)統(tǒng)一認(rèn)證
任何用戶都可以訪問權(quán)限范圍內(nèi)所有資源?!皺?quán)限范圍”就是各種資源授權(quán)使用的IP范圍。
(2)文獻(xiàn)服務(wù)統(tǒng)計
對各成員館的信息服務(wù)進(jìn)行統(tǒng)計分析,特別是實(shí)現(xiàn)單位用戶之間文獻(xiàn)服務(wù)的統(tǒng)計,為各成員館提供結(jié)算參考。
表2 統(tǒng)一認(rèn)證、文獻(xiàn)服務(wù)統(tǒng)計系統(tǒng)模塊內(nèi)容
元數(shù)據(jù)的多少是衡量信息揭示度的重要標(biāo)準(zhǔn),基于元數(shù)據(jù)的檢索在嚴(yán)格保證DC的15個基本元數(shù)據(jù)項(xiàng)的基礎(chǔ)上,應(yīng)根據(jù)資金和人力等資源情況,進(jìn)一步擴(kuò)大資源的揭示深度和廣度。
網(wǎng)站的信息經(jīng)常更新,甚至?xí)霈F(xiàn)網(wǎng)站關(guān)閉的情況,產(chǎn)生死鏈接,這就需要對索引資源盡快更新。網(wǎng)頁快照是解決此問題的重要方法,可在一定時期內(nèi)保留網(wǎng)站的原貌。定期檢查是及時發(fā)現(xiàn)和減少死鏈接現(xiàn)象的根本手段,門戶管理人員也可根據(jù)用戶的信息反饋,有針對性地進(jìn)行補(bǔ)救[7]。
在信息門戶中可有針對性地開發(fā)“用戶使用情況調(diào)查模塊”,基于用戶的選擇,從聚合的點(diǎn)擊流中直接挖掘信息,進(jìn)而能夠基于使用進(jìn)行新的開發(fā)。此外,利用這些挖掘的用戶數(shù)據(jù)還可以構(gòu)建額外服務(wù),如推薦服務(wù)。建立相應(yīng)的指標(biāo)體系,從用戶使用的角度來評估資源建設(shè)情況,可以更有效地改善區(qū)域圖書館聯(lián)盟的協(xié)調(diào)采訪和各成員館的館藏資源質(zhì)量。
可考慮在現(xiàn)有應(yīng)用系統(tǒng)的基礎(chǔ)上添加包括博客 、RSS 、W iki、SNS(社會網(wǎng)絡(luò))、P2P 、IM等應(yīng)用,提供圖書館以外的應(yīng)用內(nèi)容,使系統(tǒng)上的每一個用戶都能實(shí)現(xiàn)交互,這樣就組成了一個以數(shù)字圖書館為主題的用戶網(wǎng)絡(luò)[8]。
圖書館要想將用戶牢固鎖定,就必須去適應(yīng)用戶信息獲取習(xí)慣。圖書館聯(lián)盟可以改變采購商業(yè)數(shù)據(jù)庫的模式,可以優(yōu)惠價購買更多的全文數(shù)據(jù)庫,以滿足用戶“更快、更方便、更自如”地獲取全文的需求。
參考資料
1 張春紅,廖三三,沈蕓蕓.數(shù)字圖書館門戶的關(guān)鍵需求設(shè)計——以北京大學(xué)數(shù)字圖書館門戶為案例.現(xiàn)代圖書情報技術(shù),2006(11):7
2 姜愛蓉.區(qū)域性圖書館合作發(fā)展座談會會議實(shí)錄.公共圖書館.2009(2):6
3 寧波數(shù)字圖書館網(wǎng)站主頁.[2009-06-19].http://www.nbdl.gov.cn/
4 深圳文獻(xiàn)港網(wǎng)站主頁.[2009-06-19].http://www.szdnet.org.cn/
5 陳定權(quán),朱維鳳等.數(shù)字圖書館門戶的個性化.新世紀(jì)圖書館,2009(2):30
6 毛燕梅,張百靈等.DC元數(shù)據(jù)與網(wǎng)絡(luò)信息的檢索效率.北方工業(yè)大學(xué)學(xué)報,2001(2):82-84
7 李輝.從中外信息門戶比較看CSDL學(xué)科信息門戶的發(fā)展.圖書情報工作,2005(2):34
8 孟曉川,馬自衛(wèi).基于Liferay的多維化門戶系統(tǒng)在數(shù)字圖書館中的研究與實(shí)現(xiàn).現(xiàn)代圖書情報技術(shù),2008(12):11
9 超星數(shù)字圖書館區(qū)域數(shù)字圖書館方案.2009年6月