鐘 萍
(安徽大學(xué),合肥 230039)
?
基于大數(shù)據(jù)的圖書(shū)館開(kāi)放數(shù)據(jù)信息服務(wù)系統(tǒng)研究
——以安徽大學(xué)圖書(shū)館為例
鐘 萍
(安徽大學(xué),合肥 230039)
大數(shù)據(jù)時(shí)代為圖書(shū)館構(gòu)建開(kāi)放數(shù)據(jù)信息服務(wù)系統(tǒng)提供了新環(huán)境,同時(shí)也對(duì)圖書(shū)館服務(wù)系統(tǒng)提出了更高要求。文章在對(duì)大數(shù)據(jù)環(huán)境下圖書(shū)館開(kāi)放數(shù)據(jù)信息服務(wù)進(jìn)行整體分析的基礎(chǔ)上,對(duì)該服務(wù)系統(tǒng)的構(gòu)建要素進(jìn)行分析闡釋?zhuān)岢鰣D書(shū)館開(kāi)放數(shù)據(jù)信息服務(wù)系統(tǒng)的四個(gè)構(gòu)建版塊,以期促進(jìn)圖書(shū)館開(kāi)放數(shù)據(jù)信息服務(wù)的發(fā)展。
大數(shù)據(jù);圖書(shū)館;開(kāi)放信息資源;開(kāi)放數(shù)據(jù)信息服務(wù)
大數(shù)據(jù)環(huán)境下,我國(guó)圖書(shū)館的開(kāi)放數(shù)據(jù)信息服務(wù)發(fā)展愈加迅速,國(guó)內(nèi)外學(xué)者也對(duì)開(kāi)放數(shù)據(jù)信息服務(wù)進(jìn)行了深入的討論研究。有效地利用大數(shù)據(jù)的背景環(huán)境,圖書(shū)館可以進(jìn)一步解決開(kāi)放存取資源和本館數(shù)字資源整合等問(wèn)題。目前,圖書(shū)館界的數(shù)字資源整合方式大致上經(jīng)歷了數(shù)據(jù)整合、信息整合和知識(shí)整合三個(gè)階段,三者是交叉存在于圖書(shū)館信息服務(wù)過(guò)程中,而非鏈性的繼承關(guān)系。實(shí)際上,圖書(shū)館數(shù)字資源整合的最高形態(tài)正是數(shù)據(jù)信息知識(shí)整合,這也是未來(lái)圖書(shū)館資源服務(wù)發(fā)展的趨勢(shì)。
大數(shù)據(jù)環(huán)境下,圖書(shū)館開(kāi)放數(shù)據(jù)信息服務(wù)整體上要從服務(wù)思路、服務(wù)目標(biāo)、服務(wù)層次三方面進(jìn)行把握,以在宏觀上加深對(duì)開(kāi)放數(shù)據(jù)信息服務(wù)的理解。
1.1 開(kāi)放數(shù)據(jù)信息服務(wù)的思路
所謂開(kāi)放數(shù)據(jù)信息服務(wù),是指將分散在網(wǎng)絡(luò)上多種形式、多種內(nèi)容的數(shù)字資源服務(wù),通過(guò)一定的整合方式進(jìn)行有效組織并達(dá)到集成目的的一種服務(wù)方式。目前廣泛使用的開(kāi)放數(shù)據(jù)信息服務(wù)以O(shè)A資源整合為主,例如跨庫(kù)檢索系統(tǒng)的OA資源整合、基于OPAC系統(tǒng)的數(shù)字資源整合等。這些數(shù)據(jù)信息整合方式體現(xiàn)了大數(shù)據(jù)環(huán)境下資源開(kāi)放獲取的內(nèi)涵。要注意的是,圖書(shū)館的開(kāi)放數(shù)據(jù)信息服務(wù)不僅要實(shí)現(xiàn)資源層面的大量整合,還要實(shí)現(xiàn)相關(guān)服務(wù)的綁定與一體化,切忌將資源與服務(wù)分裂開(kāi)來(lái),只有融合了數(shù)據(jù)信息與服務(wù)的一站式開(kāi)放數(shù)據(jù)信息服務(wù),才能更好地滿足用戶(hù)的需求。
1.2 開(kāi)放數(shù)據(jù)信息服務(wù)的目標(biāo)
在明確服務(wù)思路的基礎(chǔ)上,筆者認(rèn)為開(kāi)放數(shù)據(jù)信息服務(wù)要實(shí)現(xiàn)以下三個(gè)目標(biāo):(1)創(chuàng)建行之有效的OA資源收集機(jī)制。很多科研機(jī)構(gòu)和數(shù)據(jù)庫(kù)出版商都陸續(xù)加入到了OA運(yùn)動(dòng)中,使得網(wǎng)絡(luò)上形成了大量的OA學(xué)術(shù)資源,圖書(shū)館OA資源建設(shè)應(yīng)利用多種渠道搜集完善自身的數(shù)據(jù)庫(kù),從而實(shí)現(xiàn)數(shù)據(jù)的全面覆蓋。(2)搭建OA資源一站式檢索平臺(tái)。大數(shù)據(jù)環(huán)境下的開(kāi)放信息資源收集與整合,必須依靠一站式檢索平臺(tái)為用戶(hù)提供無(wú)障礙檢索服務(wù),將面向用戶(hù)的信息資源透明化[1]。(3)實(shí)現(xiàn)分布式OA數(shù)據(jù)資源的集成整合。OA資源內(nèi)容多、分布廣,單一的信息服務(wù)機(jī)構(gòu)很難全面覆蓋,圖書(shū)館可以采用集成的方式將分散的資源整合起來(lái),以便于用戶(hù)的檢索與獲取。
1.3 開(kāi)放數(shù)據(jù)信息服務(wù)的層次
基于大數(shù)據(jù)的圖書(shū)館開(kāi)放數(shù)據(jù)信息服務(wù)可具化為信息整合層次。以馬文峰為代表的學(xué)者認(rèn)為信息整合是指通過(guò)某種標(biāo)準(zhǔn)或機(jī)制,描述、整合、鏈接不同形式與不同載體的信息資源,使得相對(duì)獨(dú)立的數(shù)據(jù)信息之間搭建起聯(lián)系,實(shí)現(xiàn)信息的全面整合與用戶(hù)的方便獲取。其中,信息內(nèi)容的深層次整合表現(xiàn)形式主要有引文鏈接、全文搜索、信息門(mén)戶(hù)等,而淺層次的信息整合方式則有OPAC目錄整合、導(dǎo)航模式等多種類(lèi)型。
基于大數(shù)據(jù)的圖書(shū)館開(kāi)放數(shù)據(jù)信息服務(wù)系統(tǒng)包含四個(gè)構(gòu)建要素:資源層、數(shù)據(jù)處理層、應(yīng)用層以及用戶(hù)交互層。
2.1 資源層——存取資源
資源層的作用在于存取各種開(kāi)放的資源信息,宏觀方面包括OA期刊、IR、Eprints、OA搜索引擎、深網(wǎng)資源、個(gè)人學(xué)術(shù)站點(diǎn)和其它Web資源等等。微觀方面,資源層主要是指MARC、DC、OAI、DOI、Open URL 和 RDF等描述OA資源的各種元數(shù)據(jù)。目前安徽大學(xué)圖書(shū)館基本實(shí)現(xiàn)OA資源的收集與展示,中國(guó)光學(xué)期刊網(wǎng)、中國(guó)植物數(shù)據(jù)庫(kù)等開(kāi)放數(shù)據(jù)信息免費(fèi)向該校讀者提供使用[2]??傊?,資源層是構(gòu)建大數(shù)據(jù)環(huán)境下圖書(shū)館開(kāi)放數(shù)據(jù)信息服務(wù)系統(tǒng)的核心要素。
2.2 數(shù)據(jù)處理層——數(shù)據(jù)分類(lèi)
大數(shù)據(jù)環(huán)境下圖書(shū)館開(kāi)放數(shù)據(jù)信息服務(wù)系統(tǒng)宏觀方面的數(shù)據(jù)處理層往往并不復(fù)雜。一般來(lái)說(shuō),不需要繁瑣復(fù)雜的技術(shù)手段支持,也不需要開(kāi)發(fā)者投入過(guò)多的智力勞動(dòng)。數(shù)據(jù)處理層的主要作用是將OA資源進(jìn)行分類(lèi)處理,從而形成數(shù)據(jù)上的邏輯統(tǒng)一。微觀層面的元數(shù)據(jù)處理則是OA資源整合的關(guān)鍵層次,主要在于對(duì)元數(shù)據(jù)的提取、加工和處理,最終形成統(tǒng)一的元數(shù)據(jù)標(biāo)準(zhǔn),并進(jìn)行本地化存儲(chǔ)。
2.3 應(yīng)用層——應(yīng)用服務(wù)
數(shù)據(jù)處理層宏觀層面的簡(jiǎn)單運(yùn)作使得應(yīng)用層的宏觀作用也相對(duì)簡(jiǎn)單,主要在于提供給用戶(hù)簡(jiǎn)單的鏈接和檢索服務(wù)。例如安徽大學(xué)圖書(shū)館主頁(yè)的OA資源版塊即提供了中國(guó)科技期刊開(kāi)放獲取平臺(tái)的鏈接,方便本校師生直接獲取該平臺(tái)的開(kāi)放數(shù)據(jù)資源。而微觀層面的應(yīng)用層相對(duì)復(fù)雜,主要為用戶(hù)提供元數(shù)據(jù)的檢索服務(wù)、OPAC檢索服務(wù)以及個(gè)性化服務(wù)等應(yīng)用,是大數(shù)據(jù)環(huán)境下圖書(shū)館開(kāi)放數(shù)據(jù)信息服務(wù)系統(tǒng)的創(chuàng)新所在。
2.4 用戶(hù)交互層——交流交互
用戶(hù)交流層在宏觀方面形成的面向用戶(hù)的終端服務(wù)普遍突破了學(xué)科導(dǎo)航、資源導(dǎo)航等單向提供數(shù)據(jù)服務(wù)的方式,取而代之的是可以提供信息門(mén)戶(hù)、一站式檢索平臺(tái)等服務(wù),便于圖書(shū)館發(fā)揮信息技術(shù)的優(yōu)勢(shì),加強(qiáng)用戶(hù)與圖書(shū)館的交流,從而重新界定了圖書(shū)館和用戶(hù)之間的關(guān)系,實(shí)現(xiàn)彼此間的即時(shí)交互。
總而言之,基于大數(shù)據(jù)的圖書(shū)館開(kāi)放數(shù)據(jù)信息服務(wù)系統(tǒng)模型四要素是以資源層為基礎(chǔ),以數(shù)據(jù)處理層為技術(shù)環(huán)節(jié),在應(yīng)用層具體體現(xiàn),并最終呈現(xiàn)在用戶(hù)交互層,形成一項(xiàng)完整的開(kāi)放式數(shù)據(jù)信息服務(wù)流程(見(jiàn)圖 1)。
在分析了大數(shù)據(jù)背景下圖書(shū)館開(kāi)放數(shù)據(jù)信息服務(wù)系統(tǒng)四要素的基礎(chǔ)上,筆者提出該系統(tǒng)構(gòu)建如下:建立圖書(shū)館本館IR,實(shí)現(xiàn)開(kāi)放存取資源整合;架構(gòu)SOA模型,實(shí)現(xiàn)用戶(hù)服務(wù)資源整合;應(yīng)用OLAP技術(shù),實(shí)現(xiàn)開(kāi)放資源知識(shí)整合;搭建OA資源導(dǎo)航系統(tǒng),實(shí)現(xiàn)統(tǒng)一檢索。
圖1 基于大數(shù)據(jù)的圖書(shū)館開(kāi)放數(shù)據(jù)信息服務(wù)系統(tǒng)四要素[3]
3.1 構(gòu)建本館IR,實(shí)現(xiàn)開(kāi)放存取資源整合
圖書(shū)館通常被認(rèn)為是知識(shí)的存儲(chǔ)機(jī)構(gòu),擔(dān)負(fù)著保存文獻(xiàn)與數(shù)據(jù)的任務(wù)。在大數(shù)據(jù)環(huán)境下,圖書(shū)館有責(zé)任與義務(wù)收集保存數(shù)字信息,創(chuàng)建開(kāi)放數(shù)據(jù)信息環(huán)境。以李春明為代表的學(xué)者提出:圖書(shū)館在開(kāi)放信息資源服務(wù)過(guò)程中應(yīng)該構(gòu)建屬于本館的IR,依托IR來(lái)提供長(zhǎng)期且持續(xù)的開(kāi)放式服務(wù),達(dá)到長(zhǎng)期保存和可持續(xù)獲取的圖書(shū)館功能[4]。目前,斯坦福大學(xué)的LOCKSS系統(tǒng)、英國(guó)大學(xué)圖書(shū)館聯(lián)合體的CEDRAS等都是取得成功的該館IR先例?;诖髷?shù)據(jù)的圖書(shū)館開(kāi)放數(shù)據(jù)信息服務(wù)IR模型構(gòu)建把整個(gè)過(guò)程分為資源層、元數(shù)據(jù)管理層、數(shù)據(jù)倉(cāng)儲(chǔ)構(gòu)建層和應(yīng)用層四個(gè)層面(見(jiàn)圖2)。資源層主要指開(kāi)放網(wǎng)絡(luò)環(huán)境下各種類(lèi)型的存取數(shù)字資源,既包括OA期刊資源、OA機(jī)構(gòu)知識(shí)庫(kù)、OA學(xué)科知識(shí)庫(kù),也包括預(yù)印本和其它形式的開(kāi)放資源,而元數(shù)據(jù)管理層的作用則是利用元數(shù)據(jù)抽取轉(zhuǎn)換協(xié)議從資源層中的OA資源中提取元數(shù)據(jù),并將其標(biāo)準(zhǔn)化,以實(shí)現(xiàn)元數(shù)據(jù)和數(shù)據(jù)管理的統(tǒng)一和標(biāo)準(zhǔn)。與此同時(shí),元數(shù)據(jù)的管理層將不同類(lèi)型的數(shù)據(jù)信息和元數(shù)據(jù)進(jìn)行轉(zhuǎn)化,完成相關(guān)的有效操作。數(shù)據(jù)倉(cāng)儲(chǔ)構(gòu)建層的作用在于將統(tǒng)一標(biāo)準(zhǔn)的元數(shù)據(jù)和數(shù)據(jù)進(jìn)行存儲(chǔ),并按照元數(shù)據(jù)、數(shù)據(jù)內(nèi)容分門(mén)別類(lèi)形成各種類(lèi)型的數(shù)據(jù)庫(kù),為應(yīng)用層提供數(shù)據(jù)支持。IR系統(tǒng)在應(yīng)用層主要實(shí)現(xiàn)的就是查詢(xún)和檢索功能,這種系統(tǒng)不僅可以提供用戶(hù)服務(wù),同時(shí)還可以為其它系統(tǒng)提供元數(shù)據(jù)。由此可見(jiàn),大數(shù)據(jù)背景下的開(kāi)放數(shù)據(jù)信息服務(wù)系統(tǒng)模型中,圖書(shū)館既是數(shù)據(jù)提供者,也是數(shù)據(jù)服務(wù)者。
圖2 基于開(kāi)放存取資源整合圖書(shū)館IR構(gòu)建邏輯框架圖[5]
3.2 架構(gòu)SOA模型,實(shí)現(xiàn)用戶(hù)服務(wù)資源整合
基于大數(shù)據(jù)的圖書(shū)館開(kāi)放數(shù)據(jù)信息服務(wù)系統(tǒng)還要以用戶(hù)服務(wù)為構(gòu)建導(dǎo)向,即利用中間技術(shù)實(shí)現(xiàn)各分布式子系統(tǒng)的有機(jī)組織和集成,最終達(dá)到有效整合龐雜數(shù)據(jù)信息的目的,其構(gòu)建指導(dǎo)思想是以信息技術(shù)為支撐,以用戶(hù)服務(wù)為中心。首先對(duì)用戶(hù)進(jìn)行客觀而全面的分析,并提供符合讀者用戶(hù)需求的高效增值服務(wù)模式,這種模式又被稱(chēng)為SOA模型。將SOA引入圖書(shū)館開(kāi)放數(shù)據(jù)信息服務(wù)系統(tǒng)構(gòu)建中,有利于解決現(xiàn)存的數(shù)據(jù)庫(kù)異構(gòu)性等問(wèn)題,原因在于SOA架構(gòu)定義了服務(wù)提供者、服務(wù)注冊(cè)中心和服務(wù)請(qǐng)求者三種角色,三者定位明確,能夠?qū)崿F(xiàn)用戶(hù)服務(wù)資源整合,真正將圖書(shū)館開(kāi)放數(shù)據(jù)信息服務(wù)系統(tǒng)打造成為集知識(shí)資源與服務(wù)為一體的開(kāi)放式服務(wù)系統(tǒng)。
3.3 應(yīng)用OLAP技術(shù),實(shí)現(xiàn)開(kāi)放資源知識(shí)整合
圖書(shū)館開(kāi)放資源知識(shí)整合從一定程度上來(lái)說(shuō)是一種理想化的構(gòu)建模式,其運(yùn)作流程為:將開(kāi)放存取資源納入到圖書(shū)館的數(shù)字資源體系中,利用OLAP技術(shù)實(shí)現(xiàn)針對(duì)分布式環(huán)境下的數(shù)字資源的統(tǒng)一檢索和獲取目標(biāo)資源的無(wú)縫鏈接,同時(shí)為注冊(cè)用戶(hù)提供多種類(lèi)型的個(gè)性化服務(wù),最后通過(guò)開(kāi)發(fā)的知識(shí)整合系統(tǒng),集提供信息、資源和服務(wù)于一體。大數(shù)據(jù)的環(huán)境背景決定了圖書(shū)館開(kāi)放資源知識(shí)整合需要在異構(gòu)數(shù)據(jù)信息系統(tǒng)中不斷進(jìn)行收集和集成整合工作,通過(guò)對(duì)OA資源知識(shí)的篩選和提取,存儲(chǔ)相應(yīng)的數(shù)據(jù)要素,最終構(gòu)建起圖書(shū)館的本體庫(kù)。其中,開(kāi)放數(shù)據(jù)信息服務(wù)系統(tǒng)的基礎(chǔ)是信息整合部分,而OA數(shù)據(jù)資源的來(lái)源和渠道十分廣泛,既可以是學(xué)術(shù)性較強(qiáng)的公共網(wǎng)絡(luò),也可以是數(shù)字圖書(shū)館,還可以是圖書(shū)館OPAC系統(tǒng)。
3.4 搭建OA資源導(dǎo)航系統(tǒng),實(shí)現(xiàn)統(tǒng)一檢索平臺(tái)
圖書(shū)館OA資源信息導(dǎo)航系統(tǒng)是將不同的信息資源的檢索入口統(tǒng)一整合在一起,提供信息的集成式服務(wù),是將不同數(shù)據(jù)庫(kù)中電子資源數(shù)據(jù)按照類(lèi)型、順序、學(xué)科等角度進(jìn)行分類(lèi)的平臺(tái)。OA資源導(dǎo)航系統(tǒng)的基本功能有利于幫助用戶(hù)在開(kāi)放式數(shù)據(jù)網(wǎng)絡(luò)環(huán)境下,通過(guò)資源分類(lèi)、關(guān)鍵詞等方式快速定位數(shù)據(jù)信息。在OA資源導(dǎo)航系統(tǒng)構(gòu)建方面,安徽大學(xué)圖書(shū)館取得了一定突破。安徽大學(xué)圖書(shū)館首頁(yè)上設(shè)置了專(zhuān)門(mén)的OA資源窗口,作為大數(shù)據(jù)環(huán)境下圖書(shū)館開(kāi)放數(shù)據(jù)信息服務(wù)系統(tǒng)的統(tǒng)一檢索平臺(tái),該校OA資源庫(kù)提供了30個(gè)開(kāi)放數(shù)據(jù)庫(kù),并按照不同類(lèi)型、不同來(lái)源進(jìn)行分類(lèi),同時(shí)支持讀者用戶(hù)的自助檢索,使全校讀者切實(shí)享受到大數(shù)據(jù)背景下圖書(shū)館構(gòu)建開(kāi)放數(shù)據(jù)信息服務(wù)的便利性。
綜上所述,在基于大數(shù)據(jù)的圖書(shū)館開(kāi)放數(shù)據(jù)信息服務(wù)系統(tǒng)構(gòu)建過(guò)程中,要明確構(gòu)建思路、服務(wù)目標(biāo)與服務(wù)層次,從資源層、數(shù)據(jù)處理層、應(yīng)用層以及用戶(hù)交互層四要素著手,構(gòu)建本館IR、架構(gòu)SOA模型、應(yīng)用OLAP技術(shù)、搭建OA資源導(dǎo)航系統(tǒng),以實(shí)現(xiàn)圖書(shū)館開(kāi)放數(shù)據(jù)信息服務(wù)系統(tǒng)有效實(shí)施。
[1] 孫坦.開(kāi)放信息環(huán)境:學(xué)術(shù)圖書(shū)館信息資源建設(shè)的重定義與再造[J].中國(guó)圖書(shū)館學(xué)報(bào),2013(3):9-17.
[2] 安徽大學(xué)圖書(shū)館[EB/OL].[2016-06-07]http://www.lib.ahu.edu.cn/do/list.php?fid=19.
[3] 蔣玲.開(kāi)放存取模式下圖書(shū)館發(fā)展對(duì)策研究[D].大連.遼寧師范大學(xué),2007.
[4] 黎艷.圖書(shū)館如何開(kāi)發(fā)與利用開(kāi)放存取資源[J].現(xiàn)代情報(bào),2010(1):66-69.
[5] 馬漫江.開(kāi)放存取期刊與高校圖書(shū)館電子期刊資源建設(shè)發(fā)展策略研究[D].湘潭.湘潭大學(xué),2009.
(責(zé)任編輯:王靖雯)
Research on the Model of Open Data Information Service System in Library Based on Big Data——Taking the Library of Anhui University as an Example
ZHONG Ping
(Anhui University, Hefei 230039, China)
The era of big data provides a new environment for the construction of open data information service system in library, and puts forward higher requirements for the library service system. Based on the interpretation of the open data information service in library under the environment of big data,this paper analyzes and expounds the construction elements of the service system, and finally puts forward four construction sections in the open data information service system in library, in order to promote the open data library information service.
big data; library; open information resources; open data information service
2015省級(jí)質(zhì)量工程項(xiàng)目(2015jyxm768);安徽大學(xué)圖書(shū)館科研項(xiàng)目(TSG14806)
G255.76
A
1006-1525(2016)06-0070-04
鐘 萍,女,研究館員。
2016-05-08
大學(xué)圖書(shū)情報(bào)學(xué)刊2016年6期