馮穎
摘 要:文章闡述了大數(shù)據(jù)給圖書館信息服務(wù)帶來的轉(zhuǎn)變,提出了大數(shù)據(jù)圖書館服務(wù)的發(fā)展方向,分析了基于大數(shù)據(jù)的圖書館信息服務(wù)模式和資源流程,并研究了大數(shù)據(jù)模式下的圖書館信息模式與個性化服務(wù)方式。
關(guān)鍵詞:大數(shù)據(jù);主動服務(wù);信息可視化;智能用戶分析
中圖分類號:G250 文獻標識碼:A 文章編號:1003-1588(2017)02-0093-03
近年來,隨著移動信息技術(shù)、大數(shù)據(jù)技術(shù)、數(shù)據(jù)處理技術(shù)的發(fā)展,圖書館的信息模式也在不斷地革新和優(yōu)化。在圖書館信息服務(wù)中,各類跨行業(yè)、定制化、個性化的業(yè)務(wù)需求不斷增多,對圖書信息數(shù)據(jù)的抽取、挖掘和分析成為推動圖書館信息服務(wù)水平提升的關(guān)鍵。大數(shù)據(jù)技術(shù)的發(fā)展為圖書館信息模式的創(chuàng)新提供了良好契機,構(gòu)建基于大數(shù)據(jù)的圖書館“數(shù)據(jù)—信息—知識—智慧”信息服務(wù)模式,能更好地推動圖書信息數(shù)據(jù)轉(zhuǎn)化為潛在知識服務(wù),進而創(chuàng)新信息服務(wù)模式,提升數(shù)字化、智能化、個性化服務(wù)水平。
1 大數(shù)據(jù)帶動圖書館信息模式的轉(zhuǎn)變
根據(jù)維基百科的定義,大數(shù)據(jù)是一種數(shù)據(jù)集,能夠通過常用的軟件工具來獲取、存儲和管理,具有種類多、流量大、體量大、價值高的特點。此外,大數(shù)據(jù)的處理時間超過常規(guī)數(shù)據(jù)處理的可容忍時間,不僅數(shù)據(jù)量巨大,而且增長迅速。大數(shù)據(jù)是一種寶貴的信息資產(chǎn),數(shù)據(jù)中蘊藏著豐富的信息內(nèi)容,圖書館用戶在圖書信息網(wǎng)站、購物平臺、社交網(wǎng)絡(luò)等信息平臺,都會產(chǎn)生并留下大量的數(shù)據(jù),這類大數(shù)據(jù)信息包含圖片、聲音、視頻等多媒體信息,最終形成海量的圖書館用戶大數(shù)據(jù)。大數(shù)據(jù)對圖書館信息模式的轉(zhuǎn)變有巨大的推動作用,具體如下。
1.1 從被動服務(wù)向主動服務(wù)轉(zhuǎn)變
傳統(tǒng)的圖書館服務(wù)以被動服務(wù)為主,管理員對圖書資源進行信息加工,經(jīng)過信息資源的采集、存儲、集成、分享,形成信息產(chǎn)品推送給用戶。這個信息流是以管理員為中心的單向流動的過程,用戶處于一種被動接受的狀態(tài),很難將自身需求傳遞回圖書館[1]。
大數(shù)據(jù)的出現(xiàn)有助于圖書館向主動式服務(wù)轉(zhuǎn)變,建立以用戶需求為中心的信息服務(wù)模式,為用戶提供個性化信息服務(wù)。如:圖書館根據(jù)對用戶評論、滿意度反饋調(diào)查等大數(shù)據(jù)的分析結(jié)果,提取出用戶的實際需求、閱讀習慣、閱讀頻次,并將之反饋給管理員,再由管理員進行信息資源的采集、存儲、集成和分享,形成符合用戶個性化需求的信息產(chǎn)品。
1.2 從內(nèi)向型服務(wù)向外向型服務(wù)轉(zhuǎn)變
傳統(tǒng)的圖書館服務(wù)屬于內(nèi)向型服務(wù),服務(wù)載體以紙質(zhì)書籍、報刊、檔案為主,知識傳播途徑較為單一。移動信息時代,圖書館的服務(wù)載體日益多元化,通過智能手機、電腦、電視等都可以進行圖書信息傳播,信息資源獲取途徑也不斷拓展,打破了傳統(tǒng)圖書服務(wù)模式的時空限制。
大數(shù)據(jù)模式下,圖書館信息途徑更加外向,信息受眾也更加寬泛,目前包括首都圖書館、廣州圖書館、上海圖書館等在內(nèi)的圖書館都允許社會人員入館,開放式的大數(shù)據(jù)圖書館成為發(fā)展趨勢,傳統(tǒng)“讀萬卷書、行萬里路”的信息獲取方式已經(jīng)過時,“秀才不出門,便知天下事”的大數(shù)據(jù)閱讀已成為現(xiàn)實。
2 基于大數(shù)據(jù)的圖書館信息服務(wù)模式研究
大數(shù)據(jù)是數(shù)字世界的智慧基因,來自圖書館用戶的使用數(shù)據(jù)、動態(tài)數(shù)據(jù)、關(guān)聯(lián)數(shù)據(jù)和社會網(wǎng)絡(luò)數(shù)據(jù)都能夠匯聚為大數(shù)據(jù),圖書館自身即可被視為一個大的數(shù)據(jù)集,不同地區(qū)的圖書館可以聯(lián)合構(gòu)建大數(shù)據(jù)圖書館,不同地區(qū)的圖書館數(shù)據(jù)之間存在數(shù)據(jù)交換和資源共享。圖書館通過對大數(shù)據(jù)的整合與分析,洞悉用戶的真實需求。圖1為圖書館大數(shù)據(jù)應(yīng)用的支撐技術(shù)與實現(xiàn)方法。
圖1顯示,圖書館大數(shù)據(jù)應(yīng)用主要基于分布式數(shù)據(jù)存儲、網(wǎng)絡(luò)分析挖掘、圖計算技術(shù)、可視化技術(shù)等,對各類源數(shù)據(jù)進行收集、整合、存儲和處理、分析,最終轉(zhuǎn)換為個性化服務(wù)。圖書館大數(shù)據(jù)結(jié)構(gòu)復(fù)雜、種類眾多、容量巨大,對數(shù)據(jù)的處理過程是信息工作人員對信息的再次加工與分析的過程。
國外對移動圖書館和大數(shù)據(jù)應(yīng)用的研究起步較早,由此衍生出的個性化服務(wù)也較多。目前,美國高??梢蕴峁┗赪indows Phone、Kindle、Blackberry等多個系統(tǒng)的圖書數(shù)據(jù)服務(wù),很多高校都實現(xiàn)了數(shù)字圖書館服務(wù)。如:耶魯大學(xué)所有紙質(zhì)圖書均印有二維碼,用戶可以通過掃碼直接鏈接圖書資源,還可以通過大數(shù)據(jù)收集提供多媒體資源的移動信息檢索;斯坦福大學(xué)圖書館用戶可以通過智能手機終端獲取各類移動信息,包括視頻、音頻、樂譜等。
在國內(nèi),清華大學(xué)、中國人民大學(xué)等高校的圖書館,以及國家圖書館、首都圖書館等技術(shù)先進的圖書館也在大數(shù)據(jù)應(yīng)用方面展開了一系列探索,國內(nèi)很多圖書館已經(jīng)基本實現(xiàn)館藏數(shù)字化,并借助大數(shù)據(jù)提供了一系列特色服務(wù)[2]。如:國家圖書館的“掌上國圖”、杭州數(shù)字圖書館的“文瀾在線”等。大數(shù)據(jù)信息模式通過數(shù)據(jù)挖掘和分析最終得出用戶行為分析結(jié)果,從而為圖書館個性化服務(wù)提供支撐。
如圖2所示,圖書館大數(shù)據(jù)的信息架構(gòu)可以分為四層,分別為大數(shù)據(jù)的采集、存儲、處理和應(yīng)用。其中,圖書館大數(shù)據(jù)主要采集來自國內(nèi)外數(shù)據(jù)庫的論文、著作以及社交網(wǎng)絡(luò)數(shù)據(jù)等,包括文字、圖片、影像、視頻等多種表現(xiàn)形式。圖書館數(shù)據(jù)浩如煙海,要想從數(shù)據(jù)中成功提取所需要的信息,需要借助Hadoop技術(shù)、Map Reduce技術(shù)、SQL(Structured Query Language,結(jié)構(gòu)化查詢語言)技術(shù)等,將大數(shù)據(jù)存儲到云服務(wù)器,通過云計算技術(shù)對大量的圖書文件系統(tǒng)和元數(shù)據(jù)庫進行整合,實現(xiàn)多渠道、多類型、大異構(gòu)的信息存儲服務(wù)[3]。
3 基于大數(shù)據(jù)的圖書館個性化服務(wù)研究
基于大數(shù)據(jù)的圖書館個性化服務(wù)能夠幫助用戶融入其中,構(gòu)建充分適用于互聯(lián)網(wǎng)、移動終端、智能手機、本地用戶等多種接入方式的大數(shù)據(jù)知識共享平臺。大數(shù)據(jù)技術(shù)強大的數(shù)據(jù)處理和分析能力,不僅能夠幫助用戶克服時空局限,與信息管理員進行實時反饋與交流,還能夠幫助用戶借助大數(shù)據(jù)個性化服務(wù)方式,通過新媒體傳播、互動百科、學(xué)術(shù)論壇等方式來發(fā)布信息,實現(xiàn)圖書信息的閉環(huán)傳遞和反饋。
3.1 信息可視化服務(wù)
移動信息時代圖書信息資源日益多樣化,用戶對信息提供方式的要求日益提升,希望能夠?qū)崿F(xiàn)反饋信息可視化。大數(shù)據(jù)信息量大、價值密度低、數(shù)據(jù)層次多,因此通過大數(shù)據(jù)挖掘提取出有用信息,并以可視化形式呈現(xiàn),能夠大大提高圖書館用戶對圖書信息檢索的評價。常見的圖書可視化技術(shù)包括標簽云、歷史流、空間信息技術(shù)等,通過大數(shù)據(jù)的可視化輸出,能夠提高用戶的查準率。
清華大學(xué)圖書館將圖書館服務(wù)嵌入搜索引擎中,將購買的66,000多種電子期刊資源與Google Scholar等平臺進行關(guān)聯(lián),并嵌入大數(shù)據(jù)的圖書可視化技術(shù),將電子館藏大數(shù)據(jù)信息整合為XML文件并存儲在特定服務(wù)器,從而使Google Scholar等平臺能夠定期抓取。當用戶在相關(guān)搜索引擎進行搜索時,可以根據(jù)用戶的檢索自動連接到清華大學(xué)的館藏資源,并能夠可視化呈現(xiàn),用戶通過標識性的文字就能夠獲取閱讀權(quán)限,從而極大地提升了資源的查準率和資源共享率[4]。
3.2 個性化圖書信息服務(wù)
要做好圖書館信息服務(wù),應(yīng)該充分利用大數(shù)據(jù)技術(shù)的優(yōu)勢,并與云計算技術(shù)、無線通信技術(shù)、傳感和網(wǎng)絡(luò)技術(shù)相結(jié)合,實現(xiàn)圖書館數(shù)據(jù)從基礎(chǔ)設(shè)施架構(gòu)到用戶服務(wù)模式的變革,進而幫助用戶克服閱讀時間、地點、內(nèi)容、終端類型等條件的限制,結(jié)合移動圖書館、手機圖書館、云計算圖書館、泛在圖書館等新的服務(wù)形式,真正實現(xiàn)以用戶需求為中心的信息模式與個性化服務(wù)。
如表1所示,以國家圖書館的“掌上國圖”和杭州數(shù)字圖書館的“文瀾在線”為代表,國內(nèi)一些技術(shù)先進的圖書館已經(jīng)逐步對館藏進行數(shù)字化,并基于大數(shù)據(jù)技術(shù)對數(shù)字資源進行分析、存儲和整合,提供參考咨詢、圖書館微博、讀者薦購等服務(wù)。圖書館將海量的無序數(shù)據(jù)進行整合,通過開放鏈接和數(shù)據(jù)混搭的方式對其進行推送,對于來自互聯(lián)網(wǎng)、移動終端、本地等不同路徑的圖書館用戶,圖書館能夠基于大數(shù)據(jù)提供的海量資源,提供具備個性化參考咨詢的一站式檢索服務(wù)。在個性化知識發(fā)布方面,圖書館能夠通過學(xué)術(shù)博客、圖書館網(wǎng)站等來發(fā)布圖書信息;在個性化知識交流方面,讀者既能夠在知網(wǎng)空間發(fā)表心得,也能夠通過互動百科、學(xué)術(shù)論壇等方式參與知識交流。此外,互聯(lián)網(wǎng)用戶還能夠借助泛在網(wǎng)絡(luò)和虛擬社區(qū)來參與圖書信息交流,大數(shù)據(jù)的可視化技術(shù)也極大地提升了圖書館個性化服務(wù)的效率。
3.3 用戶智能化分析服務(wù)
數(shù)據(jù)挖掘即從大數(shù)據(jù)中提取出各類有價值信息,并將之應(yīng)用于對圖書信息用戶閱讀習慣、信息行為、信息軌跡的分析上,同時借助這些分析來預(yù)測用戶需求,從而提供智能化推送服務(wù)[5]。此外,圖書館還能夠借助智能化分析服務(wù),對現(xiàn)有資源進行綜合分析,預(yù)測未來有可能存在的系統(tǒng)故障、用戶需求響應(yīng)障礙、信息安全等方面的問題。
圖3是大數(shù)據(jù)圖書館讀者閱讀行為分析判定流程圖。如圖3所示,大數(shù)據(jù)圖書館會全面而規(guī)范地搜集用戶行為數(shù)據(jù),基于大量的存儲數(shù)據(jù)對用戶行為事件進行初步過濾,通過科學(xué)分類、智能分析、人工匹配等環(huán)節(jié),結(jié)合信息管理人員的經(jīng)驗,經(jīng)過價值過濾和人工篩選后得出用戶行為定義,從而進行用戶行為判定,完成價值過濾和信息篩選過程。與此同時,圖書館還采集用戶行為事件并將之存入大數(shù)據(jù)庫,將用戶行為分析的結(jié)果與數(shù)據(jù)庫對比,進行用戶行為匹配,最終得出用戶的閱讀行為和興趣點,并據(jù)此進行個性化推送服務(wù)。
清華大學(xué)圖書館在新浪微博注冊了名為“清華樂推”的微博,并使用了大數(shù)據(jù)的用戶智能分析技術(shù),通過對清華大學(xué)官方微博上的讀者咨詢、建議、投訴和表揚等方面數(shù)據(jù)的分析,篩選出重要的價值信息[6],并依據(jù)這些信息來提供相應(yīng)的定制服務(wù)、培訓(xùn)信息、圖書推送信息等。
4 結(jié)語
大數(shù)據(jù)是移動信息時代用戶閱讀需求快速變化的產(chǎn)物,也是信息技術(shù)發(fā)展的必然趨勢,大數(shù)據(jù)在圖書館的應(yīng)用有利于打破傳統(tǒng)圖書館在時間和地點方面的限制。大數(shù)據(jù)已經(jīng)成為保障圖書館信息系統(tǒng)和服務(wù)能力的重要因素,現(xiàn)代圖書館應(yīng)該充分利用大數(shù)據(jù)資源,準確識別圖書館用戶的服務(wù)需求、閱讀行為、個性化特征,創(chuàng)新信息模式與個性化服務(wù)方法,不斷改善用戶的閱讀體驗,改善用戶關(guān)系,從而實現(xiàn)精準化、個性化、智能化的圖書信息服務(wù)。
參考文獻:
[1]胡越.圖書館服務(wù)的學(xué)科化與個性化[M].北京:首都師范大學(xué)出版社,2008:21.
[2]周虹,張蓓,竇天芳,等.清華大學(xué)圖書館OPAC書封服務(wù)的設(shè)計與實現(xiàn)[J].現(xiàn)代圖書情報技術(shù),2008(8):84-87.
[3]施慧娟.可視化數(shù)據(jù)挖掘技術(shù)的研究與實現(xiàn)[D].上海:華東師范大學(xué)信息學(xué)院,2010.
[4]劉淑玲.網(wǎng)絡(luò)環(huán)境下高校圖書館的知識管理與知識服務(wù)[J].情報科學(xué),2010(4):523-526.
[5]韓晶星.面向知識社區(qū)的數(shù)字參考咨詢服務(wù)平臺構(gòu)建[J].情報雜志,2010(2):123-126.
[6]李靖.圖書館自助式服務(wù)的現(xiàn)狀與未來[J].上海高校圖書情報工作研究,2011(2): 6-8.
(編校:周雪芹)