呂曉麗
(北京科技大學(xué) 北京 100083)
近五年我國(guó)圖書館大數(shù)據(jù)研究綜述及展望
呂曉麗
(北京科技大學(xué) 北京 100083)
在大數(shù)據(jù)的推動(dòng)下,圖書館事業(yè)取得突破性進(jìn)展和業(yè)務(wù)增長(zhǎng)點(diǎn)。學(xué)術(shù)界圍繞大數(shù)據(jù)與圖書館融合的探索和研究不斷涌現(xiàn),近年來(lái)呈明顯遞增之勢(shì)。本文基于2012年以來(lái)的大量相關(guān)文獻(xiàn),從以下三方面對(duì)此領(lǐng)域的研究進(jìn)行梳理:大數(shù)據(jù)特征及其與圖書館的關(guān)系;大數(shù)據(jù)技術(shù)在圖書館各項(xiàng)業(yè)務(wù)中的應(yīng)用;其它方面的研究,主要是借鑒國(guó)外先進(jìn)經(jīng)驗(yàn)及大數(shù)據(jù)給圖書館帶來(lái)的新問(wèn)題及解決方案。
圖書館 大數(shù)據(jù) 綜述
大數(shù)據(jù)的本質(zhì),就是對(duì)用戶行為與特征進(jìn)行分析,找出數(shù)據(jù)之間的相關(guān)關(guān)系,預(yù)判事物發(fā)展方向,繼而采取相應(yīng)的對(duì)策。以大數(shù)據(jù)作技術(shù)支撐,圖書館通過(guò)對(duì)讀者利用館藏資源的數(shù)據(jù)分析,從而判斷讀者偏好,有針對(duì)性的服務(wù)讀者。2008年9月,美國(guó)自然雜志首次闡述大數(shù)據(jù)及其影響,自此,各領(lǐng)域開(kāi)始關(guān)注和研究大數(shù)據(jù)。與此同時(shí),國(guó)內(nèi)學(xué)者開(kāi)始關(guān)注并研究大數(shù)據(jù)在圖書館的應(yīng)用。中國(guó)期刊網(wǎng)(CNKI)的研究文獻(xiàn)顯示,自2012年開(kāi)始,相關(guān)學(xué)術(shù)研究初露端倪。學(xué)者普遍認(rèn)為,大數(shù)據(jù)對(duì)圖書館產(chǎn)生的深遠(yuǎn)影響,直接表現(xiàn)在圖書館資源保存與整合、技術(shù)水平以及服務(wù)創(chuàng)新等各個(gè)方面。圖書館需要充分利用大數(shù)據(jù)的優(yōu)勢(shì),主動(dòng)尋求突破,推動(dòng)資源整合、拓展服務(wù)空間。
本文主要以中國(guó)期刊全文數(shù)據(jù)庫(kù)(CNKI)為檢索源,參照互聯(lián)網(wǎng)、萬(wàn)方數(shù)據(jù)檢索結(jié)果,檢索年度為2012年—2016年,共檢索到期刊論文和學(xué)位論文共計(jì)1000余篇(其中核心期刊論文218篇)。研究方向涉及大數(shù)據(jù)與圖書館各項(xiàng)業(yè)務(wù)的融合,包含信息(知識(shí))服務(wù)、數(shù)據(jù)存儲(chǔ)、數(shù)據(jù)挖掘、發(fā)展方向等諸多方面。
2012年是大數(shù)據(jù)與圖書館的學(xué)術(shù)研究的萌芽期,僅有四篇文獻(xiàn)。主要探討了大數(shù)據(jù)的內(nèi)涵、特征及其與圖書館各項(xiàng)業(yè)務(wù)的關(guān)聯(lián)。其中,樊偉紅的“圖書館需要怎樣的‘大數(shù)據(jù)’”[1]63一文,描述了大數(shù)據(jù)的特征,并與圖書館業(yè)務(wù)進(jìn)行關(guān)聯(lián)性分析,開(kāi)啟了相關(guān)研究。
2014年相關(guān)研究蓬勃發(fā)展。共有70篇核心文獻(xiàn)。一方面,學(xué)者開(kāi)始考慮大數(shù)據(jù)、云計(jì)算技術(shù)與圖書館的關(guān)系,以及這些技術(shù)如何在圖書館各項(xiàng)業(yè)務(wù)中充分發(fā)揮作用。另一方面,深入探索大數(shù)據(jù)在知識(shí)服務(wù)、信息服務(wù)、移動(dòng)服務(wù)、資源共享、隱私保護(hù)、業(yè)務(wù)流程等圖書館各項(xiàng)具體業(yè)務(wù)中應(yīng)用。2015—2016年是研究的拓展期。涉及大數(shù)據(jù)與圖書館論文總計(jì)為124篇,其中45篇論文均研究大數(shù)據(jù)帶給圖書館的新問(wèn)題以及如何解決這些問(wèn)題,同時(shí)涉及圖書館運(yùn)用大數(shù)據(jù)案例研究,標(biāo)志著圖書館學(xué)者從理論探討走向聯(lián)系實(shí)際,尋找大數(shù)據(jù)與圖書館的最優(yōu)契合方式。
1. 大數(shù)據(jù)特征及其與圖書館的關(guān)系的研究。基于大數(shù)據(jù)特征及與圖書館關(guān)系的研究,這在2012、2013年的文獻(xiàn)中較為多見(jiàn)。多位學(xué)者均從大數(shù)據(jù)的4V特征出發(fā)建立與圖書館的聯(lián)系。圖書館的數(shù)據(jù)特征與有諸多相通之處,圖書館的數(shù)據(jù)類型多(讀者信息;資源信息;閱讀、瀏覽及檢索記錄等)、總量大(各類電子及紙質(zhì)資源)、增速快且變化頻繁(幾乎每時(shí)每刻都在增加)。在大數(shù)據(jù)技術(shù)支持下,圖書館一方面要提取大量文獻(xiàn)資源等結(jié)構(gòu)化信息;另一方面跟蹤不斷變化的讀者資源使用記錄等非結(jié)構(gòu)化信息,從而預(yù)測(cè)讀者的資源偏好,提供特色化服務(wù)。計(jì)量學(xué)是圖書館研究的重要方法,傳統(tǒng)計(jì)量學(xué)側(cè)重于描述性研究,在大數(shù)據(jù)技術(shù)支持下,“計(jì)量”的側(cè)重點(diǎn)在于對(duì)事務(wù)進(jìn)行評(píng)估和預(yù)判[2]15。與此同時(shí),圖書館也面臨諸多技術(shù)問(wèn)題,包括信息數(shù)據(jù)組成結(jié)構(gòu)、類型格式、不斷變化的存在形式等,從而導(dǎo)致數(shù)據(jù)存貯和數(shù)據(jù)應(yīng)用愈加復(fù)雜,帶來(lái)的社會(huì)問(wèn)題包括解決上述問(wèn)題過(guò)程中會(huì)引起圖書館服務(wù)模式、資源建設(shè)模式、管理模式與發(fā)展模式的轉(zhuǎn)變[3]37。
2. 大數(shù)據(jù)技術(shù)在圖書館各項(xiàng)業(yè)務(wù)中應(yīng)用的研究。
(1)關(guān)于信息服務(wù)的研究。信息服務(wù)是圖書館服務(wù)的重要項(xiàng)目。長(zhǎng)期以來(lái),國(guó)內(nèi)圖書館提供的是以“短平快”為特征的信息服務(wù)。大數(shù)據(jù)背景下,讀者需求推動(dòng)圖書館提供“放長(zhǎng)線撈大魚”的預(yù)測(cè)性深度信息服務(wù)。2012—2016年有60余篇論文主要探討大數(shù)據(jù)時(shí)代的信息服務(wù)。從數(shù)據(jù)的特征上看,圖書館提供的資源推介、數(shù)據(jù)檢索、學(xué)科評(píng)估等各項(xiàng)服務(wù),其數(shù)據(jù)類型是結(jié)構(gòu)化數(shù)據(jù),屬于數(shù)據(jù)的“過(guò)去式”。在大數(shù)據(jù)技術(shù)的推動(dòng)下,圖書館需要利用讀者瀏覽資源偏好、使用資源傾向性、閱讀時(shí)間、地點(diǎn)等諸多非結(jié)構(gòu)化和半結(jié)構(gòu)化數(shù)據(jù),要提取的是數(shù)據(jù)的“未來(lái)式”。因此可以預(yù)測(cè),未來(lái)的圖書館信息服務(wù)首先會(huì)更加注重對(duì)讀者研究及交互數(shù)據(jù),在深度分析讀者數(shù)據(jù)的基礎(chǔ)上建立數(shù)學(xué)模型,開(kāi)展“精準(zhǔn)”服務(wù);其次,通過(guò)數(shù)據(jù)信息變化,對(duì)圖書館與讀者的交互關(guān)系進(jìn)行數(shù)據(jù)挖掘,預(yù)判可能發(fā)生的信息行為,開(kāi)展“預(yù)測(cè)”服務(wù);再次,圖書館之間的開(kāi)放性、合作性更強(qiáng),數(shù)字資源整合的力度更大,利用大數(shù)據(jù)提取高質(zhì)量信息的需求會(huì)更旺盛[4]14。
(2)關(guān)于資源建設(shè)的研究。資源是圖書館的核心,資源建設(shè)永遠(yuǎn)是圖書館發(fā)展中不可回避的話題。在圖書館資源建設(shè)中大數(shù)據(jù)將發(fā)揮不可或缺的作用:大數(shù)據(jù)為讀者參與資源采購(gòu)提供決策性支持,大數(shù)據(jù)推動(dòng)各種類型的資源整合,大數(shù)據(jù)促進(jìn)資源的高效率管理等。有學(xué)者認(rèn)為圖書館資源建設(shè)和利用的理論和經(jīng)驗(yàn)已經(jīng)相當(dāng)成熟,大數(shù)據(jù)資源與館藏紙質(zhì)資源具有相似特點(diǎn)。因此,大數(shù)據(jù)資源的存儲(chǔ)利用可以參照?qǐng)D書館資源建設(shè)的共建共享模式,其核心仍舊是資源整合[5]165。還有學(xué)者預(yù)測(cè),大數(shù)據(jù)時(shí)代的圖書館必將建立超大型元數(shù)據(jù)倉(cāng)儲(chǔ),超大型元數(shù)據(jù)倉(cāng)儲(chǔ)相當(dāng)于可以共享的大型數(shù)據(jù)庫(kù),進(jìn)行資源存儲(chǔ)與整合,建立一站式數(shù)字資源平臺(tái)。同時(shí),云服務(wù)、大數(shù)據(jù)等技術(shù)的結(jié)合能夠有效構(gòu)建“資源—讀者”關(guān)系模型,實(shí)現(xiàn)資源的數(shù)字化,從而滿足用戶不斷增長(zhǎng)的需求[6]138。
(3)關(guān)于技術(shù)層面的研究。信息技術(shù)顯然已成為影響圖書館變革的核心因素。傳統(tǒng)圖書館的數(shù)據(jù)處理以關(guān)系型數(shù)據(jù)為主,屬于“靜態(tài)”分析,大數(shù)據(jù)技術(shù)下圖書館的數(shù)據(jù)處理是從大量變化的數(shù)據(jù)中挖掘核心價(jià)值的信息,屬于“動(dòng)態(tài)”預(yù)測(cè),因此傳統(tǒng)的信息技術(shù)已經(jīng)不能適應(yīng)這種變化。32篇論文探討了圖書館信息技術(shù)如何與大數(shù)據(jù)同步,如何將結(jié)構(gòu)化、半結(jié)構(gòu)化的數(shù)據(jù)進(jìn)行安全有效的存儲(chǔ),如何將數(shù)學(xué)模型與信息提取結(jié)合,實(shí)現(xiàn)工作效率的提升。圖書館信息技術(shù)與大數(shù)據(jù)的同步主要解決的是異構(gòu)數(shù)據(jù)處理和集成的問(wèn)題。學(xué)者提出了多種方法,有的基于NoSQL構(gòu)建中間件模型[7]30;有的將非結(jié)構(gòu)化數(shù)據(jù)再次細(xì)分,通過(guò)對(duì)非結(jié)構(gòu)化數(shù)據(jù)融合分析進(jìn)行數(shù)據(jù)挖掘和管理[8]31;有的對(duì)差異性大、數(shù)據(jù)量大的數(shù)據(jù)進(jìn)行統(tǒng)一的格式處理,還有的把云計(jì)算、大數(shù)據(jù)、智慧圖書館、網(wǎng)絡(luò)動(dòng)態(tài)聯(lián)合起來(lái)綜合分析,開(kāi)展圖書館服務(wù)評(píng)估。學(xué)者分別在不同層面上提供了圖書館如何存儲(chǔ)、整合異構(gòu)數(shù)據(jù)的方法,解決了部分信息技術(shù)問(wèn)題,是圖書館與大數(shù)據(jù)融合的過(guò)程中取得的進(jìn)步[9]89。
(4)關(guān)于圖書館管理的研究。主要包含大數(shù)據(jù)背景下的智慧圖書館管理、圖書館員管理、基于某種理論的管理等方面。①智慧圖書館管理方面,基于大數(shù)據(jù)的智慧圖書館服務(wù)方式和服務(wù)內(nèi)容更具有針對(duì)性。首先對(duì)讀者進(jìn)行個(gè)性化服務(wù)需求分析,了解所需,對(duì)癥下藥,達(dá)到服務(wù)對(duì)象、管理人員、服務(wù)內(nèi)容的協(xié)同一致,實(shí)現(xiàn)高效分析和科學(xué)決策[10]70。②人員管理方面,圖書館員是圖書館的能動(dòng)因素,圖書館取得的任何進(jìn)步都離不開(kāi)圖書館員的努力,因此,對(duì)圖書館員進(jìn)行有效管理是推動(dòng)圖書館發(fā)展的前提。大數(shù)據(jù)是技術(shù)、是文化、是工作方式。一是提高圖書館員的技術(shù)水平,讓他們了解什么是大數(shù)據(jù),大數(shù)據(jù)在具體工作的應(yīng)用。二是進(jìn)行文化氛圍引導(dǎo),圖書館員的思維要轉(zhuǎn)型,實(shí)現(xiàn)從小數(shù)據(jù)思維到大數(shù)據(jù)思維的過(guò)渡。三是加大圖書館員的業(yè)務(wù)培訓(xùn),如何實(shí)現(xiàn)工作方式的轉(zhuǎn)型,如何在資源層面、讀者需求層面體現(xiàn)大數(shù)據(jù)優(yōu)勢(shì),從實(shí)質(zhì)上提升大數(shù)據(jù)時(shí)代圖書館員的素質(zhì)[11]49。③基于某種理論的管理方面,有學(xué)者從自組織的角度出發(fā),認(rèn)為自組織在數(shù)據(jù)、技術(shù)、獲取信息等方面給圖書館組織帶來(lái)了挑戰(zhàn)和發(fā)展機(jī)遇[12]44。有兩篇論文以生命周期為視角探討圖書館服務(wù)的周期,并基于生命周期理論構(gòu)建了大數(shù)據(jù)監(jiān)護(hù)系統(tǒng)、圖書館與讀者關(guān)系的管理系統(tǒng),可增強(qiáng)個(gè)性化服務(wù)過(guò)程中對(duì)讀者的認(rèn)知度,實(shí)現(xiàn)資源與讀者關(guān)系的深度監(jiān)護(hù)[13]91。
3. 其它方面的研究。主要是借鑒國(guó)外先進(jìn)經(jīng)驗(yàn)以及大數(shù)據(jù)給圖書館帶來(lái)的新問(wèn)題及解決方案。
(1)是借鑒國(guó)外先進(jìn)經(jīng)驗(yàn)的研究。國(guó)外圖書館對(duì)讀者使用數(shù)據(jù)的研究以及資源推送等服務(wù)開(kāi)展的較早,也比較系統(tǒng)。2007年,圖書館提供一項(xiàng)LTFL(LibraryThing forLibraries)服務(wù),LTFL是LibraryThing通過(guò)存儲(chǔ)在LibraryThing中的數(shù)據(jù),實(shí)現(xiàn)讀者閱讀關(guān)聯(lián),提供資源導(dǎo)讀和資源推送等服務(wù)。通過(guò)標(biāo)簽實(shí)現(xiàn)閱讀的社會(huì)化關(guān)聯(lián),并獲得導(dǎo)讀與推薦服務(wù)。2000年,美國(guó)Exlibris公司推出了SFX,可以實(shí)現(xiàn)不同類型的數(shù)據(jù)及其與OPAC的資源整合與挖掘,實(shí)現(xiàn)針對(duì)讀者的個(gè)性化服務(wù)[14]107。
(2)大數(shù)據(jù)給圖書館帶來(lái)新問(wèn)題及解決方案。大數(shù)據(jù)在發(fā)揮其優(yōu)勢(shì)的同時(shí)也帶來(lái)了新問(wèn)題,引起學(xué)者的廣泛關(guān)注和探索。信息的迅猛增加會(huì)形成新的信息不對(duì)稱。不同國(guó)家、地區(qū)、社會(huì)機(jī)構(gòu)在收集、整理、挖掘、分析數(shù)據(jù)時(shí)在不同程度上形成了新的信息壁壘或信息差距,導(dǎo)致新的信息所有權(quán)的不對(duì)等。但目前對(duì)生態(tài)圖書館的危害和防范措施研究尚不深入[15]92。
近年來(lái),大數(shù)據(jù)與圖書館的研究深度不斷拓展,研究?jī)?nèi)容由理論到實(shí)踐過(guò)渡,研究方法由單一向多樣化發(fā)展。由此預(yù)見(jiàn),一段時(shí)期內(nèi)在這個(gè)領(lǐng)域的研究仍將會(huì)延續(xù)以下幾個(gè)特征。
1. 研究深度進(jìn)一步拓展。圖書館與大數(shù)據(jù)的融合是一個(gè)以技術(shù)為關(guān)鍵引導(dǎo)的非常專業(yè)的領(lǐng)域。在圖書館數(shù)據(jù)存儲(chǔ)方式、數(shù)據(jù)挖掘方法、與其它信息技術(shù)的聯(lián)合、具體業(yè)務(wù)融合等方面,還需要做更深入地研究和探討。縱觀圖書館各項(xiàng)業(yè)務(wù),資源整合依舊是未來(lái)研究的熱點(diǎn)。圖書館進(jìn)行資源整合不僅依托于大數(shù)據(jù)技術(shù),更重要的是以資源現(xiàn)狀為基本條件,通過(guò)異構(gòu)資源的聚類、重組,達(dá)到無(wú)縫銜接,實(shí)現(xiàn)傳統(tǒng)圖書館業(yè)務(wù)與大數(shù)據(jù)背景下圖書館業(yè)務(wù)的高度融合。
2. 研究?jī)?nèi)容貼近具體業(yè)務(wù)。伴隨著大數(shù)據(jù)、云計(jì)算等技術(shù)的結(jié)合,圖書館服務(wù)項(xiàng)目需要進(jìn)一步貼近讀者實(shí)際需求,貼近技術(shù)前沿、貼近圖書館具體事務(wù)。通過(guò)大數(shù)據(jù)追蹤分析讀者行為,圖書館將更主動(dòng)地向讀者推薦資源,并依托互聯(lián)網(wǎng)、通信網(wǎng)、物聯(lián)網(wǎng)進(jìn)行傳播,借助微信公眾號(hào)、微博等即時(shí)通訊手段,達(dá)到手機(jī)、電腦等多終端接收數(shù)據(jù),信息資源無(wú)障礙推送。相關(guān)研究如果與實(shí)踐脫節(jié),將失去其存在價(jià)值。因此,針對(duì)解決具體問(wèn)題、優(yōu)秀案例分析、能夠?qū)嶋H發(fā)揮作用的研究會(huì)越來(lái)越多并成為主流。
3. 研究視野進(jìn)一步國(guó)際化。2015年以前借鑒國(guó)外圖書館經(jīng)驗(yàn)的文章較少。截止到2016年12月,有兩篇文章對(duì)國(guó)外圖書館應(yīng)用大數(shù)據(jù)技術(shù)進(jìn)行專門介紹,提出值得我國(guó)圖書館與大數(shù)據(jù)融合方面可借鑒之處。德國(guó)卡爾斯魯厄大學(xué)圖書館的Bibtip推薦系統(tǒng)是一個(gè)很好的借鑒,其實(shí)質(zhì)是在OPAC系統(tǒng)中應(yīng)用重復(fù)購(gòu)買理論,對(duì)用戶的瀏覽記錄進(jìn)行統(tǒng)計(jì)、分析檢索行為。隨著世界經(jīng)濟(jì)、文化、網(wǎng)絡(luò)高度融合,國(guó)家之間的交流和溝通越來(lái)越多,關(guān)于借鑒國(guó)外圖書館的先進(jìn)經(jīng)驗(yàn)為我所用的研究必將呈上升趨勢(shì)。
[1]樊偉紅,李晨暉,張興旺,秦曉珠,郭自寬.圖書館需要怎樣的“大數(shù)據(jù)”[J].圖書館雜志,2012(11).
[2]張文彥,武瑞原,于潔.大數(shù)據(jù)時(shí)代的圖書館初探[J].圖書與情報(bào), 2012(6).
[3]韓翠峰.大數(shù)據(jù)帶給圖書館的影響與挑戰(zhàn)[J].圖書與情報(bào),2012(5).
[4]吳敏慧.大數(shù)據(jù)與圖書館信息服務(wù)新構(gòu)想[J].圖書館理論與實(shí)踐,2015(2).
[5]陳祖琴,蔣勛,蘇新寧.圖書館視角下的大數(shù)據(jù)資源共建共享[J].情報(bào)雜志,2015(4).
[6]溫浩宇,李京京.大數(shù)據(jù)時(shí)代的數(shù)字圖書館異構(gòu)數(shù)據(jù)集成研究[J].情報(bào)雜志,2013(9).
[7]郭春霞.大數(shù)據(jù)環(huán)境下高校圖書館非結(jié)構(gòu)化數(shù)據(jù)融合分析[J].圖書館學(xué)研究,2015(5).
[8]李浩.云計(jì)算、大數(shù)據(jù)、數(shù)字圖書館與智慧圖書館關(guān)聯(lián)研究—用大數(shù)據(jù)打造智慧圖書館的思考[J].四川圖書館學(xué)報(bào),2014(6).
[9]陳臣.基于大數(shù)據(jù)驅(qū)動(dòng)的圖書館動(dòng)態(tài)網(wǎng)絡(luò)性能評(píng)估和服務(wù)質(zhì)量保證研究[J].圖書館理論與實(shí)踐,2016(8).
[10]馬曉亭.基于移動(dòng)大數(shù)據(jù)分析的圖書館個(gè)性化服務(wù)QOS保證研究[J].圖書館理論與實(shí)踐,2016(2).
[11]楊萬(wàn)勤,陳霞,徐宏儒.大數(shù)據(jù)時(shí)代的圖書館館員業(yè)務(wù)素養(yǎng)研究[J].山西檔案,2014(5).
[12]劉小鋒.大數(shù)據(jù)下圖書館知識(shí)的自組織機(jī)制[J].現(xiàn)代情報(bào),2014(11).
[13]陳雙飛.大數(shù)據(jù)時(shí)代圖書館基于服務(wù)生命周期的客戶關(guān)系管理研究[J].現(xiàn)代情報(bào),2014(5).
[14]沈杰.大數(shù)據(jù)與圖書館信息服務(wù)工作的變革[J].圖書館,2015(9).
[15]張四新.生態(tài)圖書館系統(tǒng)的人文架構(gòu)[J].情報(bào)雜志,2005(4).
250.76
A
2016-12-14
10.16565/j.cnki.1006-7744.2017.08.26
呂曉麗,北京科技大學(xué)黨委統(tǒng)戰(zhàn)部,研究方向?yàn)閳D書情報(bào),教育管理。