銀晶
摘 要 大數(shù)據(jù)的核心實(shí)際是一種數(shù)據(jù)思維,國(guó)內(nèi)公共圖書館目前已做了一些利用大數(shù)據(jù)嘗試。論文從單個(gè)城市公共圖書館到圖書館業(yè)內(nèi),以及圖書館與社會(huì)跨界三個(gè)維度的實(shí)證分析,反映出大數(shù)據(jù)運(yùn)用時(shí)產(chǎn)生的各種問(wèn)題,并給予建議和對(duì)策,同時(shí)也展望了圖書館未來(lái)大數(shù)據(jù)運(yùn)用情況,以期對(duì)國(guó)內(nèi)圖書館業(yè)內(nèi)有所借鑒。
關(guān)鍵詞 公共圖書館 大數(shù)據(jù) 數(shù)據(jù)思維
分類號(hào) G250.76
DOI 10.16810/j.cnki.1672-514X.2017.01.012
Analysis and Countermeasures on the Empirical Process of Big Data in Public Library
Yin Jing
Abstract The core of big data is a data thinking. At present domestic public libraries have made some attempt of using big data. This paper analyzes the empirical process of big data from three dimensions, including public libraries in different cities, library industry, and library and social cross-borders. It reflects some problems of using big data, and gives the suggestions and countermeasures. Also it outlooks the future of big data in libraries, and hopes to give reference for domestic libraries.
Keywords Public library. Big data. Data thinking.
大數(shù)據(jù)時(shí)代要學(xué)會(huì)用數(shù)據(jù)說(shuō)話,其核心就是要擁有數(shù)據(jù)思維[1]。作為服務(wù)行業(yè)的公共圖書館,數(shù)據(jù)的產(chǎn)生及收集是非常豐厚的,利用大數(shù)據(jù)思維,可以從更多維度來(lái)了解館情,不僅可以了解館內(nèi)讀者行為、資源使用情況,改進(jìn)或調(diào)整管理決策、服務(wù)過(guò)程、技術(shù)手段以及宣傳策略,提升圖書館服務(wù)質(zhì)量和水平、提高資源利用率等;也可以在業(yè)內(nèi)進(jìn)行比較,幫助發(fā)現(xiàn)問(wèn)題,了解所處行業(yè)位置和業(yè)務(wù)水平;還可以將數(shù)據(jù)與外部環(huán)境關(guān)聯(lián)對(duì)比,在社會(huì)大環(huán)境中看清楚圖書館的服務(wù)價(jià)值、提升空間及發(fā)展方向。
1 圖書館對(duì)大數(shù)據(jù)的認(rèn)識(shí)才剛剛開(kāi)始
大數(shù)據(jù)目前雖然已經(jīng)成為業(yè)界的話題,但在圖書館,大多數(shù)人認(rèn)為它離我們還遙遠(yuǎn),在實(shí)踐中還沒(méi)有認(rèn)認(rèn)真真地著手基礎(chǔ)數(shù)據(jù)的挖掘工作,一些看似簡(jiǎn)單的、無(wú)用的、雜亂的數(shù)據(jù)還沒(méi)有有效地應(yīng)用于圖書館的各項(xiàng)工作中,圖書館對(duì)大數(shù)據(jù)的認(rèn)識(shí)也才剛剛開(kāi)始。
國(guó)內(nèi)圖書館將一些業(yè)務(wù)服務(wù)數(shù)據(jù)向社會(huì)公布始于2013年,率先是由上海圖書館開(kāi)始嘗試。上海圖書館于2013年推出了“我的悅讀2012”,即注冊(cè)讀者2012年的閱讀賬單,大獲好評(píng),其數(shù)據(jù)內(nèi)容為上海圖書館的讀者每人平均借閱書本冊(cè)數(shù)、借閱量最大的讀者借過(guò)多少冊(cè)、借閱頻率最高的書被多少名讀者借過(guò)、上海市中心圖書館的規(guī)模等有趣的統(tǒng)計(jì)數(shù)據(jù)[2]。2015年,深圳圖書館對(duì)外公布了深圖2014年大數(shù)據(jù)服務(wù)結(jié)果,包括到館人次、服務(wù)讀者量、文獻(xiàn)外借冊(cè)次、全年舉辦各類活動(dòng)場(chǎng)次,微媒體粉絲、數(shù)字閱讀服務(wù)量、年度檢索熱詞、圖書館設(shè)施設(shè)備情況及場(chǎng)館服務(wù)宣傳等內(nèi)容。同年,杭州圖書館則在其微信公眾號(hào)增加了“閱讀賬單”功能,綁定讀者帳號(hào)后,讀者可了解自己在2014年的全年借閱量及排行、文獻(xiàn)種類、持證時(shí)間等數(shù)據(jù)內(nèi)容。2016年初,東莞圖書館、廣州圖書館、佛山圖書館等也相繼在媒體上公布本館大數(shù)據(jù)服務(wù)內(nèi)容。盡管眾多的圖書館向社會(huì)陸續(xù)開(kāi)展大數(shù)據(jù)服務(wù),但筆者認(rèn)為真正實(shí)施大數(shù)據(jù)分析的圖書館卻少之又少。
2 圖書館數(shù)據(jù)源統(tǒng)計(jì)應(yīng)用實(shí)證分析
大數(shù)據(jù)理論上需要全的數(shù)據(jù),圖書館目前已有的數(shù)據(jù)并不少,特別是采用績(jī)效管理模式的圖書館,數(shù)據(jù)源更是種類多樣,這就需要對(duì)館內(nèi)部的數(shù)據(jù)進(jìn)行梳理、分析,進(jìn)行查漏補(bǔ)缺、合并重復(fù)數(shù)據(jù),形成數(shù)據(jù)整合報(bào)表,一目了然,清晰明白,而一旦其中數(shù)據(jù)有異樣可以準(zhǔn)確發(fā)現(xiàn)問(wèn)題環(huán)節(jié),這樣才具有參考決策意義。
2.1 案例一、流通文獻(xiàn)書目數(shù)據(jù)
以流通文獻(xiàn)為例,流通文獻(xiàn)的統(tǒng)計(jì)在系統(tǒng)建設(shè)前期,已經(jīng)設(shè)計(jì)了各種數(shù)據(jù)字段的數(shù)據(jù)表等,需要什么字段的內(nèi)容,語(yǔ)句命令調(diào)用即可?;跂|莞圖書館圖書館Interlib系統(tǒng)后臺(tái)調(diào)用日志,采用SQL統(tǒng)計(jì)方法,對(duì)2014年1月1日—2014年12月31日?qǐng)D書館借閱文獻(xiàn)進(jìn)行統(tǒng)計(jì),并按照文獻(xiàn)借閱數(shù)量排序,顯示年文獻(xiàn)借閱量達(dá)1萬(wàn)次以上數(shù)據(jù)統(tǒng)計(jì)結(jié)果,見(jiàn)表1。
(1)該熱門文獻(xiàn)借閱統(tǒng)計(jì)表需要與館藏文獻(xiàn)統(tǒng)計(jì)表等相關(guān)業(yè)務(wù)數(shù)據(jù)進(jìn)行對(duì)比,對(duì)于文獻(xiàn)館藏比例調(diào)整、采購(gòu)選擇有了參考依據(jù),館藏文獻(xiàn)統(tǒng)計(jì)表、預(yù)約文獻(xiàn)統(tǒng)計(jì)表、續(xù)借文獻(xiàn)統(tǒng)計(jì)表、熱門檢索文獻(xiàn)統(tǒng)計(jì)表等此類數(shù)據(jù)的統(tǒng)計(jì)就需要納入業(yè)務(wù)數(shù)據(jù)統(tǒng)計(jì)范疇中。
(2)該表分析有如下結(jié)果,成人讀物與少兒讀物類別比例對(duì)分,即1:1。成人閱讀最熱內(nèi)容,除小說(shuō)及家庭教育之外,個(gè)性心理學(xué)(人格心理學(xué))、圖形圖像識(shí)別、人生觀與人生哲學(xué)、證券市場(chǎng)也進(jìn)入了熱門借閱榜。兒童閱讀最熱內(nèi)容,以圖畫故事書為主,各種童話、寓言、兒童笑話、謎語(yǔ)、神話其次,位居第三的美國(guó)圖書故事書深受歡迎,隨后是各科簡(jiǎn)易讀物、對(duì)照讀物、注釋讀物、幼兒讀物、常識(shí)等等。
(3)對(duì)于此表的統(tǒng)計(jì)還發(fā)現(xiàn)文獻(xiàn)編目數(shù)據(jù)應(yīng)有更詳細(xì)的制定規(guī)則。以I247.57為例,就有長(zhǎng)篇小說(shuō)、言情小說(shuō)、中篇小說(shuō)、三部曲(作品)、日記體小說(shuō)、歷史小說(shuō)、短篇小說(shuō)空值等35項(xiàng)分類說(shuō)明,不僅增加了統(tǒng)計(jì)難度,而且統(tǒng)計(jì)出來(lái)的結(jié)果無(wú)法適用于實(shí)際工作。
2.2 案例二、監(jiān)控?cái)?shù)據(jù)的作用
以到館人次為例,東莞圖書館2014年到館人數(shù)為230萬(wàn),其中參與用戶培訓(xùn)人數(shù)占0.79%,參加講座人數(shù)占1.4%,參觀展覽人數(shù)占18.9%,合計(jì)有21.09%的讀者到館是參加各種活動(dòng)、講座或培訓(xùn)。其中書刊文獻(xiàn)外借人次占流通人次的38.17%,到館使用文獻(xiàn)資源,那么還有40.74%的到館讀者在做什么呢?自習(xí)、休閑、開(kāi)架閱覽是觀察中得到的結(jié)論,并無(wú)數(shù)據(jù)支持,而這部分?jǐn)?shù)據(jù)是可以通過(guò)已有的門禁系統(tǒng)、視頻監(jiān)控系統(tǒng)等進(jìn)行數(shù)據(jù)統(tǒng)計(jì)。除了統(tǒng)計(jì)數(shù)量之外,監(jiān)控?cái)?shù)據(jù)時(shí)間分布趨勢(shì)對(duì)安全管理措施制定有重要的參考意義。
以上僅以兩個(gè)案例說(shuō)明在圖書館內(nèi)外部反映業(yè)務(wù)成效數(shù)據(jù)中需要厘清數(shù)據(jù)源,在對(duì)一種業(yè)務(wù)數(shù)據(jù)報(bào)表統(tǒng)計(jì)時(shí)要與關(guān)聯(lián)數(shù)據(jù)表相互佐證,籍此來(lái)發(fā)現(xiàn)是否有遺漏的價(jià)值數(shù)據(jù)。業(yè)務(wù)數(shù)據(jù)不能是孤立的,單個(gè)報(bào)表只反映了客觀事實(shí)的一部分,如安全管理的數(shù)據(jù),門禁監(jiān)控?cái)?shù)據(jù)之外,還有能耗、資金投入、修繕等一系列方面的數(shù)據(jù)。
3 通過(guò)各類數(shù)據(jù)對(duì)比識(shí)別社會(huì)服務(wù)價(jià)值
圖書館的各種統(tǒng)計(jì)數(shù)據(jù)除館內(nèi)管理決策使用之外,還要有縱橫比較,一個(gè)是與館內(nèi)相關(guān)數(shù)據(jù)進(jìn)行對(duì)比印證客觀事實(shí);二是與業(yè)內(nèi)同行縱向進(jìn)行比較,來(lái)確認(rèn)在業(yè)內(nèi)的服務(wù)水平和業(yè)務(wù)能力等;三是跨界比較,可與服務(wù)地域的人口結(jié)構(gòu)、教育水平、文化程度等進(jìn)行跨界比較分析,從另一個(gè)角度來(lái)認(rèn)識(shí)圖書館的服務(wù)效果。
3.1 館內(nèi)相關(guān)數(shù)據(jù)對(duì)比印證
東莞圖書館的用戶數(shù)據(jù)統(tǒng)計(jì)分析結(jié)果中,讀者平均年齡為32歲,男女比例基本持平,男性略占優(yōu)勢(shì),學(xué)歷數(shù)據(jù)統(tǒng)計(jì)結(jié)果顯示,小學(xué)以上學(xué)歷占32.83%,其中中學(xué)類占8.15%、大學(xué)占23.75%,研究生以上占1.3%;而填寫其它/空白,即無(wú)學(xué)歷占67.13%,表明大部分讀者學(xué)歷不高或太高或無(wú)學(xué)歷。與2014年文獻(xiàn)借閱統(tǒng)計(jì)分析得出預(yù)估讀者群體特征相一致。
3.2 與業(yè)內(nèi)同行縱向比較
當(dāng)單館的業(yè)務(wù)數(shù)據(jù)與同行相比較的時(shí)候,數(shù)據(jù)差異會(huì)在一定程度上說(shuō)明各館的服務(wù)差異,但更多的則是數(shù)據(jù)本身有各種問(wèn)題。以下案例中國(guó)內(nèi)幾個(gè)公共圖書館大數(shù)據(jù)結(jié)果來(lái)源均出自媒體報(bào)道或其工作年報(bào),或直接采用,或根據(jù)其數(shù)據(jù)與相關(guān)數(shù)據(jù)進(jìn)行演算后得出,沒(méi)有數(shù)據(jù)則空白顯示。
(1)主要讀者群體年齡段。表2數(shù)據(jù)顯示,各館的主要年齡段分布在18-45歲之間。
(2)年流通人次及日均到館人次。表3數(shù)值統(tǒng)計(jì)中包含了各館分館的數(shù)據(jù),統(tǒng)計(jì)方式各館都不同,東莞圖書館曾采用紅外線計(jì)數(shù)器,但這種設(shè)備對(duì)于群體出入的數(shù)量無(wú)法精確記錄,后更新?lián)Q代成單人出入閘口,使得數(shù)據(jù)統(tǒng)計(jì)更為準(zhǔn)確。
(3)年文獻(xiàn)外借冊(cè)次。表4中可以看到,上海圖書館的年文獻(xiàn)外借冊(cè)次驚人。其它館的外借冊(cè)次雖然相比而言并不多,卻不能說(shuō)明服務(wù)水平不高,因?yàn)閿?shù)字閱讀的服務(wù)已是現(xiàn)代圖書館文獻(xiàn)服務(wù)的重要領(lǐng)域。
人均借閱冊(cè)次=外借冊(cè)次/持證讀者數(shù)
數(shù)值=(未成年人6冊(cè)次+成年人5冊(cè)次)/2
(4)持證讀者占城市常住人口比例。表5中的數(shù)值比例本意是想表達(dá)圖書館的社會(huì)價(jià)值和作用,然而讀者證卻是一言難盡的,有些城市圖書館的讀者證與類似便民服務(wù)卡的城市管理服務(wù)相融合,使其服務(wù)卡也具備了讀者證功能,比如社???,電子學(xué)生證或校園卡等,通常都?xì)w因于當(dāng)?shù)卣欠翊罅χС?,具有典型的地域特征。而其它圖書館沒(méi)有這樣的強(qiáng)力支持力度,則會(huì)從讀者證的有效性、活躍性等方面發(fā)出疑問(wèn)。因此,如何確認(rèn)讀者證的真正價(jià)值,或者考慮用其它可以替代的數(shù)值項(xiàng)來(lái)表達(dá)圖書館對(duì)于本地社會(huì)的價(jià)值和作用。
各城市常住人口數(shù)值均取自各地《2014年X市國(guó)民經(jīng)濟(jì)與社會(huì)發(fā)展統(tǒng)計(jì)公報(bào)》,如《2014年廣州市國(guó)民經(jīng)濟(jì)和社會(huì)發(fā)展統(tǒng)計(jì)公報(bào)》
(5)數(shù)字資源服務(wù)量。表6中各館對(duì)于數(shù)字資源使用的統(tǒng)計(jì)方式,統(tǒng)計(jì)項(xiàng)等并不統(tǒng)一。數(shù)字資源的點(diǎn)擊量如何統(tǒng)計(jì)、冊(cè)次與篇次又有什么區(qū)別,如何計(jì)量?下載到本地還是緩存等都無(wú)定論。數(shù)字資源使用需要用什么樣的指標(biāo)來(lái)確認(rèn),各館均有自己的看法。
(6)熱門借閱文獻(xiàn)。對(duì)于熱門文獻(xiàn)的界定,顯然也不統(tǒng)一,各館對(duì)于熱門文獻(xiàn)的分析角度也不同,比如上海圖書館對(duì)于不同年齡層進(jìn)行了分析,青年人閱讀經(jīng)濟(jì)類圖書的比例遠(yuǎn)高于中老年讀者,老年人閱讀經(jīng)典讀物、人物傳記圖書的比例高于中青年讀者。深圳圖書館書刊借閱部主任張樺介紹[9],工業(yè)技術(shù)類和經(jīng)濟(jì)類,這兩大類正好與深圳重點(diǎn)發(fā)展高新技術(shù)產(chǎn)業(yè)、金融產(chǎn)業(yè)的城市發(fā)展方向相吻合,進(jìn)一步細(xì)分之后,在工業(yè)技術(shù)類中,計(jì)算機(jī)軟件類的書籍借閱量較大;在經(jīng)濟(jì)類中,金融理財(cái)和企業(yè)管理類的書籍比較受到讀者的青睞。廣州館則給出了熱門文獻(xiàn)前十名的排行榜,只列出了具體書目文獻(xiàn)信息,沒(méi)有類別的統(tǒng)計(jì)分析。
綜上所述,當(dāng)館內(nèi)統(tǒng)計(jì)的數(shù)據(jù)與業(yè)內(nèi)同行比較時(shí),產(chǎn)生了各種問(wèn)題,追究其原因,(1)沒(méi)有數(shù)據(jù)統(tǒng)計(jì)的標(biāo)準(zhǔn),特別是數(shù)字閱讀使用量,而傳統(tǒng)業(yè)務(wù)數(shù)據(jù)的已經(jīng)不能客觀反映業(yè)務(wù)真是情況。(2)大數(shù)據(jù)運(yùn)用中,該統(tǒng)計(jì)什么樣的數(shù)據(jù)項(xiàng),如何對(duì)數(shù)據(jù)項(xiàng)進(jìn)行有效分析。(3)大數(shù)據(jù)分析結(jié)果要對(duì)社會(huì)發(fā)生什么樣的影響作用需要考慮,既要積極指引閱讀的作用,也不能抹去存在的問(wèn)題和困難。(4)數(shù)據(jù)公布是為了帶動(dòng)業(yè)內(nèi)發(fā)展,促進(jìn)交流,為本地讀者提供更好的服務(wù)。
3.3 跨界比較
圖書館對(duì)社會(huì)的影響力到底有多大,或者說(shuō)對(duì)于社會(huì)的價(jià)值貢獻(xiàn)有多少,在大數(shù)據(jù)時(shí)代,各行各業(yè)都開(kāi)始重視數(shù)據(jù),單純的數(shù)據(jù)沒(méi)有了行業(yè)間的阻隔使得跨界比較成為了可能。以東莞圖書館用戶分析數(shù)據(jù)與東莞市人口數(shù)據(jù)的比較為例。數(shù)據(jù)比較1:2014年末東莞市全市常住人口834.31萬(wàn)人,其中城鎮(zhèn)常住人口740.95萬(wàn)人,戶籍人口191.39萬(wàn)人。常住人口以外來(lái)務(wù)工人員為主,大部分學(xué)歷為中學(xué)/中專以下,與該館讀者群體分析一致。數(shù)據(jù)比較2:東莞圖書館2014年總分館到館人次為713萬(wàn),表明東莞圖書館總分館為全市85%的常住人口提供了服務(wù),去過(guò)身邊的圖書館/基層公共電子閱覽室。數(shù)據(jù)比較3:東莞圖書館圖書館2014年提供數(shù)字閱讀服務(wù)量達(dá)到了1千萬(wàn)次以上,以當(dāng)年的東莞市常住人口計(jì)算,人均約1.2次。上述比較反映了一個(gè)城市的圖書館對(duì)于本地社會(huì)的服務(wù)情況,側(cè)面反映出它的社會(huì)影響力。
除以上對(duì)比之外,還可以與當(dāng)?shù)厝丝谖幕?、學(xué)歷水平、社會(huì)經(jīng)濟(jì)發(fā)展情況等各方面進(jìn)行跨界對(duì)比,城市圖書館為本地市民提供服務(wù)的質(zhì)量、數(shù)量更能準(zhǔn)確反映該圖書館對(duì)于當(dāng)?shù)厣鐣?huì)的價(jià)值、對(duì)市民及行業(yè)的影響力,以及對(duì)未來(lái)服務(wù)發(fā)展方向的了解等。
4 圖書館運(yùn)用大數(shù)據(jù)的問(wèn)題與對(duì)策
4.1 標(biāo)準(zhǔn)規(guī)范制定是大數(shù)據(jù)利用前提
4.1.1 規(guī)范原始數(shù)據(jù)類型,夯實(shí)數(shù)據(jù)統(tǒng)計(jì)的基礎(chǔ)
經(jīng)過(guò)數(shù)據(jù)整理會(huì)發(fā)現(xiàn)各種數(shù)據(jù)統(tǒng)計(jì)問(wèn)題,規(guī)范原始數(shù)據(jù)非常必要,比如原始數(shù)據(jù)登記內(nèi)容是否完整、數(shù)據(jù)類型分類數(shù)量酌情增減、數(shù)據(jù)源是否增加等。
4.1.2 數(shù)據(jù)統(tǒng)計(jì)方式要明確,便于數(shù)據(jù)采信利用
目前業(yè)內(nèi)對(duì)于圖書館業(yè)務(wù)數(shù)據(jù)并無(wú)統(tǒng)一標(biāo)準(zhǔn),而實(shí)際業(yè)務(wù)中發(fā)生的數(shù)據(jù)紛繁蕪雜,以圖書館提供數(shù)字資源服務(wù)的數(shù)據(jù)庫(kù)為例,統(tǒng)計(jì)數(shù)據(jù)項(xiàng)中的點(diǎn)擊量、下載量、瀏覽量并無(wú)統(tǒng)一的標(biāo)準(zhǔn)解釋,或者由圖書館根據(jù)自己的理解去統(tǒng)計(jì),或者由數(shù)據(jù)庫(kù)提供商提供資源使用的數(shù)據(jù)統(tǒng)計(jì)結(jié)果。這樣的數(shù)據(jù)結(jié)果采信值較低,不利于反映出業(yè)務(wù)服務(wù)的真實(shí)情況。
4.1.3 亟待解決數(shù)據(jù)統(tǒng)計(jì)標(biāo)準(zhǔn)規(guī)范的制定
從采集渠道、采集種類、統(tǒng)計(jì)方式、統(tǒng)計(jì)結(jié)果呈現(xiàn)方式等進(jìn)行規(guī)范。在標(biāo)準(zhǔn)制定過(guò)程中需要參照行業(yè)外部的相關(guān)數(shù)據(jù)統(tǒng)計(jì)標(biāo)準(zhǔn)規(guī)范,以便與之可以對(duì)接,具有可比較性等。
4.2 大數(shù)據(jù)的技術(shù)解決方案
4.2.1 技術(shù)改進(jìn),便于使用
大數(shù)據(jù)實(shí)際使用中不是必須重新研發(fā)技術(shù)平臺(tái),特別是目前圖書館業(yè)內(nèi)不會(huì)花費(fèi)高昂的成本進(jìn)行,可以考慮在現(xiàn)有業(yè)務(wù)/服務(wù)系統(tǒng)后臺(tái)中搭建小型的統(tǒng)計(jì)模塊,對(duì)既有的數(shù)據(jù)進(jìn)行隨時(shí)統(tǒng)計(jì),將大型數(shù)據(jù)統(tǒng)計(jì)分散到每月/周/日進(jìn)行統(tǒng)計(jì)再匯總,而在很多圖書館的業(yè)務(wù)系統(tǒng),特別是采用interlib系統(tǒng)的圖書館,數(shù)據(jù)表庫(kù)中已經(jīng)包含了較為完整的業(yè)務(wù)數(shù)據(jù)信息,只需要根據(jù)需求調(diào)用統(tǒng)計(jì)即可。
4.2.2 借力第三方
大數(shù)據(jù)統(tǒng)計(jì)不是必須由圖書館自己操作完成,可以借助第三方工具、網(wǎng)站、軟件、科研機(jī)構(gòu)等等,在可信的基礎(chǔ)上,借力得出與自己有關(guān)的價(jià)值數(shù)據(jù)。中研院信息科學(xué)研究所研究員陳升瑋[10]指出,在絕大多數(shù)情況下,大數(shù)據(jù)項(xiàng)目其實(shí)不需要建置Hadoop系統(tǒng)。就技術(shù)面來(lái)說(shuō),現(xiàn)在有許多業(yè)者開(kāi)始提供成本較低的大數(shù)據(jù)處理工具和云端系統(tǒng),有些甚至跟App一樣,只要根據(jù)自身需求挑選需要購(gòu)買的功能即可,例如科智提供的工業(yè)化數(shù)據(jù)管理工具即為一例。
4.3 構(gòu)建數(shù)據(jù)管理機(jī)制
(1)圖書館的大數(shù)據(jù)運(yùn)用定位需要明晰。大數(shù)據(jù)應(yīng)用是為圖書館管理、資源、服務(wù)提供參考依據(jù)或數(shù)據(jù)支撐,它是一種方法、一種工具,不同層級(jí)的數(shù)據(jù)統(tǒng)計(jì)分析結(jié)果應(yīng)對(duì)應(yīng)不同層級(jí)的管理模式。從數(shù)據(jù)的產(chǎn)生源,數(shù)據(jù)結(jié)果用在哪里,讓從管理層到一線員工能夠清晰的了解他所負(fù)責(zé)的服務(wù)內(nèi)容和業(yè)務(wù)目前的運(yùn)營(yíng)狀況。
(2)建立數(shù)據(jù)驅(qū)動(dòng)機(jī)制。當(dāng)通過(guò)數(shù)據(jù)分析某個(gè)細(xì)分用戶群時(shí),發(fā)現(xiàn)用戶群的活躍/降低規(guī)律時(shí),基于用戶的特征,就要針對(duì)此現(xiàn)象開(kāi)展數(shù)據(jù)關(guān)聯(lián)查詢,發(fā)揮各個(gè)環(huán)節(jié)數(shù)據(jù)的價(jià)值以便形成具有個(gè)性化的服務(wù)方案。
(3)對(duì)于數(shù)據(jù)結(jié)果,還需要實(shí)踐論證。比如根據(jù)流通文獻(xiàn)數(shù)據(jù)統(tǒng)計(jì)結(jié)果進(jìn)行對(duì)應(yīng)的資源采購(gòu)、服務(wù)推廣,除了進(jìn)行數(shù)據(jù)統(tǒng)計(jì)分析,還要與之前數(shù)據(jù)進(jìn)行對(duì)比驗(yàn)證,不斷完善和改進(jìn)數(shù)據(jù)統(tǒng)計(jì)方法,提高數(shù)據(jù)準(zhǔn)確率,提升數(shù)據(jù)利用價(jià)值。
(4)加強(qiáng)合作方數(shù)據(jù)管理。在數(shù)據(jù)統(tǒng)計(jì)過(guò)程中,有些數(shù)據(jù),如數(shù)字資源在線使用的數(shù)據(jù)等,不是由圖書館統(tǒng)計(jì)或處理的,在處理數(shù)據(jù)安全、用戶隱私、數(shù)據(jù)可信度以及數(shù)據(jù)使用等方面需要考慮。
4.4 生產(chǎn)數(shù)據(jù)產(chǎn)品
數(shù)據(jù)產(chǎn)品最大的價(jià)值在于輔助使用者優(yōu)化決策,以及輔助決策價(jià)值的實(shí)現(xiàn)。因此圖書館大數(shù)據(jù)產(chǎn)生的數(shù)據(jù)產(chǎn)品需要注意兩點(diǎn),一是認(rèn)清掌握的數(shù)據(jù)能給受眾帶來(lái)哪些有價(jià)值的服務(wù)。二是認(rèn)清掌握的數(shù)據(jù)可以通過(guò)哪些合理的方法提供。
圖書館可以產(chǎn)生的數(shù)據(jù)產(chǎn)品包括用戶行為數(shù)據(jù)產(chǎn)品、文獻(xiàn)服務(wù)數(shù)據(jù)產(chǎn)品等大類產(chǎn)品,每類數(shù)據(jù)產(chǎn)品又可以細(xì)分成各具特色的數(shù)據(jù)產(chǎn)品,用戶行為數(shù)據(jù)產(chǎn)品可以按不同時(shí)段的到館人次、人口籍貫、文化程度、借閱次數(shù)等進(jìn)行細(xì)分,而文獻(xiàn)服務(wù)產(chǎn)品數(shù)據(jù)就更多,文獻(xiàn)借閱冊(cè)次、種類、出版社、作家、年份等,或者二次以上的文獻(xiàn)再開(kāi)發(fā)、不同主題資源整合、專題深度挖掘等數(shù)據(jù)產(chǎn)品。這些數(shù)據(jù)產(chǎn)品除了圖書館自身掌握和運(yùn)用之外,還可以為當(dāng)?shù)卣峁┕芾矸?wù)參考;與文獻(xiàn)/資源提供商對(duì)已有文獻(xiàn)產(chǎn)品服務(wù)升級(jí)進(jìn)行談判的基礎(chǔ);為拓寬服務(wù)內(nèi)容、服務(wù)方式、創(chuàng)新服務(wù)模式而引入社會(huì)團(tuán)體,并與之對(duì)接開(kāi)展合作的基礎(chǔ)等等。
5 展望圖書館未來(lái)大數(shù)據(jù)運(yùn)用
從圖書館業(yè)務(wù)管理角度出發(fā),大數(shù)據(jù)的運(yùn)用是圖書館大數(shù)據(jù)運(yùn)用的初級(jí)階段,當(dāng)技術(shù)發(fā)展到更高層次時(shí),圖書館真正的大數(shù)據(jù)運(yùn)用是知識(shí)大數(shù)據(jù),圖書館的服務(wù)也將從文獻(xiàn)信息服務(wù)過(guò)渡到知識(shí)服務(wù)。蘇新寧[11]認(rèn)為以知識(shí)為導(dǎo)向的文獻(xiàn)信息將進(jìn)行深度開(kāi)發(fā),知識(shí)單元加工與重組,智能詞表、自動(dòng)分類詞表的組織與共享都將成為未來(lái)圖書館的實(shí)踐領(lǐng)域,館藏文獻(xiàn)數(shù)據(jù)資源將與社會(huì)資源整合,文獻(xiàn)整合服務(wù)向綜合信息資源服務(wù)發(fā)展,以往簡(jiǎn)單文獻(xiàn)推薦信息指引將被知識(shí)單元數(shù)據(jù)集替代,真實(shí)而具體為讀者答疑解惑等等。
從外部環(huán)境融合角度來(lái)看,大數(shù)據(jù)的運(yùn)用是圖書館數(shù)據(jù)開(kāi)放的運(yùn)用。除了必要的保密數(shù)據(jù)(用戶隱私數(shù)據(jù)等)之外,業(yè)務(wù)數(shù)據(jù)、館藏?cái)?shù)據(jù)、資源數(shù)據(jù)等都可開(kāi)放出來(lái)。提供數(shù)據(jù)開(kāi)放服務(wù),包括開(kāi)放技術(shù)平臺(tái),提供個(gè)性化閱讀學(xué)習(xí)功能模塊構(gòu)建;提供大數(shù)據(jù)學(xué)習(xí)課件、軟件支持工具、討論專區(qū);提供資源拆分、重組等軟件工具、學(xué)習(xí)課件及討論專區(qū)。
從用戶角度來(lái)看,構(gòu)建眾包模式,鼓勵(lì)萬(wàn)千讀者創(chuàng)建個(gè)性化的閱讀學(xué)習(xí)資源庫(kù),對(duì)資源進(jìn)行拆分、重組、再生產(chǎn),甚至按照自己喜歡的方式呈現(xiàn)。還可依照個(gè)人興趣或閱讀學(xué)習(xí)方式來(lái)創(chuàng)建如報(bào)紙、期刊、文檔、視頻等載體類型的讀者個(gè)性化閱讀學(xué)習(xí)資源。知識(shí)的再生產(chǎn)已不再是獨(dú)屬于圖書館或者館員的專利,人人都是知識(shí)構(gòu)建、分享者。采用眾包模式,海量數(shù)字資源真正成為知識(shí)的寶藏,人人都可以通過(guò)自己的方式學(xué)習(xí)和發(fā)現(xiàn)更多更有價(jià)值的知識(shí)內(nèi)容,圖書館真正成為知識(shí)的寶庫(kù)。
從第三方合作角度來(lái)看,將數(shù)字閱讀平臺(tái)(PC端、移動(dòng)端)的接口開(kāi)放API(Application Programming Interface,應(yīng)用程序編成接口),讓第三方不僅可以訪問(wèn)網(wǎng)站內(nèi)容,還可以對(duì)內(nèi)容進(jìn)行修改、整合和再創(chuàng)作,或者增加功能模塊,或形成新的應(yīng)用在第三方平臺(tái)上向用戶推送等[12]。合作的目的是采用正確的創(chuàng)意,采用正確的科技和媒體策略,集合各類能人以有效和高效的方式完成任務(wù)[13]。不僅第三方能以較少的成本、較高的成功幾率來(lái)創(chuàng)業(yè),圖書館服務(wù)內(nèi)容也更加豐富、形式更加多樣,獲得更多的關(guān)注以及擴(kuò)大社會(huì)影響力。
圖書館內(nèi)外雙向發(fā)展,大數(shù)據(jù)帶給圖書館的將會(huì)是顛覆性的,業(yè)務(wù)、管理、服務(wù)、思維方式等等隨之而變,而圖書館是否已做好應(yīng)對(duì)了呢?對(duì)于圖書館來(lái)說(shuō)這是最好的時(shí)代,也是最壞的時(shí)代。
參考文獻(xiàn):
[ 1 ] 吳明輝.忘掉你的大數(shù)據(jù),數(shù)據(jù)思維才最重要![EB/OL].(2015-10-15)[2016-03-13].http://www.cbdio.com/BigData/2015-10/15/content_3972102.htm.
[ 2 ] 上海圖書館推出讀者年度閱讀“對(duì)賬單”[EB/OL].(20
13-02-16)[2016-03-13].http://www.wenming.cn/book/pdjj/201302/t20130216_1070126.shtml.
[ 3 ] 東莞圖書館:十年書香漫莞邑[EB/OL].(2016-01-18)[2016-03-13].http://epaper.southcn.com/nfdaily/html/2016-01/18/content_7509723.htm.
[ 4 ] 上海圖書館持證讀者增至310萬(wàn),超半數(shù)年外借14冊(cè)書[EB/OL].(2015-04-22)[2016-03-13].http://cul.jschina.com.cn/system/2015/04/22/024447365.shtml.
[ 5 ] 廣州圖書館.2014年報(bào):業(yè)務(wù)統(tǒng)計(jì)數(shù)據(jù)[Z].廣州圖書館,2014.
[ 6 ] 圖書館大數(shù)據(jù):年人均借書17冊(cè) 深圳人都愛(ài)看些
啥?[EB/OL].( 2015-10-30 )[2016-03-13].http://www.sznews.com/news/content/2015-10/30/content_124201
90.htm.
[ 7 ] 佛山讀者7年增14倍 最喜愛(ài)圖書出爐[EB/OL].(20
15-04-23)[2016-03-13].http://www.citygf.com/FSNews/FS_002008/201504/t20150423_5641555.html.
[ 8 ] 去年廣州圖書館入館人數(shù)遠(yuǎn)超國(guó)家圖書館成全國(guó)第一[EB/OL].(2016-01-14)[2016-03-13].http://city.igdzc.
com/a/20160114/68850.html#0-tsina-1-12273-
397232819ff9a47a7b7e80a40613cfe1.
[ 9 ] 深圳人到圖書館都愛(ài)借閱些什么書?大數(shù)據(jù)告訴你![EB/OL].(2015-04-23)[2016-03-13].http://www.sznews.com/news/content/2015-04/23/content_114981
57.htm.
[10] 李欣宜:一次搞懂大數(shù)據(jù),《數(shù)位時(shí)代》第251期[EB/OL].(2015-04-01)[2016-03-13].http://www.bnext.com.tw/article/view/id/35807.
[11] 蘇新寧.大數(shù)據(jù)環(huán)境數(shù)字圖書館面臨的挑戰(zhàn)[EB/OL].(2015-06-10)[2016-03-13].http://www.lib.bnu.edu.cn/balis/2015/2.pdf.
[12] 周婷婷.大數(shù)據(jù)時(shí)代數(shù)據(jù)運(yùn)用的理念與實(shí)踐研究:以英國(guó)《衛(wèi)報(bào)》為例[J].江漢學(xué)術(shù),2015(1):123-128.
[13] 鮑勃·羅德,雷·維勒茲.大融合:互聯(lián)網(wǎng)時(shí)代的商業(yè)模式[M].朱衛(wèi)未,等譯.北京:人民郵電出版社,2015:36.