覃利
摘 要:該文簡述了大數據的相關知識,列舉了網絡時代圖書館的危機表現,并在此基礎上提出了圖書館應借鑒大數據在其它領域的成功應用,挖掘和利用圖書館用戶的非結構化數據以實現個性化的服務,從而提升圖書館的能見度、競爭力和吸引力。
關鍵詞:大數據 數據分析 圖書館服務
中圖分類號:G250.7 文獻標識碼:A 文章編號:1672-3791(2015)09(a)-0174-02
美國數據可視化專家尼古拉斯·費爾頓認為大數據是“超出了傳統的數據管理工具處理能力的大型復雜的數據集,并通常被認為是數字時代創(chuàng)造大量的非結構化和半結構化數據”。隨著互聯網的快速發(fā)展和逐步完善,日志、微博、視頻、圖片、郵件的半結構化和非結構化數據快速增長。根據IDC2011年統計,每兩年全球信息將翻倍,僅在2011年一年,全球被創(chuàng)建和被復制的數據總量為1.8ZB。到2020年這一數值估計將增長到35ZB。去年百度每天處理的數據量相當于5000個國家圖書館,阿里集團已經積攢了超過100PB已處理過的數據,等于104857600GB,相當于4萬個西雅圖中央圖書館,大約580億本藏書的數據量。
為迎接大數據的挑戰(zhàn),各國政府和相關行業(yè)都在積極制定和布局戰(zhàn)略規(guī)劃。2012年3月,美國政府制定了一個大數據研發(fā)計劃,投資額度為6億美元,歐盟也有類似的舉措。中國于2012年10月成立了以探索大數據科技為核心的大數據專家委員會。騰訊在天津建立了亞洲最大數據中心,百度創(chuàng)建了大數據處理中心,新浪推出了可以提供精準數據分析服務的微博產品。
隨著互聯網的迅速發(fā)展,擁有大量資源和數據的圖書館的使用已出現了下降的趨勢,一些歐洲國家的圖書館面臨著嚴峻的挑戰(zhàn)。開放的網絡資源和原生數字資源使圖書館資源中心地位有逐步被取代的危險;搜索引擎使圖書館書目邊緣化,圖書館作為信息門戶的地位在下降;類似百度知道的網絡百科和咨詢服務,使圖書館的參考咨詢服務面臨挑戰(zhàn);社交網絡、移動互聯網、電子書的出現使傳統圖書館服務日益弱化,圖書館服務模式的改變迫在眉睫;在線學習和開放教育的普及也對傳統的學習方式形成沖擊。發(fā)現中,訪問實體圖書館和網上圖書館的人數都在下降,圖書館在線咨詢的數量也在減少,圖書館的發(fā)展存在著如何聚集人氣、留住用戶的危機問題。
在大數據時代,數據無時不在,無處不在。每個人都處于一個龐大的數據海洋中,圖書館只是這個龐大數據網絡中的一個節(jié)點而不再是用戶發(fā)現信息資源的唯一入口。面對圖書館危機,借鑒大數據在其它領域應用的成功模式,圖書館要積極探索以數據為基礎的智能服務模式,促進知識發(fā)現,運用信息技術識別、分析并挖掘隱含在用戶在利用圖書館的行為中的結構化、半結構化數據信息,了解用戶的想法,推斷出用戶檢索及閱讀方面的喜好和習慣,制定戰(zhàn)略規(guī)劃,創(chuàng)新和重構圖書館服務體系,促進行業(yè)發(fā)展,從而在大數據時代實現華麗轉身。
1 利用大數據建立“數據找人”的個性化圖書館模式,提升圖書館的能見度
大數據在利用數據找人方面有其獨特優(yōu)勢。例如:大數據分析團隊曾幫助奧巴馬在2012年美國大選中大獲全勝。其分析師依據選民的住址、家庭背景、家庭狀況等數據分析出選民的性格特征從而有針對性開展競選游說,以較低的成本獲得了大選的成功。在“人找數據”的傳統圖書館利用模式中用戶往往存在如何查找的困惑。在大數據時代,圖書館是數據資源中心,應注重建設以用戶數據研究為核心的個性化圖書館。圖書館應加強用戶研究和交互數據的使用,通過分類和聚類、語義網和情感分析等數據處理方式進行跟蹤服務、精準服務等;依據用戶的喜好和需求建立用戶模型,從多渠道切入用戶的應用;面向不同用戶提供有針對性的服務,改進用戶體驗,提升個性化服務的水平。努力從傳統的以資源為中心的“人找數據”模式轉變?yōu)橐匀藶橹行牡摹皵祿胰恕蹦J?,不斷提高資源的能見度,從而提高圖書館的能見度。
雖然企業(yè)的目的是為了贏利,圖書館的目的是為用戶提供公益服務,但兩者在“以用戶為中心”以及“如何滿足用戶的需求,節(jié)省用戶費用”兩方面具用共同點。因此,大數據也為圖書館管理者更深入、更準確地了解用戶行為和圖書館資源利用情況,提高自身服務和管理水平提供了寶貴的數據和手段。例如:分析圖書上架后借閱情況的變化,可以看到隨著時間的變化一部分圖書的流通率很快下降,而另外一部分圖書流通率的變化是緩慢的,據此書籍的剔舊年限不應是一刀切而應是有所區(qū)分的。對于外借圖書進行分類統計,而不只是統計一個總的流通量,可以找到借閱率非常高和非常低的圖書種類,采購部門在預訂時可以據此增加熱門圖書采購的品種和數量,減少不受歡迎的圖書采購的數量和種類。
2 利用大數據分析用戶的行為模式,增強圖書館的核心競爭力
淘寶數據魔方是一款基于淘寶業(yè)務數據的數據分析產品,它可以分析淘寶消費者瀏覽、交易、收藏、搜索等數據和消費者特性,從而掌握消費者的足跡以及消費偏好,有利于分析競爭對手,研究消費者行為,提高銷售的針對性?!翱峁芬魳贰蓖ㄟ^相似的用戶組推斷出每個年齡段用戶喜愛哪一首歌,喜歡哪一類電影;“迪卡儂”可以通過其各地商店銷售數據準確判斷消費者對運動品牌的不同喜好,從而在全國各地智能地調整庫存策略;著名的沃爾瑪的“啤酒和尿布”案例通過分析消費者行為規(guī)律,找出購物之間的相關性,并調整超市商品陳列方式,從而獲得銷售收入的增長。
圖書館和超市有很多共同點,圖書館應把用戶作為消費者看待,通過大量行為數據挖掘以了解用戶的行為模式,圖書館應注重收集用戶行為日志(包括用戶的借閱記錄、信息數據庫、離線數據等),分析不同用戶群體的借閱行為的差異,通過用戶的檢索記錄分析用戶的資源需求,利用用戶數據庫分析用戶的研究動向等,以提高圖書館行業(yè)的核心競爭力。例如:解析OPAC用戶檢索,包括關鍵詞的使用頻率、檢索命中的結果數量、點擊了哪些檢索結果記錄及圖書的預約及續(xù)借情況等,可以了解讀者感興趣的內容和檢索習慣;如果某種書的預約人數較多,這意味著需要增加購買量;有些書被大量續(xù)借,則說明需要調整借還時間。
3 利用大數據抓住有效數據贏得用戶,提高圖書館的吸引力
在互聯網時代,即時通訊、博客、微博、微信、社交網絡、搜索引擎等已成為網民使用最多的網絡應用,據統計,亞馬遜公司銷售收入的30%來自“猜你喜歡”推薦引擎,其口號是“最成功的書籍推薦應該只有一本書,就是用戶要買的下一本書”;基于社交網絡的一家新創(chuàng)建的音樂網站利用用戶關系數據,挖掘其朋友圈及音樂喜好,并積極推薦他們可能喜歡的音樂。圖書館用戶的社交網絡數據和利用圖書館資源的日志數據是圖書館非結構化數據的重要組成部分,在大數據庫的時代應重視收集有關用戶的數據,在掌握數據的基礎上做好有針對性的服務,從而提高圖書館對用戶的吸引力。
總而言之,大數據時代為圖書館的發(fā)展帶來了新的機遇,但是用戶需求和選擇的多樣化使圖書館服務遇到了瓶頸,圖書館應充分利用大數據技術發(fā)展的歷史機遇,開發(fā)更深入、更廣泛的資源集成、數據集成、知識集成、服務集成的智能成果,從而實現從資源管理到智能服務的飛躍。
參考文獻
[1] 裴昱.大數據時代圖書館用戶行為信息的利用方式[J].圖書館學刊,2013(8):44-46.
[2] 遲有雷.大數據如何賺錢.[EB/OL].[2014-03-12].http://www.forbeschina.com/review/201403/0031571.shtml.
[3] 2014大數據熱點話題與趨勢解讀[EB/OL].[2013-11-05].http://www.thebigdata.cn/YeJieDongTai/7189.html.
[4] 楊穎.大數據時代何處掘金[N].經濟日報,2013-01-08(6).