張邦利
摘 要 大數(shù)據(jù)開啟了時(shí)代的重大轉(zhuǎn)型,引發(fā)了人們對(duì)數(shù)據(jù)價(jià)值的重新認(rèn)識(shí),也使得對(duì)解決問題思維從追求因果關(guān)系向更看重關(guān)聯(lián)關(guān)系方向轉(zhuǎn)移。不再熱衷于追求精確度,不再依賴于隨機(jī)采樣。大數(shù)據(jù)也在改變著圖書館信息服務(wù)的方式,成為提升信息服務(wù)的創(chuàng)新源泉。
關(guān)鍵詞 大數(shù)據(jù)思維 圖書館 信息服務(wù)
中圖分類號(hào):G250.7 文獻(xiàn)標(biāo)識(shí)碼:A DOI:10.16400/j.cnki.kjdkz.2016.05.090
Abstract Big data opens an era of major transformation, led to a re understanding of the value of the data, but also makes the problem of thinking from the pursuit of causal relationship to a more important relationship between the direction of the transfer. No longer interested in the pursuit of accuracy, no longer rely on random sampling. Big data is also changing the way of library information services, information services to become a source of innovation.
Key words thinking of big data; library; information service
0 引言
大數(shù)據(jù)的到來深刻地改變著人們的工作、生活和思維方式,各行各業(yè)對(duì)數(shù)據(jù)的依賴有增無減,數(shù)據(jù)即資源,數(shù)據(jù)即財(cái)富這一理念已逐漸為社會(huì)所認(rèn)同。以統(tǒng)計(jì)數(shù)據(jù)為依據(jù)的定量分析逐步取以分析者的直覺經(jīng)驗(yàn)作出判斷的定性分析方法,隨著手機(jī)終端的普及,每個(gè)個(gè)體人都可以把自己的生活、所見所得變成數(shù)據(jù),產(chǎn)業(yè)互聯(lián)、人體互聯(lián)導(dǎo)致更大量級(jí)的數(shù)據(jù)爆炸。數(shù)據(jù)也變得資產(chǎn)化,被當(dāng)作財(cái)富來采集、存儲(chǔ)和交易,這就是“數(shù)字化生存”。伴隨圖書館的信息收集和處理水平的不斷提高,信息服務(wù)無疑已成為目前圖書館公共服務(wù)的重要內(nèi)容,通過大數(shù)據(jù)的思維來指導(dǎo)圖書館信息服務(wù)工作中的數(shù)據(jù)采集、整理、存儲(chǔ)與使用,是圖書館是圖書館發(fā)展必須重視的一個(gè)問題。
1 大數(shù)據(jù)和大數(shù)據(jù)思維相關(guān)概述
1.1 大數(shù)據(jù)
“大數(shù)據(jù)”一詞,早在20世紀(jì)80年代就已出現(xiàn),但那時(shí)“大數(shù)據(jù)”僅僅是作為數(shù)據(jù)挖掘技術(shù)中的對(duì)“海量數(shù)據(jù)”的一種表述。2011年5月,麥肯錫全球研究院首次提出“大數(shù)據(jù)”概念,發(fā)布了一份關(guān)于“大數(shù)據(jù)”的詳細(xì)報(bào)告。報(bào)告將大數(shù)據(jù)描述成為“無法在一定時(shí)間內(nèi)使用傳統(tǒng)數(shù)據(jù)庫軟件工具對(duì)其內(nèi)容進(jìn)行獲取、管理和處理的數(shù)據(jù)集合”。而且指出,數(shù)據(jù)正在逐漸朝每個(gè)行業(yè)、業(yè)務(wù)職能領(lǐng)域滲透,成為不可忽視的生產(chǎn)要素,大數(shù)據(jù)作為分析的另一種表述形式,目前已成從數(shù)據(jù)中萃取知識(shí),并將知識(shí)轉(zhuǎn)化為提升商業(yè)競爭優(yōu)勢的智能活動(dòng)。2012年1月的世界達(dá)沃斯經(jīng)濟(jì)論壇上,“大數(shù)據(jù)”是主題之一。時(shí)至今日,大數(shù)據(jù)的內(nèi)涵變得更為寬泛,首先,大數(shù)據(jù)的“大”既體現(xiàn)在數(shù)量上,也體現(xiàn)在其組成分布、數(shù)據(jù)結(jié)構(gòu)上;其次,基于“云計(jì)算和云存儲(chǔ)”、“物聯(lián)網(wǎng)”等新興的技術(shù)和服務(wù)又促使數(shù)據(jù)的種類和規(guī)模正以前所未有的速度增長。大數(shù)據(jù)具有多“4V”特征,即大量(Volume)、高速(Velocity)、多樣(Variety)、價(jià)值(Value)。
1.2 大數(shù)據(jù)思維
大數(shù)據(jù)的出現(xiàn)使得人們分析信息時(shí)思維發(fā)生了轉(zhuǎn)變。在大數(shù)據(jù)時(shí)代,人們分析信息面臨著三個(gè)轉(zhuǎn)變,第一是要分析更多的數(shù)據(jù),不再依賴于隨機(jī)采樣。當(dāng)我們有足夠的數(shù)據(jù)處理和存儲(chǔ)能力,而且可以獲得海量數(shù)據(jù)的時(shí)候,隨機(jī)采樣就沒有多大的意義了。第二是,不再熱衷于追求精確度。針對(duì)小數(shù)據(jù)量和特定事情,追求精確性依然是可行的,隨著數(shù)據(jù)的增多,我們就不用再對(duì)某個(gè)現(xiàn)象一味追求細(xì)枝末節(jié),而只需要把握好或判斷出基本發(fā)展方向。第三是從導(dǎo)找因果關(guān)系轉(zhuǎn)而關(guān)注相關(guān)關(guān)系,將專注力放在相關(guān)關(guān)系的探索上,只要發(fā)現(xiàn)兩個(gè)或若干個(gè)現(xiàn)象之前的相關(guān)性,就可以創(chuàng)造某種經(jīng)濟(jì)或社會(huì)效益。不一定需要知道事情產(chǎn)生的起因或原因,但通過事件觸發(fā)器提醒讓我們知道這件事情正在發(fā)生。即大數(shù)據(jù)告訴我們“是什么”,而不是“為什么”。
1.3 大數(shù)據(jù)思維的幾個(gè)重要原理
第一是數(shù)據(jù)核心原理。在大數(shù)據(jù)環(huán)境下,數(shù)據(jù)比流程更重要??梢詮臄?shù)據(jù)庫和記錄數(shù)據(jù)庫中搜索出你是誰,你需要什么,從而推薦給你需要的信息,用數(shù)據(jù)核心思維方式去思考問題并解決問題。
第二是數(shù)據(jù)價(jià)值原理。數(shù)據(jù)并不完全是越多越好,重要的是通過分析實(shí)實(shí)在在的數(shù)據(jù)得出有價(jià)值的東西,挖掘出的價(jià)值含量越高更能凸顯大量數(shù)據(jù)的重要性。如今,數(shù)據(jù)已經(jīng)成為了一種商業(yè)資本,思維轉(zhuǎn)變了,數(shù)據(jù)就能被巧妙地用來激發(fā)新產(chǎn)品和新型服務(wù)。通過對(duì)數(shù)據(jù)的處理和分析,整理出用戶的消費(fèi)傾向、想法、喜好,個(gè)性化差異等情況,然后進(jìn)行分類記載,既而又可以進(jìn)行分類指導(dǎo)。
第三是全樣本原理。傳統(tǒng)采樣的目的就是為了用最少的數(shù)據(jù)獲得更多的信息,但采樣分析不能捕捉細(xì)節(jié),而且,在采樣分析的時(shí)候,有一些信息會(huì)丟失掉了。信息時(shí)代,大型數(shù)據(jù)庫管理系統(tǒng)中存儲(chǔ)的數(shù)據(jù)庫越來越全面,因?yàn)榇髷?shù)據(jù)包含了全部的信息數(shù)據(jù),通過使用所有的數(shù)據(jù),可以發(fā)現(xiàn)在大量數(shù)據(jù)中淹沒掉的情況。全數(shù)據(jù)的樣本思維方式,我們就能夠從不同的角度,更細(xì)致地觀察、思考和研究問題的方方面面。
第四是相關(guān)性原理。與傳統(tǒng)的因果思維相比,相關(guān)性更加強(qiáng)調(diào)兩個(gè)數(shù)據(jù)值之間的數(shù)理關(guān)系。一個(gè)數(shù)據(jù)值增加,另一個(gè)數(shù)據(jù)值可能會(huì)隨之增加,也可能不會(huì)發(fā)生變化。相關(guān)關(guān)系沒有絕對(duì),只有可能性。比如,不是圖書館網(wǎng)站上推薦的每本書都是讀者想要的書。每一本書的信息、讀者的每一次檢索都可以記錄為數(shù)據(jù),我們對(duì)大數(shù)據(jù)進(jìn)行相關(guān)關(guān)系分析,從而知道哪些檢索詞條是最能吸引讀者的,哪個(gè)時(shí)間段是讀者最愿意呆在圖書館看書的。當(dāng)然,相關(guān)性不是不要因果關(guān)系,因果關(guān)系還是基礎(chǔ),通過找出各類數(shù)據(jù)之間的相互關(guān)系也能解決日常管理工作中的難點(diǎn)和瓶頸問題,通過找出以上關(guān)聯(lián)物并監(jiān)控它,就能預(yù)測下一步的異常情況。
2 大數(shù)據(jù)思維與圖書館信息化服務(wù)
通常情況下,圖書館信息服務(wù)工作包含四個(gè)方面的內(nèi)容,一是借閱活動(dòng),即常見的書籍、報(bào)刊借閱服務(wù)。二是信息咨詢服務(wù),向讀者提供題錄、書目等主題信息。三是信息檢索服務(wù),通過文獻(xiàn)信息網(wǎng)絡(luò),提供聯(lián)機(jī)檢查服務(wù)。四是專利檢索與開發(fā)服務(wù)。隨著圖書館信息服務(wù)應(yīng)用范圍的不斷擴(kuò)大,圖書館各個(gè)系統(tǒng)的信息數(shù)據(jù)庫內(nèi)容不斷豐富,數(shù)據(jù)變得越來越復(fù)雜。筆者認(rèn)為,這些數(shù)據(jù)既包含現(xiàn)有的圖書館各環(huán)節(jié)業(yè)務(wù)產(chǎn)生的數(shù)據(jù),存儲(chǔ)于數(shù)據(jù)庫中,又包含了從客戶端讀取的用戶ID、瀏覽過的網(wǎng)頁、停留的時(shí)間等數(shù)據(jù),也包含了從其他部門共享來的數(shù)據(jù)。對(duì)圖書館工作人員而言,如何在已有的數(shù)據(jù)獲取、存儲(chǔ)方式進(jìn)行創(chuàng)新管理?在分析和決策的工作流程中加入大數(shù)據(jù)的支持?如何利用大數(shù)據(jù)幫助信息服務(wù)工作?這些問題的解決需要把信息技術(shù)思維轉(zhuǎn)移到大數(shù)據(jù)思維上來。
2.1 整體性思維改變圖書館數(shù)據(jù)資源采集模式,盡可能全面采集數(shù)據(jù)
圖書館的傳統(tǒng)信息資源,通常包含圖書館管理人員和讀者用戶的基本情況,購買的圖書和文獻(xiàn)數(shù)據(jù)庫,自建的音頻、視頻、專著等數(shù)字資源等,這些數(shù)字資源組成了圖書館信息服務(wù)的資源基礎(chǔ)。這些資源數(shù)據(jù)的特點(diǎn)是結(jié)構(gòu)完整,格式規(guī)范,能夠?yàn)樽x者提供查詢、檢索、下載等信息服務(wù)。現(xiàn)在,大型數(shù)據(jù)庫管理系統(tǒng)廣泛使用在各行各業(yè),圖書館也無例外,館內(nèi)各個(gè)電腦終端、掃描槍、觸摸屏、攝像頭等捕捉到的數(shù)據(jù)最終都會(huì)很快地匯入圖書館的數(shù)據(jù)庫中。比如,讀者在圖書館電腦終端的操作軌跡,包括逐條的檢索記錄、借閱時(shí)間、借閱規(guī)律等都會(huì)產(chǎn)生出大量的信息數(shù)據(jù),應(yīng)該盡可能多地收集這些數(shù)據(jù)。在實(shí)際的信息服務(wù)工作中,讀者的行為數(shù)據(jù)還缺乏全面性、整體性和關(guān)聯(lián)性,如記錄有讀者的檢索詞,下載文獻(xiàn)的主題,但沒有記錄讀者的檢索時(shí)長,記錄有讀者的進(jìn)館次數(shù)、進(jìn)館時(shí)間,但沒有記錄讀者的離館時(shí)間,從而缺少讀者的在館時(shí)間。這些數(shù)據(jù)與用戶的行為習(xí)慣密切相關(guān),雖然價(jià)值不大,但如果能全面收集起來,則能幫助分析讀者的偏好,幫助圖書館提供最有用的信息服務(wù)。
2.2 關(guān)聯(lián)思維為信息服務(wù)提供新的解決路徑,分析挖掘讀者的行為軌跡
圖書館的開放性決定了圖書館的信息服務(wù)是面向讀者的,以讀者參與的各類主題來建立“數(shù)據(jù)倉庫”,在倉庫中再建立不同的“房間”,每個(gè)房間存儲(chǔ)不同的記錄。比如讀者的基本信息、訪問記錄、借閱記錄、檢索歷史、查詢咨詢等。圖書館信息服務(wù)一方面要對(duì)讀者的不同信息需求加以分析研究,分析不同讀者的“行為軌跡”,如同在網(wǎng)購時(shí)經(jīng)常會(huì)彈出的“猜你會(huì)喜歡”、“瀏覽了該商品的人還瀏覽了以下商品”等信息。另一方面也需要根據(jù)每個(gè)業(yè)務(wù)流程收集到的大量的、完整的讀者借閱記錄、檢索記錄等數(shù)據(jù),挖掘讀者的行為特征,對(duì)具有相關(guān)興趣特征的讀者群體進(jìn)行分類管理,形成專門的統(tǒng)計(jì)分析結(jié)果,向讀者推薦相關(guān)的專題,既提高了資源的利用率,也提高了讀者滿意度,達(dá)到真正吸引讀者的目的。關(guān)聯(lián)思維需要圖書館工作人員根據(jù)特定的問題,考慮到位,特別是在優(yōu)化圖書館某一個(gè)工作流程時(shí),由于各個(gè)數(shù)據(jù)都有著內(nèi)在聯(lián)系,圖書部門之間的資料數(shù)據(jù)也存在著協(xié)調(diào)共享,如果不注意其中的關(guān)聯(lián)關(guān)系,就會(huì)出現(xiàn)顧此失彼、數(shù)據(jù)紊亂的問題。
2.3 智能思維豐富圖書館個(gè)性服務(wù)的內(nèi)涵,開展主動(dòng)服務(wù)
大數(shù)據(jù)應(yīng)用技術(shù)是圖書館未來構(gòu)建創(chuàng)新服務(wù)的動(dòng)力引擎,是未來幾年內(nèi)圖書領(lǐng)域信息服務(wù)研究的重要課題。新型知識(shí)智能服務(wù)引擎包括資源及學(xué)術(shù)搜索引擎、資源及服務(wù)推薦引擎、用戶及資源行為智能分析引擎、用戶知識(shí)需求預(yù)測引擎、及多維度信息資源獲取、組織、分析及決策引擎等。例如,美國Hiptype公司就充分利用個(gè)性化分析系統(tǒng),對(duì)電子書讀者的身份和閱讀習(xí)慣進(jìn)行智能分析,繼而幫忙作者和出版商得到詳細(xì)的數(shù)據(jù)從而更懂讀者。
利用現(xiàn)在的數(shù)據(jù)庫技術(shù),圖書館可以重點(diǎn)對(duì)讀者用戶的各種行為數(shù)據(jù)進(jìn)行復(fù)雜的數(shù)據(jù)處理、統(tǒng)計(jì)和分析。如通過對(duì)所有學(xué)生借閱記錄的記載數(shù)據(jù),嘗試統(tǒng)計(jì)每月學(xué)生的借閱頻率,檢索的關(guān)鍵詞,分析并預(yù)測出不同月份學(xué)生的需求,從而在下一年的不同月份合理安排借閱書目,主動(dòng)提供索引指南幫助學(xué)生克服因信息分散而造成的檢索困難,提高信息服務(wù)的時(shí)效性和針對(duì)性。
利用數(shù)據(jù)信息,圖書館開展有針對(duì)性地主動(dòng)服務(wù)來解決讀者的實(shí)際問題。還可以搭建微信公眾號(hào)平臺(tái)向用戶定期推送內(nèi)容豐富、形式多樣的個(gè)性化信息,保持即時(shí)的互動(dòng)與交流,讀者向圖書館反饋新書的閱讀意見與建議;還可以利用圖書館網(wǎng)站發(fā)布公告和動(dòng)態(tài),提供各類數(shù)字資源的下載和查閱;圖書館可以根據(jù)讀者不同的信息需求,制定不一樣的信息服務(wù)策略,優(yōu)化不同的業(yè)務(wù)環(huán)節(jié),開展不同的信息服務(wù)??稍趫D書館網(wǎng)站上設(shè)置相關(guān)的欄目,放置視頻或幻燈片,方便讀者更快無差錯(cuò)的檢索。圖書館可適時(shí)開展一些諸如咨詢參考、熱門學(xué)科跟蹤等相關(guān)服務(wù),考慮為讀者精準(zhǔn)推送相關(guān)聯(lián)信息和在未來可提供幫助的潛在資源。
3 結(jié)語
隨著圖書館不斷優(yōu)化信息服務(wù)的水平,為各類讀者提供越來越人性化的個(gè)性服務(wù),大數(shù)據(jù)的影響也將越來越深入到圖書館日常的管理工作中,大數(shù)據(jù)思維也將潛移默化地改變著圖書館管理人員的工作思維方式,引導(dǎo)其不斷創(chuàng)新管理,優(yōu)化流程,為讀者提供更多人性化和個(gè)性化的服務(wù)。
參考文獻(xiàn)
[1] 大數(shù)據(jù)時(shí)代的思維變革[J].重慶理工大學(xué)學(xué)報(bào)(社會(huì)科學(xué)),2014.8.
[2] 蔡莉靜,陳曹維.現(xiàn)代圖書館信息服務(wù)[M].北京:海洋出版社,2006:47.
[3] 樊偉紅,李晨暉.圖書館需要怎樣的“大數(shù)據(jù)”[J].圖書館雜志,2012.11.