李 恬
其實(shí),數(shù)據(jù)的存在由來已久,人類自從誕生以來就在源源不斷地創(chuàng)造著數(shù)據(jù),各行各業(yè)的發(fā)展都離不開對(duì)數(shù)據(jù)的處理,當(dāng)數(shù)據(jù)量增長(zhǎng)到一定程度就形成了海量數(shù)據(jù)(達(dá)到TB級(jí)別的數(shù)據(jù)),但一般認(rèn)為海量數(shù)據(jù)還不足以稱作“大數(shù)據(jù)”[1]。在飛速發(fā)展的數(shù)字信息環(huán)境中,數(shù)據(jù)成本的下降促使數(shù)據(jù)量急劇增長(zhǎng)至PB級(jí)別(1024TB)甚至更多,根據(jù)IDC作出的估測(cè),預(yù)計(jì)到2020年,全球?qū)⒖偣矒碛?5億GB的數(shù)據(jù)量[2];數(shù)據(jù)類型除了結(jié)構(gòu)化數(shù)據(jù)外,還有半結(jié)構(gòu)化數(shù)據(jù)和非結(jié)構(gòu)化數(shù)據(jù),而且有調(diào)查發(fā)現(xiàn),85%的數(shù)據(jù)屬于廣泛存在于社交網(wǎng)絡(luò)、物聯(lián)網(wǎng)、電子商務(wù)之中的非結(jié)構(gòu)化數(shù)據(jù),這些非結(jié)構(gòu)化數(shù)據(jù)的產(chǎn)生往往伴隨著社交網(wǎng)絡(luò)、移動(dòng)計(jì)算和傳感器等新的渠道和技術(shù)應(yīng)用的不斷涌現(xiàn)[3]。
事實(shí)上,在“大數(shù)據(jù)”這個(gè)概念產(chǎn)生以前,一些商家就已經(jīng)發(fā)現(xiàn)了大規(guī)模數(shù)據(jù)的價(jià)值。早在20世紀(jì)70年代末,沃爾瑪公司就開始通過挖掘數(shù)據(jù)來改善自己的供應(yīng)鏈,陸續(xù)采用了條形碼掃描系統(tǒng)和公司內(nèi)部衛(wèi)星系統(tǒng),使得總分部之間可以實(shí)現(xiàn)實(shí)時(shí)、雙向的數(shù)據(jù)和聲音傳輸,在此基礎(chǔ)上于2007年建立了一個(gè)超大的數(shù)據(jù)中心,其存儲(chǔ)能力高達(dá)4PB以上[3]。通過對(duì)數(shù)據(jù)中心內(nèi)消費(fèi)者的購(gòu)物行為等非結(jié)構(gòu)化數(shù)據(jù)進(jìn)行分析,沃爾瑪成為了最了解顧客購(gòu)物習(xí)慣的零售商,并創(chuàng)造了“啤酒與尿布”的經(jīng)典商業(yè)案例[4]。同樣,在醫(yī)療、交通、電信、城市管理等其他領(lǐng)域,移動(dòng)終端、社交網(wǎng)絡(luò)的全民化應(yīng)用以及信息化程度的提高,也使數(shù)據(jù)有了巨大的應(yīng)用空間。也就是說,大數(shù)據(jù)是伴隨著信息技術(shù)和數(shù)字信息環(huán)境的發(fā)展,信息量呈指數(shù)級(jí)增長(zhǎng)、數(shù)據(jù)類型及數(shù)據(jù)結(jié)構(gòu)的日趨復(fù)雜化的情況下產(chǎn)生的。
對(duì)于大數(shù)據(jù)的定義目前還沒有明確的界定,得到公認(rèn)的是大數(shù)據(jù)的“4V”特性,即容量(Volume)、速度(Velocity)、價(jià)值(Value)和類型(Variety)。其中容量(Volume)指收集和分析的數(shù)據(jù)量巨大;速度(velocity)指數(shù)據(jù)處理速度要足夠快;價(jià)值(Value)指數(shù)據(jù)中蘊(yùn)含著潛在的價(jià)值轉(zhuǎn)化;類型(variety)指數(shù)據(jù)類型多樣復(fù)雜。所以,有人總結(jié)大數(shù)據(jù)是“海量數(shù)據(jù)+復(fù)雜類型”的數(shù)據(jù),包括分析、帶寬、內(nèi)容三個(gè)要素,其核心因素是蘊(yùn)含價(jià)值[5]。
大數(shù)據(jù)的廣泛存在已經(jīng)得到從企業(yè)界與政府層面越來越多的重視,人們看到了其中隱藏的價(jià)值和非同尋常的機(jī)會(huì),但大數(shù)據(jù)只有在數(shù)據(jù)、技術(shù)、思維三個(gè)條件同時(shí)具備時(shí)才會(huì)發(fā)揮它的價(jià)值。谷歌的首席經(jīng)濟(jì)學(xué)家哈爾·范里安(Hal Varian)說“數(shù)據(jù)非常之多而且具有戰(zhàn)略重要性,但真正缺少的是從數(shù)據(jù)中提取價(jià)值的能力”[6],這種能力除了技術(shù)能力外,也包括運(yùn)用大數(shù)據(jù)的思維能力,隨著計(jì)算機(jī)業(yè)的發(fā)展,技術(shù)上的困難終將被克服,大數(shù)據(jù)能否發(fā)揮作用,最終取決于分析數(shù)據(jù)的思維能力。而且,大數(shù)據(jù)概念的出現(xiàn)本身就給人們提供了一個(gè)思維方式,即可以從很多看似平常的數(shù)據(jù)或資源中挖掘有用的信息,通過對(duì)海量數(shù)據(jù)的分析,獲得更多有價(jià)值的產(chǎn)品和服務(wù)。從這個(gè)意義上說,大數(shù)據(jù)不僅是一種資源,更是一種理念,其最大的價(jià)值不是數(shù)據(jù)本身,而是通過對(duì)數(shù)據(jù)的分析來改善和提高工作質(zhì)量和水平,這就是大數(shù)據(jù)理念,其具體內(nèi)涵有以下幾方面。
(1)從數(shù)據(jù)的視角分析問題。大數(shù)據(jù)是復(fù)雜類型的數(shù)據(jù),這里的復(fù)雜可以是結(jié)構(gòu)上的,也可以是形式上的,包括結(jié)構(gòu)化、半結(jié)構(gòu)化和非結(jié)構(gòu)化的數(shù)字、文字、圖片、聲音、影像等一切存在形式都可以作為數(shù)據(jù)進(jìn)行分析和研究。如谷歌對(duì)翻譯功能的改進(jìn),就是將互聯(lián)網(wǎng)上的語言視為能夠判別可能性的數(shù)據(jù),而不是語言本身,甚至它所發(fā)布的上萬億語料庫(kù)囊括了互聯(lián)網(wǎng)上的很多廢棄內(nèi)容和錯(cuò)誤的數(shù)據(jù),依此推算出英語詞匯搭配在一起的可能性。
(2)重視數(shù)據(jù)整體。一般認(rèn)為只有當(dāng)數(shù)據(jù)規(guī)模達(dá)到一定程度才算得上大數(shù)據(jù),但有些情況下,小規(guī)模的數(shù)據(jù)也能幫助人們發(fā)現(xiàn)問題和解決問題,那么它便也具備了大數(shù)據(jù)的意義。其實(shí),這里的“大”只是相對(duì)意義上的,它更強(qiáng)調(diào)數(shù)據(jù)的整體,而非部分或樣本。盡可能多地掌握所有數(shù)據(jù),這是大數(shù)據(jù)與一般數(shù)據(jù)的區(qū)別之一,只是數(shù)據(jù)規(guī)模越大,越有可能準(zhǔn)確地考察細(xì)節(jié)和全面地分析問題。
(3)從數(shù)據(jù)中尋找關(guān)聯(lián)關(guān)系。即從大量的數(shù)據(jù)流中發(fā)現(xiàn)異常,通過尋找數(shù)據(jù)之間、數(shù)據(jù)與其他事物的關(guān)聯(lián)關(guān)系發(fā)現(xiàn)事物發(fā)展的規(guī)律和預(yù)測(cè)趨勢(shì)。大數(shù)據(jù)的核心就是“建立在相關(guān)關(guān)系分析法基礎(chǔ)上的預(yù)測(cè)”[7],亞馬遜的個(gè)性化推薦系統(tǒng)就是通過分析大量的用戶瀏覽記錄和購(gòu)買記錄的關(guān)聯(lián)關(guān)系,預(yù)測(cè)用戶的需求和興趣點(diǎn),從而有針對(duì)性地推薦相關(guān)產(chǎn)品。
圖書館在長(zhǎng)期的工作中積累了大量數(shù)據(jù),雖然在規(guī)模和數(shù)據(jù)處理速度上遠(yuǎn)未達(dá)到大數(shù)據(jù)的標(biāo)準(zhǔn),但在圖書館變革和向知識(shí)服務(wù)轉(zhuǎn)型的實(shí)踐中仍有很高的利用價(jià)值,它們就是圖書館的“大數(shù)據(jù)”。運(yùn)用大數(shù)據(jù)理念,我們有必要充分挖掘圖書館“大數(shù)據(jù)”的價(jià)值來拓展工作和服務(wù)方向。
圖書館最大的優(yōu)勢(shì)就是擁有大量包括紙質(zhì)資源、電子資源、網(wǎng)絡(luò)資源、圖片、音頻、視頻等各種內(nèi)容和載體形式的館藏資源,這是圖書館開展服務(wù)工作的基礎(chǔ)。但根據(jù)帕累托定律,用戶主動(dòng)獲取的、利用率較高的資源主要集中于20%的館藏資源上,即圖書館的大部分館藏資源沒有物盡其用,而且隨著人們獲取知識(shí)的方式和途徑日益網(wǎng)絡(luò)化,越來越多的圖書館資源處于閑置狀態(tài)。產(chǎn)生這個(gè)問題的根源是傳統(tǒng)的圖書館服務(wù)是被動(dòng)式的文獻(xiàn)提供,而人們需要的是能快速高效地獲取具體的知識(shí),現(xiàn)代圖書館應(yīng)該更多地側(cè)重于發(fā)展“在復(fù)雜創(chuàng)新需求下的知識(shí)組織、知識(shí)集成、知識(shí)融匯、知識(shí)發(fā)現(xiàn)、知識(shí)創(chuàng)造”[8]的知識(shí)服務(wù)。毫無疑問,知識(shí)正是圖書館的主體資源,用大數(shù)據(jù)思維看,圖書館的館藏實(shí)質(zhì)是知識(shí)數(shù)據(jù)的集合。相對(duì)于零散、無序的網(wǎng)絡(luò)資源,圖書館館藏資源已經(jīng)通過科學(xué)的方法和特定的標(biāo)識(shí)符(分類號(hào)、主題詞)進(jìn)行了初步的整序,形成了一個(gè)個(gè)有序的知識(shí)塊,但知識(shí)服務(wù)不僅是對(duì)知識(shí)存儲(chǔ)的整序,更是基于知識(shí)內(nèi)容的融合分析與歸納,即通過分析各種知識(shí)因子及相互之間隱含的關(guān)聯(lián)關(guān)系,從中找出與用戶需求相匹配的知識(shí)。因此,開展知識(shí)服務(wù)的關(guān)鍵環(huán)節(jié)是從館藏知識(shí)數(shù)據(jù)集中尋找關(guān)聯(lián),揭示規(guī)律或發(fā)現(xiàn)新知識(shí)。但目前知識(shí)服務(wù)仍限于口號(hào),缺乏實(shí)質(zhì)性的轉(zhuǎn)變,除了圖書館在認(rèn)識(shí)上對(duì)知識(shí)服務(wù)缺乏理解外,在實(shí)踐中也沒有從“大”圖書館資源觀和數(shù)據(jù)的角度對(duì)館藏資源進(jìn)行分析和處理,這使得知識(shí)挖掘與整合的力度遠(yuǎn)遠(yuǎn)不夠。隨著信息技術(shù)的發(fā)展,包括電子圖書、電子期刊、數(shù)據(jù)庫(kù)、音視頻資源、網(wǎng)絡(luò)資源在內(nèi)的圖書館數(shù)字資源也在急速增長(zhǎng)并占據(jù)了相當(dāng)大的比例,這將為圖書館運(yùn)用大數(shù)據(jù)技術(shù)和大數(shù)據(jù)理念進(jìn)行知識(shí)挖掘提供了便利條件。
上世紀(jì)90年代初,美國(guó)就通過啟動(dòng)“完全、開放、無償”的科學(xué)數(shù)據(jù)共享計(jì)劃[9]鼓勵(lì)民眾把數(shù)據(jù)流動(dòng)過程中和數(shù)據(jù)應(yīng)用過程中的各種價(jià)值充分挖掘出來,既提高了科學(xué)數(shù)據(jù)的利用率,又為人們發(fā)揮才華創(chuàng)造了良好環(huán)境,并促進(jìn)了整個(gè)社會(huì)的經(jīng)濟(jì)發(fā)展。
書目數(shù)據(jù),作為圖書館界的科學(xué)數(shù)據(jù),是海量的、高度規(guī)范的結(jié)構(gòu)化數(shù)據(jù),圖書館每年投入大量人力物力建設(shè)的這些數(shù)據(jù)卻長(zhǎng)期以來處于非常閉塞的環(huán)境中,未能充分發(fā)揮其潛在價(jià)值。2010年,大英圖書館宣布向研究人員和其他圖書館免費(fèi)提供書目數(shù)據(jù),讓用戶超越傳統(tǒng)圖書館的局限開發(fā)和利用這一重要的國(guó)際資源[10];2012年,哈佛大學(xué)圖書館也向公眾開放了涵蓋73所分館的1200萬書目記錄,希望以此來促進(jìn)世界范圍書目數(shù)據(jù)的開放以及對(duì)新型應(yīng)用性產(chǎn)品的研發(fā),正如哈佛大學(xué)圖書館實(shí)驗(yàn)室的副主任David Weinberger所說“這就是書的大數(shù)據(jù)”[11]。書目數(shù)據(jù)不僅用于檢索,還可以發(fā)揮更多的價(jià)值,如大英圖書館提供給知識(shí)產(chǎn)權(quán)辦公室(IPO)的八百萬條書目記錄,用于1650年以來出版行業(yè)的動(dòng)態(tài)研究,并從中揭示出反對(duì)知識(shí)產(chǎn)權(quán)立法進(jìn)程的種種模式。
與此同時(shí),書目數(shù)據(jù)的關(guān)聯(lián)化研究則成為書目大數(shù)據(jù)的另一開發(fā)領(lǐng)域。書目數(shù)據(jù)的關(guān)聯(lián)化是指“使用URI作為書目記錄的名稱,通過使用HTTP、URI,可以定位到書目記錄,并且通過相關(guān)的URI鏈接發(fā)現(xiàn)更多的對(duì)象”[12],包括書目記錄的關(guān)聯(lián)和書目數(shù)據(jù)的關(guān)聯(lián)。前者是從一條書目記錄鏈接到其他書目記錄,在有相似或相關(guān)特征的書目或不同載體形態(tài)的資源之間建立關(guān)聯(lián);后者則首先將書目記錄分解為書目數(shù)據(jù)(記錄書目信息的最小獨(dú)立單元,包括題名、責(zé)任者、主題詞等),再將每一條書目數(shù)據(jù)作為獨(dú)立資源建立URI鏈接,如責(zé)任者可鏈接到責(zé)任者個(gè)人信息、職業(yè)、其他著作、相關(guān)其他責(zé)任者。通過書目關(guān)聯(lián)使用戶不僅能更深入全面地了解館藏,還能進(jìn)行擴(kuò)展查詢和知識(shí)發(fā)現(xiàn),實(shí)現(xiàn)多類型知識(shí)內(nèi)容的整合和集成,也可從社會(huì)網(wǎng)絡(luò)反向鏈接到圖書館館藏信息,吸引更多的用戶群,由此便會(huì)產(chǎn)生大量的書目關(guān)聯(lián)數(shù)據(jù),或者說書目關(guān)聯(lián)的“大數(shù)據(jù)”。
以大數(shù)據(jù)理念處理書目數(shù)據(jù),還可以促使我們進(jìn)一步思考如何編制書目記錄,以便于向關(guān)聯(lián)數(shù)據(jù)轉(zhuǎn)化,例如最早將書目數(shù)據(jù)發(fā)布成關(guān)聯(lián)數(shù)據(jù)的瑞典聯(lián)合目錄(LIBRIS)所使用的詞匯表就是包含了元數(shù)據(jù)、書目本體和簡(jiǎn)單知識(shí)組織系統(tǒng)的綜合體,而并不局限于圖書館領(lǐng)域[13]。隨著越來越多的圖書館開放書目數(shù)據(jù)和發(fā)布關(guān)聯(lián)數(shù)據(jù),書目大數(shù)據(jù)的開發(fā)利用存在著廣闊的發(fā)展前景。
由于長(zhǎng)期受“以文獻(xiàn)資源為中心”的思想束縛,圖書館一直將工作重心放在自身建設(shè)與技術(shù)開發(fā)應(yīng)用等方面,忽視了對(duì)用戶需求的分析。知識(shí)服務(wù)是基于用戶需求的服務(wù),需要從用戶類型、群體特征、年齡、職業(yè)等各方面對(duì)用戶的需求狀態(tài)、特點(diǎn)、信息心理、行為及信息利用過程和效果等展開研究,這樣才能針對(duì)不同的用戶提供相應(yīng)的知識(shí)信息,取得最佳服務(wù)效果[14]。因此,用戶資源已成為現(xiàn)代圖書館最重要的戰(zhàn)略資源之一,對(duì)用戶數(shù)據(jù)的管理和研究則成為圖書館提高服務(wù)水平的關(guān)鍵問題。
圖書館獲取的用戶數(shù)據(jù)有兩種,一種是傳統(tǒng)的問卷調(diào)查數(shù)據(jù),一種是用戶使用圖書館服務(wù)系統(tǒng)所產(chǎn)生的交互數(shù)據(jù)。前者是目前用戶研究的主要途徑,但這種方法存在一定的弊端,如效率低、樣本數(shù)量有限,調(diào)查效果取決于調(diào)查問卷的設(shè)計(jì)是否合理、是否充分準(zhǔn)確地表達(dá)了調(diào)查者的意圖、調(diào)查結(jié)果又是否充分反映了用戶意見、被調(diào)查者的態(tài)度是否真誠(chéng)等各種因素,使調(diào)查結(jié)果存在誤差或無法充分表達(dá)用戶的真實(shí)想法和具體需求,事實(shí)上,用戶有時(shí)很難準(zhǔn)確地表達(dá)自身需求;而交互數(shù)據(jù)是用戶在使用圖書館的過程中所產(chǎn)生的自然數(shù)據(jù),包括讀者信息、訪問數(shù)據(jù)(訪問時(shí)間、路徑、相關(guān)鏈接)、借閱信息、咨詢信息、檢索數(shù)據(jù)、下載數(shù)據(jù),甚至RFID射頻數(shù)據(jù)等,它們是直觀、客觀、實(shí)時(shí)和動(dòng)態(tài)變化的,能迅速反映出用戶需求的變化趨勢(shì),關(guān)注和分析這些數(shù)據(jù),可了解和揣摩用戶的心理和習(xí)慣,并根據(jù)變化及時(shí)調(diào)整服務(wù)策略,快速滿足讀者需求。但在實(shí)際中,圖書館對(duì)這部分?jǐn)?shù)據(jù)的利用還遠(yuǎn)遠(yuǎn)不夠。
大數(shù)據(jù)理念就是利用全部數(shù)據(jù),沒有偏見地關(guān)注更多的細(xì)節(jié),從不同的角度更細(xì)致入微地觀察和研究數(shù)據(jù)的方方面面。圖書館可以從讀者訪問路徑中了解讀者的閱讀傾向;根據(jù)讀者常用的檢索方式改進(jìn)檢索系統(tǒng);從檢索結(jié)果為“0”的數(shù)據(jù)中發(fā)現(xiàn)資源購(gòu)買漏洞。大數(shù)據(jù)可以幫助人們從數(shù)據(jù)之間的關(guān)聯(lián)關(guān)系中分析某一現(xiàn)象產(chǎn)生的原因,例如:為什么圖書館的利用率越來越低?通過數(shù)據(jù)則只需關(guān)注圖書館在資源供給和服務(wù)上出現(xiàn)了什么問題;當(dāng)學(xué)科館員因遭受冷遇對(duì)自己的價(jià)值產(chǎn)生懷疑時(shí),可以通過圖書館網(wǎng)頁(yè)上“學(xué)科館員”的訪問數(shù)據(jù)了解究竟有多少人關(guān)注學(xué)科館員,從訪問數(shù)據(jù)和咨詢數(shù)據(jù)的對(duì)比中,分析用戶是根本對(duì)學(xué)科館員不感興趣,還是對(duì)學(xué)科館員的服務(wù)不滿意。
很多時(shí)候,大數(shù)據(jù)正是把研究者的視角從表面延伸到真實(shí)的內(nèi)核,更客觀準(zhǔn)確地洞察用戶,不僅及時(shí)發(fā)現(xiàn)問題,還能發(fā)展受用戶歡迎的新業(yè)務(wù)和新功能。
工作效率受工作理念、工作制度、工作模式、技術(shù)效率等多方面因素的影響,依賴于管理者在掌握現(xiàn)有工作數(shù)據(jù)的基礎(chǔ)上對(duì)資源的合理調(diào)配。圖書館工作的自動(dòng)化和數(shù)字化在技術(shù)上提高工作效率的同時(shí),也產(chǎn)生了大量使管理者可以掌握工作人員及業(yè)務(wù)處理的相關(guān)數(shù)據(jù)。
(1)流通數(shù)據(jù)。包括讀者到館的時(shí)間、次數(shù)、到館率、文獻(xiàn)借閱率、借閱記錄、流通率等,這些數(shù)據(jù)一方面能反映讀者利用圖書館的情況,另一方面能客觀反映讀者閱讀傾向、及時(shí)了解讀者需求的變化和各類圖書的供求狀況。對(duì)流通數(shù)據(jù)的分析可作為圖書采購(gòu)和館藏建設(shè)的依據(jù),從而利用好購(gòu)書經(jīng)費(fèi),有效合理地補(bǔ)充藏書,有針對(duì)性地改善文獻(xiàn)服務(wù),開展文化閱讀活動(dòng)。
(2)采訪數(shù)據(jù)。采訪工作是圖書館資源建設(shè)的基礎(chǔ),其過程中產(chǎn)生的大量包括書商提供的書目數(shù)據(jù)、訂購(gòu)數(shù)據(jù)、入藏?cái)?shù)據(jù)、到館周期、到館率、入藏利用率等采訪數(shù)據(jù),如果加以充分利用將在很大程度上影響著后來的采訪工作,也是圖書館用戶考察圖書館供貨商(又稱“書商”)的重要依據(jù)。可以說,采訪數(shù)據(jù)是采訪工作研究的著眼點(diǎn),不僅能為圖書館的管理者和決策者提供經(jīng)費(fèi)預(yù)算的執(zhí)行情況,評(píng)估采訪計(jì)劃及合理性,預(yù)測(cè)資源建設(shè)及經(jīng)費(fèi)支出發(fā)展趨勢(shì),還能了解各學(xué)科資源建設(shè)狀況、不同載體文獻(xiàn)占用資金的比例,從而制定圖書館資源建設(shè)發(fā)展方向和最佳采購(gòu)方案,盡最大努力滿足全校師生的學(xué)習(xí)、教學(xué)和科研需求。
(3)編目數(shù)據(jù)。除了指書目數(shù)據(jù)外,還包括編目工作相關(guān)數(shù)據(jù),尤其當(dāng)編目大量外包以后,對(duì)外包編目員的管理和書目數(shù)據(jù)的質(zhì)量控制就成了編目工作的重點(diǎn)。外包編目員的個(gè)人信息、工作經(jīng)歷、業(yè)績(jī)、流動(dòng)更替等數(shù)據(jù)可幫助圖書館根據(jù)需要考察和選擇合適的編目員;編目數(shù)據(jù)來源、審核記錄、出錯(cuò)率、錯(cuò)誤類型等數(shù)據(jù)能幫助領(lǐng)導(dǎo)者分析和評(píng)估外包工作的質(zhì)量和效率,從而制定科學(xué)合理的人員管理和質(zhì)量控制策略。
(4)咨詢數(shù)據(jù)?;ヂ?lián)網(wǎng)和通訊技術(shù)的發(fā)展使圖書館的參考咨詢工作呈現(xiàn)出形式多樣化的局面,F(xiàn)AQ、BBS、電子郵件咨詢、IM咨詢、社交網(wǎng)絡(luò)(微博、博客)咨詢等產(chǎn)生了大量非結(jié)構(gòu)化的咨詢記錄,有的圖書館還開發(fā)了咨詢管理信息系統(tǒng)[15],通過記錄和統(tǒng)計(jì)功能形成了結(jié)構(gòu)化的咨詢數(shù)據(jù)。無論是非結(jié)構(gòu)化的咨詢記錄還是結(jié)構(gòu)化的咨詢數(shù)據(jù),從大數(shù)據(jù)的視角去思考和分析,對(duì)研究用戶、評(píng)估咨詢質(zhì)量和效果、開發(fā)咨詢新業(yè)務(wù)等方面都大有裨益。
圖書館變革的目標(biāo)就是為了適應(yīng)在信息量不斷增長(zhǎng)的情況下更好地滿足人們獲取有效信息和知識(shí)的需求。當(dāng)人們抱怨信息過量,需要借助一些媒介從海量的信息中篩選出有用信息甚至直接獲取知識(shí)時(shí),正是圖書館發(fā)揮作用的時(shí)候,但服務(wù)水平仍亟待提升。毫無疑問,大數(shù)據(jù)為圖書館提供了新的視角,不僅更細(xì)致準(zhǔn)確地洞察用戶,而且能更深入地剖析業(yè)務(wù)工作,引導(dǎo)圖書館向更人性化、專業(yè)化的層面發(fā)展。即使目前還無法預(yù)測(cè)大數(shù)據(jù)在實(shí)際工作中將會(huì)產(chǎn)生何種具體效用,但其獨(dú)特的魅力和理念將吸引研究者們進(jìn)行更多的探索。
[1]樊偉紅,李晨暉,張興旺,等.圖書館需要怎樣的“大數(shù)據(jù)”[J].圖書館雜志,2012(11):63-68.
[2]云計(jì)算環(huán)境下大數(shù)據(jù)及其智能處理技術(shù)[EB/OL].[2013-07-12].http://wenku.baidu.com/view/b20357b065ce050876321384.htm l.
[3]大數(shù)據(jù)藍(lán)海[EB/OL].[2013-07-12].http://content.businessvalue.com.cn/post/6687.htm l.
[4]啤酒與尿布[EB/OL].[2013-08-30].http://baike.baidu.com/view/1978239.htm.
[5][英]維克托·邁爾-舍恩伯格,肯尼思·庫(kù)克耶.大數(shù)據(jù)時(shí)代[M].盛楊燕,周濤,譯.杭州:浙江人民出版社,2013:176,75.
[8]李麟,初景利.國(guó)外文獻(xiàn)信息服務(wù)機(jī)構(gòu)知識(shí)服務(wù)實(shí)踐研究[J].圖書情報(bào)工作,2012(15):5-8.
[9]數(shù)據(jù)開放與國(guó)家振興[J].科技成果縱橫.2002(4):4-15.
[10]大英圖書館宣布開放數(shù)據(jù)服務(wù) [EB/OL].[2013-10-12].http://www.nlc.gov.cn/newtsgj/gtqk/tyck/2010nzm l/120/120dt/201012/t20101202_23991.htm.
[11]Andrey Watters.Strata Week:Harvard Library releases big data for its books[EB/OL].[2013-07-24].http//strata.oreilly.com/2012/04/harvard-book-datacloudera-hadoop-splunk-ipo.htm l.
[12]張海玲.圖書館書目數(shù)據(jù)的關(guān)聯(lián)數(shù)據(jù)化研究[J].圖書館論壇,2013(1):120-125.
[13]杜敏.圖書館書目數(shù)據(jù)關(guān)聯(lián)化淺議[J].科技信息,2013(6):204.
[14]杜也力.知識(shí)服務(wù)模式與創(chuàng)新[M].北京:北京圖書館出版社,2005:96.
[15]宋潔,張敏.大學(xué)圖書館參考咨詢服務(wù)數(shù)據(jù)的管理和利用實(shí)踐[J].農(nóng)業(yè)圖書情報(bào)學(xué)刊,2011(6):186-189.