張大勇
(湖南城市學院圖書館,湖南 益陽 413000)
在云計算、物聯(lián)網(wǎng)等技術的推動下,世界已經(jīng)進入了一個“大數(shù)據(jù)”時代。如何有效地利用大數(shù)據(jù)成為政府公共管理和企業(yè)界共同關注的問題,但這些數(shù)據(jù)集的規(guī)模往往超出數(shù)據(jù)處理者的能力。圖書館主要工作為實踐,研究和教育。以最大限度地利用人類的知識,促進專業(yè)的交流為責任。圖書館職業(yè)無法離開專業(yè)知識和信息,影響人類社會的可持續(xù)發(fā)展。數(shù)據(jù)是圖書館藏書的重要組成部分。數(shù)據(jù)作為原始類的產(chǎn)品,可以加工、整理、分析,最后提煉成人與人之間的生產(chǎn)和生活中發(fā)揮更大作用的信息和知識。因此,大數(shù)據(jù)主題是圖書館行業(yè)內(nèi)應當研究的問題,展示了圖書館界在信息社會求生存,謀發(fā)展能力的提升。本文旨在討論大數(shù)據(jù)時代下,圖書館與大數(shù)據(jù)相關的研究內(nèi)容、發(fā)展存在的問題以及總體發(fā)展趨勢。
圖書館已有的研究中有文獻計量學等和大數(shù)據(jù)有關。研究人員為了促進信息科學與社會科學的進步,通過大型網(wǎng)絡規(guī)模的收集獲得數(shù)據(jù)和分析數(shù)據(jù)得出相關結論來實現(xiàn)目標。由于大數(shù)據(jù)技術的應用,傳統(tǒng)的文獻計量學的研究從過去只有簡單的描述性研究擴展到評估和預測的研究。圖書館學研究人員參與了很多相關的項目,例如,新西蘭的奧塔哥大學的圖書館承擔了研究數(shù)據(jù)管理項目的任務,在麻省理工大學設立項目研究圖書館數(shù)據(jù)存儲、需求分析數(shù)據(jù)的管理,和傳播數(shù)據(jù),并完成數(shù)據(jù)收集保存標準的制定工作。烏里韋和麥克唐納在認為數(shù)據(jù)監(jiān)測工作將從傳統(tǒng)的信息技術受益。Huwe 建議采取政治手段,以促進圖書館和數(shù)據(jù)中心的發(fā)展,他認為高等教育機構應該認可圖書館對學術研究的支持。通過分析2008 非常流行的“數(shù)字化監(jiān)控中心的生命周期模型”,希金斯提出,圖書館的“數(shù)據(jù)保留計劃”的生命周期可以被納入其數(shù)字機構庫文件管理實體。此外,美國學者對館員在大數(shù)據(jù)環(huán)境中的作用和專業(yè)知識進行了調(diào)查,他們一致認為圖書館可以在大數(shù)據(jù)時代承擔數(shù)據(jù)管理職責。謝菲爾德大學還安排了基礎的信息學專業(yè)課程。2011年6月倫敦國際監(jiān)護教育論壇投入使用的,也給數(shù)字監(jiān)控領域的發(fā)展提供了一個機會。
國內(nèi)目前的相關研究課題還處于剛起步的狀態(tài),CNKI 與該主題相關的文章也只有寥寥幾篇。相比之下,國內(nèi)對“數(shù)據(jù)監(jiān)護權”的關注度更高這,主要是針對大學圖書館在這個專業(yè)領域展開更多的研究。這方面的論文在2012年之后有一個井噴式的增長,但總體來說,國內(nèi)相關文獻還相對較少,研究項目也幾乎沒有。
在數(shù)字化時代,數(shù)據(jù)處理更容易、更快。圖書館的數(shù)據(jù)資源種類多、數(shù)量大、形式多樣。截至2008年底,CALS 的文檔數(shù)據(jù)量達到180T,2010年底的國家圖書館數(shù)字資源總量達到480 T。目前,國家博物館進行維護之后,數(shù)字圖書館的非結構化數(shù)據(jù)的存儲容量將非常大??倲?shù)字資源工程也達到108TB。由此看來,圖書館的數(shù)字資源總量已聚集為一個大的數(shù)據(jù)集。再次,圖書館自動化服務水平已發(fā)展到了一個新的階段。此外,用戶服務信息每日激增,用戶對服務的要求越來越高,圖書館要根據(jù)用戶的服務信息,做出相應的調(diào)整。因此,根據(jù)各自限定的環(huán)境和條件,從大量的數(shù)據(jù)分析中挖掘出用戶當前和未來的需求都非常迫切。
目前,隨著科學技術的不斷發(fā)展,傳統(tǒng)的紙質(zhì)圖書館向電子、數(shù)字圖書館的轉(zhuǎn)變,因此圖書館服務的性質(zhì)已經(jīng)發(fā)生了很大的變化。傳統(tǒng)圖書館是點對點的服務,而目前數(shù)字圖書館已經(jīng)成為綜合性服務,服務的風格和方法等方面都發(fā)生了很大的變化。在服務理念上,數(shù)字圖書館是基于數(shù)據(jù)服務的基礎上,在大數(shù)據(jù)的基礎上,從數(shù)據(jù)采集,智能服務,提供綜合服務,創(chuàng)新了服務模式。在大數(shù)據(jù)時代,數(shù)據(jù)資源是豐富的,每個圖書館可以利用網(wǎng)絡來收集大量的數(shù)據(jù)資源,基于資源共享提供各種數(shù)據(jù)管理的資源之間的無縫連接。
在大數(shù)據(jù)時代背景下,競爭已經(jīng)不再是一個簡單的數(shù)據(jù)資源所有權的競爭,而是在數(shù)據(jù)的結構以及類型上、數(shù)據(jù)的開發(fā)以及利用上的競爭。從圖書館的角度來看,它是在大數(shù)據(jù)背景下,為了避免自己被邊緣化,就必須分析數(shù)據(jù),來進行相關的數(shù)據(jù)分析服務。分析數(shù)據(jù)庫業(yè)務有以下幾個方面:首先,圖書館需要建立自己的大數(shù)據(jù)分析,數(shù)據(jù)分析通常在現(xiàn)有的數(shù)據(jù),如讀者愛好的書籍等。另外是對讀者的分析,這類似企業(yè)和其他客戶群體參考提供的數(shù)據(jù)分析、競爭情報分析,但也有很大的區(qū)別,不同之處在于數(shù)據(jù)分析對象、用于數(shù)據(jù)分析和數(shù)據(jù)分析的目的等。對于這樣的數(shù)據(jù),可能不會被圖書館所擁有,所以它必然成為在這個行業(yè)發(fā)展的瓶頸限制,我們應該想辦法解決這些問題。
[1]劉瓊.大數(shù)據(jù)環(huán)境下圖書館面臨的影響與挑戰(zhàn)[J].理論觀察,2013(8):112-113.
[2]孫琳.大數(shù)據(jù)時代圖書館服務體系創(chuàng)新研究[J].理論觀察,2013(4):99-100.
[3]李立.大數(shù)據(jù)在數(shù)字圖書館中的應用分析[J].高校實驗室工作研究,2014(3):35-37.
[4]李白楊,張心源.數(shù)字圖書館建設中大數(shù)據(jù)問題初探[J].情報科學,2013,11:26-29.