何楊琦
摘 要:大數(shù)據現(xiàn)已影響到各行各業(yè),它的到來對高校圖書館的數(shù)字化建設不只是機遇,還有挑戰(zhàn)。本文概述了大數(shù)據技術和高校圖書館之間存在的內在聯(lián)系,并分析了大數(shù)據背景下高校圖書館的數(shù)字化建設問題。
關鍵詞:大數(shù)據;高校圖書館;數(shù)字化
中圖分類號:G250.72 文獻標識碼:B
當下社會信息技術正在持續(xù)迅猛地發(fā)展,大數(shù)據時代已經到來,其明顯表現(xiàn)就是新型的數(shù)據不斷地涌現(xiàn)出來,數(shù)據量正呈現(xiàn)爆炸式增長。
高校圖書館是公共信息體系中的重要組成部分,也在緊隨時代的腳步進行數(shù)字化改革建設。
大數(shù)據對于高校圖書館進行數(shù)字化建設來說不只是挑戰(zhàn),更是機遇。二者之間存在兩方面的內在聯(lián)系:首先, 大數(shù)據背景下的有關技術能為圖書館數(shù)字化建設提供必要的幫助;其次,圖書館的數(shù)字化建設可以為大數(shù)據的相關研究提供經驗和應用的空間。
一、大數(shù)據和高校圖書館數(shù)字化建設之間的內在聯(lián)系
到目前為止,作為一項逐漸顯現(xiàn)出強大功能的技術,我們還沒有對大數(shù)據做出一個準確的解釋,不過通過對不同概念進行分析,我們得出了一個共識——大數(shù)據技術就是從各種不同類型的數(shù)據中迅速地檢索到自己所需的有價值的信息的能力。
高校圖書館的主要作用是為高校教學以及師生的科研任務提供幫助,其是實現(xiàn)高效信息化的主要載體,在高校的發(fā)展進程中起著不可替代的作用。
高校圖書館要想為了使自己保持與信息社會發(fā)展同步,就必須開展數(shù)字化建設。
二、高校圖書館在大數(shù)據背景下數(shù)字化建設的建設思路
接下來,筆者將從技術發(fā)展、資源建設、服務升級三個方面論述高校圖書館在大數(shù)據背景下進行數(shù)字化建設的思路。
1.技術發(fā)展
(1)當今的數(shù)據量已經由TB級升級到了PB級,并還在迅猛增長。有調查顯示,2015年世界上最大的數(shù)據倉庫中存有的數(shù)據量已經將近100PB。但它對信息的存儲能力還不能滿足數(shù)據快速增長的要求,因此迫切需要開發(fā)一種新型的分布式數(shù)據庫。
(2)傳統(tǒng)意義上的圖書館中的數(shù)據均為結構化數(shù)據,在實現(xiàn)數(shù)字化之后,圖書館還擁有了非結構化數(shù)據,比如圖片、視頻等多媒體數(shù)據。非結構化數(shù)據的增長速度明顯高于結構化數(shù)據,截至2012年,非結構化數(shù)據已經占到了互聯(lián)網數(shù)據量的76%以上。在這種背景之下,關系數(shù)據庫已經不能滿足時代的需求。
(3)處理數(shù)據的快捷性。用戶在數(shù)字化圖書館中能夠得到即時服務,可以隨時閱讀或者下載信息。
而大數(shù)據技術要求的也是數(shù)據處理的快捷性,數(shù)據處理的時間顯著縮短,比如300GB的數(shù)據只需1秒鐘就可以處理完成。
(4)大數(shù)據時代下需要對數(shù)據進行精簡和挖掘,最近幾年數(shù)據挖掘、數(shù)據倉庫等技術的快速發(fā)展為高校圖書館的發(fā)展提供啟示,那就是著重發(fā)展對大數(shù)據的數(shù)據挖掘以及分析。高校圖書館只要能在大數(shù)據中發(fā)現(xiàn)潛在規(guī)律和價值,就能夠從根本上提升智能化服務水平。
2.資源建設
高校圖書館在實現(xiàn)數(shù)字化之后,不要只把資源建設當作自己的服務基礎,還要把它當作建設自身的核心所在。資源建設過程中需要大數(shù)據技術的強力支持,進而幫助能豐富數(shù)據資源的內容和種類,完善數(shù)據資源的結構,重點發(fā)展原生資源、領域資源以及特色資源,并積極實現(xiàn)資源的共享。
(1)發(fā)展原生資源——高校本身在平時的教學和科研過程中發(fā)表的各種類型的、各種用途的文獻。原生資源是高校學術水平的集中體現(xiàn),它集中了學校老師的所有科研成果。原生資源的利用價值高,而建設成本低,因此在高校圖書館數(shù)字化建設中具有一定的優(yōu)勢。
(2)建立自己的特色資源——這是高校圖書館保持本身特色的根本所在。在當今的大數(shù)據背景下,圖書館無需將所有館藏數(shù)據都進行數(shù)字化建設,而應該根據本館的館藏優(yōu)勢及特色,重點對特色的學科進行數(shù)字化建設,因地制宜,才能做得更好。
(3)建立各圖書館之間的資源共享機制——只有保持合作共享,才能夠滿足用戶日益增長的數(shù)據需求,才能夠在數(shù)據爆炸的時代背景下不被淘汰。因此,各高校圖書館之間要建立互通有無的合作式發(fā)展關系。
3.服務升級
數(shù)字化圖書館的核心服務價值在于滿足客戶的以下要求:①用戶對高質量數(shù)據資源的需求;②用戶能夠迅速方便地檢索到所需信息;③對用戶關注的信息要持續(xù)跟蹤并推送給用戶。大數(shù)據技術的發(fā)展使得數(shù)字化圖書館能更好地解決以上三個問題,通過提供智能化服務和個性化服務,推動圖書館服務水平的提升。
三、圖書館數(shù)字化建設可行性建議
目前還處于大數(shù)據技術的初始階段,各項理論以及實踐技術有待完善。高校圖書館要想在大數(shù)據時代做好數(shù)字化建設,需要未雨綢繆,做好前期的準備工作。
1.建立數(shù)字資源的整合平臺
為了滿足新時期用戶快捷、方便的數(shù)據需求,摒棄以往復雜的檢索方法以及檢索界面給用戶帶來的諸多不便,高校圖書館首先要建立起一個統(tǒng)一檢索的數(shù)字資源平臺,為讀者用戶提供一站式的服務,并實現(xiàn)數(shù)據查閱的快速、聚類呈現(xiàn)、無重復以及多角度。
北京大學圖書館已經建立了一套“未名學術搜索”系統(tǒng),這為建立整合平臺提供了探索經驗。
用戶通過使用該系統(tǒng),能快速地檢索到本圖書館館藏中的所有藏書、論文資源、多媒體資源、電子書資源、期刊等各種數(shù)據資源,并向用戶提供所檢索資源的來源、館藏中的存放位置等重要信息。
2.加強整合原生的信息資源
不斷生成的原生數(shù)據是未來生活中大數(shù)據的重要來源,所以高校圖書館要加強整合原生資源并建立數(shù)據庫。
目前的各個數(shù)據庫之間普遍存在著知識關聯(lián)度低、內容交叉且重復的問題,因此在建立新的原生數(shù)據庫時,要做好統(tǒng)一協(xié)議,建立一個有利于大數(shù)據相互融合、操作性強的標準平臺。
3.建立精確、個性化的推薦系統(tǒng)
根據不同用戶在圖書館中不同的瀏覽網站、鏈接搜索、瀏覽次數(shù)以及停留時間,追蹤出用戶不同的興趣以及特征方向,基于此為用戶建立一套精確的個性化推薦系統(tǒng)。
這種系統(tǒng)在大數(shù)據時代可用于分析用戶的行為并預測相應的應對方式,其可以為建設大數(shù)據提供客觀、準確的參考依據。
高校圖書館是大數(shù)據的重要組成部分,也是大數(shù)據與人們之間聯(lián)系的橋梁。
因此,高校圖書館不能只安心做大數(shù)據時代的受益者,更應該在數(shù)字化建設中積極探索,作為一個參與者主動參與到大數(shù)據時代的發(fā)展進程當中。
參考文獻:
[1]樊偉紅,李晨暉,張興旺,等.圖書館需要怎樣的“大數(shù)據”[J].圖書館雜志,2012,(11).
[2]王天泥.知識咨詢:大數(shù)據成為信息科技關注新熱點[J].圖書與情報,2013,(2).
[3]朱開忠.圖書館轉型研究[M].北京:人民郵電出版社,2011.
[4]魏 欣,趙 雋,張 敬,等.高校圖書館數(shù)字化建設——淺論數(shù)字化特色資源的建設[J].圖書館工作與研究,2005,(4).
[5]董秀真,靳艷華.高校圖書館數(shù)字化建設[J].醫(yī)學信息學雜志,2007,(3).