成玉峰
大數(shù)據(jù)時代數(shù)字圖書館面臨的機遇和挑戰(zhàn)淺談
成玉峰
隨著數(shù)字時代的到來,網(wǎng)絡學術資源建設快速發(fā)展,大有取代數(shù)字圖書館的趨勢,因而也為數(shù)字圖書館帶來了巨大的挑戰(zhàn),當然,任何事物都是對立存在的,大數(shù)據(jù)時代為數(shù)字圖書館帶來挑戰(zhàn)的同時,亦為其帶來機遇。擴展資源范疇,廣泛應用數(shù)據(jù)分析技術,改變服務模式,是未來數(shù)字圖書館跳出傳統(tǒng)資源建設的框架,樹立全方位服務理念,提供全方位資源服務方式和傳播形式的必由之路。
大數(shù)據(jù) 數(shù)字圖書館 機遇 挑戰(zhàn)
隨著時代的發(fā)展,大數(shù)據(jù)一詞被越來越多的人所提到,“大數(shù)據(jù)”也被越來越多的人用來對信息爆炸時代產(chǎn)生的海量數(shù)據(jù)進行釋義,并對和大數(shù)據(jù)相關的技術與產(chǎn)業(yè)進行命名。正如哈佛大學社會學教授——加里·金說:“這是一場革命,龐大的數(shù)字資源各個領域開始了量化過程,無論商界、學術界還是政府,所有領域都將開始這種進程?!盵1]
大數(shù)據(jù)為我們的生活亦帶來了三個顛覆性觀念的轉(zhuǎn)變:是全部數(shù)據(jù),而不是隨機采樣;是大方向,而不是精確制導;是相互關系,而不是因果關系。這三大改變,也是大數(shù)據(jù)其本身的精髓。它具有數(shù)據(jù)量大、類型繁多、價值密度低、速度快、時效高的特點,可以說在大數(shù)據(jù)時代,其對人類的數(shù)據(jù)駕馭能力提出了更高的要求,也為人們能夠獲得印象更為深刻且全面的數(shù)據(jù)分析能力提供了更為廣闊的空間與考驗。
數(shù)字圖書館是用數(shù)字處理技術處理和存儲各種圖文并茂的圖書館,其實質(zhì)是一種多媒體制作的分布式信息系統(tǒng)涉及信息資源加工、存儲、檢索等方面,也就是說,數(shù)字圖書館就是虛擬的、沒有圍墻的圖書館,是基于網(wǎng)絡環(huán)境下共建共享的可擴展的知識網(wǎng)絡系統(tǒng),是超大規(guī)模的、分布式的、便于使用的、可以實現(xiàn)無縫鏈接與智能檢索的知識中心。[2]數(shù)字圖書館具有信息儲存空間小不易損壞、信息查閱檢索方便、遠程迅速傳遞信息、同一信息可多人同時使用等優(yōu)點。但亦存在資源浪費、信息版權問題、建設資金龐大、圖書館員素質(zhì)低等問題。
與傳統(tǒng)圖書館相比,數(shù)字圖書館除具有不同的功能與特征外,其在館藏建設、讀者服務的方面都有了新的進展。
在以計算機技術、網(wǎng)絡技術和數(shù)字化技術為支撐下的數(shù)字圖書館,有著較為迅速的發(fā)展速度的同時,其取得的成績也是令人欣喜的,但金無足赤,人無完人,大數(shù)據(jù)時代下的數(shù)字圖書館亦仍舊存在著些許缺陷,如:簡單復制傳統(tǒng)圖書館的功能、信息資源系統(tǒng)共享不足等。大數(shù)據(jù)時代的到來為突破數(shù)字圖書館局限性帶來了機遇,目前已成為國內(nèi)外圖書情報學研究的熱點。
(一)大數(shù)據(jù)環(huán)境下的數(shù)字圖書館面臨重重挑戰(zhàn)
在整個大數(shù)據(jù)環(huán)境下,數(shù)字圖書館正面臨著與傳統(tǒng)圖書館的“同質(zhì)”問題和數(shù)字圖書館的非結構化數(shù)據(jù)空白。首先,數(shù)字圖書館處理問題是數(shù)字資源化、音頻視頻信息的轉(zhuǎn)化等方面的擴展深化,但對大量的數(shù)據(jù)的加工處理與管理服務有著些許欠缺。而且從未來發(fā)展的角度來看,數(shù)字圖書館應該對數(shù)字化資源進行更為深層次的開發(fā),加大對原始數(shù)據(jù)的發(fā)掘、采集、組織、保存利用的力度,從而開展一條數(shù)據(jù)資源主導型的可持續(xù)發(fā)展的新模式。打破傳統(tǒng)資源框架的束縛,建立全方位的服務信息,服務形式開始從被動化向主動化發(fā)展,不斷擴展服務與傳播方式,全面擴展數(shù)字圖書館服務。[2]同時也要對數(shù)字圖書館員進行定位,提高其對數(shù)字圖書館的認識,要求每一位館員都應當具有超強的數(shù)據(jù)分析能力,能夠及時了解學術風向,把握大數(shù)據(jù)分析的技術,能夠熟練應用多種數(shù)據(jù)分析工具以及軟件,并且可以準確定位網(wǎng)絡資源,這樣才能夠促進數(shù)字圖書館的發(fā)展。其次,因為數(shù)字圖書館的非結構化數(shù)據(jù)的空白性,其數(shù)據(jù)內(nèi)容所占比重非常低,并且因為缺乏對大數(shù)據(jù)的分析,數(shù)字圖書館很難融入企業(yè)等用戶群體的細節(jié)服務。隨著各種新的技術及渠道在數(shù)字圖書館中的應用,產(chǎn)生了諸多如電子郵件、數(shù)據(jù)日志、文字處理文件等應用,以及眾多被人們發(fā)布在網(wǎng)絡上的新聞等因無序、未加工整理,與數(shù)據(jù)庫使用統(tǒng)計等一些未被數(shù)字圖書館收集整理過得資源,造成了大數(shù)據(jù)環(huán)境下的數(shù)字圖書館面臨著半結構化、非結構化數(shù)據(jù)的缺失。大數(shù)據(jù)環(huán)境下大數(shù)據(jù)的缺乏,使得數(shù)字圖書館成為實體館的遙不可及的夢想,當然其技術的缺失亦使得數(shù)字圖書館很難融入到各種用戶群體的細節(jié)服務。
(二)數(shù)字圖書館發(fā)展的“大數(shù)據(jù)”策略
在注重諸如電子郵件、儀器儀表數(shù)據(jù)、日志數(shù)據(jù)、非結構化數(shù)據(jù)建設的同時,大數(shù)據(jù)時代數(shù)字圖書館應該進行數(shù)字資源的深層次開發(fā),廣泛開展了一條數(shù)據(jù)資源主導型的發(fā)展新模式。
盡快開發(fā)一代數(shù)字圖書館應用支撐平臺,支持多種數(shù)據(jù)管理,多媒體文檔存儲、保管、檢索和管理,是我們首先要做的,在此基礎上,在各類教育、科研和文化對象正逐漸走向信息化、數(shù)字化、網(wǎng)絡化的全面、廣泛存在的數(shù)字化信息環(huán)境中,在社交網(wǎng)絡的數(shù)字內(nèi)容等開放數(shù)字內(nèi)容領域的基礎上,已經(jīng)成為主要的信息資源。因此,在數(shù)據(jù)爆炸性增長、新類型數(shù)據(jù)不斷涌現(xiàn)、數(shù)據(jù)結構更趨復雜的大數(shù)據(jù)時代,數(shù)字圖書館的資源建設也將發(fā)生深刻的改變。
大數(shù)據(jù)環(huán)境下的數(shù)字圖書館,在面臨挑戰(zhàn)的同時,亦擁有很大的發(fā)展前景,在當前大的競爭環(huán)境中,大數(shù)據(jù)與數(shù)字圖書館應當更近一步的結合,唇齒相依,互相促進,才能夠更好地共同發(fā)展。
[1]劉曉娟,尤斌,張愛蕓.基于微博數(shù)據(jù)的應用研究綜述[J].情報雜志,2013,32(9):39~40.
[2]劉海舒,李慧萍.高職院校圖書館現(xiàn)狀與發(fā)展對策思考[J].中國職業(yè)技術教育,2016(35):96~99.
(作者單位:東北石油大學秦皇島分校)