滑珊
摘 要:近年來,隨著信息基礎(chǔ)設(shè)施的完善與互聯(lián)網(wǎng)現(xiàn)代信息技術(shù)的發(fā)展,電商、社交網(wǎng)絡(luò)等電子網(wǎng)絡(luò)服務(wù)迅速普及,人類進(jìn)入大數(shù)據(jù)時(shí)代。2008年,大數(shù)據(jù)概念正式提出,在政府管理、社會(huì)保障等多行業(yè)領(lǐng)域得到廣泛應(yīng)用。圖書館的建設(shè)受到嚴(yán)重沖擊,大數(shù)據(jù)時(shí)代的新理念對圖書館資源建設(shè)及其生存發(fā)展產(chǎn)生重大影響。大數(shù)據(jù)時(shí)代下,建設(shè)數(shù)字圖書館已成為必然。
關(guān)鍵詞:大數(shù)據(jù)時(shí)代 數(shù)字圖書館 網(wǎng)絡(luò) 信息
中圖分類號:G25 文獻(xiàn)標(biāo)識碼:A 文章編號:1003-9082(2019)02-00-01
信息時(shí)代的發(fā)展使得網(wǎng)絡(luò)信息數(shù)據(jù)呈現(xiàn)爆炸式增長。2008年,《Nature》雜志正式提出大數(shù)據(jù)一詞,迅速引起業(yè)界與學(xué)界的廣泛關(guān)注,2012年被稱為世界大數(shù)據(jù)年,2013年被成為中國統(tǒng)計(jì)的大數(shù)據(jù)元年,大數(shù)據(jù)在我國的發(fā)展已勢不可擋。資源建設(shè)是圖書館開展各項(xiàng)業(yè)務(wù)工作的基礎(chǔ),數(shù)字資源成為圖書館資源的重要部分。如何利用已有數(shù)字資源,轉(zhuǎn)化為有用的知識規(guī)則,對促進(jìn)數(shù)字圖書館建設(shè)發(fā)展,實(shí)現(xiàn)圖書館永續(xù)發(fā)展具有重要意義。
一、大數(shù)據(jù)時(shí)代對數(shù)字圖書館建設(shè)的影響
大數(shù)據(jù)一般都是以數(shù)量巨大,種類繁多存在的非結(jié)構(gòu)性數(shù)據(jù),在百科中也被稱為海量數(shù)據(jù),巨量數(shù)據(jù),簡單說就是涉及的數(shù)據(jù)量非常巨大,無法采用人工的方式進(jìn)行數(shù)據(jù)的處理和截取,也不能根據(jù)人們的實(shí)際要求進(jìn)行信息的解讀。大數(shù)據(jù)是一場數(shù)據(jù)革命,是一場思維變革,大數(shù)據(jù)時(shí)代下,數(shù)據(jù)已成為一種重要的戰(zhàn)略資源,可通過巧妙的應(yīng)用激發(fā)新產(chǎn)品服務(wù)。創(chuàng)造更大的價(jià)值。數(shù)字資源是數(shù)字化技術(shù)與電子出版技術(shù)發(fā)展的產(chǎn)物,是現(xiàn)代文獻(xiàn)信息的主要形式之一,狹義上說,數(shù)字資源是以數(shù)字化將文字、圖像等形式信息存在在非印刷介質(zhì)上,通過計(jì)算機(jī)設(shè)備再現(xiàn)的信息資源。
數(shù)字資源是圖書館現(xiàn)代館藏中發(fā)展最快與最靈活的資源載體,具有內(nèi)容動(dòng)態(tài)性,容易獲取性等特點(diǎn)。大數(shù)據(jù)時(shí)代的到來賦予了圖書館數(shù)字資源新的內(nèi)涵。大數(shù)據(jù)環(huán)境下,以文本為主的結(jié)構(gòu)化學(xué)術(shù)資源不能滿足用戶需求,用戶在使用移動(dòng)圖書館中會(huì)產(chǎn)生大量非結(jié)構(gòu)化數(shù)據(jù)信息。圖書館對數(shù)字資源進(jìn)行加工取舍,以專業(yè)信息推送服務(wù)方式傳達(dá)給用戶。圖書館可向社會(huì)提供大批結(jié)構(gòu)規(guī)范的數(shù)字文獻(xiàn)信息。圖書館可對業(yè)務(wù)流程數(shù)據(jù)進(jìn)行挖掘分析整理。實(shí)現(xiàn)館藏文獻(xiàn)資源與讀者服務(wù)的最佳結(jié)合。
大數(shù)據(jù)環(huán)境下,海量數(shù)據(jù)收集的條件與能力得到很大提高。數(shù)據(jù)總量的爆炸式增長帶來了數(shù)據(jù)雜、垃圾數(shù)據(jù)多等新的問題。有效收集利用有價(jià)值的數(shù)據(jù)成為促進(jìn)數(shù)字圖書館更好發(fā)展的重要途徑。圖書館數(shù)字資源融合強(qiáng)調(diào)基于同一平臺的異構(gòu)融合,跨越時(shí)空與不同類型圖書館的界限,實(shí)現(xiàn)技術(shù)與服務(wù)的融合。大數(shù)據(jù)時(shí)代,圖書館數(shù)據(jù)資源來源廣泛,只有在實(shí)現(xiàn)數(shù)據(jù)資源庫全面開放的前提下才能獲取有價(jià)值的完整數(shù)據(jù)。
數(shù)字資源由數(shù)字資源集成整合演變而來,在數(shù)字資源建設(shè)共享中發(fā)揮重要的作用。數(shù)字資源整合是圖書情報(bào)領(lǐng)域的重要研究內(nèi)容,數(shù)字資源整合是大數(shù)據(jù)環(huán)境下集成發(fā)展的新方向。隨著網(wǎng)絡(luò)技術(shù)的發(fā)展,數(shù)字資源范圍不斷拓展。大數(shù)據(jù)環(huán)境下,完整的數(shù)據(jù)化大數(shù)據(jù)成為數(shù)字資源融合的主要對象。
大數(shù)據(jù)時(shí)代,在云計(jì)算技術(shù)的推動(dòng)下,數(shù)據(jù)處理能力不斷提高,圖書館數(shù)據(jù)資源融合是完整的所有數(shù)據(jù)化的圖書館大數(shù)據(jù)的融合。將所有與圖書館相關(guān)的數(shù)據(jù)信息組合成完整的有機(jī)體,以獲得更多大的價(jià)值。圖書館數(shù)據(jù)資源融合包括同一主題不同來源的數(shù)據(jù)融合,與其他信息機(jī)構(gòu)的數(shù)據(jù)融合等。
二、數(shù)字圖書館資源融合措施
大數(shù)據(jù)環(huán)境下,圖書館數(shù)字資源融合平臺通過融合完整圖書館大數(shù)據(jù),有利于促進(jìn)圖書館所有數(shù)據(jù)資源的共享共建。最終應(yīng)用于圖書館業(yè)務(wù)流程改善與信息服務(wù)提供。業(yè)務(wù)數(shù)據(jù)是圖書館大數(shù)據(jù)的重要部分,通過分析采集的數(shù)字圖書館數(shù)據(jù)融合,可總結(jié)出圖書館業(yè)務(wù)開展中存在的規(guī)律問題。通過分析圖書館流通數(shù)據(jù)檢索,可對檢索工具的簡易性與檢索結(jié)果的準(zhǔn)確性進(jìn)行評價(jià)。
大數(shù)據(jù)時(shí)代下,大規(guī)模的數(shù)據(jù)需用更加先進(jìn)的技術(shù)工具進(jìn)行數(shù)據(jù)處理分析,發(fā)現(xiàn)提取海量數(shù)據(jù)中隱藏的有價(jià)值的信息,利用流量數(shù)據(jù)分析、預(yù)測預(yù)警模型等多方面,成為近年來各行業(yè)的關(guān)注熱點(diǎn)。
圖書館大數(shù)據(jù)獲取指通過RFID射頻識別、閱讀終端設(shè)備、移動(dòng)互聯(lián)網(wǎng)及圖書館數(shù)字資源融合平臺的數(shù)據(jù)接口,實(shí)現(xiàn)完整的圖書館大數(shù)據(jù)處理工作。圖書館大數(shù)據(jù)獲取主要包括對圖書館資源數(shù)據(jù)、業(yè)務(wù)數(shù)據(jù)等數(shù)據(jù)獲取,采集圖書館大數(shù)據(jù)中,數(shù)據(jù)類型復(fù)雜多樣,需利用ETL工具對圖書館大數(shù)據(jù)進(jìn)行預(yù)留處理,以提高數(shù)字圖書館數(shù)據(jù)收集的可靠性與準(zhǔn)確性。
圖書館大數(shù)據(jù)存儲指將批量的不同來源的圖書館大數(shù)據(jù)經(jīng)抽取、轉(zhuǎn)換等預(yù)處理工作后存儲到不同介質(zhì)中。
以便圖書館大數(shù)據(jù)的處理應(yīng)用。大數(shù)據(jù)時(shí)代的圖書館數(shù)字資源融合平臺采取分布式存儲方式,將圖書館數(shù)據(jù)資源存儲到Hadoop平臺上,提供海量數(shù)據(jù)的分布式存儲。Hadoop集群實(shí)現(xiàn)低成本的存儲與高并發(fā)的查詢能力。
圖書館大數(shù)據(jù)的應(yīng)用指將圖書館大數(shù)據(jù)分析結(jié)果應(yīng)用于圖書館業(yè)務(wù)開展中,以拓展圖書館服務(wù)內(nèi)容形式。大數(shù)據(jù)的核心是建立在相關(guān)分析基礎(chǔ)上的預(yù)測,圖書館可同融合關(guān)聯(lián)數(shù)據(jù)為用戶提供預(yù)測服務(wù),為企業(yè)制定競爭策略提供支持。
結(jié)語
大數(shù)據(jù)時(shí)代的發(fā)展為數(shù)字圖書館的資源建設(shè)與信息服務(wù)產(chǎn)生重大影響,要實(shí)現(xiàn)數(shù)字圖書館更好的發(fā)展,必須融合所有完整的數(shù)據(jù),通過大數(shù)據(jù)技術(shù)進(jìn)行數(shù)據(jù)挖掘分析,發(fā)現(xiàn)數(shù)字圖書館大數(shù)據(jù)潛在的價(jià)值,以改善信息服務(wù)。圖書館數(shù)字資源融合通過數(shù)據(jù)公開共享,實(shí)現(xiàn)數(shù)據(jù)技術(shù)平臺的融合,為其發(fā)展提供更好的條件支持。
參考文獻(xiàn)
[1]丘莉莉.我國高校數(shù)字圖書館知識服務(wù)現(xiàn)狀及發(fā)展策略研究[J].赤子(上中旬),2014(21):271+32.
[2]黃寅焱,霍麗麗.探索中國數(shù)字圖書館建設(shè)發(fā)展之路——評《數(shù)字圖書館建設(shè)研究》[J].黑龍江檔案,2016(05):102.
[3]胡昌平,谷斌.數(shù)字圖書館建設(shè)及其業(yè)務(wù)拓展戰(zhàn)略——國家可持續(xù)發(fā)展中的圖書情報(bào)戰(zhàn)略分析(4)[J].中國圖書館學(xué)報(bào),2005(05):13-16+33.
[4]柯珠華.網(wǎng)絡(luò)信息技術(shù)發(fā)展對高校圖書館知識服務(wù)影響研究[J].福建師大福清分校學(xué)報(bào),2017(03):91-96.
[5]秦虹.堅(jiān)持科學(xué)發(fā)展觀 加快黨校數(shù)字圖書館建設(shè)步伐——“全國黨校系統(tǒng)數(shù)字圖書館建設(shè)工作會(huì)議”召開[J].情報(bào)資料工作,2006(01):109-110.