摘要:隨著數(shù)字時(shí)代的到來,大數(shù)據(jù)在我國各個(gè)領(lǐng)域被廣泛應(yīng)用,這是我國科技進(jìn)步的表現(xiàn)。圖書管理要想有效地跟上大數(shù)據(jù)時(shí)代的步伐,就要利用數(shù)據(jù)的采集、分析、處理及共享技術(shù),把圖書館的用途有效地發(fā)揮出來。
關(guān)鍵詞:圖書管理 大數(shù)據(jù) 數(shù)據(jù)采集 數(shù)據(jù)存儲數(shù)據(jù)處理
一、引言
圖書館是群眾獲取信息的重要場所之一,作為信息共享平臺,圖書館的使用率是極高的。書籍的存儲量具有種類多、數(shù)量大的特點(diǎn),其管理方法也須相對嚴(yán)謹(jǐn)。在科技高速發(fā)展的形勢下,圖書管理要想更快、更有效地為民眾提供服務(wù),就要提升圖書館的管理模式,提高目錄檢索效率,實(shí)現(xiàn)現(xiàn)代化圖書管理。
二、大數(shù)據(jù)運(yùn)用于圖書館管理中的意義
(一)有效的數(shù)據(jù)采集可以提高服務(wù)效率
數(shù)據(jù)采集是圖書管理面臨的一大難題,因?yàn)閿?shù)據(jù)并非都是統(tǒng)一格式的,所采集的數(shù)據(jù)不僅包含結(jié)構(gòu)化數(shù)據(jù),也包含半結(jié)構(gòu)化數(shù)據(jù)以及非結(jié)構(gòu)化數(shù)據(jù)。大數(shù)據(jù)的計(jì)算、分析與處理是基于海量數(shù)據(jù)基礎(chǔ)上的。因此,無論哪種類型的數(shù)據(jù)都需要統(tǒng)一采集,這一點(diǎn)與大數(shù)據(jù)的工作性質(zhì)相同,在同一采集模式下的兩種領(lǐng)域,是完全可以有效結(jié)合的。不僅可以有效提高工作效率,也可以使圖書管理工作變得更加容易。[1]
(二)大量的數(shù)據(jù)存儲可以拓展服務(wù)領(lǐng)域
圖書館因其服務(wù)性質(zhì),需要不斷吸收數(shù)據(jù),包括書籍本身的數(shù)據(jù),也包括在管理過程中生成的數(shù)據(jù)。在現(xiàn)有存儲空間無法滿足的情況下,實(shí)施大數(shù)據(jù)進(jìn)行海量數(shù)據(jù)的存儲、管理以及優(yōu)化可以有效解決這一問題,使圖書館可以不斷吸收更多種類的信息,以更好地拓展服務(wù)領(lǐng)域。
(三)高效的數(shù)據(jù)處理可以提升服務(wù)效能
隨著人類文明的推進(jìn),圖書館應(yīng)以大量、豐富的信息數(shù)據(jù)來滿足各類人群的需求。目前,信息化技術(shù)雖然已經(jīng)運(yùn)用到了圖書管理中,但大量數(shù)據(jù)的不斷產(chǎn)生,使原有數(shù)據(jù)處理模式已經(jīng)無法有效滿足現(xiàn)狀。把大數(shù)據(jù)引入圖書管理,可以有效維護(hù)圖書管理的運(yùn)營。智能平臺管理系統(tǒng)可以有效整合圖書館內(nèi)的數(shù)據(jù),通過數(shù)據(jù)整合,將所有書籍進(jìn)行數(shù)據(jù)分類、分層的管理,進(jìn)而提高信息檢索的有效性,加速圖書管理的系統(tǒng)一體化進(jìn)程。另外,大數(shù)據(jù)在借閱管理系統(tǒng)中可以起到監(jiān)管的作用,對于延遲、未歸還或者損壞書籍,可以進(jìn)行有效檢索與監(jiān)督,提高書籍的有效利用率。
三、大數(shù)據(jù)在圖書館管理中的應(yīng)用
(一)大數(shù)據(jù)在數(shù)據(jù)采集中的應(yīng)用
大數(shù)據(jù)具有科學(xué)、先進(jìn)的采集工具,可以讀取并采集各個(gè)類型的數(shù)據(jù),從而有效進(jìn)行數(shù)據(jù)整合,增加數(shù)據(jù)處理及數(shù)據(jù)檢索的有效性。[2]因圖書館內(nèi)的數(shù)據(jù)采集量大、結(jié)構(gòu)復(fù)雜,因此,在運(yùn)用大數(shù)據(jù)進(jìn)行采集時(shí),可以利用Hadoop中的Chukwa,或者Cloud Era中的Flume進(jìn)行采集。這兩種工具可以以數(shù)百兆每秒的速度進(jìn)行數(shù)據(jù)的采集,包括圖片、音頻、視頻及其他格式的數(shù)據(jù)。這些數(shù)據(jù)被采集以后,會根據(jù)數(shù)據(jù)性質(zhì)進(jìn)行分類,然后進(jìn)行數(shù)據(jù)的清理、過濾、轉(zhuǎn)換及壓縮,最后將數(shù)據(jù)打包存儲。
(二)大數(shù)據(jù)在數(shù)據(jù)存儲中的應(yīng)用
圖書館作為數(shù)據(jù)共享的平臺,需要大量的數(shù)據(jù)庫來容納多類型數(shù)據(jù)。這些數(shù)據(jù)來自資源信息、管理信息與服務(wù)信息,數(shù)據(jù)種類較為繁雜,因此可以利用大數(shù)據(jù)中的Hadoop進(jìn)行數(shù)據(jù)存儲。Hadoop包含混合架構(gòu)存儲模式,圖書館可以在多重?cái)?shù)據(jù)的存儲中,尋找適合自身情況的存儲模式。在進(jìn)行數(shù)據(jù)采集以后,可以利用原有數(shù)據(jù)存儲庫進(jìn)行結(jié)構(gòu)化數(shù)據(jù)的存儲,利用NoSQL進(jìn)行半結(jié)構(gòu)化數(shù)據(jù)的存儲,對非結(jié)構(gòu)化的數(shù)據(jù),須提取其元數(shù)據(jù)并進(jìn)行存儲。這樣一來,可以有效對所有數(shù)據(jù)進(jìn)行存儲,保證數(shù)據(jù)的完整性。
(三)大數(shù)據(jù)在數(shù)據(jù)處理中的應(yīng)用
在大數(shù)據(jù)模式下,存儲數(shù)據(jù)是為數(shù)據(jù)處理而服務(wù)的,通過大數(shù)據(jù)的Hadoop中的MapReduce,可以對數(shù)據(jù)進(jìn)行匯總分析,然后通過可視化程序把結(jié)果展示出來。利用這些結(jié)果,圖書館可以通過對書籍存儲量、種類的了解,來掌握圖書館的書籍規(guī)模;通過對書籍的借閱狀態(tài),來掌握大眾關(guān)注的重點(diǎn),并改善服務(wù)模式;通過對書籍不良狀況的展示,來分析管理中的不足,從而加大管理力度。這樣,可以更好地體現(xiàn)現(xiàn)代圖書管理的優(yōu)勢。[3]
四、結(jié)語
圖書館是我國現(xiàn)代文化的象征,在信息時(shí)代的背景下,圖書管理要緊跟時(shí)代步伐,把大數(shù)據(jù)與工作運(yùn)營有效結(jié)合起來,利用大數(shù)據(jù)充分、有效地采集、存儲及處理技術(shù)來整理數(shù)據(jù),通過分析來預(yù)測圖書館的未來發(fā)展趨勢,突出圖書館的整體優(yōu)勢。目前,大數(shù)據(jù)正處于發(fā)展階段,具有極大的發(fā)展空間。因此,在未來隨著大數(shù)據(jù)的不斷進(jìn)步,圖書管理手段也將會不斷提升。
參考文獻(xiàn):
[1]張琦.論大數(shù)據(jù)在圖書館管理與服務(wù)中的應(yīng)用[J].統(tǒng)計(jì)與管理,2017(01).
[2]唐曉歡.基于大數(shù)據(jù)應(yīng)用的圖書館管理與服務(wù)探討[J].辦公室業(yè)務(wù),2017(23).
[3]姜艷紅.大數(shù)據(jù)在圖書館管理與服務(wù)中的應(yīng)用探討[J].中國高新區(qū),2018(13).
(作者簡介:張燕,女,吉林省圖書館,館員,研究方向:圖書館管理)(責(zé)任編輯 劉冬楊)