韓佳雪
摘要:大數(shù)據(jù)在當(dāng)前管理實(shí)踐中的應(yīng)用不但改變?nèi)藗兊乃季S模式,而且促使管理實(shí)踐水平有了空前的提高,人們工作的思路和方法發(fā)生了明顯的轉(zhuǎn)變。在圖書館檔案管理中運(yùn)用大數(shù)據(jù)技術(shù),對(duì)圖書館檔案管理質(zhì)量的提升和效率的提高起到了重要作用。本文對(duì)大數(shù)據(jù)對(duì)圖書館管理影響及應(yīng)用進(jìn)行分析,以供參考。
關(guān)鍵詞:大數(shù)據(jù);圖書館管理;應(yīng)用
一、大數(shù)據(jù)特征
1.數(shù)量Volume
第一個(gè)特征也是最重要的,大數(shù)據(jù)描述的是大批量數(shù)據(jù),數(shù)據(jù)量級(jí)一般可以達(dá)到PB(1024TB)級(jí)規(guī)模,根據(jù)互聯(lián)網(wǎng)數(shù)據(jù)中心(IDC)的監(jiān)測(cè),全球在2010年正式進(jìn)入ZB(10243TB)時(shí)代,2011年全球數(shù)據(jù)量將達(dá)到1.8ZB,預(yù)計(jì)到2020年,全球?qū)⒖偣矒碛?5ZB的數(shù)據(jù)量。日益龐大的數(shù)據(jù)量使得人們對(duì)數(shù)據(jù)的有效利用日益重視,從而衍生了大數(shù)據(jù)概念。大數(shù)據(jù)需要處理的是各類統(tǒng)計(jì)、用戶行為等數(shù)據(jù),如企業(yè)的經(jīng)營(yíng)交易信息、商品物流信息、社會(huì)網(wǎng)絡(luò)交流信息、位置信息等,數(shù)據(jù)規(guī)模極為龐大,有著自己獨(dú)特的處理方案。
2.多樣性Variety
大數(shù)據(jù)種類繁多,在編碼方式、數(shù)據(jù)格式、應(yīng)用特征等多個(gè)方面存在差異性,多信息源并發(fā)形成了大量的異構(gòu)數(shù)據(jù),因此不能再用處理結(jié)構(gòu)化數(shù)據(jù)的方法來(lái)進(jìn)行處理。
3.速度Velocity
大數(shù)據(jù)對(duì)數(shù)據(jù)實(shí)時(shí)處理有著極高的要求,需要實(shí)時(shí)反饋結(jié)果,捕捉、分析、處理每一個(gè)瞬時(shí)出現(xiàn)的數(shù)據(jù),因此通過(guò)傳統(tǒng)數(shù)據(jù)庫(kù)查詢方式得到的當(dāng)前結(jié)果很可能已經(jīng)沒(méi)有了價(jià)值。
4.真實(shí)性Veracity
大數(shù)據(jù)策略可以提供更為真實(shí)的數(shù)據(jù),通過(guò)對(duì)大量數(shù)據(jù)的分析,在用戶行為、數(shù)據(jù)總結(jié)和未來(lái)預(yù)測(cè)方面做出準(zhǔn)確的判斷,為政府、企業(yè)、科研決策提供了真實(shí)可靠的依據(jù)。
二、大數(shù)據(jù)對(duì)圖書館管理的影響和挑戰(zhàn)
(一)海量數(shù)據(jù)處理考驗(yàn)圖書館計(jì)算能力
大數(shù)據(jù)時(shí)代背景下,各類數(shù)據(jù)量迅速增長(zhǎng),數(shù)據(jù)產(chǎn)生的方式、范圍發(fā)生前所未有的變化,人們?cè)谏鐣?huì)中的各類行為都產(chǎn)生了大量的信息數(shù)據(jù),信息數(shù)據(jù)的組成結(jié)構(gòu)、格式類型、存在形態(tài)等都更加復(fù)雜。圖書館要對(duì)上述復(fù)雜的數(shù)據(jù)進(jìn)行應(yīng)用、存儲(chǔ),將具有很強(qiáng)的挑戰(zhàn)性,不僅僅涉及云計(jì)算、大數(shù)量級(jí)數(shù)據(jù)存儲(chǔ)等技術(shù)問(wèn)題,還可能促發(fā)圖書館服務(wù)模式、資源建設(shè)模式、管理模式與發(fā)展模式的轉(zhuǎn)變。
(二)數(shù)據(jù)分析方式轉(zhuǎn)變帶來(lái)的挑戰(zhàn)
隨著圖書館信息化程度的提高,以互聯(lián)網(wǎng)信息搜索、查詢?yōu)榛A(chǔ)的知識(shí)服務(wù)逐漸被更多的圖書館所采用。但不管是簡(jiǎn)單的信息服務(wù),還是結(jié)合了信息檢索、組織、分析等高級(jí)業(yè)務(wù)服務(wù),都可歸納為就數(shù)據(jù)而進(jìn)行的服務(wù)。大數(shù)據(jù)時(shí)代背景下要求圖書館不僅需要通過(guò)結(jié)構(gòu)化數(shù)據(jù)了解客戶需求,也需要大量的非結(jié)構(gòu)化數(shù)據(jù)、半結(jié)構(gòu)化數(shù)據(jù)去挖掘、預(yù)測(cè)和分析當(dāng)前和未來(lái)的用戶需求,社會(huì)大眾的需求也將隨著不斷變化的個(gè)性化的高滿意度服務(wù)出現(xiàn)而對(duì)圖書館的服務(wù)呈現(xiàn)出明確和迫切的需求。滿足用戶的需求,提供復(fù)雜數(shù)據(jù)的處理也將成為大數(shù)據(jù)時(shí)代圖書館的發(fā)展方向,如何處理好數(shù)據(jù)分析,將直接影響圖書館的生存與發(fā)展。
(三)大數(shù)據(jù)對(duì)圖書館基礎(chǔ)設(shè)施提出更高的要求
半結(jié)構(gòu)化及非結(jié)構(gòu)化數(shù)據(jù)的迅速增加,導(dǎo)致數(shù)據(jù)存儲(chǔ)、計(jì)算規(guī)模越來(lái)越大,其成本急劇上升。很多知識(shí)服務(wù)機(jī)構(gòu)出于成本的考慮將應(yīng)用由高端服務(wù)器轉(zhuǎn)向中低端硬件構(gòu)成的大規(guī)模計(jì)算機(jī)集群,從而對(duì)支持非結(jié)構(gòu)化數(shù)據(jù)存儲(chǔ)及分析的基礎(chǔ)設(shè)施提出了很高的要求。
三、圖書館應(yīng)用“大數(shù)據(jù)”的策略建議
1.對(duì)大數(shù)據(jù)的存貯、分析、處理能力應(yīng)提高
其實(shí)數(shù)據(jù)不一定非要用阿拉伯?dāng)?shù)字來(lái)記錄,如:文字、音頻、視頻都是其常見(jiàn)格式。圖書館的大量數(shù)據(jù)應(yīng)分為兩部分存儲(chǔ),一部分考慮到光盤存儲(chǔ)對(duì)數(shù)據(jù)存儲(chǔ)本身而言具備離線存儲(chǔ)功能,穩(wěn)定,不易遭到破壞與攻擊,以光盤的形式存儲(chǔ);另外考慮到硬盤存儲(chǔ)速度更快、聯(lián)網(wǎng)更方便,以硬盤形式存儲(chǔ)。以往,圖書館的數(shù)據(jù)處理牽涉的大部分是結(jié)構(gòu)化的數(shù)據(jù)信息,可供分析的數(shù)據(jù)比例不大,要想從中挖掘出十分有價(jià)值的信息難度較大。大數(shù)據(jù)時(shí)代的到來(lái),它的特征與優(yōu)勢(shì)促使讀者的信息化需求發(fā)生變化,用戶迫切需要圖書館提供智能化、個(gè)性化的服務(wù)。圖書館應(yīng)及時(shí)改變數(shù)據(jù)處理范圍和方式,利用現(xiàn)有條件挖掘潛力,對(duì)讀者的借閱記錄、信息行為、微博等各類數(shù)據(jù)進(jìn)行深入分析,挖掘出有價(jià)值的信息。改善基礎(chǔ)設(shè)施,提高服務(wù)方案,提高對(duì)大數(shù)據(jù)的分析和處理能力,提高服務(wù)效率。
2.圖書館面臨硬件基礎(chǔ)設(shè)施和技術(shù)人才的挑戰(zhàn)
大數(shù)據(jù)時(shí)代,圖書館需要擁有經(jīng)濟(jì)、高效的存儲(chǔ)和計(jì)算能力來(lái)存儲(chǔ)和分析各類讀者用戶的信息,這需要建立在擁有較先進(jìn)、完備的硬件基礎(chǔ)設(shè)施和信息技術(shù)人才的基礎(chǔ)之上。
3.圖書館應(yīng)用大數(shù)據(jù)存在的隱私問(wèn)題及解決辦法
隨著互聯(lián)網(wǎng)的發(fā)展,讀者在不同的地點(diǎn)會(huì)留下越來(lái)越多的數(shù)據(jù)痕跡。既要提倡數(shù)據(jù)共享,又要防數(shù)據(jù)被濫用。雖然全國(guó)人大已經(jīng)通過(guò)加強(qiáng)網(wǎng)絡(luò)信息保護(hù)的決定,使大數(shù)據(jù)的挖掘與利用有法可依。但還是希望早日出臺(tái)“信息公開法”以適應(yīng)大數(shù)據(jù)時(shí)代界定數(shù)據(jù)挖掘、利用的權(quán)限和范圍;另一方面圖書館員自身應(yīng)該樹立良好的職業(yè)道德,在工作中高度關(guān)注和重視大數(shù)據(jù)的隱私問(wèn)題,堅(jiān)決維護(hù)用戶的隱私權(quán),這樣才可以使讀者的個(gè)人信息在合理、合法的范圍內(nèi)有效傳播,以達(dá)到在充分發(fā)揮大數(shù)據(jù)優(yōu)勢(shì)的同時(shí),又不侵犯用戶隱私的共贏目的。
4.應(yīng)用大數(shù)據(jù)圖書館應(yīng)構(gòu)建網(wǎng)絡(luò)安全整體架構(gòu)
Web服務(wù)作為圖書館數(shù)字化的重要組成部分,它為最終用戶提供了訪問(wèn)圖書館資源的重要接口。但是由于安全定位不同,使得傳統(tǒng)的IPS或防火墻無(wú)法真正做到完全理解HTTP,不能有效地保護(hù)Web應(yīng)用業(yè)務(wù)安全。圖書館應(yīng)采用專業(yè)級(jí)的Web防火墻對(duì)Web網(wǎng)站進(jìn)行Web應(yīng)用安全防護(hù),來(lái)阻斷如SQL注入、遠(yuǎn)程文件包含、腳本……,schema中毒、cookie中毒、以及其他Web應(yīng)用攻擊的威脅,保護(hù)這個(gè)重要的入口。這樣就可以保證Web應(yīng)用程序安全性的同時(shí)還可防止敏感的數(shù)據(jù)庫(kù)內(nèi)容外泄,為圖書館Web應(yīng)用提供了專業(yè)級(jí)的應(yīng)用安全防護(hù)。
結(jié)束語(yǔ)
隨著大數(shù)據(jù)時(shí)代發(fā)展,傳統(tǒng)圖書館模式的轉(zhuǎn)變,管理的內(nèi)容和方式不再局限于大量的人力物力財(cái)力在紙質(zhì)圖書的收藏、分類、整理、借閱等等方面的工作,而是更多的轉(zhuǎn)向了提升管理者的職業(yè)素質(zhì),提高管理者的科研能力,轉(zhuǎn)變管理者的管理思路和管理方式,使更多科研人員可以隨時(shí)隨地、多手段、多方式的獲得各種數(shù)據(jù)和信息,并且使得信息數(shù)據(jù)易讀取易存儲(chǔ)等特點(diǎn),圖書管理的發(fā)展改革必將隨著大數(shù)據(jù)時(shí)代的發(fā)展進(jìn)入一個(gè)更光明的時(shí)代。
參考文獻(xiàn):
[1]尹全勤.基于大數(shù)據(jù)的高校智慧圖書館建設(shè)研究[J].科技傳播,2019,11(12):163-164.
[2]肖玉.大數(shù)據(jù)處理在高校圖書館信息化管理中的應(yīng)用探析[J].現(xiàn)代信息科技,2019,3(11):117-118+122.
[3]王迪,陳妍.淺談?dòng)吞飯D書館管理系統(tǒng)[J].蘭臺(tái)內(nèi)外,2019(16):52-53+76.