趙婷婷
(沈陽城市建設學院圖書館,遼寧 沈陽 110167)
隨著社會的發(fā)展和科技的進步,網(wǎng)絡技術迅猛發(fā)展,相應的數(shù)據(jù)信息也呈“爆炸式”增長,繼云計算出現(xiàn)以后,一個更為熱門的詞匯“大數(shù)據(jù)”應運而生。而至今學術界也沒有形成統(tǒng)一的定義,它本身是一種比較抽象的概念,維基百科對大數(shù)據(jù)的定義:大數(shù)據(jù)是指利用常用軟件工具來獲取、管理和處理數(shù)據(jù)所耗時間超過可容忍時間的數(shù)據(jù)集。而在搜索百度百科時,研究機構Gartner對于“大數(shù)據(jù)”(Big data)給出了這樣的定義:“大數(shù)據(jù)”是需要新處理模式才能具有更強的決策力、洞察發(fā)現(xiàn)力和流程優(yōu)化能力來適應海量、高增長率和多樣化的信息資產(chǎn)。
單從字面理解,它僅僅表現(xiàn)出了數(shù)據(jù)數(shù)量之大,而實際上,大數(shù)據(jù)除了數(shù)量大以外,還具有種類豐富、復雜多樣、價值量大、處理速度快等特點。大數(shù)據(jù)的這幾個特點,在學術界達成了共識。
在圖書館的具體管理工作中,無論是館藏資源管理、用戶管理、人力資源管理,還是財力資源管理、時間成本管理,都能夠從中找出相應的數(shù)據(jù)資源。
圖書館的各種基本服務數(shù)據(jù)包括:圖書館年開放天數(shù)、開館時間累計小時數(shù)、年到館人次、平均到館人次、年累計外借圖書冊數(shù)、人均借閱冊數(shù)、網(wǎng)站訪問量次數(shù),官方微博、微信粉絲數(shù)量,發(fā)布消息、推送通知數(shù)量,讀者閱讀次數(shù)、點贊數(shù)量等等。
圖書館的館藏數(shù)據(jù)無疑可以揭示出一個圖書館的館藏情況,包括紙質(zhì)資源館藏量、電子資源館藏量、中文圖書館藏量、外文圖書館藏量、中外文期刊數(shù)量、中外文數(shù)據(jù)庫數(shù)量、中外文電子期刊數(shù)量,按中圖法分類各大類圖書數(shù)量,論文年度被下載全文篇數(shù),一段時間內(nèi)借閱量最大的圖書借閱次數(shù)等等。
讀者數(shù)據(jù)包括圖書館正式注冊讀者數(shù)量、電子資源注冊讀者數(shù)量,其中本科生、碩士生、教師及其他類別讀者數(shù)量,每名讀者的借閱軌跡、閱讀習慣、個人偏好,全年借閱量最大的讀者,所屬系別,讀者使用圖書館時長,參考咨詢?nèi)舜?,參加專題培訓人次等。
首先,使圖書館各項具體業(yè)務管理有“據(jù)”可循。在大數(shù)據(jù)時代,人們非常依賴網(wǎng)絡環(huán)境,足不出戶,通過網(wǎng)絡就能進入圖書館,查閱館藏目錄或以網(wǎng)絡形式在線閱讀數(shù)字出版物。而讀者信息行為軌跡,便是大數(shù)據(jù)時代研究人們閱讀習慣并開展有針對性的閱讀推廣活動的數(shù)據(jù)基礎。比如我們在淘寶網(wǎng)購物,網(wǎng)站就會從用戶瀏覽和購買記錄中了解用戶的購買習慣和需求,馬上就有了“猜你喜歡”,并根據(jù)購物者的習慣在網(wǎng)站首頁推送一些相關產(chǎn)品。再次登錄網(wǎng)站時,曾瀏覽過的商品也會推送進來,同時還有類似商品鏈接讓購物者進行對比。如此都是源于后臺對消費者的消費行為和習慣進行了記錄和分析。圖書館如果根據(jù)讀者的喜好從讀者行為數(shù)據(jù)中分析出有價值的信息,并向讀者推送所其所喜愛的館藏,就會使得圖書館的各項管理有的放矢。
其次,能使圖書館的業(yè)務管理工作更有針對性,更個性化。圖書館領域之中的大數(shù)據(jù),是通過分析讀者行為而得出的數(shù)據(jù),再對讀者下一步的行為進行預判,從而對其進行有針對性的服務。與通常所說的個性化服務不同的是,傳統(tǒng)的個性化服務是點對點的形式,而此種個性化服務是建立在海量資源基礎上的,除了提供好傳統(tǒng)的個性化服務,還會通過分析用戶需求,提供更精細化的知識服務,針對性更強。
最后,能讓圖書館的業(yè)務管理實現(xiàn)量化管理。這里的量化,并不是指精確或者是數(shù)字化,而是找到規(guī)律,確定概率。也就是說,量化數(shù)據(jù)并不是一定要最后變成數(shù)字,這樣說的原因是出于對目的的把握。我們在圖書館中利用大數(shù)據(jù),目的是為了更好地對圖書館進行管理,服務于用戶,所以研究圖書館中的大數(shù)據(jù),可以從數(shù)據(jù)出發(fā),讓這些存在于圖書館之中的數(shù)據(jù)反作用于圖書館。相對的數(shù)據(jù)量化之后才是影響讀者的因素合計,而量化的目的則是為了更好地實施管理,也就是讓管理更直觀。
圖書館中存在的數(shù)據(jù)種類多:有通過主題詞表、分類法形成的編目數(shù)據(jù),有讀者數(shù)據(jù),查詢歷史記錄數(shù)據(jù)、借閱記錄數(shù)據(jù)、咨詢記錄數(shù)據(jù)、開架閱覽數(shù)據(jù)、資源下載記錄數(shù)據(jù)、館內(nèi)閱覽人數(shù)數(shù)據(jù)等等,種類繁多。同時這些數(shù)據(jù)存在的形式也很多,有視頻數(shù)據(jù)、音頻數(shù)據(jù)、聲像數(shù)據(jù)、圖形數(shù)據(jù)、文字式數(shù)據(jù)等等。
另外,圖書館中的數(shù)據(jù)還有個明顯的特點是雜亂無章,即是無序化的。若想真正的讓這些數(shù)據(jù)得以充分利用,必須要進行一番鑒別和處理。雖然目前大數(shù)據(jù)在處理數(shù)據(jù)方面的技術已經(jīng)取得一定的進展。但是面對大數(shù)據(jù)種類繁多,數(shù)據(jù)量大的現(xiàn)狀,若想從結構復雜,種類繁多的大量數(shù)據(jù)中,快速有效地獲取有用信息,需要大數(shù)據(jù)技術的支撐,而數(shù)據(jù)中心將面臨巨大的壓力。
大數(shù)據(jù)背景下,圖書館的管理方式、工作方式發(fā)生了翻天覆地的變化,這要求館員要能夠在海量的信息中發(fā)現(xiàn)有價值的信息,對數(shù)字資源進行篩選、評估、判斷、處理,同時也要求館員具有一定的管理能力以及創(chuàng)新思維,這對圖書館館員,特別是對于非圖情專業(yè)人員來說,是一個巨大的挑戰(zhàn)。
多數(shù)圖書館缺少對廣大館員大數(shù)據(jù)方面的知識培訓,加之館員學習交流和出國深造的機會也十分有限,造成了大數(shù)據(jù)方面的高精尖人才極度匱乏。缺少高層次的專業(yè)人才,缺少復合型人才,這是目前圖書館的現(xiàn)狀。
大數(shù)據(jù)時代一個顯著的特點是開放性,在這個大平臺上,數(shù)據(jù)是開放式的,資源也是開放式的,通過數(shù)據(jù)共享,圖書館可以確保其資源得到最大限度的利用,價值實現(xiàn)最大化,但同時,最大的安全隱患便是個人隱私受到了嚴重威脅[24],一旦在整個數(shù)據(jù)鏈中的某個環(huán)節(jié)出現(xiàn)紕漏,就會影響整體系統(tǒng)數(shù)據(jù),會泄露整條數(shù)據(jù)鏈中的數(shù)據(jù)信息;另外,隨著數(shù)據(jù)技術門檻的降低,加之黑客等的入侵,用戶的隱私很難受到嚴密保護,數(shù)據(jù)安全問題、用戶隱私隱患問題凸顯。
大數(shù)據(jù)典型的特點是數(shù)量巨大、類型繁多。面對如此海量雜亂的數(shù)據(jù)資源,建立一個有效機制使之有序化是十分必要的。圖書館要成立專門的數(shù)據(jù)管理部門,對數(shù)據(jù)的獲取、分析做出統(tǒng)一的標準和規(guī)劃,協(xié)調(diào)好各項數(shù)據(jù)之間的關系,這需要提升計算機選擇、分析、存儲的能力,需要成立專門的數(shù)據(jù)管理部門,同時為了節(jié)省時間,減去重復勞動的麻煩,應建立共享平臺,實現(xiàn)數(shù)據(jù)資源的共享[21]。
大數(shù)據(jù)時代背景下,面臨的一個問題便是要對傳統(tǒng)的圖書館員進行一次全面的提升,要把重點放在建設一支兼具數(shù)據(jù)技術和管理能力的隊伍。
首先要培養(yǎng)圖書館員的數(shù)字意識,使之具備捕捉信息的能力。其次,還要培養(yǎng)圖書館員新的知識和技能,只有圖書館員吸收了這些知識,才能將其準確地傳遞給讀者。這種角色的轉(zhuǎn)變,可能會需要相當長的一段時間,也會遇到相應的困難。因此,在大數(shù)據(jù)環(huán)境下,加大對館員的培訓力度,拓寬知識面,增強業(yè)務能力,特別是關于數(shù)據(jù)分析與處理的能力,使之成為適應大數(shù)據(jù)時代需要的圖書管理員。
為了保護用戶個人隱私,保證數(shù)據(jù)安全,必須加強管理,需從以下幾點入手。首先,從技術上,要做好安全防范,對相關信息采取加密手段,保證用戶信息及內(nèi)部數(shù)據(jù)資料處于一種絕對保密的安全狀態(tài);其次,要制定并完善相應的法律法規(guī),從法律層面保護用戶隱私,對于擅自泄露用戶隱私,非法入侵者,應追究其相應的法律責任;最后,要在內(nèi)部做好職業(yè)道德教育,從內(nèi)部做好防范安全工作,使用戶隱私安全多一層保障。