趙婷婷
(沈陽城市建設學院圖書館,遼寧 沈陽 110167)
隨著社會的發(fā)展和科技的進步,網絡技術迅猛發(fā)展,相應的數據信息也呈“爆炸式”增長,繼云計算出現(xiàn)以后,一個更為熱門的詞匯“大數據”應運而生。而至今學術界也沒有形成統(tǒng)一的定義,它本身是一種比較抽象的概念,維基百科對大數據的定義:大數據是指利用常用軟件工具來獲取、管理和處理數據所耗時間超過可容忍時間的數據集。而在搜索百度百科時,研究機構Gartner對于“大數據”(Big data)給出了這樣的定義:“大數據”是需要新處理模式才能具有更強的決策力、洞察發(fā)現(xiàn)力和流程優(yōu)化能力來適應海量、高增長率和多樣化的信息資產。
單從字面理解,它僅僅表現(xiàn)出了數據數量之大,而實際上,大數據除了數量大以外,還具有種類豐富、復雜多樣、價值量大、處理速度快等特點。大數據的這幾個特點,在學術界達成了共識。
在圖書館的具體管理工作中,無論是館藏資源管理、用戶管理、人力資源管理,還是財力資源管理、時間成本管理,都能夠從中找出相應的數據資源。
圖書館的各種基本服務數據包括:圖書館年開放天數、開館時間累計小時數、年到館人次、平均到館人次、年累計外借圖書冊數、人均借閱冊數、網站訪問量次數,官方微博、微信粉絲數量,發(fā)布消息、推送通知數量,讀者閱讀次數、點贊數量等等。
圖書館的館藏數據無疑可以揭示出一個圖書館的館藏情況,包括紙質資源館藏量、電子資源館藏量、中文圖書館藏量、外文圖書館藏量、中外文期刊數量、中外文數據庫數量、中外文電子期刊數量,按中圖法分類各大類圖書數量,論文年度被下載全文篇數,一段時間內借閱量最大的圖書借閱次數等等。
讀者數據包括圖書館正式注冊讀者數量、電子資源注冊讀者數量,其中本科生、碩士生、教師及其他類別讀者數量,每名讀者的借閱軌跡、閱讀習慣、個人偏好,全年借閱量最大的讀者,所屬系別,讀者使用圖書館時長,參考咨詢人次,參加專題培訓人次等。
首先,使圖書館各項具體業(yè)務管理有“據”可循。在大數據時代,人們非常依賴網絡環(huán)境,足不出戶,通過網絡就能進入圖書館,查閱館藏目錄或以網絡形式在線閱讀數字出版物。而讀者信息行為軌跡,便是大數據時代研究人們閱讀習慣并開展有針對性的閱讀推廣活動的數據基礎。比如我們在淘寶網購物,網站就會從用戶瀏覽和購買記錄中了解用戶的購買習慣和需求,馬上就有了“猜你喜歡”,并根據購物者的習慣在網站首頁推送一些相關產品。再次登錄網站時,曾瀏覽過的商品也會推送進來,同時還有類似商品鏈接讓購物者進行對比。如此都是源于后臺對消費者的消費行為和習慣進行了記錄和分析。圖書館如果根據讀者的喜好從讀者行為數據中分析出有價值的信息,并向讀者推送所其所喜愛的館藏,就會使得圖書館的各項管理有的放矢。
其次,能使圖書館的業(yè)務管理工作更有針對性,更個性化。圖書館領域之中的大數據,是通過分析讀者行為而得出的數據,再對讀者下一步的行為進行預判,從而對其進行有針對性的服務。與通常所說的個性化服務不同的是,傳統(tǒng)的個性化服務是點對點的形式,而此種個性化服務是建立在海量資源基礎上的,除了提供好傳統(tǒng)的個性化服務,還會通過分析用戶需求,提供更精細化的知識服務,針對性更強。
最后,能讓圖書館的業(yè)務管理實現(xiàn)量化管理。這里的量化,并不是指精確或者是數字化,而是找到規(guī)律,確定概率。也就是說,量化數據并不是一定要最后變成數字,這樣說的原因是出于對目的的把握。我們在圖書館中利用大數據,目的是為了更好地對圖書館進行管理,服務于用戶,所以研究圖書館中的大數據,可以從數據出發(fā),讓這些存在于圖書館之中的數據反作用于圖書館。相對的數據量化之后才是影響讀者的因素合計,而量化的目的則是為了更好地實施管理,也就是讓管理更直觀。
圖書館中存在的數據種類多:有通過主題詞表、分類法形成的編目數據,有讀者數據,查詢歷史記錄數據、借閱記錄數據、咨詢記錄數據、開架閱覽數據、資源下載記錄數據、館內閱覽人數數據等等,種類繁多。同時這些數據存在的形式也很多,有視頻數據、音頻數據、聲像數據、圖形數據、文字式數據等等。
另外,圖書館中的數據還有個明顯的特點是雜亂無章,即是無序化的。若想真正的讓這些數據得以充分利用,必須要進行一番鑒別和處理。雖然目前大數據在處理數據方面的技術已經取得一定的進展。但是面對大數據種類繁多,數據量大的現(xiàn)狀,若想從結構復雜,種類繁多的大量數據中,快速有效地獲取有用信息,需要大數據技術的支撐,而數據中心將面臨巨大的壓力。
大數據背景下,圖書館的管理方式、工作方式發(fā)生了翻天覆地的變化,這要求館員要能夠在海量的信息中發(fā)現(xiàn)有價值的信息,對數字資源進行篩選、評估、判斷、處理,同時也要求館員具有一定的管理能力以及創(chuàng)新思維,這對圖書館館員,特別是對于非圖情專業(yè)人員來說,是一個巨大的挑戰(zhàn)。
多數圖書館缺少對廣大館員大數據方面的知識培訓,加之館員學習交流和出國深造的機會也十分有限,造成了大數據方面的高精尖人才極度匱乏。缺少高層次的專業(yè)人才,缺少復合型人才,這是目前圖書館的現(xiàn)狀。
大數據時代一個顯著的特點是開放性,在這個大平臺上,數據是開放式的,資源也是開放式的,通過數據共享,圖書館可以確保其資源得到最大限度的利用,價值實現(xiàn)最大化,但同時,最大的安全隱患便是個人隱私受到了嚴重威脅[24],一旦在整個數據鏈中的某個環(huán)節(jié)出現(xiàn)紕漏,就會影響整體系統(tǒng)數據,會泄露整條數據鏈中的數據信息;另外,隨著數據技術門檻的降低,加之黑客等的入侵,用戶的隱私很難受到嚴密保護,數據安全問題、用戶隱私隱患問題凸顯。
大數據典型的特點是數量巨大、類型繁多。面對如此海量雜亂的數據資源,建立一個有效機制使之有序化是十分必要的。圖書館要成立專門的數據管理部門,對數據的獲取、分析做出統(tǒng)一的標準和規(guī)劃,協(xié)調好各項數據之間的關系,這需要提升計算機選擇、分析、存儲的能力,需要成立專門的數據管理部門,同時為了節(jié)省時間,減去重復勞動的麻煩,應建立共享平臺,實現(xiàn)數據資源的共享[21]。
大數據時代背景下,面臨的一個問題便是要對傳統(tǒng)的圖書館員進行一次全面的提升,要把重點放在建設一支兼具數據技術和管理能力的隊伍。
首先要培養(yǎng)圖書館員的數字意識,使之具備捕捉信息的能力。其次,還要培養(yǎng)圖書館員新的知識和技能,只有圖書館員吸收了這些知識,才能將其準確地傳遞給讀者。這種角色的轉變,可能會需要相當長的一段時間,也會遇到相應的困難。因此,在大數據環(huán)境下,加大對館員的培訓力度,拓寬知識面,增強業(yè)務能力,特別是關于數據分析與處理的能力,使之成為適應大數據時代需要的圖書管理員。
為了保護用戶個人隱私,保證數據安全,必須加強管理,需從以下幾點入手。首先,從技術上,要做好安全防范,對相關信息采取加密手段,保證用戶信息及內部數據資料處于一種絕對保密的安全狀態(tài);其次,要制定并完善相應的法律法規(guī),從法律層面保護用戶隱私,對于擅自泄露用戶隱私,非法入侵者,應追究其相應的法律責任;最后,要在內部做好職業(yè)道德教育,從內部做好防范安全工作,使用戶隱私安全多一層保障。