郭山
摘要:大數(shù)據(jù)時(shí)代的到來對(duì)各行各業(yè)造成了不同程度的沖擊,在應(yīng)用大數(shù)據(jù)技術(shù)優(yōu)化工作流程、提高工作效率的過程中,一些難以避免的問題和困難逐漸浮出水面,如何用新的思維和方法去解決他們,關(guān)系到后續(xù)一系列的運(yùn)營(yíng)和變革。傳統(tǒng)圖書館在進(jìn)行數(shù)字化建設(shè)過程中,數(shù)據(jù)大規(guī)模性問題、數(shù)據(jù)多樣性問題以及數(shù)據(jù)價(jià)值性問題等成為不小的挑戰(zhàn),而克服之道就在于從大數(shù)據(jù)固有特性角度進(jìn)行分析以總結(jié)出有效的解決之策,本文即對(duì)此展開論述。
關(guān)鍵詞:大數(shù)據(jù);數(shù)字圖書館;建設(shè);問題;解決措施
在大數(shù)據(jù)背景下,傳統(tǒng)圖書館建設(shè)也走上了數(shù)字化道路,它基于先進(jìn)的計(jì)算機(jī)技術(shù)、信息技術(shù)和通訊技術(shù)等,借助網(wǎng)絡(luò)平臺(tái)和軟件工具,實(shí)現(xiàn)了對(duì)圖書文件信息的采集、篩選、加工、存儲(chǔ)、整合以及管理,通過完成的圖書信息管理系統(tǒng)來提高工作效率并滿足人們?nèi)找嬖鲩L(zhǎng)的借閱需求。而數(shù)字圖書館的建設(shè)隨著大數(shù)據(jù)技術(shù)的發(fā)展也遭遇了一定的瓶頸,只有對(duì)其正確看待并合理分析,才能取得突破以保證數(shù)字圖書館發(fā)揮應(yīng)有的價(jià)值。
一、大數(shù)據(jù)的概念
目前,大眾對(duì)大數(shù)據(jù)沒有一個(gè)統(tǒng)一的、明確的概念,大數(shù)據(jù)通常是指大小規(guī)格超越傳統(tǒng)數(shù)據(jù)庫(kù)軟件工具抓取、存儲(chǔ)、管理和分析能力的數(shù)據(jù)群。這個(gè)定義有很強(qiáng)的主觀色彩,因?yàn)闆]有一個(gè)統(tǒng)一的標(biāo)準(zhǔn)來確定超過多少TB(1000GB)的數(shù)據(jù)才是大數(shù)據(jù)。但隨著時(shí)間的推移和技術(shù)的發(fā)展,我們可以知道大數(shù)據(jù)的量會(huì)越來越大。還有一點(diǎn),這定義也會(huì)因?yàn)椴块T的差異而發(fā)生標(biāo)準(zhǔn)的變化,這和通用的是什么軟件以及特定行業(yè)數(shù)據(jù)集的大小有密切的關(guān)系。所以,現(xiàn)有各行業(yè)的大數(shù)據(jù)可以是幾十TB,也可以是幾干TB。按照EMC的界定,特指的大數(shù)據(jù)一定是指大型數(shù)據(jù)集,規(guī)模大概在10TB。通過多用戶將多個(gè)數(shù)據(jù)集集合在一起,能構(gòu)成PB的數(shù)據(jù)量。
二、大數(shù)據(jù)背景下數(shù)字圖書館建設(shè)面臨的問題
大數(shù)據(jù)的優(yōu)勢(shì)體現(xiàn)在數(shù)據(jù)來源、數(shù)據(jù)處理方式和數(shù)據(jù)思維等方面,相應(yīng)的應(yīng)用難點(diǎn)也需要從其根本特性入手分析:
(一)如何解決數(shù)據(jù)的大規(guī)模性問題
數(shù)字圖書館收錄了包括文獻(xiàn)、光盤、網(wǎng)絡(luò)等在內(nèi)的各種資源,也聚焦了讀者和向讀者提供服務(wù)的各類信息。這些數(shù)據(jù)資源日復(fù)一日地增長(zhǎng)累計(jì),已經(jīng)形成了一個(gè)龐大的數(shù)據(jù)集,傳統(tǒng)以MB為基本單位的數(shù)據(jù)庫(kù)處理根本難以應(yīng)對(duì),只能依靠以GB、TB或PB為基本單位的大數(shù)據(jù)進(jìn)行處理??梢?,大數(shù)據(jù)的“大”就體現(xiàn)在對(duì)數(shù)據(jù)收集的全面性、完整性和綜合性上,因此數(shù)字圖書館的建設(shè)首先要解決的問題就是如何處理海量的大數(shù)據(jù)存儲(chǔ)信息。
(二)如何解決數(shù)據(jù)的多樣性問題
數(shù)字圖書館的數(shù)據(jù)除了主要的圖書信息和讀者服務(wù)信息外,還擁有很多不同類型的數(shù)據(jù)信息,如閱讀社交數(shù)據(jù)、用戶反饋數(shù)據(jù)、系統(tǒng)運(yùn)營(yíng)與管理數(shù)據(jù)等,而它們的編碼和存儲(chǔ)格式各有差異,需要采取不同的處理方法。在數(shù)字圖書館建設(shè)過程中,這些異構(gòu)數(shù)據(jù)在有限時(shí)間內(nèi)能否被合理利用,將成為數(shù)字圖書館發(fā)揮價(jià)值的關(guān)鍵。
(三)如何解決數(shù)據(jù)的價(jià)值性問題
數(shù)字圖書館的誕生是時(shí)代發(fā)展的必然產(chǎn)物,傳統(tǒng)地只向讀者提供借閱服務(wù)的運(yùn)營(yíng)目標(biāo)正逐漸向數(shù)據(jù)分析與挖掘方向靠攏,因此其業(yè)務(wù)核心變成了對(duì)海量數(shù)據(jù)的深入分析與合理應(yīng)用。在這一過程中,一些蘊(yùn)藏在數(shù)據(jù)信息里的碎片化知識(shí)需要被精準(zhǔn)地識(shí)別和展現(xiàn),因而數(shù)字圖書館面臨著從龐雜的數(shù)據(jù)中找出有價(jià)值信息的嚴(yán)峻挑戰(zhàn)。
三、大數(shù)據(jù)背景下數(shù)字圖書館建設(shè)的應(yīng)對(duì)策略
(一)選擇性地聚集數(shù)字資源
針對(duì)數(shù)據(jù)大規(guī)模性問題,最佳的方法是轉(zhuǎn)變思維,即在建設(shè)數(shù)字圖書館時(shí)避免“貪大求全”,不必刻意囊括所有類別的數(shù)字資源,而是優(yōu)先選擇有特色或者已經(jīng)形成規(guī)模的數(shù)字資源,在此基礎(chǔ)上對(duì)其他資源進(jìn)行整合,最終形成一套有組織、有系統(tǒng)地開發(fā)、整理和建設(shè)方法,確保數(shù)字圖書館的主要價(jià)值得以體現(xiàn)。具體來說,可以開展館際區(qū)域合作與資源整合共享,一方面減輕大數(shù)字給自身帶來的經(jīng)濟(jì)負(fù)擔(dān),抵御資源投入不足風(fēng)險(xiǎn);一方面針對(duì)選擇建設(shè)的數(shù)字資源進(jìn)行更加完善的處理,比如怎樣長(zhǎng)期保存、選擇何種存儲(chǔ)介質(zhì)、落實(shí)備份與遷移、探索仿真與再造等。
(二)趨向平臺(tái)化建設(shè)
現(xiàn)階段數(shù)字圖書館在管理結(jié)構(gòu)化數(shù)據(jù)方面較為成熟,但對(duì)于非結(jié)構(gòu)化數(shù)據(jù)的處理則應(yīng)對(duì)不佳,一個(gè)有效的解決之策就是借助基于網(wǎng)格技術(shù)的信息化平臺(tái),將計(jì)算機(jī)、數(shù)據(jù)庫(kù)、互聯(lián)網(wǎng)、傳感器、終端等整合成一個(gè)功能強(qiáng)大的虛擬計(jì)算機(jī),從而實(shí)現(xiàn)數(shù)字圖書館異構(gòu)環(huán)境下跨平臺(tái)異構(gòu)資源的協(xié)同工作。該平臺(tái)應(yīng)基于用戶需求進(jìn)行建設(shè),既要保證數(shù)據(jù)信息的質(zhì)量,又要保證不同類型的數(shù)據(jù)信息能夠被快捷、有效地存儲(chǔ)、保管、檢索和管理,這樣才能真正解決數(shù)據(jù)的多樣性問題。
(三)創(chuàng)新應(yīng)用服務(wù)與軟件技術(shù)
數(shù)字圖書館的數(shù)據(jù)價(jià)值,在大數(shù)據(jù)背景下主要體現(xiàn)在這些方面:信息檢索、數(shù)據(jù)挖掘、知識(shí)呈現(xiàn)和個(gè)性化服務(wù)等,而它們都需要可靠的應(yīng)用服務(wù)和軟件實(shí)現(xiàn)。為此,在建設(shè)數(shù)字圖書館過程中,一定要重視前沿科技活力的注入以及軟件技術(shù)的創(chuàng)新與發(fā)展,這樣才能跟上時(shí)代步伐。大數(shù)據(jù)背景下,數(shù)字圖書館的服務(wù)方式、途徑等時(shí)刻都在變化,所提供的服務(wù)也不僅僅是圖書借閱、信息查詢等,圍繞包括讀者、企業(yè)、機(jī)構(gòu)等在內(nèi)的不同類型的用戶,數(shù)字圖書館必須具備強(qiáng)大的數(shù)據(jù)挖掘、數(shù)據(jù)處理、數(shù)據(jù)分析和呈現(xiàn)能力,才能在新時(shí)代發(fā)揮不俗的價(jià)值功能。
四、結(jié)束語(yǔ)
數(shù)字圖書館是大數(shù)據(jù)時(shí)代下孕育的產(chǎn)物,其建設(shè)過程在大數(shù)據(jù)背景下也遭遇了一些困難,需要集中精力突破數(shù)字資源建設(shè)、平臺(tái)打造以及服務(wù)價(jià)值提升等發(fā)展桎梏,用行之有效的應(yīng)對(duì)措施保證數(shù)字圖書館的建設(shè)合理化、應(yīng)用有效化,成為與時(shí)代共存并共進(jìn)的綜合性服務(wù)設(shè)施。
參考文獻(xiàn):
[1]郭軼賓.探究大數(shù)據(jù)背景下數(shù)字圖書館面臨的機(jī)遇與挑戰(zhàn)[J].智庫(kù)時(shí)代,2018(書):171-172.
[2]盧巧時(shí).大數(shù)據(jù)時(shí)代數(shù)字圖書館面臨的機(jī)遇和挑戰(zhàn)[J].才智,2018(29):226.
[3]鄧文婷,大數(shù)據(jù)時(shí)代的數(shù)字圖書館建設(shè)研究[J].福建廣播電視大學(xué)學(xué)報(bào),2018(04):25-28.