李嬌等
摘 要:隨著大數(shù)據(jù)時(shí)代迅速來(lái)臨,給社會(huì)文化與各行各業(yè)都帶來(lái)了巨大變革,圖書(shū)館同樣不例外。就大數(shù)據(jù)來(lái)說(shuō),圖書(shū)館界先后進(jìn)行了一系列學(xué)術(shù)研究以及實(shí)踐,但圖書(shū)館事業(yè)當(dāng)中大數(shù)據(jù)的運(yùn)用仍然存在著許多問(wèn)題,這些問(wèn)題的存在對(duì)圖書(shū)館正常發(fā)展及運(yùn)營(yíng)造成了嚴(yán)重影響,因此優(yōu)化其應(yīng)用程序尤其關(guān)鍵。
關(guān)鍵詞:大數(shù)據(jù)時(shí)代;圖書(shū)館;發(fā)展
基金項(xiàng)目:重慶市高等教育教學(xué)改革研究項(xiàng)目(133023,1203036)。
1.前言
隨著大數(shù)據(jù)時(shí)代的到來(lái),對(duì)圖書(shū)館的建設(shè)和服務(wù)等工作產(chǎn)生了很大的影響。比如,出現(xiàn)了圖書(shū)館的大數(shù)據(jù)存儲(chǔ)能力不夠、容易泄露讀者的保密數(shù)據(jù)及其閱讀隱私等問(wèn)題。當(dāng)前,為保證圖書(shū)館順應(yīng)時(shí)代發(fā)展的需求,及時(shí)做好相應(yīng)的應(yīng)對(duì)措施,實(shí)現(xiàn)大數(shù)據(jù)在圖書(shū)館管理中的可用性,已成為圖書(shū)館準(zhǔn)確、高效地滿足讀者閱讀需求,優(yōu)化服務(wù)模式的關(guān)鍵。因此,圖書(shū)館應(yīng)科學(xué)的進(jìn)行大數(shù)據(jù)的采集、分析及判定和決策,以實(shí)現(xiàn)大數(shù)據(jù)的可控性、有效性和經(jīng)濟(jì)性。
2.對(duì)圖書(shū)館運(yùn)用大數(shù)據(jù)的主要問(wèn)題
2.1 圖書(shū)館的大數(shù)據(jù)運(yùn)行技術(shù)及基礎(chǔ)設(shè)施條件不夠
圖書(shū)館數(shù)據(jù)具有資源總量大、增長(zhǎng)迅速快的特點(diǎn),其種類以及數(shù)量隨著信息時(shí)代的到來(lái)逐超越紙質(zhì)版的學(xué)術(shù)資源,將成為圖書(shū)館的重要館藏部分,也是數(shù)字圖書(shū)館日后可依據(jù)的重要資產(chǎn)。因此,出現(xiàn)了圖書(shū)館的大數(shù)據(jù)運(yùn)行技術(shù)及基礎(chǔ)設(shè)施條件不夠的問(wèn)題。當(dāng)前,將新興的大數(shù)據(jù)技術(shù)合理的運(yùn)用于數(shù)字化的圖書(shū)館,構(gòu)建出大數(shù)據(jù)圖書(shū)館所需的基礎(chǔ)設(shè)施條件,已是大數(shù)據(jù)時(shí)代背景下圖書(shū)館進(jìn)行建設(shè)的一項(xiàng)重要挑戰(zhàn)。一方面,信息時(shí)代,讀者產(chǎn)生的數(shù)據(jù)信息中會(huì)存在很多半結(jié)構(gòu)化和非結(jié)構(gòu)化的信息數(shù)據(jù),致使信息數(shù)據(jù)的結(jié)構(gòu)類型和格式形態(tài)等都更加復(fù)雜。因此,極速增長(zhǎng)的數(shù)據(jù)量給圖書(shū)館的存儲(chǔ)能力帶來(lái)了很大的挑戰(zhàn),當(dāng)前現(xiàn)有的圖書(shū)館的整體性的知識(shí)服務(wù)結(jié)構(gòu)并不完善,其數(shù)據(jù)處理技術(shù)很難實(shí)現(xiàn)大數(shù)據(jù)的應(yīng)用需求。另一方面,大數(shù)據(jù)種類的復(fù)雜化給圖書(shū)館的常規(guī)分析帶來(lái)了很大的挑戰(zhàn),這就要求必須突破對(duì)大量異構(gòu)數(shù)據(jù)的處理和分析不足的問(wèn)題。當(dāng)前,大數(shù)據(jù)時(shí)代產(chǎn)生的數(shù)據(jù)總量及類型的急劇變化使圖書(shū)館的基礎(chǔ)設(shè)施承受著很大的壓力,由于受到成本的制約,現(xiàn)階段的大部分圖書(shū)館難以在短時(shí)間內(nèi)在技術(shù)、基礎(chǔ)設(shè)施的建設(shè)等方面滿足建設(shè)大數(shù)據(jù)圖書(shū)館的實(shí)際要求[1]。
2.2 大數(shù)據(jù)的不確定性對(duì)圖書(shū)館管理提出了新的挑戰(zhàn)
大數(shù)據(jù)存在一定的不確定性,這種不確定性特征會(huì)致使網(wǎng)絡(luò)數(shù)據(jù)很難被建模及有效學(xué)習(xí),從而難以發(fā)揮其有效利用的價(jià)值。數(shù)據(jù)本身存在的不確定性、并不完全準(zhǔn)確的原始數(shù)據(jù)、對(duì)數(shù)據(jù)采集的處理力度以及應(yīng)用需求等因素致使數(shù)據(jù)在不同的維度和尺度方面均出現(xiàn)了不確定性;大數(shù)據(jù)的模型也具有不確定性,由于數(shù)據(jù)自身具有的不確定性會(huì)要求數(shù)據(jù)的處理方式應(yīng)該不同于傳統(tǒng)的數(shù)據(jù)處理方法,這就要求圖書(shū)館在大數(shù)據(jù)的管理方面應(yīng)該提出相應(yīng)的新模型并把握好模型的表達(dá)能力,最終致使新選擇的大數(shù)據(jù)模型也具有了一定程度的不確定性;大數(shù)據(jù)的學(xué)習(xí)具有不確定性,數(shù)據(jù)模型一般情況下都需要學(xué)習(xí)模型參數(shù),但是通常情況下很難找到模型的最優(yōu)解。因此,大部分學(xué)習(xí)問(wèn)題都只是采用一個(gè)近似但并不確定的方法找出一個(gè)相對(duì)而言可用的解。在大數(shù)據(jù)時(shí)代的要求下,傳統(tǒng)的近似學(xué)習(xí)方法則需要面對(duì)時(shí)效和規(guī)模的雙重挑戰(zhàn),這樣一來(lái),便要求圖書(shū)館要盡量提高技術(shù)性管理水平來(lái)應(yīng)對(duì)大數(shù)據(jù)學(xué)習(xí)中的不確定性[2]。
2.3 大數(shù)據(jù)為圖書(shū)館數(shù)據(jù)帶來(lái)安全隱患的問(wèn)題
在大數(shù)據(jù)信息時(shí)代,使用信息的安全和讀者的閱讀隱私問(wèn)題已經(jīng)成為當(dāng)前建設(shè)大數(shù)據(jù)圖書(shū)館的一大挑戰(zhàn)。開(kāi)放數(shù)據(jù)和共享數(shù)據(jù)是進(jìn)行大數(shù)據(jù)模式的核心精神,現(xiàn)階段的各組織機(jī)構(gòu)包括圖書(shū)館都開(kāi)始公開(kāi)、共享出各自領(lǐng)域的信息數(shù)據(jù),在很大程度上消除了以往的“數(shù)據(jù)孤島和數(shù)據(jù)割據(jù)”的狀態(tài),逐漸實(shí)現(xiàn)了共建圖書(shū)館數(shù)據(jù)以及數(shù)據(jù)價(jià)值最大化發(fā)展。但是,隨著而來(lái)的信息安全問(wèn)題也從傳統(tǒng)的計(jì)算機(jī)網(wǎng)絡(luò)的保密性管理、可控性管理逐漸轉(zhuǎn)變?yōu)殡y于預(yù)見(jiàn)信息安全隱患和信息管理出現(xiàn)不可控的困境。隨著近年來(lái)大數(shù)據(jù)的不斷整合和大數(shù)據(jù)技術(shù)門檻的日益降低,導(dǎo)致圖書(shū)館大數(shù)據(jù)中所包含的大量的涉及用戶隱私的商業(yè)情報(bào),甚至是部分涉及國(guó)家安全的信息都成了難以保護(hù)的重要對(duì)象。由此,致使大數(shù)據(jù)背景下的圖書(shū)館數(shù)據(jù)的安全隱患問(wèn)題日益嚴(yán)重化[3]。
3.圖書(shū)館應(yīng)對(duì)大數(shù)據(jù)時(shí)代影響的有效對(duì)策
3.1 開(kāi)發(fā)圖書(shū)館的大數(shù)據(jù)運(yùn)行技術(shù),使圖書(shū)館滿足運(yùn)行大數(shù)據(jù)的條件
在大數(shù)據(jù)背景下,只有開(kāi)發(fā)圖書(shū)館的大數(shù)據(jù)運(yùn)行技術(shù),才能使圖書(shū)館滿足運(yùn)行大數(shù)據(jù)的條件。當(dāng)前,圖書(shū)館建設(shè)的當(dāng)務(wù)之急應(yīng)該是樹(shù)立大數(shù)據(jù)的發(fā)展戰(zhàn)略,做好管理的頂層設(shè)計(jì),科學(xué)推動(dòng)圖書(shū)館完成大數(shù)據(jù)的轉(zhuǎn)型。圖書(shū)館應(yīng)該基于全局戰(zhàn)略及局部戰(zhàn)略的角度,根據(jù)自身實(shí)際條件對(duì)建立大數(shù)據(jù)的戰(zhàn)略角色進(jìn)行定位,并緊密結(jié)合圖書(shū)館所在區(qū)域的主要服務(wù)對(duì)象的館藏特點(diǎn)等因素,建立起分級(jí)、分類的具體性實(shí)施策略,積極探索大數(shù)據(jù)的業(yè)務(wù)、服務(wù)、技術(shù)等模型。圖書(shū)館穩(wěn)定發(fā)展的主要競(jìng)爭(zhēng)力是其占有數(shù)據(jù)信息的規(guī)模活性和對(duì)數(shù)據(jù)的分析、挖掘、運(yùn)用能力,當(dāng)前,傳統(tǒng)方法的數(shù)據(jù)定量分析已難以滿足大數(shù)據(jù)的分析需求。圖書(shū)館可以采用統(tǒng)計(jì)學(xué)及模式識(shí)別等各種技術(shù),從圖書(shū)館大量的數(shù)據(jù)中提取出信息中所潛在的各種價(jià)值信息。同時(shí),圖書(shū)館應(yīng)該成立適用的數(shù)據(jù)管理部門來(lái)專門負(fù)責(zé)信息數(shù)據(jù)的采集、收儲(chǔ)和利用工作,通過(guò)館內(nèi)各部門間的協(xié)調(diào)工作,使圖書(shū)館滿足運(yùn)行大數(shù)據(jù)的條件。
3.2 圖書(shū)館應(yīng)構(gòu)建科學(xué)的大數(shù)據(jù)存儲(chǔ)系統(tǒng)
圖書(shū)館大數(shù)據(jù)存儲(chǔ)系統(tǒng)需要具有存儲(chǔ)架構(gòu)科學(xué)、存儲(chǔ)容量大、存儲(chǔ)區(qū)域網(wǎng)絡(luò)化等,這些特性直接關(guān)系著圖書(shū)館的大數(shù)據(jù)管理效率和管理質(zhì)量。因此,為順應(yīng)大數(shù)據(jù)時(shí)代的要求,構(gòu)建科學(xué)的大數(shù)據(jù)存儲(chǔ)系統(tǒng),圖書(shū)館應(yīng)該做好以下幾個(gè)方面的工作:(1)關(guān)注大數(shù)據(jù)系統(tǒng)結(jié)構(gòu)的科學(xué)合理性,存儲(chǔ)數(shù)據(jù)應(yīng)該嚴(yán)格按照數(shù)據(jù)信息的類型、應(yīng)用需求和安全保障等對(duì)信息文件進(jìn)行分塊存儲(chǔ)。 (2)采用認(rèn)證用戶身份及設(shè)置訪問(wèn)權(quán)限的管理模式,控制用戶對(duì)大數(shù)據(jù)存儲(chǔ)平臺(tái)的數(shù)據(jù)訪問(wèn)。 (3)圖書(shū)館大數(shù)據(jù)存儲(chǔ)系統(tǒng)應(yīng)該具備比較強(qiáng)的數(shù)據(jù)容錯(cuò)力,以保證數(shù)據(jù)存儲(chǔ)的可用性。(4)應(yīng)根據(jù)圖書(shū)館的未來(lái)管理方向和服務(wù)數(shù)據(jù)量的增長(zhǎng)情況,建設(shè)存儲(chǔ)系統(tǒng)時(shí)應(yīng)該保證系統(tǒng)可實(shí)現(xiàn)通過(guò)增加數(shù)據(jù)信息的節(jié)點(diǎn)數(shù)量或數(shù)據(jù)塊的服務(wù)器數(shù)量,便可以自由進(jìn)行數(shù)據(jù)存儲(chǔ)能力的擴(kuò)展。
3.3 確保圖書(shū)館大數(shù)據(jù)的可控性和可靠性
為確保圖書(shū)館大數(shù)據(jù)的可控性和可靠性,圖書(shū)館在進(jìn)行數(shù)據(jù)采集時(shí),通常希望可以最大范圍地對(duì)數(shù)據(jù)進(jìn)行采集和分析。這就需要圖書(shū)館運(yùn)用科學(xué)的大數(shù)據(jù)采集方法進(jìn)行數(shù)據(jù)的采集,以保證采集數(shù)據(jù)的精確性、價(jià)值密度和數(shù)據(jù)間的因果關(guān)系等。因此,為了保證圖書(shū)館大數(shù)據(jù)的準(zhǔn)確性、高效性和可用性,圖書(shū)館應(yīng)做好以下幾個(gè)方面的工作:(1)圖書(shū)館應(yīng)該根據(jù)運(yùn)營(yíng)服務(wù)和系統(tǒng)管理的實(shí)際需求,建立大數(shù)據(jù)的質(zhì)量評(píng)估標(biāo)準(zhǔn)以及可用性的保障體系。通過(guò)利用評(píng)估系統(tǒng)科學(xué)的對(duì)大數(shù)據(jù)的數(shù)據(jù)信息的可用性以及數(shù)據(jù)間的關(guān)系進(jìn)行評(píng)估,然后通過(guò)評(píng)估結(jié)果進(jìn)而實(shí)時(shí)反饋,并采取相應(yīng)的對(duì)策,進(jìn)而保證圖書(shū)館大數(shù)據(jù)平臺(tái)的科學(xué)性、經(jīng)濟(jì)性和可控性。(2)在對(duì)大數(shù)據(jù)進(jìn)行采集、存儲(chǔ)、管理和應(yīng)用的過(guò)程中,圖書(shū)館應(yīng)確保數(shù)據(jù)信息具有廣泛的數(shù)據(jù)視角、長(zhǎng)期性的原始格式存儲(chǔ)類型、可快速的實(shí)現(xiàn)數(shù)據(jù)自身價(jià)值并為用戶提供服務(wù)等。(3)圖書(shū)館應(yīng)該根據(jù)數(shù)據(jù)價(jià)值的發(fā)掘程度及其未來(lái)的可用性,對(duì)高價(jià)值的數(shù)據(jù)進(jìn)行長(zhǎng)期性的安全存儲(chǔ)及查詢優(yōu)化,保證高價(jià)值的大數(shù)據(jù)安全、穩(wěn)定及未來(lái)可用。
3.4 強(qiáng)化圖書(shū)館數(shù)據(jù)的安全建設(shè)與管理
一直以來(lái),保護(hù)國(guó)家情報(bào)安全和用戶的個(gè)人圖書(shū)情報(bào)都是圖書(shū)館的重要責(zé)任。但是,在大數(shù)據(jù)時(shí)代的背景下,大數(shù)據(jù)進(jìn)行開(kāi)放數(shù)據(jù)和共享數(shù)據(jù)致使國(guó)家情報(bào)安全和用戶的個(gè)人圖書(shū)情報(bào)出現(xiàn)了很大的安全問(wèn)題,這一問(wèn)題制約著圖書(shū)館進(jìn)入大數(shù)據(jù)時(shí)代的速度。 面對(duì)這一問(wèn)題,圖書(shū)館應(yīng)該做好以下幾個(gè)方面的工作,以切實(shí)保護(hù)用戶的數(shù)據(jù)安全:(1)圖書(shū)館需要研發(fā)或者引進(jìn)實(shí)現(xiàn)大數(shù)據(jù)條件下保護(hù)用戶隱私的安全技術(shù),以有效防止惡意入侵盜取和破壞數(shù)據(jù)的不法行為發(fā)生。同時(shí)規(guī)范數(shù)據(jù)的開(kāi)放流程及接口,以保障圖書(shū)館的數(shù)據(jù)資源的科學(xué)有序的開(kāi)放、安全使用。(2)圖書(shū)館是數(shù)據(jù)的守衛(wèi)者,圖書(shū)館工作人員必須要提高自身的專業(yè)素養(yǎng)及職業(yè)道德水平,切實(shí)保護(hù)用戶的個(gè)人數(shù)據(jù)信息安全,嚴(yán)格控制好信息的傳播和開(kāi)放范圍,同時(shí)做好國(guó)家情報(bào)機(jī)密的保護(hù)工作,維護(hù)國(guó)家的信息安全性 。(3)政府應(yīng)該研究并出臺(tái)保護(hù)大數(shù)據(jù)安全的相關(guān)法律法規(guī),通過(guò)立法的手段保護(hù)圖書(shū)館大數(shù)據(jù)的安全性。只有制定法律嚴(yán)厲的懲罰數(shù)據(jù)入侵者和數(shù)據(jù)破壞者,對(duì)其造成的危害后果追究相應(yīng)的刑事責(zé)任,才能從根本上避免圖書(shū)館大數(shù)據(jù)安全問(wèn)題的發(fā)生。
3.5 構(gòu)建結(jié)構(gòu)化及經(jīng)濟(jì)化的圖書(shū)館大數(shù)據(jù)平臺(tái)
科學(xué)的構(gòu)建結(jié)構(gòu)化及經(jīng)濟(jì)化的圖書(shū)館大數(shù)據(jù)平臺(tái),圖書(shū)館應(yīng)該做好如下工作:一方面圖書(shū)館在建設(shè)大數(shù)據(jù)平臺(tái)時(shí),應(yīng)該堅(jiān)持“統(tǒng)一標(biāo)準(zhǔn)、開(kāi)放兼容”的基本原則,以有效減少建設(shè)平臺(tái)系統(tǒng)的成本,并合理降低軟件系統(tǒng)對(duì)硬件設(shè)備技術(shù)指標(biāo)的參數(shù)要求。另一方面,進(jìn)行大數(shù)據(jù)的存儲(chǔ)、管理分析和應(yīng)用建設(shè),應(yīng)該堅(jiān)持“開(kāi)源平臺(tái)、保證軟件可擴(kuò)展及可移植”的重要原則,以確保系統(tǒng)方便操作、管理。此外,大數(shù)據(jù)平臺(tái)應(yīng)該通過(guò)對(duì)服務(wù)資源進(jìn)行動(dòng)態(tài)調(diào)配和擴(kuò)展等模式,在保證實(shí)現(xiàn)數(shù)據(jù)存儲(chǔ)、管理、分析過(guò)程中的最高收益的基礎(chǔ)上,有效降低運(yùn)營(yíng)成本的投入。同時(shí),大數(shù)據(jù)平臺(tái)的性能設(shè)計(jì)應(yīng)該滿足圖書(shū)館的全周期管理、多類型數(shù)據(jù)、多功能使用以及全天候的連續(xù)性的綜合性服務(wù)需求。
3.6 保證圖書(shū)館大數(shù)據(jù)的即時(shí)性和可用性
在大數(shù)據(jù)時(shí)代的背景下,圖書(shū)館的用戶服務(wù)和讀者的閱讀活動(dòng)所產(chǎn)生的數(shù)據(jù)具有了流動(dòng)性和實(shí)時(shí)性的特點(diǎn)。這些隨時(shí)產(chǎn)生的信息數(shù)據(jù),對(duì)圖書(shū)館的用戶服務(wù)模式以及服務(wù)質(zhì)量都具有動(dòng)態(tài)調(diào)控和即時(shí)判定的重要作用。一方面,圖書(shū)館應(yīng)該通過(guò)獲取的各種實(shí)時(shí)信息,對(duì)圖書(shū)館服務(wù)平臺(tái)的系統(tǒng)性能以及服務(wù)質(zhì)量等情況進(jìn)行提前的預(yù)警,并進(jìn)行實(shí)時(shí)監(jiān)測(cè)和動(dòng)態(tài)跟蹤,最后做出相應(yīng)決策,以全面提高圖書(shū)館服務(wù)的智能化和自動(dòng)化水平。另一方面,圖書(shū)館應(yīng)該通過(guò)對(duì)收集起來(lái)的讀者閱讀模式、閱讀內(nèi)容、讀者資料以及讀者的群關(guān)系等基本信息進(jìn)行合理分析,以準(zhǔn)確的掌握用戶的服務(wù)模式以及讀者的閱讀需求方向等,進(jìn)而為圖書(shū)館的服務(wù)模式轉(zhuǎn)型提供大數(shù)據(jù)的決策支持。此外,圖書(shū)館可通過(guò)挖掘所收集的數(shù)據(jù)信息,全面掌握讀者群的具體閱讀興趣和所需求的一些服務(wù)模式和內(nèi)容,進(jìn)而為提高圖書(shū)館對(duì)讀者的推送式的服務(wù)質(zhì)量[4]。
4 結(jié)束語(yǔ)
綜上所述,正確面對(duì)和解決大數(shù)據(jù)時(shí)代給圖書(shū)館帶來(lái)的影響,可以使圖書(shū)館與時(shí)俱進(jìn)的發(fā)展。隨著大數(shù)據(jù)時(shí)代的到來(lái)和快速發(fā)展,大數(shù)據(jù)給圖書(shū)館帶來(lái)了各種問(wèn)題,在短時(shí)間內(nèi)嚴(yán)重影響了圖書(shū)館的正常運(yùn)營(yíng)。圖書(shū)館是進(jìn)行整個(gè)社會(huì)的信息服務(wù)中心,其穩(wěn)定發(fā)展肩負(fù)著對(duì)社會(huì)的責(zé)任。因此,圖書(shū)館應(yīng)積極利用先進(jìn)的科學(xué)技術(shù)進(jìn)行改革,同時(shí),做好風(fēng)險(xiǎn)的管理工作,進(jìn)而將挑戰(zhàn)轉(zhuǎn)變?yōu)榘l(fā)展的機(jī)遇,最終促進(jìn)圖書(shū)館的可持續(xù)發(fā)展。
參考文獻(xiàn)
[1]許玲.大數(shù)據(jù)時(shí)代圖書(shū)館面臨的挑戰(zhàn)與對(duì)策思考[J].中共福建省委黨校學(xué)報(bào),2014,01(05):118.
[2]劉瓊.大數(shù)據(jù)環(huán)境下圖書(shū)館面臨的影響與挑戰(zhàn)[J].理論觀 察,2013,01(08):113.
[3]馬曉亭.大數(shù)據(jù)時(shí)代圖書(shū)館數(shù)據(jù)可用性:價(jià)值、挑戰(zhàn)和保障[J].圖書(shū)館理論與實(shí)踐,2014,01(10):6.
[4]馬曉亭.大數(shù)據(jù)時(shí)代圖書(shū)館數(shù)據(jù)長(zhǎng)期可用性保障研究[J].現(xiàn)代情報(bào),2013,33(12):64.
作者簡(jiǎn)介
李嬌(1981-),女,江蘇南通,博士,館員,研究方向?yàn)閳D書(shū)館管理及相關(guān)技術(shù),材料科學(xué)與工程。