宋桂杰
摘 要:文章闡述了大數(shù)據(jù)的概述和基本內(nèi)涵,公共圖書(shū)館大數(shù)據(jù)的內(nèi)容,同時(shí)找出了存在的問(wèn)題,針對(duì)這些問(wèn)題提出了解決措施。
關(guān)鍵詞:大數(shù)據(jù);圖書(shū)館;服務(wù);創(chuàng)新;發(fā)展
目前公共圖書(shū)館應(yīng)以變革求發(fā)展的姿態(tài)來(lái)適應(yīng)目前大數(shù)據(jù)的宏觀環(huán)境,大數(shù)據(jù)背景下圖書(shū)館的管理方式,組織型態(tài),服務(wù)模式及館員素質(zhì)建設(shè)等問(wèn)題都應(yīng)做到與大數(shù)據(jù)同步發(fā)展為上策。
1 大數(shù)據(jù)的概述與基本內(nèi)涵
(一)大數(shù)據(jù)的基本概念
怎樣理解大數(shù)據(jù)是一個(gè)相對(duì)抽象的概念,其字面意義表示數(shù)據(jù)規(guī)模龐大,目前關(guān)于大數(shù)據(jù)的概念還沒(méi)有標(biāo)準(zhǔn)的定義,一般認(rèn)為它是一種數(shù)據(jù)量很大,數(shù)據(jù)形式多樣化的非結(jié)構(gòu)化數(shù)據(jù)。綜而言之,大數(shù)據(jù)描述的是隨著數(shù)據(jù)量和數(shù)據(jù)類(lèi)型激增而出現(xiàn)的一種大規(guī)模、多樣化的數(shù)據(jù)集,及其對(duì)數(shù)據(jù)集高速采集、分析、處理以提取知識(shí)價(jià)值的技術(shù)架構(gòu)與過(guò)程。
(二)大數(shù)據(jù)的主要特征
從數(shù)據(jù)的角度看,大數(shù)據(jù)的特征主要有以下幾個(gè)方面:(1)數(shù)據(jù)規(guī)??偭烤薮蟆D壳安煌?lèi)型的數(shù)據(jù)在快速遞增,每天互聯(lián)網(wǎng)絡(luò)、社會(huì)網(wǎng)絡(luò)、傳感器網(wǎng)絡(luò)、通訊網(wǎng)絡(luò)、地理信息系統(tǒng)、數(shù)字圖書(shū)館、電子商務(wù)、網(wǎng)絡(luò)日志等產(chǎn)生巨量的數(shù)據(jù)。
(2)數(shù)據(jù)增長(zhǎng)的速度迅猛。很多領(lǐng)域的數(shù)據(jù)持續(xù)呈指數(shù)級(jí)別速度增長(zhǎng),而且動(dòng)態(tài)性強(qiáng),要求分析處理快速響應(yīng)。
(3)數(shù)據(jù)來(lái)源和類(lèi)型多。目葡天數(shù)據(jù)的類(lèi)型不僅包括文本、照片、動(dòng)畫(huà)、音頻與視頻等信息數(shù)據(jù),還包括網(wǎng)絡(luò)日志、位置信息、鏈接信息等新型數(shù)據(jù)。同時(shí),伴隨著云計(jì)算、物連網(wǎng)、傳感網(wǎng)、移動(dòng)互聯(lián)網(wǎng)等新技術(shù)發(fā)展與應(yīng)用,大數(shù)據(jù)的類(lèi)型將不斷增加,其數(shù)據(jù)結(jié)構(gòu)是不固定、不完全或不規(guī)則的,很難有統(tǒng)一的描述模型。
(4)數(shù)據(jù)的價(jià)值巨大。通過(guò)對(duì)海量的由結(jié)構(gòu)化、半結(jié)構(gòu)化和非結(jié)構(gòu)化數(shù)據(jù)組成的“大數(shù)據(jù)”的挖掘、處理、整合分析,可以發(fā)現(xiàn)新知識(shí),創(chuàng)造新價(jià)值,提升企業(yè)的競(jìng)爭(zhēng)力.為許多行業(yè)的發(fā)展帶來(lái)新的商機(jī)和發(fā)展機(jī)遇。
(5)密度低(Veracity),即價(jià)值密度低,雖然大數(shù)據(jù)的數(shù)量驚人,但是只能挖掘出微量?jī)r(jià)值。比如,長(zhǎng)達(dá)兩個(gè)小時(shí)的視頻,其中只有幾十秒具有價(jià)值,大數(shù)據(jù)價(jià)值密度低,為數(shù)據(jù)分析帶來(lái)了困難。
2 公共圖書(shū)館的大數(shù)據(jù)內(nèi)容
(一)圖書(shū)館需要大數(shù)據(jù)技術(shù)
由于大量新媒體閱讀的興起,越來(lái)越少的讀者使用傳統(tǒng)方式獲取知識(shí),大多數(shù)讀者習(xí)慣通過(guò)更便捷的途徑,隨時(shí)隨地獲取想要的電子資源,這導(dǎo)致圖書(shū)館的讀者數(shù)量銳減,館藏資源的利用率減少。所以現(xiàn)代圖書(shū)館面臨的巨大問(wèn)題是如何增加對(duì)讀者的吸引力上下功夫。自建獨(dú)具特色的數(shù)據(jù)庫(kù),可見(jiàn),大數(shù)據(jù)技術(shù)可以在現(xiàn)代圖書(shū)館應(yīng)用廣泛,為讀者服務(wù)已成為圖書(shū)館必備的重要技術(shù)。
(二)圖書(shū)館擁有大數(shù)據(jù)的數(shù)據(jù)基礎(chǔ)圖書(shū)館的數(shù)據(jù)基礎(chǔ)主要分為兩類(lèi)。
(1)圖書(shū)館的各類(lèi)館藏資源。隨著電子資源逐漸受到讀者青睞,紙質(zhì)館藏受到冷落。為了更好盤(pán)活這些資源,圖書(shū)館利用一些有價(jià)值的紙質(zhì)資源自建特色數(shù)據(jù)加,這種趨勢(shì)增加了數(shù)字化館藏的數(shù)量。此外,圖書(shū)館購(gòu)買(mǎi)的各類(lèi)數(shù)據(jù)庫(kù)包含了大量數(shù)據(jù)、期刊、報(bào)紙、書(shū)籍、研究報(bào)告、音頻、視頻等資源,也形成了海量數(shù)據(jù)基礎(chǔ)。
(2)讀者的非結(jié)構(gòu)化數(shù)據(jù)。為了使個(gè)性化服務(wù)真正惠及讀者,圖書(shū)館需要利用大數(shù)據(jù)技術(shù)分析讀者們的海量非結(jié)構(gòu)化數(shù)據(jù)。根據(jù)2016年1月發(fā)有關(guān)專(zhuān)業(yè)數(shù)據(jù)統(tǒng)計(jì),2016年手機(jī)端的即時(shí)通信使用率繼續(xù)保持穩(wěn)步的增長(zhǎng)勢(shì)頭。截至2016年12月網(wǎng)民的即時(shí)通信使用率,比2015年增加了5.5個(gè)百分點(diǎn),已達(dá)到96%以上。普及已經(jīng)非常高了。
3 大數(shù)據(jù)時(shí)代公共圖書(shū)館面臨的主要問(wèn)題表現(xiàn)
如遇到問(wèn)題如下:
(一)遠(yuǎn)程大數(shù)據(jù)網(wǎng)絡(luò)環(huán)境略顯不足
大數(shù)據(jù)網(wǎng)絡(luò)環(huán)境下,圖書(shū)館面臨三個(gè)現(xiàn)實(shí)問(wèn)題,即人才瓶頸、技術(shù)障礙和基礎(chǔ)設(shè)施滯后。目前就我國(guó)圖書(shū)館實(shí)際,寺部分都缺乏高層次人才。相對(duì)不斷增長(zhǎng)的數(shù)據(jù)而言,館員能分析的數(shù)據(jù)比例在不斷降低,對(duì)一些“可能是機(jī)會(huì)的數(shù)據(jù)”也沒(méi)有清醒的認(rèn)識(shí),缺乏對(duì)數(shù)據(jù)的轉(zhuǎn)換及處理能力。
(二)數(shù)字圖書(shū)館異構(gòu)數(shù)據(jù)集成問(wèn)題
大數(shù)據(jù)時(shí)代,數(shù)字圖書(shū)館產(chǎn)生了海量的結(jié)構(gòu)化、半結(jié)構(gòu)化、非結(jié)構(gòu)化數(shù)據(jù),非結(jié)構(gòu)化數(shù)據(jù)的增長(zhǎng)使得數(shù)字圖書(shū)館的數(shù)據(jù)處理、儲(chǔ)存技術(shù)、服務(wù)方式都將得以改變,而傳統(tǒng)的關(guān)系型數(shù)據(jù)庫(kù)的結(jié)構(gòu)和機(jī)制不能很好地適應(yīng)這種變化。如何將這些異構(gòu)數(shù)據(jù)進(jìn)行集成是數(shù)字圖書(shū)館急需解決的技術(shù)難題。
(三)文獻(xiàn)資源的整合不順暢
大數(shù)據(jù)時(shí)代,圖書(shū)館一面面臨著館藏資源不斷增長(zhǎng)、大量的信息被“擱置”;另一面面臨著用戶(hù)對(duì)檢索結(jié)果提出更高要求,圖書(shū)館資源重新被發(fā)現(xiàn)和管理的挑戰(zhàn)。面對(duì)海量的文獻(xiàn)資源.圖書(shū)館如何全面、快速地使讀者獲得有用信息.如何讓用戶(hù)按照他們自身的習(xí)慣檢索以及研制用戶(hù)精準(zhǔn)的檢索方式,如何將“拿進(jìn)來(lái)、送出去”的館藏資源打造成以用戶(hù)服務(wù)為中心的功能,仍是文獻(xiàn)資源整合中難解的課題。
(四)讀者隱私安全與價(jià)值質(zhì)疑利用大數(shù)據(jù)的同時(shí)往往涉及讀者隱私安全問(wèn)題。此外,大數(shù)據(jù)作為一項(xiàng)前沿技術(shù),對(duì)圖書(shū)館復(fù)雜數(shù)據(jù)的處理、基礎(chǔ)設(shè)施、運(yùn)行經(jīng)費(fèi)等都是不小的挑戰(zhàn)。有人對(duì)圖書(shū)館是否適合引入大數(shù)據(jù)、大數(shù)據(jù)對(duì)圖書(shū)館有多大的幫助等產(chǎn)生了懷疑。
(五)用戶(hù)流失現(xiàn)象
信息科技的發(fā)展打破了人們傳統(tǒng)獲取信息的方式,人們獲取信息的途徑不再局限于書(shū)本,移動(dòng)終端如手機(jī)、平板電腦等成為近幾年的熱點(diǎn),其采集及傳播信息的速度令人瞠目結(jié)舌。常常被偏見(jiàn)地標(biāo)上“藏書(shū)樓”的圖書(shū)館,逐漸有了淡出人們視野的趨勢(shì),用戶(hù)流失比較嚴(yán)重。
4 大數(shù)據(jù)時(shí)代的公共圖書(shū)館應(yīng)對(duì)呈現(xiàn)問(wèn)題的解決對(duì)策
(一)提前制定大數(shù)據(jù)戰(zhàn)略
但是科技是發(fā)展的,今天很先進(jìn)的設(shè)施,過(guò)幾年就會(huì)落后,因此,在建設(shè)規(guī)劃的時(shí)候,一定要注重基礎(chǔ)設(shè)施的可兼容性和可擴(kuò)展性。
(二)建立基于大數(shù)據(jù)的圖書(shū)館服務(wù)
隨著大數(shù)據(jù)時(shí)代的到來(lái),圖書(shū)館作為社會(huì)的服務(wù)中心,信息的集中營(yíng)。必須積極主動(dòng)的尋求改變自身的服務(wù)模式來(lái)提升圖書(shū)館的價(jià)值,滿(mǎn)足用戶(hù)需求??梢越o圖書(shū)館指明了一個(gè)方向,建立基于大數(shù)據(jù)的圖書(shū)館,將數(shù)據(jù)與文獻(xiàn)融為一體的新型圖書(shū)館,對(duì)信息資源進(jìn)行有效地整合。提高實(shí)現(xiàn)知識(shí)共享,最終實(shí)現(xiàn)圖書(shū)館更大的價(jià)值。
(三)更應(yīng)關(guān)注特色資源的建設(shè)
近幾年,隨著信息文化產(chǎn)業(yè)的發(fā)展數(shù)字資源種類(lèi)也越來(lái)越多,但是資源的同質(zhì)化現(xiàn)象也越來(lái)越嚴(yán)重,大數(shù)據(jù)時(shí)代,應(yīng)該更好地利用數(shù)據(jù)挖掘、數(shù)據(jù)組織和分析的技術(shù),圍繞本校特色學(xué)科優(yōu)勢(shì)進(jìn)行專(zhuān)題數(shù)據(jù)采集,建立特色數(shù)據(jù)庫(kù).并對(duì)其數(shù)據(jù)實(shí)施更新,才更有意義,在服務(wù)創(chuàng)新和知識(shí)服務(wù)的前提下,加大人才的培訓(xùn)力度,增加后勁。
(四)加大人才的培養(yǎng)和引進(jìn)力度
同時(shí)大力引進(jìn)數(shù)據(jù)挖掘、數(shù)據(jù)分析與數(shù)據(jù)管理方面的人才,為未來(lái)圖書(shū)館大數(shù)據(jù)體系構(gòu)建提供所需智力儲(chǔ)備。
5 結(jié)束語(yǔ)
在大數(shù)據(jù)時(shí)代背景下對(duì)公共圖書(shū)館的服務(wù)進(jìn)行創(chuàng)新和發(fā)燕尾服提出的新要求,作為公共圖書(shū)館的館員職責(zé)高,任務(wù)重,只有加大培訓(xùn)的力度,掌握先進(jìn)的服務(wù)手段才能更好地為社會(huì)讀者服務(wù)。
參考文獻(xiàn)
[1]黃春英,探究大數(shù)據(jù)時(shí)代下圖書(shū)館的服務(wù)創(chuàng)新與發(fā)展[J],才智,2014(6):290
[2]姜蘊(yùn)華,大數(shù)據(jù)背景下圖書(shū)館的服務(wù)機(jī)制創(chuàng)新研究,赤峰學(xué)院學(xué)報(bào)(自然科學(xué)版),2015
[3]張麗,大數(shù)據(jù)時(shí)代背景下圖書(shū)館的服務(wù)創(chuàng)新與發(fā)展,科技創(chuàng)新導(dǎo)報(bào),2016.12