余波 王桀
摘 要:近幾年大數(shù)據(jù)行業(yè)的興起給信息技術(shù)帶來了深刻的變革。在這樣的背景下,數(shù)字圖書館的建設(shè)也要有大數(shù)據(jù)思維,在資源建設(shè)、技術(shù)應(yīng)用、服務(wù)方面都要有一個(gè)大的提升,服務(wù)模式由被動(dòng)“等待”共性化轉(zhuǎn)向積極主動(dòng)“自動(dòng)推送和個(gè)性化”。未來的圖書館一定要充分利用大數(shù)據(jù)這個(gè)平臺(tái),每一個(gè)圖書管理員也應(yīng)該努力成為數(shù)據(jù)分析員。
關(guān)鍵詞:大數(shù)據(jù) 數(shù)據(jù) 應(yīng)用研究
中圖分類號(hào):G251.5 文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):1003-9082 ( 2017 ) 08-00-01
引言
信息技術(shù)的飛速發(fā)展,人們的生產(chǎn)、生活、學(xué)習(xí)已經(jīng)越來越離不開互聯(lián)網(wǎng)。隨之而來的人們生產(chǎn)、存儲(chǔ)的巨量且復(fù)雜的數(shù)據(jù)開始激增。隨著數(shù)據(jù)量從GB時(shí)代邁入TB時(shí)代,麥肯錫公司在2011年提出了大數(shù)據(jù)這個(gè)概念?;ヂ?lián)網(wǎng)時(shí)代已經(jīng)對(duì)現(xiàn)有的圖書館造成了很大的沖擊,紙質(zhì)圖書借閱量的下降,人們對(duì)網(wǎng)絡(luò)資源需求的不斷提高,圖書館數(shù)據(jù)庫建設(shè)的滯后等都要求圖書館應(yīng)該跟緊時(shí)代腳步,加快轉(zhuǎn)型步伐。大數(shù)據(jù)時(shí)代的到來更使我們圖書館人感到了緊迫感。
一、圖書館應(yīng)用大數(shù)據(jù)面臨的幾個(gè)問題
1.來源及獲取問題
圖書館傳統(tǒng)業(yè)務(wù)軟件內(nèi)的數(shù)據(jù)。主要是數(shù)據(jù)庫里的結(jié)構(gòu)化數(shù)據(jù),包括書目數(shù)據(jù):讀者的身份信息:借還書的記錄:延時(shí)記錄:資金管理等。這類數(shù)據(jù)雖然不太符合大數(shù)據(jù)的特征,但可以融入與其他大數(shù)據(jù)的分析中,是圖書館大數(shù)據(jù)分析環(huán)節(jié)中的重要部分,這類數(shù)據(jù)也包括廣泛使用的條形碼和逐漸增多的二維條形碼數(shù)據(jù)?;ヂ?lián)網(wǎng)數(shù)據(jù)包括門戶網(wǎng)站、社交網(wǎng)絡(luò)、微博、微信。使讀者主動(dòng)參與到圖書館的知識(shí)服務(wù)中,在與讀者的交互過程中,會(huì)產(chǎn)生大量數(shù)據(jù),這些數(shù)據(jù)記錄了讀者的信息需求、習(xí)慣愛好等個(gè)性化信息。文獻(xiàn)數(shù)據(jù)是各類數(shù)字化資源的總稱,隨著數(shù)字圖書館進(jìn)程的不斷加快,這類數(shù)據(jù)正呈現(xiàn)爆發(fā)式增長(zhǎng),是圖書館大數(shù)據(jù)的組成部分。但是這類數(shù)據(jù),由于來源廣泛,存在數(shù)據(jù)格式不兼容或不能離開供應(yīng)商的軟件讀取等問題,需要數(shù)據(jù)供應(yīng)商在一定的條件下,提供通用格式的數(shù)據(jù),以解決數(shù)據(jù)互操作的問題。
2.存儲(chǔ)問題
海量的數(shù)據(jù)資源對(duì)存儲(chǔ)系統(tǒng)提出了新的挑戰(zhàn),要求存儲(chǔ)系統(tǒng)具備足夠的存儲(chǔ)空間:靈活的可擴(kuò)展性和較低的使用成本,圖書館目前主要有三種存儲(chǔ)架構(gòu),第一種 DAS 方式,是服務(wù)器直接連接存儲(chǔ)設(shè)備,第二種 NAS 方式,是通過網(wǎng)絡(luò)方式連接存儲(chǔ),第三種 SAN,是通過專用的存儲(chǔ)網(wǎng)絡(luò)連接存儲(chǔ),以實(shí)現(xiàn)集中存儲(chǔ)集中管理,但三種方式都存在可擴(kuò)展性差的問題,難以適應(yīng)海量數(shù)據(jù)的存儲(chǔ)要求,對(duì)大數(shù)據(jù)而言,云存儲(chǔ)是較為理想的方式,云存儲(chǔ)系統(tǒng)具有很強(qiáng)的可擴(kuò)展性,它采用并行擴(kuò)容方式,當(dāng)容量不夠時(shí),只需增加具有一定容量的服務(wù)器,而且容量擴(kuò)展后,性能不會(huì)隨之下降。
二、圖書館大數(shù)據(jù)的應(yīng)用研究
圖書館的應(yīng)用研究,應(yīng)建立在業(yè)務(wù)需求的基礎(chǔ)上,致力于提高服務(wù)體系的組織水平,促進(jìn)圖書館事業(yè)與制度建設(shè)的創(chuàng)新發(fā)展,大數(shù)據(jù)在圖書館中的應(yīng)用將主要圍繞構(gòu)建新型知識(shí)服務(wù)體系和智能化管理上。
1.構(gòu)建新型知識(shí)服務(wù)體系的應(yīng)用利用大數(shù)據(jù)分析技術(shù),能夠揭示數(shù)據(jù)背后隱藏的讀者行為和信息需求,有利于改進(jìn)圖書館的服務(wù),優(yōu)化整合圖書館的資源,建立新型知識(shí)服務(wù)體系,大數(shù)據(jù)的應(yīng)用主要包括:
1.1對(duì)讀者的信息和借閱行為的分析,主要包含:①分析文獻(xiàn)類型與讀者的性別:年齡:學(xué)歷:專業(yè)的關(guān)系。②分析各類文獻(xiàn)的利用情況,進(jìn)行文獻(xiàn)類別的借閱率排行,及時(shí)補(bǔ)充借閱率高的圖書,下架過時(shí)文獻(xiàn),為調(diào)整借閱文獻(xiàn)的品種和采訪提供科學(xué)依據(jù)和預(yù)測(cè)信息,以優(yōu)化館藏結(jié)構(gòu)。③個(gè)性化服務(wù),分析讀者的活躍度:閱讀喜好:借閱方式:信息需求:行為習(xí)慣等數(shù)據(jù),圖書館可以有的放矢地向用戶提供符合其個(gè)性化需求的服務(wù),如新書推薦:同類書推薦:信息需求推送:個(gè)性化的圖書借閱:網(wǎng)上個(gè)性化門戶等。
1.2社交網(wǎng)絡(luò)交互數(shù)據(jù)的分析使讀者主動(dòng)參與到圖書館的知識(shí)服務(wù)中,通過數(shù)據(jù)分析可以發(fā)現(xiàn)讀者的信息需求:讀者的研究課題等,可以有針對(duì)性地向其推薦所需要的圖書:課題的論文資料:研究報(bào)告:專利文獻(xiàn)等。
1.3圖書館信息資源的整合。面對(duì)大量的信息,圖書館通過大數(shù)據(jù)處理,從各類資源中整合有用的知識(shí)和關(guān)聯(lián)關(guān)系。通過數(shù)據(jù)的加工整理,探索以數(shù)據(jù)為基礎(chǔ)的知識(shí)發(fā)現(xiàn)分析和數(shù)據(jù)的增值服務(wù)。
1.4建立一個(gè)全新的知識(shí)服務(wù)導(dǎo)航機(jī)制,建立用戶知識(shí)需求預(yù)測(cè)導(dǎo)航:多維數(shù)據(jù)資源的組織和分析導(dǎo)航:讀者信息行為分析導(dǎo)航:數(shù)據(jù)資源和學(xué)術(shù)資源的服務(wù)導(dǎo)航等。
1.5知識(shí)服務(wù)的智能輔助決策,根據(jù)讀者的借閱數(shù)據(jù),建立圖書館館藏資源的調(diào)整和預(yù)測(cè)機(jī)制,為圖書館管理增加必要的手段。
三、智能化管理方面的應(yīng)用
1.圖書館對(duì)大數(shù)據(jù)的應(yīng)用研究還包括建立大數(shù)據(jù)分析的可視化模型,如借閱分析模型:統(tǒng)計(jì)分析模型:預(yù)測(cè)模型:風(fēng)險(xiǎn)評(píng)估模型等,可視化將成為未大數(shù)據(jù)分析的重要方式。
2.圖書館物業(yè)管理的智能分析和輔助決策,各類傳感器將普遍應(yīng)用于未來的智慧型圖書館中,通過對(duì)傳感器數(shù)據(jù)的多維度分析,實(shí)現(xiàn)物業(yè)管理的智能化。
3.閱覽室閱讀數(shù)據(jù)的統(tǒng)計(jì)預(yù)測(cè)。目前圖書館閱覽室一般無法提供讀者閱讀書籍的數(shù)據(jù)。通過在一組書架中增加RFID 識(shí)別設(shè)備,當(dāng)讀者取書閱讀時(shí)即可將數(shù)據(jù)傳至服務(wù)器中,經(jīng)過數(shù)據(jù)分析和挖掘可以對(duì)讀者的閱讀進(jìn)行統(tǒng)計(jì)和預(yù)測(cè)。根據(jù)書籍的閱讀率及時(shí)增加熱門圖書,剔除冷門圖書,有利于更好地調(diào)整閱覽室的文獻(xiàn)資源布局。
結(jié)語
圖書館目前正在面臨著新技術(shù)、新思想、新服務(wù)、新用戶需求的全面沖擊。未來圖書館如果定位,數(shù)字圖書館向何處發(fā)展,都亟待解決。隨著網(wǎng)絡(luò)大數(shù)據(jù)服務(wù)的崛起,圖書館面臨著越來越大的責(zé)任。如果不轉(zhuǎn)變思路,未來就會(huì)被互聯(lián)網(wǎng)服務(wù)取而代之。如何從圖書館掌握的大數(shù)據(jù)中提取到可用的資源、分析用戶的閱讀習(xí)慣,是圖書館未來轉(zhuǎn)型為“以用戶需求為主導(dǎo)”的模型的主要一環(huán)。
參考文獻(xiàn):
[1]容春琳.公共圖書館應(yīng)用大數(shù)據(jù)的策略研究[J].圖書館建設(shè),2013(7):91-95.
[2]陳明奇.姜禾,張娟,廖方宇.大數(shù)據(jù)時(shí)代的美國(guó)信息網(wǎng)絡(luò)安全新戰(zhàn)略分析[C].第27次全國(guó)計(jì)算機(jī)安全學(xué)術(shù)交流論文集,2012,(8):42-45.
[3]陳茫.周力青,呂艷娥.大數(shù)據(jù)時(shí)代下的圖書館移動(dòng)服務(wù)創(chuàng)新研究[L].圖書與情報(bào),2014(1):171-121
[4]李白楊.張心源.數(shù)字圖書館建設(shè)中大數(shù)據(jù)問題初探[J].情報(bào)科學(xué).2013(11) 26-29.