摘 要:現(xiàn)下圖書館表現(xiàn)出大數(shù)據(jù)的特性。大數(shù)據(jù)于圖書管相關(guān)服務(wù)方面發(fā)揮著協(xié)助功能,但同時(shí)也暴露出一定的不足。圖書館需要聚焦知識(shí)服務(wù)的發(fā)展形勢(shì),通過全新技術(shù)的應(yīng)用完成大數(shù)據(jù)解讀,避免以往知識(shí)服務(wù)的不足,相對(duì)可觀地獲得深層次的大數(shù)據(jù)內(nèi)容,使得圖書館服務(wù)實(shí)現(xiàn)進(jìn)一步開拓。
關(guān)鍵詞:大數(shù)據(jù);圖書館;知識(shí)服務(wù)
1 引言
最近幾年由于互聯(lián)網(wǎng)蓬勃成長(zhǎng)而出現(xiàn)了各式的數(shù)據(jù)形態(tài),既存在以往類型的結(jié)構(gòu)化數(shù)據(jù),還包括眾多半結(jié)構(gòu)化以及非結(jié)構(gòu)化數(shù)據(jù)。種種跡象顯示出了大數(shù)據(jù)的來臨,其代表的是海量數(shù)據(jù)涌入人們的生活,而從內(nèi)容方面來看更是異常豐富,屬于海量數(shù)據(jù)的拓展。處于這一背景之下,圖書館資源表現(xiàn)出了大數(shù)據(jù)的特性,基于數(shù)據(jù)的相關(guān)知識(shí)服務(wù)既獲得了機(jī)會(huì),同時(shí)也迎來了挑戰(zhàn)。圖書館需要盡可能明確大數(shù)據(jù)的長(zhǎng)處以及特征,解讀目前知識(shí)服務(wù)暴露出的問題,研究制定全新的服務(wù)措施,幫助讀者獲得更貼合需求的服務(wù)。
2 大數(shù)據(jù)為圖書館知識(shí)服務(wù)再拓展提供可能
知識(shí)服務(wù)的概念為:依照用戶的要求,有目的的由多類或是顯性或是隱含的資源內(nèi)獲取整合知識(shí),同時(shí)基于此處理用戶提出的深層次問題的整個(gè)環(huán)節(jié)。 [1] 根據(jù)統(tǒng)計(jì)學(xué)來看,追求精準(zhǔn)的成果就要獲取更多的數(shù)據(jù),利用優(yōu)化運(yùn)算的方式可以探索到全新的內(nèi)容。圖書館經(jīng)過多年的沉積,現(xiàn)已展示出大數(shù)據(jù)特征。大數(shù)據(jù)讓圖書館涉及內(nèi)容更加多彩,同時(shí)在運(yùn)算方面速度更快,而投入量相對(duì)降低,這些均導(dǎo)致數(shù)據(jù)量的大幅增加。
除此以外,大數(shù)據(jù)使得數(shù)據(jù)的處理相對(duì)合理精準(zhǔn)。移動(dòng)服務(wù)大面積推廣使得圖書館數(shù)據(jù)豐富,特別是非結(jié)構(gòu)化數(shù)據(jù)。盡管伴隨數(shù)據(jù)呈現(xiàn)出愈加復(fù)雜的勢(shì)頭,但是涉及數(shù)據(jù)類別的豐富,數(shù)據(jù)處理成果的交叉驗(yàn)證隨之提升,因此有助于數(shù)據(jù)處理合理程度以及精準(zhǔn)水平的提升。[2]
3 大數(shù)據(jù)時(shí)代圖書館知識(shí)服務(wù)面臨的挑戰(zhàn)
3.1 數(shù)據(jù)平臺(tái)與安全技術(shù)
圖書館大多涉及的是關(guān)系數(shù)據(jù)庫(kù)平臺(tái),而在常用的RDBMS之中,由新技術(shù)拓展的非結(jié)構(gòu)化數(shù)據(jù)處于弱勢(shì)地位,倘若繼續(xù)使用RDBMS的手法控制非結(jié)構(gòu)化數(shù)據(jù),將導(dǎo)致存儲(chǔ)模塊的流失,過量的數(shù)據(jù)內(nèi)容匯聚于同一數(shù)據(jù)庫(kù)同樣使得數(shù)據(jù)庫(kù)讀寫不順暢。現(xiàn)下大部分圖書館為追求便利的數(shù)據(jù)儲(chǔ)存,因而使用了集中存儲(chǔ)的手段,這將便于圖書館方面明確每一塊工作的落實(shí)狀況,還有讀者使用服務(wù)項(xiàng)目的效果。然而由安全方面入手,此類手法暴露出不足之處。目前圖書館數(shù)據(jù)與個(gè)體的隱私以及知識(shí)產(chǎn)權(quán)息息相關(guān),同時(shí)集中存儲(chǔ)時(shí)常發(fā)生系統(tǒng)漏洞或者不安全因素的產(chǎn)生。同時(shí),大數(shù)據(jù)涉及到的非關(guān)系數(shù)據(jù)的提升表現(xiàn)出非線性特點(diǎn),但是現(xiàn)下圖書館采取的措施大多面向的是線性擴(kuò)增的數(shù)據(jù)。
3.2 分析引擎與知識(shí)發(fā)現(xiàn)
大數(shù)據(jù)分析對(duì)實(shí)時(shí)性提出了嚴(yán)苛的態(tài)度,讀者使用的順暢程度會(huì)作用于圖書館服務(wù)的水平,而圖書館以往數(shù)據(jù)分析水平不足。伴隨圖書館網(wǎng)絡(luò)系統(tǒng)的大規(guī)模推廣以及和讀者越來越多的互動(dòng),動(dòng)態(tài)交互數(shù)據(jù)激增。由于同時(shí)登錄的讀者數(shù)目增加讓數(shù)據(jù)倉(cāng)庫(kù)處理狀況不良,改善服務(wù)器緩存效果同樣無法有效地舒緩此方面壓力。圖書館各代知識(shí)服務(wù)在更新?lián)Q代之后均將造成知識(shí)庫(kù)數(shù)據(jù)源涉及單位的擴(kuò)增,使得其結(jié)構(gòu)愈加復(fù)雜。所以以往的查詢功能朝著多表查詢以及數(shù)據(jù)處理結(jié)合的方面過渡,進(jìn)而數(shù)據(jù)結(jié)構(gòu)于橫向伸縮特性方面達(dá)到需要。而現(xiàn)下的圖書館信息服務(wù)網(wǎng)絡(luò)不具備這一效果。
4 大數(shù)據(jù)時(shí)代圖書館知識(shí)服務(wù)解決方案
4.1 大數(shù)據(jù)物理存儲(chǔ)平臺(tái)
它屬于圖書館大數(shù)據(jù)知識(shí)服務(wù)構(gòu)造的前提,依照不同的要求解讀數(shù)據(jù)儲(chǔ)存措施還有劃分?jǐn)?shù)據(jù)節(jié)點(diǎn)。由于圖書館涉及的數(shù)據(jù)量以及類別范圍的廣闊使得不能通過一致的標(biāo)準(zhǔn)來實(shí)現(xiàn)物理存儲(chǔ)。除去增量方面投入非關(guān)系構(gòu)造HDFS以外,其他部分繼續(xù)保持以往關(guān)系型構(gòu)造,這屬于一類相對(duì)優(yōu)越的手段。關(guān)系型架構(gòu)通過以往的服務(wù)器還有磁盤陣列模式組建而成,再利用RAID加以數(shù)據(jù)重建,把數(shù)據(jù)各自存儲(chǔ)于磁盤陣列內(nèi)部,同時(shí)通過SAN協(xié)議實(shí)現(xiàn)計(jì)算機(jī)以及存儲(chǔ)裝備二者的信息交互。此類手法已經(jīng)充當(dāng)圖書館以往信息服務(wù)手法實(shí)施已久,表現(xiàn)出相對(duì)優(yōu)秀的穩(wěn)定程度自己安全水平。非關(guān)系型架構(gòu)HDFS對(duì)照RAID表現(xiàn)出一些差距,其屬于一類分布型文件系統(tǒng),它的中心環(huán)節(jié)NaneNode 用于控制文件系統(tǒng)涉及的元數(shù)據(jù),以及控制不同數(shù)據(jù)節(jié)點(diǎn)DataNode ,每一DataNode就屬于一個(gè) 機(jī)架,不同的DataNode利用交換機(jī)加以連通,NameNode把數(shù)據(jù)文件劃分放入許多不同的DataNode內(nèi), 同時(shí)于用戶涉及此方面時(shí)把DataNode下的信息匯合在一起呈遞于用戶。HDFS通過TCP/IP協(xié)議實(shí)現(xiàn)具體的連通,此類構(gòu)造手段能夠可觀地通過集群的效果實(shí)現(xiàn)便捷的存儲(chǔ)以及迅速的計(jì)算,可以面向超大數(shù)據(jù)集加以科學(xué)、可行的分布型處理。
4.2 大數(shù)據(jù)采集平臺(tái)
采集平臺(tái)依照?qǐng)D書館使用人員反饋的需要,明確涉及的大數(shù)據(jù)源構(gòu)造同時(shí)進(jìn)行探究,遵循數(shù)據(jù)挑取的規(guī)則,通過專門的語言由數(shù)據(jù)庫(kù)內(nèi)獲得目標(biāo)數(shù)據(jù),同時(shí)面向搜集的數(shù)據(jù)加以深入的處理,最終把獲得的數(shù)據(jù)實(shí)現(xiàn)轉(zhuǎn)換,依照讀者提出的條件進(jìn)行相關(guān)搜索以顯現(xiàn)相關(guān)數(shù)據(jù)。
4.3 大數(shù)據(jù)組織平臺(tái)
大數(shù)據(jù)組織平臺(tái)囊括了關(guān)系型數(shù)據(jù)庫(kù)以及非關(guān)系型數(shù)據(jù)庫(kù)二者。RDBMS具有保障數(shù)據(jù)穩(wěn)定、投入量有限的特點(diǎn),而且其應(yīng)用的比重相對(duì)較高。另一方面,當(dāng)處于非結(jié)構(gòu)化類型時(shí),NOSQL數(shù)據(jù)庫(kù)表現(xiàn)出絕佳的存儲(chǔ)以及管理能力。由于刨除了關(guān)系型數(shù)據(jù)庫(kù)涉及的關(guān)系性,因此這類數(shù)據(jù)庫(kù)構(gòu)造便捷,能夠任意時(shí)間設(shè)置數(shù)據(jù)結(jié)構(gòu)。
5 結(jié)語
由于信息技術(shù)于全球范圍沒推廣,多種數(shù)據(jù)形態(tài)如同雨后春筍一般涌現(xiàn)出來。圖書館作為知識(shí)以及信息的保存以及傳輸?shù)臋C(jī)構(gòu),處于這一時(shí)代背景之下,同樣顯示出了大數(shù)據(jù)的跡象。大數(shù)據(jù)時(shí)代的來臨推動(dòng)了圖書館持續(xù)地實(shí)現(xiàn)自我發(fā)展,但同時(shí)也帶來了相應(yīng)的問題。以往的圖書館服務(wù)手段無法與日益增長(zhǎng)的讀者需求相對(duì)等,本文由此切入,解讀了將大數(shù)據(jù)投入于圖書館服務(wù)的可行性還有問題,并由此著手構(gòu)筑相應(yīng)平臺(tái),為圖書館的持續(xù)進(jìn)步做好鋪墊。
參考文獻(xiàn)
[1]肖強(qiáng),朱慶華.Hadoop環(huán)境下的分布式協(xié)同過濾算法設(shè)計(jì)與實(shí)現(xiàn)[J]現(xiàn)代圖書情報(bào)技術(shù),2013(1):83-89.
[2]李廣建,楊林.大數(shù)據(jù)視角下情報(bào)研究與情報(bào)研究技術(shù)[J].圖書與情報(bào),2012(6):42-44.
作者簡(jiǎn)介
張俠(1969-),女,河南南陽人,研究生,館員,陜西省延安市委黨校圖書館,研究方向:圖書管理。endprint