譚英
摘 要:隨著大數(shù)據(jù)時代的來臨,在科學(xué)研究、移動互聯(lián)網(wǎng)、傳感網(wǎng)絡(luò)、社交網(wǎng)絡(luò)等應(yīng)用領(lǐng)域,數(shù)據(jù)量正以極快的速度增長,圖書館的 IT 應(yīng)用也不可避免的面臨著大數(shù)據(jù)信息浪潮的沖擊。在大數(shù)據(jù)時代,圖書館將在數(shù)據(jù)存儲、數(shù)據(jù)挖掘、數(shù)據(jù)分析等方面面臨著巨大的挑戰(zhàn)與考驗,復(fù)雜數(shù)據(jù)的處理也將成為大數(shù)據(jù)時代圖書館發(fā)展的主旋律,唯有抓住機遇,克服挑戰(zhàn),才能在新時代涅盤重生。
關(guān)鍵詞:“大數(shù)據(jù)”圖書館;信息資源;技術(shù)路徑;服務(wù)理念
該文分析了未來圖書館的幾個大數(shù)據(jù)主要來源,再結(jié)合圖書館知識服務(wù)及信息化建設(shè)現(xiàn)狀,重點探討了大數(shù)據(jù)將會給圖書館帶來的哪些挑戰(zhàn)與機遇,最后分析了當(dāng)前研究現(xiàn)狀,指出未來大數(shù)據(jù)主要研究熱點。大數(shù)據(jù)可能給圖書館帶來的幫助包括:可以幫助圖書館建立各類知識服務(wù)及業(yè)務(wù)建設(shè)的風(fēng)險模型、圖書館用戶流失分析及價值分析、幫助圖書館建立新型知識服務(wù)引擎、通過分析資源的狀況來預(yù)測可能的資源故障、幫助建立更加智能的網(wǎng)絡(luò)化信息資源智能組合方式、對多維度大數(shù)據(jù)的智能分析及智能輔助決策等。
一、引言
當(dāng)前,期刊論文等文獻信息資源網(wǎng)絡(luò)平臺發(fā)展迅速。比如,中國最大的期刊論文等文獻信息資源網(wǎng)絡(luò)平臺——中國知網(wǎng)資源建設(shè)就由最初的期刊論文逐步擴展到國際和國內(nèi)的論文、期刊、報刊、網(wǎng)絡(luò)資訊、專利成果、行業(yè)和產(chǎn)品標(biāo)準(zhǔn)等資源。不但如此,還收錄了年鑒、工具書海量書籍資源,更是想在教學(xué)市場分一杯羹,形成了全新的教平臺。
萬方數(shù)據(jù)平臺和維普期刊是中國知網(wǎng)強有力的競爭對手。萬方數(shù)據(jù)主要在學(xué)術(shù)論文、行業(yè)和產(chǎn)品標(biāo)準(zhǔn)、專利成果、法規(guī)文獻等方面形成差異化競爭。維普期刊則通過作者或源文件共享的方式獲取海量書籍資源。
這三家期刊論文等文獻信息資源網(wǎng)絡(luò)平臺合計擁有4000多萬篇學(xué)術(shù)論文,文字頁碼總量超過60億頁,已經(jīng)遠遠超過中國國內(nèi)任何一家大型圖書館。在如此宏大的資源面前,中國國內(nèi)的高校圖書館已經(jīng)離不開這些期刊論文等文獻信息資源網(wǎng)絡(luò)平臺。
隨著更多對學(xué)術(shù)、教育、文化、視頻等形式的呈現(xiàn),傳統(tǒng)圖書館在內(nèi)容、數(shù)量、形式等多方面處于競爭劣勢。如何抓住機遇,克服挑戰(zhàn),在競爭中生存下來是當(dāng)前傳統(tǒng)圖書館面臨的最大問題。好在,伴隨著“互聯(lián)網(wǎng)+”的深入發(fā)展,大數(shù)據(jù)時代的到來,為圖書館的發(fā)展帶來了全新的機遇,或許可以涅盤重生。
二、基于大數(shù)據(jù)的圖書館建設(shè)
大數(shù)據(jù)是隨著互聯(lián)網(wǎng)技術(shù)的高速發(fā)展,終端設(shè)備接入的增多,巨大的信息形成海量的數(shù)據(jù),并且在此基礎(chǔ)上能夠提取應(yīng)用的信息資源。在大數(shù)據(jù)時代,唯有借助這一互聯(lián)網(wǎng)的重要資源,深度融入“大數(shù)據(jù)基因,才能更好的提升圖書館的服務(wù)質(zhì)量和水平。
在大數(shù)據(jù)時代,傳統(tǒng)圖書館要逐步向“大數(shù)據(jù)”圖書館轉(zhuǎn)變。應(yīng)當(dāng)從整個互聯(lián)網(wǎng)吸取養(yǎng)分,優(yōu)化和整合資源,提升“大數(shù)據(jù)”圖書館解決復(fù)雜問題的能力。
可以毫不夸張的說,基于互聯(lián)網(wǎng)的信息資源,是圖書館的源頭之水。因此,很長時間以來,圖書館都把資源建設(shè)放在首位。但是其資源范圍僅限于紙質(zhì)媒介。如圖書、報刊、論文、年鑒、報告、專利成果、行業(yè)和產(chǎn)品標(biāo)準(zhǔn)等等。[1]在互聯(lián)網(wǎng)的新時代,“大數(shù)據(jù)”圖書館,不僅要將傳統(tǒng)紙質(zhì)媒介數(shù)字化,或者通過期刊論文等文獻信息資源網(wǎng)絡(luò)平臺的連接擴大數(shù)據(jù)庫的資源。除此以外,還需要將政府公開文件、咨政信息或社會主流熱點匯集、存儲,經(jīng)過關(guān)聯(lián)、挖掘分析形成“大數(shù)據(jù)”圖書館的優(yōu)勢。在以上資源整合的基礎(chǔ)上,應(yīng)該摒棄那種簡單堆積和分類式的資源處理方式。要有決策者的思維,以“大數(shù)據(jù)”圖書館的方式,不僅為用戶提供文獻檢索,還能幫助用戶解決工作和生活中遇到的現(xiàn)實問題,從而提升用戶良好的使用感受。反過來,用戶的檢索和信息咨詢行為,也會成為“大數(shù)據(jù)”圖書館寶貴的資源。將圖書館數(shù)據(jù)與用戶行為數(shù)據(jù)、目標(biāo)資源或其它資源關(guān)聯(lián)起來,從而成為更加高效的知識服務(wù)資源。[2]
三、“大數(shù)據(jù)”圖書館的技術(shù)路徑
隨著互聯(lián)網(wǎng)技術(shù)的深入發(fā)展和更廣泛的應(yīng)用,“大數(shù)據(jù)”圖書館需要處理的數(shù)據(jù)信息不僅數(shù)量大,涵蓋的范圍也更多,主要包括數(shù)據(jù)采集、信息處理、組織架構(gòu)、知識挖掘、分析預(yù)測、結(jié)果呈現(xiàn)、服務(wù)技術(shù)等。從圖書館流程進行分類,則有語義技術(shù)、數(shù)據(jù)聚類技術(shù)、信息分析技術(shù)和檢索技術(shù)。[3]按使用軟件類別分類則有前端分析工具(如SPSS、SAS等);采用Ha-doop分布式文件系統(tǒng)的可靠大數(shù)據(jù)存儲服務(wù)、及基于Map Reduce編程模型的高性能并行大數(shù)據(jù)處理服務(wù)技術(shù);其他諸如Hadoop Common、Chukwa、HBase、Hive、Pig、Zoo Keeper等大數(shù)據(jù)處理添加件、交叉集成件和定制實現(xiàn),均能為圖書館系統(tǒng)提供強大的技術(shù)支持。[4]
四、“大數(shù)據(jù)”圖書館的服務(wù)理念
傳統(tǒng)圖書館的服務(wù)方式基本是文獻資料的檢索,大多是等待和被動式的服務(wù)?!按髷?shù)據(jù)”圖書館的服務(wù)資源已經(jīng)有質(zhì)的飛躍,極大的豐富了圖書館的資源,服務(wù)方式也由被動式轉(zhuǎn)變?yōu)樽灾?。因此,“大?shù)據(jù)”圖書館需要樹立全方位的服務(wù)理念。第一,面向全社會提供服務(wù),即高校和科研院所建立的自有版權(quán)的數(shù)字圖書館內(nèi)容也應(yīng)面向全社會開放,提高資源的使用效率;第二,提供全資源服務(wù),即提供各種類型信息資源的服務(wù),如文獻信息、數(shù)據(jù)庫信息、網(wǎng)絡(luò)信息、視頻信息、分析信息、政策法規(guī)、政府信息等;第三,服務(wù)方式和傳播形式也要進一步改變,即除了提供用戶的自助服務(wù)和簡答資訊以外,還需加強推送服務(wù)、個性化服務(wù),并建立虛擬參考咨詢平臺,除了提供面向固定網(wǎng)絡(luò)的服務(wù),還需提供面向移動網(wǎng)絡(luò)的服務(wù),全面拓展數(shù)字圖書館服務(wù)。[5]
五、結(jié)語
大數(shù)據(jù)的深入發(fā)展為圖書館提供了劃時代的機遇,作為圖書館員也提出了更高的工作標(biāo)準(zhǔn)。每一位館員都需要主動融入“大數(shù)據(jù)”,提升數(shù)據(jù)的采集、分析能力,合理的運用關(guān)鍵技術(shù),熟練的使用數(shù)據(jù)分析工具和相關(guān)軟件,成為期刊論文等文獻資源和網(wǎng)絡(luò)資源的行家里手。
參考文獻:
[1]張春景,劉煒,夏翠娟,等.關(guān)聯(lián)數(shù)據(jù)開放應(yīng)用協(xié)議[J].中國圖書館學(xué)報,2012,38(1):43-48.
[2]陳臣.大數(shù)據(jù)時代基于個性化服務(wù)的數(shù)字圖書館數(shù)據(jù)搜索引擎設(shè)計[J].圖書館理論與實踐,2015(4):91-93-94.
[3]黎春蘭,鄧仲華.信息資源視角下云計算面臨的挑戰(zhàn)[J].圖書與情報,2011(3):23-28.
[4]馮國權(quán).互聯(lián)網(wǎng)思維h圖書館服務(wù)變革探討[J].圖書情報工作,2015(2):25-30,16.
[5]魏群義,袁芳,賈歡,等.我國移動圖書館服務(wù)現(xiàn)狀調(diào)查——以國家圖書館和省級公共圖書館為對象[J].中國圖書館學(xué)報,2014,40(3):50-63.endprint