張文華
摘 要:隨著云時代的來臨,大數(shù)據(jù)也吸引了越來越多的關(guān)注,大數(shù)據(jù)是信息通信技術(shù)發(fā)展積累至今,按照自身技術(shù)發(fā)展邏輯,從提高生產(chǎn)效率向更高級智能階段的自然生長。無處不在的信息感知和采集終端為我們采集了海量的數(shù)據(jù),而以云計算為代表的計算技術(shù)的不斷進步,為我們提供了強大的計算能力。在大數(shù)據(jù)的環(huán)境下,圖書館的數(shù)據(jù)處理和服務(wù)將會隨著圖書館服務(wù)的創(chuàng)新而發(fā)生重大的改變。
關(guān)鍵詞:大數(shù)據(jù);云計算;圖書館服務(wù)
現(xiàn)在科技的發(fā)展,尤其是大數(shù)據(jù)和云計算時代的到來,影響著每個行業(yè)的發(fā)展。而所謂大數(shù)據(jù),指的是所涉及的資料量規(guī)模巨大到無法通過目前主流軟件工具,在合理時間內(nèi)達到擷取、管理、處理、并整理成為幫助管理者經(jīng)營決策更積極目的的資訊,需要新的處理模式才能具有更強的決策力、洞察發(fā)現(xiàn)力和流程優(yōu)化能力的海量、高增長率和多樣化的信息量。大數(shù)據(jù)通常用來形容一個體系創(chuàng)造的大量非結(jié)構(gòu)化和半結(jié)構(gòu)化數(shù)據(jù),大數(shù)據(jù)分析常和云計算聯(lián)系到一起,因為實時的大型數(shù)據(jù)集分析需要框架來向數(shù)十、數(shù)百或甚至數(shù)千的電腦分配工作。數(shù)據(jù)是很容易與數(shù)字混淆,但二者是截然不同的。數(shù)字是一種符號,用來表示某種特征的程度或狀態(tài)。而數(shù)據(jù)是對客觀事物的邏輯歸納,是信息的表現(xiàn)形式和載體,所以數(shù)據(jù)與信息是分不開的,數(shù)據(jù)是信息的表達,信息是數(shù)據(jù)的內(nèi)涵。大數(shù)據(jù)要求圖書館不僅需要通過結(jié)構(gòu)化數(shù)據(jù)了解現(xiàn)在客戶享受了哪些圖書館服務(wù),從而產(chǎn)生更多非結(jié)構(gòu)化或半結(jié)構(gòu)的用戶數(shù)據(jù),使得數(shù)據(jù)快速增長,也更需要利用大量的非結(jié)構(gòu)化數(shù)據(jù)、半結(jié)構(gòu)化數(shù)據(jù)在圖書館用戶的服務(wù)關(guān)系中去挖掘正在發(fā)生什么、預(yù)測和分析將來會發(fā)生什么,以便對于圖書館的服務(wù)有更進一步的創(chuàng)新和提高。
1.大數(shù)據(jù)環(huán)境的相關(guān)分析和探索
大數(shù)據(jù)環(huán)境不在于掌握龐大的數(shù)據(jù)信息,而在于對這些含有意義的數(shù)據(jù)進行專業(yè)化處理。換言之,如果把大數(shù)據(jù)比作一種產(chǎn)業(yè),那么這種產(chǎn)業(yè)實現(xiàn)盈利的關(guān)鍵,在于提高對數(shù)據(jù)的“加工能力”,通過“加工”實現(xiàn)數(shù)據(jù)的“增值”。所以,“大數(shù)據(jù)”并不是一種新技術(shù)潮流,而是在信息技術(shù)高度發(fā)展之后,人們?nèi)绾伍_發(fā)利用數(shù)據(jù)為社會發(fā)展奠定基礎(chǔ)的過程,是一種基于新工具的新的解決問題思路。大數(shù)據(jù)的價值往往呈現(xiàn)稀疏性。從這點上來講,我國在大數(shù)據(jù)時代還面臨巨大挑戰(zhàn)。我國是目前世界上的人口大國、互聯(lián)網(wǎng)大國、手機大國。這些大國稱號來自于一串串龐大的數(shù)字。然而,在這讓國人為之驕傲的數(shù)字背后,卻隱藏著我國在大數(shù)據(jù)時代的落后現(xiàn)實,目前我國只能算是數(shù)字大國,還不是數(shù)據(jù)大國。造成現(xiàn)狀的原因,一是因為我國的數(shù)據(jù)技術(shù)起步晚,發(fā)展時間短。我國一年的數(shù)據(jù)新增量還不及美國的十分之一,而且以小數(shù)據(jù)集為主。二是缺少收集數(shù)據(jù)的意識。因為數(shù)據(jù)量,數(shù)據(jù)結(jié)構(gòu)的變化引起的。通過對大數(shù)據(jù)環(huán)境下,數(shù)字圖書館信息服務(wù)內(nèi)容變化的描述,嘗試著構(gòu)建基于大數(shù)據(jù)的數(shù)字圖書館信息服務(wù)的模式。
2.大數(shù)據(jù)環(huán)境下的數(shù)字圖書館
圖書館作為學(xué)校輔助教育部門,日常的工作中會產(chǎn)生大量的數(shù)據(jù),數(shù)字圖書館的資源數(shù)據(jù)結(jié)構(gòu)有多種,不光有結(jié)構(gòu)化的數(shù)據(jù)如數(shù)目信息,聲像數(shù)據(jù)等,還有用戶信息、用戶訪問信息以及對用戶的服務(wù)信息過半結(jié)構(gòu)化數(shù)據(jù)和非結(jié)構(gòu)化數(shù)據(jù)。通過對于這些數(shù)據(jù)的分析使數(shù)字圖書館的信息服務(wù)要求在不斷地提高。大數(shù)據(jù)實實在在存在于我們周圍,不管你認(rèn)不認(rèn)識,研不研究,它就在那里,并且發(fā)揮著巨大的作用,推動社會的飛速發(fā)展。得數(shù)據(jù)者得天下,要想迎頭趕上,并走在世界的前列,就必須積極應(yīng)對巨大挑戰(zhàn)。教育,更是如此。數(shù)字圖書館信息服務(wù)是指利用各種技術(shù)對信息資源進行采集、組織、檢索和傳播等業(yè)務(wù)進行處理的一種活動。數(shù)字圖書館對傳統(tǒng)圖書館的資源進行了數(shù)字化,使其更加易于獲取,并采用個人圖書館平臺對圖書館可提供的服務(wù)類型進行整合,提供簡單的信息推送服務(wù),用戶不僅可以得到二次文獻,還可以得到文獻全文以及多媒體信息。
挖掘大數(shù)據(jù)的價值與隱藏在其背后的世界,簡單的定性、定量分析都不能發(fā)揮作用,技術(shù)工具的作用將得到進一步放大。因此,圖書館對技術(shù)、工具的應(yīng)用需求也將更為迫切,這也對圖書館的技術(shù)應(yīng)用水平提出了新的要求、探索和創(chuàng)新。目前,傳統(tǒng)出版業(yè)和圖書館尚在數(shù)字化轉(zhuǎn)型,內(nèi)容數(shù)字化、閱讀數(shù)字化、服務(wù)數(shù)字化和管理信息化等都已經(jīng)進行到不同程度,但是“數(shù)字革命”遠未成功,“大數(shù)據(jù)”又來了。傳統(tǒng)出版業(yè)將面對更艱巨的“從數(shù)字化到數(shù)據(jù)化”——深度信息化轉(zhuǎn)型任務(wù):從內(nèi)容數(shù)字化到內(nèi)容數(shù)據(jù)化、從數(shù)字化閱讀到閱讀數(shù)據(jù)化、從數(shù)字化服務(wù)到服務(wù)數(shù)據(jù)化、從管理信息化到管理數(shù)據(jù)化。這個過程還相當(dāng)漫長,且困難重重——傳統(tǒng)出版業(yè)的數(shù)字化服務(wù)平臺與模式遠未成熟。但我認(rèn)為,出版行業(yè)要抓住大數(shù)據(jù)機遇,首先需要將數(shù)字化進行到底。根據(jù)普華永道咨詢公司最新的全球娛樂和媒體產(chǎn)業(yè)研究報告,全球范圍內(nèi)電子書占全部圖書銷售額的比例將從2012年的9%增長到2017年的22%左右。可見圖書內(nèi)容數(shù)字化的進程尚有時日,況且圖書的數(shù)字化,并不是簡單地將紙質(zhì)圖書掃描成PDF格式這么簡單,就像中文電子書城“字節(jié)社”的宗旨所言:“創(chuàng)造數(shù)字閱讀新境界,提供數(shù)字閱讀新體驗”,僅僅“內(nèi)容數(shù)字化”環(huán)節(jié)還有很大的創(chuàng)新發(fā)展空間。
3.大數(shù)據(jù)時代圖書館的服務(wù)體系的創(chuàng)新
目前大多數(shù)圖書館憑借本館內(nèi)的資源或圖書館聯(lián)盟的圖書、期刊、數(shù)據(jù)庫等資源提供服務(wù),對網(wǎng)絡(luò)上大量的非結(jié)構(gòu)化信息資源較少涉及。通過對技術(shù)的改變和服務(wù)的改善,大數(shù)據(jù)環(huán)境下的圖書館服務(wù)方式、模式和途徑都會發(fā)生改變。隨著大數(shù)據(jù)在日常的生活和科學(xué)研究中發(fā)揮的作用越來越明顯,用戶也渴望通過圖書館統(tǒng)一檢索的平臺獲取對他們有用的各類結(jié)構(gòu)化、非結(jié)構(gòu)化信息。在對于調(diào)整文獻服務(wù)、參考咨詢服務(wù)、學(xué)科服務(wù)以及信息的推送服務(wù)起到重大的改變。為滿足用戶需求,圖書館界有必要對大數(shù)據(jù)展開研究,提供復(fù)雜信息資源分析處理的服務(wù)。在大數(shù)據(jù)環(huán)境下對于信息的分析和處理將成為圖書館的主要業(yè)務(wù),圖書館資源數(shù)據(jù)量的擴展,服務(wù)策咯的改變和質(zhì)量的提升不僅是依靠一些數(shù)據(jù)共享,資源共享,而且還必須從大量數(shù)據(jù)中找出規(guī)律,找出其潛在的價值。事實上,數(shù)據(jù)分析所依賴的大量數(shù)據(jù)資源中,圖書館具有所有權(quán)的數(shù)據(jù)資源數(shù)量比較少,從而成為限制這種服務(wù)發(fā)展的瓶頸。圖書館如何與數(shù)據(jù)庫供應(yīng)商以及其他與用戶相關(guān)聯(lián)的數(shù)據(jù)擁有者合作,共同開發(fā)和維護數(shù)據(jù)資源,將成為圖書館為用戶提供個性化服務(wù)的關(guān)鍵。
大數(shù)據(jù)環(huán)境下,數(shù)字圖書館利用各種技術(shù)對網(wǎng)上的信息資源進行處理,將處理后的數(shù)據(jù)整合在一起形成數(shù)據(jù)倉庫,通過查找數(shù)據(jù)倉庫檢索信息資源來滿足用戶的個性化信息需求。圖書館服務(wù)是其價值體現(xiàn)的核心,也是其存在的價值與意義所在,技術(shù)的發(fā)展與社會的進步都為圖書館服務(wù)的發(fā)展注入了新的活力與動力。(作者單位:長春工程學(xué)院圖書館)
參考文獻:
[1] 孟小峰,慈祥.大數(shù)據(jù)管理:概念、技術(shù)與挑戰(zhàn)[J].計算機研究與發(fā)展,2013(01):146-169.
[2] 何毅.資源發(fā)現(xiàn)知識導(dǎo)航——大數(shù)據(jù)時代圖書館的獅子資源建設(shè)與服務(wù)[J].中國索引,2012(06):23-27.
[3] 張文彥,武瑞原,于潔.大數(shù)據(jù)時代的圖書館初探[J].圖書與情報.2012(06):15-21.
[4] 樊偉紅,李晨暉,張興旺,秦曉珠,郭自寬.圖書館需要怎樣的“大數(shù)據(jù)”[J].圖書館雜志,2012(11):63-71.
[5] 韓翠峰.大數(shù)據(jù)帶給圖書館的影響與挑戰(zhàn)[J].圖書與情報,2012(05): 37-40.