◎文/趙楠(安徽審計(jì)職業(yè)學(xué)院)
隨著信息時(shí)代的高速發(fā)展以及網(wǎng)絡(luò)通信技術(shù)的日臻成熟,各類(lèi)數(shù)據(jù)呈現(xiàn)出爆炸式的增長(zhǎng)。與此同時(shí),大數(shù)據(jù)的概念被提出并逐漸成為信息集合的代名詞。一般來(lái)說(shuō),大數(shù)據(jù)指的是不能在可容忍的時(shí)間內(nèi)用傳統(tǒng)軟硬件工具和技術(shù)對(duì)其進(jìn)行存儲(chǔ)、管理和應(yīng)用的數(shù)據(jù)集,有體量大、生成快、種類(lèi)多等特征[1]。大數(shù)據(jù)以超出人們想象的速度產(chǎn)生、發(fā)展和積累,引發(fā)了各界對(duì)大數(shù)據(jù)的討論和研究。早期的大數(shù)據(jù)用戶(hù)主要是國(guó)外的互聯(lián)網(wǎng)創(chuàng)業(yè)者,他們依靠分析大數(shù)據(jù)來(lái)精心策劃互聯(lián)網(wǎng)公司及旗下產(chǎn)品,比如國(guó)外的Facebook、谷歌和亞馬遜等互聯(lián)網(wǎng)公司,海量的數(shù)據(jù)集合匯集起來(lái),通過(guò)數(shù)據(jù)的存儲(chǔ)、開(kāi)源軟件的發(fā)布以及分布式計(jì)算,互聯(lián)網(wǎng)企業(yè)從他們收集的數(shù)據(jù)中有效地挖掘了大量的數(shù)據(jù)集并提取有價(jià)值的信息。我國(guó)的大數(shù)據(jù)發(fā)展雖然起步晚些,但是發(fā)展速度快、規(guī)模大,而且在大數(shù)據(jù)應(yīng)用的服務(wù)業(yè)領(lǐng)域現(xiàn)在已經(jīng)走在了世界前列,比如深度挖掘潛在客戶(hù)并精準(zhǔn)投放營(yíng)銷(xiāo)廣告的移動(dòng)互聯(lián)網(wǎng)金融、實(shí)時(shí)匹配用戶(hù)需求的共享出行服務(wù),都是國(guó)內(nèi)大數(shù)據(jù)應(yīng)用發(fā)展的典型案例。
大數(shù)據(jù)時(shí)代對(duì)數(shù)據(jù)存儲(chǔ)、利用方式的巨大轉(zhuǎn)變及其流行趨勢(shì)與廣泛影響,對(duì)致力于成為信息資源共享服務(wù)中心的高校圖書(shū)館形成了強(qiáng)烈的沖擊。高校圖書(shū)館有種類(lèi)多樣的數(shù)據(jù)庫(kù)、電子圖書(shū)期刊以及音視頻資源等,讀者查找資源的選擇變多了,但是所花費(fèi)的時(shí)間也同樣增加,各種資源的有效利用率也有一定程度的下降。圖書(shū)館的信息資源存在廣泛的價(jià)值,但是由于資源的容量巨大而有效資源所占的比例較小導(dǎo)致資源的價(jià)值密度相對(duì)較低。因此,高校圖書(shū)館必須深刻認(rèn)識(shí)和理解大數(shù)據(jù)技術(shù)及其應(yīng)用,對(duì)圖書(shū)館數(shù)據(jù)進(jìn)行充分地采集、分析和挖掘,梳理出讀者對(duì)信息資源的利用需求。高校圖書(shū)館館員需要進(jìn)行服務(wù)轉(zhuǎn)型升級(jí),將被動(dòng)地滿(mǎn)足讀者需求變?yōu)橹鲃?dòng)地迎合讀者需求,了解如何利用大數(shù)據(jù)深度挖掘讀者需求以及引導(dǎo)教科研人員將大數(shù)據(jù)技術(shù)應(yīng)用整合到他們的學(xué)術(shù)、科研中。在大數(shù)據(jù)背景下智慧性、個(gè)性化圖書(shū)館將是高校圖書(shū)館發(fā)展的潮流趨勢(shì),館員將讀者使用圖書(shū)館內(nèi)資源的信息“變廢為寶”,進(jìn)行數(shù)據(jù)整合、分析,根據(jù)讀者的個(gè)人信息和行為習(xí)慣,得出讀者的潛在需求,從而向讀者推送特定的內(nèi)容以方便其使用相關(guān)資源。
高校圖書(shū)館建設(shè)要利用大數(shù)據(jù)技術(shù)的支持,大數(shù)據(jù)技術(shù)運(yùn)用在高校圖書(shū)館的具體業(yè)務(wù)上也要進(jìn)行方法創(chuàng)新。為了更好地加強(qiáng)這兩個(gè)方面的聯(lián)系,現(xiàn)從高校圖書(shū)館資源建設(shè)角度,對(duì)大數(shù)據(jù)背景下高校圖書(shū)館資源現(xiàn)狀進(jìn)行分析思考,并提出解決相應(yīng)問(wèn)題的思路。
資源是圖書(shū)館存在的基礎(chǔ),也是利用大數(shù)據(jù)技術(shù)進(jìn)行高校圖書(shū)館建設(shè)的必不可少的重要因素。但是,隨著信息量的倍增和種類(lèi)繁多的資源出現(xiàn),高校圖書(shū)館在資源使用發(fā)掘、管理應(yīng)用以及構(gòu)建共享平臺(tái)上還存在很多制約大數(shù)據(jù)環(huán)境下圖書(shū)館發(fā)展的瓶頸。
高校圖書(shū)館作為文獻(xiàn)信息中心購(gòu)買(mǎi)了多種類(lèi)型的館藏資源,而圖書(shū)館館員對(duì)已購(gòu)買(mǎi)的資源利用情況只能通過(guò)后臺(tái)查看來(lái)統(tǒng)計(jì)各個(gè)用戶(hù)的使用量情況,對(duì)不同專(zhuān)業(yè)的學(xué)生和教師讀者使用不同種類(lèi)的資源情況還不能做到準(zhǔn)確掌握,不能通過(guò)使用情況有針對(duì)性地提高不同種類(lèi)資源的利用率。圖書(shū)館館員每天面對(duì)的海量數(shù)據(jù)以及不同需求的讀者,如何掌握讀者使用信息的規(guī)律,發(fā)掘各類(lèi)讀者的潛在信息需求,如何給讀者提供個(gè)性化服務(wù),如何給教科研人員提供精準(zhǔn)化的學(xué)科服務(wù)和參考咨詢(xún),這些問(wèn)題顯得越來(lái)越棘手。
在資源管理方面,高校圖書(shū)館每天由于檢索、發(fā)現(xiàn)、傳遞以及使用資源而產(chǎn)生大量的數(shù)據(jù),而一般情況下,讀者進(jìn)行資源傳遞、交流后留下的痕跡信息很快被遺棄。“垃圾是放錯(cuò)了地方的資源”,高校圖書(shū)館每天產(chǎn)生的信息也是如此。一個(gè)數(shù)據(jù)庫(kù)的創(chuàng)建、使用不是一味地進(jìn)行數(shù)據(jù)的疊加才實(shí)現(xiàn)的,而是通過(guò)數(shù)據(jù)之間的關(guān)聯(lián)性,梳理出結(jié)構(gòu)性和非結(jié)構(gòu)性數(shù)據(jù),形成整體的有組織的管理方式。高校圖書(shū)館如何將已使用的數(shù)據(jù)進(jìn)行重新整合、分析,通過(guò)對(duì)訪問(wèn)數(shù)據(jù)的深度挖掘與分析實(shí)現(xiàn)數(shù)據(jù)的回收利用,提供更加貼切、更加精準(zhǔn)的用戶(hù)需求服務(wù),對(duì)“一切以讀者為中心”的圖書(shū)館來(lái)說(shuō)是體現(xiàn)其價(jià)值的重要依據(jù)[2]。
高校圖書(shū)館內(nèi)普遍存在的問(wèn)題是資源和系統(tǒng)種類(lèi)繁多且關(guān)聯(lián)耦合性不強(qiáng),信息孤島問(wèn)題造成的管理和服務(wù)上的不便越來(lái)越明顯。高校教師讀者從事科研和課題研究時(shí),學(xué)生讀者在進(jìn)行畢業(yè)論文撰寫(xiě)時(shí),往往需要查找很多相關(guān)資料,需要使用不同的資源。但是,各種資源種類(lèi)繁多,查找資源費(fèi)時(shí)費(fèi)力,沒(méi)有一個(gè)集中的元數(shù)據(jù)集合,沒(méi)有一種集中平臺(tái)來(lái)實(shí)現(xiàn)各類(lèi)資源的統(tǒng)一檢索、跨庫(kù)檢索,無(wú)法提供一站式的資源檢索服務(wù)平臺(tái)。當(dāng)讀者需要查找資料時(shí),由于資源、數(shù)據(jù)庫(kù)種類(lèi)繁多,需要分別到幾個(gè)甚至更多的數(shù)據(jù)庫(kù)中去登陸、檢索,這樣大大增加了讀者獲取資源的時(shí)間。不便捷的讀者體驗(yàn)也間接降低了各類(lèi)資源的有效利用率,對(duì)以服務(wù)讀者為中心的高校圖書(shū)館來(lái)說(shuō)都是不利因素。
對(duì)用戶(hù)而言,要“按需融合”,將用戶(hù)的特定需求融合到資源使用中,充分掌握讀者使用資源的規(guī)律,發(fā)掘各類(lèi)讀者潛在的使用需求,進(jìn)而給讀者提供個(gè)性化、精準(zhǔn)化的服務(wù)。比如對(duì)不同專(zhuān)業(yè)的學(xué)生來(lái)說(shuō),考取相應(yīng)的職業(yè)資格證書(shū)對(duì)其以后就業(yè)、晉升都有很大幫助,因此以專(zhuān)業(yè)來(lái)區(qū)分不同需求的讀者對(duì)其進(jìn)行相應(yīng)的資源推送,并且通過(guò)其檢索、瀏覽相應(yīng)資源的信息來(lái)挖掘讀者對(duì)相關(guān)資源的掌握情況以便進(jìn)行持續(xù)、跟蹤性地推送。對(duì)于圖書(shū)館的資源來(lái)說(shuō),通過(guò)建立資源的元數(shù)據(jù),對(duì)資源進(jìn)行組織、加工和創(chuàng)新,解決資源之間的散亂和冗余問(wèn)題,進(jìn)而發(fā)現(xiàn)資源之間的潛在關(guān)聯(lián)性,從而創(chuàng)造新的價(jià)值。
從高校圖書(shū)館資源管理的整體角度來(lái)說(shuō),就是構(gòu)建一個(gè)物理分散、邏輯集中、共享共用的統(tǒng)一集群化管理架構(gòu)和大數(shù)據(jù)平臺(tái),為高校圖書(shū)館的決策支持、信息服務(wù)等提供數(shù)據(jù)應(yīng)用支撐,促進(jìn)各類(lèi)資源的共享、協(xié)調(diào)管理。具體實(shí)施上,可以對(duì)高校圖書(shū)館所涉及的所有系統(tǒng)進(jìn)行全面的管理,解決統(tǒng)一認(rèn)證問(wèn)題,用單點(diǎn)登錄代替多點(diǎn)登錄的繁瑣,優(yōu)化用戶(hù)使用流程;對(duì)全館所涉及到的各類(lèi)資源建立統(tǒng)一的資源管理框架,形成數(shù)據(jù)索引庫(kù);對(duì)圖書(shū)館數(shù)字化資產(chǎn)進(jìn)行全面管理,避免資源孤立、信息孤島等問(wèn)題出現(xiàn),并且結(jié)合各種形式的客戶(hù)端技術(shù)將全館所有讀者數(shù)據(jù)進(jìn)行匯總分析,通過(guò)大數(shù)據(jù)技術(shù)加以分析利用,深度挖掘有價(jià)值的數(shù)據(jù)信息,為高校圖書(shū)館建設(shè)和服務(wù)決策提供強(qiáng)大的數(shù)據(jù)支撐。
大數(shù)據(jù)技術(shù)的應(yīng)用就是要讓讀者便捷高效地獲取所需服務(wù)和資源而不受時(shí)間空間限制,甚至在讀者沒(méi)有意識(shí)到的情況下已經(jīng)獲得了服務(wù),高校圖書(shū)館可以通過(guò)搭建“平臺(tái)-支撐-應(yīng)用”三級(jí)智慧化體系結(jié)構(gòu)來(lái)實(shí)現(xiàn)。對(duì)圖書(shū)館整體而言,搭建一個(gè)基礎(chǔ)平臺(tái)來(lái)管理和控制各種數(shù)據(jù)資源是根本,進(jìn)行全館大數(shù)據(jù)的數(shù)據(jù)收集、標(biāo)準(zhǔn)化,對(duì)各類(lèi)多源、異構(gòu)數(shù)據(jù)進(jìn)行有效融合,形成全面、豐富、融合的智慧化體系結(jié)構(gòu)的資源基礎(chǔ);然后組合各個(gè)不同分工的子平臺(tái),提供相應(yīng)的大數(shù)據(jù)分析決策、資源整合、數(shù)據(jù)倉(cāng)儲(chǔ)等系統(tǒng)作為支撐,負(fù)責(zé)高校圖書(shū)館的用戶(hù)信息管理與需求預(yù)測(cè)、資源管理分析等任務(wù);在支撐平臺(tái)的數(shù)據(jù)基礎(chǔ)上,針對(duì)具體的讀者需求展開(kāi)各種具體的信息服務(wù),建立相應(yīng)的個(gè)性化服務(wù)、智能搜索等應(yīng)用系統(tǒng)。因此,高校圖書(shū)館智慧化體系結(jié)構(gòu)應(yīng)該是一種全方位、立體化的,具有主動(dòng)性、人性化、個(gè)性化、泛在化等特點(diǎn)[3]。
大數(shù)據(jù)技術(shù)在我國(guó)高校圖書(shū)館領(lǐng)域的發(fā)展尚處于起步階段,并且由于學(xué)校的規(guī)模和科研水平等原因?qū)е缕湓诟鞲咝5陌l(fā)展程度良莠不齊,但是它為高校圖書(shū)館的資源建設(shè)帶來(lái)了歷史性機(jī)遇是毋庸置疑的。未來(lái)高校圖書(shū)館建設(shè)面臨著諸多未知和挑戰(zhàn),必須不斷創(chuàng)新高校圖書(shū)館的服務(wù)和技術(shù),以大數(shù)據(jù)應(yīng)用來(lái)促進(jìn)新發(fā)展新亮點(diǎn),這也是大數(shù)據(jù)時(shí)代高校圖書(shū)館建設(shè)的研究熱點(diǎn)和方向。