馮園園
(鐵嶺師范高等專科學校圖書館,遼寧鐵嶺112000)
大數(shù)據(jù)思維下圖書館數(shù)字資源建設與利用研究
馮園園
(鐵嶺師范高等??茖W校圖書館,遼寧鐵嶺112000)
對大數(shù)據(jù)和大數(shù)據(jù)思維進行了闡述,分析了大數(shù)據(jù)時代圖書館數(shù)字館藏資源建設面臨的挑戰(zhàn),指出圖書館存在同質化建設、缺乏完善的資金投入結構、缺乏特色數(shù)字資源服務等問題。研究了大數(shù)據(jù)思維下圖書館數(shù)字資源的建設方法,以及基于大數(shù)據(jù)思維的圖書館數(shù)字資源的合理利用。
大數(shù)據(jù)思維圖書館館藏資源建設利用
物聯(lián)網(wǎng)、移動通訊技術的快速發(fā)展,為網(wǎng)絡用戶獲取發(fā)布數(shù)據(jù)信息提供了便利,而無處不在的智能化終端的應用,也在每時每刻產生大量數(shù)據(jù)。根據(jù)全球互聯(lián)網(wǎng)數(shù)據(jù)中心的監(jiān)測,非結構化網(wǎng)絡數(shù)據(jù)正以每年不低于55%的速度增加,標志著我們已經進入大數(shù)據(jù)時代。數(shù)據(jù)是圖書館開展各項服務的基礎,在提供信息和資源服務的過程中,圖書館也在不斷產生各類數(shù)據(jù)。大數(shù)據(jù)時代顛覆了人們的思維和學習方式,改變了以往以小數(shù)據(jù)為核心解決問題的典型模式,變?yōu)橥ㄟ^對海量數(shù)據(jù)對應關系的深入分析,迅速提取有價值信息的思維模式。大數(shù)據(jù)思維的應用,以感性技術和多源異構數(shù)據(jù)的挖掘分析,激發(fā)人們對生活、學習方式的重新認識,也提升了數(shù)字化資源利用的準確性和便捷性。目前圖書館已有的資源多為歷史文獻、科研資料等,屬于結構化、靜態(tài)的信息,缺少對網(wǎng)絡資源、用戶行為信息以及非正式數(shù)字出版物的搜集與收錄,導致圖書館在數(shù)字館藏資源建設方面的缺失。面對大數(shù)據(jù)時代的嚴峻挑戰(zhàn),圖書館應利用大數(shù)據(jù)思維,對館藏資源建設工作進行重新定位,突破思維慣性構建數(shù)字資源建設方案,提升數(shù)字資源建設效率,進一步完善館藏數(shù)據(jù)信息。
1.1大數(shù)據(jù)時代
大數(shù)據(jù)是在信息技術發(fā)展過程中,為解決信息環(huán)境下難以管理的異構數(shù)據(jù)問題,而提出的一種數(shù)據(jù)處理技術。大數(shù)據(jù)具有規(guī)模龐大、增長變化快、容量大等特征,屬于經過處理具有較高決策力和優(yōu)化能力的信息資產。大數(shù)據(jù)技術的核心在于,通過對海量常規(guī)軟件無法管理數(shù)據(jù)的專業(yè)性分析,可以提升處理后數(shù)據(jù)的價值。2011年美國麥肯錫公司首次應用“大數(shù)據(jù)”一詞,指代超出傳統(tǒng)意義度量的,包括非結構性、結構性和半結構性的數(shù)據(jù)[1]。美國政府于2012年頒布《大數(shù)據(jù)研究和發(fā)展倡議》,計劃在生物醫(yī)學、生態(tài)環(huán)境等領域投入至少兩億美元,為大數(shù)據(jù)研究提供保障。從某種程度上來看,大數(shù)據(jù)屬于前沿技術,能夠從各種類型的數(shù)據(jù)中獲得有用信息,并且具有極大的應用價值。大數(shù)據(jù)是互聯(lián)網(wǎng)高速發(fā)展的產物,隨著數(shù)字信息的爆炸式增長,大數(shù)據(jù)的種類與形式也在不斷擴展。
1.2大數(shù)據(jù)思維的概念
大數(shù)據(jù)時代改變了人們對生活、對世界的理解方式,顛覆了傳統(tǒng)的思維觀念,一切都可以用數(shù)據(jù)進行描繪和觀察。大數(shù)據(jù)技術引發(fā)的思維變革,對傳統(tǒng)思維模式產生了巨大沖擊,更加注重對碎片化信息的整合利用,注重對數(shù)據(jù)信息的視覺化處理和動態(tài)預測。小數(shù)據(jù)屬于簡單科學,大數(shù)據(jù)屬于復雜科學,小數(shù)據(jù)與大數(shù)據(jù)之間存在對應關系,因此可以將大數(shù)據(jù)思維看做復雜性思維。大數(shù)據(jù)思維通過對異構多源數(shù)據(jù)價值的挖掘分析,發(fā)現(xiàn)未知數(shù)據(jù)的內在規(guī)律,能夠引發(fā)人們對生活、工作方式的深入認知。大數(shù)據(jù)思維包含人們對數(shù)據(jù)資源的深入挖掘,對數(shù)據(jù)創(chuàng)新模式的不斷總結,以及對大數(shù)據(jù)應用的理論性指導,旨在激發(fā)大數(shù)據(jù)的利用潛能。
1.3大數(shù)據(jù)思維的特點
大數(shù)據(jù)思維闡釋了大數(shù)據(jù)技術的內在邏輯,具有開放性、動態(tài)性、關聯(lián)性等特征。所有大數(shù)據(jù)都是對外開放的,實現(xiàn)了數(shù)據(jù)的個人獨有到全民共享。對于大數(shù)據(jù)的研究可以不帶任何預設,而是依據(jù)科學的方法和流程進行分析。大數(shù)據(jù)本身是由不同類型的數(shù)據(jù)、數(shù)據(jù)集構成的,打破了基于小數(shù)據(jù)的因果思維模式。在對數(shù)據(jù)信息進行挖掘時,不僅需要關注不同數(shù)據(jù)之間的關聯(lián),也需要關注不同數(shù)據(jù)集之間的間接、復雜的對應關系[2]。大數(shù)據(jù)是動態(tài)變化的,通過先進技術隨時在線采集系統(tǒng)數(shù)據(jù),并且迅速處理分析,可以大致了解系統(tǒng)的動態(tài)演化過程。大數(shù)據(jù)思維融合了統(tǒng)計學的思維觀念,通過對看似雜亂的總體數(shù)據(jù)的研究,能夠發(fā)現(xiàn)數(shù)據(jù)背后隱含的規(guī)律。
大數(shù)據(jù)技術改變了圖書館的服務環(huán)境,要求圖書館提供支持數(shù)據(jù)驅動的服務模式,適應用戶的動態(tài)信息獲取需求,也給圖書館數(shù)字資源建設帶來新的挑戰(zhàn)。
2.1缺乏完善的資金投入結構
我國圖書館在資源建設方面主要依靠政府撥款,部分依靠社會資金投入,籌措資金的渠道相對單一。大數(shù)據(jù)時代圖書館的數(shù)字資源建設,尤其是對海量異構分布信息的挖掘、篩選和利用,需要利用先進技術與設備,與傳統(tǒng)方式相比運維成本更高[3]。雖然數(shù)字資源的獲取更為便利,但是由于涉及到知識版權的鑒定與使用,并且流程相對繁瑣,也需要耗費大量資金。同時政府資金投入無法滿足大數(shù)據(jù)環(huán)境下的資源建設需求,即便是專項大額撥款,也只能滿足圖書館購置軟硬件設備的需求,在數(shù)字資源開發(fā)與持續(xù)利用方面的資金依然短缺。加上很多數(shù)據(jù)庫資源并非免費獲取的,價格也在持續(xù)上漲,導致圖書館無法保障數(shù)字資源的完整性,也影響到數(shù)字資源建設質量。
2.2缺乏特色數(shù)字資源服務
由于很多圖書館將結構化數(shù)字資源的搜集整理作為重點,缺少對非結構化數(shù)據(jù)的挖掘和存儲,導致圖書館存儲的資源類型千篇一律,缺乏深度與廣度,無法滿足用戶對個性化資源的需求。很多圖書館都是基于網(wǎng)絡開放獲取資源,為用戶提供信息檢索、組織與推送服務,極少利用移動通訊網(wǎng)絡、云計算等拓展服務領域,在數(shù)字資源采集整合方面缺乏創(chuàng)新意識,整體服務水平偏低。部分圖書館在數(shù)字館藏資源建設方面,將已有資源的數(shù)字化作為重點,缺少與其他圖書館或信息機構的交流共享,缺乏對海量數(shù)據(jù)進行綜合處理的能力,與個性化、多元化服務需求相差甚遠。
2.3數(shù)字資源同質化現(xiàn)象嚴重
大數(shù)據(jù)環(huán)境下很多圖書館的數(shù)字資源迅速增多,雖然在一定程度上擴展了館藏規(guī)模,但是由于圖書館缺乏科學的數(shù)字資源組織方法,導致建設中存在標準不一、重復建設等問題。在數(shù)字資源建設方面,很多圖書館采用購買成熟數(shù)據(jù)庫、館藏資源數(shù)字化和自建數(shù)據(jù)庫的方式,滿足用戶對數(shù)據(jù)信息的需求。而部分商家為謀求利益對數(shù)字資源進行任意買賣,導致很多數(shù)據(jù)庫的數(shù)據(jù)存在交叉重疊[4]。不僅影響到圖書館的資源建設效率,也導致數(shù)字資源的極大浪費。同時圖書館數(shù)字資源建設存在結構不合理等問題,缺乏對用戶行為信息的敏銳感知,缺乏科學的數(shù)據(jù)資源建設決策,重視對結構化數(shù)據(jù)的整合,而忽視了對非機構化數(shù)據(jù)的采集和長期存儲,很難適應大數(shù)據(jù)時代的需求變化。
大數(shù)據(jù)思維的應用有助于發(fā)現(xiàn)混雜數(shù)據(jù)存在的相互關系,挖掘海量數(shù)據(jù)中隱含的規(guī)律,為圖書館數(shù)字資源建設提供新思路。圖書館可以通過加強基礎設施建設,注重特色館藏資源建設,以及建設公共媒體數(shù)字資源庫的方式,強化大數(shù)據(jù)環(huán)境下的數(shù)字資源建設。
3.1加強圖書館基礎設施建設
互聯(lián)網(wǎng)技術的廣泛應用,使得在線信息檢索工具得到普及,改變了人們的信息獲取方式,更多的用戶傾向于瀏覽、獲取數(shù)字化資源。但是目前我國圖書館依然以印刷型資源為主,對于數(shù)字資源的采集、存儲力度并不大。大數(shù)據(jù)環(huán)境下圖書館應該轉變資源建設模式,通過基礎設施建設,改善數(shù)字館藏資源建設環(huán)境,為海量復雜數(shù)據(jù)的處理和利用創(chuàng)造條件。同時面對大數(shù)據(jù)環(huán)境下異構分布的數(shù)字資源,要求圖書館員了解圖情學、信息技術等綜合知識,具備信息檢索、數(shù)據(jù)挖掘、數(shù)據(jù)組織等能力,掌握與數(shù)字資源建設相關工具的使用方法。圖書館在引進先進技術與設備的基礎上,應該為圖書館員提供培訓學習機會,鼓勵圖書館員參與到科研活動、實踐探索中,或者采用參觀學習、知識講座與學術交流的方式,提升圖書館員的整體素養(yǎng),為圖書館數(shù)字資源的高效管理提供保障。
3.2注重特色館藏資源建設
圖書館結合館藏實際與社會經濟發(fā)展狀況,加強特色數(shù)字館藏資源建設,能夠充分體現(xiàn)自身資源特色,改變圖書館領域“全而不精”的狀態(tài)。圖書館以特色館藏資源建設提供特色服務,可以在館際合作中凸顯優(yōu)勢,也是提升圖書館競爭力的根本所在[5]。利用大數(shù)據(jù)技術對已有資源進行深入分析,發(fā)現(xiàn)本館具有獨特風格的文獻資源,通過對這些文獻資源的數(shù)字化處理,構建具有特色的圖書館數(shù)字資源體系。在依照計劃進行數(shù)字資源建設的同時,圖書館應該將主要精力放在重點學科文獻建設上,合理配置不同學科數(shù)字資源的比例,利用大數(shù)據(jù)技術多方收集具有代表性的文獻資料,如工具書、論著、科研手稿等,保障特色文獻資源的完整性和系統(tǒng)性。
3.3建設公共媒體數(shù)字資源庫
面對大數(shù)據(jù)環(huán)境下眾多公共媒體海量異構分布的數(shù)據(jù),圖書館可以構建覆蓋眾多信息媒介的大數(shù)據(jù)服務系統(tǒng),通過對復雜數(shù)據(jù)的整合處理,為用戶提供便捷、高效的數(shù)據(jù)信息服務。圖書館公共媒體數(shù)字資源庫的建設,首先應該結合圖書館日常運維情況,充分了解用戶對館藏資源建設需求,總結不同層次用戶對數(shù)字資源的利用情況,建立能夠處理海量數(shù)據(jù)且符合需求的資源庫系統(tǒng)。圖書館數(shù)字資源庫的建設,應該具有靈活性和兼容性,能夠對結構化和非機構化數(shù)據(jù)進行統(tǒng)一管理,并且可以滿足個性化服務需求。在建設階段圖書館應該做好用戶調研工作,以用戶、數(shù)據(jù)資源、管理者為主體,綜合多方需求設計具有個性化模式的系統(tǒng)[6]?;诖髷?shù)據(jù)環(huán)境下數(shù)據(jù)庫管理的全生命周期,對系統(tǒng)建設的各個環(huán)節(jié)進行細致分析,具體建設流程如圖1所示。在資源獲取階段,利用大數(shù)據(jù)技術從公共媒體平臺、開放數(shù)據(jù)庫中獲取滿足用戶需求的數(shù)據(jù)資源。然后對數(shù)據(jù)資源進行過濾和整合,在對數(shù)據(jù)關聯(lián)、現(xiàn)象與過程等進行分析的基礎上,遵循一定的準則進行數(shù)據(jù)重構,最后對數(shù)據(jù)資源進行實時分析,使之轉化為可用的知識。
圖1 圖書館公共媒體數(shù)字資源庫建設流程
大數(shù)據(jù)思維突破了數(shù)據(jù)類型與時空限制,能夠通過數(shù)字資源整合實現(xiàn)信息共享,進一步提高數(shù)字資源的利用價值。圖書館可以利用大數(shù)據(jù)思維成立圖書館聯(lián)盟,提升數(shù)據(jù)安全監(jiān)控能力,并在深入挖掘的基礎上開發(fā)全新的服務模式。
4.1提升數(shù)據(jù)安全監(jiān)控能力
互聯(lián)網(wǎng)為我們提供了一個自由展現(xiàn)才華的空間,也是龐大的數(shù)據(jù)資源庫,但是由于信息的開放式傳播,使得數(shù)據(jù)安全問題變得尤為突出。圖書館基于大數(shù)據(jù)思維的數(shù)據(jù)資源庫建設,應該嚴格遵循國家制定的相關數(shù)據(jù)安全法規(guī),加強對數(shù)字資源的安全監(jiān)控,保障數(shù)字資源利用和共享的安全性。同時圖書館應該制定統(tǒng)一的數(shù)字資源利用標準,設計數(shù)據(jù)資源庫安全管理機制,以操作性強、詳細的管理規(guī)范,減少圖書館數(shù)字資源利用中存在的分歧,維持圖書館數(shù)據(jù)的穩(wěn)定運行。定期對圖書館數(shù)字館藏資源進行安全檢查,保障圖書館數(shù)字資源的利用有章可循,減少圖書館數(shù)字資源組織建設中存在的安全漏洞[7]。數(shù)字資源屬于規(guī)模龐大的信息寶庫,通過對數(shù)字資源進行挖掘分析,可以幫助用戶了解學科發(fā)展方向,為科學決策提供參考。圖書館在利用大數(shù)據(jù)技術進行數(shù)據(jù)挖掘的同時,也需要提高圖書館員的數(shù)字資源安全意識。通過圖書館員數(shù)據(jù)安全培訓,使其具備數(shù)據(jù)安全管理的大局觀,在維護圖書館數(shù)字資源安全的基礎上,促進數(shù)字館藏資源建設的良性發(fā)展。
4.2實現(xiàn)館藏資源的聯(lián)合開發(fā)
通過對我國圖書館領域的發(fā)展狀況進行綜合分析,發(fā)現(xiàn)圖書館總體發(fā)展缺乏均衡性,在智能化、數(shù)字化建設方面差距較大。要想實現(xiàn)信息共享工程的目標,需要由技術實力雄厚的圖書館給予其他圖書館技術支持,以技術資源的聯(lián)合管理,促進不同圖書館之間的協(xié)調發(fā)展。大數(shù)據(jù)技術吸引圖書館的一個顯著特點,就是可以實現(xiàn)資源共建共享。多個圖書館通過引進現(xiàn)代化技術,以網(wǎng)絡協(xié)議的方式實現(xiàn)館際合作,不僅可以幫助圖書館收集完整的數(shù)字出版物,也可以更好地滿足用戶需求。要想真正實現(xiàn)數(shù)字資源共享,最大限度利用館藏數(shù)字資源,各圖書館應以聯(lián)盟的形式走資源聯(lián)合開發(fā)道路[8]。應該注意的是,圖書館文獻資源的格式標準,是保障數(shù)字資源建設的質量基礎。協(xié)作圖書館必須制定統(tǒng)一的數(shù)據(jù)規(guī)范,并且建立數(shù)字館藏資源聯(lián)合開發(fā)系統(tǒng)(見圖2)。該系統(tǒng)包括數(shù)字館藏資源聯(lián)合開發(fā)業(yè)務子系統(tǒng)、數(shù)字館藏資源聯(lián)合管理子系統(tǒng)以及數(shù)字館藏資源標準化子系統(tǒng)等,也包括其他業(yè)務子系統(tǒng)。每個子系統(tǒng)分為多個部分,共同承擔圖書館聯(lián)盟開展的數(shù)字館藏聯(lián)合開發(fā)任務。
圖2 圖書館數(shù)字館藏資源聯(lián)合開發(fā)系統(tǒng)框架
4.3開發(fā)全新的圖書館服務模式
大數(shù)據(jù)時代,館藏資源規(guī)模已經不再是評價一個圖書館競爭實力的主要標準,用戶更加關注圖書館的數(shù)據(jù)組織分析能力與知識服務水平。圖書館服務中對隱含知識的分析與轉化能力,成為衡量其服務質量的重要指標。在這樣的環(huán)境下,要求圖書館利用大數(shù)據(jù)思維,積極開發(fā)網(wǎng)絡資源與非正式出版物中隱含的資源,通過對數(shù)據(jù)信息的高效處理轉化,創(chuàng)新圖書館服務模式。一方面,圖書館可以利用多元化的公共媒體數(shù)據(jù)庫,從中獲取有價值的數(shù)據(jù)信息,結合用戶需求提供知識咨詢服務。由于知識咨詢服務要求大量優(yōu)質數(shù)據(jù)提供支撐,并且涉及多個學科領域,單純從圖書館專業(yè)數(shù)據(jù)庫中獲取信息,已經無法滿足用戶對數(shù)據(jù)信息的個性化需求。而不同類型的公共媒體數(shù)據(jù)庫,如微博、人人網(wǎng)等,其中蘊含大量灰色文獻資源,借助大數(shù)據(jù)技術對系統(tǒng)數(shù)據(jù)進行持續(xù)跟蹤和深入挖掘,可為用戶提供非正式渠道獲取的隱含信息,具有可靠性和準確性。大數(shù)據(jù)時代數(shù)據(jù)已經變成一種資產,誰能夠迅速獲取并掌握更多數(shù)據(jù),就能夠獲得發(fā)展的先機。圖書館決策也逐漸由結合實踐經驗,向基于數(shù)據(jù)分析與經驗相結合的方向發(fā)展。通過對用戶行為數(shù)據(jù)進行深入分析,能夠科學預測圖書館領域的發(fā)展動向,輔助圖書館做出正確的決策。大數(shù)據(jù)時代的數(shù)據(jù)分析日益朝著縱深化、多維化、實時化方向轉變,要求圖書館提升對大規(guī)模數(shù)據(jù)信息的掌控能力,利用大數(shù)據(jù)思維分析當前,以更好地適應大數(shù)據(jù)時代的要求存在的問題,并且及時進行調整和創(chuàng)新。
大數(shù)據(jù)時代掀起了廣泛的科學技術革命,顛覆了人們的生活、學習和工作方式,也以先進的數(shù)據(jù)存儲、采集和處理技術促進了大數(shù)據(jù)思維的推廣。大數(shù)據(jù)環(huán)境下圖書館改變了傳統(tǒng)的館藏資源建設模式,在采集整合紙質資源的基礎上,提升了數(shù)字館藏資源開發(fā)和利用力度,并朝著數(shù)字化、網(wǎng)絡化方向發(fā)展。大數(shù)據(jù)思維在圖書館資源整合、效益評估中均有應用,為數(shù)字資源的組織利用提供了技術支持。圖書館應該利用大數(shù)據(jù)思維對館藏資源進行綜合評估,全面掌握用戶信息行為及其動態(tài)變化,并對館藏資源建設效益進行客觀分析,進而不斷提升圖書館資源建設水平。
[1]張馨允.智慧圖書館背景下的館藏資源建設探究[J].蘭臺世界,2016(1):58-60.
[2]劉慧.圖書館館藏資源建設評估研究[J].農業(yè)圖書情報學刊,2015(2):26-31.
[3]楊一凡.館藏資源建設與讀者素質教育淺析[J].科技信息,2012(17):208-209.
[4]張佳麗.大數(shù)據(jù)時代少數(shù)民族地區(qū)高校圖書館館員核心能力研究[J].農業(yè)圖書情報學刊,2015(4):205-208.
[5]譚榮.大數(shù)據(jù)時代高校圖書館信息服務的創(chuàng)新[J].新媒體研究,2015(13):57-58.
[6]李鴻.大數(shù)據(jù)背景下高校圖書館的用戶需求與信息服務[J].中國科技信息,2014(21):79-80.
[7]王楠.大數(shù)據(jù)時代高校圖書館特色信息資源整合研究——以地方信息資源為例[J].科技資訊,2014(21):253.
[8]曾祥文,王華.大數(shù)據(jù)時代高校圖書館信息化建設探討[J].科技創(chuàng)新導報,2013(35):202.
馮園園女,1980年生。碩士,館員。研究方向:圖書館信息自動化。
G253
(2016-07-04;責編:徐向東。)