文/甘肅農(nóng)業(yè)職業(yè)技術學院 樊惠民
淺析大數(shù)據(jù)對圖書館資源建設的影響
文/甘肅農(nóng)業(yè)職業(yè)技術學院 樊惠民
大數(shù)據(jù)是21世紀的又一信息化產(chǎn)物,伴隨著互聯(lián)網(wǎng)和個人終端的使用,數(shù)據(jù)的采集、分析和使用成了又一焦點話題。圖書館作為知識和信息的載體自古都是以藏書為主,自有文獻記載以來,藏書的種類、數(shù)量一直都是衡量一所圖書館規(guī)模的標桿。在當前信息化時代下,以向用戶提供特定的數(shù)據(jù)服務為目的的高效可用的資源體系構(gòu)建也受到了大數(shù)據(jù)帶來的巨大影響。相比較傳統(tǒng)圖書館,大數(shù)據(jù)的興起使得圖書館數(shù)字資源建設正面臨著巨大的影響和挑戰(zhàn),不僅帶來了數(shù)據(jù)類型的豐富,還為圖書館未來資源的管理,服務的構(gòu)建等提供了導向性的意見。本文通過對圖書館資源建設目標和大數(shù)據(jù)特征的闡述,歸納出在信息時代大數(shù)據(jù)對圖書館建設的影響,特別是圖書館資源建設過程中信息資源種類增多,產(chǎn)生大量半結(jié)構(gòu)化和非結(jié)構(gòu)化的數(shù)據(jù)。進而從三方面分析了伴隨數(shù)據(jù)結(jié)構(gòu)的改變,圖書館資源建設所受到的影響。
大數(shù)據(jù);圖書館;資源建設
圖書館自古都是以藏書為主,自有文獻記載以來,藏書的種類、數(shù)量一直都是衡量一所圖書館規(guī)模的標桿。新中國成立后,藏書建設的概念逐漸豐富與完善,藏書建設到新中國成立后七十年代逐漸形成了一個相對完整的體系,表現(xiàn)為各地區(qū)和學校相繼建立了具備藏書、查詢、借閱等功能的圖書館。隨著社會和經(jīng)濟的發(fā)展,國內(nèi)圖書館之間的各種交流合作增加,原有的藏書服務體系已無法滿足用戶需求,因此在20世紀80年代提出了文獻資源建設的概念。伴隨著智能終端和計算機網(wǎng)絡的普及發(fā)展,數(shù)字化虛擬圖書館的概念應運而生,到了20世紀90年代中期,文獻資源建設體系的弊病逐漸顯露出來,與此同時信息資源建設的概念開始蓬勃發(fā)展。
圖書館資源建設的目標是以向用戶提供特定的數(shù)據(jù)服務為目的的高效可用的資源體系構(gòu)建。我國的圖書館資源建設現(xiàn)已發(fā)展了幾十年,在文獻資源建設和關系型數(shù)據(jù)庫資源建設方面取得了一定的成績,主要集中在大型的綜合數(shù)據(jù)庫和部分自建的特色數(shù)據(jù)庫中。伴隨著全球大數(shù)據(jù)呈現(xiàn)爆發(fā)式增長,大數(shù)據(jù)已經(jīng)滲透到各個行業(yè)和業(yè)務職能領域。在當前圖書館數(shù)字資源的建設過程中,急劇增長的資源建設和多元化的信息服務建設引起圖書館的思考與探究。而大數(shù)據(jù)時代的來臨,使得圖書館數(shù)字資源建設面臨巨大的影響和挑戰(zhàn)。
“大數(shù)據(jù)”的產(chǎn)生學術界普遍認為是繼云計算、物聯(lián)網(wǎng)之后IT產(chǎn)業(yè)的又一次技術革新,會對人類探索和認識世界的思維方式帶來巨大的改變。同時“大數(shù)據(jù)”也是一個用來描述海量的結(jié)構(gòu)化和非結(jié)構(gòu)化數(shù)據(jù)的短語。有著廣泛的分布,包括業(yè)務流程的數(shù)據(jù)、企業(yè)產(chǎn)生的大數(shù)據(jù)、社會發(fā)展的大數(shù)據(jù)、個人生活的大數(shù)據(jù)、科學大數(shù)據(jù)等。利用大數(shù)據(jù),不僅可以在產(chǎn)生、收集和傳遞信息方面精簡人力,提升工作效率,而且在信息分析和推理上形成重大的意義,還可以根據(jù)數(shù)據(jù)的產(chǎn)生趨勢進行正確、有效、有依據(jù)的判斷和決定。通過合理的使用大數(shù)據(jù),可以為決策和個人生活帶來巨大的便利。大數(shù)據(jù)的產(chǎn)生也與以互聯(lián)網(wǎng)技術為標志的信息技術密切相關,其具體的形成過程涉及數(shù)據(jù)挖掘、海量存儲、數(shù)據(jù)分析等。雖然業(yè)界一直沒有對大數(shù)據(jù)進行準確的定義,但對大數(shù)據(jù)的特征可以進行如下的總結(jié):
(一)數(shù)據(jù)量大。隨著互聯(lián)網(wǎng)和移動終端等的不斷發(fā)展,人們的個人信息、網(wǎng)絡社交等各種類型的數(shù)據(jù)呈爆炸式增長,形成了信息量龐大、內(nèi)容不斷更新變化的大數(shù)據(jù)。對圖書館而言,伴隨著信息資源的電子化、用戶訪問和需求數(shù)據(jù)等的快速增加,數(shù)據(jù)量日漸龐大成了必然。
(二)數(shù)據(jù)類型多。數(shù)據(jù)的類型主要指數(shù)據(jù)結(jié)構(gòu)。隨著移動互聯(lián)網(wǎng)的快速普及,移動智能終端和通信工具的發(fā)展,傳感器技術的滲透,數(shù)據(jù)的結(jié)構(gòu)從以前的單一結(jié)構(gòu)化慢慢增加為半結(jié)構(gòu)化和非結(jié)構(gòu)化的形態(tài)。
(三)數(shù)據(jù)流動快。數(shù)據(jù)的流動包括數(shù)據(jù)的創(chuàng)建速度和數(shù)據(jù)的處理速度。大數(shù)據(jù)的一個重要特點就是實時性,實時性是指數(shù)據(jù)的創(chuàng)建速度和處理速度都非??臁K杏脩敉ㄟ^智能終端產(chǎn)生的數(shù)據(jù)都具有流動快的特點,也都屬于實時數(shù)據(jù),因此稱之為流式數(shù)據(jù)。而這類數(shù)據(jù)需要進行及時的采集和處理,這是傳統(tǒng)的數(shù)據(jù)服務系統(tǒng)無法滿足的。
(四)數(shù)據(jù)價值密度低。數(shù)據(jù)價值是進行大數(shù)據(jù)分析和挖掘的目標和意義。數(shù)據(jù)的價值與飛速增長的數(shù)據(jù)量沒有絕對的正比關系,相反伴隨著數(shù)據(jù)量的快速增加,數(shù)據(jù)所具有的價值沒有太大增幅數(shù)據(jù)的價值密度就會降低,因此增加了獲取數(shù)據(jù)中有價值信息的難度。
隨著大數(shù)據(jù)的應用向各行各業(yè)進行滲透,傳統(tǒng)的數(shù)據(jù)管理模式也將面臨重大的革新,特別是在數(shù)據(jù)的來源、存儲、組織、分析和價值利用等方面都將進行革新,而圖書館作為知識和文化的傳播橋梁也會受到影響。這些影響可分為數(shù)據(jù)類型和圖書館資源建設兩方面。
在數(shù)據(jù)類型方面,傳統(tǒng)圖書館數(shù)據(jù)以紙質(zhì)類的圖書和報刊為主,近些年依托網(wǎng)絡和數(shù)字化建設,電子書資源和數(shù)據(jù)庫資源逐漸在豐富,許多紙質(zhì)書籍報刊也都轉(zhuǎn)換為數(shù)字資源,甚至許多音頻和視頻資源也都進行了整理,而這些數(shù)據(jù)資源都屬于結(jié)構(gòu)化的數(shù)據(jù)。隨著互聯(lián)網(wǎng)的發(fā)展,圖書館的數(shù)據(jù)類型也發(fā)生了改變,主要有以下三種數(shù)據(jù):
1.基于社交平臺的半結(jié)構(gòu)化和非結(jié)構(gòu)化數(shù)據(jù)。在社交網(wǎng)絡逐漸成為生活中不可缺少的一部分時,借助大數(shù)據(jù)分析技術可以對社交網(wǎng)絡中產(chǎn)生的半結(jié)構(gòu)化和非結(jié)構(gòu)化數(shù)據(jù)進行收集,分析出當前大部分讀者的愛好和閱讀習慣。為后續(xù)圖書館資源建設和服務開展提供導向性意見。
2.由讀者產(chǎn)生的非結(jié)構(gòu)化數(shù)據(jù)。根據(jù)讀者的各種檢索、查詢、借閱等信息綜合產(chǎn)生的讀者閱讀信息,與讀者所擁有的用戶信息、地理位置信息、瀏覽器信息等數(shù)據(jù)結(jié)合,再配合圖書館所固有的各種電子資源,成了圖書館的大數(shù)據(jù)。通過對這些進行收集、整理形成完整的圖書館大數(shù)據(jù)。
3.政府及相關機構(gòu)發(fā)布的即時信息。這類即時信息的特征是實時性強,主要集中于社會關注的熱點和各行業(yè)的指導信息,大多屬于板結(jié)構(gòu)化和非結(jié)構(gòu)化的。圖書館通過對這類信息進行處理和分析,一方面挖掘這些數(shù)據(jù)的價值,另一方面可以為讀者提供各類即時服務,使讀者獲取更專業(yè)的知識和信息。
數(shù)據(jù)類型的改變也為圖書館資源建設帶來了諸多影響,可以歸結(jié)為以下幾點:
1.核心資源的轉(zhuǎn)移。目前圖書館的核心資源依然是經(jīng)過長時間數(shù)字化形成的各種傳統(tǒng)關系型數(shù)據(jù)庫,但是隨著大數(shù)據(jù)分析處理技術的發(fā)展,數(shù)據(jù)背后的隱藏價值被發(fā)掘和利用,原有的傳統(tǒng)關系型數(shù)據(jù)庫其將發(fā)生重大變化,普通讀者用戶通過各類應用在互聯(lián)網(wǎng)上產(chǎn)生的社交網(wǎng)絡數(shù)據(jù)將取而代之。讀者在使用圖書館數(shù)字資源時產(chǎn)生的訪問數(shù)據(jù),政府、新聞媒體及其他社會機構(gòu)發(fā)布的即時信息等將成為大數(shù)據(jù)背景下圖書館的核心資源。
2.依托大數(shù)據(jù)進行服務質(zhì)量的優(yōu)化。圖書館行業(yè)的競爭本質(zhì)上不局限于館藏信息資源的規(guī)模,還包括對大數(shù)據(jù)信息的挖掘、處理和分析,進行更符合讀者需求的數(shù)字資源建設以保持圖書館在傳播知識和信息領域的核心競爭力。通過大數(shù)據(jù)的分析還可以對圖書館未來發(fā)展提供支持,進行服務質(zhì)量的優(yōu)化和升級。
3.數(shù)據(jù)結(jié)構(gòu)類型更加復雜。傳統(tǒng)圖書館的數(shù)據(jù)以處理關系型數(shù)據(jù)庫的數(shù)據(jù)為主,屬于結(jié)構(gòu)化數(shù)據(jù),而面對類型為半結(jié)構(gòu)和非結(jié)構(gòu)的數(shù)據(jù)時就無從下手。針對半結(jié)構(gòu)和非結(jié)構(gòu)數(shù)據(jù)進行分析、處理和挖掘,獲取這些數(shù)據(jù)可以為圖書館數(shù)字資源建設創(chuàng)造許多有價值的信息。
從上文論述可知,在大數(shù)據(jù)時代,隨著數(shù)據(jù)來源、數(shù)據(jù)類型等的改變,圖書館資源建設也面臨重大變革,主要表現(xiàn)在以下幾方面:
(一)擴大圖書館數(shù)字資源范疇。保留圖書館紙質(zhì)圖書、期刊、報紙等資源的同時,一方面將傳統(tǒng)資源數(shù)字化,并且將一些政府信息、社會關注熱點、信息訪問量大的熱點包括其中,更要將用戶通過圖書館終端搜索、查詢、下載等的行為信息作為資源進行采集。另一方面,要增加對數(shù)據(jù)資源的關聯(lián)和挖掘分析,以形成各類由于的信息,真正擴大數(shù)字資源的范疇。
(二)加強圖書館數(shù)字資源加工深度。數(shù)字資源的組織加工時對數(shù)字資源的整序,是資源的一種知識展現(xiàn)形式。對于數(shù)字信息,結(jié)構(gòu)化的信息所具有的表現(xiàn)形式基本上限制在資源庫內(nèi)部。在大數(shù)據(jù)環(huán)境下,需要將圖書館數(shù)字資源建立語義關聯(lián),形成面向社會資源的圖書館數(shù)字資源組織架構(gòu)。同時,應將信息通過知識解構(gòu)和知識建構(gòu)的方式進行深加工。不僅充分發(fā)揮數(shù)據(jù)發(fā)掘、軟件分析工具的作用,更要特別提升圖書情報領域涉及的主題詞表、分類詞表等的應用和共享能力。
(三)促進圖書館用戶行為信息組織。用戶的行為信息是互聯(lián)網(wǎng)環(huán)境中圖書館所獲得的新的非文獻資源。用戶行為信息可以作為圖書館知識服務與推薦的寶貴資源,通過進行行為信息的深度挖掘和有效組織,能夠做的將用戶行為與文獻資源、目標資源以及其他資源進行關聯(lián),為知識服務個性化提供參考依據(jù)。
(四)提升圖書館網(wǎng)絡設施建設。由于大數(shù)據(jù)處理需要較強的數(shù)據(jù)采集和存儲能力,較高的計算能力,因此對圖書館的IT構(gòu)架提出更高的要求。同時隨著數(shù)據(jù)量的不斷增加,數(shù)據(jù)的類型越來越多,圖書館支持復雜數(shù)據(jù)組織和管理的硬件基礎設施提出了更高的要求。
(五)促進圖書館服務的變革。通過挖掘元數(shù)據(jù)倉儲使得網(wǎng)絡計量學和文獻計量學的某些統(tǒng)計以及評價方法可以擴展,發(fā)展成為便民服務;通過對數(shù)據(jù)信息的挖掘和分析,創(chuàng)建圖書館服務的新模式;對實時數(shù)據(jù)進行分析和決策,發(fā)揮圖書館的智慧導向功能。
圖書館作為知識傳播和推廣的平臺,其資源的建設和有效的利用非常的重要。在大數(shù)據(jù)快速發(fā)展的今天,利用大數(shù)據(jù)理論和技術對圖書館資源庫的建設進行擴展,不僅可以幫助圖書館建設更為豐富完整的資源體系,更可以為讀者提供更加優(yōu)質(zhì)的服務,進一步促進知識和文化的交流。
[1]張興旺.圖書館大數(shù)據(jù)體系構(gòu)建的學術環(huán)境和戰(zhàn)略思考[J].情報資料工作,2013(2):12-17.
[2]劉明,李娜.大數(shù)據(jù)趨勢與專業(yè)圖書館[J].中華醫(yī)學圖書情報雜志,2013,22(2):1-6.
[3]楊海燕.大數(shù)據(jù)時代的圖書館服務淺析[J].圖書與情報,2012(4):120-122.
[4]韓翠峰.大數(shù)據(jù)時代圖書館的服務創(chuàng)新與發(fā)展[J].圖書館,2013(1):121-122.
[5]王捷.大數(shù)據(jù)時代下圖書館開展信息服務的對策[J].現(xiàn)代情報,2013,33(3):81-83.
[6]蘇新寧.大數(shù)據(jù)時代數(shù)字圖書館面臨的機遇和挑戰(zhàn)[J].中國圖書館學報,2015(11):4-12.