大數據時代,收集信息不是大數據的主要目的,大數據要發(fā)揮應有的作用,就應該從巨量數據信息中分析和整理出有價值的信息。數字圖書館保留了大量數據,基于這些數據,人們可以獲得一些潛在價值,收集和分析這些數據資源是數字圖書館未來面臨的重要問題。
新時代,人們積極構建擁有論文、參考書目、期刊等信息資源的數字圖書館,其目的是實現資源共享,即資源的共同使用,使用戶方便快捷地訪問、獲取不同類型的信息資源。當前,數字圖書館卻面臨發(fā)展困境:和實體圖書館藏書資源和用戶具有同質性、存在半結構化或非結構化數據缺口、缺乏創(chuàng)新激勵、大數據應用無法滿足新的研究需求等。筆者認為,要想實現持續(xù)發(fā)展,數字圖書館必須改善資源結構,在大數據的基礎上豐富服務內容,提高圖書館員素質。
一、大數據時代的數字圖書館
隨著互聯(lián)網的發(fā)展和數據信息容量資源的變化,大數據時代應運而生。事實上,收集信息不是大數據的主要目的,大數據要發(fā)揮應有的作用,就應該從巨量數據信息中分析和處理出有價值的信息。
2009年,基于網絡通信技術和數字處理技術的應用,為提高互聯(lián)網信息的可訪問性,歐洲一些數字圖書館與科研機構合作來研究圖書館和信息科學的關系。為應對大數據時代的挑戰(zhàn),美國2012年正式啟動強制政府與大學、公司合作的大數據研究與發(fā)展計劃。近年來,國內外數字圖書館蓬勃發(fā)展,取得了豐碩成果。許多圖書館,如哈佛大學圖書館,開始使用大數據定期發(fā)布關于讀者閱讀偏好和習慣的大數據成果報告,并密切開展大數據存儲、研究和分析,以更好地滿足不同需求。但是,國內外數字圖書館仍然存在不少缺點,如復制傳統(tǒng)的圖書館功能、缺乏突出特征、信息共享能力不足等,數字圖書館只有不斷突破自身的局限,才能實現快速發(fā)展。
二、大數據背景下數字圖書館面臨的困境
(一)數字圖書館和實體圖書館藏書資源和用戶的同質性
音頻和視頻信息的轉換、數據資源的數字化和存儲等是數字圖書館關注的問題,但其往往缺乏數據收集意識和對海量數據的深度處理和管理。為防止數據缺乏制約長遠發(fā)展,數字圖書館要打造以數據資源為主導的發(fā)展模式。從發(fā)展趨勢來看,數字圖書館必須深入開展數字資源的深入挖掘、收集并分析初始數據,解決圖書館藏書資源的同質性問題。在用戶同質性領域,當前數字圖書館館藏資源的主要內容是圖書館既有資源的數字化內容,再加上一些數字圖書館的系統(tǒng)也不能完全走出物理圖書館的服務范圍,無法完成不同信息領域用戶的共享和使用,導致存在用戶同質化現象。
(二)存在半結構化或非結構化數據缺口
數字圖書館的數據可以分為存儲在數據庫中且可以通過二維表結構表達的結構化數據和網上的常見電子郵件、辦公文檔和各種形式的信息為代表的半結構化或非結構化數據。目前,隨著物聯(lián)網技術等新渠道的發(fā)展,大量的數據日志、電子郵件和網絡新聞等半結構化或非結構化數據信息資源分類涌入數字圖書館,數字圖書館予以收集并處理圖書借閱情況。
部分數字圖書館專注于文獻數據庫的建設,使得半結構化或非結構化數據明顯不足。統(tǒng)計結果顯示,到2012年,互聯(lián)網數據的75%左右是非結構化數據,然而數字圖書館結構化或非結構化數據明顯不足,缺乏大數據信息資源使數字圖書館分析技術發(fā)展滯后,再加上這些存儲在數據庫中且可以通過二維表結構表達的結構化數據沒有經過足夠的大數據分析,使得數字圖書館難以有效地滲透到企業(yè)或融入用戶的詳細服務中。為滿足新時代數字圖書館發(fā)展的需要,更準確地滿足用戶需求,數字圖書館要優(yōu)化資源結構,進一步發(fā)展非結構化數據,并分析這類大數據,找出傳統(tǒng)渠道無法確定的重要關系,增強對用戶的理解,采用智能解決方案更深入鎖定用戶,實現快速發(fā)展。
(三)數字圖書館缺乏創(chuàng)新激勵
當前,國家高度重視以市場為導向的產學研結合的技術創(chuàng)新體系。使任何人都能在任何時間和地點獲得必要的知識是數字圖書館存在的主要意義。但是,目前基于門戶網站服務是大部分存在于象牙塔中的數字圖書館的情況,移動通信、電視網絡、開放的移動圖書館和其他網絡平臺等服務功能,很少有數字圖書館能將其服務范圍擴展至此。我國的數字圖書館仍然缺乏創(chuàng)新思想、活力和創(chuàng)新指導,未能建立與業(yè)務高度融合的真正服務機制,未能及時跟蹤用戶需求和習慣的變化。數字圖書館無法名副其實地存在。
(四)數字圖書館在大數據應用方面無法滿足新的研究需求
隨著協(xié)作創(chuàng)新和第四范式等新概念的出現,研究需求側重于用數字和模擬技術面向問題的本體和數據驅動的探索,對創(chuàng)新有更高要求和對數據科學更為依賴的科研模式的轉變自然對數字圖書館大數據利用的效率提出了更高的要求,在大數據的背景下,數字圖書館需要關注并研究大量數據,以不斷滿足新的研究需求。但是,目前數字圖書館在大數據應用和大數據利用效率方面存在缺陷,難以滿足對對創(chuàng)新有更高要求的科研需求。
三、大數據時代數字圖書館發(fā)展出路
(一)改善資源結構
現階段,一些數字圖書館專注于文獻數據庫建設,使得半結構化或非結構化數據明顯不足。重視結構化數據的作用、相對缺乏非結構化數據的管理是信息社會發(fā)展下數字圖書館建設的弊病。數字圖書館建設當前無法實現各個方面信息資源的數字化,為了實現信息資源的系統(tǒng)化和合理化,保證數字圖書館信息資源的質量,滿足用戶對文化資源各個方面的需求,數字圖書館應該以用戶需求為核心調整信息資源,注意信息資源的數字化整合。在發(fā)展過程中,數字圖書館可以以數字資源的形式記錄某一主題的相關歷史,以數字方式轉換和保存歷史上重要事件的各種數據,并開放數字資源,予以永久保護。
(二)在大數據的基礎上豐富數字圖書館的服務內容
一是提供個性化服務。隨著時代的發(fā)展,數字圖書館可以根據用戶需求提供個性化服務?!皞€人計算機”與“個人計算”有很大差異,在大數據的支持下,為提高數字圖書館的服務質量,“個人計算”可以根據用戶的喜好和特點進行深入分析、預測,推送相應的個性化服務。
二是按需服務。用戶的需求是數字圖書館信息服務的導向。在大數據的背景下,數字圖書館應該通過用戶需求的反饋而不是圖書館使用的資源,管理數據庫資源和網絡資源,使用云計算和傳感器網絡等新技術,創(chuàng)建覆蓋快速、檢索方便、有利于知識挖掘的圖書館信息環(huán)境,傳輸一般知識和有意義信息。
三是智能服務。用科學算法預測是大數據的核心。數字圖書館可以根據研究課題跟進相關文獻資源,基于大數據的預測和分析,掌握該領域的學術趨勢和科研趨勢,方便用戶了解新的熱點研究問題。這種真正意義上的智能服務能幫助傳統(tǒng)知識聚集的圖書館轉變?yōu)橹R的處理和預測場所,為有針對性的科學研究奠定基礎。
(三)注重圖書館員素質的提高
人們需要建立管理數字資源的圖書館管理機構,解決可能存在的知識產權問題。大數據時代,數字圖書館要注重知識版權保護,防患于未然,因此需要具有知識產權保護意識、注重數字資源管理的圖書館管理者。為更好地保護每個公民的基本權利,避免可能存在的知識產權問題,加強對數字資源的保護,圖書館管理者要遵循相關法律法規(guī),規(guī)范規(guī)章制度,與版權公司合作,以增強圖書館員的知識產權保護意識。
(四)關注資金投入
數字圖書館要想提供數字產品和服務,離不開大量的資金投入,資金短缺在數字圖書館建設中時有發(fā)生。大數據時代,健全數字圖書館資本投入體系對數字圖書館的建設相當重要。為促進數字圖書館的可持續(xù)發(fā)展,政府相關部門可以將其當作公益事業(yè),提供一定的資金支持,以更好地保證數字圖書館的資金收支平衡。社會機構也可為數字圖書館的發(fā)展提供一定的資金支持。除了使用公益金外,市場化投資方式也可以為數字圖書館建設與服務模式改善提供充足資金。人們要充分利用各種社會力量,運用各種資金,推進數字圖書館建設,確保數字圖書館實現健康發(fā)展。
(成都師范學院圖書館)
作者簡介:劉聰彪(1982-),男,河南漯河人,碩士,助理館員,研究方向:信息資源管理(圖書館學)。