陳臣
〔摘要〕數(shù)字圖書館已進入大數(shù)據(jù)時代。大數(shù)據(jù)時代既給數(shù)字圖書館帶來了機遇,也給數(shù)字圖書館帶來了挑戰(zhàn),如何將零散分布、孤島存儲的圖書館數(shù)字資源融合成完整的“大數(shù)據(jù)”,從中提取出有用的信息,并最終轉(zhuǎn)化為知識和規(guī)則,對于提升數(shù)字圖書館的服務(wù)能力和競爭力十分重要。針對數(shù)字圖書館存在數(shù)據(jù)來源各異、數(shù)據(jù)存儲方式多樣、數(shù)據(jù)形式非結(jié)構(gòu)化等問題,本文對大數(shù)據(jù)時代圖書館數(shù)字資源的重構(gòu)與融合問題進行了研究,提出了基于大數(shù)據(jù)的圖書館數(shù)字資源重構(gòu)與融合策略。該策略有助于對圖書館數(shù)字資源進行整合,可促進數(shù)字資源的共享,有助于加強數(shù)字資源、讀者、系統(tǒng)服務(wù)資源和個性化服務(wù)模式的融合,并最終提升數(shù)字圖書館的綜合服務(wù)能力。
〔關(guān)鍵詞〕大數(shù)據(jù);圖書館;數(shù)字圖書館;數(shù)字資源;重構(gòu)與融合
DOI:10.3969/j.issn.1008-0821.2016.08.002
〔中圖分類號〕G25076〔文獻標識碼〕A〔文章編號〕1008-0821(2016)08-0010-04
〔Abstract〕Digital library has entered the era of big data,when brings opportunities,it also brings challenges.How to integrate digital resource into whole big data from data and information that scattered distribution and fragmentary existence in digital library,extract valuable information from them,translate into useful knowledge and rule,which is important to enhance the service ability and competitiveness of digital library.In view of the issues concerning different data sources,diverse data storage and unstructured data existing in digital library,the paper conducted some research on the reconstruction and integration of digital resources of library In the era of big data,the strategy of digital resources reconstruction and fusion based on big data is put forward.The strategy is helpful for the integration of digital resources in digital libraries,and promoted the sharing of digital resources,and helped strengthen the contact of the digital resources,reader,system service resource,and Personalized service model,so as to enhance the competitiveness of the digital library,ultimately improve the comprehensive service ability of Digital Library.
〔Key words〕big data;library;digital library;digital resources;reconstruction and integration
隨著移動互聯(lián)網(wǎng)技術(shù)、云計算技術(shù)、傳感器網(wǎng)絡(luò)和閱讀終端制造技術(shù)在圖書館服務(wù)中的廣泛應(yīng)用,圖書館數(shù)據(jù)環(huán)境呈現(xiàn)出數(shù)據(jù)海量(Volume)、多樣化(Variety)、快速處理(Velocity)和高價值(Value)的大數(shù)據(jù)4V特性,圖書館已進入大數(shù)據(jù)時代。大數(shù)據(jù)不僅為數(shù)字圖書館的數(shù)據(jù)安全管理、科學(xué)分析、價值融合和數(shù)據(jù)服務(wù)模式變革提供可靠的決策支持,而且其海量、高價值、低獲取成本和高共享特性的數(shù)字資源,已成為讀者知識獲取和對圖書館服務(wù)感知的主要載體,導(dǎo)致讀者對圖書館數(shù)字資源的依賴性隨著數(shù)字資源價值總量的快速增長而不斷加強。因此,如何科學(xué)采購數(shù)字資源、高效自建數(shù)字資源庫、與第三方合作開發(fā)共享資源和合理利用網(wǎng)絡(luò)免費資源等,已成為關(guān)系圖書館服務(wù)能力建設(shè)和讀者閱讀滿意度的重要問題。圖書館界學(xué)者對圖書館數(shù)字資源的知識庫建設(shè)、知識傳播、服務(wù)推送、服務(wù)創(chuàng)新和資源質(zhì)量評估進行了深入的研究。王小立認為個人數(shù)字圖書館資源共享服務(wù)是未來圖書館發(fā)展的一個重要趨勢,其資源共享服務(wù)還面臨著隱私保護、知識產(chǎn)權(quán)等諸多問題[1];劉曉英認為數(shù)字資源融合涉及的技術(shù)問題主要包括數(shù)據(jù)存儲容量問題、數(shù)據(jù)標準問題、數(shù)據(jù)安全問題、數(shù)據(jù)保存問題等;蘇新寧認為應(yīng)從大數(shù)據(jù)的角度考慮數(shù)字圖書館的各類問題,把數(shù)字圖書館完全融入大數(shù)據(jù)之中,借助大數(shù)據(jù)技術(shù)解決數(shù)字圖書館有關(guān)問題[2];劉元珺認為公共圖書館數(shù)字資源評估指標具有關(guān)聯(lián)性、復(fù)雜性和動態(tài)性,公共圖書館不能簡單地聚焦于個別指標的達成[3]。曹寧認為應(yīng)借助數(shù)字資源整合與優(yōu)化,完善數(shù)字資源服務(wù)體系的整體性與有序性,打造服務(wù)平臺與服務(wù)終端的兼容互通與共建共享[4]。劉慧認為,應(yīng)該做到聯(lián)盟內(nèi)的數(shù)字資源聯(lián)合采購的工作,并做好分工,降低數(shù)字資源的重復(fù)率,做到共建共享工作[5]。
1大數(shù)據(jù)環(huán)境下圖書館數(shù)字資源管理的問題與挑戰(zhàn)
11大數(shù)據(jù)環(huán)境下圖書館數(shù)字資源的概念與特點
圖書館數(shù)字資源也稱電子資源,是指圖書館通過計算機技術(shù)、多媒體技術(shù)和通信傳輸技術(shù)等,將信息資源和知識相互融合而形成的數(shù)字表現(xiàn)形式,并通過互聯(lián)網(wǎng)等手段發(fā)布、處理、存取、傳播、收集和利用的數(shù)字信息資源的總和。圖書館數(shù)字資源通常有文字、圖片、聲音、視頻等多種存在類型,圖書館數(shù)字資源庫建設(shè)可采用購買第三方數(shù)字資源、自建數(shù)字資源庫和共享免費的互聯(lián)網(wǎng)資源等方式。與傳統(tǒng)的紙質(zhì)印刷型文獻相比,圖書館數(shù)字資源庫具有信息海量、高價值密度、建設(shè)速度快和投資收益高等優(yōu)點。
大數(shù)據(jù)時代的到來,圖書館數(shù)字資源的結(jié)構(gòu)特點、組織方式和服務(wù)模式發(fā)生了巨大的變化。首先,圖書館數(shù)字資源呈現(xiàn)海量和多類型的特點。大數(shù)據(jù)時代,圖書館的數(shù)字資源除了傳統(tǒng)的電子刊物、電子圖書、音頻與視頻讀物、網(wǎng)絡(luò)OA(辦公自動化)資源外,還包括圖書館數(shù)據(jù)中心系統(tǒng)參數(shù)與運營數(shù)據(jù)、讀者個體特征與閱讀行為數(shù)據(jù)、傳感器網(wǎng)絡(luò)數(shù)據(jù)、視頻監(jiān)控數(shù)據(jù)等,這些大數(shù)據(jù)資源具有海量(Volume)、多數(shù)據(jù)類型(Variety)、高價值(Value)和處理速度快(Velocity)的4V特點[6]。其次,大數(shù)據(jù)時代隨著圖書館計算機數(shù)據(jù)處理和存儲性能的快速增長,圖書館數(shù)字資源產(chǎn)生、發(fā)布、使用和消亡的生命周期大幅度減少,圖書館可通過對數(shù)據(jù)資源的價值二次挖掘、標準化處理和數(shù)據(jù)融合等操作,來提升數(shù)字資源的價值總量和使用時效性。第三,結(jié)合圖書館服務(wù)能力提升和讀者數(shù)字閱讀需求,將數(shù)字資源庫中不同的元數(shù)據(jù)描述統(tǒng)一組織起來形成資源的統(tǒng)一檢索,以及通過對元數(shù)據(jù)層數(shù)據(jù)標準的統(tǒng)一,來實現(xiàn)圖書館內(nèi)部數(shù)字資源知識的關(guān)聯(lián)、融合和二次增值,是大數(shù)據(jù)時代圖書館數(shù)字資源庫建設(shè)面臨的一個挑戰(zhàn)性問題。
12海量數(shù)字資源的長期存儲與可獲取需求
2015年9月23日,國家科技圖書文獻中心(NSTL)邀請國內(nèi)多個圖書館共同發(fā)起簽署《數(shù)字文獻資源長期保存共同聲明》發(fā)布會在京舉行。國家圖書館、中國科學(xué)院文獻情報中心、中國科學(xué)技術(shù)信息研究所、北京大學(xué)圖書館、清華大學(xué)圖書館等近60個文獻信息機構(gòu)的領(lǐng)導(dǎo)和代表出席了發(fā)布會,集體簽署了《數(shù)字文獻資源長期保存共同聲明》,表現(xiàn)出我國圖書館界對數(shù)字文獻資源的國家長期保存具有強烈的愿望[7]。如何構(gòu)建科學(xué)、合理的數(shù)字文獻資源采購機制,實現(xiàn)我國數(shù)字文獻資源的本土長期保存和支持用戶長期可獲取,對于維護我國數(shù)字讀者的閱讀權(quán)益和國家信息安全具有重要意義。
隨著無線寬帶傳輸技術(shù)和終端制造技術(shù)的發(fā)展,讀者可通過移動數(shù)字閱讀終端、手機、平板電腦和臺式電腦開展數(shù)字閱讀活動,數(shù)字閱讀模式多樣化在有效擺脫時間、地域和閱讀方式對讀者束縛的同時,也導(dǎo)致圖書館服務(wù)數(shù)據(jù)、閱讀終端設(shè)備運行數(shù)據(jù)、讀者閱讀關(guān)系數(shù)據(jù)和讀者行為數(shù)據(jù)激增,圖書館傳統(tǒng)的數(shù)據(jù)存儲模式已不能滿足海量大數(shù)據(jù)存儲和檢索的需求,因此,如何利用云計算技術(shù)構(gòu)建超大型元數(shù)據(jù)倉儲,是圖書館實現(xiàn)數(shù)字資源統(tǒng)一聚合與一站式檢索應(yīng)關(guān)注的問題。此外,圖書館大數(shù)據(jù)主要包括用戶服務(wù)數(shù)據(jù)、系統(tǒng)管理與運營數(shù)據(jù)、讀者閱讀關(guān)系與行為數(shù)據(jù)、視頻監(jiān)控數(shù)據(jù)等,這些數(shù)據(jù)具有海量(Volume)、多數(shù)據(jù)類型(Variety)、高價值(Value)和處理速度快(Velocity)的4V特點,其中半結(jié)構(gòu)與非結(jié)構(gòu)化數(shù)據(jù)占據(jù)大數(shù)據(jù)總量的85%以上,如何對多類型數(shù)據(jù)進行標準化處理和有效過濾數(shù)據(jù)噪聲,已成為關(guān)系圖書館大數(shù)據(jù)可用性和大數(shù)據(jù)決策有效性的關(guān)鍵。
13數(shù)字資源的融合管理、聚類和重組問題
(1)圖書館大數(shù)據(jù)資源具有數(shù)據(jù)海量、多類型、關(guān)系復(fù)雜和價值挖掘難度大的特點,如何通過異構(gòu)數(shù)字資源的融合、聚類、重組和挖掘,清晰洞察大數(shù)據(jù)間的復(fù)雜關(guān)系和隱性知識,準確發(fā)現(xiàn)數(shù)字資源間的關(guān)聯(lián)關(guān)系(被引用、引用耦合、作者群相關(guān)性、文獻的使用等),是數(shù)字圖書館從傳統(tǒng)的信息檢索、分類、鏈接和推薦等服務(wù),向大數(shù)據(jù)時代讀者閱讀需求預(yù)測、個性化服務(wù)定制、知識服務(wù)推送、服務(wù)質(zhì)量智能評估與優(yōu)化等轉(zhuǎn)變的前提[8]。
(2)準確、快速、實時和經(jīng)濟是大數(shù)據(jù)時代數(shù)字圖書館服務(wù)的4個關(guān)鍵要素。如何通過數(shù)字資源的融合管理、聚類和重組,并利用知識域可視化技術(shù)描述知識資源及其載體,全面挖掘、分析、構(gòu)建、繪制和顯示知識及它們之間的相互聯(lián)系,是支持圖書館將數(shù)字資源從傳統(tǒng)的數(shù)據(jù)層展示,向信息層、知識層深度揭示轉(zhuǎn)變的有效途徑。
(3)如何通過數(shù)字資源的融合管理、聚類和重組來消除數(shù)據(jù)孤島,實現(xiàn)大數(shù)據(jù)資源的集成、開放、共享和知識融合,是圖書館大數(shù)據(jù)關(guān)系精準發(fā)現(xiàn)和價值二次挖掘有效的保證。圖書館數(shù)字資源的融合管理、聚類和重組過程,在重點關(guān)注歷史數(shù)據(jù)、實時數(shù)據(jù)、不同行業(yè)數(shù)據(jù)、不同空間、不同地域數(shù)據(jù)之間融合的同時,還應(yīng)注重與不同服務(wù)平臺和不同服務(wù)模式的融合,才能增強數(shù)字資源融合、聚類和重組的安全性、可用性、經(jīng)濟性和可靠性。
14構(gòu)建新型圖書館數(shù)字資源采購聯(lián)盟體系的需求
大數(shù)據(jù)時代,構(gòu)建新型圖書館數(shù)字資源采購聯(lián)盟體系對降低我國圖書館數(shù)字資源采購費用,提升我國數(shù)字資源管理安全性和本土長期存儲可用性具有重要的現(xiàn)實意義。CALIS(中國高等教育文獻保障系統(tǒng))是經(jīng)國務(wù)院批準的我國高等教育“211工程”、“九五”、“十五”總體規(guī)劃中3個公共服務(wù)體系之一,通過建設(shè)以中國高等教育數(shù)字圖書館為核心的教育文獻聯(lián)合保障體系,實現(xiàn)了信息資源的共建、共知和共享,為中國的高等教育服務(wù)。從1997年至今,CALIS項目組共組織了近450場海外資源引進活動,使各大高校教學(xué)科研人員在第一時間準確地了解到國際前沿動態(tài),跟蹤和把握國際科研的發(fā)展趨勢,不斷提升了教學(xué)和科研水平[9]。自2010年起,只有獲得中國有關(guān)部門批準的圖書進出口商才能協(xié)助組織國際采購數(shù)據(jù)庫的談判和簽約等相關(guān)工作,CALIS將不再承擔(dān)引進資源集團采購的組織工作,取而代之的是成立DRAA(中國高校圖書館數(shù)字資源采購聯(lián)盟),今后將以DRAA的名義采購海外數(shù)字資源[10]。
當(dāng)前,我國高校和科研機構(gòu)對國外數(shù)據(jù)庫的依賴性不斷增強,2015年我國高校采購各類國外數(shù)據(jù)庫的費用高達32億人民幣。從CALIS和DRAA多年的海外數(shù)據(jù)庫采購工作看,Wiley interScience、IEEE、EBSCO、ProQuest、Sciencedirect、INSPEC、SPRINGER等歐美數(shù)據(jù)庫供應(yīng)商在國際數(shù)據(jù)庫交易上長期把持著話語權(quán),雖然CALIS和DRAA聯(lián)盟采購費用比單獨采購下降了25%~40%,但總費用仍以年均15%的速度快速增長[11]。其次,所采購的資源在資源內(nèi)容和服務(wù)模式上相同,不同高校與科研機構(gòu)不能根據(jù)自身的實際需求在資源采購上進行個性化定制。第三,采購方僅購買了海外數(shù)字資源某一時間段的使用權(quán),而無法將海外資源在我國本土進行長期的存儲和使用。第四,如何構(gòu)建第三方的數(shù)據(jù)庫管理平臺,實現(xiàn)海外資源的存儲、管理、查詢、分析、評估和優(yōu)化,以及在降低我國海外數(shù)據(jù)庫使用成本的前提下提升數(shù)據(jù)庫的安全性、可控性和可用性,也是構(gòu)建我國數(shù)字資源采購聯(lián)盟體系應(yīng)關(guān)注的重點問題。
2基于大數(shù)據(jù)的圖書館數(shù)字資源重構(gòu)與融合策略
21加強圖書館數(shù)字資源大數(shù)據(jù)庫的建設(shè)
首先,大數(shù)據(jù)時代,圖書館應(yīng)轉(zhuǎn)變傳統(tǒng)數(shù)字資源庫建設(shè)以圖書、期刊、專利、學(xué)位論文、報紙、行業(yè)標準規(guī)范、會議論文等為核心的思維,將政府報告數(shù)據(jù)、社會公共熱點信息、網(wǎng)絡(luò)信息、第三方共享信息和讀者行為數(shù)據(jù)等數(shù)字化,依據(jù)數(shù)據(jù)的類型、可用性存儲于圖書館的大數(shù)據(jù)庫之中,以此提升圖書館大數(shù)據(jù)庫資源的價值總量、可用性和數(shù)據(jù)相關(guān)性,確保大數(shù)據(jù)決策科學(xué)、可靠。其次,對大數(shù)據(jù)進行關(guān)聯(lián)、挖掘、融合、分析和深度加工,是圖書館實現(xiàn)從大數(shù)據(jù)——語義關(guān)聯(lián)——知識發(fā)現(xiàn)——知識展示轉(zhuǎn)變的重要途徑[12]。圖書館通過對大數(shù)據(jù)、IT服務(wù)資源、圖書館員和知識的有機整合,可有效提升圖書館的服務(wù)組織效率和服務(wù)能力,實現(xiàn)服務(wù)投資收益率和大數(shù)據(jù)決策最優(yōu)化。第三,如何發(fā)現(xiàn)與構(gòu)建海量復(fù)雜大數(shù)據(jù)之間的相關(guān)性,是圖書館發(fā)現(xiàn)大數(shù)據(jù)中隱性知識和實現(xiàn)大數(shù)據(jù)價值二次增值的關(guān)鍵。圖書館應(yīng)借助語義技術(shù)充分挖掘文獻、作者、引用文章和內(nèi)部知識點之間的語義關(guān)系,為讀者提供智能、高效和個性化的知識服務(wù)。第四,滿足讀者閱讀需求和提升讀者知識獲取效率,是圖書館增強自身服務(wù)能力和保證QOS(服務(wù)質(zhì)量)應(yīng)重點關(guān)注的問題。圖書館大數(shù)據(jù)資源庫建設(shè)應(yīng)以讀者閱讀需求為中心,通過對讀者閱讀行為、閱讀關(guān)系、閱讀模式、閱讀終端參數(shù)等大數(shù)據(jù)的采集、存儲、分析和決策,保證讀者閱讀活動相關(guān)大數(shù)據(jù)分析科學(xué)和閱讀需求預(yù)測精準,為圖書館資源庫建設(shè)及資源整合提供科學(xué)的參考與支持依據(jù)[13]。
22統(tǒng)一圖書館數(shù)字資源大數(shù)據(jù)整合、共享和使用的標準大數(shù)據(jù)時代,圖書館數(shù)字資源整合呈現(xiàn)出政府信息、文獻資源、社會熱點、網(wǎng)絡(luò)數(shù)據(jù)、讀者個體特征等海量數(shù)據(jù)相互融合的特點,其用戶服務(wù)模式也從以文獻資源檢索服務(wù)為中心,向以綜合信息知識決策為中心轉(zhuǎn)變。因此,如何制定新的大數(shù)據(jù)資源整合標準,是關(guān)系圖書館數(shù)字資源組織加工效率、語義相關(guān)性、組織架構(gòu)科學(xué)性和資源知識展現(xiàn)可讀性,以及從文獻資源中完全解析出知識,關(guān)將眾多無關(guān)知識單元之間或與文獻間建立語義關(guān)聯(lián)的關(guān)鍵,也是圖書館發(fā)現(xiàn)知識和產(chǎn)生新的知識的重要途徑[14]。
首先,圖書館應(yīng)統(tǒng)一數(shù)字資源采集、組織、描述、分類、標引、加工、描述、保存、管理、存儲、交換、檢索和服務(wù)的標準,確保數(shù)字資源在編碼格式、著錄方式和數(shù)據(jù)格式上具有統(tǒng)一的標準,并且不同圖書館的信息系統(tǒng)應(yīng)相互兼容和支持互操作,便于圖書館實現(xiàn)數(shù)字資源的跨平臺共享和互操作。其次,統(tǒng)一數(shù)字資源整合、重組和聚合的方式與技術(shù)標準,是圖書館實現(xiàn)數(shù)字資源知識可識別、可讀取和可完全挖掘的前提。因此,應(yīng)通過圖書館聯(lián)盟實現(xiàn)數(shù)字資源管理的“統(tǒng)一平臺、統(tǒng)一標準、統(tǒng)一采集、統(tǒng)一整合、統(tǒng)一發(fā)布、統(tǒng)一共享、統(tǒng)一檢索和統(tǒng)一認證”,保證數(shù)字資源在圖書館之間的無縫連接、完全共享和全面融合。第三,數(shù)字資源的數(shù)據(jù)庫管理、存儲模式、集成與共享方式、傳輸控制、安全保證、數(shù)據(jù)挖掘和資源使用等標準,也是關(guān)系圖書館大數(shù)據(jù)資源可控、可用和經(jīng)濟的重要問題。圖書館聯(lián)盟在大數(shù)據(jù)采集、傳輸、管理和使用標準的制定中,應(yīng)加強數(shù)據(jù)聚類技術(shù)、信息分析技術(shù)和數(shù)據(jù)檢索技術(shù)的建設(shè),堅持以提升讀者個性化閱讀需求發(fā)現(xiàn)和圖書館智能化服務(wù)定制能力為中心,確保數(shù)字資源知識發(fā)現(xiàn)與服務(wù)推送過程安全、高效、經(jīng)濟和可控。
23實現(xiàn)圖書館數(shù)字資源的統(tǒng)一發(fā)現(xiàn)與共享
利用云計算技術(shù)構(gòu)建我國圖書館聯(lián)盟超大型元數(shù)據(jù)私有云倉儲庫,是我國圖書館數(shù)字資源庫安全管理、經(jīng)濟建設(shè)、全面收集和高效使用的重要保證。在圖書館聯(lián)盟超大型元數(shù)據(jù)私有云倉儲庫建設(shè)中,首先應(yīng)注重數(shù)字資源元數(shù)據(jù)標準規(guī)范體系的建設(shè),統(tǒng)一圖書館元數(shù)據(jù)采集模式和質(zhì)量控制的標準,并通過建立科學(xué)的數(shù)據(jù)更新制度來保證元數(shù)據(jù)更新科學(xué)、高效、實時和可持續(xù)。同時,圖書館借助互聯(lián)網(wǎng)對讀者的身份進行認證后,支持讀者訪問圖書館聯(lián)盟云數(shù)據(jù)中心來完成館藏數(shù)字資源的統(tǒng)一查詢、檢索、發(fā)布和下載。
其次,數(shù)字圖書館服務(wù)模式從傳統(tǒng)的集成資源檢索與發(fā)現(xiàn)服務(wù),向海量數(shù)字資源元數(shù)據(jù)的預(yù)加工、融合、價值挖掘和知識推薦服務(wù)轉(zhuǎn)變,是大數(shù)據(jù)時代圖書館聯(lián)盟數(shù)字資源云倉儲庫服務(wù)模式變革的一個重要特征。為了保證云倉儲庫安全、高效、可用和可控,圖書館數(shù)字資源云倉儲庫建設(shè)應(yīng)堅持統(tǒng)一數(shù)據(jù)庫、統(tǒng)一檢索入口、統(tǒng)一集成存儲和個性化服務(wù)定制的原則,實現(xiàn)館內(nèi)數(shù)字資源庫數(shù)據(jù)的全面整合、一站式檢索、相關(guān)性發(fā)現(xiàn)和精準數(shù)據(jù)定位,支持讀者從元數(shù)據(jù)題錄層面完全揭示其隱匿的知識。
第三,當(dāng)前,世界上諸如谷歌、百度等一些具有較強科技實力的互聯(lián)網(wǎng)信息服務(wù)公司,創(chuàng)辦了谷歌學(xué)術(shù)、百度學(xué)術(shù)等免費的統(tǒng)一資源發(fā)現(xiàn)服務(wù)欄目。這些公司具有強大的大數(shù)據(jù)計算、海量數(shù)據(jù)云存儲、海量資源的高度集成及深度加工、優(yōu)質(zhì)的數(shù)據(jù)檢索效果保障等能力,并擁有成熟的統(tǒng)計平臺及用戶行為分析技術(shù),這些互聯(lián)網(wǎng)信息服務(wù)公司通過與世界著名數(shù)據(jù)庫供應(yīng)商一對一的合作資源共享,采用OAI-PMH(元數(shù)據(jù)獲取協(xié)議)的元數(shù)據(jù)收割技術(shù)網(wǎng)絡(luò)攫取,以及充分發(fā)揮自身的搜索引擎技術(shù)優(yōu)勢,利用爬蟲對擬采集數(shù)據(jù)進行發(fā)現(xiàn)、收錄、解析、加工和處理,具有數(shù)字資源發(fā)現(xiàn)精準、高效、快速和免費的特點[15]。因此,圖書館聯(lián)盟可通過與谷歌、百度等公司簽署戰(zhàn)略合作的方式,為圖書館數(shù)字資源庫建設(shè)、知識發(fā)現(xiàn)服務(wù)完善和學(xué)術(shù)評價體系的創(chuàng)新等方面提供服務(wù)支持。
24構(gòu)建基于大數(shù)據(jù)的圖書館數(shù)字資源長期保存體系2013年7月,根據(jù)我國科技部數(shù)字科技文獻資源長期保存工作安排,NSTL正式啟動了我國數(shù)字科技文獻資源長期保存體系建設(shè),并于2014年在其成員單位部署建設(shè)了中國科學(xué)院文獻情報中心和中國科學(xué)技術(shù)信息研究所等兩個國家數(shù)字科技文獻資源長期保存示范系統(tǒng),建立了我國數(shù)字科技文獻資源長期保存的基本規(guī)范體系[16]。但在海外數(shù)字文獻資源的采購、存儲、管理和使用上,NSTL僅采購了海外著名數(shù)字資源庫的限時使用權(quán),這對我國的信息資源安全和海外數(shù)字資源可控性、可用性產(chǎn)生了較大不利影響,因此,如何獲取海外數(shù)據(jù)庫在我國的長期存檔權(quán)、處理權(quán)和服務(wù)權(quán),是我國圖書館聯(lián)盟面臨的一個嚴峻挑戰(zhàn)。
世界上許多發(fā)達國家已從國家信息安全戰(zhàn)略角度開始了E-first(數(shù)字資源優(yōu)先)或者E-only(數(shù)字資源惟一)的文獻資源體系長期保存系統(tǒng)建設(shè),比如荷蘭的國家圖書館已在本館存儲了世界主流出版社的數(shù)字科技期刊;德國建立了DFG國家保存中心體系;加拿大政府支持多倫多大學(xué)建立了國家數(shù)字資源長期保存系統(tǒng)。因此,我國圖書館界應(yīng)在國家相關(guān)部門的領(lǐng)導(dǎo)和支持下,在制定科學(xué)、高效、經(jīng)濟和可行的海外優(yōu)質(zhì)數(shù)字資源本土存儲與管理制度的同時,明確圖書館聯(lián)盟各參與方的責(zé)任、義務(wù)和權(quán)利等,努力提升我國數(shù)字圖書館數(shù)據(jù)中心安全管理、數(shù)據(jù)存儲、遠程傳輸和服務(wù)質(zhì)量保證的能力,才能確保海外資源在我國本土長期存儲、可用和可控。
3結(jié)束語
伴隨大數(shù)據(jù)時代的到來,數(shù)字圖書館的數(shù)字資源組織模式、內(nèi)容結(jié)構(gòu)和服務(wù)方法發(fā)生了深刻的變革,使圖書館擺脫了數(shù)據(jù)類型、時間、空間和閱讀模式對讀者閱讀需求的限制,并以大數(shù)據(jù)科學(xué)決策支持為依據(jù),精確地預(yù)測出讀者的閱讀需求、閱讀場景、閱讀社會關(guān)系和終端類型,可為讀者提供安全、高效、經(jīng)濟和個性化的數(shù)字閱讀推送服務(wù)。但是,隨著云計算技術(shù)、傳感器網(wǎng)絡(luò)技術(shù)、大數(shù)據(jù)技術(shù)和互聯(lián)網(wǎng)技術(shù)在圖書館服務(wù)中的廣泛應(yīng)用,數(shù)字圖書館大數(shù)據(jù)呈現(xiàn)出海量和總量指數(shù)增長的特征,其數(shù)字資源類型呈現(xiàn)多樣、復(fù)雜、難共享和價值挖掘困難的特點。因此,如何基于大數(shù)據(jù)技術(shù)實現(xiàn)數(shù)字資源的重構(gòu)與融合,對于全面挖掘圖書館數(shù)字資源隱匿知識,實現(xiàn)數(shù)字閱讀服務(wù)高效、共享、經(jīng)濟和可控具有重要的意義。
因此,圖書館聯(lián)盟應(yīng)從大數(shù)據(jù)復(fù)雜環(huán)境特點、圖書館服務(wù)能力提升和讀者大數(shù)據(jù)閱讀需求出發(fā),規(guī)范圖書館數(shù)字資源的采集、存儲、傳輸和服務(wù)的標準,統(tǒng)一構(gòu)建一個圖書館數(shù)字資源采購、管理、挖掘、重構(gòu)、整合和共享的大數(shù)據(jù)平臺,不斷增強數(shù)字資源整合、價值發(fā)現(xiàn)、組織加工、分析檢索的廣度與深度,最終實現(xiàn)圖書館數(shù)字資源服務(wù)從傳統(tǒng)的被動、等待和共性化服務(wù),向自動預(yù)測、智能管理和個性化知識推送的服務(wù)模式轉(zhuǎn)變。此外,數(shù)字圖書館在數(shù)字資源的采集、存儲、共享和使用中,還應(yīng)從我國信息資源安全、讀者隱私保護和數(shù)字資源的可用性保證出發(fā),嚴格遵守我國信息安全的相關(guān)標準與法律法規(guī),才能為讀者提供安全、高效、經(jīng)濟和滿意的數(shù)字資源大數(shù)據(jù)閱讀服務(wù)。
參考文獻
[1]Wikipedia.Big data[EB/OL].http:∥cn.wikipedia.org/wiki/Bigdata,3014-11-02.
[2]張興旺,李晨暉,麥范金.變革中的大數(shù)據(jù)知識服務(wù):面向大數(shù)據(jù)的信息移動推薦服務(wù)新模式[J].圖書與情報,2013,(4):74-78.
[3]馬曉亭.基于用戶服務(wù)價值的圖書館大數(shù)據(jù)價值分析與服務(wù)質(zhì)量保證研究[J].圖書館,2014,(5):95-98.
[4]邵慧麗,張帆.基于知識發(fā)現(xiàn)數(shù)字圖書館知識服務(wù)研究[J].圖書館,2016,(2):70-73.
[5]曾子明,金鵬.基于用戶興趣變化的數(shù)字圖書館知識推薦服務(wù)研究[J].圖書館論壇,2016,(1):94-99.
[6]張曉林.機構(gòu)知識庫的發(fā)展趨勢與挑戰(zhàn)[J].現(xiàn)代圖書情報技術(shù),2014,(2):1-7.
[7]季淑娟,王曉麗.高校區(qū)域性聯(lián)合信息咨詢服務(wù)的系統(tǒng)架構(gòu)研究[J].大學(xué)圖書館學(xué)報,2013,(3):74-79.
[8]劉成山,王潔良,秦春秀.一種基于對等云的數(shù)字圖書館架構(gòu)[J].情報理論與實踐,2013,(11):114-117.
[9]中華人民共和國文化部.圖書館數(shù)字資源統(tǒng)計規(guī)范(WH/T 47—2012)[S].北京:國家圖書館出版社,2013.
[10]李彬彬,劉昆雄.我國高校圖書館參考咨詢知識庫建設(shè)現(xiàn)狀調(diào)查與分析[J].圖書館建設(shè),2013,(4):36-40.
[11]王小立.百度“知道”知識傳播對個人數(shù)字圖書館資源共享的啟示[J].圖書館,2016,(2):83-87.
[12]李月琳,梁娜,齊雪.從交互維度到交互功能:構(gòu)建數(shù)字圖書館交互評估理論模型[J].中國圖書館學(xué)報,2016,42(1):66-82.
[13]馬曉亭.大數(shù)據(jù)時代圖書館數(shù)據(jù)可用性:價值、挑戰(zhàn)和保障[J].圖書館理論與實踐,2014,(10):5-8.
[14]白廣思.數(shù)字圖書館大數(shù)據(jù)分類研究[J].圖書館學(xué)研究,2016,(3):53-58.
[15]張興旺,李晨暉.數(shù)字圖書館大數(shù)據(jù)知識服務(wù)體系協(xié)同設(shè)計研究[J].圖書與情報,2015,(3):61-70.
[16]王錳,鄭建明,陳雅.大數(shù)據(jù)環(huán)境下數(shù)字圖書館的基本職能[J].情報資料工作,2015,(3):109-112.
(本文責(zé)任編輯:孫國雷)