范家巧
20世紀(jì)末圖書(shū)館學(xué)界開(kāi)始研究數(shù)字資源融合課題,重點(diǎn)以圖書(shū)館資源為研究對(duì)象,對(duì)數(shù)字資源整合問(wèn)題進(jìn)行探討,取得了較多成果。相關(guān)研究側(cè)重于數(shù)字資源整合目標(biāo)、意義、內(nèi)涵、功能、方式、環(huán)境等問(wèn)題研究。大數(shù)據(jù)技術(shù)的出現(xiàn)和發(fā)展為數(shù)字資源整合帶來(lái)了新的機(jī)遇與挑戰(zhàn)。國(guó)外較早開(kāi)展相關(guān)研究,研究?jī)?nèi)容多元化,理論成果豐富。國(guó)內(nèi)外學(xué)術(shù)界共同關(guān)注大數(shù)據(jù)技術(shù)相關(guān)的數(shù)據(jù)挖掘、分析及處理技術(shù),區(qū)別在于國(guó)外更關(guān)注基礎(chǔ)理論及技術(shù)方面問(wèn)題,我國(guó)側(cè)重于具體的應(yīng)用問(wèn)題,探討分析大數(shù)據(jù)技術(shù)對(duì)不同行業(yè)、領(lǐng)域的影響以及應(yīng)用方式[1-5]。數(shù)字資源融合是較受關(guān)注的領(lǐng)域,探討分析數(shù)字圖書(shū)館的資源融合與信息共享問(wèn)題,雖然已經(jīng)取得豐富的理論研究成果,但仍然無(wú)法從根本上克服數(shù)字資源分布分散性、建設(shè)重復(fù)性、利用水平低下等不足,影響了數(shù)字資源的綜合價(jià)值與利用潛力[6-8]。在大數(shù)據(jù)環(huán)境中,圖書(shū)館數(shù)字資源得到新的發(fā)展,類型不斷豐富,總量高速擴(kuò)張。對(duì)圖書(shū)館而言,數(shù)據(jù)資源融合可以理解為數(shù)字資源與大數(shù)據(jù)融合發(fā)展的過(guò)程,是以同一平臺(tái)為基礎(chǔ)的數(shù)據(jù)融合,進(jìn)而實(shí)現(xiàn)平臺(tái)、服務(wù)與技術(shù)的全面融合,在數(shù)據(jù)資源高度共享與充分利用的基礎(chǔ)上,提升服務(wù)質(zhì)量[9]。其特點(diǎn)主要表現(xiàn)在4個(gè)方面:
(1)資源無(wú)縫鏈接。數(shù)字資源融合能夠突破圖書(shū)館數(shù)字資源的時(shí)間與空間局限性,實(shí)現(xiàn)不同圖書(shū)館分散零碎數(shù)據(jù)資源的整合,形成更完善、規(guī)模更龐大的圖書(shū)館大數(shù)據(jù),避免“數(shù)據(jù)孤島”問(wèn)題對(duì)圖書(shū)館數(shù)字資源利用的影響,為不同圖書(shū)館資源共享提供無(wú)縫鏈接的平臺(tái),既提升資源利用率,也為數(shù)據(jù)開(kāi)發(fā)利用提供更有效的支持。
(2)數(shù)據(jù)關(guān)聯(lián)分析。2006年后關(guān)聯(lián)數(shù)據(jù)成為圖書(shū)館領(lǐng)域關(guān)注重點(diǎn),為了優(yōu)化業(yè)務(wù)和服務(wù),圖書(shū)館以大數(shù)據(jù)技術(shù)為基礎(chǔ)開(kāi)展關(guān)聯(lián)分析,分析用戶行為偏好,進(jìn)行用戶畫(huà)像,進(jìn)而分析圖書(shū)館資源與用戶之間的相互關(guān)系,從而對(duì)自身資源分布情況進(jìn)行優(yōu)化,更好地滿足用戶需求。
(3)知識(shí)轉(zhuǎn)化發(fā)現(xiàn)。基于大數(shù)據(jù)技術(shù)的資源融合能夠?qū)D書(shū)館數(shù)字資源進(jìn)行整合,構(gòu)建不同領(lǐng)域的數(shù)據(jù)庫(kù),開(kāi)展數(shù)據(jù)挖掘和數(shù)據(jù)處理,對(duì)整合資源進(jìn)行科學(xué)分析,準(zhǔn)確把握數(shù)據(jù)的內(nèi)在關(guān)聯(lián),幫助用戶構(gòu)建起知識(shí)體系,發(fā)揮關(guān)聯(lián)資源的融合效應(yīng),實(shí)現(xiàn)資源的充分利用和價(jià)值創(chuàng)造。
(4)服務(wù)融合創(chuàng)新。在激烈的競(jìng)爭(zhēng)環(huán)境下,服務(wù)質(zhì)量成為圖書(shū)館發(fā)展關(guān)鍵。為了實(shí)現(xiàn)科學(xué)發(fā)展,服務(wù)功能的拓展與服務(wù)質(zhì)量的提升成為核心工作。圖書(shū)館服務(wù)表現(xiàn)為個(gè)性化、多樣化、定制化等特征,基于大數(shù)據(jù)技術(shù)的綜合服務(wù)成為趨勢(shì)。
在此背景下,如何應(yīng)用大數(shù)據(jù)技術(shù)對(duì)圖書(shū)館數(shù)字資源進(jìn)行高效融合與轉(zhuǎn)化成為值得關(guān)注的問(wèn)題。本文從理論研究層面對(duì)大數(shù)據(jù)技術(shù)背景下的圖書(shū)館數(shù)字資源的特征、發(fā)展模式、創(chuàng)新理念進(jìn)行梳理和總結(jié),對(duì)數(shù)據(jù)共享、信息開(kāi)放、資源融合等理念進(jìn)行闡述,進(jìn)一步完善數(shù)字資源理論的內(nèi)容,以期為圖書(shū)館數(shù)字資源管理與利用模式的科學(xué)創(chuàng)新提供理論依據(jù)。
海量數(shù)據(jù)的有機(jī)融合是數(shù)字資源融合的具體表現(xiàn),是將不同圖書(shū)館所擁有的數(shù)字資源進(jìn)行全部融合,實(shí)現(xiàn)數(shù)據(jù)跨時(shí)間、跨空間的高度融合;是與圖書(shū)館有關(guān)的所有數(shù)據(jù)的統(tǒng)一整合,從而為數(shù)據(jù)挖掘和利用提供充分的數(shù)據(jù)支持,以此實(shí)現(xiàn)數(shù)據(jù)價(jià)值的最大化。基于時(shí)間維度,圖書(shū)館數(shù)字資源的融合是數(shù)據(jù)在時(shí)間層面的積累與整合,是對(duì)過(guò)去、當(dāng)前與未來(lái)數(shù)據(jù)的全面融合;基于空間維度,圖書(shū)館數(shù)字資源的融合是對(duì)不同地區(qū)、不同圖書(shū)館數(shù)據(jù)的全面整合,也是對(duì)資源數(shù)據(jù)、業(yè)務(wù)數(shù)據(jù)、用戶數(shù)據(jù)、行業(yè)數(shù)據(jù)的全面整合。因此,對(duì)于圖書(shū)館而言,數(shù)字資源的整合需要對(duì)不同主體、不同來(lái)源、不同類型的數(shù)據(jù)進(jìn)行融合,是一項(xiàng)復(fù)雜的系統(tǒng)工程。
在大數(shù)據(jù)技術(shù)高速發(fā)展推動(dòng)下,應(yīng)用內(nèi)容不斷豐富,逐漸形成多種不同的技術(shù)體系。不同技術(shù)體系在數(shù)據(jù)處理流程及方法上存在差異,但大致可概括為大數(shù)據(jù)的采集、導(dǎo)入和預(yù)處理、統(tǒng)計(jì)分析、挖掘等4個(gè)不同步驟。具體到圖書(shū)館領(lǐng)域,大數(shù)據(jù)處理同樣基于4個(gè)基本流程完成。通過(guò)上述步驟,能夠簡(jiǎn)單完成數(shù)字資源的融合。但由于圖書(shū)館資源呈現(xiàn)出顯著的服務(wù)特性,使得簡(jiǎn)單的資源融合無(wú)法滿足實(shí)際需求,必須在服務(wù)融合的基礎(chǔ)上保證服務(wù)質(zhì)量,以此滿足用戶不斷提升的服務(wù)需求。基于大數(shù)據(jù)技術(shù)環(huán)境,圖書(shū)館數(shù)字資源融合可采取以下思路:
(1)大數(shù)據(jù)收集。從時(shí)間與空間兩個(gè)維度出發(fā),完成所有數(shù)據(jù)的收集工作,確保數(shù)據(jù)收集的完整性與可靠性。該項(xiàng)工作需要完善的基礎(chǔ)設(shè)施和先進(jìn)的存儲(chǔ)技術(shù),對(duì)存儲(chǔ)容量也有更高的要求。
(2)大數(shù)據(jù)組織加工。圖書(shū)館大數(shù)據(jù)不可避免地存在重復(fù)、冗余、錯(cuò)誤數(shù)據(jù)信息,這會(huì)影響數(shù)據(jù)處理的準(zhǔn)確性與效率。因此,在具體應(yīng)用中,首先需要對(duì)數(shù)據(jù)進(jìn)行預(yù)處理,完成數(shù)據(jù)清洗之后將有效信息導(dǎo)入融合系統(tǒng),并由系統(tǒng)對(duì)數(shù)據(jù)進(jìn)行分類和轉(zhuǎn)換,確保數(shù)據(jù)的適用性與可靠性。
(3)大數(shù)據(jù)分析應(yīng)用。以用戶的特定需求為出發(fā)點(diǎn),一是可以借助大數(shù)據(jù)技術(shù)對(duì)圖書(shū)館的數(shù)字資源進(jìn)行處理,為問(wèn)題的解決提供依據(jù);二是在未提前明確需求的基礎(chǔ)上,借助數(shù)據(jù)挖掘技術(shù)對(duì)大規(guī)模數(shù)據(jù)進(jìn)行分析,從中挖掘潛在價(jià)值,從而為圖書(shū)館各項(xiàng)業(yè)務(wù)提供科學(xué)指導(dǎo),也以大數(shù)據(jù)服務(wù)的形式滿足用戶的需求。
圖1 數(shù)字資源融合轉(zhuǎn)化體系
大數(shù)據(jù)技術(shù)環(huán)境下,圖書(shū)館資源融合的主要內(nèi)容可以分為數(shù)據(jù)、平臺(tái)與服務(wù)等3個(gè)層面上的要素融合,從而構(gòu)建起資源高度共享與利用的交互平臺(tái)。具體而言,資源融合的基礎(chǔ)為數(shù)據(jù)融合,關(guān)鍵技術(shù)環(huán)節(jié)為平臺(tái)融合,最終目標(biāo)則是不同圖書(shū)館的服務(wù)融合。數(shù)據(jù)融合能實(shí)現(xiàn)海量異構(gòu)數(shù)據(jù)在同一平臺(tái)上的融合,并在此基礎(chǔ)上構(gòu)建起圖書(shū)館的業(yè)務(wù)與服務(wù)平臺(tái),為用戶提供更加全面高效的信息服務(wù),提升自身的競(jìng)爭(zhēng)力[10]?;诖髷?shù)據(jù)技術(shù)的資源融合與轉(zhuǎn)化過(guò)程如圖1所示。
在數(shù)據(jù)融合層,資源融合的對(duì)象是不同圖書(shū)館所擁有的不同的數(shù)字資源,上述數(shù)字資源以原始資源的形式作為融合對(duì)象,針對(duì)不同圖書(shū)館數(shù)據(jù)資源的分散、異構(gòu)等問(wèn)題,通過(guò)科學(xué)有效的方法對(duì)其進(jìn)行處理,構(gòu)建起數(shù)據(jù)資源充分融合與高度共享的體系,以此滿足用戶的資源查詢與處理需求。圖書(shū)館的原始數(shù)據(jù)資源主要包括資源數(shù)據(jù)、業(yè)務(wù)數(shù)據(jù)、用戶數(shù)據(jù)、行業(yè)數(shù)據(jù)等,涉及圖書(shū)館、用戶、外部機(jī)構(gòu)等多個(gè)主體。在圖書(shū)館數(shù)字資源融合過(guò)程中,則需要重點(diǎn)解決相關(guān)數(shù)據(jù)的公開(kāi)性與安全性問(wèn)題,在充分保護(hù)用戶數(shù)據(jù)安全的基礎(chǔ)上,盡可能提升數(shù)據(jù)的共享水平和利用效率[11]。此外,為了確保數(shù)據(jù)資源融合的充分性與可靠性,必須針對(duì)數(shù)據(jù)龐大、并發(fā)程度高等現(xiàn)實(shí)問(wèn)題,構(gòu)建一個(gè)多中心、多層次的綜合型數(shù)據(jù)平臺(tái),實(shí)現(xiàn)數(shù)據(jù)資源的集中管理,對(duì)不同區(qū)域、不同圖書(shū)館、不同類型的數(shù)字資源進(jìn)行集中存放和統(tǒng)一管理,并基于元數(shù)據(jù)實(shí)現(xiàn)不同數(shù)據(jù)的科學(xué)關(guān)聯(lián)。
在大數(shù)據(jù)技術(shù)實(shí)現(xiàn)過(guò)程中,需要良好的基礎(chǔ)設(shè)施與處理技術(shù)才能確保大數(shù)據(jù)的充分利用,因此首先需要解決技術(shù)問(wèn)題,才能為圖書(shū)館數(shù)字資源融合提供支持。圖書(shū)館大數(shù)據(jù)存在來(lái)源廣、規(guī)模大、異構(gòu)性、復(fù)雜性等特點(diǎn),圖書(shū)館資源融合面臨較大的困難,無(wú)論是數(shù)據(jù)的采集、加工、處理還是應(yīng)用,各個(gè)環(huán)節(jié)都比較困難,導(dǎo)致數(shù)據(jù)融合的風(fēng)險(xiǎn)較高,實(shí)施效果得不到充分保證?;诖髷?shù)據(jù)技術(shù)環(huán)境,圖書(shū)館數(shù)字資源的融合必須以最新、最先進(jìn)的數(shù)據(jù)處理技術(shù)為基礎(chǔ),通過(guò)數(shù)據(jù)采集、數(shù)據(jù)挖掘、數(shù)據(jù)存儲(chǔ)、云計(jì)算、可視化技術(shù)、知識(shí)發(fā)現(xiàn)等技術(shù)共同完成數(shù)據(jù)資源的融合,為資源融合平臺(tái)的構(gòu)建提供充分的數(shù)據(jù)支持,從而實(shí)現(xiàn)良好的數(shù)據(jù)共享[12]。
圖書(shū)館龐大的數(shù)據(jù)資源能夠充分滿足圖書(shū)館的數(shù)據(jù)服務(wù)需求并保證圖書(shū)館的服務(wù)質(zhì)量,而良好的數(shù)據(jù)服務(wù)也是圖書(shū)館資源融合的目標(biāo)所在?;诖髷?shù)據(jù)技術(shù)環(huán)境,數(shù)據(jù)挖掘、數(shù)據(jù)分析是最基本、最核心的業(yè)務(wù),也是大數(shù)據(jù)應(yīng)用的關(guān)鍵環(huán)節(jié)。對(duì)于圖書(shū)館而言,數(shù)字資源的融合是大勢(shì)所趨,只有實(shí)現(xiàn)良好的數(shù)字融合,才能夠真正發(fā)揮其資源優(yōu)勢(shì),提升圖書(shū)館的用戶服務(wù)水平,滿足現(xiàn)代用戶對(duì)數(shù)據(jù)資源的多樣性、個(gè)性化需求,從而充分挖掘資源價(jià)值。基于大數(shù)據(jù)技術(shù)應(yīng)用,能夠?qū)崿F(xiàn)對(duì)海量數(shù)字資源的科學(xué)整合與高效利用,并且在數(shù)據(jù)分析的基礎(chǔ)上準(zhǔn)確把握用戶需求,從而實(shí)現(xiàn)數(shù)據(jù)服務(wù)的個(gè)性化與精準(zhǔn)化,并通過(guò)數(shù)據(jù)挖掘、關(guān)聯(lián)分析、知識(shí)發(fā)現(xiàn)等技術(shù)方法不斷挖掘數(shù)字資源的潛在價(jià)值,更好的滿足用戶的資源需求,從而積極有效地提升圖書(shū)館的整體服務(wù)質(zhì)量,為圖書(shū)館的科學(xué)發(fā)展奠定良好基礎(chǔ),以此實(shí)現(xiàn)圖書(shū)館數(shù)字資源融合的快速與穩(wěn)定發(fā)展。
重組網(wǎng)絡(luò)數(shù)據(jù)資源,對(duì)圖書(shū)館的知識(shí)資源進(jìn)行科學(xué)加工,挖掘知識(shí)資源的潛在價(jià)值并實(shí)現(xiàn)知識(shí)創(chuàng)新?;谠獢?shù)據(jù)技術(shù),在完成本體的創(chuàng)建工作之后,可通過(guò)圖書(shū)館的原始數(shù)據(jù)對(duì)本體進(jìn)行處理,實(shí)現(xiàn)數(shù)據(jù)資源的概念化與標(biāo)準(zhǔn)化轉(zhuǎn)換,并實(shí)現(xiàn)基于元數(shù)據(jù)標(biāo)簽的數(shù)據(jù)聯(lián)結(jié),以此完成數(shù)據(jù)融合工作并充分保證數(shù)據(jù)融合的完整性與全面性。與此同時(shí),數(shù)據(jù)聯(lián)結(jié)可以通過(guò)不同維度的方式進(jìn)行關(guān)聯(lián),即表現(xiàn)為語(yǔ)義關(guān)系網(wǎng)絡(luò)的建構(gòu)過(guò)程,經(jīng)過(guò)映射后數(shù)據(jù)資源能夠建成集中網(wǎng)絡(luò)系統(tǒng),可以讓用戶的數(shù)據(jù)需求更好地得到調(diào)取與滿足,通過(guò)潛在語(yǔ)義網(wǎng)絡(luò)對(duì)數(shù)據(jù)資源進(jìn)行挖掘和處理,從而實(shí)現(xiàn)知識(shí)創(chuàng)造并提升數(shù)據(jù)資源的價(jià)值。
這是利用主題內(nèi)容將語(yǔ)詞進(jìn)行表達(dá)的文獻(xiàn)信息組織檢索的方式,可以利用大數(shù)據(jù)環(huán)境來(lái)實(shí)現(xiàn)有效應(yīng)用。這種形式的資源融合可以將主題詞作為核心,將相關(guān)圖書(shū)館數(shù)字信息進(jìn)行資源融合。根據(jù)圖書(shū)館中已有的資源數(shù)據(jù)信息,將相關(guān)數(shù)據(jù)實(shí)現(xiàn)完整融合,對(duì)于用戶來(lái)說(shuō),可以利用相關(guān)的關(guān)鍵詞,快速并模糊地找到檢索信息。對(duì)于圖書(shū)館大數(shù)據(jù)業(yè)務(wù)信息來(lái)說(shuō),利用某種具體業(yè)務(wù)作為核心主題,能夠?qū)崿F(xiàn)數(shù)據(jù)的有效融合,以大數(shù)據(jù)分析的方式來(lái)完成信息業(yè)務(wù)的展開(kāi)研究。按照用戶數(shù)據(jù)進(jìn)行類別劃分,通過(guò)不同的職業(yè)、年齡、性別、偏好等等,可以劃分出用戶具體的借閱模式,并根據(jù)用戶愛(ài)好進(jìn)行信息內(nèi)容的推送。按照主題模式選擇融合方法,可以將主題核心詞通過(guò)關(guān)聯(lián)性確定下來(lái),由此完成對(duì)語(yǔ)詞主題信息的融合。
信息融合的最終目的是為用戶提供更好的服務(wù),以綜合性優(yōu)質(zhì)信息來(lái)建立以人為本信息服務(wù)方式。圖書(shū)館數(shù)字資源的融合基礎(chǔ)是用戶,這就是“用戶為中心”的服務(wù)理念建構(gòu),以用戶需求為核心,通過(guò)用戶特定信息將相關(guān)的數(shù)據(jù)融合到一起。依托大數(shù)據(jù)信息環(huán)境,幫助用戶解決在復(fù)雜多變資源環(huán)境中尋找具體數(shù)據(jù)信息的問(wèn)題,通過(guò)信息檢索的方式確定用戶所需要的內(nèi)容。但是,現(xiàn)有檢索系統(tǒng)限制較多,難以完成“用戶中心”這個(gè)要求,所以應(yīng)盡快進(jìn)行合理的調(diào)整和解決,將信息數(shù)據(jù)實(shí)現(xiàn)市場(chǎng)化,實(shí)現(xiàn)與信息商間的競(jìng)爭(zhēng)優(yōu)勢(shì),確保信息服務(wù)領(lǐng)域能夠獲得更好的升級(jí),由此滿足用戶對(duì)圖書(shū)館信息的需求。
該融合方式可以在應(yīng)用層面實(shí)現(xiàn)邏輯上的無(wú)縫對(duì)接,滿足實(shí)時(shí)集成要求。圖書(shū)館的多個(gè)不同業(yè)務(wù)部門以不同信息服務(wù)方式將數(shù)據(jù)保留到數(shù)據(jù)庫(kù)表中,建構(gòu)數(shù)字資源融合平臺(tái)時(shí),能夠以相關(guān)應(yīng)用邏輯來(lái)定義具體的庫(kù)表內(nèi)外的動(dòng)態(tài)關(guān)聯(lián)關(guān)系。此類融合模式表現(xiàn)出顯著的實(shí)時(shí)性與動(dòng)態(tài)性特征,能夠通過(guò)應(yīng)用邏輯完成數(shù)據(jù)資源的關(guān)系定義。
基于大數(shù)據(jù)技術(shù)應(yīng)用環(huán)境,數(shù)據(jù)開(kāi)放、信息公開(kāi)已成必然趨勢(shì),客觀地推動(dòng)了圖書(shū)館數(shù)字資源的科學(xué)融合與高效利用,從而形成了更加完善、規(guī)模更加龐大的圖書(shū)館數(shù)據(jù)信息庫(kù),實(shí)現(xiàn)不同圖書(shū)館數(shù)字資源的高度共享與科學(xué)整合,實(shí)現(xiàn)了數(shù)字資源的高效利用,為數(shù)據(jù)分析、處理奠定了良好基礎(chǔ),也極大提升了數(shù)據(jù)挖掘效果,提高了數(shù)字資源的綜合利用率,促使圖書(shū)館的服務(wù)水平不斷提升,并且呈現(xiàn)出多元化的發(fā)展趨勢(shì),有效地滿足不同用戶的使用需求與服務(wù)需求,實(shí)現(xiàn)了全方位、全過(guò)程的一站式數(shù)字資源服務(wù)模式。
基于云計(jì)算、大數(shù)據(jù)技術(shù)的優(yōu)勢(shì)功能,能顯著提升圖書(shū)館數(shù)字資源的融合水平,實(shí)現(xiàn)對(duì)數(shù)字資源的科學(xué)統(tǒng)籌與設(shè)計(jì)規(guī)劃,極大提升了圖書(shū)館數(shù)字化轉(zhuǎn)型發(fā)展速度,形成了以云計(jì)算為基礎(chǔ)、以大數(shù)據(jù)技術(shù)為核心的更加安全、高效、全面的數(shù)字資源平臺(tái),極大地提升圖書(shū)館資源管理與服務(wù)的集約化、效率化水平,在有效降低資源管理與資源服務(wù)成本的同時(shí),也提升了資源共享水平和應(yīng)用水平,充分發(fā)揮了大數(shù)據(jù)、云計(jì)算等技術(shù)的優(yōu)勢(shì)功能,打造更加全面、完善的數(shù)字資源系統(tǒng),從而贏得用戶的廣泛認(rèn)可,為自身發(fā)展奠定了良好的客戶基礎(chǔ)與服務(wù)基礎(chǔ)。
基于大數(shù)據(jù)技術(shù)的數(shù)據(jù)處理機(jī)制與管理流程,圖書(shū)館的數(shù)字資源將得到充分的融合發(fā)展,實(shí)現(xiàn)數(shù)據(jù)資源的有效獲取、科學(xué)存儲(chǔ)、高效處理與合理利用,提升圖書(shū)館的安全管理與標(biāo)準(zhǔn)化建設(shè)水平,滿足不同用戶的數(shù)字資源服務(wù)需求,提升服務(wù)能力,從而充分發(fā)揮數(shù)字融合的優(yōu)勢(shì)。
(1)圖書(shū)館大數(shù)據(jù)的獲取。在數(shù)據(jù)獲取環(huán)境,數(shù)字圖書(shū)館通常以RFID、傳感器技術(shù)、終端技術(shù)、視頻監(jiān)控技術(shù)等工具,通過(guò)合法的途徑對(duì)社會(huì)各個(gè)領(lǐng)域、行業(yè)的相關(guān)數(shù)據(jù)資源進(jìn)行廣泛收集與科學(xué)整理,從而不斷豐富圖書(shū)館的數(shù)字資源,并在數(shù)據(jù)處理、分析和提煉的基礎(chǔ)上不斷充實(shí)數(shù)據(jù)庫(kù),不斷提升數(shù)字資源服務(wù)水平。在圖書(shū)館的數(shù)據(jù)獲取環(huán)節(jié),主要是對(duì)現(xiàn)有的資源、業(yè)務(wù)、社交、用戶等數(shù)據(jù)進(jìn)行收集和整理,針對(duì)不同的數(shù)據(jù)采取差異性的技術(shù)手段,充分保證數(shù)據(jù)資源的全面性與完善性,為數(shù)據(jù)分析和處理提供有效的數(shù)據(jù)資源,充分保證數(shù)據(jù)分析處理的水平,從而為數(shù)據(jù)挖掘奠定良好基礎(chǔ),以此提升數(shù)據(jù)挖掘效果,為各項(xiàng)管理和服務(wù)提供更加可靠的依據(jù)。
(2)圖書(shū)館大數(shù)據(jù)的存儲(chǔ)與處理。在獲取所需數(shù)據(jù)之后,需要采取科學(xué)方法對(duì)數(shù)據(jù)進(jìn)行存儲(chǔ)。數(shù)據(jù)存儲(chǔ)是數(shù)據(jù)分析處理的前提基礎(chǔ),存儲(chǔ)管理水平將直接影響數(shù)據(jù)質(zhì)量和后續(xù)處理效率。在具體應(yīng)用中,圖書(shū)館大數(shù)據(jù)主要通過(guò)實(shí)時(shí)采集、批量導(dǎo)入等方式完成數(shù)據(jù)獲取工作,然后在對(duì)數(shù)據(jù)進(jìn)行優(yōu)化和處理后將其存儲(chǔ)于不同的介質(zhì)內(nèi),有效克服數(shù)據(jù)規(guī)模龐大、異構(gòu)問(wèn)題對(duì)數(shù)據(jù)關(guān)聯(lián)的不利影響,充分保證數(shù)據(jù)處理與應(yīng)用的水平。基于大數(shù)據(jù)技術(shù)背景,圖書(shū)館的數(shù)據(jù)資源規(guī)模將迅速擴(kuò)大,數(shù)據(jù)類型也日益復(fù)雜,若采取分布式的數(shù)據(jù)管理方式必然涉及各種不同類型數(shù)據(jù)的集中處理和存儲(chǔ),需要采取科學(xué)有效的方法克服數(shù)據(jù)異地、異質(zhì)、異構(gòu)等問(wèn)題的不利影響,充分保證數(shù)據(jù)存儲(chǔ)管理的科學(xué)水平,為數(shù)據(jù)分析、處理奠定良好基礎(chǔ)。大數(shù)據(jù)處理技術(shù)是圖書(shū)館大數(shù)據(jù)管理的另一重要任務(wù),該任務(wù)以用戶需求、業(yè)務(wù)目標(biāo)為出發(fā)點(diǎn),采取多種多樣的技術(shù)方法對(duì)數(shù)據(jù)進(jìn)行全面研究分析,保證不同數(shù)據(jù)的處理效果和整體質(zhì)量,充分滿足數(shù)據(jù)應(yīng)用的相關(guān)需求。
(3)圖書(shū)館大數(shù)據(jù)的應(yīng)用。應(yīng)用是大數(shù)據(jù)技術(shù)的根本目標(biāo)?;跀?shù)據(jù)處理結(jié)果,針對(duì)不同服務(wù)需要對(duì)數(shù)據(jù)資源進(jìn)行科學(xué)利用,準(zhǔn)確高效地滿足數(shù)字服務(wù)需求。基于大數(shù)據(jù)技術(shù)環(huán)境,大數(shù)據(jù)應(yīng)用的核心內(nèi)容是基于數(shù)據(jù)相關(guān)性分析結(jié)果,對(duì)數(shù)據(jù)進(jìn)行科學(xué)融合從而準(zhǔn)確預(yù)測(cè)客戶需求并提供針對(duì)性的服務(wù),提升客戶決策質(zhì)量。以圖書(shū)館為核心,以一站式的數(shù)字資源服務(wù)為模式,將成為未來(lái)數(shù)據(jù)資源應(yīng)用的重要方式之一,為數(shù)據(jù)挖掘技術(shù)、智慧服務(wù)技術(shù)的發(fā)展提供有力支持。
本文將數(shù)字資源融合定義為基于大數(shù)據(jù)技術(shù),將此作為平臺(tái)來(lái)完成圖書(shū)館的信息資源集成,并實(shí)現(xiàn)整合與共享。根據(jù)理論和實(shí)踐兩個(gè)視角探索具體的創(chuàng)新方向,將帶給現(xiàn)代圖書(shū)館很多轉(zhuǎn)型契機(jī),但是也存在很多問(wèn)題,解決這些矛盾和沖突,應(yīng)該成為現(xiàn)階段圖書(shū)館的數(shù)字資源融合處理核心,其解決方式和措施等能夠給圖書(shū)館提供明確的資源融合方式。
圖書(shū)館數(shù)字資源融合必須通過(guò)理念轉(zhuǎn)變才能實(shí)現(xiàn)。這種轉(zhuǎn)變主要有兩個(gè)方向:第一,做好數(shù)據(jù)資源的保護(hù)和利用。作為現(xiàn)代知識(shí)資源存儲(chǔ)、供應(yīng)的主體,圖書(shū)館表現(xiàn)出顯著的公益性特征,龐大的數(shù)據(jù)資源是其最典型的優(yōu)勢(shì),以此為基礎(chǔ),可以構(gòu)建一種以數(shù)據(jù)資源的儲(chǔ)存、保護(hù)為主要目的的開(kāi)放式信息應(yīng)用模式。但是,這種機(jī)構(gòu)性質(zhì)中存在明顯的沖突矛盾。比如,網(wǎng)絡(luò)環(huán)境推動(dòng)下圖書(shū)館也逐漸將實(shí)體文獻(xiàn)資源進(jìn)行網(wǎng)絡(luò)化處理,但是并未實(shí)現(xiàn)有效的全面開(kāi)放,這種大數(shù)據(jù)時(shí)代的來(lái)到,讓人們?cè)诖髷?shù)據(jù)價(jià)值不斷增加過(guò)程中,對(duì)數(shù)據(jù)信息的需求量越來(lái)越大。所以,從這個(gè)角度來(lái)說(shuō),圖書(shū)館應(yīng)該順勢(shì)而變,在有效完成數(shù)字資源處理任務(wù)的基礎(chǔ)上,同時(shí)做好數(shù)字資源的保護(hù)工作,并充分保證資源的利用水平,兼顧資源保護(hù)與共享。這是推動(dòng)圖書(shū)館數(shù)據(jù)資源信息共享效率的關(guān)鍵,本質(zhì)就是將“信息孤島”問(wèn)題解決。第二,圖書(shū)館館員成為管理數(shù)字資源的重要人力資源。通過(guò)對(duì)館員大數(shù)據(jù)思維的培養(yǎng),建立新時(shí)代的“用戶中心”理念,提升自身解決數(shù)據(jù)采集、處理和分析的能力,利用圖書(shū)館已有資源,進(jìn)行新的服務(wù)范圍拓展和服務(wù)內(nèi)容增加等。
對(duì)于現(xiàn)代圖書(shū)館數(shù)字資源的管理來(lái)說(shuō),需要通過(guò)平臺(tái)建設(shè)、大數(shù)據(jù)處理等方式,根據(jù)現(xiàn)有技術(shù)實(shí)現(xiàn)更好的改進(jìn),這是實(shí)現(xiàn)資源融合順利展開(kāi)的重要前提。對(duì)于數(shù)據(jù)采集來(lái)說(shuō),需要通過(guò)圖書(shū)館大數(shù)據(jù)多樣性,準(zhǔn)確、全面地實(shí)現(xiàn)具體采集流程,從而將寬帶制約、采集效率、數(shù)據(jù)質(zhì)量等問(wèn)題合理保證。在該過(guò)程中,存在一個(gè)數(shù)據(jù)存儲(chǔ)容量問(wèn)題,對(duì)于能夠達(dá)到PB級(jí)海量數(shù)據(jù)時(shí),圖書(shū)館管理系統(tǒng)能夠?qū)ζ浜A繑?shù)據(jù)進(jìn)行有效存儲(chǔ),并充分保證數(shù)據(jù)存儲(chǔ)的安全性與可靠性,提供與數(shù)據(jù)規(guī)模匹配的存儲(chǔ)空間。而數(shù)據(jù)保護(hù)則可以理解為對(duì)不同類型、結(jié)構(gòu)特征的數(shù)字資源進(jìn)行挖掘時(shí),可以通過(guò)保存數(shù)量多少、保存時(shí)間等限制,做出并不相同的挖掘行為,由此來(lái)發(fā)揮數(shù)據(jù)資源信息的價(jià)值特征。數(shù)據(jù)組織時(shí)的數(shù)據(jù)標(biāo)準(zhǔn)規(guī)范化過(guò)程,就是在圖書(shū)館數(shù)字資源融合平臺(tái)上,可以根據(jù)標(biāo)準(zhǔn)化的數(shù)據(jù)語(yǔ)言,將不同類型的數(shù)據(jù)進(jìn)行轉(zhuǎn)化,使其具備良好的兼容能力,為數(shù)據(jù)共享奠定基礎(chǔ),這時(shí)就需要將數(shù)據(jù)采集實(shí)現(xiàn)壁壘破除。數(shù)據(jù)安全問(wèn)題的含義是在數(shù)字資源利用和處理過(guò)程中,根據(jù)數(shù)據(jù)可能存在的丟失、泄漏問(wèn)題,完成對(duì)安全風(fēng)險(xiǎn)的分析和劃分,根據(jù)相關(guān)風(fēng)險(xiǎn)的發(fā)展方向,由此判定文件、數(shù)據(jù)的可行性、有效性。由于傳統(tǒng)安全管理模式存在很多矛盾沖突問(wèn)題,特別是技術(shù)漏洞、日志文件缺失、數(shù)據(jù)發(fā)現(xiàn)不清晰等都會(huì)導(dǎo)致無(wú)法使用、數(shù)據(jù)不可靠等問(wèn)題。因此,應(yīng)該從網(wǎng)絡(luò)、數(shù)據(jù)存儲(chǔ)、數(shù)據(jù)備份等方面的安全性出發(fā),完成對(duì)風(fēng)險(xiǎn)的管理、運(yùn)營(yíng)和治理等行為,并以此判斷和探究具體的解決對(duì)策。在進(jìn)行數(shù)據(jù)處理與分析時(shí),可以將空間與時(shí)間維度的數(shù)據(jù)關(guān)聯(lián)進(jìn)行綜合運(yùn)用,將圖書(shū)館大數(shù)據(jù)資源進(jìn)行深層次挖掘,為分析提供有效基礎(chǔ)。將軟件進(jìn)行平臺(tái)算法的先進(jìn)性開(kāi)發(fā)后,實(shí)現(xiàn)多重處理方式的應(yīng)用。對(duì)于可視化呈現(xiàn)方式來(lái)說(shuō),可以將可視化軟件工具利用起來(lái),將圖書(shū)館大數(shù)據(jù)間巨大、復(fù)雜的潛在邏輯關(guān)聯(lián)進(jìn)行梳理,從而進(jìn)行相關(guān)的圖書(shū)館業(yè)務(wù)支撐和決策分析。
現(xiàn)階段圖書(shū)館的大數(shù)據(jù)環(huán)境特征之一就是其整合必須建立在基礎(chǔ)功能之上,以融合所有資源的方式來(lái)完成相關(guān)的資源內(nèi)容有效建設(shè),改善原本的分布散逸狀態(tài),將信息獲取難度過(guò)大、垃圾數(shù)據(jù)太多等問(wèn)題進(jìn)行優(yōu)化,這是實(shí)現(xiàn)圖書(shū)館數(shù)字資源共享、共建和有效利用的前提。通過(guò)綜合衡量的方式,使得圖書(shū)館數(shù)字資源融合可以有效地、順利地展開(kāi)。
在實(shí)際融合與轉(zhuǎn)化時(shí),應(yīng)該將經(jīng)濟(jì)成本問(wèn)題重視起來(lái),將成本控制等問(wèn)題作為關(guān)鍵因素進(jìn)行研究分析。由于圖書(shū)館數(shù)字資源利益關(guān)聯(lián)者的多樣性,使得資源融合的環(huán)境比較復(fù)雜,必須要將這機(jī)構(gòu)經(jīng)費(fèi)收入合理保障,具體是:(1)費(fèi)用分?jǐn)偂V傅氖歉鱾€(gè)主體將資源融合實(shí)現(xiàn)共同承擔(dān),由此完成對(duì)數(shù)字融合成本費(fèi)用的科學(xué)管理與有效控制,實(shí)現(xiàn)成本費(fèi)用的合理分?jǐn)偂?2)成本控制。針對(duì)數(shù)字資源融合與轉(zhuǎn)化的不同環(huán)節(jié)與要素,將圖書(shū)館數(shù)據(jù)信息進(jìn)行采集、加工、組織、處理,這些都是需要有基本的人力物力投入,必須對(duì)成本進(jìn)行控制,通過(guò)科學(xué)的管理措施提升資源要素的利用水平和融合效率,從而降低整體成本。(3)利益均衡。在數(shù)字資源實(shí)現(xiàn)融合與轉(zhuǎn)化過(guò)程中,可通過(guò)控制主體投入實(shí)現(xiàn)利益的科學(xué)分配,充分保證不同主體的利益,從而獲得不同主體的支持,提高融合與轉(zhuǎn)化的效率。充足的經(jīng)費(fèi)將直接促使數(shù)字資源融合與轉(zhuǎn)化的發(fā)展,這是中國(guó)圖書(shū)館事業(yè)發(fā)展最主要的問(wèn)題,應(yīng)該獲得中央與地方政府財(cái)政收入的支持。
以實(shí)際融合過(guò)程來(lái)說(shuō),前提是健全管理機(jī)制,為數(shù)字資源融合具體工作提供科學(xué)的依據(jù)。在實(shí)踐時(shí)可以將面臨的具體問(wèn)題通過(guò)分解環(huán)節(jié)來(lái)有效解決,從而實(shí)現(xiàn)穩(wěn)定融合,確保各類矛盾沖突問(wèn)題得到合理解決。因?yàn)楦鱾€(gè)圖書(shū)館類型不同,所使用的系統(tǒng)也各不相同,以管理部門差異性的設(shè)置方式來(lái)看,可以實(shí)現(xiàn)有效的監(jiān)督和約束,確保部門職能的順利實(shí)現(xiàn)。由于認(rèn)知的差異性,要求主管部門從一開(kāi)始就應(yīng)確認(rèn)各類職能的分配,但是這種模式可能會(huì)導(dǎo)致各個(gè)圖書(shū)館合作不暢的問(wèn)題。統(tǒng)一管理可以從三個(gè)層面展開(kāi):一是建立專業(yè)管理機(jī)構(gòu),配備專業(yè)工作人員,實(shí)施統(tǒng)一規(guī)劃標(biāo)準(zhǔn);二是不斷創(chuàng)新管理制度,以更富有激勵(lì)性、創(chuàng)新性的制度規(guī)劃,將圖書(shū)館各個(gè)工作人員都納入到管理系統(tǒng)中;三是強(qiáng)化整合運(yùn)營(yíng)模式,將不同管理機(jī)構(gòu)基本職能劃分清楚,融合平臺(tái)中同樣要?jiǎng)澐殖鼋y(tǒng)一管理的基本模式,確保圖書(shū)館數(shù)字資源能夠得到合理開(kāi)發(fā)。
圖書(shū)館數(shù)字資源融合必須通過(guò)專業(yè)人才來(lái)完成系統(tǒng)技術(shù)的應(yīng)用。大數(shù)據(jù)時(shí)代催生了多重技術(shù)應(yīng)用方式,管理人員、服務(wù)人員基本素質(zhì)都必須提高。從這個(gè)角度來(lái)說(shuō),圖書(shū)館必須與時(shí)俱進(jìn),以積極的培訓(xùn)、講座、研討會(huì)等促進(jìn)館員綜合素質(zhì)的提升。在支持和鼓勵(lì)工作人員不斷提升自我能力的同時(shí),加強(qiáng)外部合作,將專業(yè)人才對(duì)大數(shù)據(jù)的使用更合理、更有效。圖書(shū)館應(yīng)該認(rèn)識(shí)到人才儲(chǔ)備、培養(yǎng)、引進(jìn)的重要性,建構(gòu)大數(shù)據(jù)思維方式,通過(guò)技術(shù)系統(tǒng)的設(shè)立而建構(gòu)專業(yè)人才隊(duì)伍,實(shí)現(xiàn)圖書(shū)館數(shù)字資源融合的最初目標(biāo)。