馬曉亭
〔摘要〕數(shù)據(jù)整合對(duì)提高圖書館的數(shù)據(jù)處理與共享能力,進(jìn)而提升數(shù)據(jù)有效性、可用性和優(yōu)化決策等能力有重要意義。本文提出了一種基于大數(shù)據(jù)的圖書館異構(gòu)數(shù)據(jù)整合機(jī)制,該機(jī)制可提高圖書館大數(shù)據(jù)的利用效率,并有助于實(shí)現(xiàn)圖書館的信息資源整合。
〔關(guān)鍵詞〕大數(shù)據(jù);圖書館;異構(gòu)數(shù)據(jù);整合機(jī)制
DOI:10.3969/j.issn.1008-0821.2015.08.010
〔中圖分類號(hào)〕G25076〔文獻(xiàn)標(biāo)識(shí)碼〕A〔文章編號(hào)〕1008-0821(2015)08-0047-04
大數(shù)據(jù)時(shí)代已經(jīng)到來(lái)。圖書館通過(guò)對(duì)所采集的海量數(shù)據(jù)進(jìn)行存儲(chǔ)和分析,實(shí)現(xiàn)了對(duì)讀者閱讀行為、情緒、習(xí)慣和服務(wù)需求的精確測(cè)量,制定出符合讀者服務(wù)需求、興趣和閱讀習(xí)慣的服務(wù)策略、產(chǎn)品,能夠?yàn)樽x者提供基于大數(shù)據(jù)的個(gè)性化閱讀服務(wù)。目前,圖書館數(shù)據(jù)環(huán)境已具備海量(Volume)、多樣(Variety)、快速處理(Velocity)、高價(jià)值(Value)的大數(shù)據(jù)4V特征。隨著數(shù)據(jù)總量和數(shù)據(jù)結(jié)構(gòu)復(fù)雜度的快速增長(zhǎng),如何通過(guò)數(shù)據(jù)整合來(lái)消除圖書館大數(shù)據(jù)資源不同來(lái)源、不同結(jié)構(gòu)和不同定義格式等異構(gòu)性,提高數(shù)據(jù)的價(jià)值密度、可用性、可控性、共享性和使用經(jīng)濟(jì)性,已經(jīng)成為圖書館應(yīng)重點(diǎn)關(guān)注的問(wèn)題。
1圖書館大數(shù)據(jù)整合的需求與挑戰(zhàn)
11大數(shù)據(jù)整合可有效弱化圖書館IT系統(tǒng)的多樣性
首先,隨著物聯(lián)網(wǎng)、云計(jì)算、移動(dòng)互聯(lián)網(wǎng)、傳感器和多媒體閱讀終端等技術(shù)的發(fā)展,圖書館數(shù)據(jù)中心的管理系統(tǒng)、服務(wù)系統(tǒng)和用戶閱讀終端設(shè)備,呈現(xiàn)出多平臺(tái)架構(gòu)、多接口類型、多數(shù)據(jù)模式和多標(biāo)準(zhǔn)規(guī)范的特點(diǎn),導(dǎo)致信息系統(tǒng)之間相互獨(dú)立和信息孤島呈現(xiàn)多維度特性。同時(shí),大數(shù)據(jù)資源存在過(guò)度冗余存儲(chǔ)和數(shù)據(jù)不一致現(xiàn)象,使數(shù)據(jù)難以訪問(wèn)、查詢、處理和分析,不能滿足圖書館大數(shù)據(jù)閱讀服務(wù)的分析和決策需求。其次,眾多的圖書館用戶服務(wù)系統(tǒng)分別構(gòu)建于不同的時(shí)期,系統(tǒng)的結(jié)構(gòu)模式、技術(shù)標(biāo)準(zhǔn)和管理方法差異性大。且不同系統(tǒng)之間存在集成度低、互聯(lián)性差、運(yùn)行平臺(tái)不統(tǒng)一和信息管理分散的特點(diǎn),嚴(yán)重影響了大數(shù)據(jù)的完整性、精確性、可用性和實(shí)時(shí)性。第三,圖書館復(fù)雜、多樣的管理與服務(wù)系統(tǒng),大幅增加了大數(shù)據(jù)資源的采集、存儲(chǔ)、挖掘、整合、分析和決策應(yīng)用難度。
12大數(shù)據(jù)整合是圖書館提高云服務(wù)效率的保證
通過(guò)自建私有云或租賃云服務(wù)商服務(wù)的方式,為讀者提供安全、高效、經(jīng)濟(jì)、快捷的云閱讀服務(wù),已成為圖書館云服務(wù)平臺(tái)構(gòu)建的主要模式。
云計(jì)算環(huán)境下,圖書館通過(guò)和云服務(wù)商簽署云服務(wù)租賃協(xié)議的方式,由云服務(wù)商借助網(wǎng)絡(luò)以按需、易擴(kuò)展的模式,為圖書館提供所需的云計(jì)算服務(wù),圖書館根據(jù)服務(wù)的內(nèi)容、質(zhì)量和云資源使用量支付相應(yīng)的費(fèi)用。隨著云計(jì)算技術(shù)在圖書館管理與服務(wù)應(yīng)用中的深入,云服務(wù)成本在圖書館運(yùn)營(yíng)總成本占據(jù)的比例將不斷上升。因此,如何通過(guò)數(shù)據(jù)整合有效降低大數(shù)據(jù)資源的數(shù)據(jù)總量和提高大數(shù)據(jù)價(jià)值密度,已成為關(guān)系如何降低圖書館云計(jì)算服務(wù)總成本和提升云服務(wù)收益率的關(guān)鍵。其次,在減少大數(shù)據(jù)存儲(chǔ)冗余度和數(shù)據(jù)總量的前提下,圖書館還可通過(guò)數(shù)據(jù)整合來(lái)增強(qiáng)大數(shù)據(jù)的關(guān)聯(lián)性和因果性,以此降低大數(shù)據(jù)分析過(guò)程對(duì)云計(jì)算平臺(tái)性能、云資源和應(yīng)用實(shí)時(shí)性的需求。第三,大數(shù)據(jù)整合也是將云計(jì)算技術(shù)與讀者需求相整合,將圖書館大數(shù)據(jù)資源變成大服務(wù)資源的重要途徑。
13數(shù)據(jù)整合是圖書館大數(shù)據(jù)分析與決策可靠的保證伴隨大數(shù)據(jù)技術(shù)的發(fā)展,圖書館對(duì)讀者閱讀行為、閱讀模式、社會(huì)關(guān)系和閱讀活動(dòng)反饋信息的采集將更加廣泛與深入,將導(dǎo)致大數(shù)據(jù)的來(lái)源和類型復(fù)雜化,數(shù)據(jù)總量也呈現(xiàn)級(jí)數(shù)激增和價(jià)值密度大幅下降的趨勢(shì)。同時(shí),大數(shù)據(jù)的分析過(guò)程也會(huì)對(duì)圖書館技術(shù)人員的水平和數(shù)據(jù)處理平臺(tái)性能提出更高要求。因此,如何通過(guò)對(duì)大數(shù)據(jù)資源的清洗、集成和整合,不斷增強(qiáng)圖書館大數(shù)據(jù)資源的價(jià)值密度、可用性、可控性和應(yīng)用經(jīng)濟(jì)性,已成為提升圖書館大數(shù)據(jù)平臺(tái)運(yùn)營(yíng)效率和降低平臺(tái)運(yùn)行成本的關(guān)鍵。其次,對(duì)大數(shù)據(jù)資源的有效整合,也是關(guān)系圖書館完全挖掘、開發(fā)大數(shù)據(jù)價(jià)值,精確識(shí)別讀者服務(wù)需求、個(gè)性化特征、閱讀習(xí)慣,準(zhǔn)確定位讀者大數(shù)據(jù)服務(wù)場(chǎng)景,以及優(yōu)化配置圖書館大數(shù)據(jù)服務(wù)系統(tǒng)資源的重要因素。第三,圖書館大數(shù)據(jù)資源具有海量、多源、異構(gòu)和多類型的特點(diǎn),而大數(shù)據(jù)整合過(guò)程是降低數(shù)據(jù)復(fù)雜度、消除數(shù)據(jù)異構(gòu)性、提取數(shù)據(jù)價(jià)值和發(fā)現(xiàn)數(shù)據(jù)關(guān)聯(lián)的有效途徑。
14數(shù)據(jù)整合可消除大數(shù)據(jù)的分布異構(gòu)性
為了分擔(dān)用戶服務(wù)負(fù)載和保證讀者閱讀活動(dòng)的效率、質(zhì)量、時(shí)效性,圖書館通常會(huì)根據(jù)讀者群分布狀況,在世界不同地域建設(shè)若干個(gè)子數(shù)據(jù)中心,依據(jù)地理位置就近的原則為讀者提供大數(shù)據(jù)閱讀服務(wù)。在讀者大數(shù)據(jù)資源的采集中,位于不同地理位置的子數(shù)據(jù)中心在對(duì)大數(shù)據(jù)的采集、處理、分析和決策中,會(huì)由于數(shù)據(jù)具有較強(qiáng)的地域性面導(dǎo)致大數(shù)據(jù)的價(jià)值、應(yīng)用效率下降。因此,如何實(shí)現(xiàn)位于世界不同地理位置的子數(shù)據(jù)中心數(shù)據(jù)資源的整合,是圖書館增強(qiáng)大數(shù)據(jù)應(yīng)用整體效率和提升服務(wù)總體質(zhì)量的關(guān)鍵。此外,圖書館大數(shù)據(jù)資源的分布異構(gòu)性,也是導(dǎo)致數(shù)據(jù)多樣性、非結(jié)構(gòu)化、數(shù)據(jù)孤島和數(shù)據(jù)采集質(zhì)量等問(wèn)題突出的根源,而數(shù)據(jù)整合正是有效解決這些問(wèn)題的可靠方法和途徑。第三,在長(zhǎng)期的圖書館建設(shè)與用戶服務(wù)過(guò)程中,圖書館自身積累、存儲(chǔ)了海量的元數(shù)據(jù)資源。由于歷史和現(xiàn)實(shí)等原因,不同的圖書館子數(shù)據(jù)中心在元數(shù)據(jù)的采集、處理、存儲(chǔ)和應(yīng)用過(guò)程中,通常會(huì)采用各自不同的元數(shù)據(jù)標(biāo)準(zhǔn)和軟硬件平臺(tái),會(huì)導(dǎo)致元數(shù)據(jù)在大數(shù)據(jù)應(yīng)用過(guò)程中存在語(yǔ)義上的異構(gòu)和互操作性差等問(wèn)題。
15數(shù)據(jù)整合是提高大數(shù)據(jù)閱讀服務(wù)質(zhì)量的保證
大數(shù)據(jù)時(shí)代,圖書館通過(guò)監(jiān)控服務(wù)器、網(wǎng)關(guān)、嵌入式傳感器、RFID(Radio Frequency Identification,射頻識(shí)別)芯片、視頻采集設(shè)備和閱讀終端等設(shè)備,采集與讀者閱讀活動(dòng)相關(guān)的信息和數(shù)據(jù)。這些大數(shù)據(jù)資源主要由文本、圖片、視頻等結(jié)構(gòu)化和非結(jié)構(gòu)化數(shù)據(jù)組成,并以每年40%的速度增長(zhǎng),是圖書館大數(shù)據(jù)決策和讀者個(gè)性化服務(wù)的主要依據(jù)[3]。endprint
大數(shù)據(jù)時(shí)代,隨著科技的發(fā)展和讀者閱讀需求的提高,圖書館之間的服務(wù)競(jìng)爭(zhēng)已由傳統(tǒng)IT環(huán)境下依賴數(shù)據(jù)中心基礎(chǔ)設(shè)施性能、人力資源、數(shù)字與紙質(zhì)圖書資源消耗,轉(zhuǎn)變?yōu)橐揽看髷?shù)據(jù)制定圖書館差異化服務(wù)戰(zhàn)略,為讀者提供個(gè)性化服務(wù)的綜合能力競(jìng)爭(zhēng)。因此,對(duì)大數(shù)據(jù)資源的有效整合,是圖書館減少服務(wù)業(yè)務(wù)質(zhì)量波動(dòng)、提升讀者滿意度和增強(qiáng)市場(chǎng)競(jìng)爭(zhēng)力的保障。此外,服務(wù)即時(shí)性也是關(guān)系讀者閱讀愉悅感的一個(gè)重要因素。圖書館可通過(guò)對(duì)大數(shù)據(jù)的高效整合,提升大數(shù)據(jù)分析的實(shí)時(shí)性和決策即時(shí)性,為讀者提供安全、實(shí)時(shí)、經(jīng)濟(jì)和交互的個(gè)性化推送服務(wù)。
2圖書館大數(shù)據(jù)資源整合方案與策略
21圖書館大數(shù)據(jù)資源整合方案
本文設(shè)計(jì)的圖書館大數(shù)據(jù)整合方案如圖1所示。該方案主要由大數(shù)據(jù)資源層、數(shù)據(jù)過(guò)濾與解析層、數(shù)據(jù)整合層和數(shù)據(jù)整合系統(tǒng)反饋控制層等4個(gè)功能層組成。大數(shù)據(jù)資源層主要由圖書館在讀者服務(wù)過(guò)程中采集的CRM(客戶關(guān)系管理)數(shù)據(jù)、服務(wù)系統(tǒng)運(yùn)營(yíng)與配置數(shù)據(jù)、讀者服務(wù)過(guò)程采集數(shù)據(jù)和主數(shù)據(jù)庫(kù)組成。這些大數(shù)據(jù)資源依據(jù)數(shù)據(jù)的采集來(lái)源、數(shù)據(jù)的類型、數(shù)據(jù)使用途徑和方法、數(shù)據(jù)訪問(wèn)頻率等特點(diǎn),分別存儲(chǔ)在大數(shù)據(jù)存儲(chǔ)平臺(tái)的客戶關(guān)系管理數(shù)據(jù)庫(kù)、系統(tǒng)管理數(shù)據(jù)庫(kù)、服務(wù)監(jiān)控?cái)?shù)據(jù)庫(kù)和主數(shù)據(jù)庫(kù)等邏輯數(shù)據(jù)庫(kù)中,為圖書館大數(shù)據(jù)應(yīng)用提供數(shù)據(jù)存儲(chǔ)與管理服務(wù)。數(shù)據(jù)過(guò)濾與解析層位于大數(shù)據(jù)資源層的上層,負(fù)責(zé)完成對(duì)圖書館大數(shù)據(jù)庫(kù)資源的提取、數(shù)據(jù)類型與正規(guī)性檢查、數(shù)據(jù)的清洗、數(shù)據(jù)的解析和準(zhǔn)備等工作,主要目的為過(guò)濾大數(shù)據(jù)資源層數(shù)據(jù)的噪音和規(guī)范數(shù)據(jù)類型,不斷提高大數(shù)據(jù)資源的價(jià)值密度和可用性[4]。數(shù)據(jù)整合層是將臨時(shí)數(shù)據(jù)庫(kù)中已進(jìn)行預(yù)清洗與過(guò)濾的數(shù)據(jù),通過(guò)數(shù)據(jù)源的讀取、數(shù)據(jù)轉(zhuǎn)換規(guī)則的解析和系統(tǒng)加載,將已轉(zhuǎn)換的數(shù)據(jù)寫入主數(shù)據(jù)庫(kù)的3個(gè)步驟,才能最終完成圖書館大數(shù)據(jù)資源的整合。大數(shù)據(jù)整合系統(tǒng)反饋控制層,通過(guò)對(duì)大數(shù)據(jù)分析與決策過(guò)程大數(shù)據(jù)應(yīng)用有效性的評(píng)估,并借助數(shù)據(jù)整合系統(tǒng)的反饋控制,完成對(duì)數(shù)據(jù)整合層的反饋控制、資源調(diào)度和系統(tǒng)優(yōu)圖1圖書館大數(shù)據(jù)整合方案設(shè)計(jì)圖
化,不斷增強(qiáng)數(shù)據(jù)整合層的運(yùn)行效率、數(shù)據(jù)整合可用性和整合過(guò)程的可控性。此外,圖書館還應(yīng)對(duì)大數(shù)據(jù)整合全程實(shí)施監(jiān)控和管理,及時(shí)發(fā)現(xiàn)、調(diào)整、修改和完善數(shù)據(jù)整合過(guò)程中存在的問(wèn)題與突發(fā)事件,保證大數(shù)據(jù)整合過(guò)程安全、高效、經(jīng)濟(jì)、便捷。
22圖書館大數(shù)據(jù)資源的整合管理策略
221實(shí)現(xiàn)數(shù)據(jù)在采集終端的過(guò)濾與整合
圖書館對(duì)用戶服務(wù)過(guò)程和讀者閱讀活動(dòng)數(shù)據(jù)的采集,主要是由傳感器、視頻監(jiān)控器、服務(wù)器監(jiān)控系統(tǒng)、服務(wù)器日志采集系統(tǒng)和閱讀終端設(shè)備數(shù)據(jù)采集器等完成,該類設(shè)備具有設(shè)備類型復(fù)雜、數(shù)量龐大、數(shù)據(jù)采集即時(shí)和海量、數(shù)據(jù)傳輸網(wǎng)絡(luò)負(fù)載壓力大的特點(diǎn)。因此,如何在大數(shù)據(jù)采集終端完成對(duì)所采集數(shù)據(jù)資源的過(guò)濾與整合,是圖書館減少終端采集數(shù)據(jù)傳輸數(shù)量,降低數(shù)據(jù)沖突和減輕網(wǎng)絡(luò)擁塞,提高大數(shù)據(jù)分析與決策效率、可用性的關(guān)鍵。因此,圖書館可對(duì)所采集的海量原始數(shù)據(jù)進(jìn)行終端過(guò)濾、處理和數(shù)據(jù)整合,去除其中的冗余信息并過(guò)濾數(shù)據(jù)噪音,僅將價(jià)值高、可控性強(qiáng)的數(shù)據(jù)傳輸至大數(shù)據(jù)庫(kù)存儲(chǔ),實(shí)現(xiàn)降低數(shù)據(jù)源數(shù)據(jù)采集總量、提升數(shù)據(jù)價(jià)值密度、增強(qiáng)數(shù)據(jù)可用性和提高數(shù)據(jù)決策實(shí)時(shí)性的目標(biāo)。
222實(shí)現(xiàn)圖書館不同業(yè)務(wù)平臺(tái)數(shù)據(jù)的整合
圖書館管理與用戶服務(wù)系統(tǒng)是由讀者管理、用戶服務(wù)與應(yīng)用管理、服務(wù)系統(tǒng)配置與運(yùn)營(yíng)管理、CRM管理等多個(gè)具備獨(dú)立功能的子系統(tǒng)組成,系統(tǒng)之間相互獨(dú)立且關(guān)聯(lián)性不強(qiáng),易導(dǎo)致數(shù)據(jù)在系統(tǒng)之間流動(dòng)性差和產(chǎn)生數(shù)據(jù)孤島現(xiàn)象。因此,圖書館應(yīng)加強(qiáng)對(duì)不同業(yè)務(wù)平臺(tái)系統(tǒng)數(shù)據(jù)的整合和價(jià)值提取。
首先,圖書館在對(duì)不同業(yè)務(wù)平臺(tái)數(shù)據(jù)的整合中,應(yīng)堅(jiān)持整合系統(tǒng)支持Oracle、DB2、SQLServer、MySQL、Informix等多數(shù)據(jù)源類型數(shù)據(jù),并且整合系統(tǒng)的程序接口也應(yīng)支持javaApi、Hibernate數(shù)據(jù)源和WebService、 SOA等標(biāo)準(zhǔn)的數(shù)據(jù),不斷提高數(shù)據(jù)整合系統(tǒng)對(duì)不同業(yè)務(wù)平臺(tái)數(shù)據(jù)的兼容性[5]。其次,應(yīng)提升數(shù)據(jù)整合系統(tǒng)對(duì)不同數(shù)據(jù)平臺(tái)數(shù)據(jù)之間的關(guān)聯(lián)性挖掘、發(fā)現(xiàn)能力,可通過(guò)異構(gòu)系統(tǒng)之間數(shù)據(jù)的關(guān)聯(lián)而發(fā)現(xiàn)、創(chuàng)造新的數(shù)據(jù)價(jià)值。第三,圖書館不同業(yè)務(wù)平臺(tái)數(shù)據(jù)具有海量、多結(jié)構(gòu)類型、數(shù)據(jù)庫(kù)存儲(chǔ)結(jié)構(gòu)固定、不易于直接分析和決策的特點(diǎn)。因此,應(yīng)將數(shù)據(jù)的ETL(Extract-Transform-Load,數(shù)據(jù)從來(lái)源端經(jīng)過(guò)萃取、轉(zhuǎn)置和加載至目的端的過(guò)程)過(guò)程融入不同業(yè)務(wù)平臺(tái)數(shù)據(jù)的整合中去。應(yīng)將從不同數(shù)據(jù)平臺(tái)抽取出的數(shù)據(jù)經(jīng)過(guò)ETL過(guò)程,最終按照預(yù)先定義好的數(shù)據(jù)倉(cāng)庫(kù)模型將數(shù)據(jù)加載到數(shù)據(jù)倉(cāng)庫(kù)中去,最終提高多平臺(tái)數(shù)據(jù)整合后的可分析、使用和決策特性。
223重點(diǎn)關(guān)注與第三方大數(shù)據(jù)平臺(tái)數(shù)據(jù)的整合
大數(shù)據(jù)時(shí)代,讀者個(gè)性化服務(wù)由圖書館、云服務(wù)提供商、移動(dòng)通信運(yùn)營(yíng)商和相關(guān)政府機(jī)構(gòu)等多部門協(xié)作提供。圖書館只有實(shí)現(xiàn)對(duì)多部門數(shù)據(jù)的全面、高效整合,才能二次發(fā)現(xiàn)、提升圖書館大數(shù)據(jù)資源的價(jià)值,才能更加精準(zhǔn)地發(fā)現(xiàn)讀者需求,才能有效提高圖書館讀者服務(wù)綜合收益率。例如,圖書館通過(guò)對(duì)移動(dòng)運(yùn)營(yíng)商數(shù)據(jù)的整合與分析,可準(zhǔn)確預(yù)測(cè)出讀者在未來(lái)時(shí)間的移動(dòng)路徑和閱讀需求、模式,精確評(píng)估出圖書館在未來(lái)時(shí)段的服務(wù)負(fù)載和數(shù)據(jù)網(wǎng)絡(luò)傳輸負(fù)荷,可有針對(duì)性地制定出服務(wù)資源調(diào)度和數(shù)據(jù)傳輸網(wǎng)絡(luò)管理策略,確保在未來(lái)時(shí)段不會(huì)因?yàn)樽x者需求的快速增長(zhǎng),而導(dǎo)致系統(tǒng)服務(wù)資源、網(wǎng)絡(luò)傳輸效率、用戶QOS(服務(wù)質(zhì)量)和讀者閱讀活動(dòng)滿意度等指標(biāo)大幅下降[6]。其次,圖書館應(yīng)在保證政府?dāng)?shù)據(jù)安全、可用的前提下,加強(qiáng)與政府公共大數(shù)據(jù)資源的開放、共享和整合力度,進(jìn)一步提高圖書館大數(shù)據(jù)庫(kù)資源的完整性、可用性和價(jià)值量,為圖書館建設(shè)和用戶服務(wù)提供宏觀層面上的大數(shù)據(jù)服務(wù)支持。第三,在圖書館大數(shù)據(jù)資源與第三方數(shù)據(jù)整合中,存在著各部門業(yè)務(wù)結(jié)構(gòu)相對(duì)獨(dú)立、數(shù)據(jù)所有權(quán)歸屬、數(shù)據(jù)接口復(fù)雜和數(shù)據(jù)交換頻繁的問(wèn)題。因此,圖書館與第三方的數(shù)據(jù)整合,不僅要滿足當(dāng)前各方數(shù)據(jù)庫(kù)特性、數(shù)據(jù)端口標(biāo)準(zhǔn)、大數(shù)據(jù)應(yīng)用與決策的需求,還應(yīng)從長(zhǎng)遠(yuǎn)發(fā)展考慮,重點(diǎn)加強(qiáng)多方大數(shù)據(jù)集成的系統(tǒng)架構(gòu)、數(shù)據(jù)整合能力和所采用整合技術(shù)等方面的建設(shè)。endprint
224實(shí)現(xiàn)大數(shù)據(jù)的安全、高效整合
圖書館大數(shù)據(jù)整合過(guò)程的安全管理,是關(guān)系讀者個(gè)人隱私保護(hù)、圖書館管理與服務(wù)數(shù)據(jù)安全、第三方共享大數(shù)據(jù)資源可用和政府公共數(shù)據(jù)可控的重要保證。首先,圖書館應(yīng)依據(jù)國(guó)家相關(guān)法律制定安全的大數(shù)據(jù)存儲(chǔ)與整合策略,在堅(jiān)持?jǐn)?shù)據(jù)完全整合和數(shù)據(jù)價(jià)值二次挖掘、發(fā)現(xiàn)的前提下,保護(hù)好讀者隱私和讀者大數(shù)據(jù)閱讀服務(wù)安全。此外,不能因?yàn)槎喾酱髷?shù)據(jù)資源的完全整合,而影響第三方服務(wù)商、政府等部門大數(shù)據(jù)資源的開放性、可用性和可控性。其次,圖書館應(yīng)加強(qiáng)對(duì)大數(shù)據(jù)整合IT基礎(chǔ)架構(gòu)系統(tǒng)的安全建設(shè)與管理。同時(shí),應(yīng)依據(jù)大數(shù)據(jù)整合生命周期發(fā)展規(guī)律,做好大數(shù)據(jù)平臺(tái)設(shè)備的安全管理和數(shù)據(jù)存儲(chǔ)工作,嚴(yán)格控制大數(shù)據(jù)整合風(fēng)險(xiǎn),確保不會(huì)因數(shù)據(jù)整合而影響圖書館業(yè)務(wù)的連續(xù)性和可持續(xù)發(fā)展性[7]。第三,圖書館大數(shù)據(jù)整合應(yīng)重點(diǎn)做好數(shù)據(jù)整合與數(shù)據(jù)集中存儲(chǔ)、整合系統(tǒng)的可擴(kuò)展與易維護(hù)、整合過(guò)程的安全與可靠性、整合過(guò)程的經(jīng)濟(jì)性與成本可控性管理等4個(gè)方面的工作,保證大數(shù)據(jù)整合過(guò)程安全、高效、經(jīng)濟(jì)和便捷。
3結(jié)語(yǔ)
對(duì)大數(shù)據(jù)資源的過(guò)濾和整合,是圖書館對(duì)大數(shù)據(jù)資源價(jià)值進(jìn)行二次挖掘、發(fā)現(xiàn)和創(chuàng)造的重要方式,也是圖書館增強(qiáng)大數(shù)據(jù)資源價(jià)值密度、提高決策科學(xué)性和提升讀者閱讀滿意度的重要途徑。在大數(shù)據(jù)資源的整合中,圖書館應(yīng)采取數(shù)據(jù)層面的整合、信息層面的整合、知識(shí)層面的整合三步走原則,堅(jiān)持統(tǒng)一數(shù)據(jù)庫(kù)、統(tǒng)一整合程序、統(tǒng)一IT基礎(chǔ)設(shè)施資源、統(tǒng)一數(shù)據(jù)傳輸網(wǎng)絡(luò)平臺(tái)、統(tǒng)一技術(shù)管理人員的做法,努力降低大數(shù)據(jù)的整合成本、IT基礎(chǔ)設(shè)施硬件管理與使用成本、數(shù)據(jù)整合過(guò)程復(fù)雜度,才能保證圖書館大數(shù)據(jù)整合過(guò)程安全、高效、實(shí)時(shí)和經(jīng)濟(jì),才能提高大數(shù)據(jù)資源的價(jià)值總量、密度、可用性和可控性,才能為讀者大數(shù)據(jù)閱讀服務(wù)提供可靠的大數(shù)據(jù)決策支持。
參考文獻(xiàn)
王元卓,靳小龍,程學(xué)旗.網(wǎng)絡(luò)大數(shù)據(jù):現(xiàn)狀與展望[J].計(jì)算機(jī)學(xué)報(bào),2013,36(6):1125-1138.
姜山,王剛.大數(shù)據(jù)對(duì)圖書館的啟示[J].圖書館工作與研究,2013,(4):52-54,79.
[3]康健,左憲章,唐力偉,等.無(wú)線傳感器網(wǎng)絡(luò)數(shù)據(jù)融合技術(shù).計(jì)算機(jī)科學(xué),2010,37(4):31-35.
[4]史久根,張加廣.基于壓縮感知的無(wú)線傳感器網(wǎng)絡(luò)數(shù)據(jù)融合算法[J].計(jì)算機(jī)系統(tǒng)應(yīng)用,2014,23(10):178-182.
[5]張杰,胡一兵,李亮,等.多傳感器數(shù)據(jù)融合技術(shù)應(yīng)用研究[J].測(cè)試技術(shù)學(xué)報(bào),2013,27(6):490-495.
[6]歐石燕,胡珊,張帥.本體與關(guān)聯(lián)數(shù)據(jù)驅(qū)動(dòng)的圖書館信息資源語(yǔ)義整合方法及其測(cè)評(píng)[J].圖書情報(bào)工作,2014,58(2):5-13.
[7]吳,謝樹泉,王春枝.基于語(yǔ)義的隧聯(lián)網(wǎng)數(shù)據(jù)整合方法[J].智能系統(tǒng)學(xué)報(bào),2014,9(6):209-213.
(本文責(zé)任編輯:馬卓)endprint