亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        大數(shù)據(jù)時(shí)代圖書(shū)館數(shù)據(jù)整合系統(tǒng)構(gòu)建研究

        2014-10-23 12:15:06馬曉亭蘭州商學(xué)院信息工程學(xué)院甘肅蘭州730020
        圖書(shū)館建設(shè) 2014年6期
        關(guān)鍵詞:用戶(hù)服務(wù)資源整合架構(gòu)

        馬曉亭 (蘭州商學(xué)院信息工程學(xué)院 甘肅 蘭州 730020)

        目前,隨著用戶(hù)服務(wù)模式和服務(wù)內(nèi)容的變革,圖書(shū)館在不斷提高讀者個(gè)性化閱讀愉悅感和滿(mǎn)意度的同時(shí),其數(shù)據(jù)中心的用戶(hù)服務(wù)數(shù)據(jù)、系統(tǒng)管理數(shù)據(jù)、系統(tǒng)運(yùn)行監(jiān)控?cái)?shù)據(jù)和用戶(hù)行為數(shù)據(jù)呈現(xiàn)爆炸式增長(zhǎng),數(shù)據(jù)量正在以每18個(gè)月翻一倍的驚人速度累積,圖書(shū)館已跨入大數(shù)據(jù)時(shí)代。

        全球暢銷(xiāo)書(shū)《社會(huì)消費(fèi)網(wǎng)絡(luò)營(yíng)銷(xiāo)》的作者拉里·韋伯認(rèn)為:“所謂大數(shù)據(jù)包括企業(yè)信息化的用戶(hù)交易數(shù)據(jù)、社會(huì)化媒體中用戶(hù)的行為數(shù)據(jù)和關(guān)系數(shù)據(jù)以及無(wú)線(xiàn)互聯(lián)網(wǎng)中的地理位置數(shù)據(jù)。”[1]大數(shù)據(jù)資源的持續(xù)、快速增長(zhǎng)在增強(qiáng)圖書(shū)館系統(tǒng)管理能力、服務(wù)能力、市場(chǎng)競(jìng)爭(zhēng)力及為發(fā)掘商業(yè)價(jià)值提供可靠大數(shù)據(jù)分析支持的同時(shí),也帶來(lái)了數(shù)據(jù)中心IT基礎(chǔ)設(shè)施架構(gòu)龐大、管理復(fù)雜、能耗巨大、運(yùn)維成本飆升和服務(wù)效率下降等問(wèn)題。因此,如何通過(guò)大數(shù)據(jù)資源的高效整合來(lái)提高其價(jià)值密度和數(shù)據(jù)可用性,是關(guān)系圖書(shū)館大數(shù)據(jù)應(yīng)用高效、大規(guī)模用戶(hù)個(gè)性化服務(wù)可用、系統(tǒng)運(yùn)營(yíng)綠色和經(jīng)濟(jì)的關(guān)鍵。

        1 大數(shù)據(jù)時(shí)代圖書(shū)館數(shù)據(jù)整合需求與面臨的挑戰(zhàn)

        1.1 圖書(shū)館IT基礎(chǔ)設(shè)施架構(gòu)優(yōu)化和系統(tǒng)安全運(yùn)營(yíng)的需求

        首先,圖書(shū)館IT基礎(chǔ)設(shè)施架構(gòu)的優(yōu)化,應(yīng)主要涉及IT基礎(chǔ)設(shè)施組織架構(gòu)是否有利于大數(shù)據(jù)資源和系統(tǒng)硬件設(shè)施的整合,數(shù)據(jù)中心IT基礎(chǔ)設(shè)施資源是否易于擴(kuò)展、管理和維護(hù),數(shù)據(jù)中心是否具有較低的管理、運(yùn)營(yíng)和維護(hù)成本,并在異構(gòu)環(huán)境中是否具有較強(qiáng)的安全性和可控性。其次,當(dāng)數(shù)據(jù)中心系統(tǒng)因整合而減少I(mǎi)T結(jié)構(gòu)復(fù)雜度和設(shè)備數(shù)量時(shí),用戶(hù)服務(wù)和數(shù)據(jù)存儲(chǔ)將在少量的單點(diǎn)設(shè)備上運(yùn)行,數(shù)據(jù)中心是否具有較低的單點(diǎn)故障率和數(shù)據(jù)存儲(chǔ)安全性。第三,虛擬化是IT基礎(chǔ)設(shè)施架構(gòu)整合的關(guān)鍵技術(shù)。數(shù)據(jù)中心不能因虛擬化技術(shù)的大量應(yīng)用,而導(dǎo)致系統(tǒng)安全隱患大幅增加和自身抗風(fēng)險(xiǎn)能力降低。第四,為了增強(qiáng)圖書(shū)館的用戶(hù)服務(wù)性能和系統(tǒng)可靠性,圖書(shū)館通常會(huì)在不同地域構(gòu)建若干個(gè)子數(shù)據(jù)中心來(lái)提高其用戶(hù)服務(wù)的效率和可靠性。對(duì)位于不同地域的子數(shù)據(jù)中心數(shù)據(jù)進(jìn)行有效的分析、挖掘和整合,也是關(guān)系圖書(shū)館IT基礎(chǔ)設(shè)施架構(gòu)優(yōu)化和系統(tǒng)運(yùn)營(yíng)安全的一個(gè)重要問(wèn)題[2]。

        1.2 數(shù)據(jù)中心異構(gòu)系統(tǒng)與應(yīng)用服務(wù)整合的需求

        首先,目前圖書(shū)館數(shù)據(jù)中心通常將關(guān)系系統(tǒng)安全、管理效率和用戶(hù)服務(wù)質(zhì)量的關(guān)鍵應(yīng)用部署在大型主機(jī)、Unix平臺(tái)上,而將一些非關(guān)鍵應(yīng)用部署在Unix或x86平臺(tái)上,導(dǎo)致IT基礎(chǔ)設(shè)施架構(gòu)多平臺(tái)化、應(yīng)用多元化、系統(tǒng)異構(gòu)、數(shù)據(jù)分散和信息孤島現(xiàn)象突出。其次,不同的操作系統(tǒng)、應(yīng)用服務(wù)和虛擬化平臺(tái)的安全需求與安全標(biāo)準(zhǔn)不同,很難將大數(shù)據(jù)流的獲取、組織、管理、分析、決策平臺(tái)的軟硬件系統(tǒng)一體化和預(yù)先集成。第三,如何以用戶(hù)需求和圖書(shū)館服務(wù)能力建設(shè)為指導(dǎo),在保證不同系統(tǒng)平臺(tái)效率的前提下,將數(shù)據(jù)中心原有系統(tǒng)和新開(kāi)發(fā)系統(tǒng)在大數(shù)據(jù)層面上實(shí)現(xiàn)無(wú)縫整合,是提高大數(shù)據(jù)平臺(tái)綜合效率與大數(shù)據(jù)服務(wù)有效性的關(guān)鍵[3]。第四,圖書(shū)館系統(tǒng)異構(gòu)主要可分為操作系統(tǒng)異構(gòu)、系統(tǒng)運(yùn)行平臺(tái)異構(gòu)、數(shù)據(jù)庫(kù)管理系統(tǒng)異構(gòu)、網(wǎng)絡(luò)協(xié)議異構(gòu)、用戶(hù)平臺(tái)異構(gòu)、認(rèn)證機(jī)制異構(gòu)、遠(yuǎn)程執(zhí)行方案異構(gòu)、數(shù)據(jù)自身的異構(gòu)等幾個(gè)方面,這些異構(gòu)大幅度增加了數(shù)據(jù)整合的難度和復(fù)雜性。

        1.3 增強(qiáng)大數(shù)據(jù)價(jià)值密度和可控性的需求

        IBM硅谷實(shí)驗(yàn)室大數(shù)據(jù)項(xiàng)目總監(jiān)Steven Sit,在2012年8月23日舉辦的以“技術(shù)維新,預(yù)見(jiàn)未來(lái)”為主題的2012 IBM軟件技術(shù)峰會(huì)上表示:“大數(shù)據(jù)現(xiàn)象才剛剛開(kāi)始,估計(jì)到2015年全球?qū)?huì)有超過(guò)15個(gè)ZB的數(shù)據(jù)容量?!盵4]同樣,隨著多媒體個(gè)性化服務(wù)、移動(dòng)閱讀和智能閱讀終端的推廣與普及,圖書(shū)館數(shù)據(jù)將呈現(xiàn)海量遞增、多樣性、非結(jié)構(gòu)化和時(shí)效性等特點(diǎn)。

        首先,在大數(shù)據(jù)時(shí)代,圖書(shū)館服務(wù)已從過(guò)去以資源消耗為主,轉(zhuǎn)變?yōu)橐源髷?shù)據(jù)資源保障為核心的個(gè)性化“綠色”服務(wù)。因此,大數(shù)據(jù)資源的價(jià)值密度與可控性關(guān)系到圖書(shū)館的服務(wù)創(chuàng)新能力和市場(chǎng)競(jìng)爭(zhēng)力。其次,隨著讀者需求和服務(wù)過(guò)程復(fù)雜度的增長(zhǎng),圖書(shū)館面臨著業(yè)務(wù)繁雜、數(shù)據(jù)存儲(chǔ)成本激增、計(jì)算需求增大、能耗巨大、成本控制和服務(wù)質(zhì)量保證等挑戰(zhàn),而大數(shù)據(jù)整合的有效性則是服務(wù)安全、高效、綠色和可控的保障。第四,大數(shù)據(jù)環(huán)境下,數(shù)據(jù)通常以碎片信息數(shù)據(jù)流的形式存在,單一、無(wú)規(guī)律的碎片信息數(shù)據(jù)無(wú)法呈現(xiàn)出大數(shù)據(jù)的分析、評(píng)估和預(yù)測(cè)價(jià)值。因此,圖書(shū)館必須以用戶(hù)服務(wù)需求為中心,對(duì)數(shù)據(jù)碎片進(jìn)行系統(tǒng)性的細(xì)分、搭配、重組與整合,才能提高數(shù)據(jù)的價(jià)值密度、可用性和可控性,最終實(shí)現(xiàn)大數(shù)據(jù)向大服務(wù)的轉(zhuǎn)變[5]。

        1.4 圖書(shū)館智慧服務(wù)與智慧管理的需求

        圖書(shū)館可利用大數(shù)據(jù)技術(shù)構(gòu)建智慧圖書(shū)館,實(shí)現(xiàn)服務(wù)系統(tǒng)的智慧管理與智慧服務(wù)。

        首先,圖書(shū)館只有通過(guò)對(duì)歷史數(shù)據(jù)與當(dāng)前數(shù)據(jù)的價(jià)值發(fā)現(xiàn)、數(shù)據(jù)整合與度量,完成對(duì)圖書(shū)館系統(tǒng)構(gòu)建要素關(guān)系、服務(wù)模式與內(nèi)容、服務(wù)市場(chǎng)、服務(wù)對(duì)象的準(zhǔn)確數(shù)據(jù)挖掘和現(xiàn)狀感知,才能正確把握?qǐng)D書(shū)館基礎(chǔ)設(shè)施結(jié)構(gòu)科學(xué)性、系統(tǒng)管理與服務(wù)能力、服務(wù)市場(chǎng)競(jìng)爭(zhēng)環(huán)境和讀者個(gè)性化閱讀需求的實(shí)際情況。其次,圖書(shū)館只有對(duì)所采集的全量數(shù)據(jù)、流式數(shù)據(jù)和離線(xiàn)數(shù)據(jù)進(jìn)行整合與關(guān)聯(lián)分析,以及對(duì)用戶(hù)需求態(tài)勢(shì)與服務(wù)效率進(jìn)行判定與調(diào)控,才能完成對(duì)未來(lái)服務(wù)模式與內(nèi)容變革、服務(wù)市場(chǎng)環(huán)境特點(diǎn)、用戶(hù)需求和個(gè)性化閱讀QOS(Quality of Service,服務(wù)質(zhì)量)的判定標(biāo)準(zhǔn)進(jìn)行準(zhǔn)確預(yù)測(cè)。第三,智慧服務(wù)保障是圖書(shū)館智慧管理的最終目的。因此,圖書(shū)館大數(shù)據(jù)資源整合只有堅(jiān)持以增強(qiáng)服務(wù)系統(tǒng)整體保障能力和服務(wù)資源綜合利用率為目的,才能提升大數(shù)據(jù)資源的價(jià)值密度和大數(shù)據(jù)服務(wù)的支撐力[6]。第四,數(shù)據(jù)整合的有效性和數(shù)據(jù)結(jié)構(gòu)的科學(xué)性決定著大數(shù)據(jù)平臺(tái)處理海量動(dòng)態(tài)、快速變化數(shù)據(jù)的效率與能力,關(guān)系著高速數(shù)據(jù)在短時(shí)間內(nèi)的價(jià)值有效性和即時(shí)服務(wù)質(zhì)量。因此,圖書(shū)館應(yīng)通過(guò)大數(shù)據(jù)平臺(tái)對(duì)實(shí)時(shí)采集的數(shù)據(jù)流進(jìn)行快速整合,以保證數(shù)據(jù)計(jì)算和存儲(chǔ)系統(tǒng)、信息發(fā)現(xiàn)和處理系統(tǒng)、業(yè)務(wù)決策系統(tǒng)和用戶(hù)服務(wù)系統(tǒng)的服務(wù)安全、高效、實(shí)時(shí)和優(yōu)質(zhì)[7]。

        1.5 大數(shù)據(jù)資源描述語(yǔ)法和元數(shù)據(jù)格式統(tǒng)一的需求

        圖書(shū)館采集的大數(shù)據(jù)資源主要由用戶(hù)服務(wù)數(shù)據(jù)、系統(tǒng)管理與運(yùn)營(yíng)監(jiān)控?cái)?shù)據(jù)、用戶(hù)行為數(shù)據(jù)、用戶(hù)閱讀活動(dòng)和社會(huì)關(guān)系數(shù)據(jù)、讀者論壇與博客反饋數(shù)據(jù)、讀者位置數(shù)據(jù)等組成。這些元數(shù)據(jù)的數(shù)據(jù)格式、標(biāo)準(zhǔn)和描述語(yǔ)法不統(tǒng)一,數(shù)據(jù)之間具有較強(qiáng)的沖突和不完整性。其次,數(shù)據(jù)資源之間結(jié)構(gòu)復(fù)雜并缺少規(guī)律性,數(shù)據(jù)之間無(wú)法進(jìn)行有效的語(yǔ)義關(guān)聯(lián),大幅度增加了無(wú)關(guān)數(shù)據(jù)語(yǔ)義關(guān)聯(lián)和整合的難度。第三,數(shù)據(jù)整合流程的科學(xué)性和結(jié)構(gòu)合理性以及實(shí)驗(yàn)數(shù)據(jù)格式的互操作性與可控性,也是關(guān)系大數(shù)據(jù)資源整合有效性的關(guān)鍵因素。第四,為了提高大數(shù)據(jù)資源整合的效率和降低整合成本,圖書(shū)館通常采用虛擬化方式進(jìn)行數(shù)據(jù)整合。如何擺脫數(shù)據(jù)物理存儲(chǔ)方式、途徑和位置對(duì)虛擬化存儲(chǔ)的限制,提高虛擬化融合模型的科學(xué)性和效率是圖書(shū)館應(yīng)關(guān)注的一個(gè)重要問(wèn)題[8]。

        2 圖書(shū)館大數(shù)據(jù)資源整合平臺(tái)的設(shè)計(jì)與整合策略

        2.1 圖書(shū)館大數(shù)據(jù)資源整合平臺(tái)的設(shè)計(jì)

        大數(shù)據(jù)資源整合是指共享或者合并來(lái)自于兩個(gè)或更多應(yīng)用的數(shù)據(jù),創(chuàng)建一個(gè)具有更多功能的企業(yè)應(yīng)用的過(guò)程。因此,圖書(shū)館大數(shù)據(jù)資源整合平臺(tái)設(shè)計(jì)應(yīng)采用多層次的系統(tǒng)結(jié)構(gòu)設(shè)計(jì),保證系統(tǒng)平臺(tái)具有較強(qiáng)的擴(kuò)展能力和以松散耦合度方式運(yùn)行。同時(shí),任何功能模式的增加、修改和刪除,均不能降低大數(shù)據(jù)資源整合平臺(tái)整體的功能性、易用性和可控性。筆者設(shè)計(jì)的圖書(shū)館大數(shù)據(jù)資源整合平臺(tái)系統(tǒng)架構(gòu)如圖1所示。

        圖書(shū)館大數(shù)據(jù)資源整合平臺(tái)系統(tǒng)架構(gòu)主要由管理操作層、數(shù)據(jù)預(yù)清洗與過(guò)濾層、數(shù)據(jù)整合層和大數(shù)據(jù)資源層四部分組成。管理操作層是用戶(hù)對(duì)平臺(tái)系統(tǒng)管理與應(yīng)用的接口,管理員通過(guò)對(duì)該層的操作完成大數(shù)據(jù)資源整合平臺(tái)系統(tǒng)的控制、管理、維護(hù)和應(yīng)用。數(shù)據(jù)預(yù)清洗與過(guò)濾層依據(jù)定義的數(shù)據(jù)清洗與過(guò)濾規(guī)則,對(duì)所采集的大數(shù)據(jù)資源進(jìn)行錯(cuò)誤與可用性檢查、數(shù)據(jù)質(zhì)量分析、數(shù)據(jù)過(guò)濾與清洗,保證大數(shù)據(jù)資源進(jìn)行數(shù)據(jù)整合時(shí)具有較高的價(jià)值密度和可操作性。數(shù)據(jù)整合層是將臨時(shí)數(shù)據(jù)庫(kù)中已進(jìn)行預(yù)清洗與過(guò)濾的數(shù)據(jù),通過(guò)數(shù)據(jù)源的讀取、數(shù)據(jù)轉(zhuǎn)換規(guī)則的解析和系統(tǒng)加載,將已轉(zhuǎn)換的數(shù)據(jù)寫(xiě)入主數(shù)據(jù)庫(kù),最終完成圖書(shū)館大數(shù)據(jù)資源的整合。大數(shù)據(jù)資源層主要由不同終端和監(jiān)控設(shè)備采集的大數(shù)據(jù)資源、臨時(shí)數(shù)據(jù)庫(kù)、主數(shù)據(jù)庫(kù)和應(yīng)用系統(tǒng)數(shù)據(jù)庫(kù)組成。圖書(shū)館采集的大數(shù)據(jù)資源暫時(shí)存放于臨時(shí)數(shù)據(jù)庫(kù)中,并根據(jù)預(yù)先定義好的規(guī)則進(jìn)行數(shù)據(jù)清洗與過(guò)濾,在進(jìn)行數(shù)據(jù)整合操作后導(dǎo)入主數(shù)據(jù)庫(kù)中。數(shù)據(jù)同步機(jī)制確保應(yīng)用系統(tǒng)數(shù)據(jù)和主數(shù)據(jù)庫(kù)中數(shù)據(jù)具有一致性,為圖書(shū)館大數(shù)據(jù)應(yīng)用提供了安全、高價(jià)值密度、可控和易用的數(shù)據(jù)支持[9]。

        圖1 圖書(shū)館大數(shù)據(jù)資源整合平臺(tái)系統(tǒng)架構(gòu)圖

        2.2 圖書(shū)館大數(shù)據(jù)資源整合的策略

        2.2.1 實(shí)現(xiàn)數(shù)據(jù)中心IT基礎(chǔ)設(shè)施架構(gòu)的高效整合與優(yōu)化

        據(jù)IDC(International Data Corporation,國(guó)際調(diào)查和研究公司)的研究表明,包含結(jié)構(gòu)化和非結(jié)構(gòu)化的大數(shù)據(jù)資源正在以每年60%的增長(zhǎng)率持續(xù)增長(zhǎng),2020年全球數(shù)據(jù)總量將增長(zhǎng)44倍,總量達(dá)到35.2ZB[10]。因此,圖書(shū)館必須加強(qiáng)數(shù)據(jù)中心IT基礎(chǔ)設(shè)施架構(gòu)的高效整合與優(yōu)化,才能統(tǒng)一圖書(shū)館系統(tǒng)異構(gòu)平臺(tái)和大數(shù)據(jù)資源模式,才能對(duì)具有海量數(shù)據(jù)、種類(lèi)繁多、實(shí)時(shí)性強(qiáng)和低價(jià)值密度的大數(shù)據(jù)資源進(jìn)行有效整合。

        首先,圖書(shū)館數(shù)據(jù)中心IT基礎(chǔ)設(shè)施架構(gòu)的整合與優(yōu)化,面臨著風(fēng)險(xiǎn)控制、降低成本、節(jié)約能耗和質(zhì)量保證的需求。因此,IT基礎(chǔ)設(shè)施架構(gòu)的高效整合應(yīng)以計(jì)算、存儲(chǔ)、網(wǎng)絡(luò)和數(shù)據(jù)備份設(shè)備的虛擬化整合為核心,以產(chǎn)品整合、信息整合和業(yè)務(wù)整合為目標(biāo),將系統(tǒng)資源劃分為資源池的方式進(jìn)行統(tǒng)一調(diào)度、使用,以減少I(mǎi)T基礎(chǔ)設(shè)施設(shè)備的冗余量,提高總體使用率。其次,IT基礎(chǔ)設(shè)施架構(gòu)的高效整合與優(yōu)化,應(yīng)堅(jiān)持統(tǒng)一數(shù)據(jù)環(huán)境和統(tǒng)一數(shù)據(jù)架構(gòu)的原則,確保圖書(shū)館可在統(tǒng)一整合標(biāo)準(zhǔn)、動(dòng)態(tài)和透明的環(huán)境中,安全、靈活、快速地部署、支持、管理和無(wú)縫訪(fǎng)問(wèn)所有數(shù)據(jù)。第三,對(duì)于圖書(shū)館數(shù)據(jù)中心的用戶(hù)服務(wù)器、數(shù)據(jù)存儲(chǔ)集群系統(tǒng)和網(wǎng)絡(luò)傳輸平臺(tái)硬件等工廠(chǎng)基礎(chǔ)設(shè)施的虛擬化整合,應(yīng)堅(jiān)持安全、高效、可靠、低碳和可擴(kuò)展的原則,確保大數(shù)據(jù)資源整合平臺(tái)可依據(jù)用戶(hù)的服務(wù)需求,進(jìn)行數(shù)據(jù)的訪(fǎng)問(wèn)、發(fā)現(xiàn)、清洗、集成和交付。第四,圖書(shū)館在數(shù)據(jù)中心IT基礎(chǔ)設(shè)施架構(gòu)優(yōu)化中,應(yīng)保證IT基礎(chǔ)設(shè)施架構(gòu)具備較強(qiáng)的靈活性、服務(wù)彈性和異構(gòu)環(huán)境適應(yīng)性,其可根據(jù)未來(lái)數(shù)據(jù)環(huán)境特點(diǎn)和整合需求進(jìn)行靈活的擴(kuò)展和伸縮,并具有智能、自動(dòng)化的管理與維護(hù)功能[11]。

        2.2.2 大數(shù)據(jù)資源整合平臺(tái)應(yīng)具備較強(qiáng)的功能性和可控性

        圖書(shū)館在大數(shù)據(jù)資源整合平臺(tái)的設(shè)計(jì)和采購(gòu)中,首先應(yīng)關(guān)注平臺(tái)系統(tǒng)功能模塊軟件的開(kāi)源性和獨(dú)立性,確保系統(tǒng)功能強(qiáng)大、易于開(kāi)發(fā)和成本低廉。此外,平臺(tái)系統(tǒng)架構(gòu)應(yīng)具備高彈性和可擴(kuò)充特性,用戶(hù)可依靠其內(nèi)嵌平臺(tái)定制開(kāi)發(fā)Java、C++等組件完成系統(tǒng)功能的擴(kuò)充,以滿(mǎn)足數(shù)據(jù)組合快速變動(dòng)和提升整體績(jī)效的需求。其次,整合平臺(tái)在復(fù)雜的數(shù)據(jù)整合工作流程管理設(shè)計(jì)中,應(yīng)采用工作排程的管理整合,將復(fù)雜的數(shù)據(jù)整合工作流程以創(chuàng)新的分布式架構(gòu)執(zhí)行。第三,按照用戶(hù)服務(wù)的實(shí)時(shí)性劃分,圖書(shū)館大數(shù)據(jù)資源整合平臺(tái)主要整合兩類(lèi)數(shù)據(jù)。一類(lèi)是數(shù)據(jù)海量但實(shí)時(shí)性要求不高的數(shù)據(jù),主要為系統(tǒng)日志、用戶(hù)行為數(shù)據(jù)、閱讀關(guān)系數(shù)據(jù)、系統(tǒng)配置數(shù)據(jù)等;另一類(lèi)是實(shí)時(shí)性要求高的數(shù)據(jù),主要為讀者個(gè)性化閱讀即時(shí)需求、用戶(hù)實(shí)時(shí)服務(wù)數(shù)據(jù)、讀者位置信息、系統(tǒng)安全防范與實(shí)時(shí)控制數(shù)據(jù)。圖書(shū)館大數(shù)據(jù)整合平臺(tái)應(yīng)具備對(duì)數(shù)據(jù)重要性和實(shí)時(shí)性?xún)?yōu)先級(jí)別的判定功能,在數(shù)據(jù)整合時(shí)可根據(jù)數(shù)據(jù)的實(shí)時(shí)性判定等級(jí)劃分順序進(jìn)行整合。第四,圖書(shū)館在大數(shù)據(jù)資源整合平臺(tái)設(shè)計(jì)中,應(yīng)注重利用原有關(guān)系數(shù)據(jù)庫(kù)系統(tǒng)在處理結(jié)構(gòu)化數(shù)據(jù)方面的效率優(yōu)勢(shì),并在此基礎(chǔ)上加強(qiáng)系統(tǒng)對(duì)非結(jié)構(gòu)化數(shù)據(jù)和流數(shù)據(jù)的整合,在不影響數(shù)據(jù)整合功能性和可用性的前提下,大幅度降低系統(tǒng)設(shè)計(jì)的成本投入。第五,圖書(shū)館應(yīng)加強(qiáng)大數(shù)據(jù)資源整合平臺(tái)數(shù)據(jù)輸入和輸出接口的智能化管理,確保平臺(tái)輸入端口可識(shí)別數(shù)據(jù)的類(lèi)型和整合需求,并將擬整合數(shù)據(jù)快速、準(zhǔn)確地發(fā)送至恰當(dāng)?shù)奶幚砟K進(jìn)行處理。同時(shí),處理后的數(shù)據(jù)應(yīng)自動(dòng)發(fā)送至主數(shù)據(jù)庫(kù)和相關(guān)應(yīng)用數(shù)據(jù)庫(kù)進(jìn)行保存和使用[12]。

        2.2.3 利用云計(jì)算技術(shù)確保數(shù)據(jù)整合的高效和經(jīng)濟(jì)

        隨著服務(wù)模式的變革和用戶(hù)需求的不斷發(fā)展,圖書(shū)館總數(shù)據(jù)量將呈現(xiàn)海量和級(jí)數(shù)增長(zhǎng)的態(tài)勢(shì)。依靠增加IT基礎(chǔ)設(shè)施設(shè)備數(shù)量、提升數(shù)據(jù)處理和存儲(chǔ)的性能、增強(qiáng)數(shù)據(jù)存儲(chǔ)和搜索的科學(xué)性、降低用戶(hù)服務(wù)QOS標(biāo)準(zhǔn)等方法,已經(jīng)不能有效解決未來(lái)復(fù)雜的大數(shù)據(jù)環(huán)境下大數(shù)據(jù)資源整合存在的問(wèn)題。因此,圖書(shū)館必須依靠云計(jì)算的技術(shù)支持,為大數(shù)據(jù)整合提供安全、高效、經(jīng)濟(jì)和可靠的云服務(wù)保障。

        根據(jù)數(shù)據(jù)的重要性和對(duì)圖書(shū)館用戶(hù)服務(wù)質(zhì)量影響力的大小,大數(shù)據(jù)資源可劃分為服務(wù)系統(tǒng)運(yùn)營(yíng)與安全監(jiān)控?cái)?shù)據(jù)、用戶(hù)個(gè)體特征與社會(huì)關(guān)系數(shù)據(jù)、用戶(hù)閱讀需求與行為隱私數(shù)據(jù)、用戶(hù)位置信息與行為預(yù)測(cè)等高安全級(jí)別的數(shù)據(jù),以及系統(tǒng)運(yùn)行日志、閱讀服務(wù)數(shù)據(jù)、用戶(hù)群需求數(shù)據(jù)、服務(wù)環(huán)境分析數(shù)據(jù)和客戶(hù)關(guān)系保障等安全級(jí)別低的數(shù)據(jù)。這些大數(shù)據(jù)資源具有數(shù)據(jù)總量增加快、時(shí)效性強(qiáng)、存儲(chǔ)與搜索難度大等特點(diǎn)。因此,圖書(shū)館必須將云計(jì)算技術(shù)與大數(shù)據(jù)整合需求相結(jié)合,才能確保數(shù)據(jù)整合的高效和經(jīng)濟(jì)[13]。

        首先,圖書(shū)館應(yīng)根據(jù)自身的經(jīng)濟(jì)實(shí)力、技術(shù)水平和大數(shù)據(jù)整合需求,采用自建私有云和租賃云服務(wù)商服務(wù)的方式,依靠外部云數(shù)據(jù)托管系統(tǒng)來(lái)存儲(chǔ)和備份他們的數(shù)據(jù),以減少I(mǎi)T基礎(chǔ)設(shè)施硬件、軟件系統(tǒng)建設(shè)和數(shù)據(jù)整合成本。其次,圖書(shū)館應(yīng)將安全級(jí)別較高的數(shù)據(jù)存放在私有云中,如果因經(jīng)濟(jì)與技術(shù)實(shí)力等原因必須存放在公有云中時(shí),應(yīng)與云服務(wù)商簽署科學(xué)、詳細(xì)的數(shù)據(jù)存儲(chǔ)、維護(hù)和災(zāi)難恢復(fù)協(xié)議,明確雙方的權(quán)利和職責(zé)。第三,云服務(wù)商對(duì)圖書(shū)館用戶(hù)進(jìn)行身份識(shí)別和權(quán)限認(rèn)證后,應(yīng)提供相應(yīng)的大數(shù)據(jù)資源Web遠(yuǎn)程訪(fǎng)問(wèn)、管理、部署和備份功能,保證大數(shù)據(jù)資源整合與管理過(guò)程安全、靈活、經(jīng)濟(jì)和便捷。第四,所構(gòu)建的云數(shù)據(jù)庫(kù)應(yīng)具備較強(qiáng)的數(shù)據(jù)管理、搜索、分析和依據(jù)用戶(hù)需求構(gòu)建數(shù)據(jù)模型的功能,不能影響已整合數(shù)據(jù)的查詢(xún)、下載和應(yīng)用效率[14]。

        2.2.4 以圖書(shū)館大數(shù)據(jù)服務(wù)QOS保障為目標(biāo)

        讀者作為圖書(shū)館個(gè)性化服務(wù)的承載者,具有較強(qiáng)的社會(huì)屬性。因此,圖書(shū)館大數(shù)據(jù)服務(wù)的模式、內(nèi)容、方法和途徑也應(yīng)具有較強(qiáng)的社會(huì)屬性,大數(shù)據(jù)整合應(yīng)以用戶(hù)大數(shù)據(jù)服務(wù)的QOS保障為目標(biāo)。

        首先,大數(shù)據(jù)整合應(yīng)有效保障圖書(shū)館運(yùn)營(yíng)從大生產(chǎn)向大服務(wù)的轉(zhuǎn)型。圖書(shū)館應(yīng)依據(jù)大數(shù)據(jù)資源的整合優(yōu)勢(shì),將讀者服務(wù)競(jìng)爭(zhēng)力從傳統(tǒng)IT環(huán)境下以數(shù)據(jù)中心硬件設(shè)備運(yùn)營(yíng)性能的競(jìng)爭(zhēng),向大數(shù)據(jù)環(huán)境下圖書(shū)館大數(shù)據(jù)分析與決策能力的競(jìng)爭(zhēng)轉(zhuǎn)變,準(zhǔn)確、快速和適時(shí)地分析、判斷讀者個(gè)性化閱讀需求,依據(jù)讀者閱讀需求變化為其提供相應(yīng)的大數(shù)據(jù)個(gè)性化服務(wù)產(chǎn)品。其次,大數(shù)據(jù)整合應(yīng)以?xún)?yōu)化圖書(shū)館服務(wù)流程、提升服務(wù)速度與時(shí)效、提高營(yíng)銷(xiāo)管理效率和個(gè)性化用戶(hù)服務(wù)相關(guān)性為目標(biāo),將不同終端設(shè)備采集的大數(shù)據(jù)資源進(jìn)行科學(xué)整合。第三,大數(shù)據(jù)資源整合應(yīng)以提升圖書(shū)館業(yè)務(wù)的挖掘深度、服務(wù)針對(duì)性、用戶(hù)感知能力和用戶(hù)對(duì)服務(wù)產(chǎn)品的適應(yīng)性為目標(biāo),實(shí)現(xiàn)大數(shù)據(jù)庫(kù)內(nèi)部數(shù)據(jù)和服務(wù)資源的整合,最終完成以用戶(hù)大數(shù)據(jù)分析結(jié)果為依據(jù),實(shí)現(xiàn)用戶(hù)服務(wù)內(nèi)容和模式的定制與推送。第四,大數(shù)據(jù)整合應(yīng)以提升圖書(shū)館對(duì)讀者閱讀關(guān)系、閱讀愛(ài)好、情緒與行為等數(shù)據(jù)價(jià)值獲取的能力為目的,依據(jù)數(shù)據(jù)分析結(jié)果來(lái)判斷所提供服務(wù)的準(zhǔn)確性和用戶(hù)適應(yīng)性。此外,圖書(shū)館還可依據(jù)大數(shù)據(jù)分析結(jié)果,實(shí)現(xiàn)圖書(shū)館與第三方大數(shù)據(jù)商、服務(wù)運(yùn)營(yíng)商的跨界整合,擴(kuò)展大數(shù)據(jù)服務(wù)的內(nèi)容和質(zhì)量[15]。

        2.2.5 統(tǒng)一系統(tǒng)數(shù)據(jù)架構(gòu)和實(shí)現(xiàn)智能化整合

        首先,在構(gòu)建統(tǒng)一的數(shù)據(jù)環(huán)境時(shí),圖書(shū)館會(huì)面臨系統(tǒng)管理與用戶(hù)服務(wù)過(guò)程中產(chǎn)生的各種新型數(shù)據(jù)類(lèi)型和系統(tǒng)。這種新型數(shù)據(jù)類(lèi)型與系統(tǒng)的多樣性會(huì)嚴(yán)重影響大數(shù)據(jù)價(jià)值發(fā)現(xiàn)、挖掘、分析與提取的有效性,也嚴(yán)重影響圖書(shū)館服務(wù)能力和業(yè)務(wù)洞察力的提高。因此,圖書(shū)館的大數(shù)據(jù)資源整合必須首先實(shí)現(xiàn)系統(tǒng)數(shù)據(jù)架構(gòu)的統(tǒng)一與標(biāo)準(zhǔn)化。其次,在大數(shù)據(jù)資源整合平臺(tái)構(gòu)建中,平臺(tái)系統(tǒng)設(shè)計(jì)者應(yīng)保證系統(tǒng)平臺(tái)模塊之間的數(shù)據(jù)連接器可以安全、高效、透明、無(wú)縫地實(shí)現(xiàn)數(shù)據(jù)的輸入與輸出。同時(shí),平臺(tái)系統(tǒng)可以根據(jù)主動(dòng)監(jiān)控事件和安全預(yù)警來(lái)識(shí)別風(fēng)險(xiǎn)和系統(tǒng)故障,并通過(guò)反饋控制進(jìn)行智能化的安全管理和安全事件報(bào)警。第三,大數(shù)據(jù)整合平臺(tái)應(yīng)擁有統(tǒng)一的管理界面和較低的系統(tǒng)復(fù)雜度,具備較高的系統(tǒng)運(yùn)行效率與數(shù)據(jù)加載能力,可輔助管理員智能化地管理、分析海量的結(jié)構(gòu)化、非結(jié)構(gòu)化及多種結(jié)構(gòu)化的數(shù)據(jù)。第四,大數(shù)據(jù)整合應(yīng)以圖書(shū)館服務(wù)能力的提升和用戶(hù)需求為核心,以低碳、環(huán)保為目標(biāo),通過(guò)優(yōu)化、整合軟硬件平臺(tái)系統(tǒng),實(shí)現(xiàn)大數(shù)據(jù)資源的高效、“綠色”整合。同時(shí),圖書(shū)館還應(yīng)加強(qiáng)大數(shù)據(jù)資源整合過(guò)程中的法律和制度保障,以及圖書(shū)館在大數(shù)據(jù)備份、存儲(chǔ)、使用和共享過(guò)程的安全管理,并執(zhí)行符合大數(shù)據(jù)資源整合生命周期管理的應(yīng)用策略,確保大數(shù)據(jù)整合過(guò)程的可管、可控和可監(jiān)督[16]。

        3 結(jié) 語(yǔ)

        大數(shù)據(jù)時(shí)代,數(shù)據(jù)結(jié)構(gòu)的科學(xué)性、可共享性、價(jià)值量和易操作性,是關(guān)系圖書(shū)館系統(tǒng)運(yùn)營(yíng)安全性和效率、用戶(hù)服務(wù)模式與內(nèi)容變革、服務(wù)能力提升和客戶(hù)關(guān)系管理有效性的重要因素。如何構(gòu)建科學(xué)的IT基礎(chǔ)設(shè)施架構(gòu)和采用科學(xué)、合理的策略,對(duì)低價(jià)值密度、海量、無(wú)序和分散的大數(shù)據(jù)資源進(jìn)行采集、清洗、轉(zhuǎn)換和整合,使數(shù)據(jù)資源結(jié)構(gòu)合理、高價(jià)值密度、可管理和易用,是圖書(shū)館獲取新的市場(chǎng)洞察和預(yù)測(cè)分析能力,科學(xué)匹配、優(yōu)化服務(wù)資源和滿(mǎn)足讀者個(gè)性化需求的關(guān)鍵[17]。

        因此,圖書(shū)館必須以提高讀者個(gè)性化服務(wù)保障力和大數(shù)據(jù)資源的價(jià)值總量為目標(biāo),構(gòu)建科學(xué)的大數(shù)據(jù)整合、管理平臺(tái)和服務(wù)資源整合體系。同時(shí),圖書(shū)館應(yīng)結(jié)合用戶(hù)服務(wù)系統(tǒng)的保障需求與特點(diǎn),仔細(xì)分析圖書(shū)館大數(shù)據(jù)資源的結(jié)構(gòu)特征、價(jià)值屬性、可控性和可用性,并對(duì)不同數(shù)據(jù)源、數(shù)據(jù)格式、性質(zhì)和應(yīng)用對(duì)象的數(shù)據(jù)進(jìn)行高效整合,才能增強(qiáng)數(shù)據(jù)之間的關(guān)聯(lián)性,消除信息孤島和提高知識(shí)發(fā)現(xiàn)的廣度與深度,為圖書(shū)館用戶(hù)服務(wù)決策的制定、系統(tǒng)管理與運(yùn)營(yíng)、服務(wù)資源的整體優(yōu)化和客戶(hù)關(guān)系管理提供可靠的大數(shù)據(jù)支持[18]。

        [1]Weber L. Marketing to the Social Web: How Digital Customer Communities Build Your Business[M].John Wiley & Sons,2007.

        [2]劉雪瓊,武 剛,鄧厚平.Web信息整合中的數(shù)據(jù)去重方法[J].計(jì)算機(jī)應(yīng)用,2013,33(9):2493-2496.

        [3]葉煥倬,吳 迪.相似重復(fù)記錄清理方法研究綜述[J].現(xiàn)代圖書(shū)情報(bào)技術(shù),2010(9):56-66.

        [4]2012年IBM軟件技術(shù)峰會(huì)專(zhuān)題[EB/OL].[2013-05-01].http://tech.sina.com.cn/it/2012-08-23/11387538429.shtml.

        [5]何 非,何克清.大數(shù)據(jù)及其科學(xué)問(wèn)題與方法的探討[J].武漢大學(xué)學(xué)報(bào):理學(xué)版,2014,60(1):1-12.

        [6]白如江,冷伏?!?大數(shù)據(jù)”時(shí)代科學(xué)數(shù)據(jù)整合研究[J].情報(bào)理論與實(shí)踐,2014,37(1):94-99.

        [7]周曉方,陸嘉恒,李翠平,等.從數(shù)據(jù)管理視角看大數(shù)據(jù)挑戰(zhàn)[J].中國(guó)計(jì)算機(jī)學(xué)會(huì)通訊,2012,8(9):16-20.

        [8]Lee K P,Hu J K.XMLSchema Representation of DICOM Structured Reporting[J].Journal of the American Medical Informatics Association,2003,10(2):213-223.

        [9]畢億默,盧 超,王 華. 一種數(shù)據(jù)交換整合平臺(tái)的設(shè)計(jì)與實(shí)現(xiàn)[J].計(jì)算機(jī)應(yīng)用與軟件,2013,30(12):127-129,136.

        [10]IBM展示業(yè)界最完整大數(shù)據(jù)解決方案[EB/OL].[2013-05-01].http://server.zdnet.com.cn/server/2013/0317/2148815.shtml.

        [11]侯 麗,李 姣.健康信息資源公益性開(kāi)發(fā)中異構(gòu)數(shù)據(jù)整合方案的研究與應(yīng)用[J].現(xiàn)代圖書(shū)情報(bào)技術(shù),2013(4):83-896.

        [12]管 進(jìn).基于關(guān)聯(lián)數(shù)據(jù)的圖書(shū)館知識(shí)服務(wù)策略研究[J].圖書(shū)館理論與實(shí)踐,2012(6):9-11.

        [13]Heterogeneous Database System[EB/OL].[2013-03-14].http://en.wikipedia.org/wiki/Heterogeneous Database_System.

        [14]程學(xué)旗.大數(shù)據(jù)的應(yīng)用與科學(xué)問(wèn)題探討[R].數(shù)學(xué)與大數(shù)據(jù)科學(xué)論壇.北京:中國(guó)科學(xué)院,2013:43-52.

        [15]姜 山,王 剛.大數(shù)據(jù)對(duì)圖書(shū)館的啟示[J].圖書(shū)館工作與研究,2013(4):52-54,79

        [16]秦 鴻,錢(qián)國(guó)富,鐘遠(yuǎn)薪.三種發(fā)現(xiàn)服務(wù)系統(tǒng)的比較研究[J].大學(xué)圖書(shū)館學(xué)報(bào),2012(5):5-11,17.

        [17]李國(guó)杰.大數(shù)據(jù)研究的科學(xué)價(jià)值[J].中國(guó)計(jì)算機(jī)學(xué)會(huì)通訊,2012,8(9):8-15.

        [18]王元卓,靳小龍,程學(xué)旗.網(wǎng)絡(luò)大數(shù)據(jù):現(xiàn)狀與展望[J].計(jì)算機(jī)學(xué)報(bào),2013,36(6):1125-1138.

        猜你喜歡
        用戶(hù)服務(wù)資源整合架構(gòu)
        基于FPGA的RNN硬件加速架構(gòu)
        少先隊(duì)活動(dòng)與校外資源整合的實(shí)踐與探索
        功能架構(gòu)在電子電氣架構(gòu)開(kāi)發(fā)中的應(yīng)用和實(shí)踐
        “五育并舉”下家校社資源整合的價(jià)值意義
        海外并購(gòu)中的人力資源整合之道
        智慧高速資源整合方式實(shí)踐
        新媒體時(shí)代老年類(lèi)報(bào)刊的用戶(hù)服務(wù)轉(zhuǎn)型與升級(jí)對(duì)策
        LSN DCI EVPN VxLAN組網(wǎng)架構(gòu)研究及實(shí)現(xiàn)
        科學(xué)數(shù)據(jù)共享平臺(tái)的建設(shè)與服務(wù)探討
        “互聯(lián)網(wǎng)+”時(shí)代學(xué)術(shù)期刊的轉(zhuǎn)型路徑分析
        出版廣角(2016年20期)2016-12-17 16:02:46
        青青草视频在线观看入口| 免费人成无码大片在线观看| 广东少妇大战黑人34厘米视频| 亚洲av日韩av一卡二卡| 亚洲成av人片在线天堂无| 尤物蜜桃视频一区二区三区| 国产18禁黄网站免费观看| 丰满少妇高潮惨叫久久久一| 99偷拍视频精品一区二区| 国产精品中文第一字幕| 亚洲国产精品二区三区| 日韩肥臀人妻中文字幕一区| 人妻精品久久久久中文字幕| 国产在视频线精品视频| 传媒在线无码| 国产av一区网址大全| 中文字幕综合一区二区| 日本欧美大码a在线观看| 欧美一区二区三区红桃小说 | 国产精品一区二区三区不卡| 亚洲精品中文字幕一二| 亚洲综合国产成人丁香五月激情 | 性色av无码久久一区二区三区| 亚洲AV综合久久九九| 日本中出熟女一区二区| 亚洲一区二区三区激情在线观看| 日本边添边摸边做边爱喷水| 欧美在线 | 亚洲| 精品国产品欧美日产在线| 白嫩少妇在线喷水18禁| 男女男精品视频网站免费看| 国产av无码专区亚洲av毛网站| 996久久国产精品线观看| 美女福利一区二区三区在线观看 | 国产xxx69麻豆国语对白| 久久婷婷国产剧情内射白浆| 水蜜桃一二二视频在线观看免费 | 国产免费一区二区三区免费视频 | 亚洲欧美日韩中文字幕网址| 日本熟妇免费一区二区三区| 国产情侣自拍一区视频|