(蘭州商學(xué)院網(wǎng)絡(luò)中心 甘肅蘭州 730020)
在大數(shù)據(jù)環(huán)境下,首先,數(shù)字圖書館管理數(shù)據(jù)與服務(wù)數(shù)據(jù)呈現(xiàn)海量增加,并從TB級別躍升到PB級別。對硬件與軟件服務(wù)系統(tǒng)性能提出了較高要求。其次,隨著圖書館個(gè)性化數(shù)字服務(wù)的快速發(fā)展,圖書館系統(tǒng)與網(wǎng)絡(luò)日志、監(jiān)控與服務(wù)視頻、圖片、音頻和增值服務(wù)信息等非結(jié)構(gòu)化數(shù)據(jù)量,將遠(yuǎn)遠(yuǎn)超越傳統(tǒng)圖書館以數(shù)字文本為主的結(jié)構(gòu)化數(shù)據(jù)量,占據(jù)數(shù)據(jù)總量的80%以上。第三,圖書館海量數(shù)據(jù)的價(jià)值密度較低,數(shù)據(jù)年增長率與數(shù)據(jù)的價(jià)值密度呈現(xiàn)反比關(guān)系。第四,圖書館數(shù)據(jù)處理的時(shí)效性較高,可通過高效、快速的數(shù)據(jù)處理過程,來提高數(shù)據(jù)的價(jià)值密度和可用性。
1.2.1 可對讀者閱讀需求和行為進(jìn)行準(zhǔn)確分析
目前,隨著計(jì)算機(jī)與通信技術(shù)的快速發(fā)展,科學(xué)技術(shù)已不是制約讀者數(shù)字閱讀體驗(yàn)質(zhì)量的最主要因素。圖書館能否準(zhǔn)確預(yù)測、分析讀者閱讀需求和行為,并通過個(gè)性化推送式服務(wù)來提高讀者信息獲取的效率、準(zhǔn)確性、經(jīng)濟(jì)性和便捷性,成為提高讀者閱讀質(zhì)量和降低圖書館服務(wù)成本的關(guān)鍵。
數(shù)據(jù)量的急劇膨脹是數(shù)字圖書館集團(tuán)面臨的一個(gè)嚴(yán)峻問題。要求通過構(gòu)建新的數(shù)據(jù)挖掘、分析和決策策略,采用大規(guī)模并行處理技術(shù)和分布式系統(tǒng)架構(gòu),來實(shí)現(xiàn)海量數(shù)據(jù)的高效處理和深度挖掘。確保正確把握圖書館與讀者之間、不同服務(wù)數(shù)據(jù)之間、讀者與服務(wù)數(shù)據(jù)之間的關(guān)系和發(fā)展趨勢,確保讀者個(gè)性化定制服務(wù)的有效性和可用性。〔1〕
1.2.2 大數(shù)據(jù)管理平臺(tái)具有較強(qiáng)功能性和可用性的需求
大數(shù)據(jù)平臺(tái)首先應(yīng)具備對用戶、管理、服務(wù)和其他相關(guān)信息進(jìn)行數(shù)據(jù)采集、處理、判定和高級分析的能力,并實(shí)現(xiàn)價(jià)值數(shù)據(jù)和分析結(jié)果的可視化表現(xiàn)。其次,圖書館大數(shù)據(jù)平臺(tái)應(yīng)具備良好的兼容性和可擴(kuò)展性,可為新的數(shù)據(jù)管理與分析軟件提供高性能支持平臺(tái)。通過為主數(shù)據(jù)創(chuàng)建可信賴的視圖,來優(yōu)化數(shù)據(jù)的管理流程和實(shí)現(xiàn)工作負(fù)載均衡。第三,大數(shù)據(jù)管理平臺(tái)應(yīng)支持元數(shù)據(jù)共享、自動(dòng)查詢和數(shù)據(jù)管理模式的自適應(yīng)優(yōu)化,實(shí)現(xiàn)數(shù)據(jù)的高效整合、即時(shí)分析、智能處理和服務(wù)的自動(dòng)化響應(yīng)。第四,大數(shù)據(jù)管理平臺(tái)應(yīng)實(shí)現(xiàn)對數(shù)據(jù)庫結(jié)構(gòu)化和非結(jié)構(gòu)化數(shù)據(jù)的實(shí)時(shí)訪問,可通過智能化管理策略來降低圖書館大數(shù)據(jù)環(huán)境的復(fù)雜度,提高管理員數(shù)據(jù)分析效率和降低系統(tǒng)平臺(tái)的響應(yīng)時(shí)間。
1.2.3 可幫助圖書館進(jìn)行服務(wù)分析與決策
首先,圖書館需要建設(shè)高效的大數(shù)據(jù)管理系統(tǒng)和制定集成的大數(shù)據(jù)解決方案,提高大數(shù)據(jù)時(shí)代圖書館對數(shù)據(jù)挖掘、分析、管理和決策的智能化水平。并在保證服務(wù)質(zhì)量與符合大數(shù)據(jù)標(biāo)準(zhǔn)的前提下,有效控制服務(wù)成本和運(yùn)營風(fēng)險(xiǎn),提高讀者的閱讀收益率。其次,在大數(shù)據(jù)環(huán)境下,圍繞數(shù)據(jù)價(jià)值產(chǎn)生的關(guān)聯(lián)應(yīng)用復(fù)雜多變。讀者、圖書館、云服務(wù)與網(wǎng)絡(luò)服務(wù)商均應(yīng)重新定位自身角色和相互關(guān)系,構(gòu)建以數(shù)據(jù)價(jià)值為核心,以服務(wù)、對象、技術(shù)、產(chǎn)品和應(yīng)用為一體的個(gè)性化推送服務(wù)。第三,數(shù)據(jù)的集成、管理、挖掘、處理與分析過程,應(yīng)涉及圖書館服務(wù)平臺(tái)構(gòu)建、服務(wù)創(chuàng)建和服務(wù)推送的全過程,并在數(shù)據(jù)挖掘、業(yè)務(wù)分析、服務(wù)決策和服務(wù)推送過程實(shí)現(xiàn)適時(shí)監(jiān)測和讀者互動(dòng)?!?〕
1.2.4 讀者數(shù)字閱讀隱私保護(hù)的需求
隨著大數(shù)據(jù)時(shí)代數(shù)字圖書館信息量的快速增加,以及數(shù)據(jù)采集、存儲(chǔ)、分析和處理效率的不斷提高,如何有效保護(hù)讀者閱讀活動(dòng)的敏感數(shù)據(jù)和個(gè)人隱私,防止個(gè)人敏感和隱私數(shù)據(jù)被截獲、竊取、篡改和破壞,成為保證圖書館大數(shù)據(jù)環(huán)境安全和個(gè)人閱讀隱私應(yīng)重點(diǎn)關(guān)注的問題。首先,面對大數(shù)據(jù)環(huán)境下不同的數(shù)據(jù)源、合作伙伴、數(shù)據(jù)管理系統(tǒng)和服務(wù)對象,數(shù)字圖書館應(yīng)統(tǒng)一數(shù)據(jù)采集、存儲(chǔ)、分析和處理的標(biāo)準(zhǔn),并保證數(shù)據(jù)類型和應(yīng)用過程符合大數(shù)據(jù)環(huán)境相關(guān)安全規(guī)定。此外,圖書館管理員在監(jiān)控、采集讀者閱讀行為數(shù)據(jù)和瀏覽個(gè)人隱私信息時(shí),應(yīng)制定詳細(xì)的管理員閱讀權(quán)限管理、數(shù)據(jù)保密管理和已采集數(shù)據(jù)網(wǎng)絡(luò)安全傳輸管理的制度,防止非法用戶利用大數(shù)據(jù)環(huán)境對讀者數(shù)據(jù)進(jìn)行分析,進(jìn)而明確讀者的隱私、閱讀習(xí)慣和閱讀需求的發(fā)展趨勢。
構(gòu)建戰(zhàn)略理論、制定詳細(xì)方案和服務(wù)實(shí)踐,是圖書館服務(wù)模式構(gòu)建與服務(wù)實(shí)踐的三個(gè)主要步驟。
圖書館大數(shù)據(jù)環(huán)境的科學(xué)性、可用性、可控性和經(jīng)濟(jì)性,是圖書館科學(xué)建設(shè)與制定服務(wù)戰(zhàn)略理論的前提,是用戶服務(wù)模式變革的基礎(chǔ)。同時(shí)也是保證用戶服務(wù)實(shí)踐過程中數(shù)據(jù)的有效整合,實(shí)現(xiàn)大數(shù)據(jù)生命周期全程管理的要求。首先,圖書館應(yīng)提高基于云服務(wù)平臺(tái)的大數(shù)據(jù)采集、處理和分析能力,保證大數(shù)據(jù)管理平臺(tái)具有較強(qiáng)的系統(tǒng)資源管理、分配、優(yōu)化和安全性,能夠?yàn)閳D書館提供正確、可靠和高價(jià)值的決策數(shù)據(jù)。其次,圖書館應(yīng)樹立以大數(shù)據(jù)為中心的服務(wù)價(jià)值理念。通過對所收集到的海量數(shù)據(jù)進(jìn)行價(jià)值過濾和收益評估,構(gòu)建出符合讀者需求、用戶服務(wù)收益和管理效率提升的新服務(wù)模式。第三,應(yīng)通過對圖書館海量數(shù)據(jù)做統(tǒng)計(jì)性的搜索、比較、聚類和分類等分析歸納,完成大數(shù)據(jù)全局環(huán)境下的服務(wù)價(jià)值挖掘、預(yù)測讀者服務(wù)商機(jī)和預(yù)測經(jīng)營風(fēng)險(xiǎn),為讀者提供可滿足內(nèi)在閱讀活動(dòng)需求的個(gè)性化推送式服務(wù)。〔3〕
對讀者閱讀行為和閱讀需求實(shí)時(shí)分析的準(zhǔn)確性、及時(shí)性,是圖書館有效結(jié)合大數(shù)據(jù)環(huán)境下用戶閱讀需求和環(huán)境變化實(shí)際,進(jìn)而調(diào)整圖書館服務(wù)目的、策略、內(nèi)容和方法的關(guān)鍵。首先,傳統(tǒng)數(shù)字圖書館對讀者需求、閱讀有效性和滿意度的統(tǒng)計(jì),是基于已采集數(shù)據(jù)的基礎(chǔ)之上的。而大數(shù)據(jù)環(huán)境下,圖書館可實(shí)時(shí)、準(zhǔn)確地對所采集的數(shù)據(jù)進(jìn)行分析、處理、判定和決策,并通過自我學(xué)習(xí)來提高系統(tǒng)的智能、自動(dòng)化水平。同時(shí),可對讀者進(jìn)行實(shí)時(shí)的閱讀情緒與閱讀收益分析,不斷提高讀者閱讀質(zhì)量和滿意度。其次,閱讀服務(wù)的可擴(kuò)展性是保證服務(wù)質(zhì)量的又一個(gè)重要因素。傳統(tǒng)數(shù)字環(huán)境下,圖書館是通過關(guān)聯(lián)規(guī)則和協(xié)同式過濾等技術(shù)來實(shí)現(xiàn)信息推送式服務(wù)。而大數(shù)據(jù)環(huán)境下,通過大數(shù)據(jù)技術(shù)對跨多個(gè)信息平臺(tái)的數(shù)據(jù)實(shí)現(xiàn)過濾、分析與整合,確保信息推送式服務(wù)可根據(jù)讀者需求而無限擴(kuò)展。第三,大數(shù)據(jù)環(huán)境下,應(yīng)通過對大數(shù)據(jù)系統(tǒng)的分析,發(fā)現(xiàn)影響讀者閱讀有效性、愉悅感和滿意度的瓶頸因素,并根據(jù)影響力評估指標(biāo)的內(nèi)容、影響因子和判定方法進(jìn)行修訂,提高評估的科學(xué)性、準(zhǔn)確性和實(shí)時(shí)性?!?〕
實(shí)行基于大數(shù)據(jù)技術(shù)的用戶個(gè)性化服務(wù)管理,是圖書館掌握用戶閱讀需求、提升讀者個(gè)性化服務(wù)質(zhì)量和避免讀者流失的保證。
首先,大數(shù)據(jù)環(huán)境下,圖書館通過對采集的半結(jié)構(gòu)化和非結(jié)構(gòu)化數(shù)據(jù)進(jìn)行鑒別、過濾、分類和處理,可根據(jù)閱讀需求、行為對讀者特征進(jìn)行標(biāo)示,為用戶提供個(gè)性化推送式數(shù)字閱讀服務(wù)。圖書館可通過對讀者統(tǒng)一身份認(rèn)證和統(tǒng)一權(quán)限管理,利用論壇、微博、電子郵箱、移動(dòng)服務(wù)和其他第三方增值服務(wù)等方式,利用多種信息推送渠道為讀者提供“一站式”閱讀服務(wù),保證讀者個(gè)性化閱讀服務(wù)具有較強(qiáng)的移動(dòng)性和即時(shí)性。其次,在用戶個(gè)性化閱讀管理中,應(yīng)采集正確、可用的讀者個(gè)性化閱讀行為數(shù)據(jù)、圖書館服務(wù)可用性數(shù)據(jù)、讀者閱讀需求和滿意度評估數(shù)據(jù),并建立讀者閱讀體驗(yàn)滿意度分析模型、讀者閱讀行為分析模型、個(gè)性化服務(wù)模式對用戶流失的影響力模型等。通過對所采集的數(shù)據(jù)進(jìn)行有效分析,保證管理與服務(wù)策略的制定與執(zhí)行過程科學(xué)、高效、經(jīng)濟(jì)、可用。第三,圖書館業(yè)務(wù)的完整性、讀者群的可靠性、閱讀活動(dòng)信息的價(jià)值和可獲取性、用戶服務(wù)的經(jīng)濟(jì)性和低碳性,是大數(shù)據(jù)環(huán)境下決定圖書館市場競爭力的關(guān)鍵因素。因此,應(yīng)通過大數(shù)據(jù)技術(shù)加強(qiáng)圖書館數(shù)據(jù)處理能力和跨平臺(tái)的數(shù)據(jù)整合能力,真正為讀者閱讀活動(dòng)提供個(gè)性化推送服務(wù)?!?〕
在大數(shù)據(jù)環(huán)境下,首先,圖書館數(shù)據(jù)可用性和大數(shù)據(jù)技術(shù)有效性,是評估圖書館大數(shù)據(jù)系統(tǒng)重點(diǎn)考慮的內(nèi)容。重點(diǎn)評估圖書館數(shù)據(jù)采集、有效數(shù)據(jù)過慮、快速處理、云計(jì)算和科學(xué)決策的能力,是否能夠及時(shí)發(fā)現(xiàn)、預(yù)測和修正圖書館系統(tǒng)運(yùn)行缺陷,以及在讀者服務(wù)模式變革、運(yùn)營成本變化和讀者閱讀服務(wù)保障等方面存在的不足。其次,圖書館通過大數(shù)據(jù)平臺(tái)與技術(shù),可將不同內(nèi)容、數(shù)據(jù)模式和使用對象的無關(guān)數(shù)據(jù)孤島,整合為一個(gè)統(tǒng)一的大數(shù)據(jù)平臺(tái)。通過對讀者特征 (年齡、性別、學(xué)歷等)、地理區(qū)域 (所處的地域或國家)、閱讀習(xí)慣和閱讀收益 (信息獲取效率、知識(shí)可用性、閱讀成本和閱讀愉悅感等)等數(shù)據(jù)進(jìn)行分析,可即時(shí)、情景地感知與洞察服務(wù)用戶水平,并有效評估圖書館在服務(wù)優(yōu)化、服務(wù)模式轉(zhuǎn)變和降低服務(wù)風(fēng)險(xiǎn)等方面的能力。第三,圖書館服務(wù)安全性的評估。隨著圖書館服務(wù)模式、內(nèi)容的不斷發(fā)展,圖書館服務(wù)系統(tǒng)基礎(chǔ)設(shè)施結(jié)構(gòu)和服務(wù)模式的復(fù)雜度不斷增強(qiáng),其安全防御的對象、內(nèi)容和難度成倍增長。同時(shí),黑客也可利用云計(jì)算、大數(shù)據(jù)等技術(shù),采用多種攻擊方法和途徑對圖書館管理與服務(wù)系統(tǒng)、讀者進(jìn)行攻擊。有效利用大數(shù)據(jù)平臺(tái)、網(wǎng)絡(luò)平臺(tái)、云計(jì)算平臺(tái)和智能運(yùn)營管道等,對圖書館所面臨的安全威脅、不穩(wěn)定因素、安全防御與實(shí)時(shí)檢測系統(tǒng)進(jìn)行科學(xué)評估,是增強(qiáng)圖書館系統(tǒng)安全性和服務(wù)可靠性的關(guān)鍵?!?〕
1.漆晨曦.電信企業(yè)大數(shù)據(jù)分析、應(yīng)用及管理發(fā)展策略.電信科學(xué),2013(3):12-15
2.百度百科.大數(shù)據(jù).〔2013 -06 -02〕.http://baike.baidu.com/view/6954399.htm
3.康波,劉勝強(qiáng).基于大數(shù)據(jù)分析的互聯(lián)網(wǎng)業(yè)務(wù)用戶體驗(yàn)管理.電信科學(xué),2013(3):32-35
4.Cerra A,Easterwood K,Power J.Transforming Business- Big Data,Mobility,and Globalization.Wiley,UK,2012
5.陶彩霞,謝曉軍,陳康,郭利榮,劉春.基于云計(jì)算的移動(dòng)互聯(lián)網(wǎng)大數(shù)據(jù)用戶行為分析引擎設(shè)計(jì).電信科學(xué),2013(3):27-31
6.科技中國.大數(shù)據(jù)時(shí)代.〔2013 -06-01〕.http://www.techcn.com.cn/index.php?edition-view -185281 -2.html