基于大數(shù)據(jù)的圖書館個(gè)性化服務(wù)安全體系構(gòu)建研究
陳臣
由于大數(shù)據(jù)的多數(shù)據(jù)性和復(fù)雜性,在大數(shù)據(jù)環(huán)境中頻繁出現(xiàn)不可預(yù)測(cè)的攻擊行為,且大數(shù)據(jù)導(dǎo)致的隱私泄露給用戶帶來了嚴(yán)重危害,錯(cuò)誤數(shù)據(jù)將導(dǎo)致大數(shù)據(jù)分析結(jié)果不正確。為了保障圖書館大數(shù)據(jù)計(jì)算的安全,結(jié)合大數(shù)據(jù)安全的研究和可信云的概念,論文提出一種基于大數(shù)據(jù)的圖書館個(gè)性化服務(wù)安全體系。該系統(tǒng)模型可以有效地提升大數(shù)據(jù)的數(shù)據(jù)安全性,降低黑客惡意攻擊行為有效性,從而提高圖書館大數(shù)據(jù)的分析效率。
大數(shù)據(jù)圖書館個(gè)性化服務(wù)安全體系構(gòu)建數(shù)據(jù)安全讀者隱私保護(hù)
大數(shù)據(jù)時(shí)代的來臨,在提高圖書館讀者需求感知、用戶關(guān)系管理(CRM)、用戶服務(wù)保障和服務(wù)市場(chǎng)競(jìng)爭(zhēng)環(huán)境適應(yīng)能力的同時(shí),也大幅度增加了數(shù)據(jù)中心基礎(chǔ)設(shè)施結(jié)構(gòu)的復(fù)雜度和服務(wù)安全風(fēng)險(xiǎn)。同時(shí),圖書館數(shù)據(jù)中心基礎(chǔ)設(shè)施資源、管理與服務(wù)系統(tǒng)網(wǎng)絡(luò)和高價(jià)值的大數(shù)據(jù)資源,已成為黑客攻擊和竊取的主要目標(biāo)。因此,如何利用大數(shù)據(jù)技術(shù)構(gòu)建智能、自動(dòng)、主動(dòng)和互聯(lián)的安全防御系統(tǒng),不斷增強(qiáng)圖書館系統(tǒng)服務(wù)、大數(shù)據(jù)計(jì)算、數(shù)據(jù)應(yīng)用價(jià)值和數(shù)據(jù)可用性的安全,是保證大數(shù)據(jù)時(shí)代圖書館系統(tǒng)運(yùn)營(yíng)安全和用戶QOS(服務(wù)質(zhì)量)的關(guān)鍵[1]。
1.1 大數(shù)據(jù)時(shí)代服務(wù)平臺(tái)的系統(tǒng)結(jié)構(gòu)更加復(fù)雜和開放
首先,隨著讀者服務(wù)需求的增長(zhǎng)和用戶服務(wù)模式變革,圖書館數(shù)據(jù)中心基礎(chǔ)設(shè)施硬件設(shè)備的服務(wù)架構(gòu)和應(yīng)用程序復(fù)雜度快速增長(zhǎng),如何實(shí)現(xiàn)圖書館基礎(chǔ)設(shè)施硬件設(shè)備服務(wù)效率與運(yùn)營(yíng)安全的最優(yōu)化均衡,是圖書館大數(shù)據(jù)服務(wù)必須面對(duì)的一個(gè)重要問題。其次,云計(jì)算技術(shù)、大數(shù)據(jù)處理技術(shù)、傳感器技術(shù)和用戶服務(wù)網(wǎng)絡(luò)具有極強(qiáng)的開放性,管理員可以利用基礎(chǔ)設(shè)施結(jié)構(gòu)、網(wǎng)絡(luò)和大數(shù)據(jù)資源的開放性,實(shí)現(xiàn)服務(wù)資源和大數(shù)據(jù)的快速整合和動(dòng)態(tài)分配。但是,圖書館大數(shù)據(jù)環(huán)境所具有的極強(qiáng)開放性,大幅增強(qiáng)了黑客攻擊的目的性和成功率。第三,以非結(jié)構(gòu)化數(shù)據(jù)為主體,已成為圖書館大數(shù)據(jù)庫(kù)結(jié)構(gòu)和數(shù)據(jù)管理模式的主要特點(diǎn)。由于NoSQL(非關(guān)系型的數(shù)據(jù)庫(kù))自身存在著大量的系統(tǒng)漏洞和不成熟性,導(dǎo)致圖書館對(duì)海量、非結(jié)構(gòu)化數(shù)據(jù)的管理過程中存在著巨大的安全隱患。第四,大數(shù)據(jù)與云計(jì)算技術(shù)在數(shù)字圖書館中的廣泛應(yīng)用,改變了圖書館在傳統(tǒng)IT環(huán)境下的安全需求和信息安全交付模式,黑客可采用許多新的方法和途徑對(duì)大數(shù)據(jù)服務(wù)平臺(tái)系統(tǒng)發(fā)起攻擊。此外,傳統(tǒng)的安全防御系統(tǒng)和策略,已不能滿足大數(shù)據(jù)時(shí)代圖書館安全管理與服務(wù)需求[2]。
1.2 圖書館大數(shù)據(jù)QOS(服務(wù)質(zhì)量)保障與用戶隱私保護(hù)沖突激增
首先,圖書館在讀者個(gè)性化服務(wù)中,如果對(duì)用戶數(shù)據(jù)存在過度的分析和使用,可能會(huì)侵犯用戶隱私和降低讀者對(duì)圖書館服務(wù)的信任度?!袄忡R門”事件爆發(fā)后,美國(guó)總統(tǒng)奧巴馬辯解道:“你不能在擁有100%安全的情況下,同時(shí)擁有100%隱私和100%便利?!蓖瑯?,圖書館通過對(duì)讀者個(gè)體特征、閱讀社會(huì)關(guān)系、閱讀地理位置和閱讀內(nèi)容等數(shù)據(jù)的過度采集與分析,能夠精確判斷讀者的身份、需求、目的、位置和行為路徑,但也會(huì)導(dǎo)致用戶行為隱私泄露和未來行為被預(yù)測(cè)。其次,云計(jì)算與大數(shù)據(jù)技術(shù)是圖書館大數(shù)據(jù)服務(wù)的關(guān)鍵技術(shù)。用戶大數(shù)據(jù)資源在采集、傳輸、存儲(chǔ)、處理、共享、分析和使用過程中,可能會(huì)被截獲、竊取、篡改和非法使用。同時(shí),為了提高用戶服務(wù)的效率和經(jīng)濟(jì)性,圖書館可能會(huì)將大量的用戶數(shù)據(jù)存儲(chǔ)在公有云端,而喪失對(duì)數(shù)據(jù)的管理與控制權(quán)。第三,伴隨微電子制造技術(shù)的發(fā)展,用戶閱讀終端將向多功能、集成化、多模式和低成本方向發(fā)展。讀者在使用閱讀終端進(jìn)行大數(shù)據(jù)閱讀時(shí),閱讀終端產(chǎn)生的大量閱讀模式、閱讀行為與內(nèi)容、終端類型、終端配置和位置信息等數(shù)據(jù),也可能會(huì)導(dǎo)致用戶隱私被侵犯。第四,用戶行為數(shù)據(jù)的價(jià)值密度、準(zhǔn)確性、可用性和可控性,也是關(guān)系圖書館大數(shù)據(jù)分析科學(xué)性、服務(wù)質(zhì)量保證有效和用戶隱私保護(hù)安全的關(guān)鍵因素[3]。
1.3 黑客會(huì)利用大數(shù)據(jù)技術(shù)對(duì)圖書館的管理與服務(wù)系統(tǒng)發(fā)起攻擊
首先,黑客會(huì)最大限度地收集圖書館和讀者的個(gè)人信息。比如圖書館系統(tǒng)與網(wǎng)絡(luò)參數(shù)的信息、設(shè)備配置參數(shù)、讀者個(gè)體特征數(shù)據(jù)、讀者閱讀關(guān)系數(shù)據(jù)、讀者的論壇與微博等數(shù)據(jù),并通過對(duì)數(shù)據(jù)的精確分析,而提高非法攻擊的精確度和有效性。通過對(duì)所采集數(shù)據(jù)的分析和判斷,而直接分析出用戶與系統(tǒng)管理員的帳號(hào)、密碼和其它重要信息。其次,黑客會(huì)利用大數(shù)據(jù)技術(shù),故意制造和向圖書館傳輸一些錯(cuò)誤數(shù)據(jù),并以此類數(shù)據(jù)影響圖書館大數(shù)據(jù)處理、分析和決策過程的準(zhǔn)確性與精確度。這會(huì)嚴(yán)重干擾和影響圖書館大數(shù)據(jù)安全分析、檢測(cè)的正確性和有效性,最終將導(dǎo)致圖書館自身安全性、健壯性和防御系統(tǒng)可用性大幅下降。第三,圖書館眾多安全防御系統(tǒng)的互聯(lián)性、全局安全管控能力、系統(tǒng)的可視與可用性、安全威脅實(shí)時(shí)響應(yīng)性和持續(xù)安全管理的能力等,也是決定圖書館整體安全防范能力和安全系統(tǒng)可控性的關(guān)鍵[4]。
1.4 NoSQL(非關(guān)系型數(shù)據(jù)庫(kù))安全管理需要多層面的安全防護(hù)
伴隨讀者閱讀需求發(fā)展和圖書館服務(wù)模式變革,非結(jié)構(gòu)化數(shù)據(jù)將占據(jù)圖書館數(shù)據(jù)總量的85%以上,并且非結(jié)構(gòu)化數(shù)據(jù)增長(zhǎng)的速度是結(jié)構(gòu)化數(shù)據(jù)的10到20倍。NoSQL是圖書館非結(jié)構(gòu)化數(shù)據(jù)存儲(chǔ)的主要模式。NoSQL不遵循結(jié)構(gòu)化的數(shù)據(jù)形式,具有較強(qiáng)的數(shù)據(jù)存儲(chǔ)靈活性、可用性、經(jīng)濟(jì)性和可擴(kuò)展性。但也存在著數(shù)據(jù)存儲(chǔ)不通過標(biāo)準(zhǔn)的SQL語(yǔ)言訪問,數(shù)據(jù)庫(kù)結(jié)構(gòu)復(fù)雜和數(shù)據(jù)可控性差的問題。
首先,NoSQL與關(guān)系數(shù)據(jù)庫(kù)(Relational DataBase,RDB)相比,非結(jié)構(gòu)化數(shù)據(jù)可以跨越任何網(wǎng)絡(luò)、在任何地方、以任何格式在任何設(shè)備上存儲(chǔ),沒有嚴(yán)格的數(shù)據(jù)格式要求。此外,傳統(tǒng)的數(shù)據(jù)庫(kù)安全防范與管理策略在NoSQL安全管理、控制中已失去作用。與關(guān)系數(shù)據(jù)庫(kù)相比,NoSQL對(duì)數(shù)據(jù)存儲(chǔ)、管理和安全保護(hù)策略具有不同的要求。其次,NoSQL對(duì)數(shù)據(jù)庫(kù)的訪問控制和隱私管理沒有制定相應(yīng)標(biāo)準(zhǔn),且基于NoSQL的數(shù)據(jù)管理應(yīng)用程序數(shù)量龐大,具有較高的系統(tǒng)漏洞修補(bǔ)和其它安全需求。第三,為了保證大數(shù)據(jù)的安全性和可用性,非結(jié)構(gòu)化數(shù)據(jù)會(huì)在位于不同存儲(chǔ)地理位置的服務(wù)器中對(duì)數(shù)據(jù)進(jìn)行冗余存儲(chǔ)和備份,數(shù)據(jù)具有較強(qiáng)的冗余性和分散性,圖書館管理員難以對(duì)此類數(shù)據(jù)進(jìn)行定位、監(jiān)控和安全管理。第四,NoSQL服務(wù)器軟件沒有內(nèi)置較強(qiáng)的安全策略,因此,要求訪問這些軟件的應(yīng)用程序自身必須具備較強(qiáng)安全性。此外,NoSQL的安全管理對(duì)管理員的技術(shù)水平、經(jīng)驗(yàn)和客戶端軟件安全性提出了較高要求[5]。
1.5 大數(shù)據(jù)圖書館安全管理的智能、可視和自動(dòng)化需求
隨著讀者閱讀QOS(服務(wù)質(zhì)量)保證和大數(shù)據(jù)服務(wù)復(fù)雜度的不斷增加,圖書館可以從用戶閱讀終端、系統(tǒng)監(jiān)控設(shè)備、傳感器網(wǎng)絡(luò)和服務(wù)反饋系統(tǒng)等設(shè)備中采集數(shù)據(jù),數(shù)據(jù)來源具有多源、海量、實(shí)時(shí)和多類型的特點(diǎn)。為了提高系統(tǒng)和服務(wù)安全分析、管理與決策的科學(xué)性,要求數(shù)據(jù)的采集、處理與分析過程應(yīng)具備較強(qiáng)的可視化和可控性。其次,大數(shù)據(jù)環(huán)境特點(diǎn)對(duì)圖書館安全管理提出了新的需求。要求圖書館可長(zhǎng)期不間斷地采集海量的安全系統(tǒng)運(yùn)行日志、安全管理與防御、設(shè)備運(yùn)營(yíng)、用戶行為的安全管理等數(shù)據(jù),并建立圖書館安全管理的大數(shù)據(jù)庫(kù),確保圖書館可基于安全管理大數(shù)據(jù)庫(kù)歷史數(shù)據(jù)的支持,實(shí)現(xiàn)對(duì)惡意攻擊行為的實(shí)時(shí)分析、識(shí)別和自動(dòng)防御。同時(shí),還應(yīng)執(zhí)行用戶閱讀終端的智能化安全管理和基于風(fēng)險(xiǎn)模式的身份認(rèn)證策略,實(shí)現(xiàn)閱讀終端的移動(dòng)性安全管理和系統(tǒng)網(wǎng)絡(luò)的“無邊界”安全防護(hù)。第三,大數(shù)據(jù)時(shí)代圖書館海量的管理與服務(wù)數(shù)據(jù),遠(yuǎn)遠(yuǎn)超越了傳統(tǒng)IT環(huán)境下圖書館安全防護(hù)的能力和邊界。因此,利用云計(jì)算的超級(jí)計(jì)算、存儲(chǔ)和管理能力,實(shí)現(xiàn)安全數(shù)據(jù)的快速采集、過濾、挖掘和分析,是大數(shù)據(jù)時(shí)代圖書館安全管理的必由之路。圖書館應(yīng)依靠云計(jì)算技術(shù)的支持,實(shí)現(xiàn)對(duì)信息安全事件管理、網(wǎng)絡(luò)監(jiān)控、用戶身份認(rèn)證和授權(quán)、身份管理、欺詐檢測(cè)與治理、風(fēng)險(xiǎn)評(píng)估與控制、巨量安全數(shù)據(jù)的分析與決策,確保大數(shù)據(jù)圖書館安全管理過程智能、可視、可控和自動(dòng)化[6]。
2.1 基于大數(shù)據(jù)的圖書館個(gè)性化服務(wù)安全體系構(gòu)建
大數(shù)據(jù)時(shí)代圖書館安全管理體系的構(gòu)建,首先應(yīng)確保圖書館管理與服務(wù)系統(tǒng)具有較高的運(yùn)營(yíng)效率、保密性、可靠性、經(jīng)濟(jì)性和可控性。同時(shí),還應(yīng)保證圖書館管理與服務(wù)大數(shù)據(jù)資源安全、完整、流動(dòng)、開放和可控,可有效防范大數(shù)據(jù)資源和用戶隱私數(shù)據(jù)被竊取、篡改、丟失和非法訪問。此外,當(dāng)圖書館發(fā)生安全事件時(shí),可依據(jù)系統(tǒng)運(yùn)行日志和安全管理記錄對(duì)安全問題進(jìn)行追溯、判斷、評(píng)估和控制,評(píng)判結(jié)果具有真實(shí)性和防抵賴性。
結(jié)合大數(shù)據(jù)時(shí)代圖書館安全管理需求和系統(tǒng)相關(guān)的安全標(biāo)準(zhǔn)、規(guī)范,構(gòu)建的大數(shù)據(jù)時(shí)代圖書館安全管理體系如圖1所示。
圖書館安全管理體系的第一層是圖書館系統(tǒng)硬件設(shè)備安全防護(hù)層,主要由機(jī)房環(huán)境安全、系統(tǒng)硬件設(shè)備安全和數(shù)據(jù)傳輸網(wǎng)絡(luò)安全3部分組成。第二層是大數(shù)據(jù)資源的安全管理層,該層通過安全管理策略和數(shù)據(jù)安全控制,實(shí)現(xiàn)對(duì)圖書館大數(shù)據(jù)資源的安全采集、過濾、價(jià)值提取和存儲(chǔ)。第三層是系統(tǒng)安全管理平臺(tái)層,平臺(tái)層由不同的圖書館安全管理系統(tǒng)和應(yīng)用軟件組成,具有良好的兼容性和可擴(kuò)展性,可對(duì)圖書館管理與服務(wù)系統(tǒng)實(shí)現(xiàn)基于數(shù)據(jù)流流程的安全管理。第四層平臺(tái)為大數(shù)據(jù)安全互聯(lián)平臺(tái),通過該層可實(shí)現(xiàn)圖書館不同安全管理系統(tǒng)與平臺(tái)的安全、管理與控制信息互聯(lián)。第五層是圖書館安全大數(shù)據(jù)挖掘與分析層,通過對(duì)安全大數(shù)據(jù)資源的深度挖掘與分析,明確大數(shù)據(jù)時(shí)代圖書館的安全需求、安全事件影響力和安全策略可用性,可為圖書館安全管理和安全決策提供大數(shù)據(jù)的分析與支持。第六層是圖書館安全大數(shù)據(jù)資源的采集與存儲(chǔ)層。通過對(duì)歷史大數(shù)據(jù)資源的采集與存儲(chǔ),全面構(gòu)建圖書館安全管理大數(shù)據(jù)資源庫(kù)。
大數(shù)據(jù)時(shí)代圖書館安全管理體系的構(gòu)建,應(yīng)堅(jiān)持多功能平臺(tái)高度集成和智能、自動(dòng)化的原則,能夠?qū)D書館安全事件和安全數(shù)據(jù)進(jìn)行實(shí)時(shí)、快速的查詢與檢測(cè)。此外,還可對(duì)大數(shù)據(jù)庫(kù)系統(tǒng)中存儲(chǔ)的結(jié)構(gòu)化和非結(jié)構(gòu)化數(shù)據(jù)進(jìn)行可視化處理與分析,具有較強(qiáng)的預(yù)測(cè)性和決策科學(xué)性[7]。
2.2 基于大數(shù)據(jù)的圖書館個(gè)性化服務(wù)安全管理對(duì)策
2.2.1 利用大數(shù)據(jù)技術(shù)構(gòu)建圖書館安全防御體系
首先,圖書館應(yīng)通過對(duì)安全大數(shù)據(jù)資源庫(kù)的分析與判斷,準(zhǔn)確、及時(shí)地發(fā)現(xiàn)來自圖書館內(nèi)部與外部的攻擊行為。圖書館安全大數(shù)據(jù)資源主要由系統(tǒng)運(yùn)行日志、系統(tǒng)監(jiān)控?cái)?shù)據(jù)、欺詐識(shí)別與警報(bào)數(shù)據(jù)、服務(wù)器監(jiān)控?cái)?shù)據(jù)、防火墻運(yùn)行日志和IDS(入侵檢測(cè)系統(tǒng))日志等組成。圖書館應(yīng)通過對(duì)安全大數(shù)據(jù)資源的分析,發(fā)現(xiàn)、定義惡意攻擊者和攻擊行為的內(nèi)容、方式、規(guī)律和途徑,構(gòu)建安全管理大數(shù)據(jù)資源庫(kù),并在不同的安全管理與決策系統(tǒng)中實(shí)現(xiàn)數(shù)據(jù)的共享。其次,圖書館應(yīng)加強(qiáng)基于大數(shù)據(jù)的SIEM(安全信息和事件管理)。大數(shù)據(jù)時(shí)代,圖書館安全管理對(duì)SIEM提出了智能、自動(dòng)、實(shí)時(shí)和高可控的要求。因此,圖書館應(yīng)將從監(jiān)控系統(tǒng)、服務(wù)系統(tǒng)、傳輸網(wǎng)絡(luò)、安全數(shù)據(jù)庫(kù)和用戶終端中采集的安全數(shù)據(jù)進(jìn)行整合,提高安全大數(shù)據(jù)資源的關(guān)聯(lián)性和整體價(jià)值密度,確保SIEM過程實(shí)時(shí)、高效、全面、主動(dòng)和可視。第三,應(yīng)基于安全大數(shù)據(jù)資源庫(kù)構(gòu)建圖書館安全事件模擬系統(tǒng)。在模擬圖書館系統(tǒng)平臺(tái)運(yùn)行與硬件環(huán)境后,應(yīng)將可疑的應(yīng)用服務(wù)、攻擊行為和安全事件在模擬系統(tǒng)中測(cè)試運(yùn)行,實(shí)現(xiàn)對(duì)運(yùn)行過程、實(shí)驗(yàn)結(jié)果的自動(dòng)觀測(cè)、分析、審計(jì)和告警,最終明確未知安全威脅的途徑、方法和風(fēng)險(xiǎn)度。第四,應(yīng)基于歷史事件數(shù)據(jù)資源構(gòu)建圖書館的安全防御體系,明確安全事件的發(fā)展趨勢(shì)和變異特點(diǎn),實(shí)現(xiàn)對(duì)安全威脅的準(zhǔn)確判定和安全問題的快速定位[8]。
2.2.2 圖書館大數(shù)據(jù)安全防護(hù)的數(shù)據(jù)價(jià)值密度與可用性保障
數(shù)據(jù)清洗是圖書館刪除與用戶服務(wù)無關(guān)隱私數(shù)據(jù)、增強(qiáng)數(shù)據(jù)價(jià)值密度的關(guān)鍵。管理員應(yīng)通過對(duì)大數(shù)據(jù)資源的過濾、清洗、刪減、糾正、一致化、匹配、連接和診斷,完成對(duì)大數(shù)據(jù)資源價(jià)值密度和可用性的評(píng)估與優(yōu)化。此外,還應(yīng)依據(jù)用戶大數(shù)據(jù)服務(wù)和讀者隱私保護(hù)需求,支持讀者訪問大數(shù)據(jù)庫(kù)中與自身相關(guān)的數(shù)據(jù)資源,并對(duì)數(shù)據(jù)資源進(jìn)行查詢、審查和糾正,增強(qiáng)大數(shù)據(jù)資源的價(jià)值密度、透明度和使用安全性。其次,應(yīng)通過對(duì)讀者基于身份認(rèn)定與權(quán)限分配的訪問控制管理,加強(qiáng)對(duì)非法攻擊、數(shù)據(jù)訪問、大數(shù)據(jù)應(yīng)用、網(wǎng)路防御系統(tǒng)和智能安全分析系統(tǒng)的監(jiān)控。此外,還應(yīng)智能化地分析與識(shí)別黑客惡意偽造、篡改的錯(cuò)誤數(shù)據(jù),避免錯(cuò)誤數(shù)據(jù)影響圖書館大數(shù)據(jù)分析、決策和安全管理的準(zhǔn)確性。第三,為了提高數(shù)據(jù)存儲(chǔ)、管理的安全性與可用性,圖書館應(yīng)通過融合存儲(chǔ)的方式,大幅度刪除大數(shù)據(jù)庫(kù)中的重復(fù)數(shù)據(jù),在降低大數(shù)據(jù)存儲(chǔ)數(shù)據(jù)總量的前提下,提高大數(shù)據(jù)資源的質(zhì)量和準(zhǔn)確性。此外,應(yīng)將大數(shù)據(jù)資源存儲(chǔ)、備份于多個(gè)分布式的數(shù)據(jù)存儲(chǔ)和管理節(jié)點(diǎn)之中,依據(jù)大數(shù)據(jù)的價(jià)值和安全管理需求,制定相應(yīng)的大數(shù)據(jù)資源備份策略,實(shí)現(xiàn)多個(gè)節(jié)點(diǎn)的數(shù)據(jù)副本備份。確保當(dāng)某一存儲(chǔ)節(jié)點(diǎn)發(fā)生故障時(shí),不會(huì)丟失數(shù)據(jù)和影響數(shù)據(jù)的實(shí)時(shí)可用性[9]。
2.2.3 增強(qiáng)圖書館大數(shù)據(jù)庫(kù)管理與用戶服務(wù)基礎(chǔ)設(shè)施資源的安全性
目前,APT(高級(jí)持續(xù)性攻擊)已成為黑客獲取圖書館系統(tǒng)控制權(quán)和影響用戶大數(shù)據(jù)服務(wù)質(zhì)量的重要因素,圖書館應(yīng)利用大數(shù)據(jù)技術(shù)重構(gòu)安全防御系統(tǒng),實(shí)現(xiàn)安全問題的提前預(yù)測(cè)、發(fā)現(xiàn)、評(píng)估和防范決策[10]。
管理員應(yīng)將安全風(fēng)險(xiǎn)預(yù)測(cè)技術(shù)、威脅檢測(cè)技術(shù)、危害程度評(píng)估技術(shù)和智能化安全管理技術(shù),與大數(shù)據(jù)的數(shù)據(jù)清洗、過濾、分析和控制技術(shù)相結(jié)合,實(shí)時(shí)預(yù)測(cè)、發(fā)現(xiàn)圖書館安全事件發(fā)生的系統(tǒng)區(qū)域、攻擊類型、危害程度、持續(xù)時(shí)間和作用對(duì)象。并制定相應(yīng)的安全保障預(yù)案,以及有針對(duì)性地增強(qiáng)安全防御系統(tǒng)的應(yīng)用效率、可用性、可控性和自身健壯性。同時(shí),應(yīng)加強(qiáng)對(duì)圖書館系統(tǒng)網(wǎng)絡(luò)流量和通信線路信息傳輸?shù)谋O(jiān)控,及時(shí)監(jiān)控、發(fā)現(xiàn)系統(tǒng)內(nèi)存和網(wǎng)絡(luò)敏感數(shù)據(jù)的流向與流量,利用網(wǎng)關(guān)、防火墻或DLP(數(shù)據(jù)泄密防護(hù))技術(shù),捕獲、阻止敏感數(shù)據(jù)流流出圖書館系統(tǒng)網(wǎng)絡(luò)。其次,因圖書館大數(shù)據(jù)環(huán)境具有海量、實(shí)時(shí)、分布式架構(gòu)和數(shù)據(jù)通信多模式的特點(diǎn),傳統(tǒng)的系統(tǒng)安全管理、監(jiān)控、日志分析、漏洞發(fā)現(xiàn)和安全評(píng)估軟件不能在大數(shù)據(jù)環(huán)境下有效運(yùn)行,或者較低的運(yùn)行效率不能滿足圖書館安全防護(hù)需求。由此,必須科學(xué)部署圖書館大數(shù)據(jù)系統(tǒng)的組織結(jié)構(gòu),準(zhǔn)確定義大數(shù)據(jù)的接口標(biāo)準(zhǔn)和安全應(yīng)用數(shù)據(jù)通信模式,確保大數(shù)據(jù)分析與決策技術(shù)可有效融合于圖書館安全防御系統(tǒng)之中。第三,在大數(shù)據(jù)安全資源的支持下,管理員應(yīng)利用VLAN(虛擬局域網(wǎng))技術(shù),將數(shù)據(jù)中心網(wǎng)絡(luò)劃分為系統(tǒng)管理數(shù)據(jù)傳輸、用戶服務(wù)數(shù)據(jù)傳輸、安全防御與安全分析數(shù)據(jù)傳輸?shù)忍摂M化網(wǎng)絡(luò)。在保證系統(tǒng)虛擬網(wǎng)絡(luò)數(shù)據(jù)傳輸效率的前提下,管理員可利用網(wǎng)關(guān)、防火墻等設(shè)備,對(duì)保密數(shù)據(jù)的安全性和潛在威脅進(jìn)行分析和預(yù)測(cè),對(duì)數(shù)據(jù)流執(zhí)行相應(yīng)的安全管理策略。第四,圖書館還應(yīng)將所有的大數(shù)據(jù)安全防御和管理系統(tǒng)軟件、工具和流程,按照統(tǒng)一標(biāo)準(zhǔn)、統(tǒng)一模式、統(tǒng)一平臺(tái)和統(tǒng)一管理的原則,集成到一個(gè)大的數(shù)據(jù)安全管理平臺(tái)之上,確保大數(shù)據(jù)安全系統(tǒng)平臺(tái)具有較高的運(yùn)行效率、可用性、經(jīng)濟(jì)性和可控性[11]。
2.2.4 大數(shù)據(jù)時(shí)代應(yīng)加強(qiáng)讀者的隱私保護(hù)
大數(shù)據(jù)時(shí)代加強(qiáng)讀者隱私保護(hù),是一個(gè)關(guān)系圖書館用戶QOS保證和服務(wù)可持續(xù)性,以及讀者閱讀收益率、閱讀可信度、愉悅感和服務(wù)滿意度的重要問題。
哈佛大學(xué)教授Latanya Sweeney曾經(jīng)指出,只需要ZIP代碼、出生日期和性別就可以確定87%的美國(guó)人。因此,圖書館在讀者行為和關(guān)系數(shù)據(jù)的采集中,應(yīng)以讀者閱讀需求預(yù)測(cè)和大數(shù)據(jù)服務(wù)QOS保障為依據(jù),嚴(yán)格限制用戶數(shù)據(jù)采集的對(duì)象、內(nèi)容、方法和途徑,不采集與讀者閱讀服務(wù)和圖書館服務(wù)質(zhì)量保障無關(guān)的讀者隱私數(shù)據(jù)。其次,圖書館應(yīng)從讀者隱私權(quán)利保護(hù)大局出發(fā),對(duì)所采集的用戶隱私數(shù)據(jù)進(jìn)行“匿名化”處理,刪除或者匿名化處理與用戶服務(wù)保障無關(guān)的個(gè)人隱私數(shù)據(jù)。譬如對(duì)讀者姓名、年齡、性別、社會(huì)關(guān)系、地理位置和隱私行為等數(shù)據(jù),實(shí)施位置隱私保護(hù)、標(biāo)識(shí)符匿名保護(hù)、連接關(guān)系匿名保護(hù)等。第三,管理員在做好圖書館邊界安全防護(hù)的同時(shí),應(yīng)對(duì)所有絕密數(shù)據(jù)和用戶隱私數(shù)據(jù),實(shí)現(xiàn)訪問權(quán)限控制和數(shù)據(jù)加密,致使非法用戶無權(quán)訪問或無法識(shí)別已獲得的用戶隱私數(shù)據(jù)。第四,圖書館應(yīng)將隱私數(shù)據(jù)的管理與使用權(quán)交付讀者,用戶擁有對(duì)個(gè)人隱私數(shù)據(jù)的采集、存儲(chǔ)、分析和使用權(quán)。此外,圖書館可依據(jù)讀者服務(wù)隱私安全的需求,由用戶依據(jù)大數(shù)據(jù)閱讀活動(dòng)生命周期發(fā)展規(guī)律,決定個(gè)人隱私數(shù)據(jù)采集的內(nèi)容、處理的精度、共享的對(duì)象、匿名的方式和銷毀的時(shí)間。第五,圖書館應(yīng)依據(jù)隱私數(shù)據(jù)的特點(diǎn)和安全需求,將隱私數(shù)據(jù)劃分為不同的安全等級(jí)和應(yīng)用范圍,對(duì)具有高級(jí)別的用戶隱私數(shù)據(jù)實(shí)現(xiàn)全程持續(xù)監(jiān)控和安全管理[12]。
2.2.5 構(gòu)建基于安全云的圖書館大數(shù)據(jù)服務(wù)體系
目前圖書館數(shù)據(jù)中心傳統(tǒng)的IT安全管理系統(tǒng),已無法滿足大數(shù)據(jù)環(huán)境下圖書館安全防御所需要的數(shù)據(jù)計(jì)算與存儲(chǔ)要求。因此,必須構(gòu)建基于安全云的圖書館大數(shù)據(jù)服務(wù)體系。
為保證大數(shù)據(jù)服務(wù)在滿足系統(tǒng)安全性需求和用戶服務(wù)QOS保障質(zhì)量的前提下,具有較高的經(jīng)濟(jì)性、便捷性、可控性和可擴(kuò)展性,圖書館通常會(huì)采用租賃公有云服務(wù)的方式構(gòu)建云服務(wù)中心。而云服務(wù)中心自身存在的第三方安全管理、多用戶共享和存儲(chǔ)空間邏輯隔離特點(diǎn),導(dǎo)致圖書館公有云服務(wù)具有較大安全威脅。因此,圖書館首先應(yīng)按照云服務(wù)的安全保障需求,與云服務(wù)商簽署科學(xué)的云服務(wù)租賃和安全管理協(xié)議,明確雙方在圖書館云服務(wù)安全管理中應(yīng)承擔(dān)的責(zé)任、義務(wù)和權(quán)利。通過對(duì)云服務(wù)過程不間斷的安全檢測(cè)和審計(jì),保證圖書館云服務(wù)過程安全、完整、保密和可用。其次,在資金與技術(shù)條件允許的前提下,圖書館可采用構(gòu)建私有云的方式,來存儲(chǔ)數(shù)據(jù)中心系統(tǒng)管理數(shù)據(jù)、用戶服務(wù)數(shù)據(jù)、系統(tǒng)配置數(shù)據(jù)、讀者身份信息和用戶隱私等絕密數(shù)據(jù),并嚴(yán)格控制非法用戶訪問和第三方協(xié)作商共享。第三,圖書館應(yīng)構(gòu)建基于安全云的大數(shù)據(jù)安全管理體系。安全管理體系可采用安全分層的方式進(jìn)行管理,所劃分的5個(gè)安全防護(hù)層分別為數(shù)據(jù)與系統(tǒng)訪問控制層、網(wǎng)絡(luò)安全管理層、大數(shù)據(jù)應(yīng)用與用戶服務(wù)安全管理層、數(shù)據(jù)的隱私保護(hù)層和數(shù)據(jù)完整性保障層。同時(shí),對(duì)五個(gè)防護(hù)層應(yīng)實(shí)現(xiàn)基于大數(shù)據(jù)的綜合、共享式安全管理[13]。
隨著大數(shù)據(jù)時(shí)代的來臨,讀者對(duì)閱讀服務(wù)安全性和QOS保障標(biāo)準(zhǔn)提出了更高要求,導(dǎo)致圖書館數(shù)據(jù)中心的基礎(chǔ)設(shè)施結(jié)構(gòu)、用戶服務(wù)模式、數(shù)據(jù)環(huán)境和網(wǎng)絡(luò)系統(tǒng)更加復(fù)雜和多變。此外,與傳統(tǒng)IT環(huán)境相比,大數(shù)據(jù)環(huán)境下圖書館面臨著更多的安全威脅和惡意攻擊方式。同時(shí),圖書館的系統(tǒng)管理與配置數(shù)據(jù)、用戶服務(wù)數(shù)據(jù)、讀者帳戶和密碼、用戶服務(wù)需求數(shù)據(jù)、讀者特征與行為數(shù)據(jù)、用戶服務(wù)模式和內(nèi)容數(shù)據(jù)等,因具有極強(qiáng)的價(jià)值屬性而成為黑客攻擊、截獲、竊取和篡改的重要目標(biāo)[14]。
因此,圖書館必須依據(jù)大數(shù)據(jù)時(shí)代面臨的安全威脅和安全需求,從數(shù)據(jù)中心基礎(chǔ)設(shè)施的安全保障、大數(shù)據(jù)資源的安全管理與存儲(chǔ)、安全防御平臺(tái)系統(tǒng)的可用性管理、大數(shù)據(jù)應(yīng)用的安全性建設(shè)出發(fā),構(gòu)建高效、公平、透明、可控的圖書館大數(shù)據(jù)服務(wù)安全管理平臺(tái)。此外,還應(yīng)從法律體系、服務(wù)管理和大數(shù)據(jù)應(yīng)用等多個(gè)層面出發(fā),制定基于大數(shù)據(jù)支持的安全管理與風(fēng)險(xiǎn)防控策略,才能保證圖書館系統(tǒng)管理與運(yùn)營(yíng)、讀者大數(shù)據(jù)服務(wù)和用戶保密資源安全,才能為讀者提供安全、高效、經(jīng)濟(jì)和可靠的大數(shù)據(jù)閱讀服務(wù)[15]。
[1]孟小峰,慈祥.大數(shù)據(jù)管理:概念、技術(shù)與挑戰(zhàn)[J].計(jì)算機(jī)研究與發(fā)展,2013,50(1):146-169.
[2]高明,金澈清,王曉玲,等.數(shù)據(jù)世系管理技術(shù)研究綜述[J].計(jì)算機(jī)學(xué)報(bào),2010,33(3):374-389.
[3]陳臣.基于大數(shù)據(jù)的圖書館個(gè)性化智慧服務(wù)體系構(gòu)建[J].情報(bào)資料工作,2013(6):75-79.
[4]胡坤,劉鏑,劉明輝.大數(shù)據(jù)的安全理解及應(yīng)對(duì)策略研究[J].電信科學(xué),2014(2):112-122.
[5]Goel S,Hofman J M,Lahais S,et al.Predicting consumer behavior wity Web search[J].National Academy of Sciences,2010,7(41):17486-17490.
[6]馬曉亭,樊馨蔓.云計(jì)算環(huán)境下數(shù)字圖書館虛擬機(jī)安全性研究[J].新世紀(jì)圖書館,2013(7):64-65,56.
[7]馮登國(guó),張敏,李昊.大數(shù)據(jù)安全與隱私保護(hù)[J].計(jì)算機(jī)學(xué)報(bào),2014,37(1):246-258.
[8]Zhang Li-Jie,Zhang Wei-Ning.Efficient edge anonymization of large social graphs[EB/OL][2014-04-12]. http://venom.cs.utsa.edu/dmz/techrep/2011/CS-TR-2011-004.pdf.
[9]楊高明,楊靜,張健沛.隱私保護(hù)的數(shù)據(jù)發(fā)布研究[J].計(jì)算機(jī)科學(xué),2011,38(9):11-17.
[10]潘柱廷.高端信息安全與大數(shù)據(jù)[J].信息安全與通信保密,2012(12):19-20.
[11]羅恩韜,胡志剛,楊杰.大數(shù)據(jù)動(dòng)態(tài)安全SAT雙向防御模型的研究[J].計(jì)算機(jī)應(yīng)用研究,2013,31(11):36-45.
[12]周茜,于炯.云計(jì)算下基于信任的防御系統(tǒng)模型[J].計(jì)算機(jī)應(yīng)用,2011,31(6):1531-1535.
[13]覃雄派,王會(huì)舉,杜小勇,等.大數(shù)據(jù)分析:RDBMS與MapReduce的競(jìng)爭(zhēng)與共生[J].軟件學(xué)報(bào),2012(1):32-45.
[14]何非,何克清.大數(shù)據(jù)及其科學(xué)問題與方法的探討[J].武漢大學(xué)學(xué)報(bào):理學(xué)版,2014,60(1):1-12.
[15]維克托·邁爾·舍恩伯格,肯尼思·庫(kù)克耶.大數(shù)據(jù)時(shí)代:生活、工作與思維的大變革[M].盛楊燕,周濤,譯.杭州:浙江人民出版社,2012.
陳臣蘭州商學(xué)院網(wǎng)絡(luò)中心副教授。甘肅蘭州,730020。
Research on the Security Framework Construction for the Library Personalized Service Based on Big Data
Chen Chen
Due to the multi-data and the complexity of big data,unmeasured attack behaviors take place frequently in the big data environment,and privacy issues related with big data analysis spell trouble for individuals,and deceptive or fake information within big data may lead to incorrect analysis results.In order to guarantee the safety of big data calculation of library,and based on the concepts of security research and trustworthy clouds of big data safety,a security framework construction for the library personalized service based on big data is put forward by this paper.This system model can effectively improve the data safety of big data,and reduce the hostile attack of hackers so as to improve the analysis efficiency of big data in library.
Big data.Library.Personalized service.Security framework construction.Data security.User privacy protection.
G250.76
2014-03-24 編校:劉明)