汪 飛
(江漢大學(xué)人工智能學(xué)院,湖北 武漢 430000)
網(wǎng)絡(luò)大數(shù)據(jù)指的是在網(wǎng)絡(luò)空間中將人、物、機互相融合后所產(chǎn)生的大數(shù)據(jù),并且人們可以在網(wǎng)絡(luò)中接觸或并得到這些數(shù)據(jù),大數(shù)據(jù)具有規(guī)模巨大、來源多樣化且復(fù)雜等屬性,此類大數(shù)據(jù)里存在了大量有價值信息,但是,目前已有處理方法不能有效地實行數(shù)據(jù)隱私加密保護[1]。由于大數(shù)據(jù)環(huán)境中,數(shù)據(jù)隱私加密保護優(yōu)化方法能夠保證原有數(shù)據(jù)不外泄,保證原有數(shù)據(jù)絕對完整性,并且滿足非單一類型與條件的數(shù)據(jù)保護要求,因此,受到大量專家和學(xué)者關(guān)注[2]。大數(shù)據(jù)環(huán)境中數(shù)據(jù)隱私加密保護優(yōu)化方法可以保證網(wǎng)絡(luò)安全運行,業(yè)內(nèi)研究人員對該問題給予了極大的關(guān)注[3]。
傳統(tǒng)網(wǎng)絡(luò)大數(shù)據(jù)加密算法有基于數(shù)據(jù)聚類的無損加密算法、基于布隆過濾器的無損加密算法,上述方法可以對數(shù)據(jù)進行加密時,可以在一定程度上保證數(shù)據(jù)的穩(wěn)定性,但是由于未對加密過程進行約束,導(dǎo)致加密后的數(shù)據(jù)易受入侵,數(shù)據(jù)加密魯棒性較差。且上述方法均以單向防御為主。因此,提出基于雙向防御的網(wǎng)絡(luò)大數(shù)據(jù)無損加密算法,對網(wǎng)絡(luò)大數(shù)據(jù)實現(xiàn)雙向防御無損加密,為用戶提供最大尺度的數(shù)據(jù)安全保護。
采用改進保護序加密方法,實現(xiàn)網(wǎng)絡(luò)大數(shù)據(jù)無損加密。優(yōu)化加密保護網(wǎng)絡(luò)大數(shù)據(jù)時,先按照OPES+的理論思想將大數(shù)據(jù)環(huán)境中因素數(shù)據(jù)變換為數(shù)值并按照所處方位排序[4]。同時將排列好的方位數(shù)據(jù)劃分成桶,增大其分布均勻性,讓每個桶中點的數(shù)目低于設(shè)定的閾值,使用保護序加密算法把桶中數(shù)據(jù)實行加密[5],并維持加密后數(shù)值大小順序不出現(xiàn)變動,按照加密約束條件,對數(shù)據(jù)隱私進行加密。加密約束詳細流程是:
1)加密保護的網(wǎng)絡(luò)大數(shù)據(jù)時,將度分秒設(shè)成單位,描述數(shù)據(jù)的經(jīng)緯度,使用OPES+理論思想把大數(shù)據(jù)環(huán)境中隱私數(shù)據(jù)變成數(shù)值A(chǔ)進行描述,如果通過度、分、秒代表原始的數(shù)據(jù)值,那么能夠獲?。?/p>
A=B+C/60+D/3600
(1)
其中,B表示度,C表示分,D表示秒。
2)把排列完畢的方位數(shù)據(jù)設(shè)成桶,增大其分布均勻性,假定基于明文空間里,通過q表示原始空間數(shù)值數(shù)據(jù)[6],那么把q劃分成q={E1,E2,…,En},En必須符合對隨機兩個桶的劃分,則把上述流程設(shè)成桶劃分。
3)加密保護的網(wǎng)絡(luò)大數(shù)據(jù)時,假定劃分函數(shù)是SPlit(En),那么此函數(shù)的作用為把En線性劃分成兩個子桶,直到每個桶中點數(shù)目低于設(shè)定閾值。qi(qi∈En)描述線性期望值,能夠通過式(4)實行計算
(2)
其中,(qs-qi)描述數(shù)據(jù)劃分的范疇參數(shù),i表示數(shù)據(jù)方位向量,s表示數(shù)據(jù)值域。
加密保護的網(wǎng)絡(luò)大數(shù)據(jù)時,按照上式運算能夠選擇距離期望值較遠的點實行遞歸劃分[7]。
4)加密保護的網(wǎng)絡(luò)大數(shù)據(jù)時,使用保護序加密算法把桶中的數(shù)據(jù)實行加密,并保證加密后數(shù)值的大小順序和原始一樣。運算加密函數(shù)N(Q),假定F={f1,f2,…,fm}表示的密文空間是基于q={q1,q2,…,qm}表示的明文空間加密所獲取,同時?j符合式(3)
(3)
其中,?j表示桶寬。
(4)
5)加密保護的網(wǎng)絡(luò)大數(shù)據(jù)時,針對通過qi描述的桶Ej里隨機數(shù)值,通過fj描述其加密的密文值,那么能夠通過式(5)運算fj
(5)
6)加密保護的網(wǎng)絡(luò)大數(shù)據(jù)時,使用式(6)把數(shù)據(jù)隱私加密過程約束成通過N(Q)表示的加密函數(shù)的計算,并平衡N(Q)分布
(6)
7)加密保護的網(wǎng)絡(luò)大數(shù)據(jù)時,按照上述步驟能夠?qū)崿F(xiàn)網(wǎng)絡(luò)大數(shù)據(jù)對內(nèi)無損加密[8]。
加密約束條件,可以為網(wǎng)絡(luò)大數(shù)據(jù)無損加密提供可靠度保障,降低對加密的網(wǎng)絡(luò)大數(shù)據(jù)入侵的危險。
在上述建立加密約束條件的基礎(chǔ)上,建立SAT雙向防御模型,大數(shù)據(jù)動態(tài)安全 SAT 雙向防御模型是基于大數(shù)據(jù)的數(shù)據(jù)保存量與運算性能進行分析,模型里的各個部分相互依賴,實現(xiàn)雙向的安全防御。雙向防御架構(gòu)中存在行為數(shù)據(jù)拆分中心、行為數(shù)據(jù)分析中心、行為數(shù)據(jù)包裝中心、云客戶端,并采用動態(tài)SAT雙向防御機制,為用戶提供最高的安全防御。機制流程是:
1)初始化,把一個預(yù)處理的異常數(shù)據(jù)任務(wù)實行排序,排序隊列是Gj(j=1,2,3,4,5,…,m)。若必須對異常數(shù)據(jù)實行加工處理,則行為數(shù)據(jù)拆分中心實行異常數(shù)據(jù)的內(nèi)部拆分與任務(wù)調(diào)度[9]。任務(wù)符合
(7)
其中,R表示異常數(shù)據(jù)匯總能夠拆分的有效可信數(shù)據(jù);m描述單位時間中處理大數(shù)據(jù)環(huán)境中的任務(wù)總值;j描述在資源中分配的個任務(wù)。
2)在行為數(shù)據(jù)拆分中心拆分數(shù)據(jù)之前,建立一個判斷模塊,判斷模塊通過云端監(jiān)控數(shù)據(jù)的操作行為并保存下來[10]。若隊列不屬于空,便實行拆分;若隊列是空,便實行標記,同時遞歸至后續(xù)等待隊列[11]。
3)全部任務(wù)數(shù)H能夠分為j個任務(wù),其依次對應(yīng)j條可信記錄,那么這個分割的函數(shù)F符合
(8)
4)對任務(wù)進行分割后,若不必實行后續(xù)信息處理便退出;若必須實行后續(xù)處理,便再次執(zhí)行[12]。綜上所述動態(tài)SAT雙向防御架構(gòu)算法步驟如圖1所示。
圖1 SAT雙向安全防御模型流程示意圖
在網(wǎng)絡(luò)大數(shù)據(jù)加密約束條件的基礎(chǔ)上,優(yōu)化加密保護網(wǎng)絡(luò)大數(shù)據(jù),并建立SAT雙向安全防御模型,實現(xiàn)對網(wǎng)絡(luò)大數(shù)據(jù)無損加密。
為了分析所提算法對外入侵主動防御效果,對所提算法實行實驗,基于MATLAB7.1軟件平臺中建立大數(shù)據(jù)下網(wǎng)絡(luò)數(shù)據(jù)入侵主動防御仿真平臺。使用Blade Informer Nmap攻擊軟件經(jīng)過攻擊方傳輸模擬網(wǎng)絡(luò)數(shù)據(jù)攻擊包至受攻擊主機。
使用所提算法、基于數(shù)據(jù)聚類的無損加密算法、基于布隆過濾器的無損加密算法,進行對外主動防御實驗對比。通過攻擊切斷程度來判斷三種算法在實行網(wǎng)絡(luò)數(shù)據(jù)入侵主動防御時的自我防護性能,對比結(jié)果如圖2所示。
圖2 三種算法入侵防御效果
分析圖2可明顯看出,所提算法的對外入侵主動防御效果最佳,當(dāng)攻擊包訪問的次數(shù)逐漸增多時,所提算法的攻擊切斷程度并未受影響,始終高于93%,且始終高于基于數(shù)據(jù)聚類的算法、基于布隆過濾器的算法的切斷程度。
對上述實驗里三種算法實行入侵主動防御時節(jié)點損失水平進行比較,比較結(jié)果如圖3所示。
圖3 節(jié)點損失程度對比結(jié)果
分析圖3,伴隨訪問次數(shù)的逐漸增多,所提算法的節(jié)點損失系數(shù)始終控制在0.10之內(nèi),最大值僅有0.07,而基于數(shù)據(jù)聚類的算法、基于布隆過濾器的算法的節(jié)點損失系數(shù)隨著訪問次數(shù)的增多也逐漸增多,且一直高于所提算法。則所提算法在對外入侵主動防御時,網(wǎng)絡(luò)大數(shù)據(jù)節(jié)點損失較小,數(shù)據(jù)完整度保存較好。
采用三種算法進行對內(nèi)數(shù)據(jù)無損加密效果對比分析。設(shè)定三種算法的對比指標依次是安全可靠性、精準度、誤差率,則三種算法的對內(nèi)數(shù)據(jù)無損加密效果對比如表1所示。
表1 三種算法的對內(nèi)數(shù)據(jù)無損加密效果對比
分析表1數(shù)據(jù)可知,所提算法在實行網(wǎng)絡(luò)大數(shù)據(jù)無損加密時的精準度、安全可靠性、誤差率均優(yōu)于基于數(shù)據(jù)聚類的算法、基于布隆過濾器的算法。由此驗證了所提算法能夠有效避免網(wǎng)絡(luò)大數(shù)據(jù)隱私的泄露,存在優(yōu)越的應(yīng)用價值。
測試三種算法在實行網(wǎng)絡(luò)大數(shù)據(jù)對內(nèi)無損加密后的節(jié)點損失程度,對比結(jié)果如表2所示:
表2 網(wǎng)絡(luò)大數(shù)據(jù)對內(nèi)無損加密后的節(jié)點損失程度對比
根據(jù)表2數(shù)據(jù)顯示,所提算法網(wǎng)絡(luò)大數(shù)據(jù)對內(nèi)無損加密后的節(jié)點損失系數(shù)均值僅有0.02,和基于數(shù)據(jù)聚類的算法、基于布隆過濾器的算法相比,所提算法加密后的網(wǎng)絡(luò)大數(shù)據(jù)節(jié)點損失系數(shù)最小,對節(jié)點結(jié)構(gòu)不造成顯著影響。
結(jié)合表1和表2的實驗結(jié)果可知,所提算法可實現(xiàn)網(wǎng)絡(luò)大數(shù)據(jù)無損加密。
進行雙向防御的網(wǎng)絡(luò)大數(shù)據(jù)無損加密時,不論是對外防御還是對內(nèi)加密,均涉及數(shù)據(jù)檢索,為此,將網(wǎng)絡(luò)大數(shù)據(jù)檢索效率以及加密效率作為分析指標,使用三種算法實行基于雙向防御的網(wǎng)絡(luò)大數(shù)據(jù)無損加密實驗,對比分析三種算法的數(shù)據(jù)檢索、數(shù)據(jù)加密時間,對比結(jié)果見圖4、圖5。
圖4 三種算法的數(shù)據(jù)加密效率對比結(jié)果
圖5 數(shù)據(jù)檢索效率對比結(jié)果
分析圖4、圖5可知,所提算法進行網(wǎng)絡(luò)大數(shù)據(jù)無損加密時的網(wǎng)絡(luò)大數(shù)據(jù)檢索效率、加密效率均顯著高于其它兩種算法,這是由于所提算法先通過大數(shù)據(jù)動態(tài)安全 SAT 雙向防御模型,完成網(wǎng)絡(luò)大數(shù)據(jù)雙向防御;再按照OPES+理論思想將大數(shù)據(jù)中的隱私數(shù)據(jù)變成數(shù)值并按照所處方位排序,同時將排序完的方位數(shù)據(jù)劃分成桶,使用保護序加密算法把桶中的數(shù)據(jù)實行加密,保證加密后數(shù)值大小順序保持原樣,將數(shù)據(jù)隱私加密過程約束成加密函數(shù)的計算,基于這個基礎(chǔ)之上得到加密函數(shù),把對網(wǎng)絡(luò)大數(shù)據(jù)無損加密問題變成約束同構(gòu)的線性優(yōu)化問題,以此優(yōu)化了網(wǎng)絡(luò)大數(shù)據(jù)無損加密效率。
以往的數(shù)據(jù)加密算法僅通過直接加密數(shù)據(jù)的形式實現(xiàn)數(shù)據(jù)安全保護,未曾考慮到外來入侵攻擊包對數(shù)據(jù)安全產(chǎn)生的威脅,提出基于雙向防御的網(wǎng)絡(luò)大數(shù)據(jù)無損加密算法,并將其通過仿真實驗驗證其有效性,經(jīng)驗證得出:
1)所提算法的對外入侵主動防御效果最佳,當(dāng)攻擊包訪問的次數(shù)逐漸增多時,所提算法的攻擊切斷程度并未受影響,始終高于93%。
2)訪問次數(shù)的逐漸增多,所提算法對外防御時的節(jié)點損失系數(shù)始終控制在0.10之內(nèi),最大值僅有0.07,對內(nèi)加密時的節(jié)點損失系數(shù)均值僅有0.02,損失極小,可實現(xiàn)無損加密。
3)所提算法在實行網(wǎng)絡(luò)大數(shù)據(jù)無損加密時的精準度、安全可靠性、誤差率均優(yōu)于同類算法。
4)所提算法在進行基于雙向防御的網(wǎng)絡(luò)大數(shù)據(jù)無損加密時的網(wǎng)絡(luò)大數(shù)據(jù)檢索效率、加密效率均顯著。