◎樊曉龍 孫海燕 李鵬
大數(shù)據(jù)安全防御模型構(gòu)建研究
◎樊曉龍 孫海燕 李鵬
傳統(tǒng)網(wǎng)絡安全管理體系在大數(shù)據(jù)時代已顯現(xiàn)不足,本文通過構(gòu)建大數(shù)據(jù)安全架構(gòu)層次,詳細定義大數(shù)據(jù)安全防御體系,結(jié)合粒子群算法思想,提出了大數(shù)據(jù)安全防御模型,具有較強的理論價值和實踐意義。
大數(shù)據(jù)是指攜帶巨量信息的高增長率和多樣化的信息資產(chǎn),正處蓬勃發(fā)展階段,怎樣保證其安全可靠是一個亟待解決的問題。病毒探測、主動防御等傳統(tǒng)安全防護體系,無法適用大數(shù)據(jù)的可靠性管理。大數(shù)據(jù)安全防御的重點是構(gòu)建可行的防御模型。本文基于大數(shù)據(jù)可靠性需求,提出一種動態(tài)安全算法,構(gòu)建了大數(shù)據(jù)安全防御模型。
2.1安全架構(gòu)層次設計
本文將大數(shù)據(jù)安全架構(gòu)劃分為以下4個層次:
(1)數(shù)據(jù)拆分層,主要按照數(shù)據(jù)拆分策略對大數(shù)據(jù)進行分布式管理,通過聚類算法對所獲取的數(shù)據(jù)集進行分類和預處理。
(2)數(shù)據(jù)分析層,主要分析預處理之后的大數(shù)據(jù),分析目標包括可疑病毒、非法任務等。發(fā)現(xiàn)的風險因素會被立即隔離。
(3)數(shù)據(jù)包裝層,主要實現(xiàn)大數(shù)據(jù)的有效封裝。封裝時要充分考慮信息的加密需求,確保封裝后數(shù)據(jù)的隱私性、準確性和安全性。
(4)客戶應用層,主要是大數(shù)據(jù)的使用者和分析報告的上傳者。
2.2安全防御體系的定義
本文以粒子群算法為基礎,構(gòu)建大數(shù)據(jù)安全防御體系。
首先為計算出大數(shù)據(jù)的信任度,提出以下4個定義:
定義1:如果信任度的起始與個體最好值)1(-mTold相等,則進行迭代操作的時候不再改變;假若信任度的起始值比上一值更優(yōu),則根據(jù)粒子群算法的規(guī)則,以起始值替換上一值:
表示,耦合度的大小與數(shù)據(jù)的分散程度有關,當耦合度接近于1的時候,證明局部最優(yōu)解已經(jīng)形成。
定義4:結(jié)合以上3個定義,能夠?qū)討B(tài)信任因子表示為:
基于上述研究成果,為描述大數(shù)據(jù)安全防御行為,提出以下5個定義:
定義5:假若大數(shù)據(jù)可靠度處在信任因子范圍內(nèi),則可以視為大數(shù)據(jù)是強安全的,表示為:infosuperi,j=1,iflevelmax<usi≤wmax0,others
定義6:假若大數(shù)據(jù)可靠度處在信任因子范圍內(nèi),但對于其他的訪問者處在“開放訪問”狀態(tài),則被視為弱安全,表示為:
infoweaki,j=1,ifusi≤wmax1-wmax-usi/levelmaxwmax,others
定義7:在合法性方面,假若大數(shù)據(jù)處在最高合法水平,并且對于其他的訪問者處在“不可訪問”狀態(tài),則大數(shù)據(jù)被視為強合法狀態(tài)。表示為:lawsuperi,j=1,if uli≤wmax0,others
定義8:假若大數(shù)據(jù)處在最高合法水平,并且對于其他的訪問者處在“驗證訪問”狀態(tài),則大數(shù)據(jù)被視為弱合法狀態(tài)。表示為:
lawweaki,j=1,if uli≤wmax1-exp-wmax+1-uliexpwmax-1,others
定義9:假若大數(shù)據(jù)處在“開放訪問”狀態(tài),則大數(shù)據(jù)被視為不合法狀態(tài)。表示為:
最后,客戶的操作請求與大數(shù)據(jù)可靠度間的關系表示為:
2.3安全防御體系證據(jù)分析
為保證大數(shù)據(jù)的“強安全”與“合法狀態(tài)”,假設大數(shù)據(jù)服務信息系統(tǒng)共擁有m臺服務器,在m臺服務器中,提取n臺作為構(gòu)建安全防御體系的數(shù)據(jù)樣本。進一步假設,從n臺服務器所獲取的樣本數(shù)據(jù)α∈泊松分布,則這些樣本在服務器輸入端以排隊的方式等候處理和傳輸,等候時間為1/α。如果一段數(shù)據(jù)信息的等候時間超時,則可視為信息已被丟棄。此時會生成一個反饋信息,通知信息的發(fā)送者重發(fā)信息。結(jié)合馬爾科夫定律,在這種數(shù)據(jù)傳輸環(huán)境中,可靠度不足的信息識別是符合遍歷準則的。
2.4安全防御模型實現(xiàn)流程
綜上所述,完整的大數(shù)據(jù)可靠性防御模型實現(xiàn)流程為:
(1)安全防御的初始化過程,新任務加入等待隊列。如果輪到該任務進行處理,便將其信息從數(shù)據(jù)存儲區(qū)提取出來,按照數(shù)據(jù)預處理策略進行分布式管理和數(shù)據(jù)集分類。
(2)當判定數(shù)據(jù)為有效信息之后,將任務提交數(shù)據(jù)拆分層進行信息拆分處理。在信息拆分之前,系統(tǒng)預置了信息判定單元,這個單元的功能是對所有的信息處理過程引入來自云端的可靠性監(jiān)控。
(3)如果信息中所含有的任務之和能夠進行分解,使之成為n個子任務,則分割函數(shù)可以表示為:
(4)將拆分形成的子任務提交數(shù)據(jù)分析層進行分析處理。如果子任務信息已經(jīng)在任務數(shù)據(jù)庫中存在,則判斷為重復任務,將其刪除以保證數(shù)據(jù)庫的低冗余。
(5)分析處理完畢的子任務,提交到數(shù)據(jù)包裝層。依據(jù)其獨有的索引代碼,形成哈希表,將其重新連接為一個整體的任務單元,并進行加密封裝,之后傳輸至客戶應用層。
(6)判斷是否存在下一個需要處理的任務;如果存在,則轉(zhuǎn)至第一步。
本文提出的大數(shù)據(jù)安全防御模型,基于動態(tài)安全算法,能夠克服傳統(tǒng)網(wǎng)絡安全管理體系不足,在信息安全受到威脅之前定位和清除隱患。該模型成功實現(xiàn)了基于云計算環(huán)境下的大數(shù)據(jù)安全隱私保護,符合大數(shù)據(jù)可靠性管理要求,具有較高推廣價值。大數(shù)據(jù)時代,現(xiàn)有的數(shù)據(jù)隱私保護技術(shù)還不夠完善,需要從科研和技術(shù)層面加大對云平臺的大數(shù)據(jù)安全隱私保護的研究。
(作者單位:1. 31433部隊;2. 31438部隊)