摘 要:為取得最優(yōu)網(wǎng)絡(luò)安全主動(dòng)防御效果,提出了網(wǎng)絡(luò)攻防信號博弈模型和基于上述模型的主動(dòng)防御策略優(yōu)化算法,并通過典型網(wǎng)絡(luò)實(shí)例分析了上述模型和算法在網(wǎng)絡(luò)安全主動(dòng)防御中的應(yīng)用。分析結(jié)果表明,提出的模型和方法是可行、有效的。
關(guān)鍵詞:主動(dòng)防御;策略優(yōu)化;博弈;網(wǎng)絡(luò)攻防;不完全信息
中圖分類號:TP309文獻(xiàn)標(biāo)識碼:A文章編號:2096-4706(2018)01-0138-03
An active defense strategy optimization method based on the game model of network attack and defense signal
WANG Shichao,CAO Yuan
(National University of Defense Technology,Changsha 410000,China)
Abstract:In order to obtain the optimal network security active defense effect,put forward the network attack signal game model and optimization algorithm based on active defense strategy of the model,finally through a typical example of the network analysis of the application of the model and algorithm in the network security active defense. The analysis results show that the proposed model and method are feasible and effective.
Keywords:active defense;strategy optimization;game;network attack and defense;incomplete information
0 引 言
為保護(hù)網(wǎng)絡(luò)安全,最理想的情況是,通過攻擊分析預(yù)測,在攻擊發(fā)生前實(shí)施主動(dòng)防御措施,對所有的弱點(diǎn)或者攻擊行為均做出防護(hù)。但是受資源和能力制約,“不惜一切代價(jià)的”防御是不現(xiàn)實(shí)的[1],管理員需要評估所有主動(dòng)防御策略的有效性,從中選取最優(yōu)策略,以利用有限的資源最大程度地保護(hù)網(wǎng)絡(luò)安全。
在網(wǎng)絡(luò)安全對抗實(shí)際過程中,防御者策略的有效性,不僅取決于己方的行動(dòng),還取決于攻擊者的策略。基于這種策略依存性,本文采用網(wǎng)絡(luò)攻防信號博弈模型的框架,模擬攻防雙方的對抗競爭和信息交互,幫助防御者選取最優(yōu)主動(dòng)防御策略。
1 相關(guān)研究
博弈論是研究事先決策的理論,網(wǎng)絡(luò)攻防對抗中雙方的策略依存性、非合作性正是博弈論的基本特征[2],因此,學(xué)者們將博弈論與網(wǎng)絡(luò)安全相結(jié)合,對攻防雙方的行為進(jìn)行建模研究,用于解決不同領(lǐng)域的問題。文獻(xiàn)[3]基于博弈雙方的對立性,將博弈論引入到網(wǎng)絡(luò)安全對抗研究;文獻(xiàn)[4]提出了基于博弈論對信息安全技術(shù)進(jìn)行評價(jià)的模型,側(cè)重于對信息安全優(yōu)化配置的研究;文獻(xiàn)[5]運(yùn)用完全信息博弈理論對網(wǎng)絡(luò)中發(fā)生的攻擊行為進(jìn)行分析,并指導(dǎo)防御策略的選??;文獻(xiàn)[6]則引入動(dòng)態(tài)博弈模型,通過“虛擬節(jié)點(diǎn)”將網(wǎng)絡(luò)攻防圖轉(zhuǎn)化為網(wǎng)絡(luò)博弈樹,用于研究主動(dòng)防御中的策略選擇;文獻(xiàn)[7]針對現(xiàn)實(shí)攻防中雙方收益不完全相等條件,提出基于非零和攻防博弈模型的策略選取算法;文獻(xiàn)[8]將不完全信息靜態(tài)博弈模型運(yùn)用于蠕蟲攻防策略績效評估。上述研究均基于完全信息或者同時(shí)行動(dòng)的假設(shè),這個(gè)條件在現(xiàn)實(shí)網(wǎng)絡(luò)攻防中很難滿足。
本文借鑒了上述相關(guān)研究成果,基于攻防雙方的行動(dòng)次序性、不完全信息條件,構(gòu)建網(wǎng)絡(luò)攻防信號博弈模型,并給出了基于上述模型的最優(yōu)主動(dòng)防御策略優(yōu)化算法。
2 網(wǎng)絡(luò)攻防信號博弈模型與防御策略優(yōu)化算法
2.1 模型形式化定義
定義1.網(wǎng)絡(luò)攻防信號博弈模型(Network Attack-Defense Signaling Game Model)是一個(gè)4元組,NADSGM=(N,O,T,U)。其中:
(1)N是局中人集合,N=(NA,ND)。NA代表攻擊者,ND代表防御者。
(2)O是可觀察事件集合,O={o1,o2,...,og}。
(3)T是行動(dòng)空間集合,T=(TA,TD)。TA={a1,a2,...,am}是攻擊者可用的攻擊策略集;TD={d1,d2,...,dn}是防御者可用的防御策略集,并假設(shè)任意防御策略di都是由若干可觀察事件組成的序列。
(4)U是效用函數(shù)集合,U=(UA,UD)。UA是攻擊者的效用函數(shù),UD是防御者的效用函數(shù)。
2.2 攻防效用函數(shù)
未采取防御措施時(shí),攻擊回報(bào)一般用攻擊造成的網(wǎng)絡(luò)系統(tǒng)損失表示。面向主動(dòng)防御的攻防過程中,攻擊回報(bào)期望用采取防御措施后,該攻擊對網(wǎng)絡(luò)系統(tǒng)造成的的殘余的未被消除的損失表示,防御回報(bào)用采取該防御措施后網(wǎng)絡(luò)系統(tǒng)免受的損失表示。于是,可得攻防雙方收益:
UA(di,ak)=Rcost(di,ak)-AC(ak)
UD(di,ak)=Dcost(ak)-Rcost(ak,di)-Deost(di)
其中,Rcost、AC、Dcost、Decost分別為殘余損失、攻擊成本、網(wǎng)絡(luò)系統(tǒng)損失、防御成本。[1]
2.3 精煉貝葉斯均衡
定義2.精煉貝葉斯均衡是行動(dòng)組合a*(oj)、d*(oj)和推斷的結(jié)合,它滿足:
其中:(1)是攻擊者觀察到某事件oj,對可能的防御策略di的推斷;(2)a*(oj)、d*(oj)是給定推斷條件下,攻防雙方采取的最有利于己方的行動(dòng);(3)推斷是攻擊者依據(jù)貝葉斯法則和事件oj的先驗(yàn)概率得到。
2.4 均衡求解過程
(1)在攻擊者的信息集上建立推斷。攻擊者根據(jù)觀察到的事件oj,對可能的防御策略di,建立后驗(yàn)概率推斷。
(2)給定推斷條件下,對每一個(gè)接收的信號oj∈0,攻擊者選取最有利于己方的行動(dòng)a*(oj)∈TA,使攻擊收益最大化。通過求解下式:
可得攻擊者的最優(yōu)攻擊純策略a*(oj)。
(3)防御者已知整個(gè)博弈過程,預(yù)測到攻擊者采取的最優(yōu)行動(dòng)a*(oj),給定可觀察事件集O={o1,o2,...og}條件下,選取最有利己方的防御策略d*(oj),使防御收益最大化。通過求解下式:
可得防御者的最優(yōu)防御純策略d*(oj)。
(4)步驟(2)、(3)得到的攻防純策略,可組成子博弈精煉納什均衡{a*(oj),d*(oj)},用貝葉斯法則驗(yàn)證并去掉不可置信攻擊純策略a*(oj),可得網(wǎng)絡(luò)攻防信號博弈的貝葉斯精煉均衡。
2.5 基于網(wǎng)絡(luò)攻防信號模型的防御策略優(yōu)化算法
算法1.基于網(wǎng)絡(luò)攻防信號博弈模型的防御策略優(yōu)化算法
輸入:攻防信號博弈模型
輸出:最優(yōu)主動(dòng)防御策略
(1)初始化博弈模型NADSGM=(N,O,T,U);
(2)構(gòu)建防御策略集合TD={d1,d2,...,dn};
(3)構(gòu)建可觀察事件集合O={o1,o2,...,og};
(4)構(gòu)建攻擊策略集合TA={a1,a2,...,am};
(5)對攻擊策略集TA和防御策略集合TD,生成笛卡爾集合TA×TD;
(6)對每一個(gè)攻防策略對(ak,di)∈TA×TD,計(jì)算其攻防收益值,生成收益矩陣U=(UA,UD);
(7)for all di∈TD,建立先驗(yàn)概率p(oj|di);
(8)for all oj∈O,攻擊者建立推斷;
(9)求最優(yōu)攻擊行動(dòng)a*(oj),即
(10)求防御者預(yù)測依存的最優(yōu)防御行動(dòng)d*(oj),即
(11)生成子博弈精煉納什均衡{a*(oj),d*(oj)};
(12)驗(yàn)證貝葉斯條件,即對所有oi∈O,if p(oj|d*(oi))≠0;
(13)then求得精煉貝葉斯均衡{a*(oj),d*(oj)};
(14)return d*(oj)。
該算法的時(shí)間復(fù)雜度主要集中在均衡求解計(jì)算部分,時(shí)間復(fù)雜度為o(2n+2m3);算法的空間消耗主要集中在存儲(chǔ)攻防收益矩陣和均衡求解中間結(jié)果,空間復(fù)雜度為o(mn)。
3 實(shí)驗(yàn)驗(yàn)證及分析
實(shí)驗(yàn)攻擊主機(jī)位于外部網(wǎng)絡(luò),目標(biāo)網(wǎng)絡(luò)為交換網(wǎng)絡(luò),其中共有4臺計(jì)算機(jī),分別為公共Web服務(wù)器、FTP文件服務(wù)器、Mail郵件服務(wù)器和SQL數(shù)據(jù)庫服務(wù)器。根據(jù)防火墻規(guī)則,只允許外部主機(jī)以普通用戶權(quán)限訪問Web服務(wù)器,內(nèi)部各服務(wù)器節(jié)點(diǎn)可以普通用戶權(quán)限互相訪問。假設(shè)攻擊者在攻擊主機(jī)有ROOT權(quán)限,以取得FTP、Mail、SQL服務(wù)器全部訪問權(quán)限為目標(biāo),利用網(wǎng)絡(luò)脆弱點(diǎn)信息,實(shí)施一系列原子攻擊[10]。如表1和表2所示。
可得攻擊策略集合TA={a1,a2,a3,a4,a5}和防御策略集合TD={d1,d2,d3,d4}:
(1)a1:01-02-05-08;a2:01-02-06-11;a3:01-03-08-10;a4:01-03-07-08;a5:01-04-09-11;
(2)d1:(Ⅰ,Ⅱ,Ⅳ);d2:(Ⅰ,Ⅲ,Ⅴ);d3:(Ⅰ,Ⅱ,Ⅵ);d4:(Ⅰ,Ⅳ,Ⅵ)
按照上述精煉貝葉斯均衡求解過程和基于博弈模型的防御策略優(yōu)化算法,得到純策略精煉貝葉斯均衡{d3,a4}。因此,對防御者的最優(yōu)防御純策略是d3,攻擊者的最優(yōu)攻擊純策略是a4。將本文的方法和其他文獻(xiàn)的方法進(jìn)行比較,一方面,網(wǎng)絡(luò)攻防信號博弈作為不完全信息博弈模型,與完全信息博弈相比,考慮了攻防雙方不清楚對方信息的情況,更加貼近攻防實(shí)際情形;另一方面,靜態(tài)博弈要求攻擊者和防御者同時(shí)做出選擇,而網(wǎng)絡(luò)攻防信號博弈作為動(dòng)態(tài)博弈模型,充分考慮了攻防雙方行動(dòng)的非同時(shí)性,更加符合實(shí)際要求。
4 結(jié) 論
為保護(hù)網(wǎng)絡(luò)安全,需要管理員合理選取主動(dòng)防御策略,以利用有限的資源取得最大的防御效果。為此,本文提出了網(wǎng)絡(luò)攻防信號博弈模型,根據(jù)攻擊圖給定雙方攻防策略集,將防御者的主動(dòng)防御與攻擊者觀察并理性行動(dòng)的博弈過程形式化建模,在此基礎(chǔ)上,通過求解精煉貝葉斯均衡,選取最優(yōu)主動(dòng)防御策略,最后通過一個(gè)仿真實(shí)驗(yàn)驗(yàn)證了模型和方法的有效性。為不完全信息條件的攻防動(dòng)態(tài)對抗研究提供了有效的模型方法,并能夠?yàn)楣芾韱T的主動(dòng)防御決策提供指導(dǎo)。
參考文獻(xiàn):
[1] JIANG wei,F(xiàn)ANG Binxing,TIAN Zhihong,et al. Research on defense strategies selection based on attack-defense stochastic game model [J].Jisuanji Yanjiu yu Fazhan/Computer Research and Development,2010,47(10):1714-1723.
[2] 劉剛,張宏,李千目.基于博弈模型的網(wǎng)絡(luò)安全最優(yōu)攻防決策方法 [J].南京理工大學(xué)學(xué)報(bào)(自然科學(xué)版),2014,38(1):12-21.
[3] ANDERSON R. Why information security is hard: an economic perspective[C]//17th Annual Computer Security Application Conference. Washington,DC,USA:IEEE Computer Society,2016:39-40.
[4] 朱建明.基于博弈論的信息安全技術(shù)評價(jià)模型 [J].計(jì)算機(jī)學(xué)報(bào),2015(4):828-834.
[5] LYE K,WING J. Game strategies in network security [J]. International Journal of Information Security,2015,54(1/2):71-82.
[6] 林旺群,王慧,劉家紅.基于非合作動(dòng)態(tài)博弈的網(wǎng)絡(luò)安全主動(dòng)防御技術(shù)研究 [J].計(jì)算機(jī)研究與發(fā)展,2013,48(2):306-316.
[7] 陳永強(qiáng),付鈺,吳曉平.基于非零和攻防博弈模型的主動(dòng)防御策略選取方法 [J].計(jì)算機(jī)應(yīng)用,2013,33(5):1347-1352.
[8] 劉玉嶺,馮登國,吳麗輝.基于靜態(tài)貝葉斯博弈的蠕蟲攻防策略績效評估[J].軟件學(xué)報(bào),2013,23(3):712-723.
[9] 羅伯特·吉本斯,高峰.博弈論基礎(chǔ) [M].北京:中國社會(huì)科學(xué)出版社,1999.
[10] Li X,Xue Y.A survey on server-side approaches to securing web applications [J]. Acm Computing Surveys,2014,46(4):1-29.
作者簡介:王世超(1985-),男,河南南樂人,碩士。主要研究方向:網(wǎng)絡(luò)與信息安全;曹源(1985-)男,江西贛人,講師,博士。主要研究方向:網(wǎng)絡(luò)與信息安全、網(wǎng)絡(luò)脆弱性分析。