亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于三方動態(tài)博弈模型的網絡生存防御策略優(yōu)化配置

        2017-12-19 05:09:13楊發(fā)亮張兆忠劉長樂
        火力與指揮控制 2017年11期
        關鍵詞:納什攻擊者概率

        伍 文,楊發(fā)亮,張兆忠,劉長樂

        (解放軍93936部隊,銀川 750025)

        基于三方動態(tài)博弈模型的網絡生存防御策略優(yōu)化配置

        伍 文,楊發(fā)亮,張兆忠,劉長樂

        (解放軍93936部隊,銀川 750025)

        針對網絡攻防環(huán)境中防御方以提高系統(tǒng)生存能力為目的所進行的最優(yōu)生存防御策略的選取問題,提出了一種基于完全信息動態(tài)博弈理論的生存防御策略優(yōu)化配置算法。將惡意攻擊方、故障意外事件及防御方作為博弈的參與人,提出了一種混合戰(zhàn)略模式下的三方動態(tài)博弈模型,對博弈的主要信息要素進行了說明,以混合戰(zhàn)略納什均衡理論為基礎,將原納什均衡條件式的表達式轉化為可計算數(shù)值結果的表達式,并據(jù)此增加了近似的概念,最后,將提出的模型和近似納什均衡求解算法應用到一個網絡實例中,結果證明了模型和算法的可行性和有效性。

        網絡可生存性,策略選取,動態(tài)博弈,納什均衡,粒子群

        0 引言

        計算機網絡在金融、醫(yī)療、交通、軍事、通信等領域發(fā)揮重大作用的同時,也遭受著來自各方面的威脅。各種網絡安全、生存技術被開發(fā)以提高系統(tǒng)抵御威脅的能力。已有的可生存技術有IP重路由、服務動態(tài)配置、冗余、備份等[1]。但這些技術主要是針對威脅的、被動的、孤立的防御策略,沒有形成統(tǒng)一戰(zhàn)線;依賴人為選取策略,時效性低,也沒有綜合考慮成本因素;且部分技術功能交叉,造成了資源的浪費[2]??傊狈σ惶仔兄行У慕y(tǒng)一調配機制使得這些技術的功能得到最大發(fā)揮。網絡生存防御策略優(yōu)化配置算法,是從策略層面考慮的生存防御措施,能夠利用已有的安全及可生存性技術,動態(tài)優(yōu)化配置網絡的各種生存資源,有效提高網絡的主動防御能力[3-4]。

        文獻[5]將故障、意外事件作為非理性攻擊者納入到博弈體系中,與攻擊者、防御者共同構成博弈的參與方,建立一種三方完全信息生存動態(tài)博弈模型,提出了網絡生存防御純策略優(yōu)化配置算法。本文在此基礎之上,給出了一種網絡生存防御混合策略優(yōu)化配置算法?;旌喜呗郧闆r下,動態(tài)博弈參與人不是確定地選擇行動空間中的某一策略,而是以一定的概率選擇該策略予以指導行動。選擇混合策略的目的是給其他參與人造成不確定性,這樣盡管其他參與人知道選擇某個特定純策略的概率是多少,但是并不能猜透實際上會選擇哪個純策略。混合策略相比純策略在應用上更具靈活性。

        1 三方動態(tài)博弈模型的建立

        建立的三方動態(tài)博弈模型如圖1所示,

        A.參與人:三方博弈參與者為攻擊者、故障意外事件及防御者。攻擊者指人為惡意攻擊一方,具備分析決策能力,可理性判斷應該采取的行動。故障意外事件為非理性攻擊者,發(fā)生具有隨機性,服從一定的分布,不具備理性分析能力。作為特殊的博弈參與人,故障意外事件是由外在自然觸發(fā),以觸發(fā)概率值作為輸入。防御者則通過實施各種防御策略達到對網絡保護的目的。

        B.行動次序:動態(tài)博弈參與人的行動次序是序貫的,各參與人依次采取行動。不同的行動順序會產生不同的博弈結果。根據(jù)各參與人的決策順序確定博弈模型的行動次序。

        C.行動空間:行動空間是依據(jù)參與人的策略集,在每一個行動點的可選行動集。三方博弈中,對于攻擊者,在攻擊初始的行動空間AAo包括攻擊者可選的攻擊類型,可選的攻擊對象等,在攻擊進行中的行動空間AAg包括繼續(xù)攻擊、停止攻擊、停留觀察等策略;對于防御方的行動空間AS包括防御者針對各種攻擊的容忍、恢復等策略;對于故障、意外事件,其行動空間AFo包括故障、意外事件的類型、位置等信息,AFg包括繼續(xù)破壞、停止破壞等信息,與攻擊者不同的是,其行動空間是非理性的,具體行動由故障、意外造成的實際影響確定。

        D.信息集:博弈理論中信息是參與人有關其他參與人特征和行動的知識。根據(jù)博弈參與人所掌握的信息,將博弈擴展式上的所有決策結分割成不同的集合,這些集合稱為信息集,對一個參與人的同一個信息集,后一個參與人無法區(qū)分博弈進入該集合的哪一個決策結。對于完美信息動態(tài)博弈,信息集都是單點集[6]。

        E.收益:在動態(tài)博弈中,收益是指在特定的序貫行動組合下參與人得到的效用水平。收益量化是博弈中一個非常重要的問題,其準確性直接決定博弈結果的準確性?;旌蠎?zhàn)略動態(tài)博弈參與人的收益是參與人純策略收益組成的期望收益,下面給出計算方法[7]。

        其中,φ為所有路徑組成的集合。

        這里需要說明一下的是,三方動態(tài)博弈模型中,攻擊者的收益包括攻擊者的自身收益和非理性攻擊者的額外收益。故障意外事件是由自然觸發(fā)的,不以獲得收益為目的。

        F.擴展式表示:動態(tài)博弈擴展式是以樹型結構將動態(tài)博弈過程形象直觀地表示出來。給出三方博弈的擴展式示意圖如圖2所示,“1”表示故障,“2”表示攻擊者,“3”表示防御者。

        2 混合戰(zhàn)略納什均衡及其計算形式

        有限n人非合作混合戰(zhàn)略動態(tài)博弈中[8],混合戰(zhàn)略組合是一個納什均衡,如果對于所有的 i=1,2,…,n,滿足:

        式(2)給出的納什均衡定義是以條件的方式給出。對于一個復雜的博弈問題,給出一個結果可輕易判斷該結果是否為納什均衡值,但是難以從式(2)直接求解得到納什均衡值。因此,首先將式(2)轉化為易于計算的形式。

        式(3)將得到一個確定的值,而非式(2)中僅為一個判定過程。

        式(4)是以一定的近似找到接近納什均衡的一組解,近似程度根據(jù)實際需要確定,近似程度由γ確定,γ越大,越接近納什均衡,當γ=100時,得到的γ%近似納什均衡與式(3)給出的納什均衡一致。

        采用粒子群算法對提出的三方動態(tài)模型進行求解,具體求解過程在文獻[9]中已經做過描述,這里不再贅述。

        3 實例分析

        采用如圖3所示的網絡環(huán)境進行模擬實驗分析。

        理性攻擊者通過外網對內網的各個節(jié)點進行攻擊,以破壞內部網絡的可用性作為目的,內網布置有各種生存措施阻擋外來威脅對系統(tǒng)網絡造成的傷害,非理性攻擊者(例如,軟硬件故障)的發(fā)生是隨機,可人為統(tǒng)計其概率數(shù)據(jù)。三方動態(tài)博弈模型的建立是以網絡在容忍、恢復階段的生存對抗為背景的(將網絡的生存過程分為抵抗,檢測,容忍恢復3個階段)。對博弈參與者策略的分析如表1所示:

        表1 參與者策略表

        3.1 單個攻擊對象的模型建立及納什均衡結果分析

        首先以網絡中單個設備為研究對象來構建三方動態(tài)博弈模型和進行混合戰(zhàn)略納什均衡的計算。針對圖3中節(jié)點1Web服務器,某管理員在了解各方策略的前提下,設計了攻擊者、防御者及故障事件的三方動態(tài)博弈模型如下頁圖4所示,根據(jù)其經驗給出了各博弈路徑的攻防雙方的收益值。該模型分為兩個部分,用虛線分開,虛線上和虛線下的部分分別為Web服務器故障和無故障情況下的動態(tài)博弈模型。在后續(xù)的仿真中,將分別計算兩種情況下的近似納什均衡。

        下頁圖4中,加方框的決策結為理性攻擊者與防御者需要做決策的點,與其連接的后續(xù)行動被選取的概率值即為混合戰(zhàn)略納什均衡的求解對象,這些決策結分別被標識為a~e,其后續(xù)行動的概率值分別表示為σa1、σa2、σb1、σb2......,以此類推(見圖 4)。其中σx1+σx2=1,x表示a~e。未加方框的決策結包含兩種情況,一種為故障意外事件,其行動策略的概率值是在算法運行前根據(jù)實際掌握數(shù)據(jù)給定;一種為理性攻擊者,但其后續(xù)行動只有一個。

        首先計算Web服務器無故障情況下的納什均衡,設置仿真參數(shù) c1=c2=1,ωmax=0.9,ωmin=0.6,取粒子群規(guī)模m=10,根據(jù)文獻[9]中的算法計算得到納什均衡結果為:

        對圖4進行分析,觀察其收益函數(shù),不論在什么情況下,理性攻擊者采取DoS攻擊、繼續(xù)攻擊均會得到相比其他策略更高的收益,因此沒有理由選取其他策略而放棄策略DoS攻擊和繼續(xù)攻擊;同理,防御者沒有理由不選取容忍和動態(tài)修復策略,雙方均會以更可能高的概率(概率值為1)來選擇這4個策略。因此,分析得到的納什均衡結果與納什均衡求解算法計算得到的納什均衡一致,該仿真驗證了基于粒子群的納什均衡求解算法的正確性。

        在獲知納什均衡結果的前提下,對Web服務器無故障情況下的γ%近似納什均衡進行分析,圖5給出了近似程度γ隨迭代次數(shù)增加的變化過程。

        迭代次數(shù)在25次以下時,γ的值起伏比較大,但整體趨勢向納什均衡點靠近;當?shù)螖?shù)在25~43次之間時,γ的值明顯趨近納什均衡點,但結果不穩(wěn)定,將該階段稱為γ%近似偽納什均衡階段,該階段γ最小的取值γmin=97.94,最大值γmax=100,平均值γavg=99.65,可以看出該階段的納什均衡結果已經非常近似真正的納什均衡結果;當?shù)螖?shù)在43次以上時,γ已經很穩(wěn)定地取值為100,該階段計算得到的數(shù)值結果即為納什均衡結果。經過比對γ%近似納什均衡階段和納什均衡階段的數(shù)值可以得出:γ%近似納什均衡可以以更小的代價得到一近似納什均衡結果,該結果與納什均衡非常接近,與真實的納什均衡具有相同的應用價值。

        圖6給出了程序運行時間隨著迭代次數(shù)的變化趨勢,從圖6可以看出,隨著迭代次數(shù)的遞增,計算納什均衡消耗的時間也不斷增加,在γ%近似偽納什均衡階段,需要消耗的最少時間ta=1.964 0 s,而在納什均衡階段,需要消耗的最少時間tb=3.699 5 s。計算γ%近似納什均衡相比計算納什均衡時間節(jié)省了約為一半。

        在圖5中γ%近似偽納什均衡階段選取4組納什均衡結果在圖7中表示出來,從圖中可以看出這4組值均非常接近真實的納什均衡結果。因此,γ%近似納什均衡概念的提出在確保結果有效的前提下節(jié)省了計算資源,這在實際網絡策略選擇應用中節(jié)省了決策時間,使得決策反映速度得到了提高。

        當收益計算過程考慮的因素更加復雜,例如增加代價的計算,而不是僅僅行動即獲益的思路,那么通過分析是無法獲知納什均衡結果的,而要依賴復雜的算法來求解。在Web服務器有故障情況的納什均衡計算中,考慮該情況。

        在Web服務器有故障情況下的納什均衡計算中,粒子群算法的仿真參數(shù)與無故障情況下相同,迭代進行60次,得到4組不同故障場景下的納什均衡仿真結果如表2所示。

        表2中,當故障持續(xù)概率為100%時,攻擊方將選擇分別以100%和73.07%的概率選擇DoS攻擊n1和繼續(xù)攻擊策略,防御方將分別以100%和75%的概率選擇容忍和動態(tài)修復策略,此時該近似納什均衡結果以99.99%的近似程度近似于納什均衡。當故障持續(xù)概率降為80%,DoS攻擊n1的概率σa1與防御方容忍的概率σc1幾乎保持不變,而繼續(xù)攻擊的概率σd1由73.07%增加為92.43%,這是由于攻擊方由故障獲得的額外收益減少,則需提高其繼續(xù)攻擊的概率以增加其收益值。防御方減少選擇動態(tài)修復策略的概率為63.51%,使得故障持續(xù)率降低、攻擊方繼續(xù)攻擊率增加的情況下防御方具有最佳收益值。當故障持續(xù)概率繼續(xù)降低為50%,30%時,攻擊方只有將繼續(xù)攻擊的概率提高至100%,才能保證其收益值最佳,此時防御方也只有以100%的概率選取動態(tài)修復策略時得到最佳收益值。

        表2 納什均衡仿真結果

        3.2 多個攻擊對象的模型建立分析

        由于考慮了多個攻擊對象,模型的復雜度將遠遠超過單個攻擊對象時的模型復雜度,簡化攻防策略,省略相似的攻防過程得到三方動態(tài)博弈模型如圖8所示。

        當攻擊者的攻擊對象為多個網絡設備時,攻擊者在發(fā)起攻擊時沒有確定攻擊對象,那么在建立三方動態(tài)博弈模型時攻擊者的攻擊初始策略包含兩個方面的內容,分別為攻擊哪一個對象以及以什么方式攻擊,以圖3所示攻防模型為例,攻擊者可選的攻擊對象為節(jié)點n1、n2以及n3,可選的攻擊方式有DoS攻擊以及木馬攻擊。

        三方動態(tài)博弈模型的建立是納什均衡求解最基礎也是最關鍵的部分,在給出完整的模型后,根據(jù)第2節(jié)中描述的粒子群算法求解納什均衡,僅以n1故障情況下的博弈模型為例進行說明,仿真參數(shù)為:c1=c2=1,ωmax=0.9,ωmin=0.6,m=40,迭代 100 次得到納什均衡結果如下

        該納什均衡結果與真實的納什均衡結果的近似程度為99.99%,攻防雙方按照該納什均衡的結果選取策略將會得到最佳的收益。

        4 結論

        針對網絡攻防對抗中生存防御策略的優(yōu)化配置問題,提出了一種混合策略模式下基于三方動態(tài)博弈的網絡攻防對抗模型。將提出的模型應用到一個網絡實例中,對其策略選擇過程進行分析,分別建立了單個攻擊對象和多個攻擊對象情況下的三方動態(tài)博弈模型,將兩種情況下仿真得到的納什均衡結果與實際的納什均衡結果進行對比分析,均驗證了所提理論的有效性和實用性。

        [1]李黎,鄭慶華,管曉宏.基于有限資源提升網絡可生存性的拓撲重構方法[J].物理學報,2014,63(17):1-11.

        [2]LIN Y S,CHEN P Y,CHEN Q T.Resource allocation strategies to maximize network survivability considering of average DOD[C]//Proc of 9th International Conference on Distributed Computing and Artificial Intelligence.Berlin:Springer Berlin Heidelberg,2012:751-758.

        [3]林旺群,王慧,劉家紅,等.基于非合作動態(tài)博弈的網絡安全主動防御技術研究[J].計算機研究與發(fā)展,2011,48(2):306-316.

        [4]ZHAO L R,MEI S E,ZHONG W J.Optimal configuration of firewall,IDS and vulnerability scan by game theory[J].Journal of Southeast University(English Edition),2011,27(2):144-147.

        [5]伍文,孟相如,馬志強,等.三方動態(tài)博弈網絡可生存性策略選擇[J].應用科學學報,2014,25(4):205-208.

        [6]梁霄,孟相如,陳鐸龍,等.基于隨機博弈模型的網絡可生存性跟蹤評估[J].火力與指揮控制,2013,38(9):32-36.

        [7]KAMHOUA C A,KWIAT K A,PARK J S.Surviving in cyberspace:a game theoretic approach[J].Journal of Communications,2012,7(6):436-450.

        [8]FRIHAUF P,KRSTIC M,BASAR T.Nash equilibrium seeking in noncooperative games[J].IEEE Transaction on Automatic Control,2012,57(5):1192-1207.

        [9]伍文,孟相如,康巧燕,等.粒子群算法求解混合戰(zhàn)略近似 納 什 均 衡 [J]. 計 算 機 應 用 研 究 ,2014,31(8):2302-2329.

        Strategy Optimizing Selection of Network Survivability Based on Three Players’Dynamic Game Model

        WU Wen,YANG Fa-liang,ZHANG Zhao-zhong,LIU Chang-le
        (Unit 93936 of PLA,Yinchuan 750025,China)

        A strategy optimizing selection algorithm for network survivable defense based on complete information dynamic game theory is proposed.It is to improve the network survivability in attack and defense process as viewed from optimizing the strategy combination.A three players’dynamic game model is given,the players respectively are attacker,accident and defender.The main elements of dynamic game are explained.A new mixed strategy Nash equilibrium theory is brought forward on the basis of classical Nash equilibrium.The expression of Nash equilibrium is no longer a qualification but a result led to values,which brought the concept of approximation.At last,the given model and algorithm are applied to a real network,the experimental results show that the model and algorithm are feasible and effective.

        network survivability,strategy selection,dynamic game,nash equilibrium,particle swarm algorithm

        TP393

        A

        10.3969/j.issn.1002-0640.2017.11.39

        1002-0640(2017)11-0181-05

        2016-09-21

        2016-11-25

        伍 文(1985- ),女,陜西西安人,博士。研究方向:網絡可生存性。

        猜你喜歡
        納什攻擊者概率
        第6講 “統(tǒng)計與概率”復習精講
        第6講 “統(tǒng)計與概率”復習精講
        基于微分博弈的追逃問題最優(yōu)策略設計
        自動化學報(2021年8期)2021-09-28 07:20:18
        概率與統(tǒng)計(一)
        概率與統(tǒng)計(二)
        THE ROLE OF L1 IN L2 LEARNING IN CHINESE MIDDLE SCHOOLS
        THE ROLE OF L1 IN L2 LEARNING IN CHINESE MIDDLE SCHOOLS
        正面迎接批判
        愛你(2018年16期)2018-06-21 03:28:44
        有限次重復博弈下的網絡攻擊行為研究
        師傅領進門,修行靠個人
        免费无遮挡无码视频在线观看| 在线播放免费人成毛片乱码| 亚洲一区二区三区中文字幂| 日韩中文无线码在线视频观看| 青青草久热手机在线视频观看 | 欧美视频在线观看一区二区| 在线视频一区二区在线观看| 青青草在线免费播放视频| 国产在线视频网友自拍| 欧美xxxx做受欧美88| 国产精品白浆在线观看无码专区| 久久精品国产亚洲黑森林| 国产麻豆精品久久一二三| 在线天堂av一区二区| 美女张开腿黄网站免费| 色老头在线一区二区三区| 日韩亚洲国产av自拍| 亚洲一区二区自偷自拍另类| 成熟丰满熟妇av无码区| 美丽人妻被按摩中出中文字幕| 亚洲国产香蕉视频欧美| 91亚洲色图在线观看| 蜜桃传媒免费观看视频| 亚洲色偷偷偷综合网| 日韩视频中文字幕精品偷拍| 亚洲有码转帖| 亚洲AV无码乱码一区二区三区 | 国产三级黄色免费网站| 亚洲欧美精品suv| XXXXBBBB欧美| 色婷婷久色国产成人免费| 国产高清在线一区二区不卡| 国产成人综合美国十次| 欧美黑人巨大xxxxx| 一本色道久久综合狠狠躁中文| 国产av一级片在线观看| 久久99精品国产麻豆宅宅| 国产在亚洲线视频观看| 中文字幕午夜精品一区二区三区 | 亚洲国产精品国自产拍久久蜜av| 男人激烈吮乳吃奶视频免费 |