亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

基于信號博弈的移動目標(biāo)防御最優(yōu)策略選取方法

2019-07-11 03:55:02蔣侶張恒巍王晉東

通信學(xué)報 2019年6期

蔣侶，張恒巍,2，王晉東

（1. 戰(zhàn)略支援部隊信息工程大學(xué)三院，河南鄭州 450001；2. 信息保障技術(shù)重點(diǎn)實(shí)驗(yàn)室，北京 100093）

1 引言

網(wǎng)絡(luò)系統(tǒng)作為國家關(guān)鍵基礎(chǔ)設(shè)施，對電力、交通、金融、能源、航運(yùn)等重要領(lǐng)域的有效運(yùn)轉(zhuǎn)具有關(guān)鍵支撐作用[1]。然而頻繁爆發(fā)的網(wǎng)絡(luò)安全事件表明，網(wǎng)絡(luò)安全形勢十分嚴(yán)峻。網(wǎng)絡(luò)攻防對抗中“易攻難守”的特點(diǎn)突出，攻擊者具有時間優(yōu)勢、信息不對稱優(yōu)勢和成本優(yōu)勢[2]。移動目標(biāo)防御（MTD, moving target defense）作為主動防御技術(shù)，能夠有效地提升防御效能，其核心思想是利用多樣化、隨時間持續(xù)變化的機(jī)制和策略，來增加網(wǎng)絡(luò)攻擊的復(fù)雜度和成本，降低網(wǎng)絡(luò)系統(tǒng)脆弱性暴露和被攻擊的概率，提升防御能力[3]。防御策略選取方法是提升防御效能的關(guān)鍵和最佳途徑，也是移動目標(biāo)防御領(lǐng)域的研究重點(diǎn)。

網(wǎng)絡(luò)安全的本質(zhì)是攻防對抗，因此從攻防對抗的角度出發(fā)，研究探索網(wǎng)絡(luò)攻防分析和防御決策方法體系具有重要的現(xiàn)實(shí)意義[4]。博弈理論與網(wǎng)絡(luò)攻防所具有的目標(biāo)對立性、關(guān)系非合作性和策略依存性十分吻合[5]。目前，運(yùn)用博弈理論開展移動目標(biāo)防御決策研究已經(jīng)取得部分成果。文獻(xiàn)[6]提出了一種基于完全信息靜態(tài)博弈的MTD模型，但是由于采用完全信息條件，在描述實(shí)際攻防過程時準(zhǔn)確性不足。文獻(xiàn)[7]對此加以改進(jìn)，采用不完全信息靜態(tài)博弈研究 MTD的防御機(jī)理。文獻(xiàn)[8]進(jìn)一步針對MTD與Web平臺的適配性，提出了基于不完全信息靜態(tài)博弈的最優(yōu)防御策略選取方法，增強(qiáng)了網(wǎng)絡(luò)防御效能。但是，以上成果均以靜態(tài)博弈模型為基礎(chǔ)，由于網(wǎng)絡(luò)攻防具有動態(tài)性，攻防雙方同時行動的限制條件很難滿足。因此，動態(tài)不完全信息博弈更加符合實(shí)際，研究成果的實(shí)用性和指導(dǎo)意義更大。

從網(wǎng)絡(luò)攻防實(shí)際出發(fā)，信號博弈模型（SGM,signaling game model）因?yàn)榭梢詼?zhǔn)確地描述情報信息對攻防雙方策略選擇的關(guān)鍵作用而受到研究者的特別關(guān)注。文獻(xiàn)[9]針對DDoS攻擊的防御決策問題，采用信號博弈模型研究攻防行為和信號作用機(jī)理，設(shè)計了防御決策算法。文獻(xiàn)[10]通過分析精煉貝葉斯均衡，對信息安全威脅定量評估進(jìn)行了研究。文獻(xiàn)[11]采用信號博弈來建模攻防場景，設(shè)計了一種信息安全防御機(jī)制。但是，上述理論研究成果未與具體防御機(jī)制結(jié)合，在網(wǎng)絡(luò)防御實(shí)踐應(yīng)用方面存在不足。

本文以信號博弈理論和移動目標(biāo)防御原理為基礎(chǔ)，探索結(jié)合2種方法優(yōu)勢的主動防御機(jī)制，首先，從攻擊面轉(zhuǎn)換（ASS, attack surface shifting）和探測面擴(kuò)展（ESE, exploration surface enlarging）的角度形式化來定義移動目標(biāo)防御策略，通過主動改變目標(biāo)系統(tǒng)的資源屬性，提升系統(tǒng)的防御主動性。其次，針對攻防信息的不完全性和攻防過程的動態(tài)性，基于對防御者釋放信號機(jī)制的一般性分析，采用防御者為信號發(fā)送者、攻擊者為信號接收者的結(jié)構(gòu)對網(wǎng)絡(luò)攻防過程進(jìn)行建模和博弈分析，提出精煉貝葉斯均衡求解方法，設(shè)計最優(yōu)主動防御策略選取算法。最后，利用仿真實(shí)驗(yàn)驗(yàn)證了本文模型和方法的有效性，通過分析實(shí)驗(yàn)結(jié)果，總結(jié)結(jié)合信號博弈和移動目標(biāo)防御方法實(shí)施綜合性主動防御的特點(diǎn)規(guī)律。

2 移動目標(biāo)防御信號博弈模型

2.1 移動目標(biāo)防御機(jī)制

在網(wǎng)絡(luò)攻防對抗中，如果防御者能夠通過主動行為對攻擊者的決策與行動實(shí)施干擾或影響，則體現(xiàn)了主動防御思想，具有更好的防御效果[12]。移動目標(biāo)防御是一種典型的主動防御技術(shù)，通過增加網(wǎng)絡(luò)系統(tǒng)的動態(tài)性和隨機(jī)性，從時空維度提高網(wǎng)絡(luò)系統(tǒng)結(jié)構(gòu)的不可預(yù)測性，削弱和降低攻擊者在網(wǎng)絡(luò)對抗中的優(yōu)勢[13]。

定義1 攻擊面（AS, attack surface）是指防御者為了防止攻擊者利用某些系統(tǒng)資源脆弱性成功發(fā)起攻擊所需轉(zhuǎn)移或變換的資源集合，由攻擊面維度及其取值構(gòu)成，記為AS={ASD,ASV}。其中，系統(tǒng)表示攻擊面維度的取值。

定義2探測面（ES, exploration surface）是指攻擊者為了能夠進(jìn)入目標(biāo)系統(tǒng)并實(shí)現(xiàn)攻擊目的所需探索的系統(tǒng)資源集合，由探測面維度及其取值范圍構(gòu)成，即ES={ESD,ESV}。其中，探測面維度為，表示攻擊者所探測到的系統(tǒng)資源集合，即目標(biāo)系統(tǒng)資源配置屬性，如系統(tǒng)指紋、數(shù)據(jù)存儲位置等；表示攻擊者所探測到的系統(tǒng)資源維度的取值范圍。

參考文獻(xiàn)[13-14]，給出2種主要防御手段，即攻擊面轉(zhuǎn)換和探測面擴(kuò)展的定義。

定義3攻擊面轉(zhuǎn)換是指在t時刻，目標(biāo)系統(tǒng)滿足以下2個條件之一，則說明目標(biāo)系統(tǒng)攻擊面發(fā)生了轉(zhuǎn)換。

定義4探測面擴(kuò)展是指t時刻，目標(biāo)系統(tǒng)滿足以下2個條件之一，則說明探測面發(fā)生了擴(kuò)展。

MTD通過靈活組合使用探測面擴(kuò)展和攻擊面轉(zhuǎn)移、攻擊面變換等手段，能夠有效增強(qiáng)目標(biāo)系統(tǒng)的動態(tài)性、多樣性和不確定性，提高目標(biāo)系統(tǒng)的攻擊難度。

2.2 基于信號博弈的移動目標(biāo)防御分析

分析網(wǎng)絡(luò)攻防對抗實(shí)際場景可知，一方面，因?yàn)榫W(wǎng)絡(luò)信息系統(tǒng)的開放互聯(lián)需求、服務(wù)監(jiān)管的要求等約束，網(wǎng)絡(luò)系統(tǒng)的防御能力、防御策略，甚至防御設(shè)備都是公開信息；另一方面，攻擊者往往采用嗅探、掃描等技術(shù)手段主動收集網(wǎng)絡(luò)系統(tǒng)的防御情報。上述由攻擊者抓取或防御者釋放的有關(guān)防御信息是攻擊行動決策和規(guī)劃的重要依據(jù)，本文將其定義為防御信號。從主動防御思想出發(fā)，防御者通過有選擇地主動釋放真實(shí)描述網(wǎng)絡(luò)系統(tǒng)的信息（真實(shí)信號）或與網(wǎng)絡(luò)系統(tǒng)真實(shí)情況不一致的信息（虛假信號），影響或制約攻擊者的情報判斷和行動規(guī)劃，增強(qiáng)攻擊者對目標(biāo)的認(rèn)知難度，提升防御效果。

由于網(wǎng)絡(luò)對抗中防御者一般會事先部署和實(shí)施防御策略，本文將防御者定義為信號博弈的leader和信號發(fā)送者，攻擊者定義為信號博弈的follower和信號接收者。結(jié)合MTD機(jī)制在實(shí)際攻防對抗過程中的特點(diǎn)，該類型博弈具有如下特征。

1) 主動性

攻防雙方不會將己方關(guān)鍵的博弈策略信息告知對方，攻擊者可以通過網(wǎng)絡(luò)探測手段獲取目標(biāo)系統(tǒng)的脆弱性信息；防御者通過轉(zhuǎn)換攻擊面中網(wǎng)絡(luò)資源的脆弱性維度和取值或者擴(kuò)展探測面的維度空間和取值范圍，可以降低或避免系統(tǒng)脆弱性暴露的可能。因此，作為信號發(fā)送方的防御者通過主動釋放虛假攻擊面或者探測面信息，欺騙、迷惑作為信號接收方的攻擊者。相比單純的主動防御手段，利用信號博弈機(jī)制可以增強(qiáng)防御者在攻防過程中的主動性，提升MTD的防御效果。

2) 不完全信息性

由于攻防雙方都希望在對抗過程中占據(jù)信息優(yōu)勢，攻擊者與防御者會盡可能地減少自身博弈信息的暴露程度。因此，攻防雙方的對抗博弈具有不完全信息性。

3) 動態(tài)性

在攻防過程中，攻防雙方的行動有先有后，攻擊者在接收到防御者釋放的防御信號后，基于自身對防御類型的先驗(yàn)知識和后驗(yàn)判斷，采取相應(yīng)的攻擊策略，防御者根據(jù)攻擊策略采取針對性防御策略。因此，攻防博弈具有動態(tài)性。

由于防御者無法預(yù)知遭受攻擊的時間，MTD實(shí)際應(yīng)用中一般采取固定周期或動態(tài)周期機(jī)制變換防御策略來抵御攻擊。MTD防御策略的內(nèi)容主要包括改變攻擊面和探測面的維度空間、不同維度取值范圍和變化頻率。其中，AS/ES的維度空間代表各種網(wǎng)絡(luò)系統(tǒng)資源；AS/ES的維度取值范圍代表不同系統(tǒng)資源屬性的取值范圍；變化頻率代表單位時間內(nèi)AS/ES的維度和取值范圍改變的次數(shù)，包括固定頻率和動態(tài)頻率2種方式。維度空間和取值范圍越大，變化頻率越高，表明系統(tǒng)結(jié)構(gòu)的動態(tài)性和隨機(jī)性越強(qiáng)，攻擊者越難發(fā)現(xiàn)并有效利用系統(tǒng)脆弱性。綜上，將MTD防御策略形式化描述為一個五元組(asd,asv,esd,esv,sf)，其中，asd、asv、esd、esv的定義見2.1節(jié)，sf代表變化頻率。

2.3 博弈模型構(gòu)建

本文采用信號博弈刻畫在攻防博弈過程中防御者采取MTD防御策略，同時主動釋放防御信號來欺騙、迷惑和誘導(dǎo)攻擊者，進(jìn)而增強(qiáng)其對防御類型的不確定性，提升防御效能。本文定義防御者是信號發(fā)送方，攻擊者是信號接收方。

定義5移動目標(biāo)防御信號博弈模型（MTDSG,moving target defense signaling game model）可以表示為七元組（N,T,M,B,p,,U），各參數(shù)定義如下。

1)N={Na,Nd}是博弈模型局中人集合，Na為攻擊者，Nd為防御者。

3)M為防御信號空間，由防御者釋放，信號名稱與防御者類型對應(yīng)，防御者可以自主選擇發(fā)送真實(shí)信號或虛假信號。

4)B=(D,A)是博弈雙方的策略空間。為防御者的 MTD策略集合，，其中為攻擊策略，h≥1，hN+∈。

5)p是攻擊者的先驗(yàn)信念集合，表示攻擊者對防御類型的先驗(yàn)知識，記為，滿足

2.4 博弈策略收益量化

攻防策略收益量化直接影響博弈分析和均衡計算，也是最優(yōu)防御策略選取的基礎(chǔ)。結(jié)合文獻(xiàn)[11,15]，本文對攻防策略收益進(jìn)行量化計算。

定義6系統(tǒng)損失代價（SDC, system damage cost）是指攻擊者發(fā)動攻擊后給系統(tǒng)帶來的損失，一般由攻防策略共同決定，可認(rèn)為是攻防策略的回報，通常用系統(tǒng)資源重要程度（C, criticality）、攻擊致命度（AL, attack lethality）、安全屬性損害（SAD, security attribute damage）進(jìn)行描述，一般將防御策略實(shí)施后降低的系統(tǒng)損失代價作為防御回報。攻擊成本（AC, attack cost）是指攻擊者發(fā)現(xiàn)并利用系統(tǒng)資源脆弱性發(fā)動攻擊所付出的成本，通常包括對探測面的信息偵測和情報收集，以及發(fā)動攻擊行為所需的時間和系統(tǒng)軟硬件資源等。防御成本（DC, defense cost）是指防御者為隱藏自身防御類型信息，以及實(shí)施 MTD策略所需的時間和系統(tǒng)軟硬件資源。具體定義及計算方法參考文獻(xiàn)[16-17]。

定義7信號成本（SC, signal cost）是指防御者主動釋放虛假信號，用以欺騙、迷惑和誘導(dǎo)攻擊者所付出的代價。

依據(jù)不同等級防御策略的差異度量信號成本。參考文獻(xiàn)[11,18]，根據(jù)防御策略能夠應(yīng)對的攻擊行動的權(quán)限不同，將SC分為3個等級，取值范圍分別為基于上述定義，參考本文改進(jìn)的收益量化方法，可以得到攻防雙方的期望收益分別為

由于同一防御等級的防御策略成本大致相同，可以認(rèn)為它們的防御收益也基本一致，若某個防御等級有m個防御策略，則可以認(rèn)為防御者采用等概率選擇該等級的第k個防御策略，得到防御者在該防御等級下的期望收益為

3 博弈均衡計算與防御策略選取

3.1 博弈均衡計算

定義 8MTDSG的精煉貝葉斯均衡由策略組合(m?(td),a?(m))與后驗(yàn)概率(t|dm)組成，并且滿足以下條件。

精煉貝葉斯均衡的具體計算過程可參考4.2節(jié)收益計算與4.3節(jié)均衡求解與防御策略選取。

3.2 最優(yōu)防御策略選取算法及對比分析

基于上述研究，給出基于信號博弈的移動目標(biāo)防御最優(yōu)策略選取算法，如算法1所示。

算法 1基于信號博弈的移動目標(biāo)防御最優(yōu)策略選取算法

輸入MTDSG

輸出最優(yōu)防御策略

11) 根據(jù)最優(yōu)攻防策略求出滿足貝葉斯法則的攻擊者對防御類型的后驗(yàn)概率推斷

15) end if

分析均衡求解算法可知，計算時間復(fù)雜度主要取決于精煉貝葉斯均衡解的計算過程，根據(jù)3.1節(jié)的分析，設(shè)防御類型空間和防御信號空間的大小為n，令，由動態(tài)博弈理論[19]可知，計算均衡的平均時間復(fù)雜度為存儲空間消耗主要集中在策略收益和均衡求解中間值的存儲上，為O(un)。

將本文提出的模型及方法和其他文獻(xiàn)進(jìn)行對比，具體如表1所示，其中，博弈類型是指攻防雙方對博弈信息的掌握情況及博弈行為順序；局中人類型是指在博弈模型中博弈參與者是否區(qū)分不同類型和類型的多少，實(shí)際攻防對抗過程中攻防雙方在策略收益、行為成本等方面存在差異，局中人類型細(xì)化可以更好地提高攻防策略選取的準(zhǔn)確性與針對性；信號機(jī)制是指攻防分析是否采用信號博弈以及設(shè)定的信號發(fā)送方；模型通用性是指博弈類型和攻防策略的數(shù)量是否能夠擴(kuò)展；均衡求解是指文獻(xiàn)中是否給出了求解博弈均衡的具體方法，如果沒有將嚴(yán)重削弱實(shí)用性。

通過分析已有方法可知，文獻(xiàn)[6]是基于局中人具有完全信息的假設(shè)基礎(chǔ)之上的，但實(shí)際攻防過程中，由于攻防雙方偵察能力有限，同時攻防雙方均會減少或隱藏自身攻防信息暴露，因此網(wǎng)絡(luò)攻防對抗一般應(yīng)作為不完全信息博弈考慮。文獻(xiàn)[7]是將攻防對抗作為靜態(tài)博弈進(jìn)行研究，不符合實(shí)際攻防場景的動態(tài)性特征。文獻(xiàn)[9,17,20]以攻擊者作為信號發(fā)送方進(jìn)行建模研究，基于 2.2節(jié)的分析，防御者釋放信號的情況具有更強(qiáng)的一般性，同時防御者可以利用信號機(jī)制主動欺騙、迷惑、誘導(dǎo)攻擊者，實(shí)施主動防御，具有更好的防御效果。文獻(xiàn)[21]將基于MTD的攻防對抗抽象為馬爾可夫博弈，無法分析攻防信息對博弈過程和結(jié)果的影響。

通過分析可知，對比文獻(xiàn)[6-7]中攻防模型的靜態(tài)性和信息完全性假設(shè)，本文方法基于動態(tài)攻防過程和不完全攻防信息開展研究。對比文獻(xiàn)[21]采用馬爾可夫博弈描述攻防過程，本文方法采用信號博弈進(jìn)行建模研究，可以準(zhǔn)確描述情報信息對攻防雙方策略選擇的關(guān)鍵作用。對比文獻(xiàn)[9,17,20]采用攻擊者作為信號發(fā)送方，本文方法使用防御者作為信號發(fā)送方，增強(qiáng)了方法的一般性，并能夠刻畫主動釋放防御信號來欺騙、迷惑和誘導(dǎo)攻擊者的主動防御機(jī)制。

本文工作針對攻防實(shí)際，基于移動目標(biāo)防御原理設(shè)計防御策略，通過主動改變目標(biāo)系統(tǒng)的資源屬性，增強(qiáng)了系統(tǒng)結(jié)構(gòu)的動態(tài)性和隨機(jī)性，增大了攻擊者對目標(biāo)系統(tǒng)及其防御措施的認(rèn)知難度，提升了防御效能。同時，基于主動防御思想，結(jié)合信號博弈和移動目標(biāo)防御的優(yōu)點(diǎn)實(shí)施綜合防御，利用主動釋放針對性防御信號實(shí)現(xiàn)了防御欺騙，不但增加了防御樣式和手段，進(jìn)一步提升了防御主動性，而且虛假防御信號的欺騙、迷惑作用可以擾亂和延遲攻擊行動，為移動目標(biāo)防御策略的實(shí)施提供反應(yīng)時間。

表1 模型與方法對比分析

4 仿真實(shí)驗(yàn)與分析

4.1 仿真環(huán)境描述

為了驗(yàn)證MTDSG模型和最優(yōu)防御策略選取算法的可行性與有效性，構(gòu)建如圖1所示的典型網(wǎng)絡(luò)系統(tǒng)[16]開展仿真實(shí)驗(yàn)。實(shí)驗(yàn)網(wǎng)絡(luò)系統(tǒng)主要由業(yè)務(wù)網(wǎng)、接入網(wǎng)和外部互聯(lián)網(wǎng)構(gòu)成，其中業(yè)務(wù)網(wǎng)主要包括業(yè)務(wù)服務(wù)器、數(shù)據(jù)服務(wù)器和客戶端，接入網(wǎng)主要包括IIS網(wǎng)絡(luò)服務(wù)器和網(wǎng)絡(luò)防御設(shè)備。

圖1 實(shí)驗(yàn)網(wǎng)絡(luò)系統(tǒng)拓?fù)?/p>

實(shí)驗(yàn)網(wǎng)絡(luò)系統(tǒng)配置相應(yīng)的訪問控制策略規(guī)定網(wǎng)絡(luò)節(jié)點(diǎn)之間的訪問權(quán)限[12]。利用Nessus漏洞掃描工具獲得網(wǎng)絡(luò)系統(tǒng)中各節(jié)點(diǎn)的資源脆弱性，如表2所示。

表2 網(wǎng)絡(luò)節(jié)點(diǎn)脆弱性

參考文獻(xiàn)[22-24]和美國 MIT林肯實(shí)驗(yàn)室攻防行為數(shù)據(jù)庫[18]，給出攻擊和防御動作信息，分別如表3和表4所示。為方便攻防博弈分析，設(shè)防御者類型對應(yīng)的防御信號為

表3 原子攻擊描述

表4 防御策略描述

4.2 收益計算

借鑒文獻(xiàn)[4,22]的方法，綜合考慮投入成本和專家意見，設(shè)定攻擊策略為；自然以概率選擇防御類型攻擊者對防御類型的先驗(yàn)概率攻擊者收到信號m1后對防御類型的后驗(yàn)修正概率為攻擊者收到信號m2對防御類型的后驗(yàn)修正概率為防御信號成本(40,100,180)，網(wǎng)絡(luò)系統(tǒng)的安全屬性代價，其中IIS網(wǎng)絡(luò)服務(wù)器、業(yè)務(wù)服務(wù)器、數(shù)據(jù)服務(wù)器的SAD分別為20、30、50，資源重要度C分別為3、3、5。

參考文獻(xiàn)[11,16]和式(1)～式(3)，分別計算攻擊者與防御者的博弈收益。當(dāng)防御者類型為高等級防御，防御策略為d1，釋放防御信號m1，攻擊者采取攻擊策略a1時，攻防雙方收益為

同理，當(dāng)防御者采取策略d2、d3、d4時，攻防雙方收益分別為。綜上，該場景下攻擊者和防御者的平均收益分別為。同理求得其余攻防策略對應(yīng)的收益，攻防博弈如圖2所示。

為了驗(yàn)證仿真實(shí)驗(yàn)中 MTD策略的有效性與針對性，考慮攻防對抗過程中目標(biāo)系統(tǒng)性能受到的影響程度，借鑒文獻(xiàn)[25]中的量化計算方法對目標(biāo)系統(tǒng)的服務(wù)質(zhì)量進(jìn)行分析，具體分析在不同攻防策略下，系統(tǒng)中Web服務(wù)和在線視頻服務(wù)的平均時延（ADT, average delay time），以此反映系統(tǒng)的性能損失。實(shí)驗(yàn)分別對上述2種服務(wù)進(jìn)行了15次測試，并與系統(tǒng)正常工作時的時延進(jìn)行對比，獲得在攻防對抗情況下的平均時延。具體數(shù)據(jù)如圖2所示。

4.3 均衡求解與防御策略選取

按照3.1節(jié)給出的均衡計算步驟，求解MTDSG模型精煉貝葉斯均衡，并選取最優(yōu)防御策略。

1)攻擊者推斷的最優(yōu)攻擊策略

當(dāng)m=m1時，有

圖2 攻防博弈樹

根據(jù)上式，當(dāng)α∈[0,1]，a?(m1)=a1。

當(dāng)m=m2時，同理有，當(dāng)β∈[0,1]

2)防御者推斷的最優(yōu)防御策略

3) 防御類型的后驗(yàn)概率修正

4.4 實(shí)驗(yàn)分析

仿真實(shí)驗(yàn)采用Matlab2013a實(shí)現(xiàn)了防御策略選取算法，根據(jù)所得到的實(shí)驗(yàn)數(shù)據(jù)，通過對攻防博弈過程、攻防收益和博弈均衡的一般性分析，可以發(fā)現(xiàn)結(jié)合 MTD和信號博弈進(jìn)行綜合性主動防御的規(guī)律。

1) MTD策略的成本普遍較高，由表4可知，策略成本普遍大于傳統(tǒng)防御策略，但防御者采取MTD策略時防御收益普遍大于其他傳統(tǒng)防御策略。在仿真實(shí)驗(yàn)中，選擇高等級防御類型，釋放高等級防御信號m2，防御收益分別為(3 075,2 980, 2 885)；選擇低等級防御類型，釋放高等級防御信號m2，防御收益分別為(2 920,2 675,2 235)。這說明相較于被動防御方式，MTD策略通過主動改變目標(biāo)系統(tǒng)的不確定性，能夠增加攻擊者的攻擊難度，更加有效地抵御攻擊行為。

2) 由于攻擊者對防御者類型的后驗(yàn)推斷直接影響攻防博弈過程和均衡求解，防御者可利用信號機(jī)制直接影響博弈過程和均衡策略求解。攻擊者根據(jù)先驗(yàn)概率、防御者釋放的防御信號和防御者的最優(yōu)策略使用貝葉斯法則對防御類型進(jìn)行修正。因此利用信號機(jī)制防御者能夠影響攻擊者的后驗(yàn)推斷的形成，提高防御者在攻防對抗過程中的主動性。

3) 防御者采取MTD策略同時結(jié)合信號博弈可以更加有效地增強(qiáng)主動防御效果。從防御策略特點(diǎn)和防御信號作用的角度分析，MTD策略是防御者通過目標(biāo)系統(tǒng)脆弱性的隨機(jī)化、動態(tài)化和不確定化，使防御者在攻防過程中獲得基于目標(biāo)系統(tǒng)自身的防御主動性；信號博弈可以使防御者通過主動選擇及釋放針對性信號，在攻防信息獲取和認(rèn)知領(lǐng)域?qū)崿F(xiàn)對攻擊者的欺騙、迷惑，削弱攻擊者的信息優(yōu)勢，提升主動防御能力，并能為移動目標(biāo)防御策略的實(shí)施提供準(zhǔn)備和反應(yīng)時間。

4) 低等級防御者通過信號機(jī)制發(fā)送誘導(dǎo)信號可以增強(qiáng)防御效果，提高防御收益。由圖2可知，當(dāng)目標(biāo)系統(tǒng)處于低等級防御時，使用高等級防御信號，防御者獲得的收益為(3 050,2 980,2 460)；而使用低等級防御信號時，防御收益為(2 920,2 675,2 235)。

綜上，低等級防御者偽裝成高等級防御者可以對攻擊者起到威懾、迷惑的效果，攻擊者無法清晰地認(rèn)識防御者的虛實(shí)情況，導(dǎo)致攻擊者出于自身利益，一般采取保守的試探攻擊，在一定程度上能夠起到主動防御的效果。

5 結(jié)束語

移動目標(biāo)防御是一種改變攻防不對稱、網(wǎng)絡(luò)防御“被動挨打”格局的前沿性主動防御技術(shù)，在實(shí)際應(yīng)用中具有良好效果和巨大潛力。為進(jìn)一步提升主動防御能力，本文將移動目標(biāo)防御與信號博弈相結(jié)合，從攻擊面轉(zhuǎn)換和探測面擴(kuò)展的角度定義防御策略，在分析攻防對抗過程的基礎(chǔ)上，構(gòu)建了基于信號博弈的移動目標(biāo)防御模型，設(shè)計了博弈均衡求解方法和最優(yōu)防御策略選取算法，通過仿真實(shí)驗(yàn)和數(shù)據(jù)分析，驗(yàn)證了所提模型和方法的有效性，總結(jié)了結(jié)合信號博弈和移動目標(biāo)防御方法實(shí)施綜合性主動防御的特點(diǎn)規(guī)律。本文的研究成果為信息受限的動態(tài)攻防過程中增強(qiáng)移動目標(biāo)防御的效能提供了有效的模型方法，并能夠?qū)Ψ烙呗缘倪x取提供指導(dǎo)。

下一步工作主要包括從參數(shù)的靈敏度和多屬性分析角度改進(jìn)移動目標(biāo)防御策略的量化計算方法，提升博弈收益計算準(zhǔn)確性；針對多階段連續(xù)性網(wǎng)絡(luò)攻防過程，結(jié)合隨機(jī)博弈和微分博弈開展研究，提高模型與方法的適用范圍。