鞏俊輝,胡曉輝,杜永文
蘭州交通大學(xué) 電子與信息工程學(xué)院,蘭州730070
無(wú)線(xiàn)傳感器網(wǎng)絡(luò)(Wireless Sensor Network,WSN)是由大量傳感器節(jié)點(diǎn)通過(guò)自組織方式形成的一個(gè)多跳無(wú)線(xiàn)通信網(wǎng)絡(luò),在環(huán)境、工業(yè)、軍事和家居等領(lǐng)域應(yīng)用廣泛,人們可以通過(guò)它感知真實(shí)物理世界中的各類(lèi)信息,極大提高了人類(lèi)認(rèn)識(shí)客觀(guān)世界的能力[1]。傳感器節(jié)點(diǎn)有限的資源、開(kāi)放的無(wú)線(xiàn)通信方式以及復(fù)雜的工作環(huán)境使得無(wú)線(xiàn)傳感器網(wǎng)絡(luò)極易面臨各種安全威脅,入侵檢測(cè)系統(tǒng)(Intrusion Detection System,IDS)能夠有效發(fā)現(xiàn)網(wǎng)絡(luò)中不安全的行為[2],但它需要較多的資源開(kāi)銷(xiāo)。如何在資源受限的WSN中真正有效地使用IDS是一個(gè)非常具有挑戰(zhàn)性的任務(wù)[3-4]。
博弈論(Game Theory)作為研究競(jìng)爭(zhēng)現(xiàn)象的數(shù)學(xué)理論,被許多學(xué)者應(yīng)用于無(wú)線(xiàn)傳感器網(wǎng)絡(luò)入侵檢測(cè)的研究[5-7]。相較于誤用檢測(cè)、異常檢測(cè)等方法,基于博弈論的檢測(cè)方法沒(méi)有訓(xùn)練過(guò)程而且不需要額外的數(shù)據(jù)來(lái)建立模型,其復(fù)雜度較低,能幫助WSN更加合理有效地應(yīng)用IDS[8-10]。陳行等人[11]在無(wú)線(xiàn)網(wǎng)絡(luò)入侵檢測(cè)參數(shù)調(diào)整問(wèn)題的研究中引入貝葉斯博弈理論,構(gòu)建入侵檢測(cè)博弈模型并設(shè)計(jì)了入侵檢測(cè)算法,算法能有效檢測(cè)發(fā)生變化的惡意攻擊行為。李奕男等人[12]對(duì)Ad Hoc網(wǎng)絡(luò)的入侵檢測(cè)問(wèn)題建立非合作完全信息靜態(tài)博弈模型,該模型的納什均衡策略在降低誤檢率的同時(shí)提高了檢測(cè)率,并且減少了網(wǎng)絡(luò)能耗。Shen 等人[13]應(yīng)用信號(hào)博弈描述并分析惡意傳感器節(jié)點(diǎn)和無(wú)線(xiàn)傳感器網(wǎng)絡(luò)入侵檢測(cè)系統(tǒng)之間的交互過(guò)程,建立重復(fù)的多階段信號(hào)博弈模型,實(shí)現(xiàn)了入侵檢測(cè)最優(yōu)策略的機(jī)制。Huang等人[14]在誤用檢測(cè)和異常檢測(cè)的基礎(chǔ)上提出馬爾科夫IDS算法,利用非完全信息靜態(tài)博弈推斷最優(yōu)防御策略。周偉偉等人[15]利用貝葉斯方法根據(jù)外部節(jié)點(diǎn)的先驗(yàn)概率推斷其在后續(xù)時(shí)刻為惡意節(jié)點(diǎn)的后驗(yàn)概率,并在提出的多階段動(dòng)態(tài)入侵檢測(cè)博弈模型上給出最佳策略。Han等人[16]針對(duì)無(wú)線(xiàn)傳感器網(wǎng)絡(luò)攻擊手段多樣性問(wèn)題以及資源受限的困境,利用非合作博弈思想得到混合納什均衡防御策略,平衡了系統(tǒng)的檢測(cè)效率和資源開(kāi)銷(xiāo)。
但是傳統(tǒng)博弈模型存在不足,它們采用完全理性假設(shè),通過(guò)一次博弈就能找到最優(yōu)策略且較少考慮最優(yōu)策略的穩(wěn)定性。這在現(xiàn)實(shí)網(wǎng)絡(luò)對(duì)抗中是不合理的,會(huì)導(dǎo)致模型與實(shí)際出現(xiàn)偏差,降低了研究的指導(dǎo)意義。相比于傳統(tǒng)博弈理論,演化博弈的假設(shè)與分析更加合理和準(zhǔn)確,與無(wú)線(xiàn)傳感器網(wǎng)絡(luò)入侵檢測(cè)實(shí)際情況更加契合。因此,本文基于有限理性假設(shè),針對(duì)不同的攻擊方式,引入演化博弈構(gòu)建入侵檢測(cè)攻防博弈模型,利用復(fù)制動(dòng)態(tài)方程分析多種攻擊方式下攻防雙方策略的演化趨勢(shì),實(shí)現(xiàn)最優(yōu)防御策略選取算法,解決檢測(cè)率和能耗均衡問(wèn)題。
演化博弈理論(Evolutionary Game Theory)[17]起源于達(dá)爾文的生物進(jìn)化思想,摒棄了經(jīng)典博弈理論中完全理性的假設(shè),將參與者視為群體中有限理性的個(gè)體,是一種將博弈理論與動(dòng)態(tài)演化過(guò)程相結(jié)合的理論。
在演化博弈中,有限理性的參與者通過(guò)不斷試錯(cuò)、學(xué)習(xí)來(lái)修正現(xiàn)有策略,經(jīng)過(guò)一個(gè)動(dòng)態(tài)重復(fù)的長(zhǎng)期博弈過(guò)程才能找到合適的策略。演化博弈理論分析的重點(diǎn)是在博弈過(guò)程中博弈參與者策略的調(diào)整過(guò)程、演化趨勢(shì)和穩(wěn)定性。
隨著時(shí)間變化,所有的參與者最終可能會(huì)趨向于選擇某個(gè)穩(wěn)定策略不再改變,系統(tǒng)達(dá)到穩(wěn)定狀態(tài)。對(duì)此,演化博弈中一個(gè)重要的概念是演化穩(wěn)定策略(Evolutionary Stability Strategy,ESS),它用于分析有限理性下博弈是否存在穩(wěn)定均衡。關(guān)于演化穩(wěn)定策略的定義如下。
演化穩(wěn)定策略假設(shè)有限理性參與者的策略空間為S,任何策略y≠x∈S,u(x,x)為參與者采取策略x時(shí)的收益。如果存在某個(gè),使得不等式u[x,εy+(1-ε)x]>u[y,εy+(1-ε)x] 對(duì)于所有都成立,那么策略x是一個(gè)演化穩(wěn)定策略。
從演化穩(wěn)定策略定義可看出,如果群體一開(kāi)始采取的演化穩(wěn)定策略x,則大群體中的參與者的策略收益總是大于突變小群體中參與者的策略收益,也就是說(shuō)此時(shí)群體可以抵擋突變小群體的策略入侵;如果群體一開(kāi)始采取的策略是y策略,則大群體中的參與者的策略收益總是小于突變小群體中參與者的策略收益,即y策略的收益總是小于演化穩(wěn)定策略x的收益,因此該群體會(huì)被演化穩(wěn)定策略x成功入侵,使得群體成員最終都采用演化穩(wěn)定策略。
假設(shè)無(wú)線(xiàn)傳感器網(wǎng)絡(luò)采用分簇路由協(xié)議將網(wǎng)絡(luò)劃分為多個(gè)相互連接的簇狀結(jié)構(gòu),每個(gè)簇中都有一個(gè)簇頭節(jié)點(diǎn)(Cluster Header,CH)和若干成員節(jié)點(diǎn),簇頭節(jié)點(diǎn)定期被選舉產(chǎn)生的,它和簇內(nèi)成員節(jié)點(diǎn)沒(méi)有本質(zhì)上的差異。假設(shè)在無(wú)線(xiàn)傳感器網(wǎng)絡(luò)中分布著N個(gè)節(jié)點(diǎn),分簇路由協(xié)議將網(wǎng)絡(luò)劃分為k個(gè)簇,分別記為C1,C2,…,Ck,每個(gè)簇中包含的成員節(jié)點(diǎn)數(shù)目為Mi(i=1,2,…,r),網(wǎng)絡(luò)中的惡意傳感器節(jié)點(diǎn)對(duì)其所屬簇頭發(fā)起攻擊。如圖1給出了本文的網(wǎng)絡(luò)模型。
圖1 無(wú)線(xiàn)傳感器網(wǎng)絡(luò)入侵檢測(cè)網(wǎng)絡(luò)模型
無(wú)線(xiàn)傳感器網(wǎng)絡(luò)中節(jié)點(diǎn)的能量十分有限,每個(gè)節(jié)點(diǎn)都運(yùn)行入侵檢測(cè)系統(tǒng)勢(shì)必會(huì)增大節(jié)點(diǎn)的能耗,減少節(jié)點(diǎn)的工作時(shí)間,因此本文使用分布-集中混合式入侵檢測(cè)系統(tǒng)來(lái)均衡能量消耗和檢測(cè)性能[18]。分布-集中混合模式是指網(wǎng)絡(luò)中的每個(gè)傳感器節(jié)點(diǎn)都已安裝了入侵檢測(cè)系統(tǒng),但并不是所有節(jié)點(diǎn)都運(yùn)行入侵檢測(cè)系統(tǒng),為了節(jié)省能量消耗,只開(kāi)啟位于簇頭上的入侵檢測(cè)系統(tǒng)以識(shí)別簇內(nèi)惡意傳感器節(jié)點(diǎn)的攻擊行為。當(dāng)一個(gè)傳感器節(jié)點(diǎn)被選作簇頭時(shí),它的入侵檢測(cè)系統(tǒng)將同時(shí)被喚醒,而簇內(nèi)成員節(jié)點(diǎn)上的入侵檢測(cè)系統(tǒng)將會(huì)被停用。因此,本文中簇頭節(jié)點(diǎn)在周期內(nèi)額外承擔(dān)入侵檢測(cè)的功能,且簇頭的IDS根據(jù)基站的指令開(kāi)啟指定模塊。
現(xiàn)實(shí)的網(wǎng)絡(luò)安全形勢(shì)日益復(fù)雜,攻擊手段各式各樣,可以按照檢測(cè)方法將其分為常見(jiàn)攻擊和新型攻擊兩類(lèi)[16]。誤用檢測(cè)方法可以檢測(cè)出攻擊特征已知的常見(jiàn)攻擊,卻不能有效檢測(cè)出未知特征的新型攻擊,此時(shí)需要使用異常檢測(cè)方法來(lái)判斷入侵行為是否存在。因此,本文的入侵檢測(cè)系統(tǒng)主要有誤用檢測(cè)和異常檢測(cè)兩個(gè)檢測(cè)模塊,需要制定一種用以指導(dǎo)入侵檢測(cè)系統(tǒng)的策略,使之在合適的時(shí)間啟動(dòng)合適的檢測(cè)模塊。
先前的研究工作通常假設(shè)惡意傳感器節(jié)點(diǎn)和簇頭節(jié)點(diǎn)是完全理性的,且僅攻擊網(wǎng)絡(luò)一次,這不符合實(shí)際情境。因此,假設(shè)節(jié)點(diǎn)是有限理性的,網(wǎng)絡(luò)進(jìn)行多次攻防對(duì)抗并且攻擊手段多種多樣。惡意傳感器節(jié)點(diǎn)對(duì)所在的簇頭進(jìn)行常用攻擊或者新型攻擊,每次攻擊都會(huì)選擇某一種特定攻擊手段,簇頭需要決定開(kāi)啟誤用檢測(cè)模塊還是異常檢測(cè)模塊。
根據(jù)演化博弈理論,構(gòu)建入侵檢測(cè)攻防博弈模型ADEGM=(N,S,P,U)(attack and defense evolutionary game model)。
(1)N=(NA,ND)為入侵檢測(cè)演化博弈的參與者集合,其中,NA為惡意節(jié)點(diǎn)(攻擊者),ND為簇頭節(jié)點(diǎn)(防御者)。
(2)S=(AS,DS)是參與者策略空間,其中AS={AS1,AS2}為攻擊者的可選策略集,AS1表示進(jìn)行常用攻擊,AS2表示進(jìn)行新型攻擊;DS={DS1,DS2}表示防御者的可選策略集,DS1表示啟用誤用檢測(cè)模塊,DS2表示啟用異常檢測(cè)模塊。
(3)P=(PA,PD)是演化博弈的攻防策略的概率集合,其中,PA={p,1-p},p是選擇常用攻擊的概率,則1-p是選擇新型攻擊的概率;PD={q,1-q},q是啟用誤用檢測(cè)的概率,則1-q是啟用異常檢測(cè)的概率。
(4)U=(UA,UD)是攻防雙方收益函數(shù)的集合,UA表示攻擊者的收益,UD表示防御者的收益,當(dāng)攻擊者和防御者采取ASi和DSj時(shí),分別表示他們的收益。
利用表1 中定義的符號(hào)可以表示攻擊者和防御者的收益。
表1 符號(hào)定義
誤用檢測(cè)模塊檢測(cè)常見(jiàn)攻擊的準(zhǔn)確率為α,而它卻無(wú)法檢測(cè)出新型攻擊;異常檢測(cè)模塊檢測(cè)新型攻擊的準(zhǔn)確率為β,同樣它也無(wú)法檢測(cè)出常用攻擊?;谝陨戏治?,可以計(jì)算出不同策略下攻擊者和防御者的收益,如表2所示。
表2 收益矩陣
攻擊者和防御者的知識(shí)水平不同,各自的策略不同,策略的差異會(huì)導(dǎo)致收益不同,在利益差異的驅(qū)動(dòng)下,收益低者會(huì)向收益高者學(xué)習(xí)來(lái)改進(jìn)自己的策略[19],這導(dǎo)致不同策略的比例隨時(shí)間推移而發(fā)生變化。策略變化可以表示為一個(gè)與時(shí)間相關(guān)的函數(shù),其動(dòng)態(tài)變化速率可用復(fù)制動(dòng)態(tài)方程表示。
復(fù)制動(dòng)態(tài)方程是應(yīng)用最為廣泛的選擇機(jī)制方程[20],借鑒了自然界生物演變思想,適用于學(xué)習(xí)速度較慢的群體。它描述了策略的動(dòng)態(tài)變化過(guò)程,被普遍用來(lái)分析演化博弈的均衡狀態(tài)。
求解攻防演化博弈模型均衡的算法描述如下:
(1)給定估計(jì)概率p、q。
(2)建立攻擊者復(fù)制動(dòng)態(tài)方程。
根據(jù)PA、PD及收益矩陣得到攻擊者不同攻擊策略的收益以及期望收益:
進(jìn)而建立攻擊者的復(fù)制動(dòng)態(tài)方程為:
(3)建立防御者復(fù)制動(dòng)態(tài)方程。
根據(jù)PA、PD及收益矩陣得到防御者不同防御策略的收益以及期望收益:
進(jìn)而建立防御者的復(fù)制動(dòng)態(tài)方程為:
(4)演化穩(wěn)定均衡求解。
聯(lián)立上述步驟(2)和步驟(3)得到的攻防復(fù)制動(dòng)態(tài)方程,建立如下演化復(fù)制動(dòng)態(tài)方程組:
通過(guò)求解方程組可以求出博弈模型的均衡為:
其中Y1=[0,0]T表示攻擊者進(jìn)行常用攻擊,防御者使用誤用檢測(cè);Y2=[0,1]T表示攻擊者進(jìn)行常用攻擊,防御者使用異常檢測(cè);Y3=[1,0]T表示攻擊者進(jìn)行新型攻擊,防御者使用誤用檢測(cè);Y4=[1,1]T表示攻擊者進(jìn)行新型攻擊,防御者使用異常檢測(cè)。表示攻擊者和防守者以混合策略選取常用攻擊和誤用檢測(cè)。
針對(duì)利用復(fù)制動(dòng)態(tài)方程對(duì)網(wǎng)絡(luò)攻防演化博弈模型求解得到的演化均衡,采用系統(tǒng)動(dòng)力學(xué)方法[21]分析其是否為演化穩(wěn)定策略。由公式(3)可知,攻擊者的策略變化有3種情況,如圖2~4所示;由公式(6)可知,防御者的策略變化有3種情況,如圖5~7所示。
圖2 當(dāng)時(shí),攻擊者的復(fù)制動(dòng)態(tài)相位圖
圖3 當(dāng)時(shí),攻擊者的復(fù)制動(dòng)態(tài)相位圖
圖4 當(dāng)時(shí),攻擊者的復(fù)制動(dòng)態(tài)相位圖
圖5 當(dāng)時(shí),防御者的復(fù)制動(dòng)態(tài)相位圖
圖6 當(dāng)時(shí),防御者的復(fù)制動(dòng)態(tài)相位圖
圖7 當(dāng)時(shí),防御者的復(fù)制動(dòng)態(tài)相位圖
當(dāng)攻防雙方的策略不固定時(shí),它們的策略變化如圖8所示。當(dāng)初始策略在區(qū)域A 時(shí),系統(tǒng)不會(huì)趨于穩(wěn)定狀態(tài)Y4,而是會(huì)演化到區(qū)域D;當(dāng)初始策略在區(qū)域B 時(shí),系統(tǒng)不會(huì)趨于穩(wěn)定狀態(tài)Y3,而是會(huì)演化到區(qū)域A;當(dāng)初始策略在區(qū)域C 時(shí),系統(tǒng)不會(huì)趨于穩(wěn)定狀態(tài)Y1,而是會(huì)演化到區(qū)域B;當(dāng)初始策略在區(qū)域D 時(shí),系統(tǒng)不會(huì)趨于穩(wěn)定狀態(tài)Y2,而是會(huì)演化到區(qū)域C。
圖8 復(fù)制動(dòng)態(tài)變化
綜合分析,當(dāng)攻防雙方的策略變化時(shí),系統(tǒng)不存在穩(wěn)定狀態(tài)。防御者只能根據(jù)攻擊者的策略動(dòng)態(tài)改變策略,這樣才能更有效地檢測(cè)入侵行為。
根據(jù)攻防博弈模型及演化均衡分析,在攻防雙方的策略不固定的基礎(chǔ)上,設(shè)計(jì)了入侵檢測(cè)系統(tǒng)最優(yōu)防御策略選取算法。其基本思想是根據(jù)建立的攻防復(fù)制動(dòng)態(tài)方程,防御者根據(jù)攻擊者的策略動(dòng)態(tài)選取防御策略,算法描述如下所示。
仿真實(shí)驗(yàn)使用Python 編程語(yǔ)言對(duì)無(wú)線(xiàn)傳感器網(wǎng)絡(luò)的惡意傳感器節(jié)點(diǎn)攻擊行為進(jìn)行仿真模擬,在監(jiān)測(cè)區(qū)域內(nèi)隨機(jī)部署100個(gè)傳感器節(jié)點(diǎn),傳感器節(jié)點(diǎn)一旦部署成功就不可移動(dòng)并且它們的能量不可恢復(fù),而基站位于監(jiān)測(cè)區(qū)域外部,其能量可恢復(fù)。無(wú)線(xiàn)傳感器網(wǎng)絡(luò)使用LEACH[22]分簇協(xié)議對(duì)網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu)進(jìn)行劃分,設(shè)定節(jié)點(diǎn)被選舉為簇頭的概率為0.1,那么網(wǎng)絡(luò)中將會(huì)存在大約10 個(gè)簇頭,網(wǎng)絡(luò)中有3 個(gè)惡意傳感器節(jié)點(diǎn),它們對(duì)所屬的簇頭發(fā)起攻擊。仿真參數(shù)如表3所示。
表3 網(wǎng)絡(luò)參數(shù)
如圖9是網(wǎng)絡(luò)未分簇時(shí)的網(wǎng)絡(luò)拓?fù)鋱D,如圖10是網(wǎng)絡(luò)采用LEACH分簇協(xié)議后的網(wǎng)絡(luò)結(jié)構(gòu)。
圖9 網(wǎng)絡(luò)未分簇結(jié)構(gòu)
圖10 網(wǎng)絡(luò)分簇結(jié)構(gòu)
攻防博弈的參數(shù)設(shè)置為Ca1=0.1,Ca2=0.15,Cd1=0.1,Cd2=0.2,Ba1=0.4,Ba2=0.6,α=0.9,β=0.9。求解得到Y(jié)5=[0.488,0.433]T。圖11和圖12分別是攻擊者和防御者的復(fù)制動(dòng)態(tài)方程三維圖示,其中平面為X=0.488 以及Y=0.433。
圖11 攻擊者的復(fù)制動(dòng)態(tài)方程
圖12 防御者的復(fù)制動(dòng)態(tài)方程
當(dāng)惡意節(jié)點(diǎn)總是使用同一攻擊策略,簇頭節(jié)點(diǎn)經(jīng)過(guò)學(xué)習(xí)和模仿,不斷調(diào)整策略,最終達(dá)到穩(wěn)定狀態(tài)。如圖13 和圖14 表示,當(dāng)p=1 時(shí),即惡意節(jié)點(diǎn)總是使用常用攻擊,經(jīng)過(guò)演化,最終簇頭節(jié)點(diǎn)會(huì)一直啟用誤用檢測(cè)模塊;當(dāng)p=0 時(shí),即惡意節(jié)點(diǎn)使用新型攻擊,最終簇頭節(jié)點(diǎn)會(huì)一直啟用異常檢測(cè)模塊。
圖13 p=1 時(shí)q 的演化
圖14 p=0 時(shí)q 的演化
當(dāng)簇頭節(jié)點(diǎn)總是使用同一防御策略,惡意節(jié)點(diǎn)經(jīng)過(guò)學(xué)習(xí)和模仿,不斷調(diào)整策略,最終達(dá)到穩(wěn)定狀態(tài)。如圖15 和圖16 所示,當(dāng)q=1 時(shí),即簇頭節(jié)點(diǎn)總是啟用誤用檢測(cè)模塊,經(jīng)過(guò)演化,最終惡意節(jié)點(diǎn)會(huì)一直使用新型攻擊;當(dāng)q=0 時(shí),即簇頭節(jié)點(diǎn)啟用異常檢測(cè)模塊,最終惡意節(jié)點(diǎn)會(huì)一直使用常用攻擊。
圖15 q=1 時(shí)p 的演化
圖16 q=0 時(shí)p 的演化
如圖17 所示,當(dāng)初始攻防策略為混合策略Y5=[0.488,0.433]T時(shí),隨著演化推進(jìn),雙方策略保持不變。而當(dāng)初始狀態(tài)偏離平衡節(jié)點(diǎn)后,短期內(nèi)雙方會(huì)靠近演化穩(wěn)定策略解,卻無(wú)法穩(wěn)定,隨著博弈次數(shù)增加,策略選擇呈現(xiàn)周期性的波動(dòng),如圖18所示。
圖17 初始狀態(tài)為Y5 的變化
圖18 初始狀態(tài)偏離Y5 變化
如圖19是當(dāng)惡意節(jié)點(diǎn)和簇頭節(jié)點(diǎn)的策略不固定時(shí),不同初始狀態(tài)下它們的策略變化。當(dāng)它們的初始策略在A(yíng) 區(qū)域、B 區(qū)域、C 區(qū)域和D 區(qū)域時(shí),系統(tǒng)最終不會(huì)趨于穩(wěn)定狀態(tài),而是隨著時(shí)間變化呈現(xiàn)周期性的波動(dòng)。
圖19 各區(qū)域的攻防演化
將基于演化博弈的最優(yōu)防御策略算法(EGT 防御算法)與固定防御、全面防御、隨機(jī)防御以及流量預(yù)測(cè)等入侵檢測(cè)算法進(jìn)行對(duì)比。固定防御算法采用固定的防御策略進(jìn)行入侵檢測(cè);全面防御算法同時(shí)運(yùn)行誤用檢測(cè)和異常檢測(cè)模塊;隨機(jī)防御算法在簇頭節(jié)點(diǎn)上隨機(jī)啟用誤用檢測(cè)或異常檢測(cè)模塊;流量預(yù)測(cè)算法在簇內(nèi)流量最大的簇頭節(jié)點(diǎn)上同時(shí)開(kāi)啟誤用檢測(cè)和異常檢測(cè)模塊。
如圖20 為各個(gè)入侵檢測(cè)算法的入侵檢測(cè)率對(duì)比。從圖中可以看出,使用全面防御算法的入侵檢測(cè)準(zhǔn)確率維持在90%左右,這是由于它同時(shí)啟動(dòng)兩個(gè)模塊,能夠檢測(cè)出所有的攻擊類(lèi)型,因而它的準(zhǔn)確率最高。固定防御策略的檢測(cè)率只有40%左右,這是因?yàn)楣粽邥?huì)根據(jù)防御者的固定策略有針對(duì)性地調(diào)整攻擊方式,使檢測(cè)率降至最低。隨機(jī)防御策略隨機(jī)啟用一個(gè)檢測(cè)模塊,在檢測(cè)模塊準(zhǔn)確率都為90%的前提下,它的檢測(cè)率在45%左右。流量預(yù)測(cè)算法的入侵檢測(cè)率不穩(wěn)定,平均值大約為23%,這主要是因?yàn)楣襞c網(wǎng)絡(luò)中流量的大小無(wú)關(guān)。基于演化博弈的防御策略有較高的檢測(cè)率,在52%左右。它每次只啟用一個(gè)檢測(cè)模塊,因此檢測(cè)率低于全面防御策略;相比于固定防御和隨機(jī)防御,它會(huì)根據(jù)攻擊者的攻擊策略相應(yīng)地動(dòng)態(tài)調(diào)整防御策略,防止攻擊者的針對(duì)性攻擊,因而檢測(cè)率較高。如圖21 和圖22 是隨著時(shí)間推移未啟用防御、啟用全面防御、隨機(jī)防御以及演化防御后,網(wǎng)絡(luò)節(jié)點(diǎn)平均剩余能量以及生存節(jié)點(diǎn)數(shù)量的變化。未啟用防御時(shí)由于沒(méi)有額外的能量消耗,網(wǎng)絡(luò)生存時(shí)間最長(zhǎng)。啟動(dòng)全面防御時(shí)需要同時(shí)開(kāi)啟兩個(gè)模塊,導(dǎo)致簇頭節(jié)點(diǎn)能量消耗急劇加大,使網(wǎng)絡(luò)的生存時(shí)間減少。而基于演化博弈的防御策略每次只開(kāi)啟一個(gè)檢測(cè)模塊,與全面防御策略相比,它減少了簇頭節(jié)點(diǎn)的資源開(kāi)銷(xiāo),使節(jié)點(diǎn)能量消耗降低,有效延長(zhǎng)了整個(gè)網(wǎng)絡(luò)的生存時(shí)間;演化防御和隨機(jī)防御在網(wǎng)絡(luò)攻防過(guò)程中開(kāi)啟入侵檢測(cè)和誤用檢測(cè)模塊次數(shù)相近,這令它們的能量消耗相差無(wú)幾,從而使得網(wǎng)絡(luò)節(jié)點(diǎn)平均能量和生存數(shù)量曲線(xiàn)相似。
圖20 不同算法的入侵檢測(cè)率
圖21 節(jié)點(diǎn)平均能量
圖22 生存節(jié)點(diǎn)數(shù)量
因此,基于演化博弈的防御策略在保證檢測(cè)率的前提下,有效延長(zhǎng)了網(wǎng)絡(luò)的生存時(shí)間,平衡了入侵檢測(cè)系統(tǒng)的準(zhǔn)確性與能效性。
本文從入侵檢測(cè)過(guò)程中攻防雙方的有限理性出發(fā),應(yīng)用演化博弈理論描述并分析惡意傳感器節(jié)點(diǎn)和入侵檢測(cè)系統(tǒng)之間的交互過(guò)程,針對(duì)攻擊方式的不同,構(gòu)建攻防演化博弈模型。利用復(fù)制動(dòng)態(tài)方程分析了多種攻擊方式下攻防雙方策略的演化趨勢(shì),實(shí)現(xiàn)了最優(yōu)防御策略選取算法。根據(jù)演化規(guī)律,防守者主動(dòng)動(dòng)態(tài)地調(diào)整防御策略來(lái)實(shí)現(xiàn)最有效的防御,減少了資源消耗,平衡了系統(tǒng)的能效性和準(zhǔn)確性,不僅延長(zhǎng)了節(jié)點(diǎn)的使用壽命還保證了整個(gè)網(wǎng)絡(luò)能夠長(zhǎng)久安全的運(yùn)行?;谟邢蘩硇缘娜肭謾z測(cè)攻防演化博弈模型,與實(shí)際無(wú)線(xiàn)傳感器網(wǎng)絡(luò)攻防情況相符合,仿真實(shí)驗(yàn)說(shuō)明了該演化模型的合理性和算法的有效性,對(duì)于無(wú)線(xiàn)傳感器網(wǎng)絡(luò)的入侵檢測(cè)系統(tǒng)的應(yīng)用具有重要意義。
但是演化博弈模型的學(xué)習(xí)速率由基礎(chǔ)復(fù)制動(dòng)態(tài)方程給出,這和真實(shí)的無(wú)線(xiàn)傳感器網(wǎng)絡(luò)攻防場(chǎng)景存在一定的差異,實(shí)際的攻防策略變化過(guò)程復(fù)雜,不易量化。建立更加符合實(shí)際情況的改進(jìn)復(fù)制動(dòng)態(tài)方程,將是后續(xù)研究的一個(gè)新挑戰(zhàn)。