閆衛(wèi)剛
(陜西警官職業(yè)學(xué)院,陜西 西安 710021)
近年來(lái),隨著全球信息化發(fā)展越來(lái)越快,人們依賴(lài)網(wǎng)絡(luò)的程度日漸提高,網(wǎng)絡(luò)安全隱患越發(fā)引人關(guān)注[1]。網(wǎng)絡(luò)系統(tǒng)因具有隨機(jī)性、模糊性,以往的防御方式難以適應(yīng)目前的安全要求[2]。網(wǎng)絡(luò)安全態(tài)勢(shì)通過(guò)預(yù)測(cè)和評(píng)估可確保網(wǎng)絡(luò)安全穩(wěn)定運(yùn)行,并得到學(xué)者深入研究[3]。
目前,網(wǎng)絡(luò)已經(jīng)深入到社會(huì)經(jīng)濟(jì)發(fā)展、國(guó)家戰(zhàn)略部署、人民日常生活的方方面面[4]。人們?cè)趯W(xué)習(xí)、工作、生活等方面均涉及到網(wǎng)絡(luò),但現(xiàn)有防范措施的更新速度難以跟上相關(guān)網(wǎng)絡(luò)安全威脅的變化速度[5]。由于網(wǎng)絡(luò)安全態(tài)勢(shì)預(yù)測(cè)在網(wǎng)絡(luò)安全態(tài)勢(shì)感知系統(tǒng)中具有舉足輕重的地位,所以逐漸成為了網(wǎng)絡(luò)安全研究的熱點(diǎn)之一[6]。整個(gè)預(yù)測(cè)過(guò)程是建立在對(duì)態(tài)勢(shì)進(jìn)行完整理解以及敏銳察覺(jué)的基礎(chǔ)之上[7]。在不斷接觸網(wǎng)絡(luò)安全態(tài)勢(shì)期間,采集多種多樣的信息數(shù)據(jù),也是分析網(wǎng)絡(luò)安全態(tài)勢(shì)運(yùn)行方向的開(kāi)端[8]。通過(guò)對(duì)其歷史數(shù)據(jù)觀測(cè)及相關(guān)經(jīng)驗(yàn)分析,可對(duì)未來(lái)某段時(shí)間內(nèi)網(wǎng)絡(luò)安全態(tài)勢(shì)發(fā)展趨勢(shì)進(jìn)行預(yù)測(cè)[9]。因而,研究網(wǎng)絡(luò)安全態(tài)勢(shì)預(yù)測(cè)會(huì)對(duì)其日后發(fā)展產(chǎn)生深遠(yuǎn)的影響,并為網(wǎng)絡(luò)系統(tǒng)安全運(yùn)行提供重要保障。在研究過(guò)程中會(huì)涉及到一些相關(guān)的算法和模型,但鑒于外部環(huán)境條件數(shù)量太多且難以參數(shù)化,所以無(wú)法將預(yù)測(cè)模型標(biāo)準(zhǔn)化、統(tǒng)一化,故以往的預(yù)測(cè)手段難以精確地對(duì)此類(lèi)數(shù)據(jù)進(jìn)行預(yù)測(cè)。因此,本文基于人工智能,對(duì)互聯(lián)網(wǎng)絡(luò)數(shù)據(jù)安全優(yōu)化算法進(jìn)行研究。
常用的智能優(yōu)化算法分為以下幾類(lèi):差分進(jìn)化算法、遺傳算法、粒子群優(yōu)化算法。差分進(jìn)化算法、遺傳算法的運(yùn)算過(guò)程均含有選擇、交叉、變異三個(gè)步驟。前者會(huì)使種群個(gè)體出現(xiàn)一個(gè)屬于自身的測(cè)試向量,然后對(duì)比原始和測(cè)試2個(gè)向量,選擇更合適的值進(jìn)行迭代,能夠很好地優(yōu)化處理傳統(tǒng)測(cè)試方程;而后者擅長(zhǎng)確定最優(yōu)解范圍以及在全局范圍內(nèi)進(jìn)行搜索,然而其在給定小范圍內(nèi)搜索最優(yōu)解的能力有所欠缺,所得結(jié)果的精度并不高。粒子群算法的運(yùn)算過(guò)程含有位置以及速度更新2個(gè)步驟。其對(duì)遷徙動(dòng)物尋找食物的場(chǎng)景進(jìn)行模擬,如果個(gè)體成功找到食物,便會(huì)告知其他種群成員,進(jìn)而導(dǎo)致群體產(chǎn)生運(yùn)動(dòng)。粒子群算法擅長(zhǎng)快速鎖定范圍并在其中迅速找出最優(yōu)解。
通過(guò)神經(jīng)網(wǎng)絡(luò)理論進(jìn)一步發(fā)展,研究人員對(duì)人腦神經(jīng)網(wǎng)絡(luò)系統(tǒng)特點(diǎn)研究日漸成熟。尤其是對(duì)權(quán)值的優(yōu)化,已研發(fā)出不同的優(yōu)化算法來(lái)確定其權(quán)值,其中最常用的是蟻群算法和遺傳算法等[10]。如何確定RBF神經(jīng)網(wǎng)絡(luò)連接權(quán)值?本文主要考慮利用粒子群對(duì)其進(jìn)行優(yōu)化,能夠使其權(quán)值高效迅速地確定為全局最優(yōu)解。
粒子群優(yōu)化算法的特點(diǎn)能將鳥(niǎo)群尋找食物時(shí)互助行為體現(xiàn)出來(lái),通過(guò)同伴間信息交換,從而快速找到食物,將其引申到解決數(shù)學(xué)問(wèn)題就是將最優(yōu)解問(wèn)題快速解決。該算法屬于一種尋找最優(yōu)解算法,通過(guò)粒子間協(xié)作、交換將全局最優(yōu)解快速求出。在粒子群優(yōu)化算法中,將最優(yōu)解作為該算法中一個(gè)粒子,任意對(duì)每個(gè)粒子進(jìn)行初始化,然后在解的范圍中進(jìn)行尋找。每個(gè)粒子對(duì)應(yīng)一個(gè)適應(yīng)度方程,該方程的解即符合問(wèn)題條件的最優(yōu)粒子值,通常由對(duì)象方程決定。當(dāng)粒子搜尋到一個(gè)解時(shí),比較適應(yīng)度函數(shù),若新的值比前一個(gè)值對(duì)目標(biāo)函數(shù)更適應(yīng),則新位置為該粒子暫時(shí)最優(yōu)解;反之,則個(gè)體最優(yōu)解保持不變。個(gè)體確定最優(yōu)解后,對(duì)比粒子自身的適應(yīng)度方程,最恰當(dāng)?shù)木褪侨肿顑?yōu)解。再將這二者的適應(yīng)度方程解進(jìn)行比較,選擇更加符合條件的那一個(gè)。
假設(shè)在粒子群優(yōu)化算法中,有m個(gè)粒子群,且n為粒子最優(yōu)問(wèn)題解空間維數(shù),則每個(gè)粒子改變個(gè)體粒子位置的規(guī)則包括:在尋找到個(gè)體最優(yōu)位置時(shí),每個(gè)粒子對(duì)自身位置進(jìn)行更新;每個(gè)粒子根據(jù)自身搜索方向搜索;比較全體粒子位置,根據(jù)粒子個(gè)體最優(yōu)解進(jìn)行全局最優(yōu)位置的更新。
在粒子群優(yōu)化中,通過(guò)對(duì)粒子群中粒子速度、位置的更換獲得新種群,進(jìn)一步提高種群多樣性、遍歷性。離子群優(yōu)化算法流程需經(jīng)過(guò)如圖1所示的步驟完成。
圖1展現(xiàn)了粒子群優(yōu)化算法的大致過(guò)程,其步驟包括:
圖1 粒子群優(yōu)化過(guò)程
步驟1:確定粒子的搜索頻次、所處位置以及更新速度,并對(duì)這些參數(shù)一一進(jìn)行初始化。
步驟2:對(duì)全部粒子的適應(yīng)度值進(jìn)行一一求解。
步驟3:分析粒子自身個(gè)體最優(yōu)位置,將其與此次位置適應(yīng)度值展開(kāi)比較,若后者更加接近問(wèn)題最優(yōu)解,則用本次位置替換前者。
步驟4:依據(jù)前3步的更新數(shù)據(jù)信息,重新確定粒子群全局最優(yōu)位置。個(gè)體確定最優(yōu)解后,對(duì)比粒子自身的適應(yīng)度方程,最恰當(dāng)?shù)木褪侨肿顑?yōu)解。再將這二者的適應(yīng)度方程解進(jìn)行比較,選擇更加符合條件的那一個(gè)。
步驟5:對(duì)粒子位置、速度進(jìn)行確定。
步驟6:若未能達(dá)到終止條件,則返回步驟2。
RBF神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)如圖2所示。輸出層屬于線(xiàn)性結(jié)構(gòu),可為神經(jīng)網(wǎng)絡(luò)輸入產(chǎn)生對(duì)應(yīng)的輸出;隱含層能夠訓(xùn)練輸入層的樣本,并對(duì)不同數(shù)據(jù)進(jìn)行修訂;輸入層能夠識(shí)別從外面輸入的樣本集,訓(xùn)練樣本。
圖2 RBF神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)
粒子群神經(jīng)網(wǎng)絡(luò)是神經(jīng)網(wǎng)絡(luò)模型的一種,其兼顧了神經(jīng)網(wǎng)絡(luò)的優(yōu)點(diǎn)和粒子群優(yōu)化算法的長(zhǎng)處。RBF神經(jīng)網(wǎng)絡(luò)擅長(zhǎng)模仿學(xué)習(xí),而粒子群擅長(zhǎng)進(jìn)行高效迅速地全局搜索,將二者有機(jī)結(jié)合,能夠大大提高算法的性能。如今,由于樣本數(shù)量不足,使用梯度法及線(xiàn)性最小二乘法時(shí),RBF神經(jīng)網(wǎng)絡(luò)的權(quán)值優(yōu)化難以接近最強(qiáng)性能。所以,轉(zhuǎn)而采用粒子群優(yōu)化算法來(lái)解決這一問(wèn)題。
假定1臺(tái)服務(wù)器主機(jī)可能遭受的攻擊有以下幾個(gè)方面:CSRF漏洞、CGI漏洞、XSS漏洞、應(yīng)用漏洞、SQL注入,其風(fēng)險(xiǎn)等級(jí)賦值量化為W38,W48,W58,W68,W78。在權(quán)值優(yōu)化上,神經(jīng)網(wǎng)絡(luò)沒(méi)有求得一個(gè)適應(yīng)所有情況的最優(yōu)解,所以對(duì)其權(quán)值優(yōu)化進(jìn)行研究至關(guān)重要。本文將RBF神經(jīng)網(wǎng)絡(luò)權(quán)值進(jìn)行轉(zhuǎn)換,形成粒子群中粒子,在解空間中,讓粒子進(jìn)行全局最優(yōu)權(quán)值的尋找。RBF神經(jīng)網(wǎng)絡(luò)的網(wǎng)絡(luò)模型如圖3所示。
圖3 RBF神經(jīng)網(wǎng)絡(luò)的網(wǎng)絡(luò)模型
由圖3可知,需優(yōu)化最優(yōu)解問(wèn)題解空間維度為五維。若將求解五維最優(yōu)空間解在粒子群求解最優(yōu)解進(jìn)行映射,需進(jìn)行RBF神經(jīng)網(wǎng)絡(luò)權(quán)值編碼。編碼方式一般來(lái)說(shuō)有兩種:一是對(duì)向量進(jìn)行編碼;二是對(duì)矩陣進(jìn)行編碼。前者是將所有粒子一一對(duì)應(yīng)轉(zhuǎn)化為向量,在圖3中進(jìn)行權(quán)值優(yōu)化后,不同粒子所具有的編碼如下:
采用基于粒子群優(yōu)化RBF神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)網(wǎng)絡(luò)安全態(tài)勢(shì)。在處理小樣本數(shù)據(jù)方面,粒子群優(yōu)化算法最大的特點(diǎn)是快速、準(zhǔn)確,RBF神經(jīng)網(wǎng)絡(luò)進(jìn)行粒子群優(yōu)化過(guò)程如圖4所示,優(yōu)化過(guò)程具體步驟如下:
圖4 RBF神經(jīng)網(wǎng)絡(luò)進(jìn)行粒子群優(yōu)化過(guò)程
步驟1:對(duì)其權(quán)值編碼,并將編碼對(duì)應(yīng)到每一個(gè)粒子上;
步驟2:確定粒子的搜索頻次、所處位置以及更新速度,并對(duì)這些參數(shù)一一進(jìn)行初始化;
步驟3:對(duì)RBF神經(jīng)網(wǎng)絡(luò)中心、半徑使用K-均值聚類(lèi)算法進(jìn)行計(jì)算;
步驟4:重新求解粒子群適應(yīng)度值,更新相關(guān)數(shù)據(jù)參數(shù);
步驟5:重新確認(rèn)不同粒子所處的位置以及自身的速度;
步驟6:從以下兩方面判斷是否符合終止條件,一是對(duì)全局最優(yōu)解是否在規(guī)定誤差范圍內(nèi)進(jìn)行判斷;二是對(duì)更新粒子群次數(shù)是否已達(dá)上限進(jìn)行判斷,若符合,則完成整個(gè)優(yōu)化過(guò)程,反之回到步驟4繼續(xù)以上流程,直至符合為止。
在本研究中,網(wǎng)絡(luò)安全態(tài)勢(shì)評(píng)估對(duì)象為6臺(tái)服務(wù)器主機(jī),根據(jù)熵權(quán)理論風(fēng)險(xiǎn)評(píng)估模型、多維云模型將其他5臺(tái)服務(wù)器主機(jī)風(fēng)險(xiǎn)值計(jì)算出來(lái),分別為0.682 0,0.653 1,0.650 2,0.680 1,0.541 5。因網(wǎng)絡(luò)系統(tǒng)主機(jī)全部為服務(wù)器主機(jī),服務(wù)器上架設(shè)不同網(wǎng)站,具有同等重要作用,重要性權(quán)值均相等,且6個(gè)權(quán)值之和為1,則每個(gè)服務(wù)器主機(jī)重要性權(quán)值等于1/6,則進(jìn)行加權(quán)計(jì)算后風(fēng)險(xiǎn)值為0.648 2,表明本系統(tǒng)網(wǎng)絡(luò)安全態(tài)勢(shì)屬于較高風(fēng)險(xiǎn)。
在預(yù)測(cè)時(shí),選用粒子群優(yōu)化RBF神經(jīng)網(wǎng)絡(luò)模型,利用其對(duì)訓(xùn)練樣本進(jìn)行處理,最終通過(guò)訓(xùn)練獲得有效預(yù)測(cè)模型。預(yù)測(cè)模型的流程如圖5所示。
圖5 網(wǎng)絡(luò)安全態(tài)勢(shì)預(yù)測(cè)流程
網(wǎng)絡(luò)安全態(tài)勢(shì)預(yù)測(cè)研究可以從兩個(gè)方面入手,一是把每次遭受到的攻擊看作是獨(dú)立事件,進(jìn)行單次預(yù)估,同時(shí)還要評(píng)估不同攻擊的強(qiáng)度,將不同時(shí)刻對(duì)應(yīng)的態(tài)勢(shì)值預(yù)估出來(lái),這樣做的弊端在于評(píng)估不同攻擊的強(qiáng)度時(shí)通常會(huì)受到評(píng)價(jià)者主觀認(rèn)知的左右;二是建立一個(gè)非線(xiàn)性時(shí)序的模型來(lái)進(jìn)行預(yù)估,匯總歷史數(shù)據(jù),認(rèn)真分析其內(nèi)在聯(lián)系和共同影響因子,以便對(duì)日后網(wǎng)絡(luò)的發(fā)展方像向進(jìn)行預(yù)估。本文選用經(jīng)過(guò)粒子群優(yōu)化RBF神經(jīng)網(wǎng)絡(luò)這一方式來(lái)進(jìn)行預(yù)測(cè),對(duì)來(lái)自國(guó)家級(jí)網(wǎng)絡(luò)中心的海量數(shù)據(jù)信息進(jìn)行預(yù)處理。綜合考量后選取以下影響因子作為規(guī)范性指標(biāo)來(lái)對(duì)網(wǎng)絡(luò)安全態(tài)勢(shì)進(jìn)行預(yù)估:一是新增信息安全漏洞數(shù)量;二是被植入后門(mén)的網(wǎng)站數(shù)量;三是新增信息安全高風(fēng)險(xiǎn)漏洞;四是感染網(wǎng)絡(luò)病毒主機(jī)數(shù)量;五是網(wǎng)站仿冒頁(yè)面數(shù)量;六是網(wǎng)絡(luò)中被篡改網(wǎng)站數(shù)量。將網(wǎng)絡(luò)安全態(tài)勢(shì)值進(jìn)行劃分,分別為危、差、中、良、優(yōu)5個(gè)級(jí)別。對(duì)6個(gè)指標(biāo)數(shù)據(jù)進(jìn)行統(tǒng)計(jì)、分析,5個(gè)風(fēng)險(xiǎn)等級(jí)量化表見(jiàn)表1所列。
表1 安全等級(jí)表
通過(guò)本文方法對(duì)RBF神經(jīng)網(wǎng)絡(luò)進(jìn)行優(yōu)化,從而高效迅速地預(yù)測(cè)網(wǎng)絡(luò)安全態(tài)勢(shì)。通過(guò)對(duì)比RBF神經(jīng)網(wǎng)絡(luò)優(yōu)化前后預(yù)測(cè)的數(shù)值與實(shí)際值的差異,表明粒子群優(yōu)化RBF神經(jīng)網(wǎng)絡(luò)具有準(zhǔn)確、快速的優(yōu)點(diǎn),具體如圖6所示。
圖6 算法對(duì)應(yīng)的預(yù)測(cè)誤差圖
由圖6可知,采用本文方法預(yù)測(cè)網(wǎng)絡(luò)安全態(tài)勢(shì)的收斂速度要比RBF神經(jīng)網(wǎng)絡(luò)快。預(yù)測(cè)結(jié)果誤差圖曲線(xiàn)表明,在進(jìn)化次數(shù)小于10次時(shí),本文方法預(yù)測(cè)誤差下降很快,隨后在較小誤差附近波動(dòng)。RBF神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)誤差圖曲線(xiàn)表明,其進(jìn)行樣本訓(xùn)練時(shí)產(chǎn)生的預(yù)測(cè)誤差較大,通常是由于訓(xùn)練次數(shù)或者樣本數(shù)量不足導(dǎo)致的。兩種方法預(yù)測(cè)誤差波動(dòng)表明,相比于RBF神經(jīng)網(wǎng)絡(luò),利用本文方法進(jìn)行預(yù)測(cè),誤差出現(xiàn)的起伏更小。鑒于網(wǎng)絡(luò)安全態(tài)勢(shì)數(shù)據(jù)具備以下三個(gè)性質(zhì):復(fù)雜性、隨機(jī)性、模糊性,所以本文方法能夠更好地建立相應(yīng)預(yù)測(cè)模型,把誤差的波動(dòng)控制在較小的程度內(nèi)。即便是在樣本量不足的情況下,本文方法也能夠在全局范圍內(nèi)高效迅速地鎖定最優(yōu)解。采用本文方法進(jìn)行權(quán)值優(yōu)化,能使神經(jīng)網(wǎng)絡(luò)權(quán)值快速收斂,訓(xùn)練出的網(wǎng)絡(luò)安全態(tài)勢(shì)預(yù)測(cè)模型更有效。算法對(duì)應(yīng)的預(yù)測(cè)輸出如圖7所示。
圖7 算法對(duì)應(yīng)的預(yù)測(cè)輸出
由圖7可看出,在訓(xùn)練次數(shù)較少的情況下,本文算法的預(yù)測(cè)結(jié)果快速且與實(shí)際網(wǎng)絡(luò)安全態(tài)勢(shì)值接近,比RBF神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)模型預(yù)測(cè)的網(wǎng)絡(luò)安全態(tài)勢(shì)更有效、更快速。表明本文算法預(yù)測(cè)結(jié)果更加擬合實(shí)際網(wǎng)絡(luò)態(tài)勢(shì)值。
本文基于人工智能對(duì)互聯(lián)網(wǎng)絡(luò)數(shù)據(jù)安全優(yōu)化算法進(jìn)行研究,分析了互聯(lián)網(wǎng)絡(luò)數(shù)據(jù)安全優(yōu)化算法,得出如下結(jié)論:
(1)在網(wǎng)絡(luò)安全態(tài)勢(shì)預(yù)測(cè)中,預(yù)測(cè)模型建立在粒子群優(yōu)化RBF神經(jīng)網(wǎng)絡(luò)的基礎(chǔ)上,在處理信息數(shù)據(jù)量不多時(shí),粒子群RBF神經(jīng)網(wǎng)絡(luò)算法的運(yùn)算速度快、精度高,有利于粒子群RBF神經(jīng)網(wǎng)絡(luò)進(jìn)行快速準(zhǔn)確的預(yù)測(cè)。
(2)通過(guò)對(duì)比粒子群優(yōu)化前后的RBF神經(jīng)網(wǎng)絡(luò),結(jié)果表明,對(duì)RBF神經(jīng)網(wǎng)絡(luò)進(jìn)行粒子群優(yōu)化后,其預(yù)測(cè)誤差波動(dòng)能夠很大程度的減小。利用這種方法進(jìn)行權(quán)值優(yōu)化,能使神經(jīng)網(wǎng)絡(luò)權(quán)值快速收斂,訓(xùn)練的網(wǎng)絡(luò)安全態(tài)勢(shì)預(yù)測(cè)模型更有效。
(3)比較粒子群優(yōu)化RBF神經(jīng)網(wǎng)絡(luò)算法預(yù)測(cè)結(jié)果、實(shí)際網(wǎng)絡(luò)態(tài)勢(shì)值以及RBF神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)結(jié)果,表明在訓(xùn)練次數(shù)較少情況下,粒子群優(yōu)化RBF神經(jīng)網(wǎng)絡(luò)算法的預(yù)測(cè)結(jié)果快速且與實(shí)際網(wǎng)絡(luò)安全態(tài)勢(shì)值接近,比RBF神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)模型預(yù)測(cè)的網(wǎng)絡(luò)安全態(tài)勢(shì)更有效、更快速。