張志敏
(池州職業(yè)技術(shù)學(xué)院 電子信息與傳媒系,安徽 池州 247000)
無線網(wǎng)絡(luò)的傳輸媒介為空氣,這使得借助于無線網(wǎng)絡(luò)傳輸信息的過程中信息被竊聽成為可能,使用者在使用無線網(wǎng)絡(luò)的過程中必須充分地考慮其網(wǎng)絡(luò)的安全性,避免受到攻擊。根據(jù)《2019年中國(guó)網(wǎng)絡(luò)安全報(bào)告》,網(wǎng)絡(luò)病毒數(shù)量上漲高達(dá)50%以上。由此可見,網(wǎng)絡(luò)安全形勢(shì)不容樂觀,網(wǎng)絡(luò)安全環(huán)境遭受到了嚴(yán)重的破壞。無線網(wǎng)絡(luò)安全在實(shí)現(xiàn)中華民族偉大復(fù)興方面發(fā)揮著至關(guān)重要的作用,如果網(wǎng)絡(luò)安全不能夠得到保證,那么國(guó)家信息化技術(shù)的發(fā)展也就無從談起,甚至?xí){到國(guó)家安全。在信息化、網(wǎng)絡(luò)化的大背景下,無線網(wǎng)絡(luò)安全已經(jīng)上升到了國(guó)家戰(zhàn)略的高度,關(guān)乎到國(guó)家的發(fā)展和社會(huì)的穩(wěn)定。神經(jīng)網(wǎng)絡(luò)具有比較強(qiáng)的容錯(cuò)能力和自主學(xué)習(xí)能力,通過不斷地學(xué)習(xí)來有效地識(shí)別出樣本中的異常數(shù)據(jù),達(dá)到無線網(wǎng)絡(luò)安全識(shí)別的目的[1]?;诖?,本文搭建了基于神經(jīng)網(wǎng)絡(luò)算法的無線網(wǎng)絡(luò)安全模型。
PCA(主成分分析)是一種對(duì)高維數(shù)據(jù)進(jìn)行降維的多元統(tǒng)計(jì)分析方法,通過少數(shù)的特征量能夠很好地反映出原數(shù)據(jù)絕大部分的信息,同時(shí)降維后的特征量之間沒有相關(guān)性。不妨假定對(duì)樣本K進(jìn)行主成分分析,對(duì)K進(jìn)行標(biāo)準(zhǔn)化處理得到標(biāo)準(zhǔn)化樣本矩陣R,那么
(1)
計(jì)算標(biāo)準(zhǔn)化樣本矩陣R的相關(guān)系數(shù)矩陣B,那么
(2)
(3)
(4)
當(dāng)累計(jì)貢獻(xiàn)率C>90%,那么認(rèn)為前p個(gè)主成分包含了原數(shù)據(jù)中的絕大部分特征信息。
1.2.1 BP神經(jīng)網(wǎng)絡(luò)
神經(jīng)網(wǎng)絡(luò)應(yīng)用于無線網(wǎng)絡(luò)安全模型中具有十分突出的優(yōu)勢(shì),主要體現(xiàn)在3個(gè)方面[2]:首先是神經(jīng)網(wǎng)絡(luò)容錯(cuò)處理能力比較強(qiáng),對(duì)各種不完整的輸入信息具有一定的概括抽象補(bǔ)充功能,而無線網(wǎng)絡(luò)信息在傳輸?shù)倪^程中往往會(huì)出現(xiàn)信息丟失、不完整的情況;其次是神經(jīng)網(wǎng)絡(luò)具有很強(qiáng)的自主學(xué)習(xí)能力,通過對(duì)輸入樣本的不斷訓(xùn)練自主學(xué)習(xí),可以有效地識(shí)別出在樣本中存在的異常數(shù)據(jù),同時(shí)對(duì)各種未知的異常數(shù)據(jù)也具有良好的識(shí)別效果;最后是神經(jīng)網(wǎng)絡(luò)的執(zhí)行效率比較高,在各個(gè)神經(jīng)元之間通過權(quán)值的傳遞來完成對(duì)信息的存儲(chǔ)過程。BP神經(jīng)網(wǎng)絡(luò)是典型的多層前饋網(wǎng)絡(luò)結(jié)構(gòu),在對(duì)BP神經(jīng)網(wǎng)絡(luò)訓(xùn)練的過程中結(jié)合神經(jīng)元的實(shí)際輸出和預(yù)訂期望輸出之間的比較來不斷地調(diào)整權(quán)值,直到滿足誤差允許的范圍。BP神經(jīng)網(wǎng)絡(luò)在處理復(fù)雜的問題時(shí)具有至關(guān)重要作用,在工程中應(yīng)用廣泛,典型的BP神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)如圖1所示。
圖1 BP神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)
由圖1可知,BP神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)共包含3層:輸入層、隱含層、輸出層。將BP神經(jīng)網(wǎng)絡(luò)應(yīng)用于無線網(wǎng)絡(luò)安全模型中,網(wǎng)絡(luò)的性能直接關(guān)系到安全異常檢測(cè)的準(zhǔn)確率。將入侵?jǐn)?shù)據(jù)集樣本進(jìn)行歸一化處理提供給所搭建的BP網(wǎng)絡(luò),從輸入層到隱含層會(huì)產(chǎn)生權(quán)值矩陣w1和偏差矩陣b1,從隱含層到輸出層會(huì)產(chǎn)生權(quán)值矩陣w2和偏差矩陣b2,從輸入層到隱含層的神經(jīng)元傳輸函數(shù)為f1,從隱含層到輸出層的神經(jīng)元傳輸函數(shù)為f2。那么,輸出數(shù)據(jù)y和輸入數(shù)據(jù)x之間存在如下關(guān)系:
y=f2(w2·f1(w1x-b1)-b2)。
(5)
采用梯度下降法不斷地訓(xùn)練網(wǎng)絡(luò),對(duì)網(wǎng)絡(luò)的權(quán)值和閾值進(jìn)行調(diào)整,使得全局誤差小于設(shè)定的誤差,那么就完成了對(duì)學(xué)習(xí)樣本的訓(xùn)練任務(wù)。
1.2.2 BP神經(jīng)網(wǎng)絡(luò)改進(jìn)
對(duì)于無線網(wǎng)絡(luò)安全的異常數(shù)據(jù)往往具有高維、海量等特點(diǎn),采用傳統(tǒng)的檢測(cè)方法往往不能夠達(dá)到比較高的辨識(shí)度。對(duì)BP神經(jīng)網(wǎng)絡(luò)進(jìn)行改進(jìn),采用PCA對(duì)高維的海量數(shù)據(jù)進(jìn)行降維處理,將PCA降維后所獲得的主成分?jǐn)?shù)據(jù)作為BP神經(jīng)網(wǎng)絡(luò)的輸入層[3]。采用PCA對(duì)BP神經(jīng)網(wǎng)絡(luò)進(jìn)行改進(jìn)得到的網(wǎng)絡(luò)結(jié)構(gòu)如圖2所示。
圖2 聯(lián)合PCA和BP神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)
由圖2可知,聯(lián)合PCA和BP神經(jīng)網(wǎng)絡(luò)無線網(wǎng)絡(luò)安全模型首先是將網(wǎng)絡(luò)數(shù)據(jù)集X采用PCA方法進(jìn)行降維處理,得到降維處理后的數(shù)據(jù)集X′。然后將降維后的數(shù)據(jù)集X′作為BP神經(jīng)網(wǎng)絡(luò)的輸入層中進(jìn)行網(wǎng)絡(luò)訓(xùn)練,獲得滿足精度要求的神經(jīng)網(wǎng)絡(luò)。最后是采用檢驗(yàn)數(shù)據(jù)進(jìn)行模型的檢驗(yàn),驗(yàn)證模型的有效性。
無線網(wǎng)絡(luò)拓?fù)涫且环N配置結(jié)構(gòu),常見的拓?fù)浣Y(jié)構(gòu)有3種,即基礎(chǔ)結(jié)構(gòu)集中式拓?fù)浣Y(jié)構(gòu)、Ad Hoc拓?fù)浣Y(jié)構(gòu)、蜂窩式拓?fù)浣Y(jié)構(gòu)?;A(chǔ)結(jié)構(gòu)集中式拓?fù)浣Y(jié)構(gòu)也稱之為中心輻射式結(jié)構(gòu),其能夠和有線網(wǎng)絡(luò)、移動(dòng)用戶實(shí)現(xiàn)通信功能,移動(dòng)用戶終端位于網(wǎng)絡(luò)中心輻射的末端,任何用戶終端和另外的用戶實(shí)現(xiàn)通信都必須通過BS/AP來實(shí)現(xiàn)。Ad Hoc拓?fù)浣Y(jié)構(gòu)也稱之為分布式網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu),主要應(yīng)用于軍事領(lǐng)域。和基礎(chǔ)結(jié)構(gòu)集中式拓?fù)浣Y(jié)構(gòu)所不同,Ad Hoc的用戶可以分布在更為廣泛的區(qū)域內(nèi),特定的用戶終端受到發(fā)射信號(hào)功率的限制,其只能和部分的用戶完成通信。蜂窩式拓?fù)浣Y(jié)構(gòu)是一種特殊的多基礎(chǔ)機(jī)構(gòu)配置,大規(guī)模陸地?zé)o線網(wǎng)絡(luò)和衛(wèi)星無線網(wǎng)絡(luò)中常常使用此種拓?fù)浣Y(jié)構(gòu)。蜂窩式無線通信在信息傳輸?shù)倪^程中使用的是低功率的基站,對(duì)于每個(gè)基站也僅僅只能夠覆蓋有限的區(qū)域,采用蜂窩式無線網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu)可以有效地減少干擾,提供充分的性能[4]。
有線網(wǎng)絡(luò)還是無線網(wǎng)絡(luò),是為了實(shí)現(xiàn)網(wǎng)絡(luò)通信,這使得無線網(wǎng)絡(luò)在信息傳輸?shù)倪^程中也存在網(wǎng)絡(luò)入侵、病毒攻擊等安全問題。由于無線網(wǎng)絡(luò)自身的固有屬性,其網(wǎng)絡(luò)安全具有開放性、移動(dòng)性、傳輸信道不穩(wěn)定等問題。無線網(wǎng)絡(luò)的安全問題如圖3所示。
圖3 無線網(wǎng)絡(luò)安全問題
監(jiān)聽攻擊是通過對(duì)無線網(wǎng)絡(luò)傳輸?shù)男盘?hào)進(jìn)行空中截取,對(duì)截取的信號(hào)進(jìn)行分析,從而獲得相關(guān)信息的方式。插入攻擊是采用假冒合法用戶的方式來竊聽獲取相關(guān)的傳輸信息,從而獲得信息的控制權(quán)。未授權(quán)信息服務(wù)是在未經(jīng)授權(quán)的情況下使用信息資源,例如采用萬能鑰匙破解對(duì)方WiFi密碼來達(dá)到上網(wǎng)的目的。網(wǎng)絡(luò)魯棒性是無線網(wǎng)絡(luò)本身對(duì)個(gè)別無線通信設(shè)備損壞的容忍能力或者是抗擊信道干擾的能力,這體現(xiàn)了無線網(wǎng)絡(luò)的生存能力。移動(dòng)IP安全是用戶終端在某個(gè)特定的區(qū)域內(nèi)實(shí)現(xiàn)跨區(qū)域漫游時(shí),其信息的安全問題。無線干擾是對(duì)發(fā)射功率比較大的同頻段信號(hào)的抗干擾能力。
為了更好地確保無線網(wǎng)絡(luò)的安全,必須對(duì)其實(shí)施檢測(cè)識(shí)別,在網(wǎng)絡(luò)攻擊入侵監(jiān)測(cè)和響應(yīng)系統(tǒng)之間采用分布式的結(jié)構(gòu),同時(shí)各個(gè)監(jiān)測(cè)單位之間協(xié)同工作。在無線網(wǎng)絡(luò)系統(tǒng)的每一個(gè)節(jié)點(diǎn)上都布置有獨(dú)立的檢測(cè)單位,同時(shí)每個(gè)單位都獨(dú)立運(yùn)行,從而有效地對(duì)本地的行為來進(jìn)行檢測(cè),對(duì)各種網(wǎng)絡(luò)攻擊入侵發(fā)起響應(yīng)[5]。無線網(wǎng)絡(luò)入侵檢測(cè)單位模型如圖4所示。
圖4 無線網(wǎng)絡(luò)入侵檢測(cè)單位模型圖
無線網(wǎng)絡(luò)入侵檢測(cè)單位主要是對(duì)采集的數(shù)據(jù)進(jìn)行分析,從而達(dá)到異常檢測(cè)的目的。伴隨著越來越多的網(wǎng)絡(luò)通信采用無線網(wǎng)絡(luò),這使得無線網(wǎng)絡(luò)入侵的類型也變得多樣化,采取傳統(tǒng)的專家規(guī)則只能檢測(cè)比較少、已知類型的入侵類型。采用神經(jīng)網(wǎng)絡(luò)、深度學(xué)習(xí)等方法去檢測(cè)復(fù)雜、多樣化的入侵類型成為了當(dāng)前的研究重點(diǎn)。
試驗(yàn)數(shù)據(jù)來源于安全領(lǐng)域的KDD CUP99數(shù)據(jù)集,其攻擊類型及訓(xùn)練/測(cè)試樣本情況如表1所示。
表1 攻擊類型及訓(xùn)練/測(cè)試樣本情況
對(duì)于原始數(shù)據(jù)進(jìn)行歸一化處理,通過歸一化處理使得數(shù)據(jù)集在模型訓(xùn)練識(shí)別的過程中產(chǎn)生相同的識(shí)別結(jié)果,同時(shí)所需要的時(shí)間和計(jì)算資源更少。數(shù)據(jù)歸一化處理的公式為:
(6)
式中:p0為待訓(xùn)練數(shù)據(jù)集中所有元素的平均值;p1為待訓(xùn)練數(shù)據(jù)集中所有元素的標(biāo)準(zhǔn)差。
由于PCA及BP神經(jīng)網(wǎng)絡(luò)中主分量的個(gè)數(shù)和隱含層的個(gè)數(shù)無法確定,因此在分類器的模擬階段需要通過試算的方式來確定這2個(gè)參數(shù),從而使得模型的訓(xùn)練效果達(dá)到最佳。在仿真的過程中將訓(xùn)練數(shù)據(jù)集和測(cè)試數(shù)據(jù)集采用PCA進(jìn)行降維處理,從而得到不同的主成分分量i(i=1,2,…,30)。將主成分作為BP神經(jīng)網(wǎng)絡(luò)的輸入,分別取BP神經(jīng)網(wǎng)絡(luò)隱含層的個(gè)數(shù)為j(j=1,2,…,40)。通過不同的參數(shù)i和j進(jìn)行訓(xùn)練,通過多次反復(fù)訓(xùn)練試驗(yàn)得出當(dāng)i=26,j=35時(shí),聯(lián)合PCA和BP神經(jīng)網(wǎng)絡(luò)的分類器檢測(cè)準(zhǔn)確率和收斂性最優(yōu)。對(duì)聯(lián)合PCA和BP神經(jīng)網(wǎng)絡(luò)算法與BP神經(jīng)網(wǎng)絡(luò)算法對(duì)無線網(wǎng)絡(luò)安全模型進(jìn)行識(shí)別,結(jié)果如表2所示。
表2 各種攻擊類型檢測(cè)結(jié)果
由表2可見,聯(lián)合PCA和BP神經(jīng)網(wǎng)絡(luò)算法對(duì)各種攻擊類型的檢測(cè)識(shí)別率比較高,誤報(bào)率比較低,可以應(yīng)用于無線網(wǎng)絡(luò)安全模型的識(shí)別。
無線網(wǎng)絡(luò)是互聯(lián)網(wǎng)的重要組成部分,本文針對(duì)網(wǎng)絡(luò)安全攻擊識(shí)別率低、誤報(bào)率高的問題,提出了聯(lián)合PCA和BP神經(jīng)網(wǎng)絡(luò)的無線網(wǎng)絡(luò)安全監(jiān)測(cè)方法。采用PCA對(duì)高維復(fù)雜數(shù)據(jù)進(jìn)行降維處理,將主成分作為BP神經(jīng)網(wǎng)絡(luò)的訓(xùn)練數(shù)據(jù)進(jìn)行模型訓(xùn)練。結(jié)果表明,相較于傳統(tǒng)的BP神經(jīng)網(wǎng)絡(luò),其各種網(wǎng)絡(luò)攻擊識(shí)別率提高,誤報(bào)率降低,同時(shí)收斂速度加快。本文的研究對(duì)準(zhǔn)確識(shí)別無線網(wǎng)絡(luò)攻擊類型,準(zhǔn)確上報(bào)來提升無線網(wǎng)絡(luò)安全性具有一定的參考價(jià)值。