岳 川,王立德,閆海鵬
(北京交通大學電氣工程學院,北京 100044)
隨著列車通信網(wǎng)絡(TCN)對通信速率及智能化需求的不斷增加,基于以太網(wǎng)的列車通信網(wǎng)絡(ETCN)因其帶寬高、兼容性強及開放性好等優(yōu)點,正逐步成為現(xiàn)今智能列車的首選網(wǎng)絡架構[1].但ETCN的應用給列車帶來通信便利之時,也引入了諸多網(wǎng)絡安全隱患[2].作為基礎性公共設施,列車的網(wǎng)絡安全至關重要,應當采取有效的措施來提高其安全防護能力.
入侵檢測在網(wǎng)絡安全領域扮演著重要的角色,可以發(fā)現(xiàn)網(wǎng)絡入侵行為并發(fā)出告警[3].近年來,深度學習已成為入侵檢測方法的主流選擇,其優(yōu)勢發(fā)揮通常是以充足的數(shù)據(jù)樣本為基礎,但在入侵檢測領域,小樣本問題(模型訓練時攻擊樣本數(shù)量過少)仍然阻撓深度學習方法發(fā)揮其應有的檢測能力.網(wǎng)絡攻擊多為偶發(fā)事件,攻擊報文數(shù)量往往有限,對于列車通信網(wǎng)絡,攻擊者更加追求“悄無聲息”地入侵,攻擊樣本往往數(shù)量更小,小樣本問題更加凸顯,使模型沒有充足的信息可以學習.同時,由于正常報文數(shù)量巨大,也會進一步導致類不平衡問題,即訓練數(shù)據(jù)中各類別分布不均衡,導致深度學習模型傾向于學習正常樣本的特征,而輕視關鍵的攻擊樣本.
數(shù)據(jù)增廣是解決小樣本問題的主流方法,即利用特定方法擴充小樣本數(shù)據(jù)的數(shù)量[4].傳統(tǒng)的數(shù)據(jù)增廣方法主要為過采樣方法,例如:文獻[5]使用合成少數(shù)過采樣法(SMOTE)來擴充小樣本數(shù)據(jù),提升了入侵檢測的準確率;文獻[6]提出一種基于聚類簇結構特性的綜合采樣法,能夠生成樣本分布結構特性保持的均衡數(shù)據(jù)樣本.上述方法在面對入侵檢測的小樣本問題時取得了較好的效果,并且具有可解釋性強、機制簡單的優(yōu)勢,但也正因為其機制較為簡單,生成樣本的質量不夠突出,容易導致有效信息的丟失及模型過擬合.生成對抗網(wǎng)絡(GAN)[7]是一種生成模型,因其強大的數(shù)據(jù)生成能力已被廣泛應用于多個領域的數(shù)據(jù)增廣任務中.對于入侵檢測的小樣本問題,一種更為新穎的解決思路是使用GAN 來生成高質量的網(wǎng)絡攻擊樣本:文獻[8]提出了一種基于GAN 的攻擊樣本生成方法,將生成的樣本應用在基于CNN 的入侵檢測模型中,能夠有效地提升模型的準度;文獻[9]對傳統(tǒng)GAN 進行了改進,提出了一種基于不平衡生成對抗網(wǎng)絡(IGAN)的攻擊樣本生成方法并應用于點對點模式(ad-hoc)網(wǎng)絡的入侵檢測任務中,有效提升了入侵檢測的檢測準度.上述方法雖取得了優(yōu)異的表現(xiàn),但皆有不同的適用場景.如何將GAN 有效地應用于ETCN 場景仍是一項具有挑戰(zhàn)性的任務,需要結合ETCN 中攻擊數(shù)據(jù)的實際特點對方法進行適應性的改進設計.
針對ETCN 入侵檢測的小樣本問題,在傳統(tǒng)GAN 框架基礎上,本文提出一種改進的生成對抗網(wǎng)絡(GMCW-GAN),用于生成高質量的ETCN 網(wǎng)絡攻擊樣本.實驗結果表明,本文提出的方法能夠生成有效的ETCN 網(wǎng)絡攻擊樣本,可以在小樣本條件下提高基于深度學習的ETCN 入侵檢測的檢測準度,進而增強ETCN 的安全防御能力.
首先,分析將傳統(tǒng)GAN 應用于網(wǎng)絡攻擊樣本生成任務時存在的主要缺點,在此基礎上,介紹GMCW-GAN 的主要改進內容;其次,設計GMCWGAN 中生成器與判別器的內部網(wǎng)絡結構.
GAN 是Goodfellow 等[7]于2014 年提出的一種基于可微生成器的生成式建模方法.GAN 由2 部分組成:生成器G與判別器D,通過對抗訓練的方式使生成器產(chǎn)生的樣本服從真實數(shù)據(jù)分布.該訓練過程是一個0 和博弈問題,即生成器與判別器各自的收益等于對方的損失,當訓練接近納什均衡時,模型達到最優(yōu).其目標函數(shù)如式(1),GAN 的整體優(yōu)化目標可形式化表示為
傳統(tǒng)GAN 存在3 項缺點:1)生成器的輸入通常為符合高斯分布或均勻分布的隨機變量,然而,在實際應用中,這2 類分布的表達能力較為單一,會從模型的初始采樣環(huán)節(jié)對生成樣本的初始數(shù)據(jù)形態(tài)產(chǎn)生約束,最終影響生成樣本的多樣性;2)生成過程中,生成樣本的類別不受控,表現(xiàn)為將GAN 應用在多類別的生成任務中時,無法按需指定其生成特定類別的樣本;3)生成器的優(yōu)化目標等價于最小化與pr(x) 之間的JS(Jensen-Shannon)散度[7],當分布之間沒有重疊部分時,將導致生成器梯度消失,從而無法通過訓練進一步優(yōu)化生成器.
對于ETCN 入侵檢測的攻擊樣本生成任務,缺點1 會導致生成樣本的多樣性不足,從而限制其在入侵檢測模型訓練環(huán)節(jié)中的促進作用;缺點2 會導致生成樣本的類別難以控制,從而增加樣本生成模型的訓練難度與成本;缺點3 會導致生成樣本的真實性不足,不能夠充分模擬真實的網(wǎng)絡入侵數(shù)據(jù).
面向ETCN 入侵檢測的攻擊樣本生成需求,本文設計了一種樣本生成方法GMCW-GAN,其整體結構見圖1.該方法在傳統(tǒng)GAN 的基礎上從采樣策略、約束條件、損失密度3 個方面進行改進,以克服上述缺點.
圖1 GMCW-GAN 的整體結構Fig.1 Overall structure of GMCW-GAN
1.1.1 采樣策略改進
傳統(tǒng)GAN 從高斯分布或均勻分布中采樣生成隨機變量作為其潛在空間的先驗分布,這種采樣方式在一定程度上約束了生成樣本的多樣性.為解決這一問題,GMCW-GAN 采用具備多模態(tài)特性的高斯混合模型(GMM)[10]來替代傳統(tǒng)的一元高斯分布,從而更好地契合真實訓練樣本的內生多模態(tài)特性,增加生成樣本的多樣性.
GMM 由N個高斯分量加權求和組成,每個分量為1 個一元高斯分布,可將GMM 形式化表述為
式中:g(x|μi,Ci) 為單個隨機潛變量依從的S元高斯分布的概率密度函數(shù);μi為均值向量,μi∈RS;Ci為協(xié)方差矩陣;λ={ωi,μi,Ci} 為GMM的參數(shù),ωi為第i個高斯分量的權值,且
對于ETCN 攻擊樣本生成任務,在沒有先驗知識時,可認為GMCW-GAN 潛空間中的高斯分量具有均等權值,則可令ωi=1/N,因此,潛空間需要計算的參數(shù)可約簡為 λ={μi,Ci} .由于直接從GMM 中采樣得到隨機變量的過程不可導,無法參與反向梯度傳播來更新參數(shù) λ,因此,GMCW-GAN 通過重參數(shù)化技巧解決該問題,即首先從正態(tài)分布N(0,1) 中采樣得到 ε,并按式(3)計算得到隨機變量z.
該過程在保持潛在變量隨機性的同時,將隨機性與參與訓練的參數(shù)分離,確保GMM 的參數(shù) λ 可以通過反向傳播來動態(tài)更新.
1.1.2 約束條件改進
傳統(tǒng)GAN 的生成過程自由度過高,其生成的樣本不可控.為解決該問題,GMCW-GAN 引入樣本條件約束技巧,通過給定相應的樣本類別標簽約束增強生成過程的可控性.
在GMCW-GAN 中,令真實目標樣本的類別標簽y為樣本條件約束,通過給生成器和判別器的輸入分別增加約束x|y與z|y來實現(xiàn).增加了樣本條件約束后的優(yōu)化目標改寫為
改進后,可以通過改變輸入樣本的類別標簽y來控制模型生成所需的網(wǎng)絡攻擊樣本.
傳統(tǒng)GAN 通過JS 散度來衡量
沃瑟斯坦距離可度量高維空間中的數(shù)據(jù)推動距離.面對高維的網(wǎng)絡攻擊樣本,將數(shù)據(jù)從pr(x) 推向的過程存在多種移動路徑,每種路徑下,將數(shù)據(jù)全部推至目的分布的總代價B(γ),如式(5)所示.
將式(5)代入式(6),可以等價地將W(pr,pg) 表示為
求解式(7)的過程等同于求解一個線性規(guī)劃問題,面對現(xiàn)實中復雜的網(wǎng)絡攻擊數(shù)據(jù)分布,直接對其求解是難以實現(xiàn)的,因此,通過求解其對偶問題[12],等價地得到新的函數(shù)表達式為
式中:s up 表示取上確界,L≤1 表示函數(shù)應服從1-Lipschitz 約束.
GMCW-GAN 引入梯度懲罰(gradient penalty)來保證函數(shù)服從1-Lipschitz 約束,即在判別器的優(yōu)化目標中加入梯度懲罰項其表達式為
聯(lián)立式(4)、(8)、(9),即可得到GMCW-GAN最終的目標函數(shù)為
本節(jié)基于具有強表示能力的卷積神經(jīng)網(wǎng)絡來設計生成器與判別器的內部網(wǎng)絡結構.
1.2.1 生成器
生成器主要作用是將輸入的隨機變量轉變?yōu)楣魳颖?,GMCW-GAN 中生成器的網(wǎng)絡結構包括全連接層(FC1)、重塑層(R2)、2 層轉置卷積層(TC3、TC4)與卷積層(C5),如圖2 所示.
圖2 生成器網(wǎng)絡結構Fig.2 Network structure of generator
從高斯混合模型中采樣得到的隨機分布z與樣本標簽約束y的聯(lián)合嵌入表示生成器的輸入;通過FC1 將輸入進一步表示為多神經(jīng)元隱層的輸出;通過R2 將FC1 的輸出重塑為三維結構;通過TC3 與TC4 執(zhí)行轉置卷積;通過C5,以same padding(保持卷積前后張量的高與寬不變)的方式執(zhí)行卷積,得到與真實攻擊樣本同形狀的生成攻擊樣本.
為避免引入稀疏梯度,F(xiàn)C1、TC3 與TC4 中的非線性激活函數(shù)采用LeakyRelu[13],同時因為C5 的輸出為生成的攻擊樣本,為保證與輸入至判別器的真實樣本具備同樣的特征尺度(0~1),采用Sigmoid函數(shù)作為其非線性激活函數(shù).
1.2.2 判別器
判別器主要用于判斷其輸入樣本是否真實,其本質上是一個二分類器,GMCW-GAN 中判別器的網(wǎng)絡結構包括2 層卷積層(C1、C2)、展平層(F3)與2 層全連接層(FC4、FC5),如圖3 所示.
圖3 判別器網(wǎng)絡結構Fig.3 Network structure of discriminator
判別器的輸入用真實攻擊樣本或生成器生成的攻擊樣本與樣本標簽約束的聯(lián)合嵌入表示;通過C1 與C2 提取樣本特征;利用F3 將C2 的輸出展平為向量;進一步用FC4 與FC5 提取特征,同時縮減向量長度,最終得到單個元素的輸出.C1、C2 與FC4中的非線性激活函數(shù)采用LeakyRelu,應用沃瑟斯坦距離作為優(yōu)化目標,因此,F(xiàn)C5 的輸出無須進行非線性激活.
為驗證GMCW-GAN 的性能,首先,介紹ETCN半實物實驗平臺,給出攻擊數(shù)據(jù)的獲取方式;其次,給出相應評價指標,并介紹實驗測試環(huán)境與相關超參數(shù)配置;最后,通過多角度的實驗,驗證GMCWGAN 的攻擊樣本生成能力.
本文對照某型ETCN 列車的實車網(wǎng)絡拓撲,搭建ETCN 半實物實驗平臺,根據(jù)相關資料在平臺中模擬配置了車輛正常通信進程,在此基礎上將安裝了攻擊模擬軟件的攻擊節(jié)點接入至交換機,從而開展模擬攻擊實驗.實驗環(huán)境如圖4 所示.
圖4 ETCN 半實物實驗平臺Fig.4 Hardware-in-the-loop experimental platform of ETCN
本文提出的GMCW-GAN 生成樣本類型主要取決于輸入的真實樣本類型.為了驗證其生成能力,本節(jié)采取的思路為:總結ETCN 可能面臨的典型攻擊,開展模擬攻擊實驗,從而獲取相應的數(shù)據(jù),用于驗證GMCW-GAN 的生成能力.
作者的前期研究中總結了ETCN 可能面臨的3 大類主要攻擊有探測類攻擊、拒絕服務類攻擊、中間人類攻擊[14],因此,本文向實驗平臺注入3 大類攻擊中的8 種典型攻擊來構造訓練數(shù)據(jù)集,包括屬于探測類攻擊的IP 掃描、端口掃描與漏洞掃描,屬于拒絕服務類攻擊的UDP(user datagram protocol)泛洪,TCP(transmission control protocol)泛洪,屬于中間人類攻擊的ARP(address resolution protocol)欺騙、篡改與重放.
為便于比較GMCW-GAN 生成的樣本與真實樣本的質量,通過2 個步驟構建2 個ETCN 攻擊數(shù)據(jù)集.
步驟1通過攻擊模擬實驗構造1 個樣本充足的基準ETCN 攻擊數(shù)據(jù)集,稱為TADS(train attack dataset),其數(shù)據(jù)分布見表1.
表1 TADS 的樣本分布Tab.1 Sample distribution of TADS
步驟2維持TADS 中正常報文數(shù)量不變,在其各類攻擊樣本中隨機抽取500 個樣本,構造小樣本的ETCN 攻擊數(shù)據(jù)集,稱為TADS-F,其數(shù)據(jù)分布見表2.
表2 TADS-F 的樣本分布Tab.2 Sample distribution of TADS-F
TADS 中,正常報文與攻擊報文均有上萬個樣本,數(shù)量充足,同時其數(shù)量比約為5.5∶4.5,分布平衡.TADS-F 中,正常報文數(shù)量充足,但攻擊報文數(shù)量稀少,其數(shù)量比約為9.6∶0.4,分布不平衡.
生成樣本的目的是給入侵檢測模型的訓練提供更多有效信息,因此,本節(jié)通過入侵檢測性能來評價GMCW-GAN 的攻擊樣本生成能力.小樣本條件下主要關注正類樣本(攻擊)是否能被正確檢測.查準率P是指所有檢測為攻擊的樣本中真正為攻擊的比例,反映了對攻擊樣本的檢測精準度;查全率R是指所有攻擊樣本中被正確檢測為攻擊的比例,反映了對攻擊樣本的檢測完整度;F1分數(shù)是P與R的調和平均,如式(11)所示,可綜合反映對攻擊樣本的檢測能力.
虛警率(FPR)是指被錯誤檢測為攻擊的正常樣本占所有正常樣本的比例,虛警率越低,模型對正樣本的預測純度越高,性能越好,如式(12).
式中:FP為被誤檢的正常樣本數(shù)量,TN為被正確檢測的正常樣本數(shù)量.
攻擊樣本生成實驗與入侵檢測實驗在以下配置環(huán)境中實施:1)硬件,AMD Ryzen 5 1600X CPU@3.60 GHz,32 GB RAM,NVIDIA GeForce GTX 1060 6 GB GPU;2)軟件,Windows 10 操作系統(tǒng),Keras 2.5.0,CUDA 10.2.95.
GMCW-GAN 采用RMSProp 作為優(yōu)化器,學習率設置為0.001,小批量大小為32 個,隨機變量設置為128 維向量,梯度懲罰項為10,μi與 σi賦以隨機初值(由于共有8 類攻擊樣本,因此i樣本標簽為1~8 的整數(shù).
深度神經(jīng)網(wǎng)絡(DNN)是一種具有代表性的深度學習方法,在入侵檢測領域取得了良好的應用效果[15],其網(wǎng)絡結構如圖5 所示.該模型的主要原理為:將入侵檢測任務轉化為深度學習中的分類任務,將模型視為實現(xiàn)函數(shù)關系擬合的分類器,通過從隱含層到輸出層的逐層擬合,建立輸入(樣本的特征表示)與輸出(預測的類別)之間的映射關系,通過該映射關系即可實現(xiàn)對輸入樣本的類別預測,從而實現(xiàn)入侵檢測.所構建的模型具有3 層隱含層,其神經(jīng)元數(shù)分別為512、256、128 個,激活函數(shù)為ReLU,損失函數(shù)為交叉熵損失,優(yōu)化器采用SGD,學習率為0.002,小批量大小為64,遍歷次數(shù)epoch 為30 次,檢測的總類別數(shù)C=9(包含正常類).
圖5 入侵檢測模型的結構Fig.5 Network structure of intrusion detection model
開展實驗之前,首先對原始數(shù)據(jù)進行預處理:提取TADS 中網(wǎng)絡報文的主要報頭信息作為樣本特征,包括以太網(wǎng)頭、IP 頭、UDP 頭、TCP 頭、ICMP頭、ARP 頭以及TRDP 頭的各關鍵字段;用-1 填充樣本中的缺失值;使用獨熱碼(one-hot)將類別型特征轉換為數(shù)值型;使用最大最小歸一化對全部特征值進行標準化處理.基于預處理后的TADS,通過2.1 節(jié)中的方式構造TADS-F.
為多角度驗證GMCW-GAN 的性能,共開展了下述4 類實驗.
2.4.1 樣本生成實驗
訓練GMCW-GAN 模型,按需生成少數(shù)類攻擊樣本從而構造大樣本平衡攻擊數(shù)據(jù)集.
步驟1從高斯混合模型中生成128 維的隨機向量z,從TADS-F 中獲取真實攻擊樣本x,將z與x分別與樣本標簽y進行聯(lián)合嵌入,得到帶條件約束的輸入向量z|y與真實樣本x|y.
步驟2將z|y輸入生成器,得到一批生成的攻擊樣本G(z|y) .
步驟3固定生成器參數(shù),將x|y與G(z|y) 輸入判別器,訓練判別器.
步驟4固定判別器參數(shù),將z|y輸入生成器,訓練生成器,得到新的G(z|y) .
步驟5循環(huán)步驟3 與步驟4,對整體模型進行對抗訓練,直至收斂,從而完成訓練.
步驟6按照y從1~8 的順序,將z|y輸入訓練好的生成器,對每類攻擊各生成9 500 個樣本,得到大樣本數(shù)據(jù)集(TADS-L),其分布見表3.
表3 TADS-L 的樣本分布Tab.3 Sample distribution of TADS-L
數(shù)據(jù)集中的網(wǎng)絡報文為高維樣本,無法直觀地觀察,使用t分布隨機鄰域嵌入(t-SNE)[16],將真實樣本與生成樣本映射為三維空間中的點以觀察其分布,如圖6 所示.
圖6 真實樣本與生成樣本的三維空間表示Fig.6 3D representation of real and generated samples
圖6 中紅色散點與藍色散點分別代表真實攻擊樣本與生成樣本的三維表示,可以看到:GMCWGAN 生成樣本與真實樣本高度相似,這初步證明了GMCW-GAN 的生成能力.當然,該結果是由初步的視覺觀察得到的,由于t-SNE 實現(xiàn)的是對空間特征的維度映射,并不完全反映數(shù)據(jù)在高維空間的真實情況,因此,仍需通過下述實驗進一步驗證生成樣本的質量.
2.4.2 驗證生成樣本對入侵檢測性能影響的實驗
通過比較用TADS、TADS-F 與TADS-L 分別訓練的DNN 入侵檢測模型在相同測試集上的性能差異,來驗證GMCW-GAN 生成的攻擊樣本對入侵檢測性能的影響.從TADS 中對各類別均勻分層抽樣獲取測試集,每類1 000 個,共計7 000 個測試數(shù)據(jù).用TADS、TADS-F 與TADS-L 分別訓練DNN入侵檢測模型,3 個模型在測試集上測試得到的F1分數(shù)見圖7,虛警率分別為12.7%、11.2%、12.4%.
圖7 TADS、TADS-F、TADS-L 數(shù)據(jù)集分別訓練的DNN 入侵檢測模型的F1 分數(shù)Fig.7 F1 score of DNN intrusion detection models trained by TADS,TADS-F,and TADS-L
對于TADS-DNN 在測試集上的測試結果,在其樣本分布均衡且數(shù)據(jù)量充足的情況下,不同類別攻擊的F1分數(shù)是由其自身特性決定的,不在本文的討論范圍內.可將這一結果作為基準參考,從而排除攻擊本身的檢測難度對比較結果的影響.
TADS-DNN 與TADS-F-DNN 對比發(fā)現(xiàn):后者各類攻擊的F1分數(shù)相較于前者有明顯下降,這是由攻擊樣本數(shù)量減少而導致的模型擬合能力下降引起的;與之相反的是,TADS-F-DNN對正常樣本的檢測能力略有提升,分析其原因可知,正常樣本數(shù)量沒有減少,模型可提取信息仍然充足,同時,由于攻擊樣本數(shù)量減少導致了類不平衡,模型會將其自身學習至擅于識別樣本量大的類別,因此導致了對正常樣本檢測能力的小幅上升;TADS-F-DNN 的虛警率略低于TADS-DNN,這同樣說明訓練時攻擊樣本的減少幾乎不會影響正常樣本的檢測,反而因為引發(fā)的類不平衡現(xiàn)象,略微提高了對正常樣本的識別能力.
根據(jù)圖7 可知:TADS-L-DNN 對攻擊樣本的檢測能力相較于TADS-F-DNN 有明顯提升,對8 類攻擊樣本的F1分數(shù)均有促進作用,使其平均提升了4.23%,這證明GMCW-GAN 生成的攻擊樣本對入侵檢測的檢測準度有明顯的促進作用;TADS-LDNN 的F1分數(shù)與虛警率均非常接近于TADS-DNN,由于TADS-L 與TADS 的數(shù)據(jù)分布相同,其唯一區(qū)別在于樣本真實性不同,這證明了生成的攻擊樣本與真實樣本非常相似;盡管兩者的檢測結果差距很小,但最好的檢測效果仍由TADS-DNN 取得,這表明生成樣本本質上仍是對真實樣本的模擬,只能盡可能地向其逼近.
綜上可知,GMCW-GAN 可以生成非常接近真實攻擊樣本的高質量樣本,可用于擴充小樣本的攻擊數(shù)據(jù),從而提高入侵檢測的檢測能力.
2.4.3 與其他生成方法的性能比較實驗
為進一步驗證GMCW-GAN 的生成能力,開展與其他經(jīng)典方法及前沿方法的對比實驗,其中,經(jīng)典方法包括隨機過采樣(ROS)、SMOTE 與傳統(tǒng)GAN;前沿方法包括文獻[8]與文獻[9]所提出的方法.利用上述多種方法從TADS-F 中生成新的網(wǎng)絡攻擊樣本,分別構造多個大樣本數(shù)據(jù)集,其數(shù)據(jù)分布與TADS-L 相同.以TADS-L 與這多個數(shù)據(jù)集訓練的DNN 入侵檢測模型的測試結果見圖8 與表4.
表4 不同生成方法對入侵檢測模型虛警率的影響對比Tab.4 Comparison of data generation methods affecting FPR of intrusion detection models %
圖8 不同生成方法對入侵檢測F1 分數(shù)的影響對比Fig.8 Comparison of data generation methods affecting F1 score in intrusion detection
從圖8 可知:機制最為簡單的ROS 所生成的攻擊樣本對入侵檢測的促進最少;SMOTE 優(yōu)于ROS,這是由于其應用了K 近鄰方法,使其比隨機采樣更具備信息提取能力;在IP 掃描、端口掃描、漏洞掃描、ARP 欺騙、UDP 泛洪與TCP 泛洪上,傳統(tǒng)GAN表現(xiàn)出比ROS 與SMOTE 更好的生成能力,這證明了傳統(tǒng)GAN 具備更強的樣本生成能力;但其篡改與重放樣本的生成效果劣于SMOTE,導致這一結果的可能原因是傳統(tǒng)GAN 訓練中出現(xiàn)了模式崩塌,使得模型對篡改與重放的擬合能力較低;相比之下,GMCW-GAN 對篡改與重放樣本的生成效果最好,但與其他方法的差距并不突出,導致這一結果的可能原因是篡改與重放樣本同正常樣本在特征上非常相似,因此,入侵檢測模型對這2 類生成樣本并不敏感,表現(xiàn)為F1分數(shù)的變化較小.
參與對比的2 個前沿方法表現(xiàn)出了比經(jīng)典方法更好的效果.GMCW-GAN 取得了全局最優(yōu)的表現(xiàn),其生成的攻擊樣本所訓練的模型在所有攻擊類別上均取得了最佳F1分數(shù),相較于其他方法,GMCWGAN 擁有最佳的攻擊樣本生成能力,將傳統(tǒng)GAN的幾種改進方法、生成器與判別器的優(yōu)化設計綜合在一起后,取得了明顯的優(yōu)化效果.
從表4 可知,不同生成模型生成的樣本對入侵檢測模型的虛警率影響很小,這一結果再一次驗證了2.4.3 節(jié)中的結論,即生成的攻擊樣本主要用于促進入侵檢測模型對攻擊樣本的檢測能力,在正常樣本數(shù)量較大的前提下,生成的攻擊樣本對正常樣本的檢測幾乎沒有影響.
2.4.4 類內實驗
上述實驗從整體視角評估并驗證了本文方法的有效性,本節(jié)則開展類內實驗,具體對比所提出的不同改進對生成樣本的影響,從而驗證各項改進的有效性.
本文共對傳統(tǒng)GAN 進行了3 項改進,其中第2 項改進為約束條件改進,其效果體現(xiàn)在增強實驗人員在樣本生成實驗中的控制力,即能夠通過該改進來控制模型按需生成特定類型的攻擊樣本,因此,該改進對樣本的質量無影響,不參與量化的評估.為評估其他2 項改進,即采樣策略與損失函數(shù)的改進,首先,在GMCW-GAN 中去除這2 項改進,其次,去除一項、保留另一項,從而共建立3 個模型,利用這3 個模型,按照2.4.3 節(jié)的方式開展對比實驗,在入侵檢測實驗中,F(xiàn)1分數(shù)結果如圖9 所示.由于不同生成模型對虛警率的影響已在上文實驗中進行了驗證,因此不再進行對比.
圖9 2 項類內改進方法對入侵檢測的影響對比Fig.9 Comparison of two in-class improvements affecting intrusion detection
通過圖9 可知:采樣策略改進與損失函數(shù)改進對各項攻擊的F1分數(shù)均有促進作用,驗證了對生成樣本的多樣性與真實性的提升效果;對于除篡改與重放外的其他攻擊樣本,損失函數(shù)改進對F1分數(shù)的促進比采樣策略改進更明顯,樣本真實性的提升能夠比多樣性的提升在入侵檢測中帶來更明顯的促進作用;對于篡改與重放,2 項改進對F1分數(shù)的提升較為接近,這2 類攻擊與正常樣本的相似度很高,因此,樣本真實性在其檢測過程中帶來的收益相對受限,表現(xiàn)為多樣性與真實性的促進效果接近.整體而言,包含了2 項改進的完整模型對各類攻擊樣本均具有最佳的F1分數(shù),2 項改進能夠共同促進入侵檢測的檢測準度提升,進一步驗證了2 項改進的有效性.
針對基于深度學習的ETCN 入侵檢測領域面臨的網(wǎng)絡攻擊小樣本問題,對傳統(tǒng)生成對抗網(wǎng)絡進行改進,提出了一種攻擊樣本生成方法GMCW-GAN.該方法使用高斯混合模型、樣本條件約束與沃瑟斯坦距離改進了GAN 的采樣策略、約束條件及損失函數(shù),基于卷積神經(jīng)網(wǎng)絡構建了生成器與判別器.在ETCN 半實物實驗平臺中進行了模擬攻擊實驗以獲取攻擊樣本,利用GMCW-GAN 生成了新的攻擊樣本,通過多角度的實驗證明了GMCW-GAN 可以生成有效的網(wǎng)絡攻擊樣本,可用其擴充模型訓練數(shù)據(jù),進而緩解ETCN 入侵檢測的小樣本問題.