亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

基于可遷移注意力的工控流量域適應(yīng)方法

2022-10-17 13:53:08蘇思達(dá)陳永樂(lè)周自強(qiáng)楊大哲

計(jì)算機(jī)工程與設(shè)計(jì) 2022年10期

蘇思達(dá)，陳永樂(lè)，周自強(qiáng)，楊大哲，郭浩+

(1.太原理工大學(xué) 信息與計(jì)算機(jī)學(xué)院，山西晉中 030600； 2.國(guó)網(wǎng)山西省電力公司電力科學(xué)研究院電網(wǎng)技術(shù)中心，山西太原 030000)

0 引言

基于深度學(xué)習(xí)(DL)的入侵檢測(cè)系統(tǒng)通過(guò)在流量數(shù)據(jù)集中進(jìn)行特征學(xué)習(xí)以實(shí)現(xiàn)對(duì)工業(yè)控制系統(tǒng)的實(shí)時(shí)保護(hù)。由于流量數(shù)據(jù)抓取和標(biāo)簽化的成本限制，現(xiàn)有DL模型在監(jiān)控設(shè)備、協(xié)議、威脅類(lèi)型等持續(xù)變化的工控通訊網(wǎng)絡(luò)中往往性能受限，并且，在一種工控網(wǎng)絡(luò)的標(biāo)簽化數(shù)據(jù)中訓(xùn)練的DL模型難以適用于對(duì)另一種網(wǎng)絡(luò)實(shí)施檢測(cè)[1-4]?，F(xiàn)有研究嘗試采用域?qū)褂?xùn)練網(wǎng)絡(luò)(DANN)[5]以減少DL模型訓(xùn)練所需標(biāo)簽化數(shù)據(jù)的數(shù)量，DANN在域適應(yīng)(DA)的基礎(chǔ)上利用生成式對(duì)抗網(wǎng)絡(luò)(GAN)[6]的博弈原理來(lái)學(xué)習(xí)不同數(shù)據(jù)集間的域不變性映射。然而，DANN將每條流量數(shù)據(jù)籠統(tǒng)地視作一個(gè)整體進(jìn)行傳輸，沒(méi)有利用其細(xì)粒度結(jié)構(gòu)。對(duì)于一條流量數(shù)據(jù)而言，并非所有的特征都是可遷移的，不同特征在遷移任務(wù)中所發(fā)揮的作用也并非完全相同的。并且，由于不同流量數(shù)據(jù)特征之間的數(shù)值及分布差異，單條流量數(shù)據(jù)的整體可遷移性也存在著強(qiáng)弱之分。

為了應(yīng)對(duì)上述挑戰(zhàn)，構(gòu)建了一個(gè)對(duì)抗性DA網(wǎng)絡(luò)來(lái)訓(xùn)練工控入侵檢測(cè)DL模型，并將域適應(yīng)的可遷移注意力(TADA)[7]引入以實(shí)現(xiàn)流量數(shù)據(jù)的跨域細(xì)粒度對(duì)齊。TADA在DANN的基礎(chǔ)上，實(shí)現(xiàn)了基于多個(gè)局部域判別器的局部注意力以及基于全局域判別器的全局注意力。這兩種注意力是互補(bǔ)的，局部注意力被用于突出流量數(shù)據(jù)中可遷移或在域遷移時(shí)影響系數(shù)更高的特征字段；全局注意力被用于從整體上強(qiáng)調(diào)可遷移性更強(qiáng)的單條流量數(shù)據(jù)。此外，PCA被用于實(shí)現(xiàn)數(shù)據(jù)特征的維度映射，這使DA網(wǎng)絡(luò)同樣適用于源域和目標(biāo)域特征空間異構(gòu)的情況。

1 相關(guān)工作

工控入侵檢測(cè)系統(tǒng)根據(jù)數(shù)據(jù)來(lái)源可以劃分為基于主機(jī)的入侵檢測(cè)系統(tǒng)和基于流量的入侵檢測(cè)系統(tǒng)[8]，后者得益于深度神經(jīng)網(wǎng)絡(luò)的成功獲得了更好的發(fā)展。Tiwari等[9]較為全面地評(píng)估了神經(jīng)網(wǎng)絡(luò)、支持向量機(jī)等方法在構(gòu)建入侵檢測(cè)系統(tǒng)時(shí)的性能表現(xiàn)。Kalech等[10]通過(guò)SCADA系統(tǒng)輸入輸出信號(hào)的時(shí)間序列建立系統(tǒng)行為模型，采用隱馬爾可夫模型和神經(jīng)網(wǎng)絡(luò)進(jìn)行異常行為判別。然而這些方法都假設(shè)所提出的模型在足夠多的標(biāo)簽化數(shù)據(jù)上完成訓(xùn)練，并未考慮數(shù)據(jù)缺乏這樣更為嚴(yán)格的現(xiàn)實(shí)環(huán)境。

Singla等[11]評(píng)估了利用Fine-tune方法以少量的訓(xùn)練數(shù)據(jù)構(gòu)建入侵檢測(cè)模型的可能性，他們首先在足夠多的源域數(shù)據(jù)集上進(jìn)行訓(xùn)練，然后在目標(biāo)域上對(duì)模型進(jìn)行微調(diào)，然而，他們不僅假設(shè)了源域和目標(biāo)域具有相同特征空間的理想場(chǎng)景，而且其效果會(huì)受到模型復(fù)雜度的影響。Zhao等提出了CeHTL等[12]和HeTL等[13]遷移學(xué)習(xí)框架，將其用于訓(xùn)練目標(biāo)域中沒(méi)有標(biāo)簽化數(shù)據(jù)的NID模型，他們的框架適用于同構(gòu)和異構(gòu)的DA案例，但是在目標(biāo)數(shù)據(jù)集上的檢測(cè)精度并不高。得益于對(duì)抗思想對(duì)訓(xùn)練過(guò)程的增強(qiáng)，DANN能夠在一定程度上提高模型的精度。Zhang等[14]采用DANN訓(xùn)練入侵檢測(cè)系統(tǒng)并將其應(yīng)用于智能電網(wǎng)中以檢測(cè)惡意攻擊；類(lèi)似地，Singla等[15]在跨域數(shù)據(jù)特征空間類(lèi)似和不同兩種情況下利用DANN訓(xùn)練了一個(gè)高精度的入侵檢測(cè)DL模型，并在NSL-KDD數(shù)據(jù)集上評(píng)估了其表現(xiàn)。然而，他們的方法所建立的跨域傳輸通道是粗粒度的，并未考慮工控通訊網(wǎng)絡(luò)的復(fù)雜性。

據(jù)我們所知，在工控領(lǐng)域，本文是第一個(gè)使用對(duì)抗性DA的方法在數(shù)據(jù)集有限的情況下訓(xùn)練入侵檢測(cè)DL模型，并針對(duì)流量數(shù)據(jù)實(shí)現(xiàn)了跨域細(xì)粒度對(duì)齊的。

2 同構(gòu)特征空間

工控系統(tǒng)的SCADA網(wǎng)絡(luò)層數(shù)據(jù)特征可分為網(wǎng)絡(luò)流量特征和有效負(fù)載特征。通過(guò)對(duì)Modbus RTU協(xié)議和工業(yè)生產(chǎn)系統(tǒng)的分析，我們發(fā)現(xiàn)，由于不同工控系統(tǒng)的SCADA系統(tǒng)所面向的數(shù)據(jù)以及所監(jiān)控設(shè)備的不同，其Modbus RTU協(xié)議中的有效負(fù)載特征通常是異構(gòu)的，這就造成了源域和目標(biāo)域特征空間的不對(duì)齊，無(wú)法應(yīng)用于DA訓(xùn)練。因此，在數(shù)據(jù)經(jīng)過(guò)清洗、標(biāo)簽化以及標(biāo)準(zhǔn)化之后，本方法采用主成分分析(PCA)的方法對(duì)特征進(jìn)行維度變換，PCA[16]是一種特征提取技術(shù)，它執(zhí)行從高維特征空間到低維特征空間的線性映射。PCA將數(shù)據(jù)集中n個(gè)特征轉(zhuǎn)換為一組新的線性不相關(guān)特征，即主成分。然后按照方差降序來(lái)選擇前k個(gè)主成分來(lái)表征數(shù)據(jù)，即降維后的新特征，這個(gè)過(guò)程會(huì)去除最不重要的主成分。圖1是一個(gè)PCA轉(zhuǎn)換的示例，假設(shè)f1和f2是數(shù)據(jù)集中方差幾乎相等的兩個(gè)特征，PCA將這兩個(gè)特征轉(zhuǎn)換為兩個(gè)主成分pc1和pc2，其中pc2相較于pc1方差非常小，因此可以刪除pc2，由此，PCA將包含f1和f2的數(shù)據(jù)集轉(zhuǎn)換成了一個(gè)只含有pc1特征的數(shù)據(jù)集。類(lèi)似地，我們可以使用 PCA 來(lái)轉(zhuǎn)換具有更多特征的數(shù)據(jù)集并減少數(shù)據(jù)集的維數(shù)，以構(gòu)造同構(gòu)特征空間，同時(shí)保留數(shù)據(jù)集中的有效信息。

3 基于可遷移注意力的對(duì)抗性域適應(yīng)

本文對(duì)TADA做出針對(duì)流量數(shù)據(jù)的適用性改進(jìn)以實(shí)現(xiàn)不同工控系統(tǒng)SCADA網(wǎng)絡(luò)層數(shù)據(jù)的跨域細(xì)粒度對(duì)齊。相較于DANN，TADA中的可遷移注意力更注重跨域數(shù)據(jù)的相似性和區(qū)別，以此來(lái)推理數(shù)據(jù)以及其特征在遷移過(guò)程中的影響力權(quán)重，這使得整個(gè)DA網(wǎng)絡(luò)能夠有選擇地強(qiáng)調(diào)特征信息，并具備動(dòng)態(tài)校準(zhǔn)的能力。基于可遷移注意力的對(duì)抗性DA網(wǎng)絡(luò)概覽如圖2所示，我們將從局部、全局和網(wǎng)絡(luò)整體可遷移注意力3個(gè)部分進(jìn)行描述。

3.1 局部可遷移注意力

(1)

(2)

(3)

通過(guò)局部注意力，更具有可遷移性的維度將被更大的注意力值加權(quán)，從而使DA模型重點(diǎn)關(guān)注更為重要的維度。由于每一維度的注意力值是根據(jù)其可遷移性生成的，因此這種局部注意力自然可以跨域遷移。

3.2 全局可遷移注意力

與局部可遷移注意力模塊中專(zhuān)注于每一維度的可遷移性以實(shí)現(xiàn)細(xì)粒度遷移不同，全局可遷移注意力進(jìn)一步關(guān)注單條流量數(shù)據(jù)整體的可遷移性。流量數(shù)據(jù)具有復(fù)雜的特征空間，并且在數(shù)據(jù)準(zhǔn)備的過(guò)程中，單條流量數(shù)據(jù)經(jīng)過(guò)了多次變換，這可能使域判別器找到更少的維度進(jìn)行對(duì)齊，但是，該條流量數(shù)據(jù)并不一定具有更小的遷移價(jià)值，因此，全局對(duì)抗模塊的引入是十分有必要的。

本方法將全局對(duì)抗模塊添加至特征Gb(hi)，并將其結(jié)果作為整體輸入分類(lèi)器Gy，全局域判別器的損失函數(shù)可被形式化為

(4)

其中，Gb為瓶頸層，di是xi的域標(biāo)簽，Ld是全局域判別器的交叉熵?fù)p失函數(shù)。

(5)

(6)

其中，c是攻擊標(biāo)簽數(shù)，pi,j是xi屬于標(biāo)簽j的概率。通過(guò)這種方式，全局判別器的輸出被用于突出能在特征空間中更好地遷移的單條流量數(shù)據(jù)的熵。通過(guò)迭代最小化熵懲罰，DL模型對(duì)這些流量數(shù)據(jù)的檢測(cè)分類(lèi)準(zhǔn)確率逐漸收斂于一個(gè)穩(wěn)定值，從而提高了分類(lèi)器的性能。由于每條流量數(shù)據(jù)的注意力值是根據(jù)其可遷移性生成的，因此這種全局注意力自然可以跨域遷移。

3.3 DA網(wǎng)絡(luò)的可遷移注意力

通過(guò)局部可遷移注意力和全局可遷移注意力，流量數(shù)據(jù)每一維度的負(fù)遷移被減輕，單條流量數(shù)據(jù)的正遷移被增強(qiáng)，基于不同維度的多對(duì)抗DA網(wǎng)絡(luò)實(shí)現(xiàn)了從源域到目標(biāo)域的細(xì)粒度傳輸路徑，而集成于全局特征的全局注意力模塊能使分類(lèi)器在流量數(shù)據(jù)經(jīng)過(guò)復(fù)雜變換后正確地預(yù)測(cè)其流量類(lèi)型。和大多數(shù)DA方法類(lèi)似，分類(lèi)器的損失函數(shù)可在標(biāo)簽化的源域數(shù)據(jù)DS上被形式化為

(7)

其中，Ly是交叉熵?fù)p失函數(shù)，Gy是被用于最終進(jìn)行預(yù)測(cè)的分類(lèi)器，即入侵檢測(cè)模型。本文采用基于可遷移注意力的DA方法實(shí)現(xiàn)針對(duì)流量數(shù)據(jù)的更細(xì)粒度的無(wú)監(jiān)督DA，它能夠通過(guò)在一個(gè)端到端的深度架構(gòu)中集成深度特征學(xué)習(xí)、全局DA、局部DA和可遷移注意力機(jī)制來(lái)聯(lián)合學(xué)習(xí)可遷移流量特征并訓(xùn)練自適應(yīng)的入侵檢測(cè)DL模型。最終，基于可遷移注意力的DA模型被表示為

(8)

4 實(shí)驗(yàn)與分析

本節(jié)詳細(xì)說(shuō)明了我們實(shí)驗(yàn)的數(shù)據(jù)集信息，實(shí)驗(yàn)的參數(shù)、設(shè)計(jì)信息以及評(píng)判標(biāo)準(zhǔn)等。此外，我們還分析了兩種注意力機(jī)制在本方法中所發(fā)揮的作用。

4.1 數(shù)據(jù)集

我們使用了密西西比州立大學(xué)建立的工控入侵檢測(cè)標(biāo)準(zhǔn)數(shù)據(jù)集來(lái)評(píng)估本研究提出的方法[17]。數(shù)據(jù)來(lái)源為天然氣管道控制系統(tǒng)(G)和儲(chǔ)水箱控制系統(tǒng)(W)的SCADA網(wǎng)絡(luò)層數(shù)據(jù)。這兩個(gè)工控系統(tǒng)均采用Modbus RTU協(xié)議進(jìn)行通信。數(shù)據(jù)集中的屬性值均是由十進(jìn)制和十六進(jìn)制數(shù)構(gòu)成。其中G中含有97 019條數(shù)據(jù)，每條數(shù)據(jù)包含26個(gè)特征，W中含有236 179條數(shù)據(jù)，每條數(shù)據(jù)包含23個(gè)特征，G和W的數(shù)據(jù)特征空間是異構(gòu)的。這兩個(gè)數(shù)據(jù)集的攻擊類(lèi)型均為四大類(lèi)：指令注入攻擊、響應(yīng)注入攻擊、拒絕服務(wù)攻擊和偵察攻擊。這四大類(lèi)攻擊還可以細(xì)化成7類(lèi)攻擊。數(shù)據(jù)集的詳細(xì)攻擊描述及分類(lèi)標(biāo)簽見(jiàn)表1。

表1 攻擊類(lèi)型詳細(xì)描述及仿真標(biāo)簽

4.2 實(shí)驗(yàn)設(shè)計(jì)

我們采用簡(jiǎn)單設(shè)計(jì)的DL模型作為實(shí)驗(yàn)中的基線模型，并且采用Zhang等[14]的DANN模型與所提出的方法進(jìn)行比較，基線模型同時(shí)也作為DANN和本方法中的DL分類(lèi)模型。注意，之前的研究[15]已經(jīng)論證了Fine-Tune[11]方法在目標(biāo)域數(shù)據(jù)量較小時(shí)的性能不足以及在異構(gòu)遷移學(xué)習(xí)時(shí)的局限性，因此本方法不再將Fine-Tune作為重點(diǎn)討論對(duì)象。

為了全面地評(píng)估我們所提出方法的適用性，我們?cè)趯?shí)驗(yàn)中考慮了如下兩種場(chǎng)景：

場(chǎng)景1：我們?cè)u(píng)估了在一個(gè)工控系統(tǒng)網(wǎng)絡(luò)層數(shù)據(jù)上訓(xùn)練的入侵檢測(cè)DL模型針對(duì)另一系統(tǒng)的檢測(cè)情況。出于客觀性考慮，我們將分別在G→W和W→G 兩個(gè)流量數(shù)據(jù)遷移任務(wù)上評(píng)估所有的方法。在G→W中，參與評(píng)估的方法將在帶標(biāo)簽的G中訓(xùn)練，在去標(biāo)簽的W中測(cè)試。源域和目標(biāo)域在W→G中與在G→W中相反。

場(chǎng)景2：我們將在該場(chǎng)景中分析一種更為典型的情況，例如，某電力工控系統(tǒng)網(wǎng)絡(luò)層包含了8種類(lèi)型的流量數(shù)據(jù)，其入侵檢測(cè)DL模型基于這些數(shù)據(jù)訓(xùn)練并且分類(lèi)精度良好，隨后該網(wǎng)絡(luò)空間出現(xiàn)了一種新的攻擊流量，該系統(tǒng)僅能從這個(gè)攻擊類(lèi)別中收集數(shù)量有限的數(shù)據(jù)樣本。我們將在場(chǎng)景2中評(píng)估3種方法所訓(xùn)練的DL模型能否對(duì)新的攻擊流量做出正確識(shí)別。我們將在擁有更多數(shù)據(jù)量的W中實(shí)施場(chǎng)景2的實(shí)驗(yàn)。

4.3 參數(shù)與度量標(biāo)準(zhǔn)

我們采用開(kāi)源庫(kù)Pytorch訓(xùn)練所提出的方法以及其它對(duì)比方法。我們使用100個(gè)epoch來(lái)訓(xùn)練基線模型，并將批大小設(shè)置為32，對(duì)于本方法，我們訓(xùn)練10 000次迭代，同樣將批大小設(shè)置為32。我們?yōu)樯窠?jīng)網(wǎng)絡(luò)模型和所提出的DA方法采用自適應(yīng)學(xué)習(xí)率優(yōu)化算法Adam進(jìn)行梯度優(yōu)化，并將起始學(xué)習(xí)率設(shè)置為0.001，β1=0.9,β2=0.999。在整個(gè)實(shí)驗(yàn)過(guò)程中，我們將式(8)中的平衡參數(shù)設(shè)置為λ=1.0,γ=0.1。此外，為了同構(gòu)G和W的特征空間，我們采用PCA的方法將兩個(gè)數(shù)據(jù)集降維至d=20。

為了描述經(jīng)過(guò)訓(xùn)練的分類(lèi)模型性能，我們使用精度(ACC)評(píng)判正確預(yù)測(cè)所占的比重

(9)

并采用F-score(F1)作為準(zhǔn)確率和召回率的調(diào)和平均，較為全面地評(píng)價(jià)模型性能

(10)

其中，TP為正確分類(lèi)的良性樣本數(shù)，TN為正確分類(lèi)的攻擊樣本數(shù)，F(xiàn)P為錯(cuò)誤分類(lèi)的良性樣本數(shù)，F(xiàn)N為錯(cuò)誤分類(lèi)的攻擊樣本數(shù)， P=TP/(TP+FP) 為精確率， R=TP/(TP+FN) 為召回率。

4.4 實(shí)驗(yàn)結(jié)果與分析

我們用于對(duì)比的基線模型共由9層組成，其中有3組全連接層、一個(gè)批量歸一化層和一個(gè)相互堆疊的reLU激活層，全連接層依次具有64、32、16個(gè)神經(jīng)元，輸出層具有兩個(gè)神經(jīng)元并由soft-max函數(shù)激活，用于給出給定樣本屬于攻擊或良性類(lèi)別的預(yù)測(cè)概率，即DL模型被訓(xùn)練為能區(qū)分良性和攻擊樣本的二分類(lèi)模型。在場(chǎng)景1中，基線模型在源域中訓(xùn)練，在目標(biāo)域中測(cè)試以評(píng)估其整體跨域表現(xiàn)；而在場(chǎng)景2具體情境中，基線模型將在目標(biāo)域中進(jìn)行訓(xùn)練。

4.4.1 場(chǎng)景1

我們?cè)赪→G和G→W兩個(gè)流量數(shù)據(jù)遷移任務(wù)中評(píng)估了基線模型、DANN，以及本方法對(duì)表1中的7種攻擊流量和正常流量跨域檢測(cè)的性能表現(xiàn)，其結(jié)果見(jiàn)表2。無(wú)論是從精度還是F-score上都可以看出，本方法在跨域任務(wù)中的優(yōu)越性是明顯的。值得注意的是，在G→W中，源域中多類(lèi)流量數(shù)據(jù)的數(shù)量都遠(yuǎn)小于目標(biāo)域數(shù)據(jù)，這意味著模型從源域中學(xué)習(xí)特征的難度更大，從特征中獲取的域遷移信息更少，因此，相較于W→G，在G→W中3種模型的性能表現(xiàn)有所下降，其中，由于基線模型沒(méi)有為跨域檢測(cè)做任何的準(zhǔn)備，下降幅度最大，而由于本方法采用的兩種注意力機(jī)制使模型能夠有效地執(zhí)行特征的動(dòng)態(tài)重校準(zhǔn)，能夠在全局和局部匹配源和目標(biāo)流量數(shù)據(jù)分布的復(fù)雜多模態(tài)結(jié)構(gòu)，從更困難的環(huán)境中學(xué)習(xí)更多的可遷移特征，因此本方法能夠?qū)⒃趦蓚€(gè)任務(wù)中的準(zhǔn)確度差值保持在1.7%以?xún)?nèi)，F(xiàn)-score差值保持在0.4%以?xún)?nèi)，均領(lǐng)先于DANN和基線模型，具有更強(qiáng)的穩(wěn)定性。這種數(shù)據(jù)量的差異所產(chǎn)生的影響在3種DL模型對(duì)包括良性樣本在內(nèi)的每種流量的檢出率中體現(xiàn)得更為直觀，如圖3所示。從圖中明顯可以看出，基線模型和DANN對(duì)NMRI、MSCI、MFCI的檢出率具有比本方法更為劇烈的下降幅度。

表2 場(chǎng)景1中3種模型的性能表現(xiàn)

我們?cè)?0 000次迭代內(nèi)觀察并分析了3種方法的收斂效率。與基線模型相比，本方法的優(yōu)勢(shì)在訓(xùn)練過(guò)程初期就十分明顯，即使是在學(xué)習(xí)成本相對(duì)較低的W→G中，基線模型與本方法的精度差異在1500次迭代時(shí)就達(dá)到了0.047，并且其差值仍在逐漸增加。DANN在約4000次迭代之前與本方法的精度差異維持在0.009～0.018之間，然而，由于本方法對(duì)特征更深層次的提取，在第4500次迭代后，DANN的收斂效率明顯降低。此外，本方法在約9000次迭代后就逐漸收斂，基線模型和DANN仍未趨于穩(wěn)定，這表明我們對(duì)可遷移特征的處理是輕量級(jí)的。

場(chǎng)景1的結(jié)果還揭示了一個(gè)現(xiàn)象，像基線模型這一類(lèi)在傳統(tǒng)入侵檢測(cè)中具有較淺層機(jī)器學(xué)習(xí)模型更出色的檢驗(yàn)效果的深層DL模型，在相對(duì)較少的流量數(shù)據(jù)中訓(xùn)練后仍然無(wú)法在遷移任務(wù)中保持較高的精度，這驗(yàn)證了即使深層DL模型在特征學(xué)習(xí)中更具優(yōu)勢(shì)，也無(wú)法有效地消除跨域差異，這意味著現(xiàn)有工控系統(tǒng)在仍然具有安全隱患，也驗(yàn)證了我們所做工作的意義。

4.4.2 場(chǎng)景2

我們將W分為源域數(shù)據(jù)和目標(biāo)域數(shù)據(jù)，其中，源域數(shù)據(jù)包含來(lái)自6個(gè)攻擊樣本的標(biāo)簽化數(shù)據(jù)，目標(biāo)域則包含來(lái)自其余一個(gè)攻擊樣本的去標(biāo)簽數(shù)據(jù)，目標(biāo)域和源域都含有正常的攻擊流量。為了保證實(shí)驗(yàn)結(jié)果的通用性，我們?cè)赪中的四大類(lèi)攻擊中分別選擇一種并重復(fù)上述操作，其中包括指令注入攻擊MPCI、響應(yīng)注入攻擊CMRI、拒絕服務(wù)攻擊DoS和偵察攻擊Recon。我們還針對(duì)不同的目標(biāo)域數(shù)據(jù)量執(zhí)行此操作，以顯示數(shù)據(jù)量的大小對(duì)目標(biāo)模型精度的影響，由于這4種攻擊樣本在W中的總數(shù)不同，我們對(duì)數(shù)據(jù)量的劃分終點(diǎn)也有所不同，為了保證對(duì)比的有效性，我們對(duì)4種攻擊劃分的前4個(gè)量級(jí)都分別為100，200，500，1000。圖4展示了在場(chǎng)景2中基線模型、DANN以及本方法對(duì)CMRI、Recon、MPCI、DoS的檢測(cè)精度和F-score。x軸表示用于訓(xùn)練的目標(biāo)數(shù)據(jù)集樣本數(shù)，y 軸表示在目標(biāo)測(cè)試數(shù)據(jù)集上測(cè)試分類(lèi)模型時(shí)的準(zhǔn)確率和 F-score值。對(duì)于響應(yīng)注入攻擊CMRI來(lái)說(shuō)，在目標(biāo)域樣本量只有100的時(shí)候，我們觀察到本方法在精度方面分別優(yōu)于基線模型和DANN8.08%和2.33%，在F-score值方面分別優(yōu)于基線模型和DANN9.12%和4.33%。在其它3個(gè)攻擊類(lèi)別中，我們觀察到了類(lèi)似的結(jié)果。當(dāng)使用少量數(shù)據(jù)樣本訓(xùn)練時(shí)，相較于DANN和本方法，基線模型明顯的低性能表現(xiàn)是由于其極度過(guò)擬合現(xiàn)象。在少量數(shù)據(jù)樣本上訓(xùn)練的DL模型能夠?qū)τ?xùn)練集進(jìn)行有效分類(lèi)，但是無(wú)法很好地泛化到其它未知數(shù)據(jù)上。而DANN和本方法本質(zhì)上使用源數(shù)據(jù)集樣本來(lái)擴(kuò)充目標(biāo)數(shù)據(jù)集并將它們投影到一個(gè)公共的潛在子空間中，從而緩解了由于訓(xùn)練數(shù)據(jù)量非常少而導(dǎo)致的過(guò)擬合問(wèn)題。

此外，相比于DANN，在目標(biāo)域樣本量越少的情況下，本方法的優(yōu)勢(shì)就更加明顯，這是由于本方法通過(guò)局部和全局注意力更有效地從數(shù)據(jù)中掌握域遷移的關(guān)鍵信息，并減少不相關(guān)信息的干擾，以更小的學(xué)習(xí)成本獲得更好的性能。

在場(chǎng)景2中，我們觀察到，當(dāng)目標(biāo)域樣本數(shù)足夠(大于1000)時(shí)，DANN和本方法具有與場(chǎng)景1類(lèi)似的收斂效率表現(xiàn)，而當(dāng)目標(biāo)域樣本量不充分時(shí)，DANN即使在訓(xùn)練初期也難以與本方法維持類(lèi)似的精度，這意味著當(dāng)未知攻擊出現(xiàn)時(shí)，DANN對(duì)攻擊的響應(yīng)實(shí)時(shí)性更差，而本方法則能夠通過(guò)少量迭代做出更準(zhǔn)確的判斷，具有更強(qiáng)的適用性。

我們還測(cè)試了DANN和本方法在針對(duì)上述4類(lèi)攻擊訓(xùn)練后在源域數(shù)據(jù)集上的表現(xiàn)，即DL模型在包含除測(cè)試樣本外的6類(lèi)良性和攻擊樣本的舊數(shù)據(jù)集上的準(zhǔn)確率。由于在目標(biāo)域上訓(xùn)練的基線模型在源域上的分類(lèi)表現(xiàn)太差，不具有參考價(jià)值，所以我們未將其考慮在內(nèi)，我們將在之后用一種樸素的方式對(duì)其進(jìn)行評(píng)估。用DANN和本方法訓(xùn)練的分類(lèi)模型的精度結(jié)果見(jiàn)表3，我們觀察到，本方法在源域上保持了88%～94%的精度，而DANN的表現(xiàn)是相對(duì)不穩(wěn)定的。這表明我們的方法不僅在目標(biāo)域上表現(xiàn)良好，而且在源域上也非常準(zhǔn)確，意味著其能夠檢測(cè)在目標(biāo)域中看到的新攻擊以及在源域中看到的舊攻擊，更具實(shí)用價(jià)值。

為了更加全面的對(duì)基線模型做出評(píng)估，我們將源域和目標(biāo)域數(shù)據(jù)結(jié)合為單個(gè)訓(xùn)練集，用于基線模型的訓(xùn)練，此基礎(chǔ)上，我們進(jìn)行了額外的實(shí)驗(yàn)。結(jié)果表明，在這種不考慮域遷移的情況下，基線模型在源域上獲得了出色的檢測(cè)精度和F-score，盡管如此，當(dāng)目標(biāo)域數(shù)據(jù)量很小的時(shí)候，基線模型的性能和本方法具有一定的差距。當(dāng)使用源域數(shù)據(jù)集和目標(biāo)域數(shù)據(jù)集的100個(gè)樣本進(jìn)行CMRI、Recon、MPCI、DoS組合訓(xùn)練時(shí)，在目標(biāo)域數(shù)據(jù)的精度方面，本方法分別優(yōu)于基線模型8.12%、7.56%、5.91%和7.04%。注意，這種評(píng)估方式實(shí)質(zhì)上模擬了一種傳統(tǒng)情況：當(dāng)出現(xiàn)了新的攻擊類(lèi)型時(shí)，工控系統(tǒng)抓取少量該攻擊的流量數(shù)據(jù)并將其簡(jiǎn)單標(biāo)記為攻擊流量，然后將這些數(shù)據(jù)加入訓(xùn)練集并對(duì)DL模型重新進(jìn)行訓(xùn)練、部署以從正常流量中識(shí)別出這些攻擊流量。我們的實(shí)驗(yàn)結(jié)果表明這種簡(jiǎn)單做法是存在風(fēng)險(xiǎn)的，也驗(yàn)證了在工控系統(tǒng)中對(duì)流量數(shù)據(jù)進(jìn)行域遷移的必要性。

4.5 局部與全局可遷移注意力

為了進(jìn)一步探究并區(qū)分局部和全局可遷移注意力在流量數(shù)據(jù)遷移中的作用，我們用DA(局部)表示本方法中基線模型、局部注意力模塊以及熵模塊的組合；用DA(全局)表示本方法中基線模型、全局注意力模塊以及熵模塊的組合，并在場(chǎng)景2中對(duì)偵察攻擊Recon進(jìn)行了實(shí)驗(yàn)，同樣地，我們將結(jié)果與基線模型和DANN進(jìn)行比較，見(jiàn)表4。

表3 用DANN和本方法訓(xùn)練的DL模型在源數(shù)據(jù)集上的準(zhǔn)確度表現(xiàn)

表4 5種模型所訓(xùn)練的DL模型對(duì)Recon的檢測(cè)精度表現(xiàn)

結(jié)果表明，DA(局部)和DA(全局)都比基線模型具有顯著提升，但是在更困難的情況下(目標(biāo)域樣本過(guò)少)DA(局部)比DA(全局)和DANN的表現(xiàn)要更差。局部注意力關(guān)注流量數(shù)據(jù)遷移的細(xì)粒度的維度信息，而在目標(biāo)域樣本數(shù)量較少的情況下，數(shù)據(jù)能夠提供給局部注意力模塊的信息略顯匱乏，而全局注意力能夠更快地從整體強(qiáng)調(diào)流量數(shù)據(jù)的可遷移信息，很好地彌補(bǔ)了局部注意力的不足。因此，將兩種注意力結(jié)合使用，使其相互補(bǔ)足的本方法擁有最出色的表現(xiàn)。

5 結(jié)束語(yǔ)

隨著工控系統(tǒng)的發(fā)展以及攻擊手段的多樣化，傳統(tǒng)入侵檢測(cè)技術(shù)在動(dòng)態(tài)的工控網(wǎng)絡(luò)環(huán)境中性能的局限性日益突出。遷移學(xué)習(xí)中的相關(guān)技術(shù)手段對(duì)入侵檢測(cè)模型適應(yīng)性的改進(jìn)是明顯的，然而，現(xiàn)有研究忽視了工控流量數(shù)據(jù)結(jié)構(gòu)的復(fù)雜性，導(dǎo)致域遷移的效果十分有限。本文基于遷移學(xué)習(xí)中的DA技術(shù)，構(gòu)建了一個(gè)對(duì)抗性DA網(wǎng)絡(luò)來(lái)訓(xùn)練入侵檢測(cè)DL模型，并將TADA引入，分別在數(shù)據(jù)的維度和整體兩個(gè)層面對(duì)流量域遷移過(guò)程進(jìn)行優(yōu)化以構(gòu)建更細(xì)粒度的遷移通道。在跨層檢測(cè)和未知攻擊檢測(cè)兩種場(chǎng)景中的實(shí)驗(yàn)結(jié)果表明，本方法不僅嚴(yán)格保障了檢測(cè)精度，也更能滿(mǎn)足工控入侵檢測(cè)系統(tǒng)對(duì)于實(shí)時(shí)性和穩(wěn)定性的要求。未來(lái)，我們將開(kāi)展DA網(wǎng)絡(luò)中特征提取器的相關(guān)研究，旨在從多個(gè)層面增強(qiáng)流量特征信息的表征能力，進(jìn)一步提升工控入侵檢測(cè)模型的性能。