韓 晨 劉愛軍 牛英滔 李永貴 童新海
1.國防科技大學(xué)第六十三研究所 江蘇南京 210007 2.陸軍工程大學(xué)通信工程學(xué)院 江蘇南京 210007
電磁頻譜安全是維護(hù)國家安全的重要保障[1-2].2012年,美軍基于認(rèn)知思想提出認(rèn)知電子戰(zhàn),其目的是通過研究新的干擾樣式,改善干擾效果,提高頻譜優(yōu)勢[3].近年來,干擾智能化的相關(guān)研究得益于認(rèn)知理論的迅速發(fā)展而逐漸深入,并引起了學(xué)術(shù)界的廣泛討論,對其研究熱情也日益高漲.Roberto D P 等指出認(rèn)知干擾應(yīng)具備認(rèn)知無線電的能力,可以通過感知學(xué)習(xí)來選擇最佳的干擾策略[4].武忠國研究了認(rèn)知電子戰(zhàn)中干擾波形的設(shè)計(jì)問題[5].吳劍鋒等基于遺傳算法提出認(rèn)知引擎以優(yōu)化干擾決策[6].Pelechrinis K 等提出認(rèn)知干擾機(jī)應(yīng)針對通信協(xié)議的薄弱環(huán)節(jié)施加干擾,以實(shí)現(xiàn)最大的干擾收益[7].在現(xiàn)有文獻(xiàn)的表述中,認(rèn)知干擾與智能干擾在內(nèi)涵與外延上有較多重疊,故本文將認(rèn)知干擾納入智能干擾范疇.Yang H 等提出可以快速學(xué)習(xí)用戶的通信規(guī)律,并及時調(diào)整干擾功率以最大化干擾收益的智能干擾模型[8].Pirzadeh H 等研究的智能干擾針對訓(xùn)練階段和傳輸階段施加干擾攻擊,以降低MIMO 系統(tǒng)性能[9].Sheikhi A 等根據(jù)對信道信息的探測,設(shè)計(jì)智能干擾信號攻擊MIMO 系統(tǒng)[10].Han B 等研究的智能干擾充分利用信號特征以施加干擾攻擊,兼具壓制干擾和欺騙干擾的干擾效果[11].文獻(xiàn)[12-14]研究的智能干擾可以針對通信系統(tǒng)的糾錯編碼性能、通信信號的幀結(jié)構(gòu)以及調(diào)制方式,實(shí)行相應(yīng)的最佳干擾.文獻(xiàn)[15-16]研究的智能干擾機(jī)可以通過經(jīng)驗(yàn)積累和環(huán)境監(jiān)測主動調(diào)整干擾策略.
許多優(yōu)秀的工作針對干擾智能化進(jìn)行了廣泛的研究,隨著強(qiáng)化學(xué)習(xí)(reinforcement learning,RL)技術(shù)在通信領(lǐng)域的廣泛應(yīng)用,干擾智能化的相關(guān)研究進(jìn)一步深化.Amuru S D 等采用強(qiáng)化學(xué)習(xí)技術(shù),使干擾機(jī)在未知的電磁環(huán)境中學(xué)習(xí)對方的通信行為,并自適應(yīng)調(diào)整干擾參數(shù)以實(shí)現(xiàn)最佳干擾[17].Han C 等通過強(qiáng)化學(xué)習(xí)技術(shù),調(diào)整多個智能干擾機(jī)的部署位置以實(shí)現(xiàn)高效干擾[18].楊鴻杰等基于強(qiáng)化學(xué)習(xí)技術(shù),提出了一種智能干擾算法以達(dá)到跟蹤干擾的目的[19].裴緒芳等基于隨機(jī)森林,提出一種智能干擾算法[20],通過在線學(xué)習(xí)實(shí)現(xiàn)對通信規(guī)律的學(xué)習(xí),并實(shí)現(xiàn)高效干擾.張柏開等提出一種基于強(qiáng)化學(xué)習(xí)的認(rèn)知干擾決策方法,能夠自主優(yōu)化干擾效果[21].Xiao L 等研究的智能干擾可以根據(jù)正在進(jìn)行的通信活動,靈活調(diào)整干擾策略[22-23].Lu X 等研究的智能干擾可以通過對網(wǎng)絡(luò)狀態(tài)的估計(jì),優(yōu)化干擾信道和干擾功率選擇[24].這些干擾機(jī)在與通信方的通信對抗中,通過經(jīng)驗(yàn)積累或者探索學(xué)習(xí)得到“干擾知識”,并進(jìn)行干擾決策,動態(tài)適應(yīng)因?yàn)橥ㄐ艑苟鴮?dǎo)致的電磁環(huán)境的局部改變,以提高自身效益.以強(qiáng)化學(xué)習(xí)為代表的決策技術(shù)使得智能干擾機(jī)可以在與環(huán)境的動態(tài)交互中,實(shí)現(xiàn)干擾策略的自適應(yīng)和自優(yōu)化.
此外,博弈論廣泛用于通信對抗的動態(tài)建模.張春磊等指出,可依據(jù)博弈理論優(yōu)化干擾波形,實(shí)施認(rèn)知干擾攻擊[3].Tang L 等引入社會契約,把多干擾機(jī)的干擾決策問題建模為合作干擾博弈,從而求解最佳策略[25].Han C 等研究的干擾機(jī)基于學(xué)習(xí)算法和博弈理論,針對衛(wèi)星互聯(lián)網(wǎng)的關(guān)鍵節(jié)點(diǎn)施加干擾,來提高干擾效率[26].闞保強(qiáng)等提出的智能干擾機(jī)可以感知信道狀態(tài),并將通信對抗建模為Stackelberg 博弈,以一定概率干擾通信鏈路[27].Lu J 等應(yīng)用Stackelberg 博弈建模通信對抗中雙方的動態(tài)交互,所研究的智能干擾機(jī)可以自適應(yīng)調(diào)整干擾策略[28].Han C 等研究的智能干擾體現(xiàn)在干擾機(jī)可以根據(jù)干擾效果調(diào)整干擾動作,依據(jù)學(xué)習(xí)算法和博弈理論實(shí)現(xiàn)智能化干擾[29].Aziz F M等研究的智能干擾可以學(xué)習(xí)LTE 網(wǎng)絡(luò)參數(shù),并將智能干擾機(jī)與通信用戶之間的交互建模為重復(fù)博弈[30].博弈論為建模通信雙方的對抗策略提供了理論工具,借助博弈理論,分析對方的策略均衡,從而預(yù)演對抗形勢,提前部署和籌劃對抗策略,以實(shí)現(xiàn)高效干擾[31].
在現(xiàn)有文獻(xiàn)中,智能干擾的定義仍然沒有達(dá)成共識,自適應(yīng)干擾、認(rèn)知干擾、智能干擾的概念范疇相互交錯.許多相關(guān)工作只是集中在對AI 技術(shù)的應(yīng)用,而沒有進(jìn)一步分析智能干擾的邏輯特征,對于干擾智能化的邏輯閉環(huán)還缺少分析論證.如圖1所示,希望通過對智能干擾目的、方式、反饋的解析,厘清智能干擾的概念內(nèi)涵,分析干擾智能化的邏輯特征,并構(gòu)建智能干擾的整體框架,為其實(shí)現(xiàn)提供一定的理論支撐.本文認(rèn)為:智能干擾是一種可以對環(huán)境進(jìn)行深刻認(rèn)知,學(xué)習(xí)通信規(guī)律,預(yù)測通信行為,以更低消耗、更高效率實(shí)現(xiàn)干擾目標(biāo)的新型干擾機(jī)理.它不是一種具體的干擾樣式,而是對基本干擾樣式的綜合、靈活、高效運(yùn)用.智能干擾通過學(xué)習(xí)、預(yù)測、決策,實(shí)現(xiàn)對通信方通信規(guī)律的深刻學(xué)習(xí),預(yù)先判斷通信行為,實(shí)施前瞻性的精準(zhǔn)攻擊,并在動態(tài)博弈的過程中實(shí)時評估干擾效果,主動調(diào)整干擾策略,以更小代價(jià)、更高效率、更實(shí)時精準(zhǔn)、更安全隱蔽的手段,削弱或消除無線傳輸對信息系統(tǒng)的支撐作用,降低敵方信息化作戰(zhàn)能力.
圖1 智能干擾的目的、方式和反饋Fig.1 The purpose,method and feedback of smart jamming
對于干擾攻擊而言,如果干擾信號在各個域度(功率域、頻率域、空間域、時間域等)都完全壓制通信信號,那么就可以實(shí)現(xiàn)常規(guī)意義上的完全最佳干擾[32].但這往往意味著更大的資源消耗和對干擾任務(wù)的過度完成.智能干擾的目的在于學(xué)習(xí)通信用戶的通信規(guī)律,以盡可能低的消耗,盡可能高的效率,實(shí)現(xiàn)己方的干擾意圖,降低通信方的抗干擾容限,甚至阻斷通信.而其中的關(guān)鍵,就在于如何學(xué)習(xí)對方的通信規(guī)律.
無線通信的過程可以認(rèn)為是在通信環(huán)境的基礎(chǔ)上進(jìn)行的通信行為.其中,通信環(huán)境包括支持用戶接入并完成通信任務(wù)的軟硬件條件以及受地理、經(jīng)濟(jì)、社會發(fā)展所影響的頻譜可用狀態(tài)、流量時空分布等長期通信規(guī)律;通信行為是指用戶利用通信環(huán)境完成具體任務(wù)的系列活動,包括用戶對功率、頻率等資源的使用調(diào)度,以及為消減無意干擾或應(yīng)對惡意干擾所采取的通信策略.通信行為體現(xiàn)了通信方的短期通信規(guī)律.
因此,對于通信對抗而言,通信方的通信規(guī)律既體現(xiàn)在通信環(huán)境在時域、空域、功域、頻域等多個維度的長期特征,同樣也體現(xiàn)在通信方采取的多種抗干擾技術(shù)所蘊(yùn)含的策略規(guī)律.不同抗干擾技術(shù)所涉及的抗擾主體、實(shí)施場域、協(xié)議結(jié)構(gòu)都不盡相同,但是這些抗干擾技術(shù)背后蘊(yùn)含的通信規(guī)律仍然具有可知性和規(guī)律性,且這些通信規(guī)律可以在電磁頻譜數(shù)據(jù)中得到體現(xiàn).
從信號的角度出發(fā),其幅度、頻率、相位信息在電磁環(huán)境中表現(xiàn)為對抗雙方可獲取的功率、頻率、時間等電磁頻譜數(shù)據(jù)[33].如圖2所示,實(shí)際通信系統(tǒng)可以映射成虛擬的拓?fù)浣Y(jié)構(gòu),其中,通信設(shè)備或者用戶映射為節(jié)點(diǎn),而設(shè)備或者用戶之間的連通關(guān)系映射為有向邊.通過數(shù)據(jù)采集、處理、分析得到拓?fù)渲懈鱾€節(jié)點(diǎn)的時-頻-功信息,并因此分析信息中蘊(yùn)含的通信規(guī)律.因此,本文主要圍繞信號的功率信息、頻率信息、時間信息、網(wǎng)絡(luò)空間信息展開討論,從功率、頻率、時間、空間4 個維度,解構(gòu)通信行為規(guī)律.其中,空間是通信規(guī)律的宏觀呈現(xiàn);時間是通信行為的順序體現(xiàn);頻率是通信行為的載體;功率表征通信強(qiáng)度的增減.
圖2 多維域通信規(guī)律Fig.2 The multi-dimensional communication rules
通信網(wǎng)絡(luò)的空間域概念由不同位置的網(wǎng)絡(luò)節(jié)點(diǎn)和節(jié)點(diǎn)之間的有效鏈路所構(gòu)成的拓?fù)浣Y(jié)構(gòu)及其所承載的通信活動共同構(gòu)成.空間域特征主要指目標(biāo)網(wǎng)絡(luò)的拓?fù)浣Y(jié)構(gòu)以及流量分布,前者包括關(guān)鍵節(jié)點(diǎn)、關(guān)鍵鏈路等信息;而后者主要指的是網(wǎng)絡(luò)中各個節(jié)點(diǎn)、鏈路所體現(xiàn)的通信流量規(guī)律——即不同節(jié)點(diǎn)、不同鏈路在不同時刻的通信流量的分布規(guī)律,也可以用該節(jié)點(diǎn)、該鏈路在不同時刻的功率-頻率使用規(guī)律來近似表征.
時間既可作為分配資源,又可作為通信行為發(fā)生的度量.通信行為的時間規(guī)律,往往與空間、頻率使用規(guī)律具有較強(qiáng)的相關(guān)性,既包括時分復(fù)用等多址方式,也包括基于時間相關(guān)性的流量預(yù)測以及頻譜可用性預(yù)測.具體而言,通信行為的時間域規(guī)律體現(xiàn)在目標(biāo)網(wǎng)絡(luò)用戶的時分復(fù)用規(guī)則、MAC 層協(xié)議競爭退避時長、流量規(guī)律的時間相關(guān)性、路由算法的收斂時長、干擾脈沖的持續(xù)時間以及釋放時間、掃頻信號的掃頻周期、衛(wèi)星服務(wù)的過頂時刻及持續(xù)時間等.
通過分析目標(biāo)網(wǎng)絡(luò)的功率、頻率數(shù)據(jù),得到目標(biāo)網(wǎng)絡(luò)的功率儲備、可用頻譜集合、目標(biāo)網(wǎng)絡(luò)的噪聲水平、解調(diào)門限信噪比等,從而對目標(biāo)網(wǎng)絡(luò)進(jìn)行有針對性的高效干擾.
本文認(rèn)為智能干擾是一種新的干擾機(jī)理而不是一種具體的干擾樣式.它是對基本干擾樣式的綜合、靈活、高效運(yùn)用.
干擾分類紛繁復(fù)雜、千差萬別,按照不同的分類標(biāo)準(zhǔn),有多種不同的干擾分類方法[34].但一般而言,通信對抗主要考慮的是壓制式惡意干擾,而頻率域干擾又是其中最常見的干擾類型.對于壓制干擾,一般有兩種壓制手段——瞄準(zhǔn)式壓制干擾和阻塞式壓制干擾[35],對這兩種基本干擾樣式的綜合、靈活、高效運(yùn)用,是智能干擾的具體承載方式.下文將從干擾的目的、形式和效果出發(fā),對智能干擾策略的具體承擔(dān)者和實(shí)施者——瞄準(zhǔn)干擾和壓制干擾進(jìn)行分析.
從干擾目的上看,瞄準(zhǔn)干擾主要針對特殊的用戶或者具體的通信行為,而阻塞干擾不僅可以針對用戶,而且更傾向于針對通信系統(tǒng)或者通信網(wǎng)絡(luò);從干擾形式上看,瞄準(zhǔn)干擾主要針對具體的通信單元或者資源單元,比如針對具體的通信信道、節(jié)點(diǎn)或者鏈路實(shí)施精準(zhǔn)壓制,而阻塞干擾主要針對全部或者部分的干擾空間,比如攻擊部分通信子網(wǎng),甚至阻塞整個目標(biāo)網(wǎng)絡(luò);從干擾效果上看,瞄準(zhǔn)干擾主要采取直接的強(qiáng)對抗、硬對抗手段,對目標(biāo)單元進(jìn)行攻擊致毀或者爭奪占用,而阻塞干擾更多的是降低目標(biāo)網(wǎng)絡(luò)的抗干擾裕度,降低整個網(wǎng)絡(luò)的通信性能.
總體而言,瞄準(zhǔn)干擾是一種高精度、低消耗的精準(zhǔn)干擾,主要應(yīng)用于“能量受限、能力較強(qiáng)”的干擾場景,但其高效精準(zhǔn)是建立在充分的偵察情報(bào)和經(jīng)驗(yàn)積累的前提下;阻塞干擾一般應(yīng)用于“能量有余、能力不足”的情況,干擾方缺乏對通信方的有效偵察,只能以大量的能量消耗,整體降低通信方的通信性能,其作用效果相當(dāng)于提高目標(biāo)空間的背景噪聲,惡化通信環(huán)境.
智能干擾機(jī)根據(jù)對通信環(huán)境的感知,對于干擾目標(biāo)或者干擾范圍較小,干擾要求較高,通信規(guī)律把握較深,運(yùn)用瞄準(zhǔn)干擾的方式,基于學(xué)習(xí)算法和相應(yīng)的推理決策能力,根據(jù)用戶的通信行為,甄別不同鏈路的狀態(tài)差異,爭奪當(dāng)前頻譜的信道資源,判斷網(wǎng)絡(luò)節(jié)點(diǎn)的重要程度,實(shí)現(xiàn)更高精度、更快速度、更低消耗的高效干擾;而如果干擾范圍較大,干擾要求不高,對于通信方通信規(guī)律掌握不夠全面,則可以在現(xiàn)有知識的情況下,盡可能縮小目標(biāo)范圍,運(yùn)用阻塞干擾的方式,根據(jù)用戶通信行為、目標(biāo)網(wǎng)絡(luò)拓?fù)涞闹芷诟淖円?guī)律和網(wǎng)絡(luò)節(jié)點(diǎn)的流量分布規(guī)律,實(shí)現(xiàn)干擾范圍廣、干擾時間長的有效干擾.
如圖3所示,智能干擾從經(jīng)驗(yàn)中學(xué)習(xí),提取環(huán)境特征,根據(jù)交互信息調(diào)整干擾策略.所以,對于智能干擾而言,需要解決3 個方面的問題:1)如何積累經(jīng)驗(yàn);2)如何從經(jīng)驗(yàn)中學(xué)習(xí);3)如何根據(jù)學(xué)習(xí)結(jié)果進(jìn)行干擾決策.人工智能技術(shù)中的深度學(xué)習(xí)(deep learning,DL)技術(shù)可以從環(huán)境數(shù)據(jù)中提取有效特征[36],強(qiáng)化學(xué)習(xí)技術(shù)可以實(shí)現(xiàn)與環(huán)境的動態(tài)交互,進(jìn)行自主決策,而結(jié)合兩者優(yōu)勢的深度強(qiáng)化學(xué)習(xí)(deep reinforcement learning,DRL)技術(shù)可以實(shí)現(xiàn)對復(fù)雜環(huán)境的特征提取,并進(jìn)行相應(yīng)的高效決策.所以,如何解決經(jīng)驗(yàn)的積累,是智能干擾當(dāng)前面臨的關(guān)鍵問題.
圖3 干擾反饋Fig.3 The diagram of jamming feedback
智能干擾需要積累的經(jīng)驗(yàn)來自干擾釋放后,通信方或者通信環(huán)境對干擾效果的反饋.干擾機(jī)進(jìn)而根據(jù)干擾效果反饋,動態(tài)調(diào)整干擾策略,實(shí)現(xiàn)智能高效的精準(zhǔn)干擾.所以要實(shí)現(xiàn)干擾的智能化,需要研究及時、高效的干擾反饋機(jī)制[37].一般意義上的情報(bào)偵察和信息支援的滯后性和階段性,并不能滿足智能干擾對于動態(tài)博弈中實(shí)時性和高效性的要求.所以,需要從新的角度獲取干擾反饋數(shù)據(jù),并從中提取關(guān)鍵信息,以調(diào)整策略.從通信要素的角度來看,無論是干擾方還是通信方,在電磁對抗的過程中,可以獲取的信息主要有功率、頻率、傳輸時間等通信要素,以及敵方網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu)的大致信息.所以,智能干擾的經(jīng)驗(yàn)積累以及效果反饋,也應(yīng)從這些有限的戰(zhàn)場信息中收集并提煉.本節(jié)從以下兩個角度對智能干擾的反饋機(jī)制進(jìn)行初步的探索和分析.
干擾方對通信網(wǎng)絡(luò)實(shí)施基于統(tǒng)計(jì)學(xué)習(xí)的干擾,干擾機(jī)不關(guān)注通信方具體的通信行為,而是根據(jù)通信環(huán)境中關(guān)鍵節(jié)點(diǎn)的功率、頻率信息,估計(jì)目標(biāo)網(wǎng)絡(luò)受擾后的吞吐量,并將其作為干擾效果反饋.該場景下的干擾反饋,體現(xiàn)在干擾方對通信網(wǎng)絡(luò)的性能評估.基于目標(biāo)網(wǎng)絡(luò)當(dāng)前的拓?fù)浣Y(jié)構(gòu),測算并估計(jì)流量較大節(jié)點(diǎn)的功率水平和頻譜利用情況,分析該網(wǎng)絡(luò)中主要路徑的總吞吐量的降低值作為干擾效果,從而對干擾策略做出相應(yīng)調(diào)整.在這種針對網(wǎng)絡(luò)的干擾場景下,利用學(xué)習(xí)算法,學(xué)習(xí)網(wǎng)絡(luò)的流量規(guī)律,愈是擁塞的節(jié)點(diǎn),愈加劇其擁塞,可以使得目標(biāo)網(wǎng)絡(luò)進(jìn)一步癱瘓.
在通信資源相對有限的對抗環(huán)境中,干擾機(jī)作為對抗中占據(jù)優(yōu)勢的對抗實(shí)體,與通信方競爭資源,以自身對通信資源的爭奪和占用,作為干擾效果反饋,并相應(yīng)地改變干擾策略,實(shí)現(xiàn)智能干擾.以頻譜爭奪為例,在同一頻點(diǎn),干擾機(jī)與通信機(jī)進(jìn)行功率博弈,干擾機(jī)作為優(yōu)勢方,加大功率可以迫使用戶退出該頻點(diǎn),從而對該頻點(diǎn)實(shí)施占領(lǐng),獲得該頻點(diǎn)反饋的干擾收益.然而,即便干擾方是優(yōu)勢方,但干擾能力終歸受限,所以干擾機(jī)占據(jù)的頻點(diǎn)最終將趨于飽和,而通信方也將獲得自己可用的通信頻點(diǎn).故干擾機(jī)需要研究,在一段頻譜中,應(yīng)以怎樣的功率分配,對哪些頻點(diǎn)實(shí)施干擾,可以最大程度降低對方收益,提高己方的收益,以決定最終的干擾策略,實(shí)現(xiàn)智能化干擾.
需要指出的是,大致相當(dāng)?shù)膶鼓芰κ潜疚难芯客ㄐ艑沟幕厩疤?在敵我懸殊的場景下研究對抗雙方基于理性的對抗策略不屬于本文討論的范疇.同時,無線環(huán)境固有的動態(tài)波動以及對抗雙方的動態(tài)博弈,共同造成了通信環(huán)境的不確定性.因此,干擾機(jī)需要通過己方博弈收益的變化,學(xué)習(xí)通信環(huán)境的變化規(guī)律以及通信方的通信行為規(guī)律,有針對性地施加干擾.
傳統(tǒng)的干擾決策機(jī)制對于當(dāng)前頻譜態(tài)勢的把握主要基于人為判斷,并且干擾攻擊的施加時刻和方式都具有一定的主觀性.此類干擾決策方法對于歷史數(shù)據(jù)的利用比較粗淺,大多是基于直觀的因果關(guān)系進(jìn)行干擾決策,而且往往會面臨“小樣本數(shù)據(jù)”難題.一旦陷入先驗(yàn)信息獲取不足的境地,往往只能通過盲干擾的策略,以大量的資源消耗代價(jià),來阻塞敵方通信,效率低下且效果不佳.而智能干擾可以通過數(shù)據(jù)生成和環(huán)境學(xué)習(xí),實(shí)現(xiàn)對歷史數(shù)據(jù)的深入挖掘和對當(dāng)前頻譜態(tài)勢的深刻把握,從而進(jìn)行主動干擾決策,并且實(shí)現(xiàn)自配置和自優(yōu)化.
如圖4所示,智能干擾機(jī)采集電磁頻譜數(shù)據(jù),并進(jìn)行數(shù)據(jù)存儲、數(shù)據(jù)標(biāo)記等處理,然后將得到的通信環(huán)境特征與知識庫進(jìn)行匹配推理,如果知識庫中已經(jīng)存在該種通信情景下的干擾決策,那么直接輸出干擾策略;如果此時是一種未知的通信場景,則進(jìn)行深入學(xué)習(xí),學(xué)習(xí)通信行為的空、時、頻、功等多維特征,然后進(jìn)行學(xué)習(xí)推理.此時,知識庫中的干擾知識可以通過遷移學(xué)習(xí)的方式,輔助當(dāng)前的學(xué)習(xí)過程,得到最佳的干擾策略[38].通過學(xué)習(xí)推理或者案例匹配得到干擾策略后,與之前的歷史數(shù)據(jù)進(jìn)行綜合分析,分析敵對方的通信策略,并預(yù)判通信行為,然后綜合考慮當(dāng)前可用的干擾資源,進(jìn)行最終的干擾決策,并輸出干擾動作.通過對抗環(huán)境的干擾反饋對干擾策略進(jìn)行優(yōu)化調(diào)整,實(shí)施高效、精準(zhǔn)的干擾攻擊.
圖4 智能干擾技術(shù)圖Fig.4 The logic diagram of smart jamming
在圖4的基礎(chǔ)上,本文構(gòu)建了一個智能干擾模式的簡單示例,如圖5所示.首先將干擾機(jī)與通信方之間的對抗建模為Stackelberg 博弈,研究對抗雙方的動態(tài)交互[18].對于干擾機(jī)而言,在對抗環(huán)境中感知設(shè)備或者數(shù)據(jù)采集節(jié)點(diǎn)收集得到的頻譜數(shù)據(jù)往往是小樣本數(shù)據(jù).小樣本數(shù)據(jù)難以深入挖掘?qū)Ψ降耐ㄐ判袨橐约半姶怒h(huán)境的時變特性,因此,生成對抗網(wǎng)絡(luò)首先用來學(xué)習(xí)采集數(shù)據(jù)的深層表達(dá),并產(chǎn)生大樣本數(shù)據(jù)[39].生成對抗網(wǎng)絡(luò)通過訓(xùn)練生成器和判決器兩個神經(jīng)網(wǎng)絡(luò)來產(chǎn)生大量樣本數(shù)據(jù).生成器用來深度學(xué)習(xí)樣本數(shù)據(jù)分布,并且利用噪聲源產(chǎn)生與真實(shí)數(shù)據(jù)盡可能相似的合成數(shù)據(jù).判決器用來判斷輸入數(shù)據(jù)是真實(shí)數(shù)據(jù)的概率.如果判決器判斷正確,則調(diào)整生成器的參數(shù),使得合成數(shù)據(jù)更“真實(shí)”;反之,則調(diào)整判決器的參數(shù),從而避免下一次類似的錯誤.最終,將得到一個成熟的生成器用來產(chǎn)生與真實(shí)數(shù)據(jù)分布相似的大樣本數(shù)據(jù).長短期記憶網(wǎng)絡(luò)用來預(yù)測頻譜數(shù)據(jù)中蘊(yùn)含的通信行為規(guī)律[40].長短期記憶網(wǎng)絡(luò)可以自動學(xué)習(xí)在記憶單元內(nèi)存儲的時序信息,刪除不重要的信息,從而更好地生成有助于預(yù)測下一個頻譜狀態(tài)的特征.基于對于頻譜狀態(tài)的預(yù)測,干擾機(jī)可以有效地減小干擾范圍并且實(shí)施更精準(zhǔn)的干擾攻擊.深度強(qiáng)化學(xué)習(xí)技術(shù)用來處理無線環(huán)境的動態(tài)性,并且探索最佳的干擾動作[26,41].深度神經(jīng)網(wǎng)絡(luò)用來提取頻譜數(shù)據(jù)的特征.對于干擾信道的選擇問題,在強(qiáng)化學(xué)習(xí)的范式下,智能體觀測當(dāng)前的頻譜數(shù)據(jù)作為狀態(tài),然后從可用動作集合中選擇下一時刻的干擾信道作為動作,該動作作用于無線環(huán)境后,會得到干擾反饋.基于深度強(qiáng)化學(xué)習(xí)技術(shù),干擾機(jī)可以主動調(diào)整干擾動作以提高干擾效益.
圖5 一個智能干擾模式簡單示例Fig.5 A simple example of implementing smart jamming
傳統(tǒng)的抗干擾技術(shù),諸如跳頻通信,基于預(yù)測技術(shù)或者基于強(qiáng)化學(xué)習(xí)技術(shù)都可以在經(jīng)驗(yàn)學(xué)習(xí)中得到跳頻圖案,從而有針對性地施加預(yù)判式精準(zhǔn)攻擊.而對于雙方都采取智能策略的通信對抗而言,智能化的實(shí)現(xiàn)源于智能算法和計(jì)算能力的深度融合.脫離了硬件設(shè)施和計(jì)算能力,智能對抗就會退化成戰(zhàn)術(shù)思想的碰撞,而差距懸殊的硬件條件會導(dǎo)致通信對抗中絕對優(yōu)勢方的出現(xiàn),此時的通信對抗研究意義不大.在雙方能力相差不甚懸殊的條件下,研究智能化的對抗策略,將干擾機(jī)與通信用戶之間的策略對抗建模為Stackelberg 博弈,可以在有限約束下實(shí)現(xiàn)動態(tài)均衡解,取得有意義的研究結(jié)果.
本文認(rèn)為智能干擾是干擾機(jī)理的突破,干擾策略的進(jìn)化,而不是干擾樣式的創(chuàng)新.在策略層面,智能干擾相比于被動式的自適應(yīng)干擾,實(shí)現(xiàn)了從“決策-反饋”到“感知-學(xué)習(xí)-預(yù)測-決策-反饋”的策略閉環(huán),使得干擾機(jī)不僅具備對通信方抗干擾動作的動態(tài)反應(yīng)能力,還可以前瞻性地預(yù)判通信行為,從而提前部署并阻斷通信;從承載方式的層面,智能干擾是對基本干擾樣式的綜合、靈活、高效運(yùn)用,一般而言,即是根據(jù)對抗實(shí)際需要,基于推理、預(yù)測和決策能力,綜合、靈活地運(yùn)用瞄準(zhǔn)或者阻塞干擾的方式,阻斷或者削弱通信方的有效通信;從干擾效果反饋的層面,智能干擾機(jī)需要真正實(shí)現(xiàn)對于對抗環(huán)境的深刻學(xué)習(xí),并由此獲得可靠的干擾效果反饋.在此基礎(chǔ)上才可以實(shí)現(xiàn)智能干擾機(jī)與環(huán)境之間有效的動態(tài)交互,并及時優(yōu)化干擾策略,實(shí)現(xiàn)自學(xué)習(xí)、自優(yōu)化的智能干擾.本文通過策略目的、承載方式及效果反饋3 個方面,解讀智能干擾“按域拆分、學(xué)習(xí)規(guī)律”的策略方法,“基本樣式、綜合運(yùn)用”的方式屬性以及“經(jīng)驗(yàn)積累、學(xué)習(xí)優(yōu)化”的技術(shù)特征.希望可以為智能干擾的實(shí)現(xiàn)提供一定的理論支撐和方法指引.