朱 卓,劉琦妍,張 策
(1.中國電子科技集團公司第五十三研究所機載產品事業(yè)部,天津 300308;2.西北工業(yè)大學a.無人系統(tǒng)技術研究院;b.航天學院,西安 710072)
目前,察打一體無人機的主要威脅為紅外地空導彈[1-2],其主要包括便攜式紅外地空導彈和車載式紅外地空導彈,并具有抗人工干擾能力較強,射程較遠等特點[3-4],無人機基本無法擺脫其攻擊,因此,研究用于無人機自主規(guī)避紅外地空導彈的決策技術是十分必要的。當無人機遭受紅外地空導彈攻擊威脅時,能通過對自身獲得的各項信息進行分析決策,做出最合理的自主規(guī)避對抗舉措,可以提高其生存能力。
文獻[5]研究了導彈迎頭攻擊時,飛機的最佳防御策略,即做非常規(guī)機動并同時發(fā)射干擾彈;文獻[6]深入研究紅外成像導彈的抗干擾機理,建立了目標機的運動和輻射模型以及面源紅外誘餌的運動擴散模型和紅外圖像模型,并選擇導彈的戰(zhàn)術參數以制定干擾效能評估指標,仿真結果表明,面源紅外誘餌可有效干擾二代彈,但針對三代彈和四代彈的干擾成功率較低;文獻[7]針對具有一定自主空戰(zhàn)能力的無人機,建立了以過載為輸入的飛行動力學模型和采用三維比例導引法的導引彈道模型,并結合神經網絡為無人機設計了一種規(guī)避來襲導彈的機動策略,但其樣本庫的計算非常耗時,且神經網絡只適用于設定好的導彈系統(tǒng);文獻[8]構建了超視距空中對抗訓練環(huán)境,提出了一種融合專家經驗的啟發(fā)式Q 網絡方法,實現了空中對抗機動策略的自主學習;文獻[9]利用神經網絡直接從無人機與導彈的位置關系預測規(guī)避結果,為無人機實時提供規(guī)避策略,但其需要大量數據支持;文獻[10]提出了一種基于蟻群和Q 學習的融合算法,以提高認知雷達干擾決策的效率和適應性,從而適應未來戰(zhàn)場上的集群對抗環(huán)境,但其在復雜戰(zhàn)場環(huán)境下效果不佳。
上述研究從不同方面給出了無人機的作戰(zhàn)策略,但在復雜紅外對抗情況下,仍需進一步提高無人機對抗決策的質量,使其適應力更強,覆蓋面更廣。本文提出一種面向典型對抗態(tài)勢的自主干擾決策模型,首先,基于紅外干擾彈投放策略集及典型紅外對抗態(tài)勢建立紅外對抗樣本庫;其次,利用遺傳算法及匹配決策模型得到最優(yōu)典型對抗態(tài)勢決策集;最后,結合線性插值思想得到一般對抗態(tài)勢下的干擾彈投放策略,找出針對不同對抗態(tài)勢的近乎最優(yōu)的對抗策略方案,創(chuàng)建決策模型,并通過仿真實驗驗證了本文自主決策模型的有效性。
干擾彈投放策略集包含以下因素:投放干擾彈總數、投放組數、組間間隔、每組投放強點源干擾彈數、每組投放多點源干擾彈數、彈間隔、投放方向、投放速度等。
為同時應對紅外制導導彈和雷達制導導彈,無人機需裝載相同數量的紅外干擾彈和箔條彈。本文設定目標無人機單次可攜帶的紅外干擾彈總量為60 枚,包括強點源干擾彈與多點源干擾彈。為避免一次投放全部干擾彈造成無人機多次遇襲時無干擾彈可用的危險處境,限定一次性投放干擾彈的數量不多于12枚,最多投放3 組。投放組數n=1,2,3,每組強點源干擾彈數m=1,2,每組多點源干擾彈數d=1,2,組間隔tn=0,1,1.5 s,彈間隔tm=0.1,0.2,0.3 s。干擾彈投放速度為30 m/s,投放傾角與偏角為[-120°,-60°](以30°為間隔),本文取-60°,按照先投放強點源干擾彈后投放多點源干擾彈的原則,上述參數組成的紅外干擾彈投放策略集(部分)如表1 所示。
表1 紅外干擾彈投放策略集(部分)Tab.1 Delivery strategy set of infrared decoy(partial)
每一個干擾投放策略確定后,會有一個對應的投放持續(xù)時間T,即完成該策略的投放所需要的時長,可表示為
式中k 為每組彈數。
針對任一對抗態(tài)勢,每次投放都應包含強點源干擾彈與多點源干擾彈,強點源干擾彈可以有效遮蔽無人機目標并使紅外制導導彈根據質心跟蹤原理偏向強點源干擾彈的方位;如果強點源干擾彈未能成功誘導紅外制導導彈偏離目標,多點源干擾彈可以形成多個類目標紅外干擾,混淆導引頭對目標的判斷,致使導彈需要從多個點源目標中選擇跟蹤目標,從而有效降低選中目標的概率。
不同類型導彈的射程、射高、飛行速度等參數不同,故對應的干擾對抗策略也不盡相同。
紅外制導導彈與目標無人機構成的典型對抗態(tài)勢由導彈和無人機的初始參量構成,包括:飛機高度、彈目距離、導彈運動速度、導彈發(fā)射方位角、無人機飛行高度、無人機飛行速度。設置典型便攜式導彈對抗態(tài)勢,無人機飛行高度分別設置為1.0、2.0、3.5 km,無人機飛行速度為0.2 Ma,彈目距離分別為2.0、4.0、6.0 km,導彈發(fā)射方位角根據導彈攻擊包線分別設置為0°、12°、27°、50°、77°、90°、120°、138°、165°、180°,排除不合理的對抗態(tài)勢,共組成典型對抗態(tài)勢80 種,部分態(tài)勢如表2 所示。
表2 典型對抗態(tài)勢(部分)Tab.2 Typical confrontation situation(partial)
通過建立具有典型性和覆蓋性的紅外對抗樣本庫,可為仿真實驗和干擾彈投放策略的選擇提供數據支撐,是后續(xù)評估干擾策略效果的基礎。紅外對抗樣本庫的構成如圖1 所示。
圖1 紅外對抗樣本庫Fig.1 Sample library of infrared countermeasures
隨著導彈發(fā)射距離的增加,對應的理想彈道平均時長增加;當水平進入角從0°逐漸轉到180°,即導彈從尾后攻擊逐漸轉向迎頭攻擊,對應的理想彈道平均時長減??;不同的干擾投放策略對應的投放持續(xù)時間不同。因此,在構建紅外對抗樣本庫時,需要考慮干擾彈投放持續(xù)時間和導彈完成攻擊的理想時間的匹配,以保證紅外干擾彈可以全部投放出去,且其在整個對抗過程的大部分時間內均能發(fā)揮效用。經實驗發(fā)現,T應滿足以下條件
式中:S 為彈目距離;v彈為導彈飛行平均速度;v無為無人機飛行平均速度。
基于上述分析,可以從紅外干擾彈投放策略集中為每種對抗態(tài)勢選擇可行策略集,以貼合實際情況,避免浪費紅外干擾彈,并減少紅外對抗樣本庫的樣本數量,方便后續(xù)計算。
遺傳算法[11](GA,genetic algorithm)是模擬達爾文生物進化論的自然選擇和遺傳學機理生物進化過程的計算模型,是一種通過模擬自然進化過程搜索最優(yōu)解的方法[12]。遺傳算法過程如圖2 所示,種群像自然進化一樣,后生代種群比前代更加適應于環(huán)境,末代種群中的最優(yōu)個體經過解碼,可作為問題近似最優(yōu)解[13]。
圖2 遺傳算法過程Fig.2 Process of genetic algorithm
本文針對典型態(tài)勢的最優(yōu)干擾彈投放策略,結合遺傳算法的基本思想,對傳統(tǒng)遺傳算法進行一定的改進。其核心內容包括以下方面。
(1)參數編碼。采用實數編碼,減少一般二進制編碼最后解碼的步驟。
(2)初始群體的設定。初始種群選取參數范圍為紅外對抗樣本庫中參數。在獲得的初始種群選取范圍內,以隨機方式獲取初始種群,其規(guī)模設為40。
(3)適應度函數的設計。以綜合復雜度[14]作為適應度函數。
(4)遺傳操作設計過程如下。
a 選擇算子。計算初始種群的適應值,保留適應值最高的前10 個組合并遺傳至下一代,淘汰最低的10 個組合。
b 交叉算子。本文無人機干擾彈投放策略采用實數編碼的方式,每個個體的染色體記為干擾彈決策各因素的值,采用單點交叉,示意圖如圖3 所示。將適應度排名前30 的個體分為奇數與偶數排列的兩組,每組共15 個,各選10 個個體分別進行交叉操作,遺傳至下一代。
圖3 單點交叉示意圖Fig.3 Diagram of single point crossing
c 變異算子。優(yōu)質的典型態(tài)勢對抗決策已經接近最優(yōu),采取的變異范圍較小,本文將使用變異算子產生的高斯隨機數替換組合染色體后6 位中任一位作為一次變異操作。
(5)控制參數設定。設置初始種群數量為40,迭代次數設置為5 次,交叉概率和變異概率設定為1。交叉概率設置為1,可以加速搜索過程,提高算法效率;變異概率設為1,以保證最優(yōu)策略的全局性。
迭代結束后,將迭代所得的適應度值最高的策略作為當前典型態(tài)勢的干擾彈投放策略。擇優(yōu)步驟如圖4 所示。
圖4 基于遺傳算法的擇優(yōu)步驟Fig.4 Optimal steps based on genetic algorithm
針對紅外對抗樣本庫中的每個樣本,生成其紅外仿真圖像序列,計算這些序列的綜合復雜度值,利用建立的紅外對抗樣本庫以及計算出的綜合復雜度值來進行簡單的決策匹配。針對每一種基礎對抗態(tài)勢給出最優(yōu)干擾彈投放策略的評價準則:①策略符合干擾與混淆的基本思想;②綜合復雜度作為評判指標;③每次對抗干擾總數滿足全程干擾規(guī)劃。針對任意一種典型對抗態(tài)勢選擇干擾彈投放策略流程如圖5 所示。
圖5 策略流程圖Fig.5 Strategy flow chart
根據實驗分析,與最優(yōu)策略綜合復雜度值差值在0.05 以內的策略均可作為備選策略,選取其中投放干擾彈最少的策略作為當前對抗態(tài)勢的最優(yōu)干擾彈投放策略。
計算得到匹配典型紅外對抗態(tài)勢的最佳紅外干擾彈投放策略,需要將其擴展到針對任一態(tài)勢,構建基于典型紅外對抗態(tài)勢的遷移決策模型。本文根據典型對抗態(tài)勢得出的有效策略,使用插值法得到非典型對抗態(tài)勢的策略提案,再根據仿真實驗,并結合綜合復雜度來評判策略的有效性。三線性插值思想[15]如圖6 所示。
圖6 三線性插值圖Fig.6 Tri-linear interpolation graph
已知C 點坐標(x,y,z),設C000點坐標為(x0,y0,z0),C001點坐標為(x0,y0,z1),C100點坐標為(x1,y0,z0),C110點坐標為(x1,y1,z0),C101點坐標為(x1,y0,z1),C011點坐標為(x0,y1,z1),C010點坐標為(x0,y1,z0),C111點坐標為(x1,y1,z1)。C 點的插值計算形式如下
典型對抗態(tài)勢通過組合共構成36 個區(qū)間,示意圖如圖7 所示。通過判斷當前對抗態(tài)勢處于哪個區(qū)間內,即可通過線性插值思想計算得出對應態(tài)勢的遷移干擾彈投放策略。
圖7 典型對抗態(tài)勢示意圖Fig.7 Typical confrontation situation diagram
為了測算通過插值方法計算得到的隨機態(tài)勢的干擾彈投放策略是否為當前態(tài)勢的優(yōu)質策略,同樣使用遺傳算法進行尋優(yōu)設計。紅外對抗決策模型由典型對抗態(tài)勢策略經過線性插值法與基于遺傳算法思想的改進算法組成,流程如圖8 所示。
圖8 一般對抗態(tài)勢決策分析流程Fig.8 Decision analysis process of general confrontation situation
上文的干擾彈投放策略只能取整,但通過線性插值思想計算得出的當前態(tài)勢干擾彈投放策略參數值一般不取整,需結合典型態(tài)勢投放策略設計參數值,將當前態(tài)勢計算參數就近取整,作為當前態(tài)勢干擾彈投放策略。設投放組數n={n1,n2},每組強點源干擾彈數m={m1,m2},每組多點源干擾彈數d={d1,d2},其計算公式如下
其余投放策略因素設置與前文針對典型對抗態(tài)勢的投放策略相同。與最優(yōu)策略綜合復雜度值差值在0.05以內的干擾彈投放策略作為備選策略,再進一步選取最優(yōu)策略。
基于紅外干擾彈投放策略集和典型對抗態(tài)勢計算綜合復雜度得到80 組典型對抗態(tài)勢優(yōu)質策略集,通過遺傳算法思想對優(yōu)質策略集進行進一步優(yōu)化,計算得到的最優(yōu)策略集綜合復雜度與優(yōu)質策略集綜合復雜度對比圖如圖9(a)所示,其中,紅點表示經過遺傳算法迭代后得到的最優(yōu)策略綜合復雜度值,藍點表示優(yōu)質策略的綜合復雜度值。兩者差值如圖9(b)所示。
圖9 典型態(tài)勢綜合復雜度對比圖與差值圖Fig.9 Comparison of synthetic complexity and difference graph of typical situation
從圖9 可知,經過遺傳算法迭代后得到的最優(yōu)策略綜合復雜度值明顯高于未迭代之前的優(yōu)質策略綜合復雜度值,綜合復雜度差值均值接近0.2。
故無人機紅外對抗自主決策模型以面向典型對抗態(tài)勢的自主干擾決策模型為基礎,結合插值與遺傳算法尋優(yōu)思想,得到面向一般態(tài)勢的自主干擾決策模型。取36 個典型對抗態(tài)勢區(qū)間,每個區(qū)間有20 個隨機態(tài)勢,結合插值思想計算其干擾彈投放策略,并計算相關策略的綜合復雜度。隨機態(tài)勢分布圖如圖10所示。
圖10 隨機態(tài)勢分布圖Fig.10 Distribution of random situation
計算720 個隨機態(tài)勢的插值遷移策略綜合復雜度與通過遺傳算法迭代后得到的最優(yōu)策略綜合復雜度,綜合復雜度對比圖如圖11(a)所示,其中,紅點表示經過遺傳算法迭代后得到的最優(yōu)策略綜合復雜度值,藍點表示插值遷移策略綜合復雜度值。隨機態(tài)勢最優(yōu)策略綜合復雜度與插值遷移策略綜合復雜度的差值圖如圖11(b)所示。
圖11 隨機態(tài)勢綜合復雜度對比圖與差值圖Fig.11 Comparison of synthetic complexity and difference graph of random situation
從圖11(b)可知,綜合復雜度差值大于0.05 的策略約占測試策略總數的10%,其中綜合復雜度差值介于0.05 與0.06 之間的策略約占測試策略總數的44%,本文認為綜合復雜度差值在0.05 以內的對抗策略均可作為備選策略,所以插值遷移策略與經過遺傳算法思想尋優(yōu)后的策略相比有近90%都可作為備選策略,且計算量小,具有應用可行性。
為驗證本文決策模型的可行性和有效性,進行紅外對抗場景仿真實驗。導彈發(fā)射距離分為近距、中距、遠距3 種情況,分別對應2~3 km、3~5 km、5~6 km;將導彈水平進入角劃分為尾后、側向、迎頭3 種情況,分別對應0°~45°、45°~135°和135°~180°;無人機飛行高度設為中低空、中高空2 種情況,分別對應1.0~2.0 km、2.0~3.5 km。設計驗證實驗條件時,使近距、中距、遠距對應的實驗樣本數之比為1 ∶3 ∶1,使尾后、側向、迎頭對應的實驗樣本數之比為2 ∶2 ∶1,使中低空和中高空對應的實驗樣本數之比為2 ∶3。通過生成隨機數的方式,得到100 條對抗實驗條件,這些條件在空間中的分布情況如圖12 所示。
圖12 實驗態(tài)勢分布圖Fig.12 Distribution of experimental situation
針對100 條隨機對抗實驗態(tài)勢,通過典型態(tài)勢最優(yōu)策略集與插值計算方法計算出當前態(tài)勢的對抗策略,并與傳統(tǒng)干擾彈投放策略進行對比,當來襲導彈從尾后攻擊時,遠距時采用多點源干擾彈,中近距時采用強點源干擾彈;側向攻擊時,采用強點源干擾彈;迎頭攻擊時,采用多點源和強點源干擾彈組合使用。
對傳統(tǒng)干擾策略采用同一態(tài)勢下同一投放干擾彈數量進行仿真實驗,部分仿真數據如表3 所示,以實驗結束時脫靶量大于導彈殺傷半徑作為干擾成功標準,統(tǒng)計100 條實驗態(tài)勢與其對應策略仿真結果,傳統(tǒng)策略的干擾成功率為59%,本文決策模型的干擾成功率為87%,驗證了決策包的有效性。
表3 仿真數據(部分)Tab.3 Simulation data(partial)
本文提出一種面向典型對抗態(tài)勢的自主干擾決策模型,設計紅外對抗樣本庫,并結合遺傳算法進行尋優(yōu),得到最優(yōu)典型態(tài)勢策略集;通過線性插值、綜合復雜度與對抗態(tài)勢和對抗決策之間的映射模型,得到針對不同對抗態(tài)勢近乎最優(yōu)的對抗策略方案,并創(chuàng)建決策模型。通過仿真實驗,驗證了本文決策模型的可行性和有效性。
本文通過非典型態(tài)勢的策略遷移模型計算發(fā)現決策與對應態(tài)勢最優(yōu)對抗決策有一定的偏差,后續(xù)工作中,將尋找更為優(yōu)秀有效的計算模型,使一般態(tài)勢可以得到更優(yōu)秀的決策模型。