張濤, 于雷, 周中良, 李飛
(1.空軍工程大學(xué) 工程學(xué)院, 陜西 西安 710038;2.中國人民解放軍 94831部隊, 浙江 衢州 324001)
基于變權(quán)重偽并行遺傳算法的空戰(zhàn)機動決策
張濤1,2, 于雷1, 周中良1, 李飛1
(1.空軍工程大學(xué) 工程學(xué)院, 陜西 西安 710038;2.中國人民解放軍 94831部隊, 浙江 衢州 324001)
針對空戰(zhàn)機動決策中態(tài)勢多樣化對機動決策的影響以及控制量的細(xì)化問題,以敵我雙機空戰(zhàn)為背景,利用空戰(zhàn)優(yōu)勢函數(shù)值作為空戰(zhàn)機動決策的依據(jù),基于滾動時域控制方法,采用變權(quán)重自適應(yīng)偽并行遺傳算法解決空戰(zhàn)決策問題。重點分析了隱身優(yōu)勢函數(shù)以及變權(quán)重函數(shù)的建立、遺傳編碼方式、操作算子的確定,最后對空戰(zhàn)決策進(jìn)行了仿真。仿真結(jié)果驗證了隱身優(yōu)勢函數(shù)的合理性,以及該理論在空戰(zhàn)機動決策方面的有效性。
自適應(yīng)偽并行遺傳算法; 變權(quán)重; 機動決策; 優(yōu)勢函數(shù)
當(dāng)前,隨著機載武器、傳感器和飛機本身性能的不斷提高,現(xiàn)代空戰(zhàn)的空間范圍不斷擴大,目標(biāo)、武器以及本機之間的相互關(guān)系也變得越來越復(fù)雜。為了減輕駕駛員的負(fù)擔(dān),提高空戰(zhàn)效能,對空戰(zhàn)機動決策的研究愈顯重要[1]。針對現(xiàn)代空戰(zhàn)的需求,世界各軍事大國都在加緊空戰(zhàn)機動決策及其生成技術(shù)的研究和應(yīng)用開發(fā)??諔?zhàn)機動決策問題是NP(Nondeterministic Polynomial)難問題,目前解決此問題的方法有:神經(jīng)網(wǎng)絡(luò)法、影響圖法、Petri網(wǎng)法、蟻群算法、粒子群算法等,其中神經(jīng)網(wǎng)絡(luò)法很難獲得真實的空戰(zhàn)數(shù)據(jù)來對神經(jīng)網(wǎng)絡(luò)進(jìn)行學(xué)習(xí)訓(xùn)練,影響圖法及蟻群算法的計算時間較長,難以滿足空戰(zhàn)的實時性要求,文獻(xiàn)[2]提出了遺傳算法在戰(zhàn)術(shù)飛行動作決策方面的應(yīng)用,將48種戰(zhàn)術(shù)動作進(jìn)行編碼、遺傳優(yōu)化,但文中沒有給出具體編碼及仿真過程。目前國內(nèi)的研究主要是依據(jù)典型機動動作庫進(jìn)行機動決策,沒有考慮到控制量的細(xì)化問題。本文提出了基于滾動時域的控制方法,對具體控制量進(jìn)行細(xì)化、離散化,采用變權(quán)重自適應(yīng)偽并行遺傳算法解決機動決策問題。
滾動時域方法的實質(zhì)是用隨時間反復(fù)進(jìn)行的一系列小規(guī)模優(yōu)化問題求解的過程取代一個靜態(tài)的大規(guī)模優(yōu)化問題求解的結(jié)果,以達(dá)到在優(yōu)化的前提下降低計算量并適應(yīng)不確定性變化的目的[3]。本文將空戰(zhàn)過程分為多個時間階段,利用滾動時域控制的理論進(jìn)行求解[4],從而達(dá)到作戰(zhàn)要求。
遺傳算法(Genetic Algorithm,GA)是近年來迅速發(fā)展起來的一種基于遺傳學(xué)進(jìn)化思想的隨機搜索優(yōu)化算法[5-6]。該算法作為一種新的全局優(yōu)化搜索算法[7],其具有隱含并行性和全局解空間搜索的特點[8]。自適應(yīng)偽并行遺傳算法將算法自身隱含的并行性及并行計算相結(jié)合,提高了優(yōu)化計算效率、收斂速度,有效抑制了“早熟”現(xiàn)象[7]。
1.1 角度優(yōu)勢函數(shù)
角度優(yōu)勢函數(shù)主要與雷達(dá)最大探測角及空空導(dǎo)彈發(fā)射角有關(guān),戰(zhàn)斗機要進(jìn)行搜索、跟蹤及武器發(fā)射、制導(dǎo),必須控制載機使目標(biāo)在一定的角度范圍內(nèi)。因此角度優(yōu)勢函數(shù)表示為[9]:
(1)
式中,QI為我機速度矢量與目標(biāo)線的夾角;αmax為空空導(dǎo)彈最大發(fā)射角;βmax為雷達(dá)最大探測角。S1取值范圍為(0,1),取值越大,優(yōu)勢越大。
1.2 速度優(yōu)勢函數(shù)
速度優(yōu)勢函數(shù)為:
(2)
式中,VI為我機速度;VT為目標(biāo)機速度;VmaxI,VmaxT,VminI,VminT分別為我機和目標(biāo)機的最大、最小飛行速度。S2取值范圍為(0,1),取值越大,優(yōu)勢越大。
1.3 隱身優(yōu)勢函數(shù)
由于飛機的雷達(dá)反射面積SRC決定了被發(fā)現(xiàn)的概率及攻擊概率等,直接影響飛機的安全性,因此有必要引入隱身優(yōu)勢函數(shù):
(3)
式中,SRC0為門限SRC差值;SRCT為目標(biāo)機的雷達(dá)反射面積;SRCI為我機的雷達(dá)反射面積。S3取值范圍為(0,1),取值越大,優(yōu)勢越大。
1.4 攻擊優(yōu)勢函數(shù)
攻擊優(yōu)勢函數(shù)的主要決定因素是載機所攜帶導(dǎo)彈的射程,射程與角度優(yōu)勢及隱身優(yōu)勢函數(shù)相關(guān),因此攻擊函數(shù)引入角度及隱身優(yōu)勢函數(shù),攻擊優(yōu)勢函數(shù)為:
(4)
式中,RI為我機機載空空導(dǎo)彈的射程;RT為目標(biāo)機機載空空導(dǎo)彈的射程。S4取值范圍為(0,1),取值越大,優(yōu)勢越大。
1.5 高度優(yōu)勢函數(shù)
高度優(yōu)勢函數(shù)為[10]:
(5)
式中,H為我機與目標(biāo)機的相對高度差,我機在上為正;H0為門限高度差,其值隨空戰(zhàn)形式的不同而變化,可由決策者根據(jù)經(jīng)驗設(shè)定。S5取值范圍為(0,1),取值越大,優(yōu)勢越大。
1.6 破壞跟蹤函數(shù)
S6=
(6)
式中,ωT為目標(biāo)機相對我機的角速度;αTmax為目標(biāo)機最大雷達(dá)視場跟蹤角;ωI為我機相對目標(biāo)機的角速度。S6取值范圍為(0,1),取值越大,優(yōu)勢越大。
1.7 綜合優(yōu)勢函數(shù)及變權(quán)重的確定
空戰(zhàn)態(tài)勢是決策者進(jìn)行空戰(zhàn)決策的依據(jù),空戰(zhàn)樣式及時間階段的不同,對各優(yōu)勢函數(shù)的敏感度也就不同。為體現(xiàn)決策者的經(jīng)驗和偏好,綜合交戰(zhàn)雙方的角度、速度、高度、飛機性能、武器性能及攻擊等因素,綜合優(yōu)勢函數(shù)為各優(yōu)勢函數(shù)及偏好權(quán)向量的乘積。偏好權(quán)向量W的表達(dá)式為:
W=[W1,W2,W3,W4,W5,W6]
(7)
綜合優(yōu)勢函數(shù)S為:
S=W1S1+W2S2+W3S3+W4S4+
W5S5+W6S6
(8)
不同作戰(zhàn)態(tài)勢及作戰(zhàn)階段下各影響因素重要程度的變化,通過調(diào)整加權(quán)系數(shù)來體現(xiàn)。根據(jù)空戰(zhàn)機動決策過程中的各影響因素的重要性,確定第i影響因素的權(quán)重為:
(9)
1.8 目標(biāo)運動狀態(tài)的預(yù)測
假設(shè)在當(dāng)前時刻測定目標(biāo)位置及運動狀態(tài)已知,目標(biāo)保持當(dāng)前運動狀態(tài),根據(jù)式(1)預(yù)測下一決策時刻目標(biāo)位置及運動狀態(tài),并根據(jù)目標(biāo)位置及運動狀態(tài)對優(yōu)勢函數(shù)進(jìn)行預(yù)測,以備進(jìn)行決策優(yōu)化時使用。
本文的并行遺傳算法采用粗粒度模型(也稱孤島模型),其原理為將初始的種群分為若干個子種群,并將子種群分配到各子節(jié)點上單獨進(jìn)行遺傳進(jìn)化,每隔一定代數(shù),將各子種群中的最優(yōu)個體遷移到其它子種群中,并接納其它子群體送來的最優(yōu)個體[11]。實際應(yīng)用時可以在一臺計算機上串行實現(xiàn)粗粒度并行遺傳算法,即偽并行遺傳算法。雖然偽并行遺傳算法不具有并行計算的速度優(yōu)勢,但仍具有避免“早熟”的性質(zhì),有效地降低了遺傳算法在全局搜索能力方面固有的缺陷[12]。
算法流程如下:
(1)初始化。根據(jù)實際問題確定編碼方式,并生成初始群體,編碼方式有二進(jìn)制編碼和實數(shù)編碼。
(2)設(shè)計適應(yīng)度函數(shù),計算每個個體的適應(yīng)度值。
(3)選擇操作。按照一定的規(guī)則從種群中分別選擇一定數(shù)目的染色體進(jìn)入下一代群體。本文采用多種選擇方法,首先采用最佳個體保留策略,即將適應(yīng)度值最高的個體不進(jìn)行交叉和變異,直接選擇進(jìn)入下一代群體;其余的個體按照適應(yīng)度值比例法,又稱輪盤賭法[13]。
(4)交叉變異。將選擇的染色體作為父代,根據(jù)交叉概率和變異概率,選擇一定數(shù)目的染色體進(jìn)行交叉和變異,得到下一代染色體。交叉概率Pc計算如下:
(10)
式中,Pc∈[Pc1,Pc2],Pc1,Pc2∈(0,1),一般情況下交叉概率Pc1,Pc2∈(0.3,0.9);fmax為群體中的最大適應(yīng)度值;f′為要交叉的兩個個體中較大的適應(yīng)度值;favg為群體的平均適應(yīng)度值。
變異概率Pm計算如下:
(11)
式中,Pm∈[Pm1,Pm2],Pm1,Pm2∈(0,1),一般情況下變異概率Pm1,Pm2∈(0.005,0.300);f為變異個體的適應(yīng)度值。
(5)遷移。將適應(yīng)度值高的個體根據(jù)規(guī)則發(fā)給其它子種群。本文采用自適應(yīng)循環(huán)遷移算子,即根據(jù)子種群的相對適應(yīng)度值調(diào)整遷移概率,將子種群中適應(yīng)度高的個體發(fā)給其它子種群[14]。遷移概率Pq計算如下:
(12)
式中,k為比例系數(shù),根據(jù)實際問題而定。
3.1 飛機運動模型
飛機本身是一個彈性體,載荷的消耗和使用、操縱系統(tǒng)的運動和飛行員的移動使得質(zhì)心位置隨時變化,如果考慮這些因素,那么運動方程極為復(fù)雜,無法求解。本文假設(shè)飛機質(zhì)量為常數(shù),將飛機視為質(zhì)點,在慣性坐標(biāo)系中,用3個描述質(zhì)心運動的運動學(xué)方程確定飛機的運動規(guī)律。
基于地理坐標(biāo)系(北-天-東)建立運動學(xué)方程。假設(shè)飛機側(cè)滑角和迎角均為0°,發(fā)動機安裝角為0°,則飛機的運動學(xué)方程為:
(13)
(14)
式中,Vt為飛機速度;a為飛機加速度;θt為飛機航跡俯仰角;Δθ為飛機航跡俯仰角變化率;φt為飛機航跡偏轉(zhuǎn)角;Δφ為飛機航跡偏轉(zhuǎn)角變化率。
因a與當(dāng)前飛行速度相關(guān),根據(jù)飛機飛行規(guī)律可知:在最大速度時的加速度最大為0,在最小速度時的加速度最小為0。因此可以將加速度的取值范圍表示為:
(15)
3.2 基于改進(jìn)遺傳算法的機動決策模型
首先將戰(zhàn)斗機的飛行控制量離散化,組成染色體群體,每一個染色體代表一組控制量。其基本思想是n個染色體位數(shù)代表一個控制量,一條染色體可由多段控制量染色體組成。由3.1節(jié)可知,戰(zhàn)斗機機動可總結(jié)為3個控制量進(jìn)行控制,其中將控制量Δθ,Δφ及a的值域劃分N=2n份,每一數(shù)值代表了3個控制量的大小,如表1所示。確定每個控制量對應(yīng)的染色體位數(shù)n(向絕對值大的方向取整),則總的染色體位數(shù)為3n。其中,Δφ向右為正,Δθ向上為正,其編碼控制方式如圖1所示。
表1 編碼方式
圖1 飛機機動方式及編碼示意圖
由于控制量的值域范圍不是相對0左右對稱的,尤其是Δθ和a,因此本文假設(shè)其分別對其正負(fù)兩部分進(jìn)行N/2等分,具體計算公式如下:
(16)
Δφ和a的計算方式同上。那么任意一個染色體對應(yīng)的控制量即可根據(jù)式(16)來計算得到。
在完成了控制量的離散化及編碼之后,通過自適應(yīng)偽并行遺傳算法對染色體種群進(jìn)行尋優(yōu)。本文研究的目的是在空戰(zhàn)中占據(jù)主動,增加我方的優(yōu)勢,因此選取我方的優(yōu)勢函數(shù)S為目標(biāo)函數(shù)。
(17)
其余的遺傳操作按照第2節(jié)的步驟進(jìn)行。通過多次迭代后可得到最優(yōu)結(jié)果,對應(yīng)的染色體即為最優(yōu)的染色體,通過式(16)可計算染色體對應(yīng)的3個控制量值,即為此決策過程中最優(yōu)的機動決策方案。經(jīng)多次決策就可完成整個空戰(zhàn)過程的機動決策。
仿真條件:假設(shè)敵我兩架戰(zhàn)斗機進(jìn)行空戰(zhàn),我機初始坐標(biāo)為(0,4,0) km,速度為300 m/s,初始航跡偏轉(zhuǎn)角為0°,雷達(dá)反射面積SRCI為3 m2和0.1 m2,導(dǎo)彈最大射程為15 km,速度范圍為200~400 m/s,雷達(dá)最大搜索方位角為60°,導(dǎo)彈最大發(fā)射角為45°;敵機初始坐標(biāo)為(15.0,4.5,15.0) km,速度為250 m/s,初始航跡偏轉(zhuǎn)角為180°,雷達(dá)反射面積為3 m2,導(dǎo)彈最大射程為10 km,敵機按照預(yù)定軌跡飛行;門限高度值為1 km;初始權(quán)重為(0.0,0.1,0.2,0.1,0.5,0.1),調(diào)整系數(shù)為(0.5,0.0,0.0,0.0,-0.5,0.0),每3 s進(jìn)行一次機動決策。將初始群體分為兩個子種群,每個子種群有20個染色體,每個群體進(jìn)化50代,仿真結(jié)果如圖2和圖3所示。圖2中,n為進(jìn)化代數(shù)。
由圖2可以看出,該算法的進(jìn)化收斂速度很快。圖2(a)和(b)分別在第一個子種群進(jìn)化至19和20代時即已尋找到最優(yōu)個體,因此兩個子種群的自適應(yīng)偽并行遺傳算法可以保證機動決策的最優(yōu)性。通過圖3可以看出,SRCI=3 m2時,敵我隱身優(yōu)勢相當(dāng),在初始階段,敵我雙方距離較遠(yuǎn)時我機通過爬升機動占據(jù)有利位置,在10 s時達(dá)到最高高度4.948 km,隨著敵我雙方距離的縮短,角度優(yōu)勢函數(shù)權(quán)重變大,高度優(yōu)勢函數(shù)權(quán)重變小,因此我機逐漸轉(zhuǎn)向角度瞄準(zhǔn);SRCI=0.1 m2時,我機隱身優(yōu)勢及攻擊優(yōu)勢函數(shù)值較大,因此我機主要進(jìn)行角度瞄準(zhǔn),以提前進(jìn)入攻擊位置。仿真結(jié)果驗證了通過變權(quán)重自適應(yīng)并行遺傳算法計算得到的最優(yōu)機動決策結(jié)果完全達(dá)到了機動決策的目的。
圖2 最優(yōu)個體適應(yīng)度值與進(jìn)化代數(shù)的關(guān)系
圖3 機動決策軌跡圖
本文對戰(zhàn)斗機空戰(zhàn)機動決策進(jìn)行了研究,利用滾動時域控制思想,將機動決策問題階段化,將控制量細(xì)化、離散化,并將變權(quán)重自適應(yīng)并行遺傳算法應(yīng)用到機動決策中,重點分析了目標(biāo)函數(shù)的建立、編碼以及變權(quán)重的確定,并對理論進(jìn)行了仿真驗證。由仿真結(jié)果可以看出,變權(quán)重自適應(yīng)并行遺傳算法在空戰(zhàn)機動決策方面是有效可行的,為空戰(zhàn)機動決策研究提供了參考依據(jù)。
[1] James S,Jonathan P,Brian W,et al.Air-combat strategy using approximate dynamic programming[J].Journal of Guidance,Control,and Dynamics,2010,33(5):1641-1654.
[2] 周德云,李鋒,蒲小勃,等.基于遺傳算法的飛機戰(zhàn)術(shù)飛行動作決策[J].西北工業(yè)大學(xué)學(xué)報,2002,20(2):109-112.
[3] 劉東坡.基于滾動機制的有限時域設(shè)備更新方法[D].濟南:山東大學(xué),2010.
[4] Benjamin R Carter.Time-optimization of high performance combat maneuvers [D].Monterey:Naval Postgraduate School,2005.
[5] 徐瑋.一種基于復(fù)形調(diào)優(yōu)遺傳算法的多學(xué)科優(yōu)化方法[J].系統(tǒng)工程與電子技術(shù),2010,32(4):869-872.
[6] 張涵璐,吳振森,張昌民,等.BRDF的遺傳算法和遺傳模擬退火算法建模及比較[J].系統(tǒng)工程與電子技術(shù),2010,32(7):1529-1531.
[7] 李正光,黃明,梁旭.改進(jìn)偽并行遺傳算法求解作業(yè)車間調(diào)度問題[J].數(shù)學(xué)的實踐與認(rèn)識,2010,40(1):133-138.
[8] 焦李成,尚榮華,馬文萍,等.多目標(biāo)優(yōu)化免疫算法、理論和應(yīng)用[M].北京:科學(xué)出版社,2010.
[9] 肖冰松,方洋旺,胡詩國,等.一種新的超視距空戰(zhàn)威脅評估方法[J].系統(tǒng)工程與電子技術(shù),2009,31(9):2162-2166.
[10] 郭昊,周德云,張堃.無人作戰(zhàn)飛機空戰(zhàn)自主機動決策研究[J].電光與控制,2010,18(8):28-32.
[11] 李培,郝曉光,周文.基于偽并行遺傳算法的無源電力濾波器優(yōu)化設(shè)計[J].電測與儀表,2011,48(7):75-81.
[12] 王萍萍,潘豐.基于改進(jìn)偽并行遺傳算法的函數(shù)優(yōu)化[J].江南大學(xué)學(xué)報,2010,9(1):12-16.
[13] 元昌安,彭昱忠,覃曉, 等.基因表達(dá)式編程算法原理與應(yīng)用[M].北京:科學(xué)出版社,2010.
[14] 陳勇,劉勇,鮑勝利.基于偽并行遺傳算法的路徑測試數(shù)據(jù)自動生成[J].四川大學(xué)學(xué)報,2009,41(5):141-145.
(編輯:姚妙慧)
Decision-makingforaircombatmaneuveringbasedonvariableweightpseudo-parallelgeneticalgorithm
ZHANG Tao1,2, YU Lei1, ZHOU Zhong-liang1, LI Fei1
(1.Engineering Institute, Air Force Engineering University, Xi’an 710038, China;2.94831 Unit of the PLA, Quzhou 324001, China)
Considering a scenario of air combat involving two opposed fighters, a decision-making model based on variable weight adaptive parallel genetic algorithm is established by the continually updated preponderance function. This paper mainly discusses the preponderance function, variable weight function, coding mode and operator. The experiment results demonstrated that this algorithm is feasible because it could complete the decision-making for air combat.
adaptive pseudo-parallel genetic algorithm;variable weight;decision-making for maneuvering;preponderance function
E844
A
1002-0853(2012)05-0470-05
2011-12-26;
2012-04-24
航空科學(xué)基金資助(20095196012);校博士生創(chuàng)新基金資助(Dx2010106)
張濤(1982-),男,山東新泰人,博士研究生,主要研究方向為航空武器系統(tǒng)總體、仿真與控制。