唐上欽, 魏政磊, 謝磊, 周歡, 張卓然
(1.空軍工程大學 航空工程學院, 陜西 西安 710038;2.中國空氣動力研究與發(fā)展中心, 四川 綿陽 621000;3.93184部隊, 北京 100000)
機動軌跡預測是自主空戰(zhàn)的重要組成部分,對機動決策影響深遠。在實際對抗過程中,擁有軌跡預測的一方會迅速占據態(tài)勢優(yōu)勢,滿足攻擊指標。軌跡預測實際上是時間序列的預測問題,且具有高度的非線性和時變性。按照現有預測方式的不同,機動軌跡預測可以分為兩類:模型驅動類與數據驅動類。
模型驅動的機動軌跡預測方法是基于一定的先驗知識,根據目標的運動規(guī)律,建立精準的動力學或運動學模型。文獻[3]通過在線識別各類機動動作建立軌跡預測模型,實時預測目標位置,但在機動變化較為頻繁之際,預測精度有所下降;文獻[4]利用氣動參數設計機動模式集,通過蒙特卡洛采樣和貝葉斯理論實現軌跡預測,相比于傳統(tǒng)的外推理論精度更高,但要求建立一個較為完善的機動模式集,在實際情況中很難進行完善;文獻[5]針對氣動參數控制的飛機運動模型,設計了自適應交互多模型進行軌跡預測,但該方法要求目標在短時間內姿態(tài)變化不大;文獻[6]提出了一種灰色動態(tài)濾波方法進行軌跡預測,相比于傳統(tǒng)的卡爾曼濾波和原始灰色方法預測精度大幅度提高,但其利用最小方差估計值代替實際值,引入微分方程,無法對參數準確估值,不準確的參數都會導致誤差較大;文獻[7]采用交互式模型解決軌跡預測問題。基于卡爾曼濾波的機動軌跡預測方法受到飛機運動模型與算法精度兩個方面的制約,同時基于交互多模型算法的預測方法通過加權多種模型來提高預測精度,但是仍然受到運動模型的限制。
基于數據驅動的機動軌跡預測方法是通過提取軌跡規(guī)律實現未來時刻的軌跡預測。從數據驅動的角度看,解決機動軌跡預測問題的思路分兩種:一種是將軌跡預測問題視為函數擬合問題;另外一種是將其看作為時間序列的預測問題。前者是將機動軌跡看作靜態(tài)數據進行擬合,不具有動態(tài)性;文獻[9]研究了目標機動軌跡的特征,提出一種基于最小二乘曲線擬合的目標機動軌跡預測方法;文獻[10]利用小波分析法提高軌跡的識別能力,采用小波分解預測方法建立了軌跡外推方案,該方案對數據處理要求較高,實際過程中所采集的數據往往會有一定的偏差?;跁r間序列的軌跡預測方法包括自回歸模型、隱馬爾可夫模型、高斯混合模型、模糊時間序列預測、Elman神經網絡、循環(huán)神經網絡(RNN)。RNN預測方法包括RNN、長短期記憶(LSTM)神經網絡、門控循環(huán)神經網絡。文獻[15]提出了一種飛機4D軌跡預測模型,將卷積神經網絡(CNN)與LSTM網絡結合,預測精度相比于單一模型更高,但其缺點是只能進行短期預測,且飛機軌跡變化不能過于劇烈,適用范圍有限;文獻[16]提出了一種深度編碼和深度解碼的LSTM網絡用于軌跡預測,提高了預測的準確性和魯棒性,但其僅應用于飛機航行的終端空域,終端空域的軌跡都較為平滑,在復雜軌跡情況下預測精度會大幅降低;文獻[17]改進了飛行動力學模型,設置偏航角速度閾值,利用CNN卷積核共享減少了存儲空間和訓練時間,從局部信息聚合得到整體信息,對輸入進行層次信息的提??;文獻[8]利用門控循環(huán)單元(GRU)預測飛行軌跡,通過對比不同網絡層數和神經元個數,選取最優(yōu)GRU網絡,與反向傳播(BP)神經網絡對比,預測誤差降低。
通過上述研究可知,基于模型驅動的預測方法在線預測實時性較強,但需要對目標建立較為完善的模型,實際飛行過程中很難建立完備模型;基于數據驅動預測方法易于實現,在數據全面且充分的情況下預測精度較高,因此采用基于數據驅動的機動軌跡預測方法。本文的主要貢獻為:
1)考慮到機動軌跡在三維空間中復雜性較高,通過4種軌跡特征,將軌跡分為三類,劃分為21種基本機動單元,構建更加完備的機動庫,使得復雜軌跡簡單化,數據需求量大幅度減少;
2)采用三角形搜索優(yōu)化(TSO)算法代替梯度下降算法更新門控循環(huán)神經網絡內部權值和偏置,克服了局部最優(yōu)問題,縮短了預測時耗,一定程度上提升了預測精度;
3)利用自適應增強技術構建強預測器,進一步提升了預測精度,通過仿真選取最優(yōu)網絡參數。
采用以油門、攻角和滾轉角為控制量的無人戰(zhàn)斗機(UCAV)3自由度模型,其模型示意圖如圖1所示。圖1中,為空氣阻力,為升力,為發(fā)動機推力,表示UCAV的速度,、分別表示俯仰角、偏航角,(,,)表示UCAV的空間坐標位置,′表示速度在水平面上投影。
圖1 UCAV推力模型Fig.1 Thrust model of UCAV
UCAV模型的數學公式定義如下:
(1)
式中:為飛機質量;表示重力加速度。在該模型中,(,,,,,)為狀態(tài)量,(,,)為控制量。
在飛行過程中,由于油料的消耗,自身質量會減輕,速度由消耗系數決定,其公式如下:
(2)
推力、阻力和升力受飛機外形、飛行狀態(tài)和環(huán)境因素影響,其計算公式分別為
(3)
(4)
(5)
機動軌跡可以分為水平面機動動作、垂直面機動動作和空間組合機動動作。在水平面內,根據航跡偏轉角,機動軌跡可以分為平飛、右轉彎和左轉彎。一般情況下,航跡偏轉角變化率Δ為正,表示飛機正在左轉;否則表示飛機正在右轉。如果航跡偏轉角變化率累加角度達到90°或者-90°,則累加開始到當前時刻的機動軌跡被認為是一段被分解的左轉彎或者右轉彎機動軌跡;如果累加角度從90°達到180°,則表示該段軌跡為左轉彎;如果該段軌跡繼續(xù)左轉彎,則累加角度會超過180°,此時累加角度重新歸零累加,且角度為負。右轉彎機動軌跡的分解與左轉彎一樣。直飛保持當前的航跡偏轉角不變,其變化率為0°。水平面內的機動軌跡單元分為3種,如圖2所示的、和。
圖2 機動軌跡單元示意圖Fig.2 Schematic diagram of maneuver trajectory unit
在垂直面內,根據傾斜角、高度變化率,機動動作可以分為爬升與俯沖。對于高度增加的爬升機動,如半斤斗倒轉機動動作可以由兩個軌跡片段構成,首先是航跡傾斜角由0°變?yōu)?0°,其法向加速度偏上方,軌跡形狀為凹上爬升形狀;其次是航跡傾斜角由90°變?yōu)?°,其法向過載偏下方,飛行軌跡為凸上爬升形狀。兩種形狀的差異主要由飛機滾轉角相差180°造成,而目標機的姿態(tài)與過載是UCAV傳感器無法得知的,因此采用航跡傾斜角變化率來區(qū)分垂直面內的軌跡形狀;同時,利用累積傾斜角來區(qū)分爬升與俯沖。垂直面內的機動軌跡單元分為6種模式:凹上爬升、直上飛、凸上爬升、凸下俯沖、直下飛、凹下俯沖,如圖2(a)所示的~。
在空間中,可以將一個空間動作分解為水平面內機動與垂直面內機動。按照水平面內的分類,將空間機動軌跡單元分為兩大類:空間左轉彎機動與空間右轉彎機動;再按照垂直面內的分類,將空間左轉彎機動分為左轉彎凹上飛、左轉彎直上飛、左轉彎凸上飛、左轉彎凸下飛、左轉彎直下飛以及左轉彎凹下飛,空間右轉彎類似于空間左轉彎??臻g左轉機動軌跡單元具體分類如圖2(b)所示的~。與左轉彎類似,空間右轉機動軌跡單元具體分為右轉彎凹上飛、右轉彎直上飛、右轉彎凸上飛、右轉彎凸下飛、右轉彎直下飛以及右轉彎凹下飛(除了水平右轉彎),如圖2(c)所示的~。
在空間分布劃分的基礎上,根據上述分析將航跡傾斜角(航跡切向方向與水平面夾角)、航跡傾斜角變化率Δ、偏航角(航跡切線方向與圖1中軸夾角)和偏航角變化率Δ作為機動單元的分類參數,建立機動單元庫,如表1所示,相比于傳統(tǒng)的7種或11種機動單元庫更加全面,能夠涵蓋各種復雜的機動動作。
表1 機動軌跡單元特征
為解決機動軌跡預測精度低、時耗高的問題,本文提出集成三角搜索優(yōu)化GRU神經網絡(TSO-GRU-Ada)模型。為克服GRU的梯度優(yōu)化陷入局部最優(yōu)的問題,利用一種三角搜索算法來優(yōu)化訓練GRU的權重與偏置量。同時為了增加預測精度,結合自適應增強算法改進GRU神經網絡。
圖3 門控循環(huán)神經單元結構圖Fig.3 Structure diagram of gated recurrent neural unit
=(,+-1+)
(6)
(7)
=(,+-1+)
(8)
(9)
,=(,++)
(10)
神經網絡權重與偏置量訓練學習是一個優(yōu)化問題。為克服GRU可能陷入局部最優(yōu)問題,采用一種基于三角形啟發(fā)的進化優(yōu)化算法——TSO算法。
TSO算法分為角度搜索(TVS)階段與邊搜索(TES)階段。具體步驟如下:
1)初始化三角頂點種群。
2)TVS階段。將頂點種群分為進化算子種群與高斯分布估計算子種群。該階段具體的流程如下:
第1個子群采用高斯分布估計算子更新個體,計算公式為
=+,~(0,)
(11)
=,~(0,)
(12)
為特征向量矩陣,=diag(,,…,)為特征值對角矩陣,表示第個特征根值,表示問題的維度,表示第個單位長度的搜索方向,服從標準正態(tài)分布。
第2個子群根據當前點與其他兩個點之間的夾角類型,采用不同的進化策略更新個體。3個點之間的夾角類型主要分為銳角、鈍角(包括直角)和無效角,第個頂點個體的夾角計算公式為
(13)
式中:表示目標向量中的最優(yōu)個體;表示第(≠)個頂點個體。根據夾角類型,具體進化策略定義如下:
①如果當前的夾角是銳角,則對應的頂點采用兩個差分進化算子,具體策略計算如下:
(14)
②如果當前夾角為鈍角或者直角,則采用兩個差分進化算子:
(15)
與(14)式不同的是,(15)式第2個差分進化算子發(fā)生變化,主要是加快種群優(yōu)化收斂速度。
③如果當前的頂點不能構成三角形,則視當前的夾角為無效角度,這種狀態(tài)采用current-to-best1變異策略。
3)TES階段。設為貪婪參數,∈(0,05)。將種群分為較優(yōu)解、中間解和較差解3類,各類所占種群比重分別為、1-2和,更新公式為
(16)
為提高種群搜索多樣性,TES利用較優(yōu)解和較差解之間的差分向量與中間解之和來更新種群個體,計算如下:
(17)
(18)
6)如果當前評價次數達到最大評價次數,則停止優(yōu)化過程,并且輸出最優(yōu)值嗎,如果未達到最大評價次數,則返回步驟2。
1)初始化時間序列樣本的權值分布=(,,…,1,),每個樣本的權值計算如下:
為了達到WHO-FIP藥學教育人才培養(yǎng)“八星藥師”目標和我國臨床藥學專業(yè)培養(yǎng)目標,基于布魯姆學習目標分類法,中國藥科大學構建了臨床藥學專業(yè)本科生的實踐教學體系。
(19)
2)對于迭代輪次=1,2,…,,使用具有當前分布的訓練器的訓練樣本,訓練基預測器=(,)。
3)計算基預測器在訓練樣本集上的預測誤差率:
(20)
(21)
=max |-()|
(22)
式中:,為第個樣本在第個基預測器上的相對平方誤差;為第輪的樣本最大誤差。
4)計算基預測器的權重系數:
(23)
5)更新訓練時間序列集的樣本分布+1,直到迭代輪次達到最大值:
(24)
6)線性組合個基預測器,得到最終的強預測器:
(25)
式中:()為所有()的中位數。
將TSO優(yōu)化器與傳統(tǒng)SGD、Adam優(yōu)化器進行對比,損失函數收斂曲線如圖4所示,可知TSO優(yōu)化器收斂速度更快,優(yōu)化效果更佳。
圖4 損失函數收斂曲線Fig.4 Convergence curve of loss function
結合自適應增強學習器(AdaBoost)與TSO-GRU,提出一種基于TSO-GRU-Ada的目標機動軌跡預測模型。該預測模型主要是以歷史時刻機動軌跡坐標為輸入,以未來時刻的機動軌跡坐標為輸出,挖掘機動軌跡的運動規(guī)律。除此之外,每一種機動單元訓練一個預測模型,選取普適結構,這樣防止出現過擬合現象?;赥SO-GRU-Ada的機動軌跡預測模型如圖5所示。具體步驟如下:
1)獲取訓練樣本。利用3自由度模型機動訓練飛行參數數據提取軌跡參數,構建21種機動訓練樣本集{(,)}(=1,2,…,21)。
2)初始化AdaBoost參數。初始化基預測器算法TSO-GRU,基預測器個數′;初始化訓練樣本的分布權重′。
圖5 基于TSO-GRU-Ada的機動軌跡預測流程Fig.5 Flow chart of maneuver trajectory prediction based on TSO-GRU-Ada
3)訓練基預測器TSO-GRU。初始化TSO種群,即初始化GRU網絡參數;執(zhí)行TSO的變異操作(包括TVS與TES階段);執(zhí)行交叉算子;計算預測均方誤差;執(zhí)行精英選擇策略。執(zhí)行上述優(yōu)化過程直到迭代結束,輸出GRU最優(yōu)網絡權值與偏置量,計算訓練樣本的預測輸出。
4)計算權重系數以及更新樣本分布+1;訓練基預測器直到迭代輪次結束,輸出強預測器TSO-GRU-Ada。
5)通過當前時刻機動單元,選取強預測模型,利用實時目標軌跡特征參數測試強預測器。
為驗證TSO-GRU-Ada預測模型解決空戰(zhàn)機動軌跡預測問題的可行性與有效性,首先利用UCAV 3自由度模型得到大量基本單元飛行軌跡,利用機動軌跡參數獲取TSO- GRU-Ada的AdaBoost基預測器個數、GRU隱藏單元個數、TSO種群規(guī)模;其次,利用UCAV軌跡構建訓練集訓練TSO-GRU-Ada網絡,利用軌跡建立測試集檢驗TSO-GRU-Ada的性能;最后在空戰(zhàn)訓練測量儀(ACMI)系統(tǒng)中抽取一組機動軌跡進行預測。為驗證本文提出方法的優(yōu)越性,將TSO-GRU-Ada與Elman、LSTM、GRU、TSO-LSTM、TSO-GRU作比較,具體參數設置如表2所示。利用UCAV運動學模型獲得21種機動單元樣本集,其速度馬赫數隨機分布為0.3~0.9,在每種機動單元訓練軌跡數100,測試軌跡數10,其中軌跡采樣間隔為0.1 s,單次輸入周期為 10 s,預測周期為2 s。實驗仿真環(huán)境為Windows 10,CPU為 2.80 GHz,8 GB內存,編程軟件MATLAB。每個仿真實驗運行20次,每次運行輪數如表2中所示,統(tǒng)計20次的預測結果。
表2 機動軌跡預測方法參數設置
4.1.1 不同種群規(guī)模的影響
首先從TSO的種群規(guī)模入手進行分析。不同機動單元的不同種群規(guī)模對TSO-GRU-Ada的影響結果如圖6所示。從圖6中可以看出,隨著種群規(guī)模的增加,TSO-GRU-Ada模型的機動軌跡坐標預測值均方根誤差(RMSE)減小,預測時間變化不大;相同種群規(guī)模下,每種機動軌跡單元的RMSE與預測時間變化不大。綜上分析,為了考慮到預測模型訓練時間,選取種群規(guī)模為25。
圖6 不同種群規(guī)模對TSO-GRU-Ada預測性能的影響Fig.6 Effect of different population sizes on the prediction performance of TSO-GRU-Ada
4.1.2 不同基預測器個數的影響
在不同機動軌跡單元情況下,不同基預測器個數對TSO-GRU-Ada預測性能的影響結果如圖7所示。從圖7中可以看出,隨著基預測器數目的增加,TSO-GRU-Ada模型的預測RMSE減小,預測時間增加;在相同基預測器數量下,21種機動軌跡單元的RMSE與預測時間變化不大。綜上分析,本文選取基預測器個數′=8。
圖7 不同基預測器個數對TSO-GRU-Ada預測性能的影響Fig.7 Effect of the number of base predictors on the prediction performance of TSO-GRU-Ada
4.1.3 隱層單元數的影響
在不同機動軌跡單元的情況下不同GRU隱層單元數對TSO-GRU-Ada預測性能的影響結果如圖8所示。從圖8中可以看出,隨著GRU隱層單元數的增加,TSO-GRU-Ada模型的預測RMSE減小,預測時間增加;在相同隱層單元數下,21種機動軌跡單元的預測值RMSE與預測時間變化不大。綜上分析,本文選取隱層單元數為20。
圖8 不同隱層單元數對TSO-GRU-Ada預測性能的影響Fig.8 Effect of different hidden layer unit numbers on the prediction performance of TSO-GRU-Ada
根據TSO-GRU-Ada模型參數分析仿真實驗,機動軌跡預測模型選取輸入步長′=10,輸出步長′=1,TSO-GRU-Ada選取8個弱預測器,TSO優(yōu)化種群規(guī)模為25,隱層單元數為20。仿真實驗的測試集由21種機動軌跡單元樣本組成(每種機動軌跡單元有10個軌跡樣本),同時采用的是RMSE和預測時間作為預測性能的評價指標。表3給出了TSO-GRU-Ada與其他預測算法預測統(tǒng)計結果。從RMSE角度看,TSO-GRU-Ada算法在21種機動軌跡單元中表現最好,說明AdaBoost方法對提升預測精度有顯著作用;TSO-GRU排名在GRU之前,表明TSO的優(yōu)化效果顯著。從預測時間角度來看,GRU的預測時間最短;由于TSO-GRU-Ada使用了集成器,預測時間是最長的,平均預測時間約為0.027 s,相比于0.1 s的采樣時間能夠滿足實時性要求。
表3 TSO-GRU-Ada與其他預測算法預測統(tǒng)計結果比較
續(xù)表3
在水平面機動動作、垂直面機動動作和空間組合機動動作中各選取一種機動單元進行仿真驗證。選取、和。為凹上爬升機動,為右轉彎機動,為右轉彎凸下飛機動。從圖9(a)中可以看出:機動軌跡軸誤差不超過44 m,軸誤差不超過45 m,軸誤差不超過45 m。從圖10中可以看出,機動軌跡軸誤差不超過13 m,軸誤差不超過13 m,軸誤差不超過11 m。從圖11中可以看出,機動軌跡軸誤差不超過3 m,軸誤差不超過4 m,軸誤差不超過37 m。綜上分析,在3種不同類別機動單元中基于TSO-GRU-Ada的軌跡預測誤差較小,滿足精度要求。
圖9 機動軌跡單元E02的TSO-GRU-Ada預測結果Fig.9 TSO-GRU-Ada prediction results of maneuver trajectory unit E02
圖10 機動軌跡單元E15的TSO-GRU-Ada預測結果Fig.10 TSO-GRU-Ada prediction results of maneuver trajectory unit E15
圖11 機動軌跡單元E19的TSO-GRU-Ada預測結果Fig.11 TSO-GRU-Ada prediction results of maneuver trajectory unit E19
為驗證本文所提方法在連續(xù)機動軌跡上的預測性能,從ACMI系統(tǒng)中挑選出一組機動軌跡,平均速度馬赫數為0.75,分別與Elman、LSTM、GRU、TSO-LSTM、TSO-GRU算法進行預測對比,具體參數如表2所示。
從圖12中可以看出TSO-GRU-Ada所預測的軌跡與真實軌跡基本重合,由圖13可以看出本文算法在軸、軸和軸預測絕對誤差都相對較小。表4通過平均絕對誤差(MAE)和標準差(STD)評價預測的準確性與魯棒性,在表4中可以直觀看出本文算法在軸、軸、軸和總誤差方面MAE均為最小,表明與對比模型相比本文模型的預測精度更高。同樣本文模型具有較低的STD,相比于其他5種對比模型的魯棒性能較好,但相對于機動單元預測,連續(xù)軌跡預測精度有所下降。
圖12 機動軌跡三維預測圖Fig.12 3D prediction of maneuver trajectory
圖13 軌跡預測誤差Fig.13 Trajectory prediction error
表4 機動軌跡預測MAE統(tǒng)計結果
本文在UCAV機動軌跡預測問題上建立UCAV 3自由度模型,解決了數據來源問題;創(chuàng)新性地利用機動軌跡特征參數建立機動單元庫,將復雜軌跡劃分為簡單單元結構;介紹門控循環(huán)神經網絡,并利用三角搜索優(yōu)化算法更新網絡內部權值和偏置,避免陷入局部最優(yōu)。得到以下主要結論:
1)在不同機動單元中對TSO-GRU-Ada參數進行仿真實驗,挑選出最優(yōu)結構,選取參數分別為:種群規(guī)模25、基預測器個數′=8、隱層單元數20。
2)在21種機動單元情況下,TSO-GRU-Ada與Elman、LSTM、GRU、TSO-LSTM、TSO-GRU進行比較預測,結果表明其預測精度最高,且單步平均預測時間為0.027 s,滿足預測時效性能。
3)在平均速度馬赫數為0.75的連續(xù)機動軌跡情況下再次進行預測對比,預測精度較高且魯棒性能較好,能夠同時滿足高預測精度和短預測時耗要求,但相對于機動單元預測,精度有所下降。
未來在連續(xù)機動軌跡預測上需要繼續(xù)發(fā)展,進一步提高預測精度。