傅莉,謝福懷,孟光磊,王東政
(1.沈陽航空航天大學(xué) 航空航天工程學(xué)部,沈陽 110136;2.沈陽航空航天大學(xué) 自動化學(xué)院,沈陽 110136;3.大連理工大學(xué) 電子信息與電氣工程學(xué)部,大連 116024)
作為空戰(zhàn)決策最核心的內(nèi)容,無人戰(zhàn)斗機(UCAV)的機動決策問題目前已經(jīng)隨著無人機各項關(guān)鍵技術(shù)的快速發(fā)展愈來愈受到世界各國的重視.目前,常用空戰(zhàn)機動決策方法有:矩陣對策法、微分對策法、專家系統(tǒng)法、決策影響圖法等[1-4].專家系統(tǒng)法是空戰(zhàn)決策研究中提出最早、技術(shù)最成熟的方法.專家系統(tǒng)是一種知識信息處理系統(tǒng),而不是數(shù)值信息計算系統(tǒng)[5].其決策過程直接根據(jù)專家知識進行推理,相對其他幾種決策方法,專家系統(tǒng)法不需要進行大量計算,對于瞬息萬變的真實戰(zhàn)場環(huán)境,能較快地做出反應(yīng),具有響應(yīng)速度快、結(jié)構(gòu)簡單的特點.
然而專家系統(tǒng)在空戰(zhàn)機動決策上的應(yīng)用也有它自身不可避免的缺陷,由于專家系統(tǒng)知識庫中存儲的知識都是固化的數(shù)據(jù),空戰(zhàn)時一旦出現(xiàn)系統(tǒng)知識庫未存儲的空戰(zhàn)態(tài)勢,專家系統(tǒng)就失效了[6-7].為了防止空戰(zhàn)時出現(xiàn)系統(tǒng)失效的情況,本文在已有的專家系統(tǒng)中引入滾動時域法[8],當(dāng)系統(tǒng)出現(xiàn)失效時,系統(tǒng)采用滾動時域代替專家系統(tǒng)進行空戰(zhàn)機動決策.
空戰(zhàn)機動決策專家系統(tǒng)主要由3個部分組成,即知識庫、機動庫和推理機.當(dāng)專家系統(tǒng)無人戰(zhàn)機進入備戰(zhàn)狀態(tài)時,機載傳感器獲得當(dāng)前敵我雙方態(tài)勢信息,由專家系統(tǒng)推理機將態(tài)勢信息與知識庫中各個規(guī)則的條件進行匹配,直到找到與態(tài)勢信息相符的規(guī)則,根據(jù)該規(guī)則所對應(yīng)的結(jié)論,調(diào)用機動庫中相應(yīng)的飛行機動,并予以執(zhí)行.當(dāng)無人戰(zhàn)機執(zhí)行完機動后,專家系統(tǒng)會按設(shè)定的時間間隔再次調(diào)用機載傳感器獲取下一時刻的態(tài)勢信息,然后再次進行決策,直至空戰(zhàn)結(jié)束.由此可知,可以將整個無人戰(zhàn)機的空戰(zhàn)過程分割成一個個離散的時間域,每個時間域里,無人戰(zhàn)機通過機動的選擇與調(diào)用,來完成該時域內(nèi)的決策和無人戰(zhàn)機的飛行,這些機動的疊加就是無人戰(zhàn)機的最終飛行軌跡.
通過以上對空戰(zhàn)專家系統(tǒng)的分析,將整個空戰(zhàn)過程離散化,專家系統(tǒng)機動決策最優(yōu)控制問題可描述成方程組(式(1)~式(3))中最優(yōu)控制序列 u(t)∈Ω,t=t0,t1,…,tn-1的求解,使得性能指標 J(xtk,utk)最大[9].其中,Ω 為控制量 u(t)的控制約束,時間 t0,t1,…,tn-1分別為專家系統(tǒng)進行決策的每一時刻.
1.2.1 系統(tǒng)狀態(tài)方程描述
為了描述載機和目標機的相對運動,空戰(zhàn)中雙方態(tài)勢分別用狀態(tài)向量Xr、Xb來表示,下標r和b分別代表我方(紅方)和敵方(藍方).
式中:xi、yi和zi為地坐標系下戰(zhàn)機的位置坐標;vi為戰(zhàn)機的速度;θi、ψi和φi分別為在地坐標系中戰(zhàn)機的航跡傾斜角、航跡方位角和航跡滾轉(zhuǎn)角.
忽略側(cè)滑角的影響,且假設(shè)發(fā)動機推力沿著飛行速度方向,則飛機在航跡坐標系上的質(zhì)點動力學(xué)方程為
再通過地坐標系和航跡坐標系的轉(zhuǎn)換矩陣Lkg,由ωy和ωz可求得戰(zhàn)機在地坐標系下的航跡傾斜角角速度、航跡方位角角速度和航跡滾轉(zhuǎn)角角速度
將戰(zhàn)機質(zhì)心的速度矢量投射到地面坐標軸系后,可得到相應(yīng)的運動學(xué)方程組:
式中:Vx、Vy和Vz分別為速度V在地坐標系OZg軸、OXg軸和OYg軸上的分量.
則根據(jù)動力學(xué)方程組(式(5)~式(7))和運動學(xué)方程組(式(11)~式(16))可知,只要給定了戰(zhàn)機的任意時刻的初始狀態(tài)和該時刻的控制量過載nx、ny和nz即可通過求解上述動力學(xué)方程組來得到戰(zhàn)機下一時刻的狀態(tài).
1.2.2 控制約束設(shè)計
機動動作庫包含供決策選用的動作集,是建立空戰(zhàn)機動決策模型的基礎(chǔ).現(xiàn)階段,在決策系統(tǒng)設(shè)計中,普遍采用美國國家航空航天局(NASA)學(xué)者提出的7種基本操縱動作[10]:最大加速、最大減速、最大過載爬升、最大過載俯沖、最大過載左轉(zhuǎn)、最大過載右轉(zhuǎn)和穩(wěn)定飛行.基本上,所有的機動都可以分解為這7種操縱動作的一種或者幾種的疊加.本文機動動作庫在構(gòu)建了7種基本操縱動作的基礎(chǔ)上,又以經(jīng)典空戰(zhàn)戰(zhàn)術(shù)飛行動作為依據(jù),建立的一些空戰(zhàn)中常用的戰(zhàn)術(shù)動作,包括盤旋機動、半斤斗機動和蛇形機動等.
對于7個基本操縱動作的設(shè)計,本文戰(zhàn)機系統(tǒng)狀態(tài)方程選取過載nx、ny和nz作為控制變量,所以可以通過設(shè)計這些參數(shù)的變化規(guī)律來控制戰(zhàn)機完成機動動作.對于戰(zhàn)術(shù)動作庫的設(shè)計,可以將戰(zhàn)術(shù)機動分解為這7種基本操縱動作中一種或幾種的疊加.在飛行過程中,戰(zhàn)機根據(jù)空戰(zhàn)態(tài)勢、武器發(fā)射條件等,為滿足特定的戰(zhàn)術(shù)要求,在特定的態(tài)勢和時間,切換7種基本動作,從而完成特定的戰(zhàn)術(shù)動作設(shè)計.
通過以上機動庫設(shè)計原理和系統(tǒng)狀態(tài)方程的分析,由于機動庫中過載nx、ny和nz這些參數(shù)的變化規(guī)律都已經(jīng)設(shè)計好,空戰(zhàn)專家系統(tǒng)是通過機動的選擇和調(diào)用來實現(xiàn)對飛機狀態(tài)Xi的控制,所以這里的控制約束Ω指的是專家系統(tǒng)機動庫,控制量u(t)為機動庫中的各個機動.
1.2.3 空戰(zhàn)機動決策指標函數(shù)的建立
以我機位置為原點R(O),在地坐標系下對兩機空戰(zhàn)態(tài)勢關(guān)系進行分析,如圖1所示.
圖1 雙機空戰(zhàn)態(tài)勢關(guān)系Fig.1 Relation of situation of two sides in air combat
空戰(zhàn)目的都是發(fā)現(xiàn)、跟蹤、擊毀空中目標,使其失去對我方形成威脅的能力.機載雷達和空空導(dǎo)彈已成為了現(xiàn)代空戰(zhàn)的主要探測和攻擊武器,空戰(zhàn)態(tài)勢優(yōu)勢函數(shù)的建立,應(yīng)該從空戰(zhàn)態(tài)勢對戰(zhàn)機雷達跟蹤區(qū)和導(dǎo)彈攻擊區(qū)的影響這兩方面進行定量分析[11-14].所以本文在建立態(tài)勢優(yōu)勢函數(shù)時,主要考慮角度優(yōu)勢函數(shù)、距離優(yōu)勢函數(shù)和能量優(yōu)勢函數(shù).
1)角度優(yōu)勢函數(shù).
角度優(yōu)勢函數(shù)關(guān)系到我機對目標的有效跟蹤.當(dāng)我機的目標方位角小時,我機導(dǎo)彈發(fā)射的離軸角也越小,有利于提高導(dǎo)彈命中率,使我機對敵機的威脅達到最大,實現(xiàn)我機對敵機的有效跟蹤.本文選取空空導(dǎo)彈不可逃逸離軸角ψMmax為60°,雷達探測最大角度ψRmax為85°,將目標方位角分為雷達搜索區(qū)、導(dǎo)彈攻擊不可逃逸區(qū)和雷達搜索區(qū)以外3個區(qū)域,并構(gòu)造角度優(yōu)勢函數(shù):
2)距離優(yōu)勢函數(shù).
式中:
如果當(dāng) D=DMmin或 D=DMmax時,均有 SD=0.95,則有正態(tài)分布標準差為
3)能量優(yōu)勢函數(shù).
戰(zhàn)機能量優(yōu)勢函數(shù)主要與戰(zhàn)機速度和高度有關(guān).戰(zhàn)機的能量越大,則戰(zhàn)機機動能力越強,使戰(zhàn)機在超視距空戰(zhàn)中能盡快機動到對目標機實施打擊的最佳空戰(zhàn)位置,而且在較大能量時,空空導(dǎo)彈使用速度更大,對目標機實施攻擊的成功率更高.本文將能量看作戰(zhàn)機動能與勢能的和,定義戰(zhàn)機單位能量為
式中:H為戰(zhàn)機當(dāng)前高度.戰(zhàn)機能量優(yōu)勢函數(shù)為
式中:Er為我方(紅方)戰(zhàn)機單位能量;Eb為敵方(藍方)戰(zhàn)機單位能量.
綜合考慮角度和距離之間的相關(guān)關(guān)系,在此,以乘積表示角度與距離的綜合優(yōu)勢.最終可以得出空戰(zhàn)態(tài)勢優(yōu)勢函數(shù)的計算公式為
式中:K1和K2為加權(quán)系數(shù),且有K1+K2=1(0<K1,K2<1).
結(jié)合以上所建立的空戰(zhàn)態(tài)勢優(yōu)勢函數(shù),以任意時刻我機態(tài)勢優(yōu)勢值與敵機態(tài)勢優(yōu)勢值的差值作為我機進行機動決策的指標:
滾動時域控制(Receding Horizon Control,RHC)是20世紀70年代由工業(yè)界首先構(gòu)思出來的一種控制方法,其核心是在線滾動優(yōu)化,將廣義控制全局問題的求解轉(zhuǎn)化為在線滾動進行的一系列局部優(yōu)化問題,使得計算復(fù)雜性和計算資源消耗都大幅降低.滾動優(yōu)化把整個RHC任務(wù)過程分為一個個相互重疊(單步預(yù)測時是不重疊的)但不斷向前推進的優(yōu)化區(qū)間,稱為滾動時域.在某一滾動時域的開始,用系統(tǒng)的當(dāng)前狀態(tài)作為初始條件,在線求解該有限時域開環(huán)最優(yōu)控制問題,得到最優(yōu)控制序列.并在該時刻,僅取最優(yōu)控制序中的第1個控制信號實際作用到系統(tǒng)中.在下一滾動時域,重復(fù)以上過程.隨著動態(tài)過程的延續(xù),控制算法推進預(yù)測時域向前滾動,從而形成滾動優(yōu)化.對于含狀態(tài)約束以及輸入約束等限制條件的系統(tǒng),在不知道目標未來運動信息的條件下,滾動時域控制是一種有效的控制方法[15-16].滾動時域控制原理如圖2所示.
通過以上分析,假設(shè)每一次決策之間的時間間隔是固定的,定義任意起始時刻tk的滾動時域為[tk,tk+nΔt],n 為滾動時域步長,Δt為決策時間間隔,則圖中可表示為.根據(jù)第 2 節(jié)所建立的專家系統(tǒng)空戰(zhàn)機動決策最優(yōu)控制模型,則求解滾動時域內(nèi)最優(yōu)控制序列[utk|tk,utk+Δt|tk,…,utk+nΔt|tk]的指標函數(shù)為
圖2 滾動時域控制原理圖Fig.2 RHC schematic
設(shè)定空戰(zhàn)初始條件為原專家系統(tǒng)中未定義的空戰(zhàn)態(tài)勢,即原專家系統(tǒng)失效,通過原專家系統(tǒng)和改進后專家系統(tǒng)的仿真對比,驗證改進后的專家系統(tǒng)具有更強的適應(yīng)性.仿真初始條件如表1所示.
表1 仿真初始條件Table 1 Initial conditions for simulation
圖3和圖4分別為原專家系統(tǒng)空戰(zhàn)仿真結(jié)果和滾動時域法改進后的專家系統(tǒng)仿真結(jié)果.
由圖3可以看出空戰(zhàn)開始,原專家系統(tǒng)就出現(xiàn)失效狀況,我機維持起始飛行狀態(tài),作勻速直線運動,我機態(tài)勢優(yōu)勢值也呈現(xiàn)遞減的趨勢,最終被敵機擊落.
圖3 原專家系統(tǒng)機動決策Fig.3 Expert system maneuver decision
圖4 改進專家系統(tǒng)機動決策Fig.4 Improved expert system maneuver decision
圖4為引進滾動時域法后的專家系統(tǒng),在專家系統(tǒng)決策出現(xiàn)失效的情況下,系統(tǒng)采用滾動時域控制代替專家系統(tǒng)進行空戰(zhàn)機動決策.如圖4所示,敵我空戰(zhàn)開始時刻,專家系統(tǒng)出現(xiàn)失效,滾動時域法求解最優(yōu)控制機動.第1階段,我機作偏航純跟蹤機動,向敵機偏轉(zhuǎn)同時保持一定的增速;第2階段,我機通過最大加速直飛行機動與敵機拉開距離;第3階段,當(dāng)我機和敵機拉開一定的距離,我機作最大過載左轉(zhuǎn)彎機動,快速向敵機偏轉(zhuǎn);第4階段,當(dāng)我機角度向敵機偏轉(zhuǎn)到一定角度時,我機對敵機形成側(cè)向攻擊態(tài)勢,由專家系統(tǒng)進行決策,我機繼續(xù)采用最大過載左轉(zhuǎn)彎機動;第5階段,通過前兩個階段的最大過載左轉(zhuǎn)彎機動,我機與敵機形成迎頭攻擊態(tài)勢,繼續(xù)由專家系統(tǒng)進行決策,我機采用偏航純跟蹤機動,實現(xiàn)對敵的跟蹤.由圖4可知,引進滾動時域法后的專家系統(tǒng),在專家系統(tǒng)法失效的情況下,仍能做出有效的機動,實現(xiàn)敵我態(tài)勢的逆轉(zhuǎn),我機態(tài)勢優(yōu)勢值呈遞增的趨勢.
本文建立了一套基于滾動時域的無人戰(zhàn)機空戰(zhàn)決策專家系統(tǒng).通過與原專家系統(tǒng)的仿真對比,驗證了改進后的系統(tǒng)在專家系統(tǒng)法失效的情況下,能快速地進行自主決策,使我機有效地規(guī)避目標威脅并達成攻擊條件.基于滾動時域的無人戰(zhàn)機空戰(zhàn)決策專家系統(tǒng)不僅保留了專家系統(tǒng)機動決策法的優(yōu)點,而且克服了專家系統(tǒng)法適應(yīng)性差的缺陷.綜合分析可得基于滾動時域的無人戰(zhàn)機空戰(zhàn)決策專家系統(tǒng)的特點為:
1)系統(tǒng)能充分發(fā)揮專家的經(jīng)驗優(yōu)勢,決策過程不需復(fù)雜的算法計算,有利于提高機動決策的實時性.
2)系統(tǒng)具有良好的可維護性和擴展性.對于不同的機型,系統(tǒng)可以根據(jù)需要對知識庫中的知識進行增刪、修改、擴充等操作.
3)系統(tǒng)具有更強的靈活性和適應(yīng)性.系統(tǒng)綜合使用專家系統(tǒng)法和滾動時域法進行決策,在任何的空戰(zhàn)態(tài)勢下,都能做出有效的機動決策.
除了實現(xiàn)對專家系統(tǒng)的改進,本文建立的專家系統(tǒng)機動決策最優(yōu)空戰(zhàn)模型,對以后專家系統(tǒng)的研究以及智能算法的引入都具有一定的借鑒意義.
References)
[1] Galati D G.Game theoretic target assignment strategies in competitive multi-team systems[D].Pittsburgh:University of Pittsburgh,2004.
[2] Imado F,Kuroda T.A method to solve missile-aircraft pursuitevasion differential games[C]∥Proceedings of the 16th IFAC World Congress.Laxenburg:IFAC,2005,16:176-181.
[3] Virtanen K,Raivio T.Modeling pilot’s sequential maneuvering decisions by a multistage influence diagram[J].Journal of Guidance,Control,and Dynamics,2004,27(4):665-677.
[4]董彥非,郭基聯(lián),張恒喜.空戰(zhàn)機動決策方法研究[J].火力與指揮控制,2002,27(2):75-78.Dong Y F,Guo JL,Zhang H X.The methods of air combat maneuvering decision[J].Fire Control& Command Control,2002,27(2):75-78(in Chinese).
[5]趙威.基于專家系統(tǒng)的雙機協(xié)同攻擊決策技術(shù)研究[D].西安:西北工業(yè)大學(xué),2007.Zhao W.Based on expert system coordination air fight decision research[D].Xi’an:Northwestern Polytechnical University,2007(in Chinese).
[6] Platts JT,Howell SE,Peeling E C,et al.Increasing UAV intelligence through learning[C]∥AIAA 3rd“Unmanned Unlimited” Technical Conference,Workshop and Exhibit.Reston:AIAA,2004,1:270-282.
[7] Xiao L,Sun D,Liu Y,et al.A combined method based on expert system and BP neural network for UAV systems fault diagnosis[C]∥2010 International Conference on Artificial Intelligence and Computational Intelligence.Piscataway,NJ:IEEE Press,2010,3:3-6.
[8] Xu B,Kurdila A,Stilwell D J.A hybrid receding horizon control method for path planning in uncertain environments[C]∥The 2009 IEEE/RSJ International Conference on Intelligent Robots and Systems.Piscataway,NJ:IEEE Press,2009:4887-4892.
[9] McGrew JS,How J P,Williams B,et al.Air-combat strategy using approximate dynamic programming[J].Journal of Guidance,Control,and Dynamics,2010,33(5):1641-1654.
[10] Fred A,Giro C,Michael F.Automated maneuvering decisions for air to air combat[R].Reston:AIAA,1987.
[11] James SM.Real-time maneuvering decisions for autonomous air combat[D].Massachusetts:Massachusetts Institute of Technology,2008.
[12]馬偉江,姚佩陽,周翔翔.改進的超視距空戰(zhàn)態(tài)勢評估方法[J].計算機工程與設(shè)計,2011,32(6):2096-2099.MaW J,Yao P Y,Zhou X X.Improved method of situation assessment in BVR air combat[J].Computer Engineering and Design,2011,32(6):2096-2099(in Chinese).
[13]吳文海,周思羽,高麗.基于導(dǎo)彈攻擊區(qū)的超視距空戰(zhàn)態(tài)勢評估改進[J].系統(tǒng)工程與電子技術(shù),2011,33(12):2679-2685.Wu W H,Zhou S Y,Gao L.Improvements of situation assessment for beyond-visual-range air combat based on missile launching envelope analysis[J].Journal of Systems Engineering and Electronics,2011,33(12):2679-2685(in Chinese).
[14]張洪波,李國英,丁全心.超視距空戰(zhàn)下的態(tài)勢評估技術(shù)研究[J].電光與控制,2010,17(4):9-13.Zhang H B,Li G Y,Ding Q X.Research on situation assessment in BVR air combat[J].Electronics Optics & Control,2010,17(4):9-13(in Chinese).
[15]付昭旺,李戰(zhàn)武,強曉明.基于滾動時域控制的戰(zhàn)斗機空戰(zhàn)機動決策[J].電光與控制,2013,20(3):20-29.Fu ZW,Li ZW,Diang X M.Tactical decision-making method based on receding horizon control for air combat[J].Electronics Optics & Control,2013,20(3):20-29(in Chinese).
[16] Bellingham J,Richards A,How JP.Receding horizon control of autonomous aerial vehicles[C]∥Proceedings of the American Control Conference,2002.Piscataway,NJ:IEEE Press,2002,5:3741-3746.