張 歡,吳 軍,何貴波,吳志峰
(1.空軍工程大學(xué)航空航天工程學(xué)院,陜西 西安 710038;2.中國人民解放軍93256部隊,遼寧 沈陽 110034)
隨著任務(wù)規(guī)劃系統(tǒng)的不斷發(fā)展,人們對機載傳感器規(guī)劃的研究也陸續(xù)開展起來,傳感器規(guī)劃用于作戰(zhàn)飛機在完成任務(wù)執(zhí)行過程中對自身的機載傳感器使用計劃的制定,其中包括對傳感器的選用、使用時機、使用策略等[1],并對使用后的效果進行分析,評估達成任務(wù)目的的可行性,以此更好地發(fā)揮裝備的作戰(zhàn)效能和完成作戰(zhàn)任務(wù)。傳感器規(guī)劃與航線規(guī)劃密切相關(guān),通常是在航線規(guī)劃完成以后開始實施,以航線中的某個位置作為使用時機開展傳感器的使用計劃制定工作,當(dāng)使用時機不能滿足既定的目標(biāo)要求時,需要及時調(diào)整使用時機或?qū)骄€進行修改。
本文將主要探究在傳感器規(guī)劃過程中如何根據(jù)目標(biāo)的狀態(tài)來設(shè)置傳感器的使用時機、使用策略,如何實時跟蹤捕捉到目標(biāo),以及如何將捕捉到的信息及時反饋回來,以便能夠?qū)崟r地對飛行航線進行局部調(diào)整。為此,本文提出了一種改進的模型預(yù)測控制(model prediction control,MPC)算法,該算法將傳統(tǒng)MPC的基本思想[2]與卡爾曼濾波中的目標(biāo)狀態(tài)估計理論相結(jié)合,仿真結(jié)果表明:該算法在解決傳感器探測跟蹤移動目標(biāo)方面具有良好的效果,能夠比較準(zhǔn)確、快速地搜索到移動目標(biāo)。
MPC是20世紀70年代在工業(yè)控制領(lǐng)域出現(xiàn)的一種新型控制算法,該算法的基本思想是在每個推進步長中先預(yù)測未來的輸出狀態(tài),然后確定控制動作。在下一個推進步長中重復(fù)進行優(yōu)化過程,并保持原有的優(yōu)化性能指標(biāo)不變,改變其作用區(qū)域,以此體現(xiàn)MPC算法在線滾動優(yōu)化特點。常規(guī)MPC主要包含3個基本的要素:預(yù)測模型、滾動優(yōu)化和反饋校正[2]。
1)預(yù)測模型
預(yù)測模型用來表述對象的輸入輸出動態(tài)行為,就是根據(jù)對象的歷史信息和未來輸入來確定對象的未來輸出。
2)滾動優(yōu)化
滾動優(yōu)化是一種基于優(yōu)化的控制,通常情況下,是根據(jù)某一性能指標(biāo)的最優(yōu)來確定未來的控制作用,其數(shù)學(xué)描述一般為:設(shè)預(yù)測時域為m個步長,控制時域為n個步長,n≤m,在尋優(yōu)的過程中,對于任意時刻j,通過上述推進步長可計算出對應(yīng)的控制序列,直至尋優(yōu)結(jié)束。因此,可定義目標(biāo)函數(shù)為
滾動優(yōu)化實質(zhì)上是對目標(biāo)函數(shù)在線不斷滾動尋優(yōu)的過程。
3)反饋校正
反饋校正環(huán)節(jié)用于補償模型預(yù)測誤差或其它干擾因素所產(chǎn)生的擾動。
在基于MPC的傳感器規(guī)劃算法中,首先需要做的是構(gòu)建一個初始搜索圖C(D,S),對于任意一點r∈R,在該圖中都存在一條邊s∈S,滿足r∈FOR(s),其中,F(xiàn)OR為傳感器能夠覆蓋到的所有目標(biāo)探測區(qū)域,接下來將利用已有的信息對搜索圖進行初始化。假設(shè)載機的起始位置為點d0,隨機選取3個點d1,d2和d3作為初始任務(wù)點,由這4個點構(gòu)成一條初始航線P=(d0,d1,d2,d3)與相應(yīng)的傳感器計劃L(P,0)。在載機沿著初始的航線P從起始點d0飛到任務(wù)點d1的過程中,傳感器根據(jù)初始的傳感器計劃L(P,0)對目標(biāo)區(qū)域進行探測,并根據(jù)探測的結(jié)果對目標(biāo)區(qū)域的目標(biāo)估計信息進行更新。同時計算出未來的飛行航線P=(d1,d2,d3,…,di+3)和對應(yīng)的傳感器計劃L(P,i),使得期望的航線收益(P)達到最大。當(dāng)載機到達任務(wù)點d1之后,就以d1作為新的起始點,滾動優(yōu)化重復(fù)以上步驟,直到最終發(fā)現(xiàn)目標(biāo)。最后,分析此次傳感器規(guī)劃過程中傳感器的使用效果,并對是否達成作戰(zhàn)目的的可行性做出評估分析。
基于MPC的傳感器規(guī)劃算法的具體流程圖如圖1所示。
接下來主要針對算法流程中的初始搜索圖如何構(gòu)建、傳感器計劃L的定義、航線收益R(p)的計算、基于卡爾曼濾波理論的目標(biāo)狀態(tài)估計模型的建立以及如何分析傳感器的使用效果等幾個方面進行剖析。
在搜索圖問題中,以圖的頂點表示航線點,2個頂點之間的連線表示一條航段,通常將圖整體記為C,將圖C中的全體頂點構(gòu)成的集合記為D,圖C中的全部邊構(gòu)成的集合記為S,并記C=(D,S),圖搜索問題的本質(zhì)實際上就是在滿足給定約束指標(biāo)的前提下,在圖中尋找出一條最優(yōu)的航線[4]。如圖2所示為一個基本的圖模型,其中d1~d9為航線點,s1~s9表示航段,航段未完全標(biāo)出。
有了基本圖模型之后,可根據(jù)基本圖模型來構(gòu)建搜索圖。在一片搜索區(qū)域R上構(gòu)造一個四邊形均勻網(wǎng)格圖C=(D,S),網(wǎng)格圖C必須滿足如下條件:對于搜索區(qū)域R內(nèi)的任意一點r,都有與之相對應(yīng)的一條邊s∈S,能夠保證r落在邊s上的某些點的傳感器可探測區(qū)域(FOR)內(nèi),由此可以確定圖內(nèi)的任意一點傳感器都能夠探測到。
圖1 基于MPC的傳感器規(guī)劃算法流程圖Fig 1 Flow chart of sensor planning algorithm based on MPC
圖2 基本圖模型Fig 2 Basic graph model
某型作戰(zhàn)飛機在執(zhí)行任務(wù)之前,首先需根據(jù)已有的先驗情報信息對搜索圖進行初始化,利用目標(biāo)狀態(tài)估計理論所獲取的目標(biāo)信息對網(wǎng)格圖C中的目標(biāo)信息進行初始化。如圖3所示為構(gòu)建的初始搜索圖,圖上的點d0為載機的初始位置,點d1,d2和d3為預(yù)先選取的3個任務(wù)點,圖上的小黑點為搜索圖初始化后目標(biāo)估計的位置分布情況。
1)傳感器視場(FOV)和觀測場(FOR定義)
傳感器在地面上的瞬時探測區(qū)域稱為傳感器的視場,即為FOV,觀測場FOR則是隨著載機的移動和對傳感器進行的一些操作,F(xiàn)OV在地面上不斷移動,進而形成的載機對地面的全部探測范圍稱之為觀測場[5]。如圖4所示為某型機載雷達的探測視場示意圖。
圖3 構(gòu)建的初始搜索圖Fig 3 Builded initial search graph
圖4 傳感器視場FOV示意圖Fig 4 FOV diagram of sensor field
由圖4可以看出:FOV范圍的大小由傳感器的探測點和視場大小決定,由于FOV的大小一般由傳感器的系統(tǒng)參數(shù)決定,并且在一定范圍以內(nèi)其值通常不變,為常數(shù)。因此,在研究傳感器規(guī)劃問題中,通常用傳感器的觀測點來描述傳感器規(guī)劃問題。
2)傳感器任務(wù)的定義
假設(shè)i時刻傳感器的觀測點為q(i),則指向q(i)的傳感器視場定義為FOV(q(i)),一個作用在FOV(q(i))范圍內(nèi)的時延定義為一個傳感器任務(wù),記為q(i)[6]。
傳感器任務(wù)的序列稱為傳感器計劃,一般來講,一個傳感器計劃是由多個傳感器任務(wù)序列組合而成的,屬于離散范疇內(nèi)的對象,因此,可記為
定義i時刻傳感器的瞬時搜索增益為r(i),其含義實質(zhì)上為i時刻發(fā)現(xiàn)目標(biāo)的概率,如果一個目標(biāo)處于傳感器的FOV內(nèi)且被發(fā)現(xiàn)了,則收益為1,傳感器初始搜索收益為r(0)=0。傳感器的下一步搜索收益一般由傳感器任務(wù)q(i)、當(dāng)前的目標(biāo)狀態(tài)估計值設(shè)為x(i)和當(dāng)前搜索收益決定,其計算式
式中 函數(shù)g的值為i+1時刻目標(biāo)被發(fā)現(xiàn)的概率。
航線P的收益可定義
式中TP為航線P上所有的可能執(zhí)行的傳感器任務(wù)總數(shù),r(τ)為 τ 時刻傳感器的搜索收益[7]。
本文采用了卡爾曼濾波器來估計目標(biāo)的狀態(tài)分布,卡爾曼濾波是一種經(jīng)典的、最優(yōu)估計的遞推濾波算法,具有精度高、實時性好的特點[8]。設(shè)目標(biāo)的卡爾曼濾波狀態(tài)方程
式中 X(k)為k時刻目標(biāo)的狀態(tài)向量,X(k)∈Rn,A為k時刻狀態(tài)轉(zhuǎn)移矩陣,W(k)則是均值為0的高斯白噪聲。
假設(shè)目標(biāo)的位置可表示為
式中 f函數(shù)表示k時刻目標(biāo)的真實位置,ΔX(k)則表示誤差量,則可將上式用矩陣形式表示為
將公式(7)作為卡爾曼濾波的量測方程,其中C表示狀態(tài)信號與輸出信號之間的增益矩陣。
可進一步求出誤差協(xié)方差矩陣為
增益矩陣
X(k)的狀態(tài)估計值
測量噪聲方差陣為
式(5)~式(11)組成了以卡爾曼濾波理論為原理的目標(biāo)狀態(tài)估計模型。
在每進行完一次傳感器規(guī)劃之后,應(yīng)當(dāng)對此次規(guī)劃過程中的傳感器使用效果進行分析,如圖5所示為某機載雷達使用效果分析圖。
從上圖中可以看出:為了檢驗機載雷達的使用效果,在雷達規(guī)劃組件中將用戶設(shè)置的雷達操控參數(shù)、使用時機、載機的即時位置與姿態(tài)信息、目標(biāo)/目標(biāo)區(qū)信息、氣象信息等發(fā)送到雷達模型,接收其作用范圍、可探測度等使用效果的計算結(jié)果,并以圖形化方式進行直觀顯示[10]。
分析完MPC算法基本流程中的關(guān)鍵要點之后,接下來通過仿真驗證該算法在傳感器規(guī)劃過程中的使用效果、算法的合理性。
圖5 機載雷達使用效果分析圖Fig 5 Using effect analysis diagram of airborne radar
仿真實驗采用VS2010編程軟件,利用之前介紹的圖搜索原理,選取了一片50 km×50 km的網(wǎng)格式任務(wù)區(qū)域,該區(qū)域作為傳感器對移動目標(biāo)的搜索區(qū)域。假設(shè)目標(biāo)以近似勻速直線方式運動,卡爾曼濾波系統(tǒng)的初始參數(shù)設(shè)置如下
如圖6所示為仿真實驗效果圖。其中,點1為執(zhí)行任務(wù)的載機起飛點,點2、點3、點4、點5、點6為航線點,也即為任務(wù)點,在這5個航線點上將載機攜帶的傳感器設(shè)備(只考慮機載雷達)也形象的標(biāo)會了出來;圖中的小黑點是利用已有目標(biāo)先驗情報信息,再運用上文中建立的卡爾曼目標(biāo)狀態(tài)估計理論,得到的目標(biāo)狀態(tài)初始分布;點7(圖中三角形)作為機載雷達最終探測到的目標(biāo)點,在圖中只顯示了4個點7位置,這4個位置從上到下依次作為在雷達進行探測的過程中目標(biāo)依次移動的4個位置。
從仿真結(jié)果圖中可以看出:當(dāng)目標(biāo)點在4個點7位置從上到下移動時,機載雷達能夠準(zhǔn)確地探測到目標(biāo)移動的位置,達到了對目標(biāo)實時跟蹤的效果。因此,可以得出結(jié)論:基于MPC的傳感器規(guī)劃算法在解決移動目標(biāo)搜索這一關(guān)鍵的傳感器規(guī)劃問題時,能夠快速、準(zhǔn)確地搜索到移動的目標(biāo),基本達到了對目標(biāo)的實時跟蹤效果。
本文針對機載傳感器規(guī)劃過程中的移動目標(biāo)搜索這一難題,將MPC的基本思想與經(jīng)典卡爾曼濾波中目標(biāo)狀態(tài)估計理論相結(jié)合,提出了一種基于改進MPC算法的傳感器規(guī)劃方法,在深入剖析了該算法的基本思想和算法流程中的關(guān)鍵要素之后,再通過具體的編程,仿真驗證了該算法在解決移動目標(biāo)搜索這一傳感器規(guī)劃問題中的有效性、合理性。
圖6 基于MPC算法的傳感器規(guī)劃仿真實驗結(jié)果圖Fig 6 Simulation result diagram of sensor planning based on MPC algorithm
[1]邢立寧,陳英武.任務(wù)規(guī)劃系統(tǒng)研究綜述[J].火力與指揮控制,2006,31(4):1-4.
[2]王文博.模型預(yù)測控制的抗擾性能分析[D].杭州:浙江大學(xué),2012.
[3]霍德聰.戰(zhàn)術(shù)飛機打擊任務(wù)中的傳感器使用策略與規(guī)劃方法研究[D].長沙:國防科技大學(xué),2007.
[4]Collins G E,Riehl J R,Philip S V.A UAV route and sensor control optimization algorithm for target search[R].California:University of California,2007.
[5]Skoglar P,Nygards J,Bjorstrom R.Path and sensor planning framework applicable to UAV surveillance with EO/IR sensors[R].Kista,Sweden:Totalforsvarets f?rskning sinstitut(FOI),2007.
[6]黃丁才.無人偵察機航線與傳感器規(guī)劃方法研究[D].長沙:國防科技大學(xué),2009.
[7]周 燕,范 鵬.戰(zhàn)術(shù)航空偵察航路規(guī)劃評價模型[J].電光與控制,2007,14(1):52-54.
[8]宗長富,胡 丹,楊 肖,等.基于擴展Kalman濾波的汽車行駛狀態(tài)估計[J].吉林大學(xué)學(xué)報,2009,39(1):7-11.
[9]任 佳,高曉光,趙歡歡.基于目標(biāo)狀態(tài)估計的UAV路徑重規(guī)劃決策模型[J].控制與決策,2009,24(7):1033-1037.
[10]趙星辰.時間敏感目標(biāo)的信息處理決策技術(shù)研究[D].西安:空軍工程大學(xué),2012.