張哲璇,龍騰,*,徐廣通,王仰杰
1. 北京理工大學 宇航學院,北京 100081 2. 北京理工大學 飛行器動力學與控制教育部重點實驗室,北京 100081
多無人機協(xié)同能夠遂行軍事和民事領域多項任務,包括區(qū)域偵察、搜索救援、地形勘察等,相比于單機具有更高的任務執(zhí)行效率與容錯性[1],已成為無人機發(fā)展的必然趨勢。多無人機協(xié)同搜索是利用無人機攜帶傳感器偵察任務區(qū)域,并使用通信網絡共享探測信息,實現(xiàn)對目標的捕獲。協(xié)同搜索規(guī)劃是引導多無人機高效執(zhí)行目標捕獲任務的關鍵技術之一,已經得到了廣泛的研究[2]。為保證協(xié)同搜索效能,便于無人機認知當前環(huán)境信息并根據(jù)探測信息合理規(guī)劃搜索路徑,需要進行合理的搜索環(huán)境建模并設計高效的協(xié)同搜索規(guī)劃方法。
在搜索環(huán)境建模方面,主要通過概率圖模型描述環(huán)境信息。概率圖模型是一種用圖形模式描述基于概率相關模型的總稱[3],概率圖模型利用圖論的思想建立問題模型,利用概率論的思想更新模型,能夠有效描述不確定環(huán)境信息,并反映任務環(huán)境態(tài)勢變化[4]。概率圖模型包括貝葉斯網絡[5]、馬爾科夫模型[6]、譜系圖[7]等。相比于其他模型,基于貝葉斯網絡的概率圖模型能夠更加清晰地描述數(shù)據(jù)間的關系,充分結合先驗信息與樣本信息反映全局模型信息,因此本文使用貝葉斯網絡建立不確定環(huán)境模型。
多無人機協(xié)同搜索規(guī)劃方法主要包括光柵式搜索[8]、區(qū)域分割搜索方法[9-10]、搜索決策方法[11]等。其中,光柵式搜索與區(qū)域分割搜索等遍歷式搜索方法具有簡單、區(qū)域覆蓋率高等優(yōu)點,但難以高效求解灰色區(qū)域協(xié)同搜索問題[12]。基于搜索信息圖的搜索決策方法因其能夠考慮目標先驗信息,重點搜索目標存在可能性大的區(qū)域,在灰色區(qū)域協(xié)同高效搜索問題方面得到了廣泛研究與應用。文獻[13]提出一種基于分布式模型預測控制(DMPC)的多無人機搜索規(guī)劃方法,在環(huán)境搜索信息圖的基礎上,將集中式多無人機優(yōu)化決策問題轉化為小規(guī)模分布式優(yōu)化問題,提高了多無人機協(xié)同搜索效率。文獻[14-15]提出了一種基于分布式蟻群優(yōu)化的協(xié)同搜索規(guī)劃方法,通過信息素圖描述環(huán)境信息,基于滾動時域求解架構提高多無人機搜索航跡求解效率,同時考慮無人機飛行范圍約束與環(huán)境障礙,設計狀態(tài)轉移準則,引導無人機安全高效執(zhí)行搜索打擊任務。田菁等[16]提出一種模型預測控制(MPC)與遺傳算法(GA)結合的多無人機協(xié)同搜索算法,建立環(huán)境搜索信息圖,使用貝葉斯準則更新環(huán)境信息,并將航跡收益作為優(yōu)化目標,基于滾動求解架構高效獲取多無人機協(xié)同搜索航跡。劉重等[17]提出一種帶信息素回訪機制的多無人機分布式協(xié)同目標搜索方法。通過建立環(huán)境信息素地圖描述環(huán)境信息,并利用信息素“釋放-傳播-揮發(fā)”的特性,設計基于信息素的網格回訪機制,引導無人機回訪重點區(qū)域,提高了無人機協(xié)同搜索效率。上述工作主要圍繞靜態(tài)目標協(xié)同搜索問題展開研究,難以處理考慮移動目標的協(xié)同搜索規(guī)劃問題。
針對移動目標協(xié)同搜索規(guī)劃問題,Sun和Liu[18]提出一種基于擴散加權不確定模型的移動目標協(xié)同搜索方法,通過為各無人機分配搜索區(qū)域,協(xié)調各無人機之間的搜索航跡,使用基于滾動時域規(guī)劃的電勢場算法高效求解各無人機搜索航跡。但是,該方法僅能夠搜索單一移動目標。文獻[19]提出針對動態(tài)目標的協(xié)同搜索方法,使用馬爾科夫鏈表征目標隱潛運動,并預測目標位置,在分布式模型預測控制的基礎上使用貪婪迭代算法求解無人機協(xié)同搜索航跡。該方法通過預測目標位置,提高無人機對移動目標的捕獲能力,但是難以求解目標初始位置分布未知的灰色區(qū)域協(xié)同搜索問題,而且未考慮傳感器虛警導致的目標誤判問題。
本文針對執(zhí)行任務時間受限的灰色區(qū)域移動目標協(xié)同搜索問題,考慮傳感器探測概率與虛警概率,提出一種重訪機制驅動的多無人機協(xié)同搜索規(guī)劃(Revisit Mechanism Driven Cooperative Search Planning, RMD-CSP)方法。以無人機飛行性能為約束,以協(xié)同搜索效能為目標函數(shù)建立多無人機協(xié)同搜索模型。構建任務區(qū)域搜索信息圖,描述搜索環(huán)境信息,并使用貝葉斯準則更新搜索信息圖。為減少由于傳感器探測概率與虛警概率造成的目標遺漏與誤判,定制重訪機制,在搜索過程中引導無人機側重搜索長時間未重訪與發(fā)現(xiàn)新的疑似目標的重點區(qū)域。在此基礎上,使用滾動時域規(guī)劃方法高效求解各無人機搜索航跡。最后通過數(shù)值仿真對所提方法的有效性進行驗證。
針對灰色任務區(qū)域內存在的多個移動目標(指揮車、發(fā)射車、雷達車等),通過衛(wèi)星偵察、雷達探測等情報偵察手段獲取部分敵方戰(zhàn)場信息作為初始先驗信息。由于先驗信息可能存在一定誤差,同時目標的移動導致任務區(qū)域先驗信息的可信度進一步降低,因此指派多架無人機進入任務區(qū)域,利用攜帶傳感器(紅外、可見光設備)進行偵察,獲取任務區(qū)域的目標信息。
圖1為多無人機協(xié)同搜索典型任務想定。任務區(qū)域中存在若干雷達車、導彈發(fā)射車等移動目標,指派4架無人機執(zhí)行目標搜索任務,重點探測目標存在概率高的區(qū)域。由于傳感器存在一定的虛警概率,無人機在首次發(fā)現(xiàn)疑似目標后,需要再次訪問該位置,對疑似目標進行再次確認,圖中“□”表示無人機捕獲的目標。
圖1 多無人機協(xié)同搜索任務示意圖Fig.1 Multi-UAV cooperative search mission
本文將無人機當作空間中的質點,僅考慮無人機的平動運動。將矩形任務區(qū)域劃分為Lx×Wy個離散網格C,將每個網格標記為Cxy(x=1,2,…,Lx;y=1,2,…,Wy),將無人機的運動范圍離散化處理[20],假設無人機每次移動步長為一個網格,無人機移動步長大于無人機最小航跡段約束,θ為無人機最大轉彎角。通過限制航跡的最大轉彎角與最小航跡段長度來滿足無人機法向過載約束,從而保證規(guī)劃航跡的可飛性。無人機在每個時刻有8種可能的運動方向,如圖2所示。
圖2 無人機運動方向離散化示意圖Fig.2 Diagram of UAV flight direction discretization
無人機在搜索過程中,根據(jù)傳感器探測信息不斷更新目標存在概率。由于傳感器測量的不確定性與環(huán)境遮擋等因素,可能出現(xiàn)目標遺漏或誤判的情況。假設無人機傳感器探測概率為PD∈[0,1],表示目標存在的情況下,傳感器探測到目標的概率;虛警概率為PF∈[0,1],表示目標不存在的情況下,傳感器探測到目標的概率。
考慮無人機飛行性能約束與無人機機間避碰約束,以最大化任務執(zhí)行效能為性能指標,建立多無人機協(xié)同搜索問題模型如下:
(1)
Ui(t)∩Uj(t)=? ?j=1,2,…,NU;j≠i
(2)
Ui(t)∈F
(3)
1) 目標搜索收益JS
目標搜索收益表示無人機搜索過程中捕獲目標的可能性,即無人機搜索過程中能夠探測到的目標存在概率之和,即
(4)
(5)
其中:ζ(x,y,t)=1表示網格Cxy處存在目標,ζ(x,y,t)=0表示網格Cxy處不存在目標;δP為目標存在閾值。
2) 環(huán)境搜索效益JE
環(huán)境搜索收益JE表示無人機搜索過程中,環(huán)境不確定度的減少量,如式(6)所示。該子目標通過增加無人機對不確定度較高區(qū)域的搜索力度,降低搜索過程中遺漏目標的情況。
(6)
3) 期望探測收益JD
為了盡可能引導無人機探測不確定度與目標存在概率較大的區(qū)域,設置期望探測收益,使無人機在執(zhí)行后續(xù)任務時能夠保證較大的探測收益,子目標JD的描述為
(7)
4) 協(xié)同收益JC
為提高多無人機協(xié)同搜索效率,減少各無人機航跡的重合,將協(xié)同收益定義為無人機環(huán)境搜索狀態(tài)o(x,y,t)的函數(shù)(詳見2.3節(jié)),具體描述為
(8)
圖3 無人機搜索區(qū)域示意圖Fig.3 UAV search region
(9)
式中:vn為目標概率峰值寬度;cn為目標存在概率峰值。
無人機在執(zhí)行搜索任務過程中,根據(jù)自身傳感器的探測信息動態(tài)更新任務區(qū)域目標存在概率p(x,y,t)。考慮傳感器探測概率與虛警概率,使用貝葉斯準則更新目標存在概率,具體描述如下[23]:
1) 當b(x,y,t)=1時
p(x,y,t)-p(x,y,t-1)=
(10)
2) 當b(x,y,t)=0時
p(x,y,t)-p(x,y,t-1)=
(11)
式中:b∈{0,1}為傳感器探測信息,b=1表示傳感器探測到目標,b=0表示傳感器未探測到目標。
-p(x,y,t)log2p(x,y,t)-(1-p(x,y,t))·
log2(1-p(x,y,t))
(12)
隨著無人機對任務環(huán)境的搜索,網格被探測次數(shù)不斷增加,環(huán)境不確定度不斷減小,具體更新方式為
(13)
式中:η∈[0,1]為環(huán)境不確定度衰減因子[25];m為同時搜索當前網格的無人機數(shù)量。
環(huán)境搜索狀態(tài)圖o(x,y,t)∈{0,1}表征t時刻網格Cxy是否被無人機搜索。o(x,y,t)=0表示網格Cxy未被無人機搜索,o(x,y,t)=1表示已有無人機搜索網格Cxy。無人機搜索過程中,根據(jù)無人機對各網格的探測情況更新環(huán)境搜索狀態(tài)圖。
本節(jié)提出重訪機制驅動的協(xié)同搜索規(guī)劃(RMD-CSP)方法,定制基于環(huán)境不確定度圖更新的重訪機制與基于目標權重系數(shù)更新的重訪機制,通過滾動規(guī)劃,高效獲取協(xié)同搜索航跡。
為提高多無人機協(xié)同搜索規(guī)劃問題求解效率,基于滾動時域控制思想[26],將大規(guī)模搜索規(guī)劃問題轉化為一系列短時域規(guī)劃問題,建立多無人機協(xié)同搜索滾動規(guī)劃模型,如式(14)所示。在每個決策時刻tp,使用貪婪算法[27]求解規(guī)劃時域[tp,tp+Tp]內的最優(yōu)搜索航跡,p=1,2,…,M。無人機按照執(zhí)行時域內航跡不斷探測目標,并根據(jù)傳感器探測結果更新環(huán)境信息,以引導無人機快速捕獲移動目標。
s.t.t∈[tp,tp+Tp],i=1,2,…,NU
Eqs. (2)and(3)
(14)
式中:tp為滾動規(guī)劃時刻;Tp為規(guī)劃時域長度。
滾動規(guī)劃過程如圖4所示,假設當前時刻為tp,無人機規(guī)劃時域[tp,tp+Tp]內最優(yōu)搜索航跡,并在執(zhí)行時域[tp,tp+Te]內沿規(guī)劃航跡執(zhí)行搜索任務。當?shù)竭_下一滾動規(guī)劃時刻tp+1時,重復上述步驟。
重訪機制驅動的多無人機協(xié)同搜索規(guī)劃方法偽代碼如表1所示,具體步驟描述如下。
步驟1 初始化。設置環(huán)境先驗信息,無人機性能參數(shù)F、初始位置,傳感器性能參數(shù)PD、PF。設置算法參數(shù),包括滾動規(guī)劃時域長度Tp與執(zhí)行時域長度Te,目標發(fā)現(xiàn)閾值δP,目標存在信息ζ(x,y,t)與各子目標權重系數(shù)w1、w2、w3、w4。根據(jù)環(huán)境先驗信息,利用式(9)和式(12),分別初始化目標概率分布圖、環(huán)境不確定度圖與環(huán)境搜索狀態(tài)圖。
步驟2 判斷是否達到最大迭代步驟tp 步驟3 根據(jù)搜索概率圖信息,規(guī)劃Tp時域內無人機搜索航跡。 步驟4 根據(jù)式(1)所示的目標函數(shù)計算可行航跡收益,使用貪婪算法確定各無人機的最優(yōu)搜索航跡。 步驟5 各無人機在執(zhí)行步長Te內沿步驟4中規(guī)劃航跡飛行,并使用自身攜帶傳感器探測目標。 步驟6 若無人機攜帶的傳感器未探測到目標,按照更新準則式(13)減小目標存在概率與環(huán)境不確定度;若探測到目標,增大目標存在概率并減小環(huán)境不確定度,同時根據(jù)基于目標權重更新的重訪機制更新各子目標權重系數(shù)(詳見3.3節(jié)),引導無人機重訪發(fā)現(xiàn)疑似目標的區(qū)域。 步驟7 根據(jù)基于環(huán)境不確定度圖更新的重訪機制(詳見3.3節(jié)),提高當前網格處的環(huán)境不確定度,引導無人機對長時間未被重訪區(qū)域進行重搜索。 步驟8 根據(jù)式(5)的目標存在準則判斷是否發(fā)現(xiàn)目標,若確定任務區(qū)域存在目標,輸出目標位置信息,轉步驟2;否則,直接轉步驟2,繼續(xù)執(zhí)行搜索任務。 表1 RMD-CSP偽代碼Table 1 Pseudocode of RMD-CSP 為減少無人機遺漏以及誤判目標的情況,本節(jié)提出2種重訪機制,基于環(huán)境不確定度圖更新的重訪機制和基于目標權重系數(shù)更新的重訪機制,具體如下所述。 1) 基于環(huán)境不確定度圖更新的重訪機制 由于目標在任務環(huán)境中不斷運動,目標仍有出現(xiàn)在已探測區(qū)域的可能性,因此通過增加長時間未被探測區(qū)域的環(huán)境不確定度,引導無人機對該區(qū)域進行及時的重訪。假設t0為網格Cxy上次被訪問時刻,T0為重訪時限,t為當前訪問時刻。重訪機制觸發(fā)條件I定義為:某區(qū)域未被探測的時間長度大于設定的重訪時限,即(t-t0)>T0,觸發(fā)基于環(huán)境不確定度圖更新的重訪機制。通過提高該區(qū)域在t時刻的環(huán)境不確定度,增加無人機進行重搜索的概率,從而引導無人機重訪該區(qū)域,更新方法為 (15) 式中:τ為環(huán)境不確定度增強因子,具體取值詳見4.3節(jié)。終止條件I定義為:當前規(guī)劃步結束時,該重訪機制終止。在后續(xù)搜索規(guī)劃過程中,環(huán)境不確定度圖更新方式如式(13)所示(詳見2.2節(jié))。通過基于環(huán)境不確定度圖更新的重訪機制,減少無人機遺漏目標情況,提升無人機捕獲移動目標的能力。 2) 基于目標權重更新的重訪機制 考慮傳感器存在探測概率與虛警概率,易出現(xiàn)目標遺漏或誤判的問題,定制基于目標權重更新的重訪機制,通過增大一定時間內的目標搜索收益這一子目標的權重,引導發(fā)現(xiàn)目標的無人機或附近無人機快速重訪發(fā)現(xiàn)新疑似目標的區(qū)域,對疑似目標進行再次確認,防止目標逃離探測范圍,同時不影響后續(xù)無人機協(xié)同搜索效能。重訪機制觸發(fā)條件II的定義為:無人機首次發(fā)現(xiàn)新的疑似目標。具體更新方法為 Jtp=w1JS+w2JE+w3JD+w4JC (16) 式中:tp為無人機首次發(fā)現(xiàn)新目標的時刻;k為無人機重訪發(fā)現(xiàn)疑似目標區(qū)域需要的最大規(guī)劃步數(shù)。終止條件II的定義為:當達到規(guī)劃時刻tp+k時,該重訪機制終止,即無人機完成對存在疑似目標區(qū)域的重訪,目標函數(shù)權重系數(shù)重置為初值。通過快速引導無人機重訪發(fā)現(xiàn)疑似目標區(qū)域,并對疑似目標進行再次確認,減小因傳感器虛警造成的目標誤判的情況,減小因探測間隔較長造成的移動目標遺漏的情況,提高無人機對移動目標的捕獲能力。 多無人機在執(zhí)行搜索任務的過程中需要考慮機間避碰問題,本文使用人工勢場法[28]實現(xiàn)機間避碰[29]。人工勢場法將其他無人機視為軟威脅,將其他無人機j對當前正在規(guī)劃的無人機i施加的綜合抗力以勢函數(shù)Fi(t)的形式表示,則t時刻全部其他無人機j作用到當前無人機i上的綜合抗力為 (17) 式中:Fij(t)為t時刻無人機j對無人機i的抗力。Fij(t)受無人機位置關系影響,具體表達為 Fij(t)= (18) 式中:Rmax、βmax、φmax分別為無人機j與無人機i之間產生抗力作用的最大允許距離、最大允許角度與最大允許方位角之差;Rij為無人機j與無人機i之間的最短距離;Rij為對應的單位向量;βi表示當前無人機i的轉彎角;φij為無人機i與無人機j之間方位角度差;參數(shù)k1為無人機間距為0時的抗力大小,參數(shù)μ>0為抗力隨無人機間距增大而減小的速率。將勢函數(shù)Fi(t)疊加到目標函數(shù)中,以最大化任務效能與最小化無人機避碰勢函數(shù)為目標函數(shù),更新1.3節(jié)中多無人機協(xié)同搜索問題模型。考慮機間避碰的協(xié)同搜索規(guī)劃問題目標函數(shù)為 (19) 本節(jié)面向典型的灰色區(qū)域協(xié)同搜索想定,開展數(shù)值仿真研究,對比分析RMD-CSP、光柵式搜索方法[30]與標準概率啟發(fā)式搜索方法[12],驗證所提方法的有效性。仿真硬件環(huán)境為Inter Core i7-6700 3.4 GHz PC機,編程環(huán)境為MATLAB 2017b。 灰色任務區(qū)域大小為60 km×60 km的矩形,將任務區(qū)域均勻劃分為60×60的正方形網格,單元網格大小為1 km×1 km,假設同一時刻每個單元網格中至多存在一個移動目標(Moving Target, MT)。根據(jù)預先任務情報信息可知任務區(qū)域內存在若干移動目標,指派4架無人機執(zhí)行搜索任務。目標初始位置分布在x∈[10,45] km,y∈[10,45] km范圍內,目標存在閾值設置為δP=0.85。無人機初始位置、初始速度方向與性能約束如表2所示,傳感器性能參數(shù)如表3[31]所示,人工勢場法參數(shù)與RMD-CSP方法參數(shù)設置分別如表4和表5所示。 根據(jù)目標先驗信息確定目標概率初始化分布參數(shù)如表6所示,初始目標概率分布與環(huán)境不確定度初始分布如圖5和圖6所示。設定總仿真時間為7 000 s,將仿真時間離散為700個規(guī)劃步,規(guī)劃時間間隔為10 s。 表2 無人機初始狀態(tài)信息與性能約束Table 2 Initial state information and performance constraints of UAVs 表3 傳感器性能參數(shù)[31]Table 3 Parameters of sensor performance[31] 表4 人工勢場法參數(shù)Table 4 Parameters of artificial potential field 表5 RMD-CSP算法參數(shù)Table 5 Parameters of RMD-CSP 表6 目標存在概率初始化參數(shù)Table 6 Initial parameters of target probability 圖5 目標初始概率分布Fig.5 Initial probability distribution of targets 圖6 環(huán)境不確定度初始分布Fig.6 Initial distribution of environment uncertainty 針對灰色區(qū)域協(xié)同搜索任務,RMD-CSP規(guī)劃結果如圖7所示。圖7(a)為t=390 s時刻的協(xié)同搜索航跡規(guī)劃結果。 由圖7(a1)可知,位于(27, 24) km網格內的目標存在概率超過閾值,認為無人機在此捕獲目標;由圖7(a2)可知,經過無人機搜索,已搜索區(qū)域環(huán)境不確定度與初始時刻相比降低;由圖7(a3)可知,規(guī)劃的航跡能夠引導無人機對目標存在概率較大與環(huán)境不確定度較低的區(qū)域進行搜索;由圖7(a4)可知,UAV-Ⅲ首次發(fā)現(xiàn)位于(27, 24) km的移動目標,算法通過更新規(guī)劃時域內的目標權重,引導UAV-Ⅳ重訪疑似目標區(qū)域,通過再次訪問確定目標真?zhèn)?。圖7(b)與圖7(c)分別為仿真時刻t=930 s 與t=2 880 s的協(xié)同搜索規(guī)劃結果。由圖7(b4)可知,在UAV-Ⅱ發(fā)現(xiàn)新疑似目標后,本方法能夠快速引導UAV-Ⅰ重訪該區(qū)域,對疑似目標進行再次確認。從圖7(c4)可以看出,通過UAV-Ⅱ自身快速重訪疑似目標區(qū)域,確認存在目標。仿真結果表明RMD-CSP能夠有效引導多架無人機協(xié)同搜索并捕獲灰色區(qū)域中的移動目標。滾動規(guī)劃過程中,單步規(guī)劃耗時最大值為0.068 s,平均值為0.036 s,中位數(shù)為0.034 s。仿真結果表明,在每一滾動規(guī)劃時域,RMD-CSP均能在0.1 s內輸出搜索航跡,能夠滿足協(xié)同搜索任務的實時性需求。 圖7 搜索規(guī)劃結果Fig.7 Search planning results 為了分析重訪機制中增強因子τ對搜索效能的影響,以0.02為間隔等步長選取不同的增強因子值,范圍設置為[1.1, 1.4]。針對每一增強因子值,分別進行100次蒙特卡羅仿真,仿真設置同4.1節(jié)。增強因子不同取值條件下,RMD-CSP引導無人機捕獲目標數(shù)量如圖8所示。 由仿真結果可知,增強因子取值在1.1~1.22 之間時,無人機捕獲目標數(shù)量沒有明顯的變化。然而,當增強因子取值超過1.22之后,隨著增強因子數(shù)值的增大,無人機捕獲目標數(shù)量逐漸減小。根據(jù)式(15)可知,增強因子取值過大,會導致長時間未被探測區(qū)域的環(huán)境不確定度增長較多。環(huán)境不確定度較大的變化會影響式(1)中子函數(shù)JE與JF,導致各子目標函數(shù)權重失衡,在后續(xù)規(guī)劃過程中忽略對目標存在概率較大區(qū)域的搜索,制約了無人機對移動目標的捕獲能力。因此,增強因子取值應不大于1.22,以保證無人機協(xié)同搜索效能。 在增強因子取值不同情況下,每一滾動規(guī)劃步規(guī)劃耗時統(tǒng)計如圖9所示,由仿真結果可知,單步規(guī)劃耗時的中位數(shù)均小于0.05 s,單步規(guī)劃最大耗時不足0.1 s,能夠滿足協(xié)同搜索規(guī)劃的實時性要求。 圖8 捕獲目標數(shù)量隨增強因子變化圖Fig.8 Number variations of captured targets with different enhancement factors 圖9 不同增強因子下單步規(guī)劃耗時Fig.9 Runtime in each planning horizon with different enhancement factors 為分析無人機數(shù)量對搜索效能的影響,分別指派4~12架無人機搜索任務區(qū)域。針對不同的無人機數(shù)量,分別進行100次蒙特卡羅仿真。設定總仿真時間為4 000 s,將仿真時間離散為400個規(guī)劃步,規(guī)劃時間間隔為10 s。統(tǒng)計捕獲目標數(shù)量如圖10所示。 由仿真結果可知,在無人機數(shù)量少于8架時,隨著無人機數(shù)量的增加,無人機捕獲目標數(shù)量增多,協(xié)同搜索效率隨著無人機數(shù)量增加而提升。但是,當無人機數(shù)量超過8架之后,無人機捕獲目標數(shù)量基本不變,例如,無人機9架次與12架次時,目標捕獲數(shù)量幾乎相等。因此,在搜索區(qū)域大小與搜索時間一定的條件下,無人機數(shù)量持續(xù)增加不會使搜索效能持續(xù)提升,因此需要根據(jù)具體想定選擇合適的無人機數(shù)量,避免資源浪費。 不同無人機數(shù)量情況下,每一滾動規(guī)劃步規(guī)劃耗時統(tǒng)計如圖11所示。由于單步規(guī)劃中需要為每架無人機規(guī)劃搜索航跡,因此隨著無人機架次的增加,單步規(guī)劃耗時增加。但是,單步規(guī)劃均能夠在0.3 s內得到各無人機搜索航跡,能夠滿足協(xié)同搜索規(guī)劃的實時性需求。仿真結果表明,本文提出了基于滾動規(guī)劃架構的RMD-CSP能夠在線高效求解多無人機協(xié)同搜索問題。 圖10 捕獲目標數(shù)量隨無人機數(shù)量變化圖Fig.10 Number variations of captured targets with different UAV numbers 圖11 不同無人機數(shù)量下單步規(guī)劃耗時Fig.11 Runtime in each planning horizon with different UAV numbers 本節(jié)通過對比分析光柵式搜索方法、標準概率啟發(fā)式搜索方法以及RMD-CSP在不同探測概率條件下的規(guī)劃結果,進一步驗證本文算法的有效性。設置5組蒙特卡羅仿真仿試驗,探測概率分別為0.5,0.6,0.7,0.8和0.9,每組均進行100次仿真,仿真時間為7 000 s,統(tǒng)計不同方法對應的捕獲目標數(shù)量與誤判次數(shù)。 仿真統(tǒng)計結果分別如圖12和圖13所示,相比于光柵式搜索方法與標準概率啟發(fā)式搜索方法,RMD-CSP能夠引導無人機捕獲更多移動目標,同時保證誤判次數(shù)最少。在探測概率為0.9時,RMD-CSP引導無人機捕獲目標數(shù)量為7.80,相比于光柵式搜索方法(2.02)與標準概率啟發(fā)式搜索方法(4.07)分別提升了2.86倍與0.92倍;RMD-CSP的平均誤判次數(shù)(0.27)比光柵式搜索方法(3.76)與標準概率啟發(fā)式搜索方法(0.57)分別降低了92.8%與52.6%。 光柵式搜索方法的固定搜索模式難以應對目標移動的隨機特性,同時由于傳感器存在虛警概率,光柵式搜索無法通過重訪對疑似目標進行再次確認,因此造成大量誤判情況,工程實用性較差。標準概率啟發(fā)式搜索方法能夠根據(jù)環(huán)境信息圖不斷調整無人機搜索航跡,在一定程度上緩解傳感器虛警造成的目標誤判情況,但由于其重訪效率低,容易遺漏目標,因此其捕獲目標數(shù)量少于RMD-CSP,不適用于求解灰色區(qū)域移動目標搜索問題。RMD-CSP能夠利用環(huán)境先驗信息,根據(jù)定制的重訪機制,快速重訪發(fā)現(xiàn)新的疑似目標區(qū)域,對疑似目標進行再次,減少目標誤判情況;重訪環(huán)境不確定度較高的區(qū)域,減少目標遺漏情況,提高了多無人機協(xié)同搜索效能,具有更好的魯棒性與工程實用性。 圖12 捕獲目標數(shù)量Fig.12 Numbers of captured real targets 圖13 誤判次數(shù)Fig.13 Numbers of judgmental errors 為提高多無人機協(xié)同搜索灰色區(qū)域內移動目標的效率,本文考慮傳感器探測概率與虛警概率,提出一種重訪機制驅動的多無人機協(xié)同搜索規(guī)劃方法,并開展數(shù)值仿真試驗,得到了如下結論: 1) 考慮實際作戰(zhàn)中,無人機攜帶的傳感器存在一定的探測概率與虛警概率,可能存在目標遺漏與誤判的情況,定制了基于環(huán)境不確定度圖更新的重訪機制與基于目標函數(shù)權重更新的重訪機制,引導無人機快速重訪長時間未被重訪區(qū)域或發(fā)現(xiàn)疑似目標的區(qū)域,減少由于傳感器探測概率與虛警概率造成的目標遺漏與誤判情況,提高灰色區(qū)域協(xié)同搜索效率與移動目標捕獲能力。 2) 通過蒙特卡羅仿真試驗分析了增強因子τ與無人機數(shù)量對協(xié)同搜索效率的影響。結果表明,增強因子取值超過1.22后,隨著增強因子取值的增加,無人機捕獲目標數(shù)量下降,協(xié)同搜索效率降低,因此增強因子應在[1.1, 1.22]內取值。隨著無人機數(shù)量的增加,RMD-CSP捕獲目標數(shù)量增加。當無人機數(shù)量超過8架次后,隨著無人機數(shù)量的增加,協(xié)同搜索效率的增加趨勢逐漸減小。因此需要根據(jù)具體任務想定選擇合適的無人機數(shù)量,避免任務資源的浪費。 3) 通過與光柵式搜索和標準概率啟發(fā)式搜索方法對比,表明本文方法能夠引導無人機高效執(zhí)行灰色區(qū)域移動目標探測任務。相比于光柵式搜索方法與標準概率啟發(fā)式搜索方法,RMD-SCP均能保證較高的捕獲移動目標概率與較低的誤判概率。本文方法能夠降低由于傳感器性能不足造成的誤判情況,能夠提高無人機的協(xié)同搜索效能,引導無人機捕獲更多的移動目標。 本文假設各無人機間通訊良好,暫未考慮通訊距離、延時等通訊約束對多無人機協(xié)同搜索的影響,后續(xù)研究中可考慮各無人機之間的通訊約束,進一步完善多無人機協(xié)同搜索方法。3.3 重訪機制
3.4 機間避碰方法
4 仿真對比分析
4.1 想定設置與方法參數(shù)設置
4.2 協(xié)同搜索規(guī)劃結果
4.3 增強因子τ對搜索效能的影響
4.4 無人機數(shù)量對搜索效能的影響
4.5 方法性能對比
5 結 論