李磊,邱少雄,徐紅麗
(1.中國人民解放軍92578部隊,北京 100161;2.東北大學(xué)機器人科學(xué)與工程學(xué)院,沈陽 110819)
近年來,無人水下航行器(Unmanned Underwater Vehicle,UUV)研究在海洋安全、海洋科考等方面取得豐碩成果。多UUV系統(tǒng)因其冗余性、魯棒性等優(yōu)勢,被世界各國大力發(fā)展[1-3]。作為多UUV系統(tǒng)的典型任務(wù)之一,移動目標協(xié)同搜索被國內(nèi)外學(xué)者廣泛研究。在移動目標協(xié)同搜索任務(wù)中,科學(xué)合理的發(fā)現(xiàn)概率模型是合理評價搜索策略、分析關(guān)鍵影響因素、優(yōu)化搜索算法的關(guān)鍵[4]。
搜索論是目前研究移動目標發(fā)現(xiàn)概率評估模型的主要方法,被廣泛應(yīng)用于靜態(tài)、動態(tài)目標搜索中。陳強等[5]針對UUV探雷任務(wù),給出多UUV協(xié)同直線搜索、梳形搜索的效率和發(fā)現(xiàn)概率計算方式;李玉偉等[6]針對發(fā)現(xiàn)概率定義不準確的問題,將累積探測概率與隨機過程相結(jié)合,提出探雷聲吶發(fā)現(xiàn)概率計算模型;朱世濤[4]建立了被動潛標系統(tǒng)搜潛發(fā)現(xiàn)概率模型,定量分析了潛艇速度以及潛標間距對發(fā)現(xiàn)概率的影響;羅光成等[7]以應(yīng)召搜潛為背景,分析水下潛艇分布規(guī)律,基于蒙特卡洛法建立了被動浮標陣對潛探測概率模型。以上方法中的探測系統(tǒng)或被探測目標是靜態(tài)的,無法適用于探測系統(tǒng)與目標均會隨時間動態(tài)變化的場景。
而在反潛潛艇反潛、航空主動聲吶反潛等雙方均存在動態(tài)機動行為的場景中,目前研究多基于基本發(fā)現(xiàn)概率模型,即單位時間內(nèi)搜索海域與目標海域面積比來計算。湯智胤等[8]通過分析反潛潛艇聲吶探測距離影響因素,分別提出了本艇寬帶、窄帶噪聲被發(fā)現(xiàn)概率計算模型;張會等[9]通過分析有效搜索區(qū),提出了單艦船往返攔截搜索發(fā)現(xiàn)概率計算方法;陳強等[10]建立多UUV線式搜索探潛作業(yè)效能評估模型,提出多UUV搜索動目標發(fā)現(xiàn)概率計算方法;李本江等[11]基于蒙特卡洛方法對反潛潛艇交叉機動發(fā)現(xiàn)敵潛艇概率的因素進行仿真,并分析了交叉機動、垂直敵航向往返直線機動兩種反潛方法在不同使用情況下的優(yōu)劣。以上方法一方面未考慮動目標機動方式隨機性與搜索系統(tǒng)的既定搜索策略,另一方面也未考慮發(fā)現(xiàn)目標時目標與搜索系統(tǒng)的“同時同域”準則。
本文首先介紹了多平臺協(xié)同探測概率空間分布模型與時間地理相關(guān)理論,作為本文研究的基礎(chǔ)。然后考慮既定搜索策略,基于協(xié)同探測概率感知與時空路徑理論提出協(xié)同探測概率時空分布模型;考慮目標機動性能,基于時空棱鏡理論生成移動目標概率時空棱鏡模型,并結(jié)合時間地理學(xué)中的相遇概念,基于“同時同域”準則,提出集群系統(tǒng)以特定策略搜索移動目標時任務(wù)時間序列上的發(fā)現(xiàn)概率以及綜合發(fā)現(xiàn)概率的計算方法。最后在仿真環(huán)境下與蒙特卡洛法、基本發(fā)現(xiàn)概率模型比較,驗證了本文所提模型的有效性與優(yōu)越性。
與傳統(tǒng)的多UUV協(xié)同搜索移動目標發(fā)現(xiàn)概率模型相比,本文的貢獻如下:
(1)傳統(tǒng)的搜索論中基本發(fā)現(xiàn)概率評估模型與經(jīng)典發(fā)現(xiàn)概率評估模型[4]只考慮了目標海域的總面積與搜索速率,與移動目標機動性能相關(guān)性不強,而本文基于時間地理學(xué)中的時空棱鏡概念,充分考慮了動態(tài)目標出現(xiàn)的時空位置及對應(yīng)概率,使得在不同場景中的評估結(jié)果更加客觀準確。
(2)本文基于時空路徑計算集群系統(tǒng)探測概率在時空中的分布,牢牢把握發(fā)現(xiàn)目標的“同時同域”準則,可計算任意節(jié)點數(shù)量、搜索策略下的發(fā)現(xiàn)概率,對搜索系統(tǒng)的兵力以及搜索策略做出客觀評估。對研究多UUV系統(tǒng)協(xié)同搜索移動目標具有一定的參考價值。
通用的探測效能模型可以分為布爾感知模型與概率感知模型[12]。無線傳感器研究初期大多采用布爾感知模型。二維平面內(nèi)的布爾感知模型為以母平臺位置為圓心,探測半徑為Rs的圓形封閉區(qū)域。假設(shè)傳感器的坐標位置是(xi,yi),傳感器Si在二維平面內(nèi)任意一點l(x,y)的探測概率為
式中
考慮到背景噪聲、信號傳輸損失等實際情況,平臺與目標的間距制約了其獲取信息的可信度,概率感知模型反映了這種制約關(guān)系。概率感知模型中,傳感器在探測區(qū)域任一目標點l(x,y)處的探測概率為
式中,參數(shù)a表示傳感器Si信號隨距離增大而衰減的程度。
針對多UUV協(xié)同探測系統(tǒng),前人基于水聲傳播理論、聲吶設(shè)計技術(shù)、信號處理理論、概率論等,開展了大量的協(xié)同探測效能建模工作[12-17],建立起協(xié)同探測概率感知模型,其本質(zhì)是探測概率在空間中的分布,表達式為
式中,(x,y)是任務(wù)區(qū)域D中的任意點。
考慮到計算復(fù)雜度問題,將式(4)離散化。對于任意的(a,b)∈D,有|x-a|+|y-b|≤r,r<ε,r∈Ν+,ε∈N+。顯然,當ε→0時,x→a,y→b,所以有Pdn(x,y)→Pdn(a,b)。因搜索海域較大、多UUV的探測范圍較大,而目標相對較小,故可選擇合理的r,存在以下關(guān)系
由式(5)可知,顯然存在集合
使得目標海域D在二維平面上可劃分為M個互不重疊的方形區(qū)域,且對于劃分區(qū)域的任意一點,存在唯一的(ai,bi),可按照式(5)計算。至此,某時刻目標海域D的協(xié)同探測概率的離散形式為式(5)~(6)。特別地,若Pdn(a,b)<η,η∈[0,1],則可認為(a,b)不在探測范圍內(nèi)。
文獻[12]分析了水下無人集群系統(tǒng)協(xié)同探測制約因素,不同空間陣位、頻率參數(shù)、平臺工作模式、水文因素等均可影響協(xié)同探測效能,其本質(zhì)是影響Pdn(x,y)的分布,使得協(xié)同探測范圍難以定量化描述。尤其在包含移動平臺的集群系統(tǒng)中,由于陣位等因素的變化,探測概率在空間分布會隨時間變化,因此,經(jīng)典的搜潛發(fā)現(xiàn)概率模型[4]與用于海上搜救的發(fā)現(xiàn)概率模型[18]難以應(yīng)用,再考慮移動目標運動狀態(tài)的不確定性,多UUV協(xié)同搜索移動目標發(fā)現(xiàn)概率評估模型必須從時間與空間上綜合考慮。
時間地理理論[19-20]認為人類活動只在有限的時間內(nèi)發(fā)生在特定的地點,是量化移動對象潛在相互作用的基礎(chǔ)方法。其認為能否發(fā)現(xiàn)目標存在兩個條件,一是能否相遇,即“同時同域”,二是相遇后能否感知,時間地理是量化移動目標之間潛在相遇的基石。
嚴格意義上的潛在相遇體現(xiàn)在兩個或多個移動對象的時空路徑產(chǎn)生重疊。即兩個或多個移動對象必須在同一時間位于同一位置,才有可能發(fā)生潛在相遇。如圖1所示,個體A和個體B的時空路徑產(chǎn)生了重疊,則表示A和B在T3到T4時間段內(nèi)在位置Pi(xi,yi)發(fā)生了潛在相遇。
圖1 移動目標潛在相遇時空路徑Fig.1 Potential spatial-temporal path of moving targets encounter
時空棱鏡表示移動目標在起點、終點、自身機動能力、環(huán)境等約束條件下所能達到的時空位置集。圖2描述了時空棱鏡中個體活動與群體互動的表達。其中個體時空棱鏡表達了個體可達的時空位置集,群體互動時空棱鏡是多個個體時空棱鏡的交集,表達了多個個體對象潛在的互動時空位置集,即潛在的相遇,其在XY平面的投影是潛在的空間互動區(qū)域。
圖2 時空棱鏡示意圖Fig.2 Space-time prism
時空圓盤為時空棱鏡在時間維度上的切片,概率時空棱鏡表達了移動目標任意時刻在約束條件下可能到達的所有位置,以及位于任一位置的可能性。基于體素的概率時空棱鏡是將時空圓盤劃分為多個體積元素,即體素,然后基于反距離權(quán)重法來分配單個體素的概率[21-22],對于第k個時空圓盤,計算公式為
式中,zk為第k個時空圓盤,lka為體素,‖lka-lk‖為測量體素距離時空路徑的長度。
多UUV系統(tǒng)的運動本質(zhì)上是時間與空間的函數(shù),若只考慮二維平面的位置信息,則各平臺的運動信息可描述為O-XYT時空中的連續(xù)曲線。將由目標海域與搜索時間構(gòu)成的域記作O,對應(yīng)地,可在該空間中構(gòu)建協(xié)同探測概率時空分布模型Pdn(x,y,t)。對于特定時刻ti,Pdn由式(4)確定。
將Pdn(x,y,t)離散化,對于任意的(a,b,c)∈O
顯然,當ε→0,δ→0時,x→a,y→b,t→c,所以有Pdn(x,y,t)→Pdn(a,b,c)。存在以下關(guān)系
由式(9)可知,顯然存在集合
使得域O可劃分為M個互不重疊的區(qū)域,且對于劃分區(qū)域的任意一點,存在唯一的(ai,bi,ci),可按照式(9)計算。至此,某次搜索任務(wù)中,協(xié)同探測概率時空分布模型的離散形式為式(9)~(10)。特別地,若Pdn(a,b,c)<η,η∈[0,1],則可認為(a,b,c)不在探測范圍內(nèi)。
為移動目標生成時空棱鏡可以充分描述其在自身機動性能、環(huán)境約束下可達到的所有時空位置及對應(yīng)概率,考慮二維空間信息與時間信息,移動目標的出發(fā)海域為S,目標海域為E,生成的時空棱鏡是一個時空位置集合Z,對于棱鏡中的任一元素(l,t)∈Z,存在關(guān)系[19]為
式中,l表示位置點,t為時間,‖‖-為歐氏距離,ψ表示目標自身的機動能力,ζ為環(huán)境約束,ts為目標出發(fā)時間,te為目標到達E的最大時間。特別地,在理想環(huán)境下,若只考慮目標的最大速度約束,則式(11)可簡化為
式中,vmax表示目標允許的最大速度。進一步地,若移動目標的出發(fā)海域和目標海域為足夠小區(qū)域,則可進一步簡化為
式中,ls和le為出發(fā)位置和目標位置。
將Z在時間維度切片,生成n個時空圓盤,以S的最高概率點ls為起點,E的最高概率點le為終點,考慮約束,生成移動目標最優(yōu)時空路徑。若S和E是均勻介質(zhì)的,則ls和le可分別取S和E的幾何中心;若移動目標航行空間廣闊無障礙,可認為移動目標最優(yōu)時空路徑是從ls以期望速度到達le的直線。第k個時空圓盤Zk與移動目標最優(yōu)時空路徑的交點為lk,lka為測量體素,每個體素的概率稱為位置概率,計算為[21-22]
至此,得到了移動目標可能的時空位置集合和出現(xiàn)在各位置的概率。
搜索系統(tǒng)發(fā)現(xiàn)移動目標需要滿足兩個條件:
(1)目標進入搜索系統(tǒng)探測范圍;
(2)目標進入探測范圍時被搜索系統(tǒng)感知。
執(zhí)行動態(tài)目標搜索任務(wù)時,多UUV系統(tǒng)中各節(jié)點根據(jù)既定策略航行,其運動狀態(tài)是已知的,故可由時空路徑確切表示其在目標海域內(nèi)的搜索過程,其時空路徑不再是線,而是由其有效探測范圍組成的體,記作L,存在關(guān)系為
在某次搜索任務(wù)中,移動目標的時空路徑點的集合為
若存在元素(xj,yj,tj)∈LT,使得由式(9)計算的Pdn滿足式(15),則目標進入了協(xié)同探測范圍,LT稱為相遇路徑。直觀地,如圖3所示,紅色線段是目標隨機產(chǎn)生的多條時空路徑,與集群探測系統(tǒng)的時空路徑(彩色斜柱體)存在交集的是相遇路徑。
圖3 集群探測潛在相遇時空模型Fig.3 Potential spatial-temporal mode of cluster and moving target encounter
由于移動目標在目標海域的運動是未知且不確定的,假設(shè)目標按照特定路徑運動將無法充分考慮目標運動的隨機性,故而所提出的發(fā)現(xiàn)概率模型缺乏客觀性。上述生成的移動目標概率時空棱鏡充分表達了目標可能出現(xiàn)的所有時空位置及概率,是移動目標所有可能時空路徑的集合。目標的時空棱鏡Z與多UUV系統(tǒng)的時空路徑L產(chǎn)生交集,則認為多UUV系統(tǒng)與目標可能發(fā)生相遇,存在發(fā)現(xiàn)目標的可能,否則不存在。
由于集群系統(tǒng)的時空路徑是確定的,所以在移動目標的每個時空圓盤內(nèi),其位置概率是1或0。若t時刻位置l在其探測范圍內(nèi),則集群系統(tǒng)位置概率為1,否則為0,表征了t時刻位置l是否處于集群系統(tǒng)的有效探測范圍。t時刻位置l在移動目標時空圓盤中,則移動目標的位置概率計算如式(14),否則為0,其表征了移動目標在時刻t出現(xiàn)在位置l的概率。為集群系統(tǒng)t時刻在位置l的探測概率。則多平臺t時刻在位置l能發(fā)現(xiàn)移動目標的概率為
多平臺t時刻能夠發(fā)現(xiàn)目標的概率為[19]
式中,Zt表示t時刻所對應(yīng)的時空圓盤。
對于較為復(fù)雜的環(huán)境,探測虛警率較高,故引入雙亮點模型,認為在k次探測中,至少連續(xù)兩次探測到目標信號,才被定義為發(fā)現(xiàn)目標[23]。在整個搜索任務(wù)中,劃定的時空圓盤個數(shù)為n,則對移動目標的綜合發(fā)現(xiàn)概率為
選取三臺UUV組成協(xié)同探測系統(tǒng),以“1”字形、三角形、“一”字形隊形沿海域循環(huán)航行,航行示意如圖4。
圖4 UUV航行示意圖Fig.4 UUV navigation schematic
為檢驗本文所提移動目標發(fā)現(xiàn)概率模型的有效性與優(yōu)越性,多UUV系統(tǒng)分別保持上述三種隊形,以500 m的隊形間距(隊形間距為相鄰兩UUV幾何中心的歐氏距離),1.5 m/s速度航行。分別基于本文所提模型、蒙特卡洛方法以及基本發(fā)現(xiàn)概率模型計算時間序列上的發(fā)現(xiàn)概率,并對比分析。
為進一步檢驗本文所提發(fā)現(xiàn)概率模型與此前發(fā)現(xiàn)概率模型的一致性,首先分別計算集群系統(tǒng)以1.5 m/s航速航行,保持“一”字形隊形下不同平臺間距時的發(fā)現(xiàn)概率(起始間距50 m,步長50 m,終止間距1800 m)。然后分別計算集群系統(tǒng)保持平臺間距為500 m的“一”字形隊形,以不同航速航行時對目標的發(fā)現(xiàn)概率(起始航速0.5 m/s,步長0.5 m/s,終止航速3 m/s)。
本文仿真實驗中集群系統(tǒng)探測概率在空間中的分布按如下方式計算[16]。
首先,集群系統(tǒng)中位于(xi0,y0i)的單平臺i在空間中某一點(x,y)的探測概率為
式中,P0取值0.8,a取值1 km。
然后,包含n個平臺在空間中某一點(x,y)的協(xié)同探測概率為
隊形間距500 m時上述三種隊形的協(xié)同探測概率空間分布如圖5所示。
圖5 典型場景下協(xié)同探測概率空間分布圖Fig.5 The spatial distribution model of multi-UUVs system cooperative detection probability in typical scenarios
實驗在長10 km、寬10 km的方形海域里進行,移動目標ts=0時刻從以ls(0.1 km,0.1 km)為圓心,0.1 km為半徑的圓內(nèi)任意一點出發(fā),航行到以le(9.9 km,9.9 km)為圓心,0.1 km為半徑的圓內(nèi)任意一點,航行的最大速度是5 m/s,最大時間te=50 min。移動目標最優(yōu)時空路徑為(ls,ts)到(le,te)的直線,相鄰時空圓盤的時間間隔為10 s,同一時空圓盤的體素劃分為邊長20 m的方形區(qū)域。協(xié)同探測概率時空分布離散空間中,=20 m,2h=10 s,以此生成的協(xié)同探測概率時空分布離散空間中的柵格單元和移動目標體素是一一對應(yīng)的,劃定有效探測范圍時,η=0.5。生成的移動目標時空棱鏡以及協(xié)同探測概率時空分布如圖6所示,移動目標時空棱鏡與有效協(xié)同探測范圍的交集是可能探測到目標的時空位置。
圖6 移動目標時空棱鏡(紅色柱體)以及協(xié)同探測概率時空分布(彩色柱體)Fig.6 The probability space-time prism of moving target (red column) and the temporal and spatial distribution model of cooperative detection probability (colored column)
與基于蒙特卡洛法的對比實驗中,以上述目標起點、終點、最大速度以及最大時間為約束,基于快速探索隨機樹算法(Rapid-exploration Random Tree,RRT)生成10000條路徑,并為每條路徑隨機生成到達時間,以計算每條路徑的平均徑向速度,移動目標以此速度前進,模擬目標可能的時空路徑。
基本發(fā)現(xiàn)概率模型為[4]
式中,w為自身探測裝備的搜索寬度,vsou為搜索速度,T為搜索時間,S為需要搜索的總面積。
三種隊形下,基于時間地理的發(fā)現(xiàn)概率模型、基于蒙特卡洛法的發(fā)現(xiàn)概率模型以及基本發(fā)現(xiàn)概率模型的對比結(jié)果如圖7所示。
圖7 基于時間地理的發(fā)現(xiàn)概率模型、基于蒙特卡洛法的發(fā)現(xiàn)概率模型以及基本發(fā)現(xiàn)概率模型仿真結(jié)果對比Fig.7 Comparison of simulation results of time-geography-based discovery probability model,Monte Carlo-based discovery probability model,and basic discovery probability model
圖7表明,本文所提出的基于時間地理的發(fā)現(xiàn)概率模型,考慮目標機動、起始區(qū)域、擬到達區(qū)域等約束信息,考慮集群搜索兵力、搜索策略等搜索能力信息,可以給出任務(wù)時間序列上的移動目標發(fā)現(xiàn)概率,與基于蒙特卡洛方法對比,二者結(jié)果均存在先上升后下降的趨勢,且峰值時間相近,而基本發(fā)現(xiàn)概率模型中只考慮了掃海寬度、搜索速度、搜索時間以及目標海域的面積,沒有考慮目標信息以及集群搜索策略信息,故其發(fā)現(xiàn)概率僅與時間呈現(xiàn)正相關(guān)。與基本發(fā)現(xiàn)概率模型相比,本文所提方法計算結(jié)果更接近于基于蒙特卡洛方法的計算結(jié)果。同時可發(fā)現(xiàn),同一場景下以不同隊形執(zhí)行搜索任務(wù)時,發(fā)現(xiàn)概率不同。
保持“一”字形隊形,不同平臺間距、航速下基于時間地理的發(fā)現(xiàn)概率模型、基本發(fā)現(xiàn)概率模型的對比結(jié)果如圖8~9所示。
圖8 不同平臺間距下基于時間地理的發(fā)現(xiàn)概率與基本發(fā)現(xiàn)概率對比圖Fig.8 Comparison of time-geography based discovery probability and basic discovery probability with different platform spacing
圖9 不同航速下基于時間地理的發(fā)現(xiàn)概率與基本發(fā)現(xiàn)概率對比圖Fig.9 Comparison of time-geography based discovery probability and basic discovery probability with different speed
圖8~9表明,在本文實驗條件下,增加平臺間距(搜索寬度)以及航速,基于本文所提發(fā)現(xiàn)概率模型與基于基本發(fā)現(xiàn)概率模型所計算的概率均呈現(xiàn)上升趨勢,二者在趨勢上具有一定程度的相似性,可表明本文所提方法的有效性。
科學(xué)合理的移動目標發(fā)現(xiàn)概率評估模型是合理評價搜索策略、分析關(guān)鍵影響因素、優(yōu)化搜索算法的關(guān)鍵。本文基于多平臺協(xié)同探測概率空間分布模型、時間地理理論,提出多UUV協(xié)同搜索移動目標發(fā)現(xiàn)概率模型,其計算過程具體為:
(1)考慮既定搜索策略,基于協(xié)同探測概率空間分布與時空路徑理論生成協(xié)同探測概率時空分布;
(2)考慮目標機動性能,基于時空棱鏡理論生成移動目標概率時空棱鏡;
(3)基于時間地理學(xué)中的相遇概念,計算集群系統(tǒng)以特定策略搜索移動目標時任務(wù)時間序列上的發(fā)現(xiàn)概率以及綜合發(fā)現(xiàn)概率。
本文所提發(fā)現(xiàn)概率模型可充分考慮目標機動能力、搜索系統(tǒng)的搜索兵力與搜索策略,其基于“同時同域”原則,可計算任意節(jié)點數(shù)量、搜索策略下的發(fā)現(xiàn)概率,從而對搜索系統(tǒng)的兵力以及搜索策略做出客觀評估。同時,仿真結(jié)果表明,同一場景下不同隊形、航速下的發(fā)現(xiàn)概率不同,在執(zhí)行多UUV協(xié)同搜索移動目標任務(wù)時,應(yīng)注重隊形與航速的選擇。
同時,本文方法也存在很多不足,如生成協(xié)同探測概率時空分布與移動目標概率時空棱鏡時,計算量隨體素數(shù)量的增加而增加,在目標海域較大、既定搜索時間較長時,若體素劃分較大,則計算效果難以保證;若體素劃分較小,則將占用較大計算資源。
未來,將優(yōu)化計算方法,降低計算量,并對體素劃分開展敏感性研究,不斷優(yōu)化發(fā)現(xiàn)概率模型;同時,也將基于本文所提模型開展搜索策略優(yōu)化研究。