金巧園,張國超,代中華
上海船舶電子設(shè)備研究所,上海 201100
被動聲吶通過接收并處理目標(biāo)輻射源信號獲得目標(biāo)的方位信息[1],具有隱蔽性強(qiáng)的優(yōu)點,是解決水下探測問題的重要設(shè)備。而利用不同時刻觀測到的方位信息,確定目標(biāo)位置和航跡的過程,稱為純方位運動目標(biāo)分析[2]。由于水下環(huán)境復(fù)雜,噪聲較大,且由被動聲吶獲得的目標(biāo)信息較少,在作戰(zhàn)時的被跟蹤目標(biāo)常通過機(jī)動來提高生存能力,而粒子濾波算法適用于非線性系統(tǒng)的狀態(tài)估計、對噪聲的高斯性依賴不強(qiáng),因此常用于純方位水下目標(biāo)跟蹤[3]。
粒子濾波算法用一批帶權(quán)值粒子的加權(quán)和來估計目標(biāo)當(dāng)前時刻的狀態(tài)。在多次迭代之后,大部分粒子的權(quán)值會趨近于零,其余部分粒子的權(quán)值增大到趨近于1,造成粒子退化的現(xiàn)象。解決該現(xiàn)象的一種方式是重采樣,其核心在于復(fù)制權(quán)值大的粒子,拋棄權(quán)值小的粒子,它能大大提升有效粒子的數(shù)量,但會導(dǎo)致粒子貧化的問題。遺傳算法在選擇、雜交、變異等算子的作用下,遵循適者生存的原理模擬生物界的進(jìn)化過程,具有全局尋優(yōu)的能力[4],在重采樣時加入遺傳算法能在提升有效粒子數(shù)量的前提下增加粒子的多樣性。已有學(xué)者對遺傳粒子濾波做了一些研究。李秀英[5]在重采樣時引入雜交和突變避免了傳統(tǒng)重采樣導(dǎo)致的粒子枯竭,使定位精度得到提升。文獻(xiàn)[6]在智能城市運動目標(biāo)跟蹤時,將量子遺傳算法與粒子濾波算法相結(jié)合,在對粒子進(jìn)行二進(jìn)制編碼時使用了量子比特和量子疊加態(tài),在選擇、交叉、變異等操作時使用了量子旋轉(zhuǎn)門。于春娣等[7]在粒子變異時將高權(quán)值父粒子繁殖的子粒子對稱地分布在父粒子兩側(cè),從而增加粒子多樣性,保證算法精度。戴銀娟等[8]在重采樣時將權(quán)值方差低于閾值的粒子進(jìn)行交叉和變異操作,提高了預(yù)測結(jié)果的精度。文獻(xiàn)[9]利用基因突變和重構(gòu)粒子集的方法,設(shè)計了一種優(yōu)化機(jī)制,以改善用于融合定位的粒子濾波算法中的粒子退化問題。
針對純方位機(jī)動目標(biāo)跟蹤問題,若遺傳重采樣時由大權(quán)值父粒子變異產(chǎn)生的新生代粒子分布方向單一、變異幅度過小或過大,會導(dǎo)致目標(biāo)機(jī)動后接近目標(biāo)真實狀態(tài)的粒子少、跟蹤誤差大和收斂時間長的問題,本文提出一種在進(jìn)化時調(diào)整新生代粒子的分布方式及變異的幅度,實現(xiàn)對純方位機(jī)動目標(biāo)更精確跟蹤的改進(jìn)遺傳粒子濾波算法。
本文研究的是單個運動觀測站,假定它與水下目標(biāo)處于同一平面,跟蹤態(tài)勢可簡化為二維平面[10],被動跟蹤系統(tǒng)在k時刻的狀態(tài)方程和觀測方程分別如下:
式中:x={x,y,vx,vy}T和為目標(biāo)的狀態(tài)向量和方位角測量值;(vx,vy) 為 目標(biāo)速度;(x,y) 和(xw,yw)為目標(biāo)和觀測站所在位置;w和v分別為過程演化噪聲和觀測噪聲;a為常數(shù);狀態(tài)轉(zhuǎn)移陣Φ和噪聲轉(zhuǎn)移陣Г分別為
式中T是觀測周期。水下純方位運動目標(biāo)跟蹤就是根據(jù)被動聲吶接收到的帶噪聲的方位角序列值來估計目標(biāo)當(dāng)前狀態(tài)的過程。
1)初始化。根據(jù)先驗信息給出目標(biāo)初始狀態(tài)以及過程演化噪聲w0和 觀測噪聲v0,按照高斯分布在初始狀態(tài)附近采樣N個粒子~p(x0),i=1,2,…,N,粒子的權(quán)值=1/N;
2)在k時刻,按照式(1)的狀態(tài)轉(zhuǎn)換方程得到粒子;
3)用式(2) 的測量方程計算k時刻各個粒子的方位角估計值,并用正態(tài)分布概率密度函數(shù)計算方位角估計值與實際值之間的似然估計
7)令k=k+1,重復(fù)步驟2)~7)。
步驟5) 中的重采樣是防止粒子退化的一個重要的手段,常用的有系統(tǒng)重采樣、分層重采樣、多項式重采樣和留數(shù)重采樣等[11],它們的宗旨是復(fù)制權(quán)值大的粒子,拋棄權(quán)值小的粒子。大權(quán)值粒子的過度復(fù)制和小權(quán)值粒子的簡單剔除,是重采樣算法中粒子多樣性喪失的主要原因[12]。粒子集中在某一時刻目標(biāo)的高似然區(qū)域,若目標(biāo)持續(xù)機(jī)動一段時間,接近目標(biāo)真實狀態(tài)的粒子數(shù)將很少,跟蹤的收斂時間將較長。遺傳算法在選擇、雜交、變異等算子的作用下,遵循適者生存的原理模擬生物界的進(jìn)化過程,具有全局尋優(yōu)的能力,在重采樣時加入遺傳算法能在提升有效粒子數(shù)量的前提下增加粒子的多樣性[13]。
本文改進(jìn)遺傳重采樣的基本思想,按照粒子的適應(yīng)度選擇出較適合環(huán)境的粒子,選擇完成后進(jìn)化,其中,粒子的適應(yīng)度由其權(quán)值決定,在進(jìn)化時將新生代粒子隨機(jī)分配到以父粒子為中心均勻劃分的各個扇面中,而非單一地劃分到父粒子的45°或235°方向,父粒子進(jìn)化得到的新生代粒子的個數(shù)與扇面的個數(shù)相差1,從而擴(kuò)大粒子分布范圍,提高新生代粒子的質(zhì)量;由于變異幅度過小會導(dǎo)致新生代粒子與父粒子的差異較小,無法保證粒子的多樣性,變異幅度過大會使遺傳算法淪為單純的隨機(jī)選擇算法,且水下目標(biāo)位置和速度的變化幅度相差較大,因此本文將擴(kuò)散因子 γ拆分成位置擴(kuò)散因子 γx和 速度擴(kuò)散因子 γv,分別對它們進(jìn)行取值。當(dāng)前時刻的目標(biāo)狀態(tài)由父粒子和新生代粒子共同估計,并將所有粒子用于下一時刻的迭代。
選擇粒子的原則是適應(yīng)度越高的粒子能進(jìn)化出越多的新生代粒子,反之則越少,適應(yīng)度小于閾值的粒子將直接被拋棄。本文借鑒文獻(xiàn)[14]的簡單重采樣法中求粒子分解數(shù)的方法計算進(jìn)化的新生代粒子數(shù)量,即用式(3) 比較父粒子的權(quán)值與1/N的整數(shù)倍,將倍數(shù)作為k時刻第i個粒子的新生代粒子數(shù)。
為了保證進(jìn)化后粒子總數(shù)保持不變且權(quán)值和為1,需要根據(jù)前一個粒子的進(jìn)化情況對當(dāng)前粒子的權(quán)值進(jìn)行少量(小于1/2N)的調(diào)整。
傳統(tǒng)的變異算子如式(4),其中 ρ是步長。經(jīng)過該變異后,新生代粒子分布在以父粒子為中心、ρ為最大擴(kuò)散半徑的45°和235°方向內(nèi),分布方向單一、分布區(qū)域較集中導(dǎo)致新生代粒子的涵蓋面積較小。
式中N(0,1)是期望為0、方差為1 的標(biāo)準(zhǔn)正態(tài)分布。
圖1 為粒子分布方式圖。圖1(a)顯示了一個父粒子按傳統(tǒng)變異算子進(jìn)化生成30 個子粒子的結(jié)果。由于該分布方式的新生代粒子的分布區(qū)域較集中,在目標(biāo)機(jī)動時可能會導(dǎo)致缺少與目標(biāo)真實狀態(tài)接近的粒子,需要花費較長時間才能跟蹤上目標(biāo)。
圖1 粒子分布方式
為了使新生代粒子均勻分布在父粒子周圍,擴(kuò)大粒子分布范圍,提高新生代粒子的質(zhì)量,本文對變異算子做了改進(jìn),具體方式為:
1)若=0,則拋棄該粒子。
2)若=1,則復(fù)制該父粒子1 次。
γ/Mk代 表變異步長,步長決定了新生代粒子的擴(kuò)散范圍,其中Mk=max(,i=1,2,···,N)。因為目標(biāo)在位置和速度上的變異幅度相差較大,故本文將擴(kuò)散因子 γ分為2 個:位置擴(kuò)散因子 γx和速度擴(kuò)散因子 γv。本文的擴(kuò)散方式使權(quán)值越大的父粒子得到子粒子越多,且擴(kuò)散半徑越大。圖1(b)顯示了一個父粒子按本文的改進(jìn)變異算子進(jìn)化生成30 個子粒子的結(jié)果,相較于傳統(tǒng)變異算子將子粒子分布在父粒子兩側(cè)的方式,本文的分布方式使子粒子覆蓋的區(qū)域更廣,從而增加了粒子的多樣性,更有可能得到接近目標(biāo)真實運動狀態(tài)的子粒 子,經(jīng)過不斷地迭代,跟蹤誤差將逐漸減小。
以正北為0°,采樣周期T為1 s,共采樣600 s。觀測站是運動的,它的初始坐標(biāo)為(0,0),前300 s 和后300 s 運動方向分別為60°和135°,速度保持9 m/s。目標(biāo)與觀測站的初始距離為8 500 m,初始方位角為45°。目標(biāo)運動情況如表1 所示,速度為14 m/s,在61~120 s 和181~240 s 兩段時間內(nèi)目標(biāo)機(jī)動。
表1 目標(biāo)運動情況
粒子數(shù)N取500 個,設(shè)目標(biāo)方位角、速度、航向、相對觀測站距離誤差符合零均值高斯分布,且 σβ=0.1°,σv=0.2 m/s,σcourse= 0.1°,σr=0.1 m,將收斂時間定義為目標(biāo)距離誤差縮小至10%的時間[15],并用均方根誤差(root mean square error,RMSE)衡量各算法的性能,均方根誤差越小說明算法的性能越好。為保證算法性能測量的準(zhǔn)確性,本文將每個算法仿真30 次。分別采用系統(tǒng)重采樣粒子濾波(system resampling particle filter,SRPF)、傳統(tǒng)遺傳粒子濾波(genetic resampling particle filter,GRPF)和本文改進(jìn)遺傳粒子濾波(improved genetic resampling particle filter,IGRPF) 得到的純方位目標(biāo)跟蹤結(jié)果以及各算法在迭代過程中的距離誤差百分比如圖2 所示,位置均方根誤差RMSEx和速度均方根誤差RMSEv如圖3 所示。
圖2 各算法跟蹤結(jié)果
圖3 位置和速度均方根誤差
從圖2 的各算法跟蹤結(jié)果中可以看出,SRPF的距離誤差在600 s 內(nèi)始終未收斂,GRPF 和IGRPF算法的收斂時間分別為468 s 和399 s,可見本文的IGRPF 算法能有效提升純方位機(jī)動目標(biāo)跟蹤的收斂速度;結(jié)合圖3 和表2 可知,本文的IGRPF算法在跟蹤機(jī)動目標(biāo)時得出的位置均方跟誤差相對SRPF 和GRPF 分別減少了25.2% 和13.0%,速度均方根誤差相對SRPF 減少了4.1%,與GRPF基本一致,由此驗證了本文的改進(jìn)遺傳粒子濾波算法擴(kuò)大了新生代粒子的分布范圍、增加了粒子的多樣化變異幅度。高質(zhì)量的新生代粒子有效防止目標(biāo)機(jī)動時狀態(tài)估計時陷入孤立點,并使得更多的粒子接近目標(biāo)真實運動狀態(tài),從而更準(zhǔn)確地跟蹤機(jī)動目標(biāo),也說明本文的改進(jìn)遺傳重采樣方法提升了系統(tǒng)的整體估計精度,改善了估計性能。
表2 各算法的平均位置均方根誤差
圖4~6 是3 種算法在目標(biāo)第一次機(jī)動不久后(取t=150 s)的粒子分布情況,能夠反映粒子在不斷預(yù)測修正和更新后的狀態(tài)。由圖4~6 可見,SRPF 和GRPF 由于粒子變化范圍較小、變異幅度缺乏多樣性的問題造成了較大的跟蹤誤差,分別是945.9 m 和839.7 m;而本文的IGRPF 算法在遺傳重采樣時,權(quán)重較小的父粒子被拋棄,權(quán)重越大的父粒子經(jīng)過選擇和變異算子處理后生成了更多的子粒子,子粒子加權(quán)累加后得到的目標(biāo)估計位置誤差更小,為724.4 m。圖6(a)中父粒子的半徑與權(quán)重的大小成正比,舉例的父粒子權(quán)重較大,進(jìn)化后在圖6(b)中生成了5 個子粒子,擴(kuò)大了粒子的分布范圍。經(jīng)過不斷預(yù)測修正和更新之后,IGRPF 算法的粒子能更快靠近目標(biāo)的真實位置。
圖4 SRPF 粒子分布
圖5 GRPF 粒子分布
圖6 IGRPF 粒子分布
本文針對遺傳粒子濾波算法在重采樣時粒子變異方向和幅度單一,在處理純方位機(jī)動目標(biāo)跟蹤問題上易造成誤差較大和收斂時間長的問題,提出以下改進(jìn):
1)調(diào)整了新生代粒子的分布方式,擴(kuò)大了其分布的范圍。
2)根據(jù)純方位運動目標(biāo)跟蹤模型將擴(kuò)散因子分為位置擴(kuò)散因子和速度擴(kuò)散因子,使粒子變異的幅度更合理。
經(jīng)仿真實驗驗證,本文的改進(jìn)遺傳粒子濾波算法能有效提升純方位機(jī)動目標(biāo)跟蹤的收斂速度并減小跟蹤誤差,提升系統(tǒng)的估計性能,以便更精準(zhǔn)地完成水下目標(biāo)探測。然而,本算法僅在仿真數(shù)據(jù)上進(jìn)行驗證,今后將逐步開展試驗,以驗證算法的普適性和有效性。