高長生,王越欣,荊武興,胡玉東
(哈爾濱工業(yè)大學 航天學院 自主空間系統(tǒng)實驗室,黑龍江 哈爾濱 150001)
臨近空間是指距離地面高度為20~100 km的空域,該空域處在航空和航天之間,比衛(wèi)星飛行高度低,比飛機飛行高度高,探測信息相對空缺,掌握該空域?qū)θ〉弥瓶諜?quán)有很大的作用,臨近空間特殊的戰(zhàn)略地位對未來戰(zhàn)爭體系的影響不可估量[1-3],近年來得到了各國軍方的高度重視。以美國為代表,如HTV2,CAV等高超聲速飛行器,其高速、遠程、精確的特點可以實現(xiàn)全球戰(zhàn)略打擊目的,給其他國家的國防帶來了嚴肅的考驗[4-5]。在此背景下,針對該類飛行器的攔截研究已迫在眉睫。
在解決臨近空間目標跟蹤問題時,一個重要的方面就是構(gòu)建高超聲速飛行器的運動模型,經(jīng)過近幾十年各國科學家和學者的深入研究,其相關(guān)理論和模型日趨完善。相關(guān)的運動學模型主要有:勻速模型(CV),狀態(tài)量只有位置和速度2方面,適合跟蹤目標作簡單的勻速直線運動,無任何機動情況下的運動形式[6]。勻加速模型(CA),相較于勻速模型,把目標的加速度加入到狀態(tài)量中,適合跟蹤目標作勻加速運動對應的跟蹤模型[7]。圓周轉(zhuǎn)彎模型(CT),指物體的速度和加速度大小均不變化,只有方向改變,主要用于跟蹤目標轉(zhuǎn)彎,常用于描述二維運動狀態(tài)[8]。上述模型均是將加速度假設為高斯白噪聲系統(tǒng),這在實際應用中會出現(xiàn)很大的誤差,此外一階時間相關(guān)模型(Singer),將目標的加速度作為具有零均值指數(shù)衰減自相關(guān)函數(shù)的隨機過程,且具有指數(shù)自相關(guān)的特性,彌補了這一假設誤差[9]。在此基礎(chǔ)上,國內(nèi)的周宏仁教授對Singer模型進行了改進,認為下一時刻的加速度不能隨意取值,只能在當前加速度的領(lǐng)域內(nèi)取值,目標加速度的統(tǒng)計特性用修正的瑞利分布來表示。在目標運動過程中實現(xiàn)了加速度均值自適應變化,并且加速度概率分布與均值相關(guān),方差則由加速度均值決定。目標的加速度只能在前一時刻加速度的鄰域范圍內(nèi)變化,建模為非零均值的自相關(guān)指數(shù)衰減過程[10]。
在高超聲速飛行器跟蹤系統(tǒng)中,工程上應用最為廣泛的是卡爾曼濾波。應用卡爾曼濾波算法完成系統(tǒng)狀態(tài)估計,需要依賴構(gòu)建的系統(tǒng)模型和實時的測量數(shù)據(jù)。然而,在跟蹤未知臨近空間目標時,飛行器的運動規(guī)律及參數(shù)無法得知,必然會引起跟蹤模型的不匹配問題,同時目標運動過程中隨時可能存在機動模式切換情況[11]。目標運動的不確定性嚴重影響了算法的精度和穩(wěn)定性。目標機動運動實質(zhì)上是一種非線性現(xiàn)象,可以利用神經(jīng)網(wǎng)絡的強非線性映射能力對目標運動的不確定性建模,對目標機動在線辨識,實時修正濾波估計值[12-14]。BP神經(jīng)網(wǎng)絡是一種按照誤差逆向傳播算法訓練的多層前饋神經(jīng)網(wǎng)絡,是應用最廣泛的神經(jīng)網(wǎng)絡,可以利用BP神經(jīng)網(wǎng)絡對濾波算法的濾波誤差進行預測,并補償給濾波估計值,從而提高濾波精度[15]。
綜上所述,本文針對高超聲速飛行器難以進行高精度跟蹤這一問題,提出了一種高超聲速飛行器在線反饋濾波算法。在當前統(tǒng)計模型的基礎(chǔ)上,利用BP神經(jīng)網(wǎng)絡與卡爾曼濾波相結(jié)合進行濾波器設計,實現(xiàn)對高超聲速飛行器高精度跟蹤。最后采用數(shù)學仿真手段對所提出的算法進行了驗證,并進行相關(guān)分析。
目標跟蹤模型是跟蹤算法的基礎(chǔ),是系統(tǒng)的狀態(tài)方程部分,即當前時刻目標的狀態(tài)量由前一時刻狀態(tài)量的表示方法,目標的運動特性由位置、速度、加速度等狀態(tài)量表征。
(1)
(2)
假設紅外采樣間隔為T,對上述方程離散化,則離散時間狀態(tài)方程為
(3)
式中:X(k)為k時刻目標運動的狀態(tài)量;F(k)為狀態(tài)轉(zhuǎn)移矩陣;G(k)為輸入控制矩陣;W(k)為噪聲。
狀態(tài)轉(zhuǎn)移矩陣F(k)的表達式為
(4)
輸入控制矩陣G(k)的表達式為
(5)
當前時刻的加速度均值一般情況下難以確定,用濾波遞推過程中的加速度一步預測代替,有
(6)
目標當前加速度方差估計:
(7)
式中:amax和a-max分別為目標加速度的最大值和最小值。
噪聲W(k)的協(xié)方差為
(8)
Q為對稱矩陣,而且有
(9)
綜上,“當前”統(tǒng)計模型將上一個時刻的加速度輸入到當前時刻來估算加速度方差,進而自適應地調(diào)整過程噪聲。
首先定義探測坐標系OxPyPzP,簡記為P。OyP軸在探測系原點水平面內(nèi),指向北極方向,OzP軸垂直于水平面指向上方,OxP構(gòu)成右手坐標系,坐標系固連在地球表面。如圖1所示。
設目標在探測系下的位置矢量:
r=(x,y,z).
(10)
紅外探測器基點在探測系下的位置矢量:
Si=(xi,yi,zi).
(11)
目標在本體系下的矢量為
(12)
所以有
(13)
如圖2所示。
圖2 定位原理Fig.2 Positioning principle
定位:
(14)
整理為矩陣形式:
(15)
則有
(16)
綜上,使用最小二乘算法定位,則有
M·X=Y?X=(MT·M)-1·MT·Y.
(17)
BP神經(jīng)網(wǎng)絡由3部分組成,分別為輸入層、隱含層和輸出層,其中輸入層接受外界信息和數(shù)據(jù)輸入,輸出層則輸出網(wǎng)絡對輸入信息和數(shù)據(jù)的處理結(jié)果,隱含層作為輸入層和輸出層的媒介,完成信息和數(shù)據(jù)的分析、處理過程。如圖3所示。
圖3 BP神經(jīng)網(wǎng)絡基本結(jié)構(gòu)Fig.3 Basic structure of BP neural network
神經(jīng)元作為人工神經(jīng)網(wǎng)絡中信息、數(shù)據(jù)處理的獨立單元,主要完成3個功能:加權(quán)、求和以及激活,其模型如圖4所示。
圖4 神經(jīng)元模型Fig.4 Neuron model
(1) 加權(quán):接受前一層傳來的數(shù)據(jù),并且每一個輸入信號都對應一個不同的權(quán)重;
(2) 求和:確定全部輸入在不同權(quán)重下的組合效果;
(3) 激活:將數(shù)據(jù)的加權(quán)和輸入到激活函數(shù),并將函數(shù)輸出結(jié)果傳遞給下一層。
激活函數(shù)采用tansig函數(shù),可以將一個實數(shù)映射到[-1,1]區(qū)間內(nèi),表達式為
y=2/[1+exp(-2x)]-1.
(18)
如圖5所示。
圖5 tansig函數(shù)Fig.5 Tansig function
將BP神經(jīng)網(wǎng)絡的學習和適應能力應用到卡爾曼濾波中,使濾波器兼?zhèn)鋵W習能力和估計性能,從而提高系統(tǒng)的跟蹤性能。
輸出濾波器的狀態(tài)估計方程為
(19)
將估計方程做等價變形,有
(20)
圖6 算法原理Fig.6 Algorithm principle
(1) 網(wǎng)絡結(jié)構(gòu)與參數(shù)配置
X=[xyzvxvyvzaxayaz].
(21)
狀態(tài)估計9維,殘差3維,增益為9×3=27維,則輸入節(jié)點數(shù)為39個,輸出節(jié)點數(shù)為9個。本文設置隱含層為2層,節(jié)點數(shù)分別為45,9。學習率采用Levenberg-Marquardt算法。
(2) 采集訓練數(shù)據(jù)集
本文采用有監(jiān)督學習的方式離線訓練網(wǎng)絡,典型彈道及一些常見的機動彈道等彈道的跟蹤結(jié)果進行數(shù)據(jù)采集,包含15 000個輸入輸出時間序列數(shù)據(jù)。
(3) 數(shù)據(jù)預處理
BP神經(jīng)網(wǎng)絡的激活函數(shù)將數(shù)據(jù)映射到(-1,1),需要對輸出數(shù)據(jù)進行歸一化處理,考慮到神經(jīng)網(wǎng)絡的輸入數(shù)據(jù)之間存在很大的量級差別,為了避免因量級差異引起網(wǎng)絡誤差預測較大,需要對輸入數(shù)據(jù)進行預處理。采用最大最小值方法進行數(shù)據(jù)歸一化。用神經(jīng)網(wǎng)絡得到的預測結(jié)果還需要進行數(shù)據(jù)的反歸一化處理,反歸一化是歸一化的逆過程。
(4) 網(wǎng)絡訓練
設置網(wǎng)絡最大訓練次數(shù)為3 000,訓練精度為1×10-5,是輸入輸出數(shù)據(jù)歸一化后的精度要求。設置隱含層的激活函數(shù)為tansig函數(shù),輸出層的激活函數(shù)為purelin函數(shù)。
(5)卡爾曼BP神經(jīng)網(wǎng)絡融合輸出
將訓練好的BP神經(jīng)網(wǎng)絡嵌入到卡爾曼濾波器中,形成混合濾波器。在對機動目標狀態(tài)估計時,經(jīng)過卡爾曼濾波得到網(wǎng)絡的輸入數(shù)據(jù),需要一步數(shù)據(jù)歸一化處理。而后將歸一化數(shù)據(jù)輸入網(wǎng)絡得到輸出數(shù)據(jù),需要輸出數(shù)據(jù)反歸一化處理,得到網(wǎng)絡預測的估計誤差。
同時需要對網(wǎng)絡的估計誤差設置閾值檢測,若估計誤差超過閾值限制,則認為此次的網(wǎng)絡預測值錯誤,對濾波估計值不進行修正。即:
(22)
為了驗證本文所提算法的有效性,采用數(shù)學仿真方法進行驗證,具體仿真場景如下:起點高度h0為45 km,起點經(jīng)度λ0為152°E,起點緯度φ0為25°N,初速度v0為6 km/s,初始航跡角γ0為0°,初始航向角ψ0為260°,初始攻角α0為5°,初始傾側(cè)角σ0為5°,仿真場景如圖7所示。
圖7 仿真場景Fig.7 Scene simulation
設置系統(tǒng)測量噪聲服從干擾高斯分布:
vk~(1-α)N(0,Rk)+αN(0,λRk),
(23)
是2種高斯噪聲的疊加。對目標的運動軌跡進行跟蹤測試。本文設置兩臺紅外探測器(S1,S2),高度為30 km,分別布置在(120.0 E,42.9 N),(116.5 E,40.1 N)完成對目標的探測定位。
選擇指標為均方根誤差(RMSE):
(24)
式中:N為蒙特卡羅仿真次數(shù);下標i代表狀態(tài)向量的第i個分量;j代表濾波第幾步;k為第k次蒙特卡羅仿真。
跟蹤時間為150 s,進行50次蒙特卡羅仿真結(jié)果如圖8,9所示。
圖8 位置RMSE對比圖Fig.8 Speed RMSE comparison
圖9 速度RMSE對比圖Fig.9 Location RMSE comparison
由上述仿真結(jié)果可知,經(jīng)過BP神經(jīng)網(wǎng)絡補償后的混合濾波器明顯收斂速度更快,而且跟蹤誤差要小很多。跟蹤精度有大幅度的提高。軌跡更加光滑。說明輸入預測估計值與濾波估計值的差值、濾波增益和新息,通過神經(jīng)網(wǎng)絡可以很準確地預測估計誤差。
本文針對高超聲速飛行器運動軌跡跟蹤,在當前統(tǒng)計模型的基礎(chǔ)上,提出了一種高超聲速飛行器在線反饋濾波算法。仿真結(jié)果表明,此在線反饋濾波算法應對高超聲速飛行器具有良好的跟蹤能力,利用此算法可以獲得更高的濾波精度和穩(wěn)定性。