羅 飛,任昊利,趙 冰
(1.中國人民解放軍91054部隊,北京102442;2.戰(zhàn)略支援部隊航天工程大學,北京101416;3.中國人民解放軍91776部隊,北京100161)
隨著航天活動的日趨頻繁,在軌衛(wèi)星數(shù)量越來越多,特別是美國在軌偵察衛(wèi)星多達數(shù)十顆,可對我海上艦船目標進行大范圍、全天候、高時效的偵查探測和海洋監(jiān)視,為有效規(guī)避其偵察監(jiān)視或對其實施干擾抗擊,對其衛(wèi)星軌道進行預測十分必要。目前,國際上主要通過經(jīng)典力學模型對衛(wèi)星軌道進行預報。北美防空司令部(North American Aerospace Defense,NORAD)提供的兩行軌道根數(shù)(Two-Line Elements,TLE)結合解析模型進行軌道預報是目前針對衛(wèi)星軌道預報的主流方法。NORAD的TLE需要在簡化常規(guī)擾動(Simplified General Perturbation Version4, SGP4)解析模型中進行計算[1],SGP4適用于近地空間目標軌道周期小于225 min的衛(wèi)星[2]。對衛(wèi)星軌道預報精度的研究,一方面集中在TLE初值,另一方面集中在對各攝動力模型優(yōu)化。盡管傳統(tǒng)方法相對成熟,但是衛(wèi)星軌道預測模型仍存在一定局限性、預報精度還有待提高。首先,現(xiàn)有的理想化的攝動力模型偏差相對較大;其次,所謂的攝動力是考慮影響衛(wèi)星軌道的影響因素,這些因素放到一個模型里可能考慮不全甚至說不清楚;再次,由于很難獲取他國衛(wèi)星的軌道數(shù)據(jù),無法及時修正軌道,數(shù)學模型在長期軌道預報中存在誤差發(fā)散現(xiàn)象[3]。針對上述不足,本文提出基于神經(jīng)網(wǎng)絡的軌道預報算法,使用衛(wèi)星的歷史TLE數(shù)據(jù)作為神經(jīng)網(wǎng)絡的學習樣本,通過對大量數(shù)據(jù)的學習,得出衛(wèi)星軌道運行的規(guī)律,預報衛(wèi)星軌道。
根據(jù)TLE兩行數(shù)據(jù),衛(wèi)星的軌道根數(shù)核心數(shù)據(jù)包括6個積分常數(shù),即開普勒軌道六要素[4],衛(wèi)星的軌道根數(shù)確定后,便可確定衛(wèi)星任一時刻的空間位置,國際上采用較多的是美國全球觀測網(wǎng)(SSN)發(fā)布的TLE根數(shù)形式,該根數(shù)形式提供開普勒根數(shù)中的軌道偏心率e,衛(wèi)星運動軌道面與赤道面的夾角i,衛(wèi)星軌道升交點赤經(jīng)Ω,近地點極角ω。此外還提供了平近點角M0和平均運動n0,這2個參數(shù)可以推算出開普勒軌道根數(shù)中的衛(wèi)星過近地點時刻ξ和軌道半長軸a。因此,本文將上述的6個參數(shù)e,i,Ω,ω,M0,n0,統(tǒng)稱為TLE兩行軌道的六要素。
SSN每天不定時會發(fā)布一條針對衛(wèi)星的TLE軌道數(shù)據(jù),隨著時間T變化,TLE兩行軌道六要素也發(fā)生改變,直觀上來看,TLE軌道六要素的變化和時間T之間應存在某種對應關系。TLE軌道六要素的物理含義詳細說明見表1,使用神經(jīng)網(wǎng)絡進行軌道預測將使用六要素,如表1所示。
使用神經(jīng)網(wǎng)絡算法對衛(wèi)星軌道預報分為兩部分:一是對TLE軌道數(shù)據(jù)核心要素的預報;二是對衛(wèi)星位置和速度進行預報。對衛(wèi)星的核心要素進行預報是指針對TLE軌道六要素進行預報,通過訓練歷史TLE數(shù)據(jù),得到六要素隨時間的變化趨勢預報模型,可對1 d,3 d,5 d,10 d后的軌道六要素進行預報,進而可以生成完整的TLE數(shù)據(jù)。對衛(wèi)星的位置和速度進行預報,是指通過訓練TLE的六要素和衛(wèi)星位置速度的對應關系,形成預報模型,預報過程中,通過提供衛(wèi)星的TLE六要素,可得到衛(wèi)星在任意時刻的位置和速度。
基于神經(jīng)網(wǎng)絡的LSTM算法適合處理時序數(shù)據(jù),使用循環(huán)神經(jīng)網(wǎng)絡LSTM預報衛(wèi)星軌道TLE,同時在預報過程中結合數(shù)據(jù)的特征使用線性回歸對部分數(shù)據(jù)進行擬合。本文根據(jù)TLE數(shù)據(jù)的特點及其物理含義,在TLE軌道六要素的基礎上增添TLE數(shù)據(jù)獲取時間戳T以及相鄰TLE數(shù)據(jù)之間的時間間隔D,用以構建適用于TLE數(shù)據(jù)預測的TLE預報八要素[5]:
鑒于神經(jīng)網(wǎng)絡訓練多個參數(shù)的復雜度,對軌道六要素分別進行訓練和預報。根據(jù)對TLE軌道六要素的時序變化分析[6],軌道六要素中的軌道傾角i、軌道離心率e以及平均運動n0三個可以直接用神經(jīng)網(wǎng)絡進行訓練,針對這3個要素分別構建基于LSTM的預測算法。
基于LSTM的預測模型由4部分組成,如圖1所示。
1)輸入層:TLE軌道預報八要素數(shù)據(jù)。
2)LSTM層:獲取TLE軌道預報八要素數(shù)據(jù)的高維度特征。
3)全連接層(Full-connect):對獲取到的高維度特征進行整合。
4)輸出層:計算目標要素的預測值并輸出。
以軌道傾角i的預測模型為例。首先,以歷史連續(xù)的N條數(shù)據(jù)作為輸入x,以相應的第N+1條TLE數(shù)據(jù)中軌道傾角i的值作為輸出y,構建軌道要素預報數(shù)據(jù)。在模型的訓練過程中,模型的輸入層接受輸入數(shù)據(jù)x。通過LSTM層學習依賴于N條TLE數(shù)據(jù)較長時間跨度內的高維度特征,在全連接層對獲取到的高維度特征進行微調和整合,給出回歸向量最后,在輸出層對回歸向量進行線性組合得到相應的要素預測
表1 TLE軌道六要素Tab.1 Six elements of TLE orbit
圖1 基于LSTM預測軌道參數(shù)要素的神經(jīng)網(wǎng)絡模型Fig.1 Neural network model based on LSTM to predict orbital parameter elements
使用均方根誤差(RMSE,Root Mean Squard Error)作為損失函數(shù),即使用軌道要素真實值y與相應的模型預測值之間的平方損失來衡量模型預測的好壞程度[7]。模型的損失函數(shù)如下:
其中:θ為神經(jīng)網(wǎng)絡模型中的權重參數(shù);m為訓練過程中預測的樣本數(shù)量。在訓練過程中,通過梯度下降法迭代更新參數(shù)θ完成最小化 J(θ)的目標,從而得到軌道參數(shù)基于LSTM較為準確的預測模型。
對于軌道六要素中的其他3個:升交點赤經(jīng)?、近地點角距ω以及平近點角M0,根據(jù)其數(shù)據(jù)的時序變化特點和仿真結果,假定這3個要素在較短時間跨度內與時間呈近似線性關系,故基于線性回歸(Linear Regression)算法分別針對這3個要素構建預測模型[8]。以升交點赤經(jīng)Ω的要素預測模型為例,以軌道預報八要素中的時間戳T與升交點赤經(jīng)Ω分別作為模型的輸入,并用其輸出值進行模型的準確度評估,該預報問題可定義為:
給定m個變量{(t1,y1),(t2,y2),···,(tm,ym)},其中t∈Rn,y∈R,目標是找到一個最合適的函數(shù)F(t):f:Rn→R。
因為y與t呈近似線性關系,其關系可表示為:
其中:w為系數(shù);b為截距。
為了找到最佳函數(shù),在基于線性回歸的預測算法中,同樣采用均方根誤差J(θ)作為模型預測好壞程度的評價指標,其中θ表示神經(jīng)網(wǎng)絡模型中的權重參數(shù),在訓練過程中通過梯度下降法迭代更新參數(shù)θ,使得J(θ)最小。
為了驗證卷積神經(jīng)網(wǎng)絡模型的加入有助于軌道預報精度的提高,在原有的LSTM模型的基礎上,添加了卷積神經(jīng)網(wǎng)絡來獲取TLE數(shù)據(jù)之間的短期時序依賴關系,其模型框架如圖2所示。
圖2 基于LSTM_CNN神經(jīng)網(wǎng)絡和線性回歸預測TLE軌道六要素示意圖Fig.2 Six elements of TLEorbit prediction based on LSTM_CNN neural network and linear regression
特別注意第m個TLE數(shù)據(jù)TLEm,也就是訓練數(shù)據(jù)中的最后一個TLE數(shù)據(jù),其時間間隔?tm是根據(jù)預測的時間戳tm+1和 其當前時間戳tm求差得到的。
之后將tles分別輸入到TLE數(shù)據(jù)中每個元素各自對應的模型,得到第m+1時刻TLE數(shù)據(jù)的6個要素,注意第m+1時刻的TLE數(shù)據(jù)是在測試集,測試集被視為空間飛行物未來時刻的數(shù)據(jù),形式化表示如下:
其中:LR為 線性回歸模型;LS T M為長短時記憶網(wǎng)絡模型;CNN為卷積神經(jīng)網(wǎng)絡模型;LS T M_CNN為聯(lián)合LSTM和CNN的軌道預報模型。
m+1
接著將預測到的第 時刻TLE數(shù)據(jù)中不同的元素拼接起來構成新的TLE數(shù)據(jù):
tm+2
其中, 是第m+2時刻的時間戳。
最后將預測的第m+1時刻的TLE數(shù)據(jù)和
第m-n-2時刻到第m時刻的TLE數(shù)據(jù)進行拼接,從而得到模型下一輪預測的輸入數(shù)據(jù)
不斷重復上述步驟,直到完成指定未來預測的天數(shù)為止。
1)根據(jù)模型預測的TLE數(shù)據(jù)和真實的TLE數(shù)據(jù)的絕對誤差作為衡量指標,來衡量模型預測TLE數(shù)據(jù)的精度:
TLEpTLEt
其中 表示模型預測TLE數(shù)據(jù), 表示真實的TLE數(shù)據(jù)。
2)傳統(tǒng)的動力學模型的衡量指標是在同一時刻模型預測空間飛行物體的狀態(tài),例如速度和位置,與星歷數(shù)據(jù)觀察值的絕對誤差,絕對誤差越小說明其精度越高。為了能和傳統(tǒng)的動力學模型比較,采用速度和位置的絕對誤差作為模型的另一衡量指標。
告密者1(Informator 1)是Koskon(空間轉換)全球空間通信系統(tǒng)的一顆原型通信衛(wèi)星,選擇從1991年6月17日到2003年2月8日由其有效載荷AO-21生成的共10550條TLE數(shù)據(jù),按照時間先后排序之后,將前80%的TLE數(shù)據(jù)作為訓練集,將后20%的TLE數(shù)據(jù),其詳細統(tǒng)計數(shù)據(jù)如表2所示。
表2 實驗數(shù)據(jù)說明Tab.2 Description of experimental data
為了能和LSTM模型有比較,因此我們設置網(wǎng)絡訓練的參數(shù)與LSTM模型相同,LSTM_CNN模型在LSTM模型的基礎上引入了CNN模型來獲取TLE時序數(shù)據(jù)的局部特征。
表3 LSTM_CNN模型的網(wǎng)絡結構參數(shù)Tab.3 Network structureparametersof LSTM_CNN model
一開始嘗試LSTM模型對應的3個元素全部用LSTM_CNN模型替換,并記錄相應的實驗結果。為了更加深入地研究LSTM_CNN模型對位置預報精度的影響,將線性回歸預測的3個變量的實驗參數(shù)設置和LSTM對應相同。
1)LSTM_CNN模型替換LSTM模型將LSTM模型對應的3個元素使用LSTM_CNN模型來訓練和預測,分別記錄在20 d內軌道離心率、軌道傾角和平均運動的誤差及在20 d內速度位置上的誤差。
表4 20 d內的20條TLE數(shù)據(jù)的誤差預測結果(誤差放大10000倍)Tab.4 Error prediction results of 20 TLE data within 20 days(error amplification by 10000 times)
首先比較LSTM_CNN模型和LSTM模型對TLE元素的預測結果發(fā)現(xiàn),LSTM模型對軌道離心率、軌道傾角和平均運動的誤差分別控制在0.333,2.34和0.22,而LSTM_CNN模型對軌道離心率、軌道傾角和平均運動的誤差分別控制在0.17,1.68和0.53。上述現(xiàn)象的原因是軌道離心率、軌道傾角隨著時間呈現(xiàn)比較復雜的變化曲線,而平均運動時間呈現(xiàn)比較緩慢的變化,增加模型的復雜度對軌道離心率和軌道傾角的預測精度有所提高,而對于平均運動則會存在過擬合的問題,導致其在訓練數(shù)據(jù)集上表現(xiàn)效果好,而在測試數(shù)據(jù)集上誤差高。
表5 20 d內的LSTM_CNN模型在位置上的預測誤差Tab.5 Prediction error of LSTM_CNN model in position within 20 days
其次比較LSTM_CNN模型和LSTM模型對位置上的誤差,發(fā)現(xiàn)LSTM_CNN模型在軌道離心率和軌道傾角上的精度提高,在平均運動上的預報精度下降,導致在位置上的總體誤差從LSTM模型的100 km升高到了200 km,由此說明平均運動的精度和位置上的預報精度成正比。為了讓結論更加有說服力,分別構建在3個元素不同預報精度下對位置誤差的影響。
表6 不同元素的不同預報精度對位置誤差的影響(對TLE元素的誤差放大10000倍)Tab.6 Influenceof different prediction accuracy of different elements on position error (magnifying theerror of TLE element by 10000 times)
其中“真實值”表示采用預測數(shù)據(jù)的真實值,不采用LSTM模型或者LSTM_CNN模型的預測值。通過靈敏度分析可知,平均運動的預報模型宜采用LSTM模型,軌道傾角和軌道離心率的預報模型為宜采用LSTM_CNN模型,這樣預測的三要素誤差值最小。觀察表中的實驗結果,比較序號1和序號2,在保持軌道傾角和軌道離心率不變的情況下,其中序號1中平均運動的誤差低,同時序號1的整體位置誤差比序號2低,由此可充分說明平均運動的預報精度和對空間飛行物位置上的整體預報精度成正比關系。除此之外,比較序號3、序號4和序號5中軌道傾角的誤差分別為1711,6716和0,而位置上的整體誤差控制在98 km左右,充分說明了軌道傾角的預報精度對位置上的誤差影響較小。最后觀察序號3和序號6上的軌道離心率的誤差分別在16 816和0,而位置上的整體誤差控制在97 km左右,由此說明軌道離心率對軌道預報模型精度的影響較小。
通常,其他國家的衛(wèi)星特別是有軍事用途的衛(wèi)星實時信息是嚴格保密不易獲取的。本文建立僅依賴歷史數(shù)據(jù)的衛(wèi)星軌道預測模型,針對不同的預測參數(shù)采用不同的神經(jīng)網(wǎng)絡模型算法,可以最大可能地減少預測誤差、提高預測精度,同時該預測模型支持長時間跨度的衛(wèi)星軌道預測,最長可以對20 d的衛(wèi)星數(shù)據(jù)進行預測,位置誤差控制在100 km以內,基本能夠滿足使用要求。后續(xù),考慮增大訓練集合規(guī)模,采用不同時序處理算法開展下階段研究,以期進一步提高預測精度。