閆謙時,崔廣立
(西安工業(yè)大學 計算機科學與工程學院,西安 710021)
基于時間序列的航天器遙測數(shù)據(jù)預(yù)測算法
閆謙時,崔廣立
(西安工業(yè)大學 計算機科學與工程學院,西安 710021)
在航天器遙測數(shù)據(jù)預(yù)測領(lǐng)域,基于時間序列的預(yù)測方法有著廣闊的應(yīng)用前景;時間序列有一明顯的特性就是記憶性,記憶性是指時間數(shù)列中的任一觀測值的表現(xiàn)皆受到過去觀測值影響;它的基本思想是根據(jù)觀測數(shù)據(jù)的特點為數(shù)據(jù)建立盡可能合理的統(tǒng)計模型,利用模型的統(tǒng)計特性解釋數(shù)據(jù)的統(tǒng)計規(guī)律,以期達到預(yù)報的目的;提出了采用模式識別和參數(shù)估計的方法,結(jié)合航天器遙測動態(tài)數(shù)據(jù),建立關(guān)于航天器遙測數(shù)據(jù)的時序預(yù)測模型,對航天器遙測數(shù)據(jù)趨勢進行檢測和預(yù)報。
遙測數(shù)據(jù);時間序列;預(yù)測;參數(shù)估計
近年來,我國的航天科技發(fā)展日新月異,然而,不斷增加的在軌航天器數(shù)量、不斷延長的航天器設(shè)計壽命以及不斷增多的航天器型號種類,給地面的管理工作增加了更大的難度,因此對于地面工作人員來說,有效維護航天器運行的穩(wěn)定性十分重要。和地面的模擬環(huán)境相比,航天器運行的空間環(huán)境更加的復(fù)雜和不可知[1]。航天器在運行過程中長期受到光照、輻射、太陽粒子等多種因素的作用和影響,致使其運行過程中的性能與功能隨在軌時間而發(fā)生一定變化,而我們地面控制中心接收到的遙測數(shù)據(jù)的變化趨勢可以有效的反映出這一情況。所以,為了提高航天器運行的可靠性,降低其運行風險,保障航天器在軌道上長期安全的運行。我們有必要對航天器遙測數(shù)據(jù)在未來一段時期內(nèi)的變化趨勢進行預(yù)測,進一步達到變化趨勢外推的作用,及時發(fā)現(xiàn)數(shù)據(jù)的異常變化。
在航天器遙測數(shù)據(jù)預(yù)測領(lǐng)域,基于時間序列的預(yù)測方法有著廣闊的應(yīng)用前景。航天器遙測數(shù)據(jù)的種類繁多,有長期趨勢波動變化的;有季節(jié)性變化的;還有一些隨機性變化的。遙測數(shù)據(jù)的變化能夠反映航天器性能和狀態(tài)的改變。根據(jù)這些改變,從而可以對航天器各部件的性能和趨勢進行預(yù)測。首先通過對航天器遙測數(shù)據(jù)參數(shù)值的變化特點進行平穩(wěn)性檢測分析,然后采用差分運算法將非平穩(wěn)的時間序列進行平穩(wěn)化處理。然后根據(jù)時間序列算法特性選取適當?shù)臅r間序列預(yù)測模型,利用MDL準則和貝葉斯估計方法確定模型的階數(shù)和參數(shù)。進而建立完整的預(yù)測模型方程,對遙測數(shù)據(jù)在未來一段時間內(nèi)的趨勢變化進行預(yù)測。
衛(wèi)星在復(fù)雜的空間環(huán)境中運行時,會產(chǎn)生大量的遙測數(shù)據(jù)。這些遙測數(shù)據(jù)的變化規(guī)律能夠很好的反應(yīng)衛(wèi)星的運行性能,這些遙測數(shù)據(jù)包括發(fā)動機的溫度、推進線路盒溫度、太陽翼的溫度、電池電壓等等。然而,在實際過程中由于航天器在運行時會受到復(fù)雜環(huán)境的影響,致使我們得到的遙測數(shù)據(jù)有可能是非平穩(wěn)序列。如果遙測數(shù)據(jù)的時序是非平穩(wěn)的,那么時間序列回歸中可能會出現(xiàn)預(yù)測有偏和無效等問題。所以在進行遙測數(shù)據(jù)預(yù)測前,對數(shù)據(jù)的變化規(guī)律進行預(yù)處理,去除野值、跳變等情況,得到平穩(wěn)性序列。從而可以提高預(yù)測精度。常用有差分變換和對數(shù)變換進行。通常情況下我們需要對序列進行反復(fù)的變換和比較,最終遙測數(shù)據(jù)時序的正態(tài)性和平穩(wěn)性等達到相對較好的狀態(tài)。
1.1 平穩(wěn)性檢驗
平穩(wěn)性檢驗是動態(tài)數(shù)據(jù)處理的必要前提,因為時間序列算法的處理對象是平穩(wěn)性的數(shù)據(jù)序列。所以獲得一個時間序列之后,要對其進行分析預(yù)測,首先要保證該時間序列的平穩(wěn)性。這里采用游程檢驗法對數(shù)據(jù)序列進行平穩(wěn)性檢驗。
比如某衛(wèi)星推進線路盒殼溫樣本序列為:
x={8.128,8.604,8.584,8.870,8.859,8.574,8.859,10.288,10.278,10.564}
序列的均值為9.1608,序列中比均值小的記為“-”,比均值大的記為“+”,得到符號序列,其中每一段連續(xù)相同的符號序列稱為一個游程。該樣本序列的游程如下。
共有2個游程,序列長度為N:
N=N1+N2
(1)
N1和N2分別表示“+”和“-”出現(xiàn)的次數(shù)。游程總數(shù)r=2,則統(tǒng)計量:
(2)
近似服從N(0,1)分布,其中:
(3)
(4)
通過計算可得E(r)=5.2,D(r)=0.135 8,進而Z=-8.683 9,在顯著性水平α=0.05下,|Z|=8.683 9>1.96,因此該溫度參數(shù)序列是非平穩(wěn)的。
1.2 數(shù)據(jù)平穩(wěn)化處理
由于樣本序列是非平穩(wěn)的,所以需要通過多次差分運算是遙測數(shù)據(jù)序列趨向平穩(wěn)。差分運算可用后移算法B或者差分算子▽以及相應(yīng)的階數(shù)d表示。
一階差分:
▽Xt=Xt-Xt-1=(1-B)Xt
(5)
二階差分:
▽2Xt=Xt-2Xt+Xt-2=(1-B)2Xt
(6)
一般地,d階差分:
▽dXt=(1-B)dXt
(7)
其中:▽d稱為d階差分算子:
(8)
為了消除時間序列中的趨勢性,我們通過逐項相減的方法從而使之前后相關(guān)性消除,這就是差分法的基本思想。我們可以通過對時間序列進行一階差分運算,消除線性趨勢。通過對時間序列進行二階差分運算,可以消除二階線性趨勢。當通過進行d階差分運算,就可以消除序列的d次多項式趨勢。最終使得所需的非平穩(wěn)時間序列逐漸趨于平穩(wěn)。
根據(jù)遙測參數(shù)隨著時間而發(fā)生規(guī)律性變化的特點,我們采用基于時間序列模型的外推預(yù)測方法。時間序列預(yù)測是根據(jù)歷史的數(shù)據(jù)來對時間序列的未來趨勢進行推測[3]。它的基本思想是根據(jù)觀測數(shù)據(jù)的特點為數(shù)據(jù)建立盡可能合理的統(tǒng)計模型,利用模型的統(tǒng)計特性解釋數(shù)據(jù)的統(tǒng)計規(guī)律,以期達到預(yù)報的目的。本算法采用模式識別和參數(shù)估計的方法,結(jié)合航天器遙測動態(tài)數(shù)據(jù),建立關(guān)于航天器遙測數(shù)據(jù)的時序預(yù)測模型,對航天器遙測數(shù)據(jù)趨勢進行檢測和預(yù)報。在實際應(yīng)用中許多平穩(wěn)時間序列往往可由自回歸模型、滑動平均模型和自回歸滑動平均模型近似表示,這樣可以使得相關(guān)的分析變得比較簡單,同時也為平穩(wěn)隨機序列的分析和產(chǎn)生提供了有效方法。
(1)自回歸模型。
時間序列模型中的一種比較簡單常見的模型是自回歸模型,它是一種把自身當做回歸變量的過程。它是把后期隨機變量通過利用前期隨機變量的線性組合來描述的一種線性回歸模型方式。對于時間序列{xt},當它的回歸系數(shù)用φ1,φ2,…,φp表示,μt為白噪聲序列,并且隨機項μt與xt-1,xt-2,…,xt-p不相關(guān)。那么自回歸模型的表達公式如下:
xt=φ1xt-1+φ2xt-2+…+φpxt-p+μt
(9)
此模型稱為p階自回歸模型。
(2)滑動平均模型。
對于時間序列{xt},當它的滑動平均參數(shù)為θ1,θ2,…,θq時,那么滑動平均模型的表達公式為:
xt=μt-θ1μt-1-θ2μt-2-…-θqμt-q
(10)
該模型記為MA(q)。模型的待估參數(shù)為θ1,θ2,…,θq,模型的階數(shù)為q。
(3)自回歸滑動平均模型。
自回歸移動平均模型,就是把自回歸過程AR和移動平均過程MA結(jié)合起來的模型。通過該模型對時間序列樣本數(shù)據(jù)進行模擬。利用ARMA方法可以通過有限的樣本數(shù)據(jù)擬合具有一定精度的時間序列數(shù)學模型。對于時間序列{xt}自回歸滑動平均模型的表達公式如下:
xt-φ1xt-1-φ2xt-2-…-φpxt-p=μt-θ1μt-1-θ2μt-2-…-θqμt-q[4]
(11)
在上面的式子中p是模型的自回歸階數(shù),q是模型的移動平均階數(shù)。自回歸參數(shù)是φ1,φ2,…,φp,移動平均參數(shù)為θ1,θ2,…,θq,它們是待定參數(shù)。AR模型和MA模型是ARMA模型的特殊情況。一個ARMA過程可能是AR與MA過程、幾個AR過程、AR與ARMA過程的迭加,也可能是測度誤差較大的AR過程。ARMA(p,q)是一種比AR(p)和MA(q)更具普遍性的模型。而AR(p)模型和MA(q)模型可以看作是ARMA(p,q)模型的兩個特例。在實際應(yīng)用任何時間序列都可以通過ARMA(p,q)模型來進行預(yù)測。
根據(jù)時間序列的一段樣本{xi},i=1,2,…,N所包含的信息,利用自相關(guān)函數(shù),偏相關(guān)函數(shù)的性質(zhì)和其他準則(如AIC、MDL),建立一個能夠正確反映時間序列變化過程的模型。通常情況下,如果時間序列的自相關(guān)函數(shù)有截斷點,即當階數(shù)大于某個數(shù)值時,它的自相關(guān)系數(shù)開始等于零,而它的偏自相關(guān)系數(shù)卻只是隨著階數(shù)的增大而逐漸減小,沒有截斷點,這時采取MA(q)模型。對于隨著階數(shù)的增加而時間序列的自相關(guān)函數(shù)是逐漸減少的,而沒有截斷點,但是它的偏自相關(guān)函數(shù)卻是有截斷點的,這種情況下我們通常選擇AR(p)模型。設(shè)若時間序列的自相關(guān)函數(shù)和偏自相關(guān)函數(shù)都只是伴隨著階數(shù)的增加而逐漸衰減,但均無截斷點,則無論是采用AR(p)模型還是采用MA(q)模型,其中所包含的的待估參數(shù)都比較多。這時,我們通常選擇ARMA(p,q)模型。通過對偏自相關(guān)函數(shù)的計算,我們可以方便的選取預(yù)測模型。這樣就可以通過每個模型的截尾性和拖尾性把各個模型識別出來。
為了最終建立完整的預(yù)測方程,需要取得最優(yōu)階次。要確定預(yù)測模型的階次,就是要求得模型中的p和q。常用的方法有AIC準則、MDL準則、殘差方差法等。這里選擇使用MDL準則法進行模型定階。
MDL準則的計算公式為:
(12)
參數(shù)估計的方法有很多,每種方法都有各自的優(yōu)缺點。矩估計法的優(yōu)點是思想簡單直觀,不需要假設(shè)總體分布,計算量也比較小。但是也存在著信息浪費的缺點。而極大似然估計法和最小二乘法都需要假定總體分布,并且計算量比較大。貝葉斯估計的估計精度比較高,所以在這里采用貝葉斯方法來估計模型的參數(shù),首先我們需要計算出模型的似然函數(shù):
(13)
參數(shù)θj(j=1,2,3,…q)的后驗分布為:
(14)
參數(shù)φi(i=1,2,3…p)的后驗分布為:
(15)
參數(shù)σ2的后驗分布為:
(16)
給定Φ,Θ,σ2的初值?1(0),…?p(0)和θ1(0),…θq(0)和σ2(0),然后從后驗分布中分別抽取φi,θj,σ2的值,然后反復(fù)迭代直到收斂,最終估計出模型方程的參數(shù)值。
通過對時間序列數(shù)據(jù)是否能夠滿足平穩(wěn)性要求進行判定,當處于非平穩(wěn)時進行平穩(wěn)化處理。然后選擇一種合適的自回歸模型判定階數(shù)、估計參數(shù),建立具體的估計方程。然后將已知的時間序列的項代入方程,可預(yù)測時間序列中的未來項。
對于具有周期性和平穩(wěn)性變化規(guī)律的遙測參數(shù),比如主母線電壓等,具有很好的預(yù)測效果。
本文以某衛(wèi)星北主母線電壓的遙測參數(shù)作為實例對象,由于衛(wèi)星運行在復(fù)雜的空間環(huán)境中電壓的參數(shù)變化具有特殊性,需要對數(shù)據(jù)進行預(yù)處理。對于獲得的遙測參數(shù)可能會出現(xiàn)跳碼、數(shù)據(jù)不連續(xù)等一些非平穩(wěn)現(xiàn)象,我們在進行預(yù)測模型選擇之前要對數(shù)據(jù)進行預(yù)處理。把有效參數(shù)選擇出來,并對遙測數(shù)據(jù)按照一定的周期性進行取樣,同時選取特定的時間間隔的數(shù)據(jù)以便建立合理的預(yù)測模型。首先通過建立相應(yīng)的時間序列,并進行平穩(wěn)性檢驗,得到該時間序列是非平穩(wěn)的,然后通過差分法進行平穩(wěn)性處理。經(jīng)過數(shù)據(jù)預(yù)處理,可以提高預(yù)測的精度,然后建立時間預(yù)測模型進行預(yù)測。
5.1 原始數(shù)據(jù)和預(yù)測數(shù)據(jù)對比
我們選取某衛(wèi)星北主母線電壓樣本數(shù)據(jù)進行分析,選取任意四天的數(shù)據(jù)作為原始數(shù)據(jù)應(yīng)用時間序列模型,來對后七天的數(shù)據(jù)變化趨勢進行預(yù)測,并對比真實值進行誤差分析。通過對四天數(shù)據(jù)的分析得到的效果圖如圖1所示。
圖1 某衛(wèi)星任意四天的北主母線電壓曲線
從整體趨勢上看,該數(shù)據(jù)變化具有日周期性的特點。雖然在每個周期內(nèi)具體的參數(shù)值會存在略微差異,但總體周期趨勢是不變的。所以它可以運用我們的算法來進行預(yù)測。經(jīng)過實驗得到后七天的實際數(shù)值和預(yù)測數(shù)值的對比圖如圖2~3所示。
圖2 后七天的電壓實際數(shù)據(jù)曲線
圖3 后七天的電壓預(yù)測數(shù)據(jù)曲線
5.2 實驗結(jié)果分析
利用建立好的預(yù)測模型,把預(yù)測得到的電壓數(shù)據(jù)序列和原始數(shù)據(jù)進行對比,通過分析可以發(fā)現(xiàn)該模型的預(yù)測出的數(shù)據(jù)趨勢能夠較好的反映主母線電壓原始時間序列數(shù)據(jù)的發(fā)展趨勢。從圖3的預(yù)測結(jié)果中可以觀察出,在一些具體數(shù)值上,預(yù)測結(jié)果和實際數(shù)據(jù)值之間存在著一定程度的偏差。但在時間序列數(shù)據(jù)的整體發(fā)展趨勢上,原始時間序列中變化較為劇烈的點以及周期性的特點,在該預(yù)測模型中都得到了很好的體現(xiàn)。
我們可以發(fā)現(xiàn)該模型能夠適應(yīng)電壓數(shù)據(jù)的預(yù)測計算,能夠預(yù)測出數(shù)據(jù)的狀態(tài)變化。為了評定模型的預(yù)測精度,我們計算七天的相對誤差率。相對誤差率=(預(yù)測值-實際值)/實際值。預(yù)測結(jié)果標準誤差值如表所示:
表1 相對誤差率
通過分析預(yù)測精度變化表,可以看出電壓的變化較為劇烈。在前期,預(yù)測的精度相對較高,但隨著時間的推移預(yù)測的相對誤差率逐漸增大,預(yù)測精度逐漸降低。通過該實驗結(jié)果可知該預(yù)測算法對于短期的航天器遙測數(shù)據(jù)的預(yù)測是有效的。由于該預(yù)測算法所采用的預(yù)測模型屬于線性模型,而衛(wèi)星主母線電壓參數(shù)具有非線性的特點,所以該預(yù)測算法對于短期內(nèi)遙測數(shù)據(jù)預(yù)測的擬合度較高,而對于長期的預(yù)測精度較低。
通過上述分析表明,上述算法對航天器遙測數(shù)據(jù)在未來短時期內(nèi)的發(fā)展趨勢的預(yù)測是有效的。由于航天器長期運行在復(fù)雜的空間環(huán)境中,遙測數(shù)據(jù)不僅會受到外部空間環(huán)境的影響,同時也會受到自身工作環(huán)境等內(nèi)在因素的干擾,從而導(dǎo)致一些遙測數(shù)據(jù)具有強烈的非平穩(wěn)變化趨勢。對于非線性的遙測參數(shù),該算法的擬合度較低,參數(shù)的估計精度還有待進一步提高。今后的研究中可以結(jié)合BP網(wǎng)絡(luò)算法等方法對該算法不斷優(yōu)化,提高該方法對于遙測數(shù)據(jù)長期的預(yù)測精度。
[1] 孫 健.在軌航天器遙測數(shù)據(jù)在線預(yù)測系統(tǒng)分析與設(shè)計[D].北京:北京郵電大學,2013.
[2] 閆 坤.基于時間序列模型的分析預(yù)測算法的設(shè)計與實現(xiàn)[D].北京:北京郵電大學,2008(5).
[3] 肇 剛,李言俊.基于時間序列數(shù)據(jù)挖掘的航天器故障診斷方法[J].飛行器測控學報,2010(3):1-5.
[4] 張金玉,張 煒.裝備只能故障診斷與預(yù)測[M].北京:國防工業(yè)出版社,2013.
[5] 羅鳳曼,時間序列預(yù)測模型及其算法研究[D].成都:四川大學,2006.
[6] 王咪咪,時間序列ARMA模型的貝葉斯分析[J].科技信息,2011:568.
Spacecraft Telemetry Data Prediction Algorithm Based on Time Series
Yan Qianshi, Cui Guangli
(School of Computer Science and Engineering, Xi’an Technological University, Xi’an 710021, China)
The prediction method based on time series has broad application prospects in the field of spacecraft telemetry data prediction. One obvious characteristic of time series is memory, and memory is the performance of any observed value in the time series. The basic idea of this model is to establish the statistical model of the data according to the characteristics of the observation data, and to use the statistical characteristics of the model to explain the statistics of the data, so as to achieve the purpose of forecasting. The algorithm using pattern recognition and parameter estimation method, and combined with the spacecraft telemetry dynamic data, the establishment of spacecraft telemetry data time series prediction model, to detect and forecast the trend of the spacecraft telemetry data.
telemetry data; time series; forecast; parameter estimation
2016-11-29;
2017-01-05。
閆謙時(1973-),男,陜西西安人,副教授,碩士研究生導(dǎo)師,主要從事航天器測控、專家系統(tǒng)方向的研究。
1671-4598(2017)05-0188-04
10.16526/j.cnki.11-4762/tp.2017.05.052
TP399
A