廣州民航職業(yè)技術(shù)學(xué)院 林修杰
一種信號長期預(yù)測新算法
廣州民航職業(yè)技術(shù)學(xué)院 林修杰
對于長期數(shù)據(jù)預(yù)測,傳統(tǒng)的預(yù)測方法性能較差。采用Wiener模型進行預(yù)測,需要獲取輸入信號的功率譜密度,以及輸入和輸出信號的互譜密度,但這難以獲取,且計算量大。采用Kalman和AR模型進行預(yù)測,隨著預(yù)測距離增加,預(yù)測結(jié)果趨于訓(xùn)練集的均值。本文提出了一種基于AR模型的長期預(yù)測新算法,命名為抽樣AR模型,將訓(xùn)練集進行分組,每個估計值使用不同的訓(xùn)練集進行預(yù)測。抽樣AR模型提高了長期數(shù)據(jù)預(yù)測的準(zhǔn)確性。
長期預(yù)測;Wiener模型;Kalman模型;AR模型;抽樣AR模型
對于長期數(shù)據(jù)預(yù)測,傳統(tǒng)的預(yù)測方法性能較差。采用Wiener模型進行預(yù)測,需要獲取輸入信號的功率譜密度以及輸入和輸出信號的互譜密度,但這難以獲取,且計算時需要重復(fù)計算,計算量大。采用Kalman和AR模型進行預(yù)測,使用估計值來估計下一個估計值,因為估計值是之前訓(xùn)練集的線性組合,沒有任何新的信息,隨著預(yù)測距離增加,預(yù)測結(jié)果趨于訓(xùn)練集的均值。
長期數(shù)據(jù)預(yù)測的實際意義很大,準(zhǔn)確的預(yù)測對于自動化和無人系統(tǒng)在各種復(fù)雜情況下做出及時合理的判斷和反應(yīng)非常重要。
本文中的研究數(shù)據(jù)取自實際環(huán)境,是某車載雷達測得的平臺運動速度。在汽車自動駕駛系統(tǒng)中,平臺運動速度的準(zhǔn)確預(yù)測對于系統(tǒng)在各種復(fù)雜情況下做出及時合理的判斷和反應(yīng)非常重要。研究數(shù)據(jù)分為兩組,實際上是將實際連續(xù)觀測的一組數(shù)據(jù)分成了兩部分。第一組(訓(xùn)練集)是用于訓(xùn)練和建模,長度為5000,利用該組數(shù)據(jù)建立和調(diào)整預(yù)測模型。第二組數(shù)據(jù)(檢驗集)是用于檢驗?zāi)P托阅?,長度為500。訓(xùn)練集數(shù)據(jù)如圖1所示。
圖1 訓(xùn)練集數(shù)據(jù)
訓(xùn)練集數(shù)據(jù)有一定周期性,相鄰點之間的相關(guān)性很強,這是估值預(yù)測的基礎(chǔ)。同時,數(shù)據(jù)有很大的隨機性,在某些點出現(xiàn)接近零的幅值。較為光滑的曲線還有細微的抖動,這是測量噪聲的影響。
本文需要用5000點預(yù)測之后的500點,最大的預(yù)測步數(shù)為500步,屬于長期數(shù)據(jù)預(yù)測。這要求數(shù)據(jù)距離500點以上都具有相關(guān)性,但隨著待預(yù)測數(shù)據(jù)和已知數(shù)據(jù)距離的加大,相關(guān)性越來越小。如何利用數(shù)據(jù)的相關(guān)性是長期數(shù)據(jù)預(yù)測的關(guān)鍵。
根據(jù)正交性原理,預(yù)測濾波器傳遞函數(shù)H(w)的表達式:
Kalman估值濾波的核心思想是將Wiener方法的批處理改為串行處理,建立遞推公式,利用上一時刻的估值計算該時刻的估值。其遞推公式為:
其中,F(xiàn)n、Hn為遞推系數(shù),Wn、Vn為噪聲項。
Kalman模型具有馬爾可夫性質(zhì),只適合一步估值,而本文要解決的是長期預(yù)測問題。用Kalman進行長期估值濾波,第1個估計值使用訓(xùn)練集中5000個數(shù)據(jù)進行估計,第n個估計值使用訓(xùn)練集中5000個數(shù)據(jù)以及前面n-1個估計值進行估計。
Kalman模型問題:使用估計值來估計下一個估計值,因為估計值是之前訓(xùn)練集的線性組合,沒有任何新的信息,結(jié)果固然會趨于訓(xùn)練集的均值。即使將Kalman的階數(shù)增加,結(jié)果也不會有本質(zhì)的改善。
N階AR模型的描述為:
確定AR模型的階數(shù)之后通過訓(xùn)練集不斷調(diào)整系數(shù)a,使預(yù)測結(jié)果最佳。
使用上面的公式進行一步預(yù)測,其K步預(yù)測的公式為:AR模型同樣遇到Kalman模型的問題,所有的預(yù)測值均只根據(jù)相同的訓(xùn)練集進行預(yù)測,這樣導(dǎo)致與Kalman同樣的結(jié)果。
為了解決Kalman以及傳統(tǒng)AR模型不能進行長期預(yù)測的問題,本文對AR模型進行了改進。
Kalman以及傳統(tǒng)AR模型問題的關(guān)鍵是每一個估計值都是從相同的訓(xùn)練集得出,也就是說沒有新的信息。因此,本文算法的核心思想是:使用不同的訓(xùn)練集進行長期預(yù)測,即每個估計值使用不同的訓(xùn)練集。具體如下:
{X}為訓(xùn)練集,{Y}為估計集,箭頭代表使用前者估計后者。{NX}為{X}的等間隔抽樣,使用AR模型對一個Y值進行預(yù)測,命名為抽樣AR模型。
該模型解決了Kalman以及傳統(tǒng)AR模型的缺陷,適合長期數(shù)據(jù)預(yù)測。
首先確定屬于抽樣AR模型進行估值,并選定AR模型的階數(shù);然后對每一組訓(xùn)練集進行AR模型參數(shù)的調(diào)整,使用每一組訓(xùn)練集進行一步估值;最后根據(jù)估值結(jié)果判斷前面選定的階數(shù)是否最優(yōu),若不是重新選定AR模型的階數(shù),重復(fù)前面步驟直到選取最優(yōu)階數(shù)進行估值計算。
表1是使用不同階數(shù)的抽樣AR模型的性能比較。
表1 不同階數(shù)的抽樣AR模型的性能比較
校驗集數(shù)據(jù)均值為5.7224,訓(xùn)練集數(shù)據(jù)均值為7.9160。
可以看出,該模型的階數(shù)不是越高越好,根據(jù)測量數(shù)據(jù),最終選取5階。圖2是使用5階抽樣AR模型的預(yù)測結(jié)果。
圖2 使用5階抽樣AR模型的估計圖樣
預(yù)測結(jié)果的趨勢基本與實測數(shù)據(jù)相符,開始200點估計值比較理想,但后面300點不太理想,特別是接近零值的那一段預(yù)測不出來。解決方法是增加訓(xùn)練集NX的點數(shù)。
抽樣AR模型解決了Kalman以及傳統(tǒng)AR模型不能進行長期預(yù)測的問題,具有很高的實用價值。
[1]徐科軍,等編著.信號分析與處理[M].清華大學(xué)出版社,2012.
[2]程佩青,編著.數(shù)字信號處理教程[M].清華大學(xué)出版社,2015.
[3]John G.Proakis,Dimitris K Manolakis.Digital Signal Processing(4th Edition)[M].Prentice Hall,2006.
[4]Vinay K.Ingle,John G.Proakis.Digital Signal Processing Using MATLAB[M].Cengage Learning,2011.
[5]Levent M.Arslan.Modified Wiener filtering[J].Signal Processing, 2006,86(2):267-272.
[6]XiaofeiShuai,Lingjiang Kong,Jianyu Yang.AR-model-based adaptive detection of range-spread targets in compound Gaussian clutter[J].Signal Processing,2011,91(4):750-758.
林修杰(1981—),男,碩士,廣州民航職業(yè)技術(shù)學(xué)院講師,研究方向:電子信息技術(shù)。