廣州民航職業(yè)技術(shù)學(xué)院 林修杰
一種信號(hào)長期預(yù)測(cè)新算法
廣州民航職業(yè)技術(shù)學(xué)院 林修杰
對(duì)于長期數(shù)據(jù)預(yù)測(cè),傳統(tǒng)的預(yù)測(cè)方法性能較差。采用Wiener模型進(jìn)行預(yù)測(cè),需要獲取輸入信號(hào)的功率譜密度,以及輸入和輸出信號(hào)的互譜密度,但這難以獲取,且計(jì)算量大。采用Kalman和AR模型進(jìn)行預(yù)測(cè),隨著預(yù)測(cè)距離增加,預(yù)測(cè)結(jié)果趨于訓(xùn)練集的均值。本文提出了一種基于AR模型的長期預(yù)測(cè)新算法,命名為抽樣AR模型,將訓(xùn)練集進(jìn)行分組,每個(gè)估計(jì)值使用不同的訓(xùn)練集進(jìn)行預(yù)測(cè)。抽樣AR模型提高了長期數(shù)據(jù)預(yù)測(cè)的準(zhǔn)確性。
長期預(yù)測(cè);Wiener模型;Kalman模型;AR模型;抽樣AR模型
對(duì)于長期數(shù)據(jù)預(yù)測(cè),傳統(tǒng)的預(yù)測(cè)方法性能較差。采用Wiener模型進(jìn)行預(yù)測(cè),需要獲取輸入信號(hào)的功率譜密度以及輸入和輸出信號(hào)的互譜密度,但這難以獲取,且計(jì)算時(shí)需要重復(fù)計(jì)算,計(jì)算量大。采用Kalman和AR模型進(jìn)行預(yù)測(cè),使用估計(jì)值來估計(jì)下一個(gè)估計(jì)值,因?yàn)楣烙?jì)值是之前訓(xùn)練集的線性組合,沒有任何新的信息,隨著預(yù)測(cè)距離增加,預(yù)測(cè)結(jié)果趨于訓(xùn)練集的均值。
長期數(shù)據(jù)預(yù)測(cè)的實(shí)際意義很大,準(zhǔn)確的預(yù)測(cè)對(duì)于自動(dòng)化和無人系統(tǒng)在各種復(fù)雜情況下做出及時(shí)合理的判斷和反應(yīng)非常重要。
本文中的研究數(shù)據(jù)取自實(shí)際環(huán)境,是某車載雷達(dá)測(cè)得的平臺(tái)運(yùn)動(dòng)速度。在汽車自動(dòng)駕駛系統(tǒng)中,平臺(tái)運(yùn)動(dòng)速度的準(zhǔn)確預(yù)測(cè)對(duì)于系統(tǒng)在各種復(fù)雜情況下做出及時(shí)合理的判斷和反應(yīng)非常重要。研究數(shù)據(jù)分為兩組,實(shí)際上是將實(shí)際連續(xù)觀測(cè)的一組數(shù)據(jù)分成了兩部分。第一組(訓(xùn)練集)是用于訓(xùn)練和建模,長度為5000,利用該組數(shù)據(jù)建立和調(diào)整預(yù)測(cè)模型。第二組數(shù)據(jù)(檢驗(yàn)集)是用于檢驗(yàn)?zāi)P托阅埽L度為500。訓(xùn)練集數(shù)據(jù)如圖1所示。
圖1 訓(xùn)練集數(shù)據(jù)
訓(xùn)練集數(shù)據(jù)有一定周期性,相鄰點(diǎn)之間的相關(guān)性很強(qiáng),這是估值預(yù)測(cè)的基礎(chǔ)。同時(shí),數(shù)據(jù)有很大的隨機(jī)性,在某些點(diǎn)出現(xiàn)接近零的幅值。較為光滑的曲線還有細(xì)微的抖動(dòng),這是測(cè)量噪聲的影響。
本文需要用5000點(diǎn)預(yù)測(cè)之后的500點(diǎn),最大的預(yù)測(cè)步數(shù)為500步,屬于長期數(shù)據(jù)預(yù)測(cè)。這要求數(shù)據(jù)距離500點(diǎn)以上都具有相關(guān)性,但隨著待預(yù)測(cè)數(shù)據(jù)和已知數(shù)據(jù)距離的加大,相關(guān)性越來越小。如何利用數(shù)據(jù)的相關(guān)性是長期數(shù)據(jù)預(yù)測(cè)的關(guān)鍵。
根據(jù)正交性原理,預(yù)測(cè)濾波器傳遞函數(shù)H(w)的表達(dá)式:
Kalman估值濾波的核心思想是將Wiener方法的批處理改為串行處理,建立遞推公式,利用上一時(shí)刻的估值計(jì)算該時(shí)刻的估值。其遞推公式為:
其中,F(xiàn)n、Hn為遞推系數(shù),Wn、Vn為噪聲項(xiàng)。
Kalman模型具有馬爾可夫性質(zhì),只適合一步估值,而本文要解決的是長期預(yù)測(cè)問題。用Kalman進(jìn)行長期估值濾波,第1個(gè)估計(jì)值使用訓(xùn)練集中5000個(gè)數(shù)據(jù)進(jìn)行估計(jì),第n個(gè)估計(jì)值使用訓(xùn)練集中5000個(gè)數(shù)據(jù)以及前面n-1個(gè)估計(jì)值進(jìn)行估計(jì)。
Kalman模型問題:使用估計(jì)值來估計(jì)下一個(gè)估計(jì)值,因?yàn)楣烙?jì)值是之前訓(xùn)練集的線性組合,沒有任何新的信息,結(jié)果固然會(huì)趨于訓(xùn)練集的均值。即使將Kalman的階數(shù)增加,結(jié)果也不會(huì)有本質(zhì)的改善。
N階AR模型的描述為:
確定AR模型的階數(shù)之后通過訓(xùn)練集不斷調(diào)整系數(shù)a,使預(yù)測(cè)結(jié)果最佳。
使用上面的公式進(jìn)行一步預(yù)測(cè),其K步預(yù)測(cè)的公式為:AR模型同樣遇到Kalman模型的問題,所有的預(yù)測(cè)值均只根據(jù)相同的訓(xùn)練集進(jìn)行預(yù)測(cè),這樣導(dǎo)致與Kalman同樣的結(jié)果。
為了解決Kalman以及傳統(tǒng)AR模型不能進(jìn)行長期預(yù)測(cè)的問題,本文對(duì)AR模型進(jìn)行了改進(jìn)。
Kalman以及傳統(tǒng)AR模型問題的關(guān)鍵是每一個(gè)估計(jì)值都是從相同的訓(xùn)練集得出,也就是說沒有新的信息。因此,本文算法的核心思想是:使用不同的訓(xùn)練集進(jìn)行長期預(yù)測(cè),即每個(gè)估計(jì)值使用不同的訓(xùn)練集。具體如下:
{X}為訓(xùn)練集,{Y}為估計(jì)集,箭頭代表使用前者估計(jì)后者。{NX}為{X}的等間隔抽樣,使用AR模型對(duì)一個(gè)Y值進(jìn)行預(yù)測(cè),命名為抽樣AR模型。
該模型解決了Kalman以及傳統(tǒng)AR模型的缺陷,適合長期數(shù)據(jù)預(yù)測(cè)。
首先確定屬于抽樣AR模型進(jìn)行估值,并選定AR模型的階數(shù);然后對(duì)每一組訓(xùn)練集進(jìn)行AR模型參數(shù)的調(diào)整,使用每一組訓(xùn)練集進(jìn)行一步估值;最后根據(jù)估值結(jié)果判斷前面選定的階數(shù)是否最優(yōu),若不是重新選定AR模型的階數(shù),重復(fù)前面步驟直到選取最優(yōu)階數(shù)進(jìn)行估值計(jì)算。
表1是使用不同階數(shù)的抽樣AR模型的性能比較。
表1 不同階數(shù)的抽樣AR模型的性能比較
校驗(yàn)集數(shù)據(jù)均值為5.7224,訓(xùn)練集數(shù)據(jù)均值為7.9160。
可以看出,該模型的階數(shù)不是越高越好,根據(jù)測(cè)量數(shù)據(jù),最終選取5階。圖2是使用5階抽樣AR模型的預(yù)測(cè)結(jié)果。
圖2 使用5階抽樣AR模型的估計(jì)圖樣
預(yù)測(cè)結(jié)果的趨勢(shì)基本與實(shí)測(cè)數(shù)據(jù)相符,開始200點(diǎn)估計(jì)值比較理想,但后面300點(diǎn)不太理想,特別是接近零值的那一段預(yù)測(cè)不出來。解決方法是增加訓(xùn)練集NX的點(diǎn)數(shù)。
抽樣AR模型解決了Kalman以及傳統(tǒng)AR模型不能進(jìn)行長期預(yù)測(cè)的問題,具有很高的實(shí)用價(jià)值。
[1]徐科軍,等編著.信號(hào)分析與處理[M].清華大學(xué)出版社,2012.
[2]程佩青,編著.數(shù)字信號(hào)處理教程[M].清華大學(xué)出版社,2015.
[3]John G.Proakis,Dimitris K Manolakis.Digital Signal Processing(4th Edition)[M].Prentice Hall,2006.
[4]Vinay K.Ingle,John G.Proakis.Digital Signal Processing Using MATLAB[M].Cengage Learning,2011.
[5]Levent M.Arslan.Modified Wiener filtering[J].Signal Processing, 2006,86(2):267-272.
[6]XiaofeiShuai,Lingjiang Kong,Jianyu Yang.AR-model-based adaptive detection of range-spread targets in compound Gaussian clutter[J].Signal Processing,2011,91(4):750-758.
林修杰(1981—),男,碩士,廣州民航職業(yè)技術(shù)學(xué)院講師,研究方向:電子信息技術(shù)。