馬雪瑩,蔡如華,寧巧嬌,吳孫勇
(桂林電子科技大學(xué) 數(shù)學(xué)與計(jì)算科學(xué)學(xué)院,廣西 桂林 541004)
時(shí)間序列預(yù)測(cè)在很多領(lǐng)域有著極其廣泛的應(yīng)用。對(duì)于如何進(jìn)行時(shí)間序列的建模和預(yù)測(cè),尤其是線(xiàn)性模型,這方面的研究由來(lái)已久,常見(jiàn)的方法有AR模型、最小二乘估計(jì)等。但現(xiàn)實(shí)中,有很多時(shí)間序列的數(shù)據(jù)是大量的,并且具有非線(xiàn)性的特點(diǎn),上述方法便不再適用。于是,統(tǒng)計(jì)學(xué)家們提出了人工神經(jīng)網(wǎng)絡(luò)、支持向量機(jī)方法等,但是神經(jīng)網(wǎng)絡(luò)只適用于短期預(yù)測(cè),支持向量機(jī)方法計(jì)算時(shí)間較長(zhǎng),計(jì)算過(guò)程復(fù)雜[1,2]。粒子濾波方法是近年提出的一種適用于視覺(jué)目標(biāo)跟蹤的有效算法,該方法簡(jiǎn)單易行,適用于任何非線(xiàn)性非高斯環(huán)境[3]。在非線(xiàn)性時(shí)間序列建模過(guò)程中可以利用粒子濾波算法,分析解決復(fù)雜的積分問(wèn)題,避免了非線(xiàn)性時(shí)間序列分析過(guò)程中需要儲(chǔ)存大量歷史數(shù)據(jù)的問(wèn)題,該算法在降低算法復(fù)雜度、提高擬合性能上具有一定的優(yōu)勢(shì)。
利用粒子濾波(PF)方法估計(jì)非線(xiàn)性自回歸(NAR)模型的狀態(tài),在一定程度上提高了估計(jì)的精度,但是粒子濾波方法在計(jì)算過(guò)程中,容易出現(xiàn)粒子退化現(xiàn)象,增加了由參數(shù)估計(jì)帶來(lái)的估計(jì)誤差[4,5]。輔助粒子濾波(APF)可以自然地從當(dāng)前量測(cè)中產(chǎn)生樣本,使之更可能的落在高似然區(qū)域內(nèi),降低了濾波對(duì)外部干擾的敏感度,而灰色預(yù)測(cè)在不增加計(jì)算量的情況下可以對(duì)目標(biāo)狀態(tài)進(jìn)行預(yù)測(cè),克服粒子退化現(xiàn)象。
本文在NAR模型建模的基礎(chǔ)上,利用輔助粒子濾波和灰色預(yù)測(cè)相結(jié)合的方法估計(jì)NAR模型的參數(shù)和狀態(tài),并應(yīng)用于股票數(shù)據(jù)的預(yù)測(cè)和分析。仿真實(shí)驗(yàn)及應(yīng)用實(shí)例表明,該方法比傳統(tǒng)NAR及粒子濾波方法的效果更好。
NAR模型是一個(gè)時(shí)間序列預(yù)測(cè)模型,主要利用時(shí)間序列數(shù)據(jù)估計(jì)未來(lái)的預(yù)測(cè)值,一般使用最小二乘法確定模型的參數(shù)和結(jié)構(gòu)[6-8]。NAR模型可以表示為:
其中x(t)為時(shí)間序列數(shù)據(jù),np為多項(xiàng)式展開(kāi)的項(xiàng)數(shù),Pl為l階回歸項(xiàng)向量,且P1=1,θl為l階回歸參數(shù),ε(t)為白噪聲。
式(1)可用矩陣形式表示為:
其中P是一個(gè)n×m的回歸項(xiàng)量矩陣,θ是一個(gè)m×1的系數(shù)向量,ε為白噪聲殘差。利用QR分解方法分解式(2)中的矩陣P,即:
其中Q為正交矩陣,R為上三角矩陣。定義g:
則:
若P中每一列的誤差為ei,基于已定義的g,每一列i的誤差值可表示為:
通過(guò)觀(guān)察發(fā)現(xiàn)的值越大,模型殘差越小,因此可根據(jù)式(6)選擇出對(duì)模型有意義的回歸項(xiàng)PM=QMRM,其參數(shù)值θM可以通過(guò)對(duì)式(3)和式(4)利用QR分解方法分解,由式(5)計(jì)算得到,記為
通過(guò)上述方法可得到NAR最佳模型:
輔助粒子濾波是標(biāo)準(zhǔn)粒子濾波的一種擴(kuò)展[9,10]。其中粒子濾波是基于序貫重要性采樣(SIS)思想,利用蒙特卡羅(MC)和執(zhí)行貝葉斯遞歸估計(jì)的一種濾波方法。SIS濾波的基本思想是從概率密度函數(shù)p(x)中采集樣本,利用帶有權(quán)值的樣本表示后驗(yàn)概率密度,從而得到目標(biāo)的狀態(tài)估計(jì)。其基本算法為:
令k時(shí)的聯(lián)合后驗(yàn)密度近似為:
通過(guò)增加的樣本和新?tīng)顟B(tài)獲得新樣本,并得到權(quán)重的更新方程:
則后驗(yàn)概率密度可近似為:
但是重要權(quán)重的方差會(huì)隨時(shí)間增長(zhǎng),在若干次遞歸后,每個(gè)粒子幾乎都會(huì)帶有很小的權(quán)重,產(chǎn)生權(quán)重退化現(xiàn)象。為了改善這種現(xiàn)象,需要引入重采樣方法。
引入重采樣算法的SIS濾波構(gòu)成了基本的粒子濾波算法。但是由于重要性密度是獨(dú)立于量測(cè)zk的,所以這類(lèi)濾波對(duì)外部的干擾是低效且敏感的,并且隨著重采樣的進(jìn)行,粒子的多樣性會(huì)喪失,為了解決這一問(wèn)題,提出了輔助粒子濾波。
輔助粒子濾波的主要思想是在粒子轉(zhuǎn)移到k時(shí)刻之前在k-1時(shí)刻實(shí)現(xiàn)重采樣,主要源自SIS中引入一個(gè)重要性密度并且這個(gè)重要密度可以導(dǎo)出樣本集,其中ij表示粒子在k-1時(shí)刻的標(biāo)記。但是APF的采樣獲取主要來(lái)自于聯(lián)合密度,這樣就可以忽略(xk,i)中的標(biāo)記i,從聯(lián)合密度中產(chǎn)生采樣用來(lái)刻畫(huà)新采樣的重要性密度函數(shù)定義為:
其中μ是在xk-1已知時(shí)的xk的信息。均值可以看成的一個(gè)樣本值,所以式(12)可改寫(xiě)為:
則可得到其狀態(tài)估計(jì)值:
灰色預(yù)測(cè)方法先由歷史數(shù)據(jù)構(gòu)建一個(gè)序列,通過(guò)累加運(yùn)算(AGO)生成一個(gè)累加序列,構(gòu)建灰色微分方程并利用該累加值估計(jì)方程參數(shù),從而預(yù)測(cè)下一時(shí)刻累加值,最后通過(guò)逆累加(IAGO)作用于累加預(yù)測(cè)值,得到目標(biāo)狀態(tài)的預(yù)測(cè)值[11,12]。
利用灰色GM(1,1)進(jìn)行建模:
(1)構(gòu)建一個(gè)包含最近量測(cè)信息的序列X(0)=式中x(0)(n)為量測(cè)數(shù)據(jù),n為序列長(zhǎng)度。
(2)通過(guò)對(duì)X(0)進(jìn)行累加運(yùn)算(AGO)建立一個(gè)新序列其中
(3)構(gòu)建灰色微分方程:
其中a,b是微分方程的系數(shù)。
其中z(1)(k)為均值生成序列且
由最小二乘法得到系數(shù)a,b的值。
把系數(shù)a,b帶入,即可得到1-AGO灰色預(yù)測(cè)模型:
因?yàn)?-AGO灰色預(yù)測(cè)模型為一次累加數(shù)據(jù)得到的,所以需要將通過(guò)逆累加(IAGO)還原成狀態(tài)預(yù)測(cè)值,即有:
輔助粒子濾波進(jìn)行了兩次加權(quán)操作,考慮了當(dāng)前量測(cè)對(duì)狀態(tài)估計(jì)的影響,生成的粒子權(quán)值變化更穩(wěn)定,使模型更加接近未知的狀態(tài),估計(jì)的結(jié)果也更加準(zhǔn)確。而灰色預(yù)測(cè)模型主要是在利用粒子濾波對(duì)當(dāng)前的目標(biāo)狀態(tài)進(jìn)行估計(jì)的基礎(chǔ)上,再把目標(biāo)歷史序列和當(dāng)前目標(biāo)狀態(tài)作為輸入信息,利用灰色預(yù)測(cè)理論對(duì)下一時(shí)刻的目標(biāo)狀態(tài)進(jìn)行預(yù)測(cè),在不增加計(jì)算量的情況下,進(jìn)一步改進(jìn)粒子退化現(xiàn)象,提高預(yù)測(cè)效果。于是把輔助粒子濾波和灰色預(yù)測(cè)方法結(jié)合在一起對(duì)時(shí)間序列的NAR模型狀態(tài)進(jìn)行估計(jì),得到以下?tīng)顟B(tài)估計(jì)的基本步驟:
(4)判斷k大小:若k+1≥f(f為灰色系統(tǒng)輸入的粒子數(shù)),則進(jìn)行灰色預(yù)測(cè)算法,反之進(jìn)行輔助粒子濾波算法。
為了更準(zhǔn)確地評(píng)價(jià)NAR、PF-NAR、APFGM-NAR狀態(tài)估計(jì)方法的好壞,將采用平均絕對(duì)誤差(MAE)、平均絕對(duì)百分比誤差(MAPE)、均方根誤差(RMSE)三個(gè)評(píng)價(jià)指標(biāo):
為了驗(yàn)證基于輔助粒子濾波及灰色預(yù)測(cè)對(duì)NAR模型狀態(tài)估計(jì)的可行性及優(yōu)越性,需要建立一個(gè)NAR模型,即:
其中xt為狀態(tài)向量,ai為模型系數(shù),由最小二乘法可得ai值分別為-0.5536,0.7064,0.9966,1.4549,εt為高斯白噪聲,zt為量測(cè)向量,βt為量測(cè)噪聲。
由式(20)可以得到模型的狀態(tài)與量測(cè)圖形,如圖1所示。
圖1 狀態(tài)與量測(cè)圖
通過(guò)式(20)中的狀態(tài)方程與量測(cè)方程進(jìn)行粒子的傳播與更新,得到NAR模型的狀態(tài)估計(jì)值,并與傳統(tǒng)的NAR和PF-NAR方法的估計(jì)結(jié)果作比較,如圖2所示。
圖2 APFGM-NAR、PF-NAR和NAR狀態(tài)估計(jì)圖
在得到NAR估計(jì)值,PF-NAR估計(jì)值與APFGM-NAR估計(jì)值后,通過(guò)殘差計(jì)算公式得到殘差估計(jì)值并進(jìn)行對(duì)比,如圖3所示。
圖3 APFGM-NAR、PF-NAR和NAR殘差估計(jì)圖
通過(guò)對(duì)圖2的觀(guān)察可知,由APFGM-NAR方法得到的狀態(tài)估計(jì)值比傳統(tǒng)的NAR和PF方法更加接近真實(shí)的狀態(tài),因此可以說(shuō)明由APFGM方法估計(jì)NAR模型的參數(shù)和狀態(tài)是可行的。對(duì)圖3分析可知,APFGM-NAR方法所得到的估計(jì)殘差值在零均值附近波動(dòng)且與其他兩種方法相比波動(dòng)較小。為了更好地對(duì)比三種方法的估計(jì)精度,利用MAE、MAPE和RMSE三種評(píng)價(jià)指標(biāo)對(duì)估計(jì)結(jié)果進(jìn)行評(píng)估,結(jié)果如表1所示。從表中可以看出APFGM-NAR方法的估計(jì)精度最高。
表1 APFGM-NAR、PF-NAR和NAR性能評(píng)價(jià)指標(biāo)
本文選取深深寶A股票,提取2014年12月23日至2015年6月12日的115個(gè)交易日的收盤(pán)價(jià),數(shù)據(jù)來(lái)源通達(dá)信金融終端軟件。深深寶A股票的時(shí)間序列如圖4中ture-state所示,通過(guò)對(duì)圖中股票收盤(pán)價(jià)的走勢(shì)分析,可以發(fā)現(xiàn)其具有很強(qiáng)的非線(xiàn)性,由此,可以把115個(gè)交易日的收盤(pán)價(jià)當(dāng)做仿真數(shù)據(jù),通過(guò)上文建立合適的NAR模型,并對(duì)模型進(jìn)行狀態(tài)估計(jì),如圖4中NAR-state所示。觀(guān)察圖4可知,NAR狀態(tài)估計(jì)與真實(shí)狀態(tài)之間的誤差較大,因此利用輔助粒子濾波與灰色預(yù)測(cè)相結(jié)合的方法估計(jì)NAR模型的參數(shù)和狀態(tài),并與基于粒子濾波方法的估計(jì)結(jié)果作比較。
圖4 深深寶A股時(shí)序和NAR狀態(tài)估計(jì)圖
利用輔助粒子濾波與灰色預(yù)測(cè)相結(jié)合的方法估計(jì)NAR模型的參數(shù)及狀態(tài),與粒子濾波估計(jì)結(jié)果進(jìn)行對(duì)比,如圖5。并對(duì)兩種方法的估計(jì)結(jié)果進(jìn)行殘差計(jì)算,得到殘差對(duì)比圖,如圖6所示。
圖5 APFGM-NAR和PF-NAR方法的股票價(jià)格估計(jì)
圖6 APFGM-NAR和PF-NAR方法的殘差估計(jì)圖
由圖5可知基于輔助粒子濾波與灰色預(yù)測(cè)的方法對(duì)NAR模型狀態(tài)的估計(jì)比粒子濾波方法更加接近于真實(shí)的狀態(tài)。由圖6可知,基于輔助粒子濾波與灰色預(yù)測(cè)方法的估計(jì)殘差比粒子濾波估計(jì)殘差在0均值上下的波動(dòng)幅度小,更平穩(wěn)。為了更加直觀(guān)地比較這兩種方法對(duì)股價(jià)走勢(shì)預(yù)測(cè)的效果,根據(jù)性能評(píng)價(jià)指標(biāo),給出了兩種方法的MAE、MAPE、RMSE的對(duì)比值,如表2所示。
表2 APFGM-NAR和PF-NAR性能評(píng)價(jià)指標(biāo)
通過(guò)對(duì)以上圖表的觀(guān)察分析可知,基于輔助粒子濾波與灰色預(yù)測(cè)的方法比粒子濾波方法對(duì)NAR模型參數(shù)及狀態(tài)的估計(jì)更加精確,對(duì)股票價(jià)格走勢(shì)的預(yù)測(cè)更加準(zhǔn)確。
粒子濾波方法是一種非線(xiàn)性濾波方法,能很好地解決非線(xiàn)性問(wèn)題,但是在對(duì)非線(xiàn)性自回歸模型進(jìn)行狀態(tài)估計(jì)的過(guò)程中容易出現(xiàn)粒子退化現(xiàn)象,所以本文提出了一種基于輔助粒子濾波與灰色預(yù)測(cè)相結(jié)合的NAR模型狀態(tài)估計(jì)算法。通過(guò)加入輔助變量,進(jìn)行兩次加權(quán)操作,降低了對(duì)外界干擾的敏感度,灰色預(yù)測(cè)理論對(duì)重采樣后的粒子狀態(tài)進(jìn)行了修正,有效地克服了粒子退化現(xiàn)象。結(jié)果表明,基于輔助粒子濾波與灰色預(yù)測(cè)相結(jié)合的方法優(yōu)于傳統(tǒng)的NAR和粒子濾波估計(jì)方法,更適合于金融時(shí)間序列的預(yù)測(cè)和分析。