曹 柯,危啟才,田 魁
(武漢工業(yè)學(xué)院數(shù)學(xué)與計(jì)算機(jī)學(xué)院,湖北武漢430023)
股指期貨價(jià)格的影響因素眾多,波動(dòng)情況復(fù)雜,常常難以準(zhǔn)確預(yù)測(cè)其走勢(shì)?,F(xiàn)有的股指期貨價(jià)格預(yù)測(cè)方法主要有BP(Back Propagation)神經(jīng)網(wǎng)絡(luò)法[1]、SVM(支持向量機(jī))法[2]和小波分析法[3]等。以上方法雖然都取得了一定的預(yù)測(cè)效果,然而實(shí)際應(yīng)用表明,這些方法都存在著自身的不足之處:例如,BP神經(jīng)網(wǎng)絡(luò)在訓(xùn)練時(shí)容易陷入局部極小點(diǎn);支持向量機(jī)的核函數(shù)要求必須滿足Mercer條件;小波變換不適合用于處理和分析非線性問題。
鑒于此,本文嘗試將股指期貨價(jià)格序列通過EMD(經(jīng)驗(yàn)?zāi)B(tài)分解)技術(shù)進(jìn)行分解,得到若干不同頻率的IMF(本征模函數(shù))分量。根據(jù)頻率高低將所有分量分成三組,將每組內(nèi)的分量進(jìn)行疊加得到一個(gè)新序列,從而可得到三個(gè)新序列,分別代表短期波動(dòng)項(xiàng)、中期波動(dòng)項(xiàng)和長(zhǎng)期趨勢(shì)項(xiàng)。通過分析這三個(gè)新序列的特點(diǎn),構(gòu)造不同的RVM(相關(guān)向量機(jī))模型對(duì)每個(gè)新序列分別進(jìn)行預(yù)測(cè),再將三個(gè)新序列的預(yù)測(cè)結(jié)果通過RVM組合預(yù)測(cè)模型進(jìn)行組合預(yù)測(cè),從而得到最終預(yù)測(cè)值。實(shí)驗(yàn)結(jié)果表明,該方法可以有效提高預(yù)測(cè)精度。
1998年,Norden和Hunag等人對(duì)瞬時(shí)頻率進(jìn)行了深入研究,創(chuàng)立了 HHT變換(Hilbert-Huang Transform)[4],并提出了驗(yàn)?zāi)B(tài)分解 EMD 方法,通過這種方法,任何信號(hào)都可以自適應(yīng)地分解成有限的本征模函數(shù)IMF。EMD方法在處理非平穩(wěn)和非線性數(shù)據(jù)上具有非常明顯的優(yōu)勢(shì),它可以將非平穩(wěn)和非線性信號(hào)序列進(jìn)行平穩(wěn)化處理,其結(jié)果是將原始信號(hào)序列中不同尺度的局部波動(dòng)逐級(jí)分解開來(lái),產(chǎn)生若干具有不同尺度特征的數(shù)據(jù)序列,每一個(gè)序列即代表了一個(gè)本征模函數(shù)IMF。由于分解后得到的各本征模函數(shù)能有效地突出原始信號(hào)序列的局部特征,因此對(duì)分解后各IMF分量進(jìn)行分析就可以更準(zhǔn)確地把握原始信號(hào)序列的重要特征信息。
本文選取滬深300股指期貨從2011年3月3日至2012年12月31日共450個(gè)數(shù)據(jù)點(diǎn)的每日收盤價(jià)格序列作為樣本數(shù)據(jù),如圖1所示。
圖1 原始股指期貨價(jià)格序列
設(shè)上述原始價(jià)格序列為x(t),采用如下算法[4]對(duì)x(t)進(jìn)行分解:
①找出x(t)的所有極大值點(diǎn)和極小值點(diǎn),分別用三次樣條插值函數(shù)擬合,形成x(t)的上包絡(luò)線和下包絡(luò)線,并記上包絡(luò)線和下包絡(luò)線的均值為m(t)。將x(t)減去m(t),得到一個(gè)新序列h(t),
②判斷h(t)是否滿足IMF的定義,若滿足,則h(t)為分解得到的一個(gè)IMF分量,然后轉(zhuǎn)到步驟③;否則,直接轉(zhuǎn)到步驟③。
③將x(t)-h(huán)(t)的結(jié)果作為新的x(t)。
重復(fù)上述過程,直到分解出所有的IMF分量。由以上算法分解得到的IMF分量和余項(xiàng)如圖2所示。由圖2可以看出,EMD自適應(yīng)地解析出6個(gè)IMF分量和一個(gè)余項(xiàng)。
圖2 E MD分解分量
為了減少建模工作量和建模復(fù)雜程度,本文借鑒了Zhang et Lai的方法[5],根據(jù)頻率高低將各IMF分量分組疊加形成三個(gè)新序列,分別代表短期波動(dòng)項(xiàng)、中期波動(dòng)項(xiàng)和長(zhǎng)期趨勢(shì)項(xiàng),結(jié)果如圖3所示。
圖3 E MD分解后各組合分量
由圖3可以看出,長(zhǎng)期趨勢(shì)項(xiàng)的波動(dòng)情況,反映了原始期貨價(jià)格的長(zhǎng)期走勢(shì),是原始期貨價(jià)格的主要組成部分。中期波動(dòng)項(xiàng),反映了原始期貨價(jià)格的短暫波動(dòng)情況,一般是由重大事件引起的,持續(xù)時(shí)間較長(zhǎng)。短期波動(dòng)項(xiàng),反映了原始期貨價(jià)格的即時(shí)變化情況,持續(xù)時(shí)間較短,它在短期期貨價(jià)格預(yù)測(cè)中起著相當(dāng)重要的作用。由此可見,重新組合后得到的三個(gè)新序列,更能突出原始股指期貨價(jià)格序列的局部特征信息,這對(duì)準(zhǔn)確把握股指期貨價(jià)格的走勢(shì)更加有利。
RVM是Michael E.Tipping博士在SVM的基礎(chǔ)上提出來(lái)的實(shí)用算法模型。由于RVM具有基于概率學(xué)習(xí)的結(jié)構(gòu)和高稀疏性等優(yōu)點(diǎn),所以在數(shù)據(jù)預(yù)測(cè)方面能獲得較高的預(yù)測(cè)精度。與SVM相比,RVM最大的優(yōu)點(diǎn)就是克服了核函數(shù)計(jì)算量大的問題,而且所選核函數(shù)不必滿足Mercer條件,因此應(yīng)用更為簡(jiǎn)便。
RVM線性預(yù)測(cè)模型為:
式中:w=(w1,w2,….wN)T表示模型權(quán)重,K(x,xi)(i=1,2,…,N)表示核函數(shù)。
由于實(shí)際數(shù)據(jù)中包含噪聲,則實(shí)際預(yù)測(cè)模型為:
式中:en服從均值為0,方差為σ2的高斯分布。
依據(jù)tn獨(dú)立的假設(shè),對(duì)于整個(gè)訓(xùn)練樣本集,可得似然函數(shù)為:
式中:t=(t1,t2,…,tN)T,Φ =[φ(x1),φ(x2),…,φ(xN)]T是一個(gè)N×(N+1)的核矩陣。
在實(shí)際預(yù)測(cè)中,如果給定輸入x,則相應(yīng)輸出為t。
本文根據(jù)短期波動(dòng)項(xiàng)、中期波動(dòng)項(xiàng)和長(zhǎng)期趨勢(shì)項(xiàng)各自的變化規(guī)律,分別選用不同的RVM核函數(shù)建立三個(gè)分項(xiàng)RVM預(yù)測(cè)模型和一個(gè)組合RVM預(yù)測(cè)模型。各RVM模型的核函數(shù)選擇情況如表1所示,各模型核參數(shù)在樣本訓(xùn)練時(shí)通過智能算法進(jìn)行尋優(yōu)得到最優(yōu)值。
表1 RVM模型核函數(shù)選擇
各個(gè)模型的預(yù)測(cè)精度采用平均絕對(duì)百分誤差(MAPE)來(lái)度量。各模型預(yù)測(cè)誤差如表2所示。
表2 分項(xiàng)和組合預(yù)測(cè)誤差
從表2可以看出,RVM模型在低頻中期波動(dòng)項(xiàng)和長(zhǎng)期趨勢(shì)項(xiàng)上的預(yù)測(cè)精度較高,在高頻短期波動(dòng)項(xiàng)上的預(yù)測(cè)效果較差。主要原因是,眾多復(fù)雜的價(jià)格影響因素增加了對(duì)高頻短期波動(dòng)項(xiàng)的預(yù)測(cè)難度。把分解后的IMF分量重新組合為三個(gè)新序列再分別進(jìn)行預(yù)測(cè),可以有效避免誤差的累積,提高最終的組合預(yù)測(cè)精度[6]。
通過對(duì)原始股指期貨價(jià)格序列進(jìn)行EMD分解和重新組合,以及對(duì)各RVM預(yù)測(cè)模型的建立,得到了本文提出的基于EMD和RVM的股指期貨價(jià)格預(yù)測(cè)模型,如圖4所示。
圖4 基于EMD和RVM股指期貨價(jià)格預(yù)測(cè)模型
選擇滬深300股票指數(shù)期貨從2011年3月3日至2012年12月31日的每日收盤價(jià)格序列,共計(jì)450個(gè)數(shù)據(jù)點(diǎn),作為實(shí)驗(yàn)研究數(shù)據(jù)。實(shí)驗(yàn)對(duì)最后40個(gè)交易日(2012年11月6日至2012年12月31日)的股指期貨實(shí)際每日收盤價(jià)格進(jìn)行預(yù)測(cè)。
實(shí)驗(yàn)采用了BP神經(jīng)網(wǎng)絡(luò)方法、SVM方法、RVM方法以及本文所提出的EMD-RVM方法對(duì)原始股指期貨價(jià)格序列分別建立預(yù)測(cè)模型,預(yù)測(cè)結(jié)果如圖5所示,為了對(duì)比預(yù)測(cè)效果,圖中僅畫出了RVM模型和EMD-RVM模型的預(yù)測(cè)結(jié)果,各模型預(yù)測(cè)的MAPE如表3所示。由圖5和表3所示結(jié)果可以看出,本文所提出的基于EMD和RVM的股指期貨價(jià)格預(yù)測(cè)模型比其它各預(yù)測(cè)模型的預(yù)測(cè)精度要高。
圖5 各模型預(yù)測(cè)結(jié)果對(duì)比
表3 各預(yù)測(cè)模型的MAPE
本文提出了基于EMD與RVM的股指期貨價(jià)格預(yù)測(cè)模型。首先由于采用了EMD技術(shù)將非平穩(wěn)的原始股指期貨價(jià)格序列進(jìn)行了平穩(wěn)化處理,因此原始價(jià)格序列的波動(dòng)性大幅降低,非平穩(wěn)性被大大減弱,分解后得到的各分量更能反映出原始價(jià)格序列內(nèi)在的波動(dòng)規(guī)律,其次由于采用了稀疏性更好和泛化能力更強(qiáng)的RVM作為分項(xiàng)預(yù)測(cè)和組合預(yù)測(cè)的模型,所以本文所提出的模型能取得較好的預(yù)測(cè)效果。由于電力負(fù)荷、黃金價(jià)格和石油價(jià)格等也屬于非平穩(wěn)序列,因此在短期電力負(fù)荷預(yù)測(cè)、黃金價(jià)格走勢(shì)預(yù)測(cè)和石油價(jià)格波動(dòng)情況預(yù)測(cè)等方面,本文所提出的基于EMD與RVM的股指期貨價(jià)格預(yù)測(cè)模型具有一定的參考價(jià)值。
[1]孫海濤,楊德平,李聰.基于BP神經(jīng)網(wǎng)絡(luò)的我國(guó)股指期貨價(jià)格預(yù)測(cè)[J].青島大學(xué)學(xué)報(bào),2012,25(3):93 -96.
[2]李海清.支持向量機(jī)在金融市場(chǎng)預(yù)測(cè)中的應(yīng)用[D].遼寧:遼寧師范大學(xué),2010.
[3]李晉.基于小波分析和GA-SVR模型的股指期貨價(jià)格預(yù)測(cè)方法研究[D].廣東:華南理工大學(xué),2011.
[4]Huang N E,Shen Z,Long S R.The empirical mode decomposition and the Hilbert spectrum for nonlinear and non-stationary time series analysis[J].The Royal Society,1998,(454):903-995.
[5]Xun Zhang,Lai K K,Wang Shouyang.A new approach for crude oil price analysis based on empirical mode decomposition[J].Energy Economics,2008(30):905 -918.
[6]楊云飛.基于EMD分解技術(shù)的不同市場(chǎng)原油價(jià)格相關(guān)性分析及預(yù)測(cè)研究[D].武漢:華中科技大學(xué),2011.