樊明智,劉道文
(許昌學(xué)院a.數(shù)學(xué)與統(tǒng)計學(xué)院;b.公共實驗中心,河南 許昌461000)
隨著我國經(jīng)濟的快速發(fā)展,股指預(yù)測成了一個當(dāng)前研究的熱點課題,業(yè)內(nèi)專家學(xué)者試圖通過分析股指的特性,把握其變化規(guī)律,從而做出較準(zhǔn)確的股票價格指數(shù)走勢分析。股票市場受多種因素的影響,在較短時期內(nèi),股指可能波動較大,表現(xiàn)出明顯的非線性和不確定性;但在較長時期內(nèi)有某些確定的基本因素起作用,股指的變化具有一定的趨勢性[1]。在分析股指混沌特性的基礎(chǔ)上,尋求一種較理想的股指預(yù)測方法具有現(xiàn)實意義。
混沌是指確定性系統(tǒng)中存在的一種貌似無規(guī)則、隨機的現(xiàn)象,其固有的確定性表明許多貌似隨機的現(xiàn)象是可以預(yù)測的,一般是將具有混沌特性的時間序列轉(zhuǎn)換到高維空間中,找出蘊涵在混沌吸引子中的演化規(guī)律。在實際預(yù)測過程中,當(dāng)嵌入維數(shù)較高時,時間序列的相空間軌跡可能很復(fù)雜,很難找出一種映射關(guān)系來預(yù)測未來時刻的數(shù)值。而神經(jīng)網(wǎng)絡(luò)是通過對簡單的非線性函數(shù)的多次復(fù)合來逼近復(fù)雜函數(shù),可以表達復(fù)雜的物理現(xiàn)象[2]。從股票市場中提取出來的股指時間序列隨時間波動比較劇烈,依據(jù)混沌理論計算出來的相空間重構(gòu)最佳嵌入維數(shù)較大。本文將依據(jù)混沌理論確定其時間延遲和最佳嵌入維數(shù)后,以最佳嵌入維數(shù)作為輸入結(jié)點數(shù)目建立神經(jīng)網(wǎng)絡(luò)模型來預(yù)測股指的未來值。
股票市場是一個復(fù)雜的非線性動力系統(tǒng),在實際數(shù)據(jù)分析時往往只是從股票價格隨時間變化的時間序列入手。而影響股票市場的因素眾多,僅僅依賴時間這一因素來預(yù)測股票市場的變化顯然存在較大的局限性,利用相空間重構(gòu)[3]的方法可以將時間序列從一維轉(zhuǎn)換到高維空間中,從而在高維空間中把握系統(tǒng)變化規(guī)律,在此基礎(chǔ)上進行股票價格指數(shù)的預(yù)測在理論上是可行的。Takens[4]證明了可以找到一個合適的嵌入維,即如果延遲坐標(biāo)的維數(shù)m≥2d+1,其中d是動力系統(tǒng)的維數(shù),在這個嵌入維空間里可以把有規(guī)律的軌跡(吸引子)恢復(fù)出來。也即在重構(gòu)的Rm空間中的軌線上原動力系統(tǒng)保持微分同胚,從而為混沌時間序列的預(yù)測奠定了堅實的理論基礎(chǔ)。
設(shè)時間序列{xi,i=1…N}是從股票市場提取出來的股指時間序列,若序列具有混沌特性,則依據(jù)混沌理論計算出該時間序列的延遲時間τ和最佳嵌入維m,根據(jù)這兩個參數(shù)對股指時間序列進行相空間重構(gòu),將其從一維轉(zhuǎn)換到高維空間中。相空間重構(gòu)得到的空間向量為:
X1,X2,…Xj,…,XM為相空間中的相點,由這些相點構(gòu)造相空間[X1,X2,…,XM]T。因此,可用這些相點在m維相空間中描述系統(tǒng)的演化軌跡,即有:
狀態(tài)方程組(2)中的各個方程是關(guān)于向量的表達式,為直觀地展現(xiàn)歷史數(shù)據(jù)的演化規(guī)律,將(2)式表示為關(guān)于時間序列數(shù)據(jù)元素的方程式[5]:
狀態(tài)空間中相點Xj→Xj+1的演化反映了系統(tǒng)的演化規(guī)律,這樣可由歷史數(shù)據(jù)預(yù)測系統(tǒng)演化趨勢[6]。由于相點Xj+1中前(m-1)維是已知的歷史數(shù)據(jù),將其化為單輸出得:
這里F(x)是一個從Rm到R的映射,一般為非線性映射關(guān)系,預(yù)測問題的實質(zhì)就是如何獲得關(guān)于F(x)的一個最佳逼近[7]。
根據(jù)歷史數(shù)據(jù)對系統(tǒng)的未來值進行預(yù)測實際上是尋求一個歷史數(shù)據(jù)與未來值間的映射,這個映射關(guān)系的準(zhǔn)確性決定了預(yù)測結(jié)果的可靠性。神經(jīng)網(wǎng)絡(luò)在理論上能實現(xiàn)非線性函數(shù)的無限逼近,具有良好的預(yù)測能力,因此利用神經(jīng)網(wǎng)絡(luò)模型能準(zhǔn)確地進行非線性時間序列的預(yù)測。根據(jù)股指時間序列的特點,本文建立徑向基函數(shù)(RBF)神經(jīng)網(wǎng)絡(luò)預(yù)測模型。
RBF神經(jīng)網(wǎng)絡(luò)是局部逼近網(wǎng)絡(luò),收斂速度快且不易陷入局部最小點,可以在任意精度下逼近任意的非線性函數(shù)。本文建立三層網(wǎng)絡(luò)結(jié)構(gòu)的預(yù)測模型(如圖1),輸入層將變量傳輸?shù)诫[含層,隱含層的基函數(shù)采用高斯函數(shù),對輸入變量產(chǎn)生局部的響應(yīng),隱含層到輸出層是一個線性加權(quán)的過程。徑向基函數(shù)為:
式中,Xk是第k個樣本向量,Ci是第i個隱含層神經(jīng)元的中心,δ為寬度值。因此RBF神經(jīng)網(wǎng)絡(luò)的輸出為:
式中,ωj是輸出層的連接權(quán)值且,Gj(Xk)是第k個樣本經(jīng)過第i個神經(jīng)元加工得到的輸出值。
圖1 RBF神經(jīng)網(wǎng)絡(luò)模型示意圖
在RBF神經(jīng)網(wǎng)絡(luò)的應(yīng)用中,神經(jīng)網(wǎng)絡(luò)模型每層神經(jīng)元數(shù)目的選取對預(yù)測結(jié)果的影響具有關(guān)鍵意義。對于混沌時間序列的預(yù)測,一般地將該序列相空間重構(gòu)的最佳嵌入維數(shù)作為輸入層結(jié)點數(shù)。研究表明,以此數(shù)目作為輸入層結(jié)點數(shù)建立的預(yù)測模型具有較好的預(yù)測效果[8]。對于隱含層神經(jīng)元數(shù)目的確定本文采取動態(tài)調(diào)整的方法,事先設(shè)定一個精度值,隱含層的神經(jīng)元數(shù)目由小到大增加,當(dāng)網(wǎng)絡(luò)預(yù)測精度達到設(shè)定值時的數(shù)目即為隱含層神經(jīng)元的個數(shù)。RBF神經(jīng)網(wǎng)絡(luò)的訓(xùn)練分為兩步驟:首先確定隱含層徑向基函數(shù)的中心點,本文采用K-均值聚類算法確定中心點Ci;其次通過最小二乘法修改連接權(quán)值。
在建立神經(jīng)網(wǎng)絡(luò)預(yù)測模型時,將股指時間序列的最佳嵌入維數(shù)作為輸入結(jié)點的數(shù)目,而最佳嵌入維數(shù)是依據(jù)混沌理論計算得來的。由于依據(jù)混沌理論計算延遲時間、嵌入維數(shù)等參數(shù)時對時間序列的元素數(shù)量要求較大,因此選取了上海證券交易所2002年12月11日~2011年3月10日2000個交易日的股指收盤價作為分析對象。為便于混沌特性的分析和計算,將由這2000個數(shù)據(jù)構(gòu)成時間序列進行歸一化處理。設(shè)樣本原始數(shù)據(jù)為{yi,i=1…N,N=2000},經(jīng)歸一化處理得到的時間序列為{xi,i=1,2…N,N=2000}。
其中,ymax=max{yi,i=1,2…2000};ymin=min{yi,i=1,2… 2000}。
相空間重構(gòu)是基于混沌理論的方法,需要證實所研究的對象是一個混沌動力系統(tǒng)或混沌時間序列,因此分析確定股票價格指數(shù)時間序列具有混沌特性,是基于混沌理論股票價格指數(shù)預(yù)測的前提。從股票市場這一非線性動力系統(tǒng)中提取出來的股票價格指數(shù)時間序列,其混沌特性可以用該序列的關(guān)聯(lián)維數(shù)及最大Lyapunov指數(shù)來判定。
關(guān)聯(lián)維是判定一個時間序列具有混沌特性的一個重要特征量,混沌時間序列的關(guān)聯(lián)維數(shù)為非整數(shù)并且會隨著嵌入維數(shù)的增大而趨于收斂。確定時間序列的關(guān)聯(lián)維數(shù)和嵌入維數(shù)最常用方法是G-P法[9],用此法計算關(guān)聯(lián)維時,需事先計算出時間序列的延遲時間。股指時間序列的數(shù)據(jù)量很大且具有明顯的非線性,本文采用C-C Method[10]法計算其延遲時間τ=24,該方法既能有效地減小互信息法的計算量,又能保持非線性特征。為了直觀地觀察和分析股指時間序列的混沌特性,在計算其關(guān)聯(lián)維數(shù)的同時分別繪制了ln(C(ε))-lnε曲線(如圖2)和D(m)-m曲線(如圖3)。從圖3中可以看出,該時間序列的關(guān)聯(lián)維數(shù)隨著嵌入維數(shù)的增加而趨于收斂,當(dāng)嵌入維數(shù)m等于12時關(guān)聯(lián)維數(shù)的值是1.0186,為非整數(shù)。
對于離散的非線性時間序列,判定其是否具有混沌特性的另一重要特征量是最大Lyapunov指數(shù)。若最大Lyapunov指數(shù)λ1<0,該序列呈現(xiàn)定?;蛑芷跔顟B(tài);λ1>0意味著該序列具有混沌特性。根據(jù)延遲時間τ=24和最佳嵌入維數(shù)mmin=12,采用小數(shù)據(jù)量方法計算出上證指數(shù)時間序列的最大Lyapunov指數(shù)λ1=0.0033。綜上所述,可以判定該時間序列具備混沌特性。
圖2 ln(C(ε))-lnε曲線
圖3 D(m)-m曲線
利用RBF神經(jīng)網(wǎng)絡(luò)預(yù)測股指時,選用序列{xi,i=1…N,N=2000}的前1600個數(shù)據(jù)作為訓(xùn)練樣本訓(xùn)練神經(jīng)網(wǎng)絡(luò),第1601~2000個數(shù)據(jù)進行RBF神經(jīng)網(wǎng)絡(luò)檢驗,對股指時間序列最后135個數(shù)據(jù)進行預(yù)測。預(yù)測的結(jié)果如圖4所示。
圖4 上證指數(shù)源數(shù)據(jù)與預(yù)測值
本文參考文獻[6]的評價方法,以預(yù)測結(jié)果的相對誤差評價預(yù)測的效果:
針對嵌入維數(shù)較高的混沌時間序列很難在相空間中找出一種映射關(guān)系來預(yù)測其變化趨勢。本文基于混沌理論計算了上證指數(shù)時間序列的混沌特性參數(shù),在相空間基礎(chǔ)上建立RBF神經(jīng)網(wǎng)絡(luò)預(yù)測模型并對上海證券交易所股指時間序列進行了預(yù)測。研究結(jié)果表明,基于混沌特性參數(shù)的神經(jīng)網(wǎng)絡(luò)能準(zhǔn)確地反映股指變化的趨勢,具有較理想的預(yù)測效果和應(yīng)用價值。但該方法仍還有一些值得改進的地方。一方面該方法對歷史數(shù)據(jù)要求嚴格且計算量大,如何改進算法減小計算量值得進一步研究;另一方面神經(jīng)網(wǎng)絡(luò)模型中心點和權(quán)值的選擇方法有待于進一步優(yōu)化改進。
[1]鮑新中,劉澄,孫彬.LM-BP算法在金融股指預(yù)測中的參數(shù)設(shè)定[J].系統(tǒng)管理學(xué)報,2009,(6).
[2]雷紹蘭.基于電力負荷時間序列混沌特性的短期負荷預(yù)測方法研究[D].重慶:重慶大學(xué),2005.
[3]呂金虎,張鎖春.加權(quán)一階局域法電力系統(tǒng)短期負荷預(yù)測中的應(yīng)用[J].控制理論與應(yīng)用,2002,(5).
[4]F.Takens.Determing Strange Attractorsin Turbulence[C].Lecture Notes in Math,898,1981.
[5]樂曉波,匡迎春,唐賢瑛.短期電力負荷的混沌預(yù)測及其神經(jīng)網(wǎng)絡(luò)的實現(xiàn)[J].長沙理工大學(xué)學(xué)報(自然科學(xué)版),2005,(2).
[6]張玉梅,曲仕茹,溫凱歌.基于混沌和RBF神經(jīng)網(wǎng)絡(luò)的短時交通流量預(yù)測[J].系統(tǒng)工程,2007,(11).
[7]侯建軍,東防,蔡烽.混沌理論和神經(jīng)網(wǎng)絡(luò)相結(jié)合的艦船搖蕩運動極短期預(yù)報[J].艦船科學(xué)技術(shù),2008,(1).
[8]呂金虎,陸安君,陳士華.混沌時間序列分析及其應(yīng)用[M].武漢:武漢大學(xué)出版社,2005.
[9]P.Grassberger,I.Procaccia.Measuring the Strangeness of Strange At?tractors[J].Physica D,1983,(9).
[10]H.S.Kim,R.Eykholt,J.D.Salas.Nonlinear Dynamics,Delay Times,and Embedding Windows[J].Physica D,1999,(127).