吳朝陽
ARMA(autoregressive integrated moving average)模型作為使用最廣泛的時間序列模型,一直以來被許多學(xué)者用于股票價格序列的研究中[1-4].其本質(zhì)是利用平穩(wěn)時間序列的統(tǒng)計相關(guān)性來進(jìn)行未來價格的預(yù)測.灰色GM(1,1)模型是基于灰色理論的時間序列預(yù)測方法,近年來也被廣泛地用于股票價格的時間序列預(yù)測中[5].GM(1,1)模型的核心思想是用指數(shù)方程來捕捉隱藏在時間序列中的能量聚集,而這種聚集可以通過累加操作顯現(xiàn)出來,從而可以用指數(shù)方程來進(jìn)行擬合.可以看出這2種辦法對于股價的預(yù)測都有各自的側(cè)重.由于股價序列的復(fù)雜和多樣性,以上2個模型中的任意一個都不能完全地描述股價運(yùn)動,因此一個常規(guī)的想法就是結(jié)合這2種預(yù)測模型建立組合模型.其思想是用GM(1,1)模型來捕捉股價運(yùn)動的趨勢,而用ARMA模型通過挖掘殘差序列的相關(guān)性來進(jìn)行股價的預(yù)測.
實(shí)際上,這種基于灰色GM(1,1)模型和ARMA模型的組合模型已經(jīng)被廣泛地用于時間序列的預(yù)測中,并被稱呼為GM-ARMA模型(grey model-autoregressive integrated moving average model)[6].但是由于組合模型中GM(1,1)模型不是最優(yōu)的,并且沒有考慮最優(yōu)的結(jié)合點(diǎn),因此傳統(tǒng)的GM-ARMA模型不是最優(yōu)的.本文將針對這2點(diǎn)不足提出了RGM-ARMA模型并用于股指的預(yù)測.
對于給定的時間序列 X=(x1,x2,…,xn),首先用經(jīng)典的GM(1,1)模型求出其灰色預(yù)測序列和點(diǎn) n+1 的灰色預(yù)測值,然后針對灰色殘差序列建立ARMA模型,并用該模型求出灰色殘差序列Y在點(diǎn)n+1的預(yù)測值GM-ARMA模型可以被表示為
可以看出GM-ARMA模型存在2點(diǎn)不足:1)由于GM(1,1)模型不是最優(yōu)的,導(dǎo)致了GM-ARMA模型也可能不是最優(yōu)的;2)在用GM(1,1)模型進(jìn)行建模的過程中,并不考慮對ARMA模型的影響,反之亦然,因此也就不存在最優(yōu)結(jié)合點(diǎn),這也導(dǎo)致了GMARMA模型不是最優(yōu)的.針對以上情況,本文在先優(yōu)化GM(1,1)模型的基礎(chǔ)上,找到灰色模型和ARMA模型的最佳結(jié)合點(diǎn),最后找到最優(yōu)的GM-ARMA模型.
當(dāng)前,對GM(1,1)模型的優(yōu)化主要集中在2個方面.
一個方面是通過選擇合適的建模所用的數(shù)據(jù)維度來優(yōu)化GM(1,1)模型.在經(jīng)典的GM(1,1)預(yù)測中,灰色建模主要是基于少量的數(shù)據(jù),因此一般都是直接選擇所有的數(shù)據(jù)進(jìn)行建模.但是對于一些可以得到大量數(shù)據(jù)的時間序列來說,選擇合適的數(shù)據(jù)維度來建立GM(1,1)模型就變得很重要了.郝永紅等在用GM(1,1)模型預(yù)測人口的時候指出,不同的數(shù)據(jù)維度將導(dǎo)致預(yù)測誤差差別較大,他們分別用5~8維4種數(shù)據(jù)維度對人口進(jìn)行了灰色預(yù)測,發(fā)現(xiàn)用6維數(shù)據(jù)進(jìn)行預(yù)測時,預(yù)測誤差最低[7].李國平等[8]也對這種問題進(jìn)行了研究,他們指出:“在對股票價格進(jìn)行灰色預(yù)測時,數(shù)據(jù)量不同,預(yù)測結(jié)果將有所不同,有時甚至差別很大”.為此他們提出了用黃金分割法來尋找合適的建模所需的數(shù)據(jù)量.
另一類優(yōu)化集中在對白化背景值z(1)(k)的優(yōu)化上.在經(jīng)典的灰色模型的教科書[9-10]中,對于累加變量x(1)(k)的白化背景值z(1)(k)的定義是
很多學(xué)者認(rèn)為常數(shù)0.5將導(dǎo)致預(yù)測值不是最優(yōu)的.為了解決這個問題,他們引進(jìn)了1個參數(shù)來替代常數(shù)0.5.不同學(xué)者采用不同希臘字母代替常數(shù)0.5,這里統(tǒng)一用希臘字母μ來表示這個參數(shù),因此白化背景值z(1)(k)新的定義為
這種改進(jìn)的GM(1,1)模型通常稱為GM(1,1,μ)模型.因?yàn)榘l(fā)展系數(shù)a和控制變量b是被白化背景值z(1)(k)所控制的,而z(1)(k)又是被參數(shù)μ所控制的,因此,優(yōu)化GM(1,1)的過程就是優(yōu)化參數(shù)μ的過程.為了找到最優(yōu)的μ,許多學(xué)者提出了各種各樣的算法,其中有劉虹等的微粒群算法[11],謝開貴等的遺傳算法[12],陳舉化等的最優(yōu)擬合點(diǎn)群逼近原始點(diǎn)群的算法[13].
通過上面的研究可以看出數(shù)據(jù)維度和影響白化背景值z(1)(k)的參數(shù)μ確實(shí)對預(yù)測精度有影響.同時也看到上面的研究主要集中在分開對這2種影響因素進(jìn)行研究,而沒有同時考慮這2個因素對預(yù)測精度的影響.針對以上情況,本文嘗試提出改進(jìn)的灰色模型以便同時考慮這2個因素對預(yù)測精度的影響.為了方便和統(tǒng)一起見,這里稱呼影響白化背景值z(1)(k)的參數(shù)為灰色變量,并用希臘字母μ來表示,對數(shù)據(jù)維度用希臘字母v來表示,并將這種改進(jìn)的 GM(1,1)模型命名為 GM(1,1,μ,v)模型.
由于本文的研究重點(diǎn)是對股票價格的灰色預(yù)測,因此參數(shù)μ和v的優(yōu)化原則也將基于一定的金融背景.在金融股票市場中,人們通常用點(diǎn)數(shù)的得失來評價他們的投資策略在過去一段時間的表現(xiàn),這種度量在統(tǒng)計上,可以用總絕對值誤差σTAE(total absolute error)來度量.σTAE越小,說明投資誤差在過去的一段時間越小.因此這里認(rèn)為最優(yōu)的參數(shù)μ和v就是其σTAE最小的參數(shù).基于最小σTAE來選擇最優(yōu)參數(shù)組合(u,v)的準(zhǔn)則稱為TAE準(zhǔn)則.對于不同的應(yīng)用,建立GM(1,1,μ,v)模型可以用不同的準(zhǔn)則,但是原理上都是基本一樣的.
用TAE準(zhǔn)則建立 GM(1,1,μ,v)模型的思路概括來說就是首先對參數(shù)μ和v設(shè)立上下限:μ∈(l,L),v∈(r,R)并離散化以便構(gòu)造1個有界的離散參數(shù)空間.對于給定的時間序列X=(x1,x2,…,xn)和1 個離散參數(shù)組合(μ,v),μ∈(l,L),v∈(r,R)都可以構(gòu)造GM(1,1,μ,v)模型并得到序列X的灰色預(yù)測序列.因此也就可以得到式中:xj表示真實(shí)值表示灰色預(yù)測值.對每一個參數(shù)組合(μ,v),都可以用以上方法就算出σTAE.參數(shù)組合(μ,v)滿足:
就是最優(yōu)的參數(shù),相應(yīng)的GM(1,1,μ,v)模型就是基于TAE準(zhǔn)則的最優(yōu)的灰色模型.
建立了優(yōu)化的灰色模型 GM(1,1,μ,v)后,就可以通過找到灰色模型和ARMA模型的最佳結(jié)合點(diǎn)來整合這 2個模型了.整合 GM(1,1,μ,v)和ARMA(p,q)的過程就是找到最佳組合(μ,v,p,q)的過程,其基本的前提條件就是參數(shù)(μ,v)和(p,q)的選擇必須基于相同的統(tǒng)計準(zhǔn)則.
在 ARMA(p,q)中,經(jīng)典的選擇參數(shù)(p,q)的準(zhǔn)則是BIC(Bayesinformationcriterion)和AIC(Akaike’s information criteria)準(zhǔn)則;但是由于 BIC和AIC不能用于(μ,v)的選擇,那么惟一可能的就是看(p,q)是否可以用TAE準(zhǔn)則進(jìn)行選擇.為了驗(yàn)證TAE準(zhǔn)則是否可以用來建立ARMA(p,q),首先要針對ARMA(p,q)模型定義TAE準(zhǔn)則.參考BIC和AIC的定義,定義TAE準(zhǔn)則如下.
對AR(autoregressive model)模型和MA(moving average model)模型的級數(shù)設(shè)定上界P和Q,針對每個參數(shù)組合(p,q),0≤p≤P,0≤q≤Q 建立ARMA(p,q)模型,并基于相同的歷史數(shù)據(jù)計算σTAE,最佳的模型滿足:
相應(yīng)的參數(shù)(p,q)也就是最優(yōu)的參數(shù).為了比較BIC、AIC和TAE準(zhǔn)則在預(yù)測誤差上的不同,用相同的數(shù)據(jù)基于以上3個準(zhǔn)則計算了平均絕對值誤差σMAPE(mean absolute percent error).這里的數(shù)據(jù)來源于YAHOO金融板塊,數(shù)據(jù)為TXS加拿大綜合指數(shù)日線數(shù)據(jù),總數(shù)是2008年6月30日—2009年2月6日的一共152個數(shù)據(jù),其中2008年6月30日—2008年12月31日的半年的126個數(shù)據(jù)用于建模,2009年1月2日—2009年2月6日的26個數(shù)據(jù)用于模型的評測,因此σMAPE的計算為
結(jié)果見表1.
表1 不同準(zhǔn)則下的σMAPE的比較Table 1 Comparison between different criterions
從表1可以看出,基于3種不同標(biāo)準(zhǔn)的預(yù)測誤差并不大,實(shí)際上,基于TAE準(zhǔn)則的預(yù)測誤差甚至小于基于BIC準(zhǔn)則的預(yù)測誤差,這經(jīng)驗(yàn)地證明了TAE準(zhǔn)則可以用來對參數(shù)(p,q)進(jìn)行選擇.
由于 GM(1,1,μ,v)中 的 參 數(shù) (μ,v)和ARMA(p,q)中的參數(shù)(p,q)都可以用TAE準(zhǔn)則來選擇,這就為整合2個模型并找到最優(yōu)的組合(μ,v,p,q)提供了基礎(chǔ).具體來說,構(gòu)造RGM-ARMA模型的思想為:
首先對參數(shù)(μ,v,p,q)設(shè)定上下限,并對連續(xù)參數(shù)進(jìn)行相應(yīng)的離散化處理,以便形成離散參數(shù)空間:μ∈(l,L),v∈(r,R),p≤P,q≤Q.對于給定的歷史時間序列X=(x1,x2,…,xn)和給定的位于離散參數(shù)空間的參數(shù)組合(μ,v,p,q),通過式(1)可以建立相應(yīng)的GM-ARMA模型,并可以用該模型計算出擬合序列,因此也就可以計算出σTAE為
最優(yōu)的GM-ARMA模型滿足:
為了說明RGM-ARMA模型的建模過程,這里用與上例相同數(shù)據(jù)來建模,其中開始的126個數(shù)據(jù)用于模型的建模,后面的26個數(shù)據(jù)用于模型的檢驗(yàn).
首先需要對參數(shù)(μ,v,p,q)建立合適的上下界,其原則是盡量包含最優(yōu)的解,同時又讓計算量不要太大,經(jīng)過研究比較,這里對參數(shù)(μ,v,p,q)定義的上下界為
其次需要對惟一的連續(xù)參數(shù)μ進(jìn)行離散化處理,這里用的離散間距為0.1以減少計算量.這樣就總共有了880 個(μ,v,p,q)的參數(shù)組合,針對每個組合可以基于歷史數(shù)據(jù)計算出相應(yīng)的σTAE,最小σTAE所對應(yīng)參數(shù)組合(μ,v,p,q)和相應(yīng)的 GM-ARMA 模型就是最優(yōu)的模型.
對于本例的歷史數(shù)據(jù)X=(x1,x2,…,x126)和某一個參數(shù)組合(μ,v,p,q)=(0.6,7,1,0),其具體的σTAE計算過程如下:
由于(μ,v)=(0.6,7),因此用相應(yīng)的GM(1,1,0.6,7)模型來得到時間序列X的灰色預(yù)測時間序列這里 GM(1,1,0.6,7)的意思是用固定的7個灰色數(shù)據(jù)量和0.6的灰色參數(shù)建立的GM(1,1)模型.其中開始的7個灰色預(yù)測數(shù)據(jù)等于原始的 7 個數(shù)據(jù)(x1,x2,…,x7),第8個灰色預(yù)測數(shù)據(jù)^z8是7個原始數(shù)據(jù)(x1,x2,…,x7)建立的GM(1,1,0.6,7)模型預(yù)測出來的,第9個灰色預(yù)測數(shù)據(jù)^z9是7個原始數(shù)據(jù)(x2,x3,……x8)建立的GM(1,1,0.6,7)模型預(yù)測得來的,以此類推,第126個灰色預(yù)測數(shù)據(jù)^z126是7個原始數(shù)據(jù)(x119,x120,…,x125)建立的 GM(1,1,0.6,7)模型預(yù)測得來的.由此,可以得到全部126個灰色預(yù)測序列 Z^和灰色殘差序列 Y=X -=(y1,y2,…,y126).由于(p,q)=(1,0),因此對灰色殘差序列 Y建立ARMA(1,0)模型并可得到相應(yīng)的Y的ARMA模型的預(yù)測擬合值,這里是空值.由于灰色模型和 ARMA 模型都要用以前數(shù)據(jù)遞推的緣故,是y8通過建立的ARMA(1,0)計算得到,以此類推是 y125通過建立的ARMA(1,0)計算得到.這樣序列X基于參數(shù)組(μ,v,p,q)=(0.6,7,1,0)的 GM-ARMA 模型的擬合的就為
總絕對值誤差σTAE就為
以上算法可以用Matlab編程實(shí)現(xiàn),本節(jié)的例子中,當(dāng)(μ,v,p,q)=(0.4,6,3,1)的時候,基于歷史數(shù)據(jù) X 計算出來的 σTAE最小,因此用(u,v,p,q)=(0.4,6,3,1)建立的 GM-ARMA 模型就是基于 TAE準(zhǔn)則的最優(yōu)GM-ARMA模型.其意思是要用6個數(shù)據(jù)段和采取灰色參數(shù)0.6建立GM(1,1)來進(jìn)行灰色預(yù)測,并對灰色殘差建立ARMA(3,1)模型來進(jìn)行預(yù)測.效仿前面的(μ,v,p,q)=(0.6,7,1,0)的例子,用(μ,v,p,q)建立 GM-ARMA 模型,可以得到第127個點(diǎn)的灰色預(yù)測值和灰色預(yù)測殘差的預(yù)測值,并由此得到序列X在127個點(diǎn)的預(yù)測值為
因此,根據(jù)RGM-ARMA模型,對TSX指數(shù)第127個點(diǎn)的預(yù)測值,也就是時間2009年1月2日的日線收盤價的預(yù)測值為8 953.2.對于第128個數(shù)據(jù),將用開始的127個數(shù)據(jù)建立改進(jìn)的GM-ARMA模型來預(yù)測,以此類推,可以得到從2009年1月2日—2009年2月6日的全部26個預(yù)測數(shù)據(jù).并計算出σMAPE為
由于股市判斷方向也重要,這里也計算出了方向錯誤率σDIR(directional errors)為
這里,
因?yàn)镚M-ARMA模型并沒有給出選擇GM(1,1)模型的準(zhǔn)則,這說明任何灰色維度超過3就可以用,因此這里選擇了幾個不同的灰色維度來建立GM(1,1)模型,而對殘差用常用的BIC準(zhǔn)則來構(gòu)建不同的GM-ARMA模型.用相同數(shù)據(jù)計算這些模型的誤差率,表2列出了各個模型的比較.
表2 不同模型的比較Table 2 Comparisons between models
由表2可以看出,RGM-ARMA模型的3種預(yù)測誤差都小于ARIMA模型和GM-ARMA模型的各種組合,這也說明了RGM-ARMA模型在實(shí)踐中是可行的.
本文解決了傳統(tǒng)的GM-ARMA模型中GM(1,1)模型并不是最優(yōu)化的問題,也提出了整合GM(1,1)模型和ARMA模型的一個全新的解決思路,即基于某種定量的原則來建立最優(yōu)的組合模型而不是依靠經(jīng)驗(yàn)來建立組合模型.實(shí)驗(yàn)結(jié)果表明,這種整合思想所得到的結(jié)果在誤差上小于ARIMA模型和GMARMA模型.更重要的是,提出了一種新的建立組合模型的思想,通過修改組合的條件,該思想可以推廣到建立多種組合模型上去.雖然是針對股票的特點(diǎn)提出了基于TAE準(zhǔn)則來建立GM(1,1)和ARMA模型的組合模型,但是也可以基于TAE準(zhǔn)則建立其他模型的組合模型.例如基于TAE準(zhǔn)則建立GM(1,1)、小波分解和ARMA模型的組合模型.或者也可以針對其他的實(shí)際情況,通過修改準(zhǔn)則來合成組合模型,例如預(yù)測國民生產(chǎn)總值GDP這種時間序列時,可以修改成MAPE準(zhǔn)則來建立GM(1,1)和AR-MA模型的組合模型.
[1]朱寧,徐標(biāo),仝殿波.上證指數(shù)的時間序列預(yù)測模型[J].桂林電子工業(yè)學(xué)院學(xué)報,2006,26(2):124-128.ZHU Ning,XU Biao,TONG Dianbo.Time-series prediction model of Shanghai composite index[J].Journal of Guilin University of Electronic Technology,2006,26(2):124-128.
[2]POTERBA J M,SUMMERS L H.The persistence of volatility and stock market fluctuations[J].American Economic Review,1986,76:1143-1151.
[3]郭寧,向鳳紅.灰色理論和神經(jīng)元網(wǎng)絡(luò)在證券市場中的應(yīng)用[J].自動化技術(shù)與應(yīng)用,2008,27(10):1-3.GUO Ning,XIANG Fenghong.Application of grey model and neural network in the stock-market[J].Techniques of Automation and Applications,2008,27(10):1-3.
[4]FRENCH K R,SCHWERT G W,STAMHAUGH R F.Expected stock returns and volatility[J].Journal of Financial Economics,1987,19:3-29.
[5]李國平,于廣青,陳森發(fā).中國股票價格灰色預(yù)測研究綜述[J].東南大學(xué)學(xué)報:哲學(xué)社會科學(xué)版,2005,7(2):28-30,126.LI Guoping,YU Guangqing,CHEN Senfa.A review of research on stock price gray forecast in China[J].Journal of Southeast University:Philosophy and Social Science,2005,7(2):28-30,126.
[6]吳庚申,梁平,龍新峰.基于GM-ARMA的年電力負(fù)荷組合模型[J].湖北電力,2005,29(2):21-23.WU Gengshen,LIANG Ping,LONG Xinfeng.An annual electric consumption combined model based on GM-ARMA[J].Hubei Electric Power,2005,29(2):21-23.
[7]郝永紅,王學(xué)萌.灰色動態(tài)模型及其在人口預(yù)測中的應(yīng)用[J].數(shù)學(xué)的實(shí)踐與認(rèn)識,2002,32(5):813-820.HAO Yonghong,WANG Xuemeng.The dynamic model of gray system and its application to population forecasting[J].Mathematics in Practice and Theory,2002,32(5):813-820.
[8]鄧聚龍.灰色系統(tǒng)基本方法[M].武漢:華中理工大學(xué)出版社,1988.
[9]袁嘉祖.灰色系統(tǒng)理論及其應(yīng)用[M].北京:科學(xué)出版社,1991.
[10]李國平,林敬松.一種改進(jìn)的灰色模型在股票價格中的應(yīng)用[J].商場現(xiàn)代化,2005(10):188-189.
[11]劉虹,張岐山.基于微粒群算法的 GM(1,1,λ)模型的機(jī)械產(chǎn)品壽命預(yù)測[J].機(jī)械設(shè)計,2007,24(10):4-5,61.LIU Hong,ZHANG Qishan.Life-span prediction on mechanical products of GM(1,1,λ)model based on particle swarm algorithm[J].Journal of Machine Design,2007,24(10):4-5,61.
[12]謝開貴,李春燕,周家啟.基于遺傳算法的 GM(1,1,λ)模型[J].系統(tǒng)工程學(xué)報,2000,15(2):168-172.XIE Kaigui,LI Chunyan,ZHOU Jiaqi.Gray model(GM(1,1,λ))based on genetic algorithm[J].Journal of Systems Engineering,2000,15(2):168-172.
[13]陳舉華,史巖彬,沈?qū)W會.GM優(yōu)化方法在機(jī)械系統(tǒng)壽命預(yù)測中的應(yīng)用[J].山東大學(xué)學(xué)報:工學(xué)版,2003,33(4):379-381.CHEN Juhua,SHI Yanbin,SHEN Xuehui.Application of GM(1,1,ω*)methods in the life prediction of mechanical systems[J].Journal of Shandong University:Engineering Science,2003,33(4):379-381.