張貴生,張信東
(1.山西大學管理與決策研究所,山西 太原 030006:2.山西大學經(jīng)濟與管理學院,山西 太原 030006)
?
基于近鄰互信息的SVM-GARCH股票價格預測模型研究
張貴生1,2,張信東1,2
(1.山西大學管理與決策研究所,山西 太原 030006:2.山西大學經(jīng)濟與管理學院,山西 太原 030006)
為了克服傳統(tǒng)線性模型分析處理收益率數(shù)據(jù)非線性因素的不足,本文提出一種新的基于近鄰互信息特征選擇的SVM-GARCH預測模型。該模型利用SVM處理高維非線性數(shù)據(jù)的優(yōu)勢,不僅包含了股指序列自身的歷史數(shù)據(jù)信息,而且通過近鄰互信息的方式融合了與目標股指數(shù)據(jù)關系密切的周邊證券市場的相關變化信息。仿真實驗結(jié)果表明,該模型在時序數(shù)據(jù)除噪、趨勢判別以及預測的精確度等方面均優(yōu)于傳統(tǒng)的ARMA-GARCH模型。
股票價格預測:SVM-GARCH模型;近鄰互信息
隨著人們對金融市場認識的不斷加深,國內(nèi)外廣大研究人員提出了大量的金融時序數(shù)據(jù)的分析預測模型,在這些方法中有基于傳統(tǒng)統(tǒng)計理論的ARMA模型[1-2]、GARCH模型[3-4]及馬爾科夫鏈[5-6]等,也有人工神經(jīng)網(wǎng)絡算法(Artificial Neural Network,ANN)[7-8]、支持向量機(Support Vector Machine,SVM)[9-10]等基于機器學習的人工智能方法。在這許多方法之中,ARMA-GARCH模型在對因變量滯后值以及隨機誤差項的滯后值進行回歸的基礎之上,還對誤差方差和滯后條件方差進行了進一步的線性函數(shù)建模,在對于金融時序數(shù)據(jù)的收益和波動性等研究方面得到了廣泛地應用[11-16]。然而,股票價格的影響因素很多,而且隨著全球經(jīng)濟金融市場的一體化發(fā)展以及金融危機的爆發(fā),各國證券市場之間的相互影響正日益擴大,不同金融市場之間的聯(lián)動和傳染效應也對股票價格有著非常顯著的影響,已經(jīng)成為影響本地證券市場波動的主要因素之一[17],所有這些因素使得股票價格的波動表現(xiàn)出復雜的非線性特征和不確定性[18-22]。而ARMA方程是一種典型的線性回歸模型,對于證券價格線性趨勢變化的假設,影響了在現(xiàn)實應用中預測精度的進一步提高[23-28]。近年來,借助機器學習和智能計算技術克服傳統(tǒng)規(guī)范分析研究假設過于嚴格的弱點[29-30],創(chuàng)新性地把ANN和SVM等非線性算法大量應用于股票價格預測研究,很大程度上提高了股票價格預測的精度。但神經(jīng)網(wǎng)絡由于存在諸如網(wǎng)絡結(jié)構(gòu)復雜、過擬合、局部極小值等缺陷,影響了在證券價格預測研究中的性能[25,31-32]。而支持向量機基于結(jié)構(gòu)風險最小化原則克服了神經(jīng)網(wǎng)絡的缺陷,已經(jīng)在經(jīng)濟、金融研究領域得到了廣泛地應用[33-36]。利用SVM模型通過高維面板數(shù)據(jù)可以更好地分析處理金融時序數(shù)據(jù)中的非線性成分,但并不能確?;貧w后的擾動項不存在異方差性?;谝陨纤悸繁疚臄M構(gòu)造一種SVM-GARCH模型,利用SVM分析收益率時間序列中非線性復雜關系的同時,通過GARCH模型處理預測殘差的異方差特性,進一步在一定程度上解決SVM對于預測目標相關信息學習不完備的問題。另外,本文借用近鄰互信息的概念刻畫不同金融市場之間的非線性依賴關系的基礎上進行SVM輸入變量的特征選擇,提高SVM模型對于收益率時序數(shù)據(jù)非線性關系的分析和預測能力。最后,以多期日經(jīng)225指數(shù)為實驗對象的實驗結(jié)果表明,學習了周邊證券市場聯(lián)動信息的SVM-GARCH模型更加貼近真實的證券市場環(huán)境,預測的有效性和精確性有顯著提高。
(1)
(2)
我們能得到當輸入為x時的預測結(jié)果f(x):
(3)
定義1.假設rt為收益率時間序列數(shù)據(jù),則SVM-GARCH模型的均值方程和方差方程如下:
(4)
在金融市場聯(lián)動研究方面,當前普遍采用的GARCH、VAR、協(xié)整以及誤差修正等計量經(jīng)濟學模型樣本需要事先假設殘差的條件分布,不能很好地適應金融時序數(shù)據(jù)的真實特性,在一定程度上影響了模型對于市場聯(lián)動信息分析判斷的準確性[18]。鑒于此,本文采用近鄰互信息的方法,從微觀層面描述不同市場之間的聯(lián)動規(guī)律。由于近鄰互信息是在信息熵的基礎之上演化而來,因此不僅客服了離散數(shù)據(jù)之間互信息的計算困難,而且還滿足了金融市場之間非線性相互關系的要求,因此本文選擇近鄰互信息來刻畫周邊市場與目標市場收益率數(shù)據(jù)之間的相關性,并以近鄰互信息最大化原則對自身收益率歷史數(shù)據(jù)及關聯(lián)市場收益率歷史數(shù)據(jù)進行特征選擇[39-40]。近鄰互信息定義如下[41]:
定義2.若樣本集U={x1,x2,…,xn}由離散的數(shù)值特征集F描述,R,S為特征集F的特征子集,即R,S?F,樣本xi在特征子集R和S上的近鄰域可分別表示為δR(xi)和δS(xi),則R與S的近鄰互信息定義為:
(5)
本文構(gòu)建的基于近鄰互信息特征選擇的SVM-GARCH股票價格收益率時間序列的預測模型的總體思路為:首先使用近鄰互信息選擇與目標市場收益率關聯(lián)性較強的目標市場歷史數(shù)據(jù)及周邊市場信息,構(gòu)造支持向量回歸機的高維輸入變量信息;然后訓練SVM分析處理收益率時間序列數(shù)據(jù);最后使用GARCH模型分析殘差序列異方差特性,矯正并改善SVM-GARCH模型預測的有效性和精確性?;诨バ畔⒌腟VM-GARCH預測模型算法描述見表1。
由于本文是針對傳統(tǒng)ARMA-GARCH模型在處理時序數(shù)據(jù)非線性結(jié)構(gòu)時的不足提出的改進算法,因此在本文接下來的實證研究中將以證券市場中的真實股票價格時間序列數(shù)據(jù)為研究對象,以ARMA-GARCH模型為基準模型,通過比較研究證明SVM-GARCH模型的科學性,以及近鄰互信息在表達當今復雜經(jīng)濟金融市場環(huán)境下的市場聯(lián)動信息方面的適用性。
3.1 數(shù)據(jù)來源及預處理
日經(jīng)225(Nikkei 225)股票指數(shù)由日本經(jīng)濟新聞社編制并由日本東京股票交易所推出,被認為不僅是最能夠代表日本股票市場的股票價格平均指數(shù),更是全世界國際金融市場中的重要指標之一。另一方面日本作為經(jīng)濟發(fā)達國家之一,在高外匯儲備、 高儲蓄、 高凈出口等方面與中國有很多相似之處,作為亞太地區(qū)最成熟的股票市場是如何發(fā)揮其宏觀經(jīng)濟的晴雨表作用的,對于當下全球經(jīng)濟金融一體化環(huán)境下的國內(nèi)股票市場而言,在維護金融安全,推動經(jīng)濟發(fā)展等方面具有很大的參考價值[22,42]。基于對以上因素的綜合考慮, 本文選取了2010年1月4日至2011年12月31日和2012年1月4日至2013年12月31日兩段時間范圍內(nèi)的日經(jīng)225指數(shù)日收益數(shù)據(jù)為實驗對象,對基準模型ARMA-GARCH和新模型SVM-GARCH展開實證比較研究,檢驗模型預測結(jié)果的精確性。兩部分數(shù)據(jù)集的前90%作為訓練數(shù)據(jù)集,主要訓練模型的學習能力并對相關參數(shù)進行估計,剩余10%作為測試集,用于樣本外測試,檢驗模型的學習效果和預測精度。本文中仿真實驗所涉及股指數(shù)據(jù)全部來自Datastream金融數(shù)據(jù)庫。設股指日收盤價格為Ci,則每日收益率為ri=(Ci-Gi-1)/Ci-1,本文研究過程中,使用股指日收益率數(shù)據(jù)為建模對象展開實證研究。SVM回歸機由Weka3.6.11工具箱實現(xiàn),近鄰互信息數(shù)值計算代碼由VisiualStudio2013語言環(huán)境自主開發(fā)完成,模型構(gòu)建中GARCH模型通過MATLAB2014b工具箱以及EVIEWS8.0完成。
3.2 模型參數(shù)選擇
從表2中給出的兩段日經(jīng)225綜合指數(shù)收益序列的相關統(tǒng)計量信息可以看出,收益率時間序列的峰度值分別為10.30446和5.72311 1均大于正態(tài)分布的峰度值3,表中J-B統(tǒng)計量檢驗結(jié)果也表明收益率序列服從正態(tài)分布的概率為0,并且偏度值也都小于0,說明兩段日經(jīng)225股指收益率序列均具有尖峰左偏的分布特點。表3給出了兩段收益率時間序列的ADF單位根檢驗結(jié)果,在1%顯著水平下,ADF統(tǒng)計量分別為-20.75900和-22.61832均遠小于臨界值且P值很小,說明收益率序列有單位根的概率幾乎為0,應該沒有明顯的記憶性和波動的持續(xù)性,文中所選取的兩段日經(jīng)225股指收益率時間序列是平穩(wěn)的。
表1 基于近鄰互信息的SVM.GARCH單步預測模型算法
表2 收益序列ri統(tǒng)計特征
表3 收益率序列的ADF檢驗結(jié)果
在確定ARMA模型的具體形式時,通常情況下以計算AC和PAC并通過圖像來直觀地進行滯后階數(shù)p,q可能取值的判斷,然后通常采用最小信息準則(AIC)給出最佳的模型階數(shù)定量化的精確判斷。其中,AIC函數(shù)的具體定義為:
(6)
根據(jù)AIC最小準則,對于兩階段日經(jīng)225指數(shù)收益率數(shù)據(jù)我們分別選擇p=2、q=2和p=2、q=3,即2010-2011段數(shù)據(jù)確定ARMA(2,2)模型,而對于2012-2013段數(shù)據(jù)選取ARMA(2,3)模型。
大量研究表明,互信息在構(gòu)建模型進行特征選擇時是一種有效的方法。并且Hu Qinghua等[41]在2011年提出的近鄰互信息概念不僅滿足了表達收益率時間序列之間非線性關系的需求,而且解決了傳統(tǒng)互信息在計算數(shù)值型離散數(shù)據(jù)的互信息時計算相關邊緣概率密度及聯(lián)合概率密度的困難。因此在本文中利用近鄰互信息的概念實現(xiàn)SVM的高維輸入變量的特征選擇功能??紤]到日經(jīng)225指數(shù)在全球證券市場的廣泛影響力和在亞洲的特殊地位,本文在開展實證研究時選取了歐洲三大股指(英國富時100、德國法蘭克福指數(shù)和法國CAC40股價指數(shù)),紐約三大股指(道瓊斯指數(shù)、標準普爾500指數(shù)和納斯達克指數(shù))、香港恒生指數(shù)以及我國內(nèi)地的上證綜指和深成指數(shù)的滯后5天歷史數(shù)據(jù)作為基礎數(shù)據(jù),并分別計算以上信息與日經(jīng)225指數(shù)之間的近鄰互信息,計算所得結(jié)果如表4所示。
表4 互信息計算結(jié)果
從表4中對于兩組數(shù)據(jù)的計算結(jié)果可以看出,與日經(jīng)225指數(shù)近鄰互信息由強到弱的前20個數(shù)據(jù)集信息依次為日經(jīng)225指數(shù)滯后5天歷史數(shù)據(jù)信息、道瓊斯指數(shù)、法蘭克福指數(shù)和香港恒生指數(shù)。作為亞洲最成熟證券市場中的代表性綜合指數(shù),日經(jīng)225指數(shù)不僅與美歐發(fā)達國家的綜合性股指數(shù)據(jù)關聯(lián)密切而且也和香港恒生指數(shù)有著很強的聯(lián)動效應,體現(xiàn)了市場較高的成熟度和開放程度。本文分別選取了表4中的前10個和前20個屬性作為SVM的高維輸入變量,構(gòu)建日經(jīng)225指數(shù)的預測模型SVM(10)-GARCH和SVM(20)-GARCH,并得到相應的預測結(jié)果。
文中對ARMA、SVM(10)和SVM(20)對于收益率預測結(jié)果的殘差序列進行了滯后5期的ARCH-LM檢驗。從表5可看出,檢驗統(tǒng)計量LM=TR2和對應的概率幾乎全部為0,統(tǒng)計結(jié)果拒絕了殘差序列中不存在異方差性的原假設,即兩組日經(jīng)225股指收益率序列在經(jīng)過不同的線性和非線性回歸后的殘差項中均存在明顯的異方差效應。因此在構(gòu)建ARMA模型和SVM模型時,需要加入GARCH模型對其回歸預測結(jié)果的殘差平方進行進一步的分析處理,同時估計兩組時間序列數(shù)據(jù)集的ARMA-GARCH模型和SVM-GARCH模型的相關參數(shù),結(jié)果如表6所示。將表中的參數(shù)估計結(jié)果代入ARMA-GARCH方程和SVM-GARCH方程,可分別得到對應的線性模型和非線性模型的條件均值方程和方差方程。本文以日經(jīng)225指數(shù)2010-2011段數(shù)據(jù)為例將上述得到的參數(shù)估計結(jié)果代入不同的預測模型,分別得到股指日收益率序列數(shù)據(jù)的ARMA-GARCH,SVM(10)-GARCH及SVM(20)-GARCH的條件均值方程及條件方差方程,具體情況如式(7)-(12)所示。
日經(jīng)225指數(shù)ARMA(2,3)-GARCH(1,1)模型的條件均值方程和方差方程分別為:
yt=0.0011-0.5872yt-1-0.8319yt-2+0.6031ut-1+0.8804ut-2+0.1058ut-3
(7)
(8)
SVM(10)-GARCH(1,1)模型的條件均值方程和方差方程分別為:
yt=1.9607×10-4+0.7279f(x)- 0.0321ut-1-0.0262ut-2+0.0315ut-3
(9)
(10)
SVM(20)-GARCH(1,1)模型的條件均值方程和方差方程分別為:
yt=3.1487×10-4+0.9362f(X)-0.0484ut-1—0.0047ut-2+0.0258ut-3
(11)
(12)
表6中列出的參數(shù)在95%置信水平下均是高度顯著的。兩組數(shù)據(jù)的ARMA方程中p值均為2,g的取值分別為2和3,說明受各種綜合因素的影響,市場交易行為對于歷史數(shù)據(jù)信息的理解一般需要兩到三天的時間。SVM方程的系數(shù)相對較大,說明了SVM在分析高維非線性的面板時序數(shù)據(jù)時的適用性,也體現(xiàn)了其在新的SVM-GARCH模型中的重要性。到此對于兩階段日經(jīng)225指數(shù)時序數(shù)據(jù)測試集的ARMA-GARCH方程和SVM-GARCH方程均已經(jīng)建立完畢。并且本文又對得到的模型分別作了1階滯后,10階滯后和20階滯后的殘差估計,驗證模型已不存在異方差性,因此可以認為模型的構(gòu)建是完全合理的。
3.3 實驗結(jié)果分析
為了檢驗模型的預測準確性, 本文以兩組日經(jīng)225指數(shù)的日收益率時間序列的10%作為測試集,展開對于ARMA-GARCH模型和兩種不同的特征選擇后的SVM-GARCH模型的實證比較研究,圖1至圖4分別顯示了預測模型在不同測試數(shù)據(jù)集上預測結(jié)果的時序圖和散點圖。從一系列時序圖中可以看出,兩種模型的預測結(jié)果均較好地擬合了收益序列的真實值,但SVM-GARCH模型對于不同測試數(shù)據(jù)集的預測結(jié)果在數(shù)據(jù)變化趨勢及波動幅度方面均更加貼近真實收益率數(shù)值的變化情況。說明SVM-GARCH模型能更好地分析處理收益率時間序列數(shù)據(jù)中所包含的非線性因素,而且也證實了當前全球經(jīng)濟一體化環(huán)境下的周邊金融市場信息對于目標市場收益變動日益顯著的影響作用。另外,從不同模型預測結(jié)果的散點圖也可以清晰地看出,SVM-GARCH模型的預測結(jié)果更加接近R2=1的最佳回歸線,而ARMA-GARC模型的預測結(jié)果則分布得更加分散。以圖1(b)的散點圖為例,SVM(10)-GARCH模型對于真實收益率數(shù)據(jù)中的方差解釋能力由ARMA-GARC模型的0.7415提高到了0.8696,表明SVM-GARCH模型顯著地改善了預測模型對于時序數(shù)據(jù)的分析和預測能力。
考慮到評價標準在實際應用領域中的特點和局限性,任何一個單個或單方面的評價指標都很難做到對于計算結(jié)果優(yōu)劣的綜合全面評價。根據(jù)Hansen等[43]的建議,考慮到評價的全面性和客觀性,文中選取了平均絕對誤差(Mean Absolute Error,MAE),均方根誤差(Root Mean Square Error,RMSE),平均絕對百分誤差(Mean Absolute Percent Error,MAPE),百分標準差(Percent Standard error of Prediction,SEP),Nash-Sutcliffe系數(shù)(Nash Sutcliffe Efficiency Coefficient,E),一致性指數(shù)(Willmott’s Index of Agreement,WIA),方向準確率(Direction Accuracy,DA)等一系列標準,旨在從多方面對于不同模型的泛化能力做出全面而又客觀的科學評價。評價標準具體定義如下:
(13)
(14)
表6 模型參數(shù)估計結(jié)果
圖1 2010-2011段日收益率數(shù)據(jù)SVM(10)-GARCH模型預測結(jié)果
圖2 2010-2011段日收益率數(shù)據(jù)SVM(20)-GARCH模型預測結(jié)果
圖3 2012-2013段日收益率數(shù)據(jù)SVM(10)-GARCH模型預測結(jié)果
圖4 2012-2013段日收益率數(shù)據(jù)SVM(20)-GARCH模型預測結(jié)果
(15)
(16)
(17)
(18)
(19)
其中ai和yi分別表示真實值和模型的預測值。通常,評價指標MAE,RMSE,SEP以及MAPE的值越小表明模型的預測值與真實值更加接近,也就說明模型預測精度更高。E表示模型的預測能力,當預測值與真實值完全相等時E取最大值1,而IA以及DA反映了模型預測結(jié)果與真實值的一致程度以及對于未來時序數(shù)據(jù)變化趨勢的判別能力,E、IA和DA的值越大,則表明模型的預測能力越強、精度越高。
表7列出了ARMA-GARCH模型以及SVM(10)-GARCH模型和SVM(20)-GARCH模型在不同股指數(shù)據(jù)測試集上預測結(jié)果的多角度評價情況。從表中各種評價指標的數(shù)據(jù)可以直觀地看出,經(jīng)過特征選擇的SVM-GARCH模型均表現(xiàn)出了更加優(yōu)異的性能。以2010-2011數(shù)據(jù)段為例可看出,預測結(jié)果的MAE值從ARMA-GARCH模型的85.99153分別下降為SVM(10)-GARCH模型的63.74392和SVM(20)-GARCH模型的59.20412,降低比例超過了25%,其它指標RMSE,MAPE,SEP等也有顯著的改善,說明SVM-GARCH模型預測性能提高顯著。另外,由于SVM-GARCH模型在均值方程中用SVM替代了線性自回歸,改善了模型對于時序數(shù)據(jù)高維非線性成分的分析和處理能力,并通過融合周邊市場信息的方式更加全面地表達了全球經(jīng)濟一體化環(huán)境下影響股票價格時序數(shù)據(jù)收益和波動的復雜性綜合因素,使得SVM-GARCH模型對于不同的測試集在一致性(WIA)尤其是在對于預測結(jié)果更為重要的方向性判別(DA)方面均體現(xiàn)了一致趨優(yōu)的良好性能。結(jié)果再次說明通過近鄰互信息對周邊市場收益數(shù)據(jù)的篩選,不僅有效利用了SVM處理高維數(shù)據(jù)的特性,而且還科學地表達了新的經(jīng)濟環(huán)境下,周邊市場信息對于目標金融市場走勢及波動的影響,能更準確地把握股票市場價格行為的變化規(guī)律,很大程度上彌補了傳統(tǒng)ARMA-GARCH模型僅僅分析單變量股票價格歷史數(shù)據(jù)信息不夠全面的缺陷,提高了模型預測的準確性和魯棒性。
表7 評價指標結(jié)果
影響股票市場的因素很多,而且隨著全球經(jīng)濟一體化趨勢的不斷加強,不同區(qū)域金融市場之間的聯(lián)動關系和傳染效應表現(xiàn)得越來越顯著,進一步增強了股指收益率時序數(shù)據(jù)的高維復雜性特征。因此通過構(gòu)建模型對未來股票收益率時間序列進行預測時,不能只關注于單變量時序數(shù)據(jù)本身所包含的有限信息,而是要賦予市場主體一些特定的行為模式及學習機制,并強調(diào)真實的開放市場環(huán)境下所有參與對象之間的微觀交互,充分挖掘與目標股指數(shù)據(jù)關系密切的周邊證券市場的相關變化信息,進而增強模型對于宏觀市場運行規(guī)律的學習能力。基于此,本文提出了一種基于近鄰互信息特征選擇的SVM-GARCH預測模型,新的模型充分利用SVM處理高維面板數(shù)據(jù)的優(yōu)勢,在考慮股指收益率自身歷史數(shù)據(jù)信息的基礎上,還借助近鄰互信息技術科學有效地融合了真實市場環(huán)境下影響目標市場收益率的周邊金融市場變化信息。該模型不僅改進了傳統(tǒng)線性仿真模型的設計,增強了模型分析收益率時間序列數(shù)據(jù)非線性復雜結(jié)構(gòu)的能力,還通過與GARCH模型結(jié)合克服了SVM模型處理預測結(jié)果殘差序列中異方差效應的不足,使得模型更加貼近了真實的市場環(huán)境。對于不同階段日經(jīng)225指數(shù)日收益率數(shù)據(jù)的數(shù)值仿真實驗表明,基于近鄰互信息特征選擇的SVM-GARCH模型更加充分地表達了影響股指收益率波動的綜合市場因素,在對于時序數(shù)據(jù)未來變化趨勢判別、數(shù)據(jù)除噪以及預測精確度等多方面均優(yōu)于傳統(tǒng)的ARMA-GARCH模型。該方法進一步豐富了計算實驗金融研究領域中關于金融時序數(shù)據(jù)分析預測的方法和措施,對于金融市場風險預警體系的完善以及投資決策的輔助設計均有一定的借鑒意義。
將非線性技術與現(xiàn)代金融理論相結(jié)合,是當前金融理論研究的熱點之一。本文緊跟這一熱點,對金融時序數(shù)據(jù)的預測性研究做了一些有益的探索。旨在從數(shù)據(jù)驅(qū)動的角度出發(fā),融合金融時序數(shù)據(jù)內(nèi)在特點的基礎上增強預測模型對于時序數(shù)據(jù)的解讀能力,進而提高模型的預測精度。但是在金融市場發(fā)生大規(guī)模突發(fā)性事件的環(huán)境下,金融時序數(shù)據(jù)震蕩或反轉(zhuǎn)突變情況會大幅增加時,金融時序歷史數(shù)據(jù)的相關信息對于模型預測精度提高的指導意義就會大打折扣,以數(shù)據(jù)信息驅(qū)動的預測模型的適應性就會收到一定程度的影響。我們希望在未來的后續(xù)研究工作中繼續(xù)深入分析特殊市場環(huán)境下的時序數(shù)據(jù)形態(tài)和特征,使得模型能夠滿足特殊事件驅(qū)動的時序數(shù)據(jù)預測精度要求,為投資策略選擇及市場金融監(jiān)管提供有效的決策輔助信息。
[1] Wang Jujie,Wang Jianzhou,Zhang Z,et al. Stock index forecasting based on a hybrid model[J].Omega,2012,40(6):758-766.
[2] Pal Pingfeng,Lin C.A hybrid ARIMA and support vector machines model in stock price forecasting[J].Omega,2005,33(6):497-505.
[3] 曹廣喜,曹杰,徐龍炳.雙長記憶GARCH族模型的預測能力比較研究-基于滬深股市數(shù)據(jù)的實證分析[J].中國管理科學,2012,20(2):41-49.
[4] 張銳,魏宇,金煒東.基于MRS-EGARCH模型的滬深300指數(shù)波動預測[J].系統(tǒng)工程學報,2011,26(5):628-635.
[5] 姜婷,周孝華,董耀武.基于Markov機制轉(zhuǎn)換模型的我國股市周期波動狀態(tài)研究[J].系統(tǒng)工程理論與實踐,2013,33(8):1934-1939.
[6] 楊繼平,張春會.基于馬爾可夫狀態(tài)轉(zhuǎn)換模型的滬深股市波動率的估計[J].中國管理科學,2013,21(2):42-49.
[7] 于志軍,楊善林,章政,等. 基于誤差校正的灰色神經(jīng)網(wǎng)絡股票收益率預測[J].中國管理科學,2015,23(12):20-26.
[8] 王文波,費浦生,羿旭明.基于EMD和神經(jīng)網(wǎng)絡的中國股票市場預測[J].系統(tǒng)工程理論與實踐,2010,30(6):1028-1033.
[9] Kim K. Financial time series forecasting using support vector machines[J].Neurocomputing,2003,55(1-2):307-319.
[10] Huang Wei,Nakamori Y,Wang Shouyang.Forecasting stock market movement direction with support vector machine[J].Computers & Operations Research,2005,32(10):2513-2522.
[11] Engle R F. Autoregressive conditional heteroscedasticity with estimates of the variance of United Kingdom inflation[J]. Econometrica,1982,50(4):987-1007.
[12] Bollerslev T.Generalized autoregressive condi-tional heteroskedasticity[J].Journal of Econometrics,1986,3 1(3):307-327.
[13] 侯利強,楊善林,王曉佳,等.上證綜指的股指波動:基于模糊FEGARCH模型及不同分布假設的預測研究[J].中國管理科學,2015,23(6):32-40.
[14] Mohammadi H, Su Lixian.International evidence on crude oil price dynamics:Applications of ARIMA-GARCH models[J].Energy Economics,2010,32(5):1001-1008.
[15] Liu Heping, Shi Jing.Applying ARMA-GARCH approaches to forecasting short-term electricity prices[J].Energy Economics,2013,37:152-166.
[16] 吳恒煜,朱福敏,溫金明.基于ARMA-GARCH調(diào)和穩(wěn)態(tài)Levy過程的期權(quán)定價[J].系統(tǒng)工程理論與實踐,2013,33(11):2721-2733.
[17] 周璞,李自然.基于非線性Granger因果檢驗中國大陸和世界其他主要股票市場之間的信息溢出[J].系統(tǒng)工程理論與實踐,2012,32(3):466-475.
[18] 沈傳河,王向榮.金融市場聯(lián)動形態(tài)結(jié)構(gòu)的非線性分析[J].管理科學學報,2015,18(2):66-75.
[19] Loh L.Co-movement of Asla-Pacific with European and US stock market returns:A cross-time-frequency analysis[J].Research in International Business and Finance,2013,29:1-13.
[20] Kotkatvuori-?rnberg J,Nikkinen J,ij? J.Stock market correlations during the financial crisis of 2008-2009:Evidence from 50 equity markets[J].International Revlew of Financial Analysis,2013,28:70-78.
[21] 黃飛雪,谷靜,李延喜,等.金融危機前后的全球主要股指聯(lián)動與動態(tài)穩(wěn)定性比較[J].系統(tǒng)工程理論與實踐,2010,30(10):1729-1740.
[22] 林宇. 中國股市與國際股市的極值風險傳導效應研究[J].中國管理科學,2008,16(4):36-43.
[23] Xiong Tao,Li Chongguang,Bao Yukun,et al.A combination method for interval forecasting of agricultural commodity futures prices[J].Knowledge-Based Systems,2015,77:92-102.
[24] Zhang G P.Time series forecasting using a hybrid ARIMA and neural network model[J].Neurocomputing,2003,50:159-175.
[25] Zhu Bangzhu,Wei Yiming.Carbon price forecasting with a novel hybrid ARIMA and least squares support vector machines methodology[J].Omega, 2013,41(3):517-524.
[26] 陳海英. 基于支持向量機的上證指數(shù)預測和分析[J].計算機仿真,2013,30(1):297-300.
[27] 張貴生,張信東.基于時間相關性的股票價格混合預測模型[J].經(jīng)濟問題,2015,(9):23-28.
[28] 于志軍,楊善林.基于誤差校正GARCH的股票價格預測模型[J].中國管理科學,2013,21(S1):341-345.
[29] 張維,趙帥特,熊熊,等.計算實驗金融、技術規(guī)則與時間序列收益可預測性[J].管理科學,2008,21(3):74-84.
[30] 張維,李悅雷,熊熊,等.計算實驗金融的思想基礎及研究范式[J].系統(tǒng)工程理論與實踐,2012,32(3):495-507.
[31] Cao Lijuan. Support vector machines experts for time series forecasting[J].Neurocomputing,2003,51:321-339.
[32] 謝國強.基于支持向量回歸機的股票價格預測[J].計算機仿真,2012,29(4):379-382.
[33] Vapnik V.The nature of statistical learning theory[M].1995,New York:Springer Verlag Press.
[34] Atsalakis G S.Valavanis K P.Surveying stock market forecasting techniques-Part II:Soft computing methods[J].Expert Systems with Applications,2009,36(3):5932-5941.
[35] 熊濤,鮑玉昆,胡忠義,張金隆.基于SOM和SVMs的滬深300指數(shù)多步預測[J].系統(tǒng)工程,2012,30(10):36-42.
[36] 李海燕.基于支持向量機算法的股市拐點預測分析[J].鄭州大學學報(哲學社會科學版),2015,48(1):96-99.
[37] 蘇治,傅曉媛.核主成分遺傳算法與SVR選股模型改進[J].統(tǒng)計研究,2013,30(5):54-62.
[38] 王晴.組合模型在股票價格預測中應用研究[J].計算機仿真,2010,27(12):361-364.
[39] Hossein H,Andreia D,Mansoureh G.Effct of noise reduction in measuring the linear and nonlinear dependency of financial maricets[J].Nonlinear Analysis:Real World Applications,2010,11(1):492-502.
[40] Dionisio A,Menezes R,Mendes D A.Mutual information:A measure of dependency for nonlinear time series[J].Physica A,2004,344(1-2):326-329.
[41] Hu Qinghua,Zhang Lei,Zhang D,et al.Measuring relevance between discrete and continuous features based on neighborhood mutual information[J].Expert Systems with Applications,2011,38(9):10737-10750.
[42] 章宇軒.基于ARMA模型的日經(jīng)225指數(shù)實證研究[J].中國外資,2013(8):174-175.
[43] Hansen P R,Lunde A.A forecast comparison of volatility models:Does anything beat a GARCH(1,1)[J].Journal of Applied Econometrics,2005,20(7):873-899.
A SVM-GARCH Model for Stock Price Forecasting Based on Neighborhood Mutual Information
ZHANG Gui-sheng1,2, ZHANG Xin-dong1,2
(1.Institute of Management and Decision, Shanxi University, Taiyuan 030006, China;2.School of Economics and Management, Shanxi University, Taiyuan 030006,China)
In order to overcome the limitations of the traditional linear model in dealing with the nonlinearity in time series, a novel SVM-GARCH forecasting model is proposed based on the neighborhood mutual information. By constructing high dimensional input variables, the proposed nonlinear model not only absorbs the historical information in the time series data but also incorporates the stock market information in different regions through feature selection by the neighborhood mutual information. Empirical studies demonstrate that the proposed model is superior to the traditional linear ARMA-GARCH model in terms of data denosing, trend discrimination and prediction accuracy etc.
stock price forecasting; SVM-GARCH model; neighborhood mutual information
2015-11-09;
2016-03-24
國家自然科學基金面上項目(71371113);教育部人文社會科學研究項目(13YJA790154)
簡介:張貴生(1977-),男(漢族),山西晉中人,山西大學經(jīng)濟與管理學院,講師,博士,研究方向:金融資產(chǎn)價格預測性研究、預測支持系統(tǒng),E-mail:zhanggs@sxu.edu.cn.
F224.12
A
1003-207(2016)09-0011-10
10.16381/j.cnki.issn1003-207x.2016.09.002