吳振宇 喻敏 金吉 姜楠
摘 要:針對(duì)上證指數(shù)具有非線性、非平穩(wěn)性的特點(diǎn),研究了一種基于經(jīng)驗(yàn)?zāi)B(tài)分解(EMD)和自回歸滑動(dòng)平均模型(ARMA)的預(yù)測(cè)方法。首先利用EMD對(duì)上證指數(shù)數(shù)據(jù)進(jìn)行平穩(wěn)化處理,使上證指數(shù)數(shù)據(jù)更有規(guī)律性,改善上證指數(shù)數(shù)據(jù)的非線性、非平穩(wěn)性特性,然后利用ARMA模型對(duì)分解后的數(shù)據(jù)建模預(yù)測(cè)。研究結(jié)果表明:和直接利用ARMA模型進(jìn)行預(yù)測(cè)所得的結(jié)果相比,本文所提的方法預(yù)測(cè)精度更高。
關(guān)鍵詞:經(jīng)驗(yàn)?zāi)B(tài)分解(EMD) 自回歸滑動(dòng)平均模型(ARMA) 上證指數(shù) 預(yù)測(cè)
中圖分類號(hào):F832.51 文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):2096-0298(2018)06(a)-033-03
股市一直以來(lái)受諸多因素的影響,導(dǎo)致股市變化莫測(cè),股票具有高風(fēng)險(xiǎn)、高回報(bào)的特點(diǎn),有效的股市上證指數(shù)預(yù)測(cè)研究是降低風(fēng)險(xiǎn),提高獲利的關(guān)鍵[1~2]。目前常用的股票預(yù)測(cè)研究方法包括:支持向量機(jī)法[3~4]、卡爾曼濾波法[5]、神經(jīng)網(wǎng)絡(luò)方法[6~7]等??柭鼮V波法是將股票數(shù)據(jù)作為狀態(tài)變量建立狀態(tài)空間模型,該方法更加適用于對(duì)股票數(shù)據(jù)的在線預(yù)測(cè),但難以估計(jì)噪聲的統(tǒng)計(jì)特性。支持向量機(jī)在處理小樣本方面有較大優(yōu)勢(shì),但一些參數(shù)的選擇將直接決定預(yù)測(cè)的精度,目前支持向量機(jī)仍然缺乏公認(rèn)有效的參數(shù)選擇方法。神經(jīng)網(wǎng)絡(luò)法具有較強(qiáng)的泛化能力,但神經(jīng)網(wǎng)絡(luò)法容易在局部最小點(diǎn)出現(xiàn)錯(cuò)誤,從而導(dǎo)致產(chǎn)生的預(yù)測(cè)結(jié)果不夠穩(wěn)定。由于ARMA模型在建模時(shí)能將影響股票的因素綜合起來(lái)[8],本文選取ARMA模型來(lái)預(yù)測(cè)上證指數(shù),由于ARMA模型用于處理平穩(wěn)序列,針對(duì)上證指數(shù)數(shù)據(jù)具有非線性、非平穩(wěn)性的特點(diǎn),需要先對(duì)其進(jìn)行平穩(wěn)化處理。對(duì)數(shù)據(jù)進(jìn)行平穩(wěn)化處理的方法主要有小波變換和經(jīng)驗(yàn)?zāi)B(tài)分解(EMD)方法。由于EMD在提取趨勢(shì)項(xiàng)上更有優(yōu)勢(shì)[9],因此本文選用EMD對(duì)上證指數(shù)數(shù)據(jù)進(jìn)行平穩(wěn)化。
針對(duì)上證指數(shù)數(shù)據(jù)非線性、非平穩(wěn)性的特點(diǎn),本文采用EMD和ARMA模型的組合方法來(lái)預(yù)測(cè)上證指數(shù)數(shù)據(jù),本文選取網(wǎng)易財(cái)經(jīng)自2014年3月26日至2016年11月26日期間的每日收盤價(jià)上證指數(shù)進(jìn)行建模預(yù)測(cè),首先利用EMD方法分解上證指數(shù)數(shù)據(jù),獲得若干個(gè)分解的子序列,由于這些子序列能體現(xiàn)原始信號(hào)的不同尺度波動(dòng)成分,因此使得分解后的數(shù)據(jù)比原始數(shù)據(jù)更加平穩(wěn),再用ARMA模型對(duì)每個(gè)子序列進(jìn)行建模預(yù)測(cè),最后將所有子序列的預(yù)測(cè)結(jié)果相加就得到了對(duì)原始上證指數(shù)數(shù)據(jù)的預(yù)測(cè)。
1 算法原理
1.1 EMD算法
經(jīng)驗(yàn)?zāi)B(tài)分解[10](Empirical Mode Decomposition,EMD)方法的基本原理是將信號(hào)中不同特征尺度或趨勢(shì)逐級(jí)分解進(jìn)而產(chǎn)生有限個(gè)固有模態(tài)函數(shù)(IMF),分解后的IMF分量體現(xiàn)了原始信號(hào)的不同尺度波動(dòng)成分,因此EMD是一種有效的處理非線性信號(hào)的方法。其分解的具體過(guò)程為。
設(shè)待分解的信號(hào)為,對(duì)其進(jìn)行EMD的具體步驟為:
(1)確定出信號(hào)的所有極大值和極小值。
其中,為隨機(jī)過(guò)程。
ARMA模型的定階也可以通過(guò)AIC準(zhǔn)則來(lái)確定,其原理為:選取不同的p、q對(duì)時(shí)間序列進(jìn)行擬合,計(jì)算出相應(yīng)的AIC值。當(dāng)AIC值達(dá)到最小值的模型就是最佳模型,AIC準(zhǔn)則是衡量統(tǒng)計(jì)模型擬合優(yōu)良性的一種標(biāo)準(zhǔn),它可以用來(lái)權(quán)衡所估計(jì)模型的復(fù)雜度和此模型擬合數(shù)據(jù)的優(yōu)良性。
2 實(shí)例分析與論證
2.1 股票數(shù)據(jù)采樣與處理
為驗(yàn)證本文所提方法的有效性,選取網(wǎng)易財(cái)經(jīng)2014年3月至2016年11月每隔一天測(cè)量的1000個(gè)收盤價(jià)上證指數(shù)進(jìn)行建模預(yù)測(cè)。預(yù)測(cè)的基本過(guò)程為:利用經(jīng)驗(yàn)?zāi)B(tài)分解將原始時(shí)間序列分解為更加平穩(wěn)的子序列,然后利用ARMA模型對(duì)每個(gè)子序列進(jìn)行建模預(yù)測(cè),得到各個(gè)模態(tài)分量的預(yù)測(cè)值,最后再將所有預(yù)測(cè)值加在一起,最終得到對(duì)上證指數(shù)的預(yù)測(cè)結(jié)果,其步驟如下。
(1)首先利用EMD方法將前900個(gè)原始數(shù)據(jù)分解成幾個(gè)不同特征尺度的IMF分量和余項(xiàng)。
(2)利用ARMA模型分別對(duì)前900個(gè)數(shù)據(jù)的IMF分量和余項(xiàng)進(jìn)行建模。
(3)利用ARMA 模型對(duì)每個(gè)IMF分量和余項(xiàng)進(jìn)行預(yù)測(cè),再將所有預(yù)測(cè)結(jié)果相加,獲得對(duì)前900個(gè)股票數(shù)據(jù)的901~1000的股票數(shù)據(jù)的預(yù)測(cè)值。
(4)最后將獲得的901~1000的股票預(yù)測(cè)數(shù)據(jù)與原始數(shù)據(jù)901~1000的股票數(shù)據(jù)進(jìn)行對(duì)比,評(píng)估預(yù)測(cè)誤差。
2.2 EMD分解結(jié)果
首先繪制原始收盤價(jià)上證指數(shù)曲線如圖1(a)所示,對(duì)收盤價(jià)上證指數(shù)的EMD分解效果如圖1(b)所示。
2.3 股票的預(yù)測(cè)結(jié)果
為了驗(yàn)證本文所研究方法的有效性,分別對(duì)選取的股票數(shù)據(jù)利用ARMA模型和EMD-ARMA模型進(jìn)行建模預(yù)測(cè),并將其預(yù)測(cè)結(jié)果與實(shí)際股票數(shù)據(jù)進(jìn)行對(duì)比,兩種預(yù)測(cè)模型的預(yù)測(cè)結(jié)果,如圖2中(a、b)所示。
從圖2中可以看出,采用EMD-ARMA模型的預(yù)測(cè)效果要優(yōu)于采用ARMA模型的預(yù)測(cè)效果,預(yù)測(cè)精度得到了顯著的提高,因?yàn)镋MD能夠?qū)⒃脊善睌?shù)據(jù)分解為更加平穩(wěn)的子序列,能更好地找出股票數(shù)據(jù)的內(nèi)在規(guī)律,使得利用ARMA模型預(yù)測(cè)使能更好地跟蹤實(shí)際的股票預(yù)測(cè)數(shù)據(jù)。
表1列出了兩種預(yù)測(cè)模型的誤差指標(biāo)大小,本文采用平均絕對(duì)百分比誤差(MAPE)、 平均絕對(duì)誤差(MAE)和均方根誤差(RMSE)來(lái)衡量預(yù)測(cè)誤差,則預(yù)測(cè)誤差越小說(shuō)明預(yù)測(cè)精度約好。從中可以看出,采用EMD-ARMA組合方法的誤差指標(biāo)要明顯小于單獨(dú)采用ARMA模型的預(yù)測(cè)誤差指標(biāo),這同樣說(shuō)明了EMD-ARMA模型能明顯提高股票的預(yù)測(cè)精度。
3 結(jié)語(yǔ)
本文研究了采用EMD-ARMA 組合的股票預(yù)測(cè)模型,得到以下結(jié)論:(1)EMD算法能將股票序列中不同特征尺度分解出來(lái),使得分解后的數(shù)據(jù)更加平穩(wěn),規(guī)律性更強(qiáng)。(2)由于EMD對(duì)股票數(shù)據(jù)進(jìn)行平穩(wěn)化處理,極大地便利了利用ARMA模型對(duì)股票數(shù)據(jù)的建模預(yù)測(cè)過(guò)程,因此采用EMD-ARMA模型比ARMA模型的預(yù)測(cè)效果更好。
參考文獻(xiàn)
[1] 張晨希,張燕平,張迎春,等.基于支持向量機(jī)的股票預(yù)測(cè)[J].計(jì)算機(jī)技術(shù)與發(fā)展,2006,16(6).
[2] 王玲.最優(yōu)組合模型在證券市場(chǎng)預(yù)測(cè)中的應(yīng)用研究[J].計(jì)算機(jī)仿真,2012,29(1).
[3] 李強(qiáng).基于支持向量機(jī)的股票預(yù)測(cè)研究[D].山東科技大學(xué), 2013.
[4] 謝國(guó)強(qiáng).基于支持向量回歸機(jī)的股票價(jià)格預(yù)測(cè)[J].計(jì)算機(jī)仿真, 2012(4).
[5] 陳恩石.基于卡爾曼濾波及神經(jīng)網(wǎng)絡(luò)算法對(duì)股價(jià)進(jìn)行預(yù)測(cè)[M].
[6] 王愛平,陶嗣干,王占鳳.BP神經(jīng)網(wǎng)絡(luò)在股票預(yù)測(cè)中的應(yīng)用[J].微型機(jī)與應(yīng)用,2010,29(6).
[7] 鄭睿穎,伍應(yīng)環(huán).神經(jīng)網(wǎng)絡(luò)在股票價(jià)格預(yù)測(cè)中的研究[J].計(jì)算機(jī)仿真,2011,28(10).
[8] 孟坤,李麗.基于ARMA模型預(yù)測(cè)股票價(jià)格的實(shí)證分析[J].河北北方學(xué)院學(xué)報(bào)(自然科學(xué)版),2016,32(5).
[9] 李慧浩,許寶杰,左云波,等.基于小波變換和EMD方法提取趨勢(shì)項(xiàng)對(duì)比研究[J].儀器儀表與分析監(jiān)測(cè),2013(3).
[10] Chen H F,Zhao W X.New Method of Order Estimation for ARMA/ARMAX Processes [J].2010,48(6).
①基金項(xiàng)目:國(guó)家自然科學(xué)基金項(xiàng)目(61671338);國(guó)家級(jí)、省級(jí)大學(xué)生創(chuàng)新創(chuàng)業(yè)訓(xùn)練計(jì)劃項(xiàng)目(20160488048)。
作者簡(jiǎn)介:吳振宇(1982-),男,漢族,河南洛陽(yáng)人,碩士研究生,主要從事股票預(yù)測(cè)分析方面的研究。