亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于CEEMDAN-GRU模型的股票市場(chǎng)指數(shù)預(yù)測(cè)研究

        2021-07-12 02:22:02鄧曉衛(wèi)呂學(xué)斌
        商學(xué)研究 2021年3期
        關(guān)鍵詞:分量模態(tài)神經(jīng)網(wǎng)絡(luò)

        葉 康,鄧曉衛(wèi),呂學(xué)斌

        (南京工業(yè)大學(xué) 數(shù)理科學(xué)學(xué)院,江蘇 南京 211816)

        一、引言

        股票市場(chǎng)指數(shù)是由證券交易所或相關(guān)金融機(jī)構(gòu)編制的反映股票市場(chǎng)走勢(shì)的一類時(shí)間序列數(shù)據(jù)。根據(jù)設(shè)定的目標(biāo)不同,計(jì)算指數(shù)的股票樣本抽取的范圍就不同,從而形成了各種不同的指數(shù),如上證50、滬深300、中證500、工業(yè)指數(shù)、商業(yè)指數(shù)等。這些指數(shù)構(gòu)成了衡量股票市場(chǎng)整體或某行業(yè)股票價(jià)格水平及其變動(dòng)趨勢(shì)的重要指標(biāo),一定程度上也是一個(gè)國(guó)家政治、經(jīng)濟(jì)發(fā)展?fàn)顟B(tài)或一個(gè)行業(yè)發(fā)展?fàn)顟B(tài)的“晴雨表”。各類指數(shù)或從總體或從不同側(cè)面體現(xiàn)了證券市場(chǎng)價(jià)格變化的狀況以及不同行業(yè)的景氣程度,能夠反映市場(chǎng)熱點(diǎn)變化方向,因此,根據(jù)指數(shù)變化狀況來決定投資方向,根據(jù)各類指數(shù)的樣本股票的構(gòu)成來確定權(quán)益投資配置比例,是目前大部分投資者特別是機(jī)構(gòu)投資者的重要投資策略;進(jìn)而,對(duì)證券市場(chǎng)各種指數(shù)走勢(shì)進(jìn)行預(yù)測(cè),對(duì)其未來發(fā)展趨勢(shì)做出預(yù)判,以保證投資決策盡可能規(guī)避風(fēng)險(xiǎn)獲取穩(wěn)定收益,更是個(gè)人和機(jī)構(gòu)投資者十分關(guān)注的核心問題。

        研究股票市場(chǎng)指數(shù)走勢(shì)規(guī)律,對(duì)指數(shù)未來走勢(shì)進(jìn)行預(yù)測(cè),傳統(tǒng)使用的方法是經(jīng)典的時(shí)間序列分析方法,如:自回歸積分移動(dòng)平均(ARIMA)模型、自回歸條件異方差(ARCH)模型、廣義自回歸條件異方差(GARCH)模型等[1-3]。然而,隨著世界政治、經(jīng)濟(jì)形勢(shì)越來越復(fù)雜,各國(guó)經(jīng)濟(jì)之間的相互交融與滲透越來越深入,證券市場(chǎng)受外界干擾、影響的程度就越來越大。具體反映在證券市場(chǎng)的表現(xiàn)就是各類股票指數(shù)走勢(shì)不僅呈現(xiàn)出非線性特征,更呈現(xiàn)出大波動(dòng)、非平穩(wěn)和高噪聲等特征。對(duì)這類復(fù)雜數(shù)據(jù)如果仍然采用傳統(tǒng)方法來建模預(yù)測(cè),難以獲得好的效果。隨著機(jī)器學(xué)習(xí)方法的研究深入,學(xué)者們發(fā)現(xiàn)將機(jī)器學(xué)習(xí)方法引入預(yù)測(cè)模型比原有時(shí)間序列模型預(yù)測(cè)要精準(zhǔn)、有效。于是基于機(jī)器學(xué)習(xí)方法的各種模型被應(yīng)用于證券市場(chǎng)指數(shù)預(yù)測(cè)研究。

        王運(yùn)豪(2019)[4]在原有ARIMA-GARCH模型的基礎(chǔ)上引入了支持向量回歸機(jī)(SVR),通過將由ARIMA-GARCH模型估計(jì)出的GARCH項(xiàng)作為SVR的輸入特征對(duì)指數(shù)進(jìn)行預(yù)測(cè),結(jié)果發(fā)現(xiàn)所提出的新模型的預(yù)測(cè)結(jié)果誤差大大減小。崔文喆等(2019)[5]比較了GARCH模型與BP神經(jīng)網(wǎng)絡(luò)模型在股票價(jià)格預(yù)測(cè)方面的優(yōu)劣,發(fā)現(xiàn)在中期和長(zhǎng)期預(yù)測(cè)中BP神經(jīng)網(wǎng)絡(luò)模型的預(yù)測(cè)效果要優(yōu)于GARCH的預(yù)測(cè)效果。王禹等(2019)[6]提出了一種基于Cart決策樹與Boosting方法結(jié)合的股票預(yù)測(cè)方法,很好地解決了過擬合問題,較單一決策樹模型預(yù)測(cè)均方誤差有所下降。循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)作為時(shí)間序列數(shù)據(jù)預(yù)測(cè)首選的方法常被用于分析預(yù)測(cè)股價(jià)走勢(shì)(王理同等,2019)[7]。但RNN方法存在的最大問題是梯度消失問題,于是經(jīng)過改進(jìn),學(xué)者們引入了長(zhǎng)短期記憶神經(jīng)網(wǎng)絡(luò)(LSTM)模型。彭燕等(2019)[8]將蘋果公司2000—2018年的相關(guān)交易數(shù)據(jù)進(jìn)行差分、小波降噪、歸一化等預(yù)處理后,推送到搭建的不同LSTM層數(shù)與相同層數(shù)下不同隱藏神經(jīng)元個(gè)數(shù)的LSTM網(wǎng)絡(luò)模型中進(jìn)行測(cè)試、比較,找出適宜的LSTM層數(shù)與隱藏神經(jīng)元個(gè)數(shù),發(fā)現(xiàn)二層LSTM模型的預(yù)測(cè)準(zhǔn)確率比單層LSTM提高了30%。周凌寒(2018)[9]在LSTM時(shí)間序列模型的基礎(chǔ)上引入了情感特征作為輸入量進(jìn)行預(yù)測(cè),并且采用卷積神經(jīng)網(wǎng)絡(luò)(CNN)優(yōu)化情感特征的提取,最后使模型的準(zhǔn)確性提升了5.7%。李佳等(2019)[10]將LSTM神經(jīng)網(wǎng)絡(luò)模型用于對(duì)上證指數(shù)和滬深300指數(shù)的預(yù)測(cè),取得了較高的預(yù)測(cè)精度并證明了LSTM模型對(duì)股指預(yù)測(cè)的適用性。然后將LSTM與RNN、CNN、SVR、ARMA等模型的預(yù)測(cè)效果進(jìn)行比較,發(fā)現(xiàn)神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)方法明顯優(yōu)于SVR和ARMA方法,而在神經(jīng)網(wǎng)絡(luò)模型中LSTM對(duì)時(shí)間序列的預(yù)測(cè)效果最好。但LSTM模型存在參數(shù)設(shè)置較多、收斂速度慢等缺陷;另一方面,股票市場(chǎng)受外部多種環(huán)境因素的影響,在股票價(jià)格或指數(shù)走勢(shì)上表現(xiàn)為很強(qiáng)的隨機(jī)性和復(fù)雜的非線性,因此僅用單一的機(jī)器學(xué)習(xí)方法進(jìn)行預(yù)測(cè),其精度提升仍有較大空間。

        美國(guó)NASA的華裔科學(xué)家Huang等(1998)[11]和Wu等(2004)[12]針對(duì)信號(hào)去噪問題提出了一種時(shí)域?yàn)V波算法,稱之為經(jīng)驗(yàn)?zāi)B(tài)分解(Empirical Mode Decomposition,EMD)。它把原始序列分解為有限個(gè)不同頻率的固有模態(tài)函數(shù)(Intrinsic Mode Function ,IMF)和一個(gè)趨勢(shì)項(xiàng)序列,以實(shí)現(xiàn)對(duì)非平穩(wěn)、非線性復(fù)雜信號(hào)數(shù)據(jù)的分解。研究發(fā)現(xiàn),EMD方法在非線性、非平穩(wěn)的時(shí)間序列分析與預(yù)測(cè)應(yīng)用中具有顯著優(yōu)勢(shì)。但EMD存在分解不徹底、模態(tài)混疊以及產(chǎn)生虛假分量等問題。學(xué)者針對(duì)這些問題進(jìn)行改進(jìn),提出了EEMD(集合經(jīng)驗(yàn)?zāi)B(tài)分解)方法以及CEEMDAN(完全集合經(jīng)驗(yàn)?zāi)B(tài)分解)方法[12-13]。基于證券市場(chǎng)指數(shù)走勢(shì)的非線性、非平穩(wěn)特點(diǎn),金融研究工作者嘗試將EMD及其發(fā)展的方法引入證券市場(chǎng)指數(shù)走勢(shì)的預(yù)測(cè)中,通過將復(fù)雜的指數(shù)信息進(jìn)行分解,然后與機(jī)器學(xué)習(xí)方法結(jié)合,對(duì)證券市場(chǎng)指數(shù)進(jìn)行預(yù)測(cè),取得了較好的效果。這方面具有代表性的文獻(xiàn)是:李斌和王正(2012)[14]最早將EMD分解算法應(yīng)用于股指股價(jià)時(shí)間序列分析,建立了EMD結(jié)合神經(jīng)網(wǎng)絡(luò)的分析模型。劉佳褀等(2019)[15]將EEMD與BP神經(jīng)網(wǎng)絡(luò)結(jié)合,對(duì)上證指數(shù)進(jìn)行預(yù)測(cè),發(fā)現(xiàn)EEMD-BP神經(jīng)網(wǎng)絡(luò)模型比單獨(dú)BP神經(jīng)網(wǎng)絡(luò)模型具有更高的預(yù)測(cè)精度。李晨亮(2019)[16]建立基于EEMD-LSTM模型的滬深300指數(shù)預(yù)測(cè)模型,結(jié)果顯示EEMD-LSTM模型對(duì)比EMD-LSTM具有更優(yōu)的預(yù)測(cè)效果。2019年,Jian等(2018)[17]使用CEEMDAN模型對(duì)股價(jià)序列做分解,結(jié)合LSTM模型進(jìn)行預(yù)測(cè),發(fā)現(xiàn)改進(jìn)后的CEEMDAN-LSTM模型的預(yù)測(cè)精度優(yōu)于原先EEMD-LSTM模型。從現(xiàn)有文獻(xiàn)看,目前對(duì)股票市場(chǎng)指數(shù)走勢(shì)擬合預(yù)測(cè)效果較好的模型是CEEMDAN-LSTM模型,但CEEMDAN-LSTM模型存在的主要問題是:在通過CEEMDAN分解后,需要對(duì)多個(gè)序列進(jìn)行LSTM建模預(yù)測(cè),而LSTM模型本身存在設(shè)置參數(shù)較多、收斂速度慢等問題。Bahdamau等(2014)[18]首次提出門控循環(huán)單元(GRU)模型,研究顯示:GRU模型優(yōu)化了LSTM模型結(jié)構(gòu),在訓(xùn)練、學(xué)習(xí)過程中具有較好的預(yù)測(cè)精度且訓(xùn)練效率更高。基于此,本文提出基于CEEMDAN與GRU結(jié)合的股市指數(shù)預(yù)測(cè)模型——CEEMDAN-GRU模型,利用GRU模型對(duì)復(fù)雜數(shù)據(jù)的高效預(yù)測(cè)能力,通過分解、預(yù)測(cè)、合成獲得原數(shù)據(jù)的預(yù)測(cè)值。以滬深300指數(shù)為例,引入正確率、擬合優(yōu)度、均方誤差、平均絕對(duì)誤差等多個(gè)指標(biāo),驗(yàn)證CEEMDAN-GRU模型在指數(shù)預(yù)測(cè)上較之已有的模型具有誤差更小、預(yù)測(cè)精度更高等優(yōu)勢(shì)。

        二、CEEMDAN-GRU預(yù)測(cè)模型的構(gòu)建

        (一)CEEMDAN分解原理

        CEEMDAN分解方法是在EMD方法的基礎(chǔ)上發(fā)展起來的。如前所述,EMD是由美籍華裔科學(xué)家Huang等(1971)[11]和Wu等(2004)[12]針對(duì)信號(hào)去噪問題提出的一種時(shí)域?yàn)V波方法——經(jīng)驗(yàn)?zāi)B(tài)分解法,該方法與傳統(tǒng)的傅里葉分解和小波分解方法具有本質(zhì)的區(qū)別,它不需要在分解前提前設(shè)定基函數(shù),可以很好地適應(yīng)非平穩(wěn)的復(fù)雜數(shù)據(jù)序列。

        設(shè)x(t)為原始復(fù)雜時(shí)序數(shù)據(jù),EMD方法有三個(gè)基本假設(shè):①序列x(t)至少包含一個(gè)極大值與一個(gè)極小值;②相鄰極值點(diǎn)的時(shí)間間隔是時(shí)間尺度的特征;③如果原始序列中不存在極值點(diǎn),但存在拐點(diǎn),可在分解前對(duì)其求微分,然后對(duì)分解結(jié)果進(jìn)行積分得到相應(yīng)的分量。同時(shí),EMD方法還規(guī)定分解出的IMF必須滿足以下兩個(gè)條件:①IMF的極值點(diǎn)的個(gè)數(shù)與零點(diǎn)的數(shù)量相差不能超過1;②IMF局部極大值的包絡(luò)線函數(shù)和IMF函數(shù)局部極小值的包絡(luò)線函數(shù)的和為0。條件①是常見的分析窄帶數(shù)據(jù)的要求,條件②則保證了IMF對(duì)應(yīng)的每個(gè)時(shí)刻的瞬時(shí)頻率都具有一定意義。在基本假設(shè)滿足的前提下,EMD分解過程如下:

        (1)找出x(t)中所有局部極大值和極小值。

        (2)利用三次樣條插值,擬合極大值和極小值形成上下包絡(luò)線,記為u(t)和l(t)。

        (3)計(jì)算上、下包絡(luò)線的均值:

        (1)

        (4)原序列減去均值序列得到新序列h1(t):

        h1(t)=x(t)-m(t)

        (2)

        若新序列h1(t)滿足IMF的兩個(gè)條件,那么它就是所求的第一個(gè)IMF。

        (5)若h1(t)不滿足條件,則把h1(t)作為新的原始序列,重復(fù)上述三個(gè)步驟,直至得到的新序列滿足IMF的條件,最終得到的新序列h1(t)即為IMF,記為:IMF1(t)。

        (6)使用原始序列x(t)減去分解出的IMF序列IMF1(t),計(jì)算殘差序列r1(t):

        r1(t)=x(t)-IMF1(t)

        (3)

        將殘差序列r1(t)作為新的起始序列重復(fù)步驟(1)至(5),繼續(xù)分解產(chǎn)生新的IMF分量IMFk(t),k=2,3,…,n,直至得到的殘差rn(t)為一個(gè)常數(shù)或者單調(diào)函數(shù)。

        最終得到:

        (4)

        其中IMFk(t),k=1,2,…,n的頻率按照從高到低的順序依次輸出,最終的殘差序列rn(t)即為原始序列的趨勢(shì)項(xiàng)。

        經(jīng)驗(yàn)?zāi)B(tài)分解方法在處理原始信號(hào)時(shí),會(huì)產(chǎn)生“模態(tài)混疊”問題,即在一個(gè)固有模態(tài)函數(shù)IMF中,包含差異極大的特征時(shí)間尺度或者相近的特征時(shí)間尺度分布在不同的固有模態(tài)中,這種現(xiàn)象會(huì)極大影響信號(hào)預(yù)測(cè)精度。學(xué)者們針對(duì)“模態(tài)混疊”問題,提出集合經(jīng)驗(yàn)?zāi)B(tài)分解(Ensemble Empirical Mode Decomposition,EEMD),通過加入高斯白噪聲極大地減少了“模態(tài)混疊”的產(chǎn)生。但EEMD分解又會(huì)使各個(gè)模式分量上殘留的噪聲帶來重構(gòu)誤差的問題。為了解決這個(gè)問題,一種具有自適應(yīng)白噪聲的完全集合經(jīng)驗(yàn)?zāi)B(tài)分解方法(Complete Ensemble Empirical Mode Decomposition with Adaptive Noise,記為CEEMDAN)被提出,CEEMDAN的分解過程如下。

        設(shè)x(t)為待分解的原始序列,Ek表示經(jīng)EMD分解后的第k個(gè)固有模態(tài)分量(IMF),εm~N(0,1)為第m次加入的白噪聲。

        首先,對(duì)序列x(t)有限次加入自適應(yīng)的白噪聲序列φ1εm,m=1,2,…,M,其中φ1為自適應(yīng)項(xiàng)。于是產(chǎn)生M個(gè)混合序列:

        xm(t)=x(t)+φ1εm,m=1,2,…,M

        (5)

        對(duì)每個(gè)混合序列進(jìn)行前述(1)至(5)的經(jīng)驗(yàn)?zāi)B(tài)分解并保留第一個(gè)固有模態(tài)分量,然后對(duì)得到的M個(gè)固有模態(tài)分量計(jì)算均值序列得到CEEMDAN分解的第一個(gè)固有模態(tài)分量cIMF1,即:

        (6)

        其次,記CEEMDAN第一次分解后產(chǎn)生的余量序列為r1(t)=x(t)-cIMF1,類似第一步的方法對(duì)混合序列加入高斯白噪聲分量得到r1(t)+φ2E1(εm),m=1,2,…,M,然后對(duì)混合序列進(jìn)行經(jīng)驗(yàn)?zāi)B(tài)分解得到M個(gè)固有模態(tài)分量。此時(shí)再對(duì)得到的固有模態(tài)分量計(jì)算均值序列,則CEEMDAN分解的第二個(gè)固有模態(tài)分量為:

        (7)

        一般地,若已分解得到k-1個(gè)固有模態(tài)分量cIMF1,cIMF2,…,cIMFk-1重復(fù)上面第二步,對(duì)混合余量序列rk-1(t)+φkEk-1(εm),m=1,2,…,M進(jìn)行分解,得到CEEMDAN分解的第k個(gè)固有模態(tài)分量為:

        (8)

        (二)GRU神經(jīng)網(wǎng)絡(luò)模型

        門控循環(huán)單元(GRU)是LSTM模型的一個(gè)變體,但較之LSTM更為精簡(jiǎn)。LSTM(長(zhǎng)短期記憶神經(jīng)網(wǎng)絡(luò))是針對(duì)RNN神經(jīng)網(wǎng)絡(luò)在處理長(zhǎng)期依賴的時(shí)間序列數(shù)據(jù)時(shí)出現(xiàn)的梯度消失問題被提出的。LSTM 的核心概念在于細(xì)胞狀態(tài)以及“門”結(jié)構(gòu)。它是一種特殊的循環(huán)體,通過“門”的設(shè)定來有選擇地決定信息是否影響每個(gè)時(shí)刻的狀態(tài)。LSTM新增的隱藏層c(細(xì)胞狀態(tài)),能夠?qū)⒂杏玫男畔⒁恢眰鬟f下去。LSTM包含的三個(gè)“門”及功能分別是:遺忘門,控制當(dāng)前狀態(tài)中哪些信息被移除;輸入門,控制哪些信息傳遞到當(dāng)前狀態(tài)中;輸出門,控制當(dāng)前狀態(tài)中哪些信息被輸出。GRU神經(jīng)網(wǎng)絡(luò)模型則通過引入更新門取代了LSTM模型中的遺忘門和輸入門的功能,在保證原有預(yù)測(cè)性能的基礎(chǔ)上,降低參數(shù)的設(shè)置個(gè)數(shù),加速收斂,提升了訓(xùn)練效率。GRU模型的結(jié)構(gòu)框架如圖1所示。

        圖1 門控循環(huán)單元結(jié)構(gòu)

        更新門,用于確定上一時(shí)刻隱藏層的輸出ht-1有多少信息保留和添加多少新信息xt,數(shù)學(xué)模型為:

        rt=σ[Wr·(ht-1,xt)+br]

        (9)

        其中σ、Wr、br分別為sigmoid函數(shù)、更新門的權(quán)值向量和更新門的偏置,(a,b)表示將a、b兩個(gè)向量相連?!啊ぁ北硎局瘘c(diǎn)相乘。

        重置門,用來決定忘記多少過去的信息,數(shù)學(xué)模型為:

        zt=σ[Wz·(ht-1,xt)+bz]

        (10)

        其中Wz、bz分別為重置門的權(quán)值向量和重置門的偏置。

        GRU隱藏狀態(tài)的數(shù)學(xué)模型為:

        (11)

        (12)

        其中,式(9)至式(12)中xt、ht為輸入、輸出向量,rt,zt分別表示更新門和重置門的輸出。GRU用更新門和重置門替代LSTM中的遺忘門、輸入門和輸出門,一方面,由GRU模型的設(shè)置方法能保存時(shí)間序列數(shù)據(jù)的重要特征;同時(shí),因?yàn)镚RU少了一個(gè)門函數(shù),因此其參數(shù)會(huì)小于LSTM?;谠撓到y(tǒng)的結(jié)構(gòu)特點(diǎn),在處理復(fù)雜金融時(shí)間序列數(shù)據(jù)時(shí),可以做到更高效且又不降低估計(jì)效率。

        (三)模型構(gòu)建

        將股票指數(shù)數(shù)據(jù)經(jīng)CEEMDAN方法分解為不同頻率的IMF分量和一個(gè)殘差趨勢(shì)項(xiàng),其后將分解后的不同頻率的序列各自導(dǎo)入一個(gè)GRU神經(jīng)網(wǎng)絡(luò)模型提取各個(gè)分量的運(yùn)行特征以獲得更好的單分量預(yù)測(cè)效果,將各分量預(yù)測(cè)值加總,最終獲得指數(shù)預(yù)測(cè)更為精確的預(yù)測(cè)結(jié)果。預(yù)測(cè)步驟如下:

        第一步:通過CEEMADN方法將預(yù)測(cè)指數(shù)分解為幾個(gè)不同頻率的IMF分量和一個(gè)趨勢(shì)項(xiàng)。

        第二步:將分解后的各固有模態(tài)函數(shù)分量和趨勢(shì)項(xiàng)進(jìn)行標(biāo)準(zhǔn)化處理后作為輸入量,導(dǎo)入GRU預(yù)測(cè)模型分別進(jìn)行訓(xùn)練、調(diào)優(yōu)、預(yù)測(cè)、反標(biāo)準(zhǔn)化,得到各個(gè)分量的預(yù)測(cè)值。

        第三步:將各個(gè)IMF預(yù)測(cè)值進(jìn)行加和集成,得到相應(yīng)指數(shù)的預(yù)測(cè)值。

        預(yù)測(cè)邏輯框圖如圖2所示。

        圖2 CEEMDAN-GRU預(yù)測(cè)模型框架圖

        下一單元將以滬深300指數(shù)為例對(duì)本文建立的CEEMDAN-GRU預(yù)測(cè)模型進(jìn)行實(shí)證檢驗(yàn),并對(duì)預(yù)測(cè)結(jié)果的優(yōu)劣從多角度進(jìn)行評(píng)價(jià)。

        三、實(shí)證分析

        (一)數(shù)據(jù)選取及基本分析

        滬深300指數(shù)是以上海和深圳證券市場(chǎng)中300只規(guī)模大、流動(dòng)性好的股票為成分股。它們覆蓋了滬深市場(chǎng)近六成的市值,代表了滬深兩市A股市場(chǎng)的核心優(yōu)質(zhì)資產(chǎn),具有良好的市場(chǎng)代表性?;诖耍疚囊詼?00指數(shù)2013年2月7日至2020年6月30日共1795個(gè)交易日的收盤價(jià)數(shù)據(jù)為樣本,將其分為“訓(xùn)練集”“驗(yàn)證集”和“測(cè)試集”,通過CEEMDAN-GRU模型對(duì)其走勢(shì)進(jìn)行預(yù)測(cè),并對(duì)預(yù)測(cè)結(jié)果進(jìn)行評(píng)價(jià),如圖3所示。數(shù)據(jù)來源于通達(dá)信交易軟件,本文使用基于Python的Keras深度學(xué)習(xí)庫進(jìn)行模型搭建。

        圖3 滬深300指數(shù)

        圖3給出了滬深300指數(shù)該時(shí)間段的走勢(shì)圖,從圖中可以看到滬深300指數(shù)在2013年2月至2020年6月近8年的走勢(shì)中包含了暴漲、暴跌、快速反彈等各種非線性復(fù)雜情形。以此數(shù)據(jù)為樣本,利用CEEMDAN-GRU建模預(yù)測(cè)可以考驗(yàn)?zāi)P偷聂敯粜?,增?qiáng)模型預(yù)測(cè)結(jié)果的說服力。

        (二)CEEMDAN分解與標(biāo)準(zhǔn)化

        首先將滬深300指數(shù)序列通過CEEMDAN分解,得到七個(gè)IMF分量,記為:cIMFk,k=1,2,…,7和趨勢(shì)序列R。分解后的七條cIMFk及趨勢(shì)序列R曲線圖如圖4所示。為便于比較,將滬深300走勢(shì)的縮小圖列于第一個(gè)。

        圖4 CEEMDAN分解

        由于滬深300指數(shù)振幅巨大,為消除不同分量數(shù)據(jù)極差太大對(duì)訓(xùn)練效果的影響,這里,將指數(shù)序列分解完成后,先對(duì)各個(gè)cIMFi分量和趨勢(shì)序列R進(jìn)行標(biāo)準(zhǔn)化處理。本文采用常用的最大最小標(biāo)準(zhǔn)化方法,以cIMFk示例(R標(biāo)準(zhǔn)化過程完全類似),公式如下:

        (13)

        其中min(cIMFk)表示序列cIMFk的最小值,max(cIMFk)表示序列cIMFk的最大值。標(biāo)準(zhǔn)化后,每一個(gè)序列的變化范圍均介于[-1,1]之間。對(duì)標(biāo)準(zhǔn)化后的數(shù)據(jù)進(jìn)行學(xué)習(xí)、模擬及預(yù)測(cè),將得到預(yù)測(cè)值可以通過(13)式反解得到原序列cIMFk的預(yù)測(cè)值。在應(yīng)用GRU神經(jīng)網(wǎng)絡(luò)模型進(jìn)行機(jī)器學(xué)習(xí)過程中,我們?nèi)?795個(gè)樣本中的85%作為訓(xùn)練集和驗(yàn)證集(共1525個(gè)樣本,其中15%為驗(yàn)證集),15%為測(cè)試集(270個(gè)樣本)。

        (三)GRU神經(jīng)網(wǎng)絡(luò)訓(xùn)練與預(yù)測(cè)

        針對(duì)每個(gè)cIMFk(k=1,2,…,7)和趨勢(shì)序列R建立GRU預(yù)測(cè)模型。采用滾動(dòng)時(shí)間窗滾動(dòng)預(yù)測(cè)方式,即以前30日的收盤價(jià)數(shù)據(jù)通過GRU模型預(yù)測(cè)下一日的收盤價(jià)。本文在參考賀毅岳等(2020)[20]搭建雙層GRU神經(jīng)網(wǎng)絡(luò)(第一層128個(gè)神經(jīng)元,第二層64個(gè)神經(jīng)元)的基礎(chǔ)上,在每層GRU后都增加了Dropout層用于防止模型過擬合,失活率設(shè)置為0.2。本文神經(jīng)網(wǎng)絡(luò)全部采用Adam優(yōu)化器,初始學(xué)習(xí)率為0.001,以均方誤差MSE為損失函數(shù),bach_size設(shè)置為6(注:bach_size代表一次帶入訓(xùn)練的樣本大小,它的取值直接影響單次訓(xùn)練耗時(shí)和訓(xùn)練效果,bach_size越大,單次訓(xùn)練時(shí)間越短,但是相應(yīng)的訓(xùn)練效果會(huì)下降)。

        為了簡(jiǎn)化模型設(shè)置,各個(gè)子序列使用相同的GRU神經(jīng)網(wǎng)絡(luò)架構(gòu),并且引入相同的早停機(jī)制(patience=200),即當(dāng)epoch次數(shù)增加200次,loss值卻不再下降時(shí)停止訓(xùn)練,保存當(dāng)前最優(yōu)模型參數(shù)。模型訓(xùn)練學(xué)習(xí)框架如圖5所示。

        圖5 GRU神經(jīng)網(wǎng)絡(luò)模型架構(gòu)

        圖6給出了CEEMDAN-GRU模型對(duì)270個(gè)測(cè)試集各cIMFk(k=1,2,…,7)和趨勢(shì)序列R的預(yù)測(cè)走勢(shì)曲線與真實(shí)曲線圖疊合圖,圖7給出了經(jīng)式(13)加和重構(gòu)后滬深300指數(shù)的預(yù)測(cè)結(jié)果曲線與實(shí)際滬深300指數(shù)走勢(shì)疊合曲線。

        從圖6的預(yù)測(cè)曲線和真實(shí)曲線的疊合圖來看,GRU模型對(duì)分解的高頻模態(tài)函數(shù)cIMF1的擬合效果較差,但隨著分解出的模態(tài)函數(shù)周期變大,GRU模型對(duì)cIMFk(k=2,3,…,7)的擬合效果越來越好。下一節(jié)將定量從多個(gè)維度評(píng)價(jià)CEEMDAN-GRU模型的預(yù)測(cè)效果,并與其他模型預(yù)測(cè)結(jié)果作比較。

        圖6 滬深300指數(shù)測(cè)試集子序列預(yù)測(cè)

        圖7 滬深300指數(shù)測(cè)試集預(yù)測(cè)(CEEMDAN-GRU模型)

        四、預(yù)測(cè)效果評(píng)價(jià)

        本文將從三個(gè)方面來評(píng)價(jià)CEEMDAN-GRU模型對(duì)指數(shù)走勢(shì)的預(yù)測(cè)效果。

        第一,漲跌正確預(yù)測(cè)率評(píng)價(jià)。漲跌正確預(yù)測(cè)率,即統(tǒng)計(jì)一段時(shí)間內(nèi)的實(shí)際漲跌天數(shù)和預(yù)測(cè)漲跌天數(shù)的吻合率,也稱之為勝率。顯然,勝率越高,該模型在實(shí)際應(yīng)用中的功效就越強(qiáng)大。本文以滬深300指數(shù)為例,在時(shí)間跨度為270天的測(cè)試集中,計(jì)數(shù)實(shí)際漲跌天數(shù)并統(tǒng)計(jì)預(yù)測(cè)值同時(shí)間的漲跌方向,結(jié)果顯示漲跌正確的預(yù)測(cè)天數(shù)達(dá)到了224天,準(zhǔn)確率為82.96%①。進(jìn)一步統(tǒng)計(jì)預(yù)測(cè)值和實(shí)際值偏差低于0.5%的天數(shù)為210天,準(zhǔn)確率為77.78%。

        第二,與已有的預(yù)測(cè)方法GRU、LSTM、CEEMDAN-LSTM等模型的預(yù)測(cè)結(jié)果比較。首先,本文用同樣的數(shù)據(jù),分別用GRU、LSTM、CEEMDAN-LSTM等模型對(duì)該數(shù)據(jù)集通過訓(xùn)練、驗(yàn)證和測(cè)試得到各模型相應(yīng)的測(cè)試集預(yù)測(cè)結(jié)果,圖8給出了上述3類模型及本文所建模型的預(yù)測(cè)走勢(shì)曲線與實(shí)際滬深300指數(shù)走勢(shì)曲線的疊合圖;然后,引入擬合優(yōu)度(R2)、均方誤差(MSE)、平均絕對(duì)誤差(MAE)和平均絕對(duì)百分比誤差(MAPE)等作為評(píng)價(jià)指標(biāo),比較GRU、LSTM、CEEMDAN-LSTM等模型預(yù)測(cè)結(jié)果與本文所提模型CEEMDAN-GRU預(yù)測(cè)結(jié)果的優(yōu)劣。MSE、MAE和MAPE評(píng)價(jià)指標(biāo)計(jì)算公式如下:

        各模型預(yù)測(cè)結(jié)果的相關(guān)指標(biāo)計(jì)算結(jié)果由表1給出。從表1可以看出:本文提出的CEEMDAN-GRU模型在對(duì)滬深300指數(shù)的預(yù)測(cè)中其擬合優(yōu)度最高,為95.9%;而預(yù)測(cè)誤差參數(shù)MSE、MAE、MAPE均為最小,說明本文提出的模型在指數(shù)預(yù)測(cè)上,其精度最高、誤差最小。由表1還可看出,采用CEEMDAN方法與機(jī)器學(xué)習(xí)方法疊加后的模型進(jìn)行數(shù)據(jù)預(yù)測(cè),其效果顯著優(yōu)于直接用機(jī)器學(xué)習(xí)方法建模預(yù)測(cè)的效果(GRU,LSTM),這表明時(shí)間序列數(shù)據(jù)的預(yù)測(cè)經(jīng)過CEEMDAN方法分解后再結(jié)合其他方法可以有效提高預(yù)測(cè)的精度,這個(gè)結(jié)論與其他學(xué)者研究的結(jié)論相吻合[16,17,19]。

        表1 不同模型預(yù)測(cè)評(píng)價(jià)指標(biāo)比較表

        圖8 滬深300指數(shù)測(cè)試集與四種預(yù)測(cè)模型擬合曲線圖

        第三,為驗(yàn)證模型的穩(wěn)定性和普適性,本文將CEEMDAN-GRU模型應(yīng)用于上證指數(shù)、中證500、深證成指等指數(shù)進(jìn)行預(yù)測(cè),然后計(jì)算其擬合優(yōu)度和誤差評(píng)價(jià)指標(biāo),各指數(shù)的預(yù)測(cè)評(píng)價(jià)指標(biāo)結(jié)果如表2所示。從表2可以看出:CEEMDAN-GRU模型對(duì)這四類不同指數(shù)預(yù)測(cè)的擬合優(yōu)度都達(dá)到了94%以上。三個(gè)誤差評(píng)價(jià)指標(biāo)MSE、MAE、MAPE,上證指數(shù)和滬深300的結(jié)果較深圳成指和中證500的結(jié)果要小,即預(yù)測(cè)精度要高,這與各類指數(shù)成分股的構(gòu)成差異有關(guān)。上海證券交易所上市公司多由國(guó)有大、中型企業(yè)構(gòu)成,滬深300指數(shù)則是以上海和深圳證券市場(chǎng)中300只規(guī)模大、流動(dòng)性好的股票為成分股;而深圳證券交易所上市公司則側(cè)重于創(chuàng)投和中小企業(yè),中證500則是剔除滬深300指數(shù)成分股,由A股市場(chǎng)中、小市值公司的一批股票作為成分股構(gòu)成。中、小市值股票的波動(dòng)性更大,這使得由CEEMDAN分解出的短周期、高頻數(shù)據(jù)列波動(dòng)更復(fù)雜,導(dǎo)致GRU模型對(duì)這一部分的預(yù)測(cè)的精度降低,從而使整體預(yù)測(cè)誤差增大。但從MAE、MAPE來看均在較低的水平上(MSE的計(jì)算是將誤差平方疊加,放大了誤差結(jié)果),可見CEEMDAN-GRU模型在對(duì)其他不同指數(shù)的預(yù)測(cè)上同樣具有不俗的預(yù)測(cè)效果。

        表2 不同指數(shù)預(yù)測(cè)評(píng)價(jià)指標(biāo)

        五、總結(jié)與展望

        本文通過將CEEMDAN方法與GRU神經(jīng)網(wǎng)絡(luò)模型相結(jié)合建立了CEEMDAN-GRU預(yù)測(cè)模型,并將該模型用于預(yù)測(cè)滬深300指數(shù)的走勢(shì)。預(yù)測(cè)步驟為:(1)利用CEEMDAN模型將指數(shù)序列分解為7個(gè)cIMF和一個(gè)趨勢(shì)項(xiàng)R;(2)對(duì)每個(gè)cIMF及R采用GRU神經(jīng)網(wǎng)絡(luò)模型進(jìn)行預(yù)測(cè);(3)將步驟(2)得到的預(yù)測(cè)結(jié)果進(jìn)行重構(gòu)得到指數(shù)的預(yù)測(cè)結(jié)果。從預(yù)測(cè)勝率和與其他模型的預(yù)測(cè)結(jié)果比較兩個(gè)測(cè)度對(duì)該模型進(jìn)行評(píng)價(jià)。結(jié)果顯示:通過統(tǒng)計(jì)實(shí)際漲跌天數(shù)與同期預(yù)測(cè)的漲跌天數(shù)比較,準(zhǔn)確率達(dá)到82.96%;與其他常用的預(yù)測(cè)模型GRU、LSTM、CEEMDAN-LSTM的預(yù)測(cè)結(jié)果進(jìn)行比較,從擬合優(yōu)度、平均誤差、均方誤差等多方面一致性驗(yàn)證了CEEMDAN-GRU模型的預(yù)測(cè)精度更高。同時(shí),為檢驗(yàn)?zāi)P皖A(yù)測(cè)的穩(wěn)健性和普適性,還對(duì)上證指數(shù)、中證500、深證成指等指數(shù)進(jìn)行建模預(yù)測(cè)(具體過程省略)并計(jì)算了相關(guān)評(píng)價(jià)指標(biāo),結(jié)果顯示本文建立的CEEMDAN-GRU,在對(duì)其他指數(shù)的預(yù)測(cè)中仍然獲得了較高的擬合優(yōu)度,同時(shí)對(duì)大市值股票的預(yù)測(cè)精度要高于小市值股票的預(yù)測(cè)精度。

        就本文提出的預(yù)測(cè)模型還存在進(jìn)一步改進(jìn)的方向:(1)本文采用的GRU神經(jīng)網(wǎng)絡(luò)模型含有兩個(gè)隱藏層,對(duì)其中各層神經(jīng)元的個(gè)數(shù)都是根據(jù)經(jīng)驗(yàn)確定的,后續(xù)可以考慮結(jié)合遺傳算法等方法尋找最優(yōu)的神經(jīng)元個(gè)數(shù)配置。(2)在實(shí)證過程中,由于cIMF1分量頻率高,包含了大量噪聲,本文使用的GRU神經(jīng)網(wǎng)絡(luò)模型對(duì)這一分量數(shù)據(jù)的預(yù)測(cè)效果并不好,這也是最后加總指數(shù)預(yù)測(cè)誤差的主要來源。根據(jù)上述預(yù)測(cè)效果評(píng)價(jià)公式,這里計(jì)算了經(jīng)GRU分解后的7個(gè)IMF分量預(yù)測(cè)結(jié)果的評(píng)價(jià)指標(biāo)(表3),結(jié)果顯示cIMF1的預(yù)測(cè)效果最差,誤差最大,這與圖6顯示的結(jié)果一致。

        表3 子序列預(yù)測(cè)評(píng)價(jià)指標(biāo)

        因此針對(duì)高頻高噪聲序列數(shù)據(jù),尋找更有效的除噪方法和預(yù)測(cè)方法,以進(jìn)一步提高整體預(yù)測(cè)精度是下一步研究的重點(diǎn)。

        注 釋:

        ①此處給出的勝率忽略了交易成本。同時(shí),研究中由于是用歷史已知數(shù)據(jù),因此檢驗(yàn)預(yù)測(cè)正確率用的是滾動(dòng)預(yù)測(cè)法。這是目前評(píng)價(jià)模型預(yù)測(cè)效果的通用方法,即預(yù)測(cè)明天的數(shù)據(jù)時(shí),用的是今天已有的真實(shí)值而不是今天的預(yù)測(cè)值。實(shí)際操作時(shí)就只能在收盤后預(yù)測(cè),第二天實(shí)施買賣操作。那么就會(huì)出現(xiàn)正確預(yù)測(cè)到漲但買不到、正確預(yù)測(cè)到跌但賣不出的尷尬局面。這些問題都有待實(shí)操中進(jìn)一步解決。

        猜你喜歡
        分量模態(tài)神經(jīng)網(wǎng)絡(luò)
        帽子的分量
        神經(jīng)網(wǎng)絡(luò)抑制無線通信干擾探究
        電子制作(2019年19期)2019-11-23 08:42:00
        一物千斤
        智族GQ(2019年9期)2019-10-28 08:16:21
        論《哈姆雷特》中良心的分量
        分量
        基于神經(jīng)網(wǎng)絡(luò)的拉矯機(jī)控制模型建立
        國(guó)內(nèi)多模態(tài)教學(xué)研究回顧與展望
        復(fù)數(shù)神經(jīng)網(wǎng)絡(luò)在基于WiFi的室內(nèi)LBS應(yīng)用
        基于HHT和Prony算法的電力系統(tǒng)低頻振蕩模態(tài)識(shí)別
        基于支持向量機(jī)回歸和RBF神經(jīng)網(wǎng)絡(luò)的PID整定
        丝袜美腿诱惑区在线播放| 国产精品人妻一码二码尿失禁| 亚洲乱亚洲乱妇无码麻豆| 免费人成视频x8x8入口| 亚洲尺码电影av久久| www.亚洲天堂.com| 美女精品国产一区二区三区| 富婆叫鸭一区二区三区| 日本在线观看三级视频| 性感女教师在线免费观看| 天堂中文官网在线| 免费无码黄动漫在线观看| chinesefreexxxx国产麻豆 | 精品+无码+在线观看| 亚洲av无码专区亚洲av伊甸园 | 欧美精品高清在线xxxx| 自拍偷拍一区二区三区四区| 亚洲综合一区二区三区天美传媒| 国产一精品一av一免费爽爽 | 亚洲夜夜骑| 亚洲无码视频一区:| 精品久久一区二区三区av制服| 亚洲国产精品成人精品无码区在线| 国产精品美女久久久久久久久| 国产高级黄区18勿进一区二区| 日韩高清av一区二区| 亚洲精品国产综合久久| 在线一区二区三区国产精品| 久久夜色精品国产噜噜麻豆| 99国产超薄丝袜足j在线观看| 亚洲成a人片在线观看高清| 亚洲偷自拍国综合第一页国模| 玖玖色玖玖草玖玖爱在线精品视频 | 国产三级不卡一区不卡二区在线| 精人妻无码一区二区三区| 99久久久无码国产精品6| 久久久久欧洲AV成人无码国产| 日本岛国大片不卡人妻| 国产日产在线视频一区| 免费a级毛片无码a∨中文字幕下载 | 美艳善良的丝袜高跟美腿|