李佳 黃之豪 陳冬蘭
摘 要:為了改善傳統(tǒng)時(shí)間序列方法無(wú)法在預(yù)測(cè)模型中添加相關(guān)變量等缺點(diǎn),并提高股指預(yù)測(cè)精度,運(yùn)用LSTM神經(jīng)網(wǎng)絡(luò)等深度學(xué)習(xí)方法對(duì)我國(guó)上證指數(shù)及滬深300指數(shù)進(jìn)行預(yù)測(cè)分析,并將預(yù)測(cè)結(jié)果與RNN、CNN、ARMA等模型進(jìn)行比較,然后在模型中加入百度指數(shù)測(cè)試其對(duì)預(yù)測(cè)精度的影響,最后檢驗(yàn)LSTM模型對(duì)訓(xùn)練步長(zhǎng)的敏感性。研究結(jié)果表明,LSTM能夠?qū)崿F(xiàn)對(duì)股指的精準(zhǔn)預(yù)測(cè),其預(yù)測(cè)評(píng)價(jià)指標(biāo)MAE、MAPE、RMSE分別為0.008、0.025、0.011,預(yù)測(cè)誤差低于其它模型,加入百度指數(shù)可進(jìn)一步提升其預(yù)測(cè)能力,但改變LSTM模型訓(xùn)練步長(zhǎng)對(duì)結(jié)果影響不大。因此,LSTM模型在金融經(jīng)濟(jì)預(yù)測(cè)領(lǐng)域有較高的應(yīng)用價(jià)值。
關(guān)鍵詞:深度學(xué)習(xí);LSTM;股指預(yù)測(cè);百度指數(shù)
DOI:10. 11907/rjdk. 191155 開(kāi)放科學(xué)(資源服務(wù))標(biāo)識(shí)碼(OSID):
中圖分類號(hào):TP306文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):1672-7800(2019)009-0017-05
Research on Stock Index Prediction Based on Deep Learning Methods Such as LSTM
LI Jia, HUANG Zhi-hao,CHEN Dong-lan
(Business School, Shanghai University of Science and Technology, Shanghai 200093, China)
Abstract:In order to improve the shortcomings such as impossible to add relevant variables to the prediction model of traditional time series methods and improve the accuracy of stock index prediction, this paper uses the deep learning method (LSTM neural network) to predict and analyze China's Shanghai Composite Index and the Shanghai and Shenzhen 300 Index. The prediction results are compared with RNN, CNN, ARMA and other models. Then, Baidu index is added to the model to test its influence on prediction accuracy. Finally, the sensitivity of LSTM model to train step size is tested. The research results show that LSTM can accurately predict the stock index. The forecasting indicators MAE, MAPE and RMSE are 0.008, 0.025 and 0.011 respectively. The prediction error of LSTM is lower than other models and adding Baidu index data can further improve the forecasting ability. Therefore, the LSTM model has application value in the field of financial economic forecasting.
Key Words: deep learning;LSTM;stock index prediction;Baidu index
0 引言
近年來(lái),我國(guó)股票市場(chǎng)表現(xiàn)不佳,上證指數(shù)大部分時(shí)間都在3 000點(diǎn)以下徘徊,有時(shí)還會(huì)出現(xiàn)較大幅度的下跌。典型例子有: 2018年6月19日,上證指數(shù)收盤(pán)價(jià)從上一交易日的3 021.90點(diǎn)暴跌至2 907.82點(diǎn),上證指數(shù)失守3 000點(diǎn)也即意味著廣大股民、股票基金、基于股票的資產(chǎn)管理計(jì)劃虧損慘重。然而股市似乎有繼續(xù)暴跌的趨勢(shì),在之后的幾個(gè)交易日內(nèi),上證指數(shù)分別跌破了2 900點(diǎn)和2 800點(diǎn)兩個(gè)關(guān)口,截至2018年7月2日,上證指數(shù)的收盤(pán)價(jià)為2 775.56點(diǎn)。股市是經(jīng)濟(jì)的晴雨表,而股票指數(shù)又是股市狀況的量化代表,因此如何精準(zhǔn)預(yù)測(cè)股票指數(shù)成為了如證券市場(chǎng)管理機(jī)構(gòu)、股票投資者等多方利益相關(guān)者致力于解決的難題。
現(xiàn)階段,股指預(yù)測(cè)方法主要分為以下幾類:首先是基于時(shí)間序列模型的股指預(yù)測(cè)方法,如萬(wàn)建強(qiáng)、文洲[1]以及薛勇等[2]使用ARIMA、ARMA、ARCH等方法對(duì)香港股指及股指期貨進(jìn)行預(yù)測(cè),但由于時(shí)間序列預(yù)測(cè)方法的固有限制,存在預(yù)測(cè)精度難以提高、對(duì)預(yù)測(cè)變量要求較高等問(wèn)題。之后,學(xué)者們對(duì)股指預(yù)測(cè)方法的研究開(kāi)始轉(zhuǎn)向機(jī)器學(xué)習(xí)方法,如田翔、鄧飛其[3]使用支持向量機(jī)回歸方法(SVR)對(duì)股指進(jìn)行預(yù)測(cè)研究,解決了非線性時(shí)間序列預(yù)測(cè)相關(guān)問(wèn)題,并提高了模型泛化能力;TAY&CAO[4]使用C-上升支持向量機(jī)對(duì)原有正則化函數(shù)進(jìn)行改進(jìn),得到了更好的預(yù)測(cè)結(jié)果;孫彬、李鐵克[5]則在支持向量機(jī)回歸基礎(chǔ)上進(jìn)行改進(jìn),使用改進(jìn)模型v-SVR對(duì)金融股指進(jìn)行預(yù)測(cè),并證明了其有效性;Wang&Shang[6]、Wang等[7]也將改進(jìn)SVM模型應(yīng)用于證券與股票指數(shù)預(yù)測(cè)中,證明了改進(jìn)支持向量機(jī)模型的有效性。同時(shí),學(xué)者們也關(guān)注了另一種機(jī)器學(xué)習(xí)方法——神經(jīng)網(wǎng)絡(luò),如王光強(qiáng)和周佩玲[8]將神經(jīng)網(wǎng)絡(luò)算法應(yīng)用于道瓊斯股票指數(shù)預(yù)測(cè)中,增強(qiáng)了神經(jīng)網(wǎng)絡(luò)的實(shí)用性;Chen&Dissanayaka[9]使用前饋反向傳播神經(jīng)網(wǎng)絡(luò)(BPNN)對(duì)2012年1月2日~2014年3月20日的股價(jià)數(shù)據(jù)進(jìn)行預(yù)測(cè),從原先的8個(gè)模型中篩選出最優(yōu)模型,并得到預(yù)測(cè)效果與訓(xùn)練輸入、隱層神經(jīng)元個(gè)數(shù)有關(guān)的結(jié)論;鮑新中等[10]、汪勁松和石薇[11]、黃宏運(yùn)等[12]對(duì)BP算法進(jìn)行改進(jìn),解決了神經(jīng)網(wǎng)絡(luò)容易陷入局部最小值,以及收斂速度慢等問(wèn)題。之后,隨著灰色預(yù)測(cè)方法逐步得到推廣,不少學(xué)者開(kāi)始嘗試將灰色預(yù)測(cè)方法應(yīng)用于股指預(yù)測(cè)中,如崔銘元等[13]、張雙[14]將灰色預(yù)測(cè)方法與BP神經(jīng)網(wǎng)絡(luò)相結(jié)合,從而提高了灰色預(yù)測(cè)法的精度。同樣考慮到將不同模型進(jìn)行結(jié)合,以充分利用各種模型優(yōu)勢(shì)的學(xué)者還有陳卓雷和蔣寒迪[15]、吳朝陽(yáng)[16]、史文靜和高巖[17]、嚴(yán)駿宏[18]等,其將傳統(tǒng)時(shí)間序列方法、灰色預(yù)測(cè)法及BP神經(jīng)網(wǎng)絡(luò)進(jìn)行組合,得到了預(yù)測(cè)精度更高的模型。
通過(guò)整理上述文獻(xiàn)可以發(fā)現(xiàn),傳統(tǒng)時(shí)間序列方法不易加入與預(yù)測(cè)指標(biāo)相關(guān)的變量,而支持向量機(jī)與BP神經(jīng)網(wǎng)絡(luò)等算法則在預(yù)測(cè)精度上還有待提高。近年來(lái),深度學(xué)習(xí)方法(Deep Learning,DL)逐漸成為機(jī)器學(xué)習(xí)領(lǐng)域的熱門話題,并在圖像處理、語(yǔ)音識(shí)別、文本識(shí)別、自然語(yǔ)言處理等領(lǐng)域應(yīng)用廣泛,但其在股指預(yù)測(cè)等金融領(lǐng)域的應(yīng)用非常少。本文主要采用深度學(xué)習(xí)方法中十分適用于時(shí)間序列預(yù)測(cè)的長(zhǎng)短期記憶模型(LSTM)對(duì)上證指數(shù)和滬深300指數(shù)進(jìn)行預(yù)測(cè),并將該方法與其它深度學(xué)習(xí)方法如循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)、卷積神經(jīng)網(wǎng)絡(luò)(CNN),以及其它機(jī)器學(xué)習(xí)方法如支持向量回歸(SVR)、BP神經(jīng)網(wǎng)絡(luò)(BP)與ARMA模型等時(shí)間序列模型進(jìn)行比較研究。
1 LSTM神經(jīng)網(wǎng)絡(luò)
由于神經(jīng)網(wǎng)絡(luò)算法從本質(zhì)上來(lái)說(shuō)更容易對(duì)復(fù)雜非線性關(guān)系進(jìn)行擬合,而如股票指數(shù)等金融時(shí)間序列因受多種因素影響呈現(xiàn)出非線性特征,因此將傳統(tǒng)BP神經(jīng)網(wǎng)絡(luò)應(yīng)用于股指預(yù)測(cè)會(huì)提高預(yù)測(cè)精度。但BP神經(jīng)網(wǎng)絡(luò)雖然可以通過(guò)增加神經(jīng)網(wǎng)絡(luò)層數(shù)進(jìn)一步提高預(yù)測(cè)精度,但隨之也會(huì)出現(xiàn)梯度消失等問(wèn)題。傳統(tǒng)BP神經(jīng)網(wǎng)絡(luò)只在神經(jīng)網(wǎng)絡(luò)層與層之間建立了權(quán)連接,RNN神經(jīng)網(wǎng)絡(luò)(Recurrent Neural Networks,RNN)則通過(guò)在神經(jīng)網(wǎng)絡(luò)層的神經(jīng)元間建立權(quán)連接方式,使隱藏層中間結(jié)果可以進(jìn)行循環(huán)利用,從而使網(wǎng)絡(luò)中的信息能夠持久化,因此其相比于其它神經(jīng)網(wǎng)絡(luò)更適合處理序列預(yù)測(cè)問(wèn)題,而傳統(tǒng)RNN由于梯度消失等問(wèn)題,對(duì)長(zhǎng)期依賴問(wèn)題的學(xué)習(xí)能力不足,導(dǎo)致其預(yù)測(cè)能力無(wú)法提升。Hochreiter&Schmidhuber[19]提出的長(zhǎng)短期記憶神經(jīng)網(wǎng)絡(luò)(Long Short-Term Memory,LSTM)則通過(guò)引入“門控單元”,可以解決長(zhǎng)期依賴問(wèn)題,之后Gers等[20]對(duì)LSTM網(wǎng)絡(luò)進(jìn)行了改進(jìn),近年來(lái)Graves等[21]又對(duì)其進(jìn)行了改良與推廣,從而使LSTM網(wǎng)絡(luò)更加有效。長(zhǎng)短期記憶網(wǎng)絡(luò)的門控單元包括輸入門、遺忘門和輸出門。此外,記憶單元(cell)也在LSTM網(wǎng)絡(luò)中發(fā)揮著至關(guān)重要的作用。長(zhǎng)短期記憶網(wǎng)絡(luò)結(jié)構(gòu)如圖1所示。
(1)遺忘門[ft]。遺忘門的激活函數(shù)為sigmoid函數(shù),其決定信息的遺忘。sigmoid函數(shù)值介于0~1之間,當(dāng)函數(shù)值為0時(shí),表示丟棄信息,當(dāng)函數(shù)值為1時(shí),表示完全接受信息,其公式如下:
以上簡(jiǎn)要介紹了LSTM神經(jīng)網(wǎng)絡(luò)將[ht-1]和[xt]逐步轉(zhuǎn)變?yōu)閇ht]的過(guò)程,正是由于LSTM神經(jīng)網(wǎng)絡(luò)對(duì)遺忘門、輸入門、輸出門及記憶單元的巧妙設(shè)置,使得該網(wǎng)絡(luò)能夠保留有用信息,從而一定程度上解決了長(zhǎng)期依賴問(wèn)題。因此,LSTM神經(jīng)網(wǎng)絡(luò)能更有效地對(duì)時(shí)間序列進(jìn)行預(yù)測(cè)。
2 實(shí)證分析
2.1 實(shí)驗(yàn)數(shù)據(jù)來(lái)源及處理
雖然國(guó)際上有許多具有巨大影響力的股票指數(shù)如道瓊斯、納斯達(dá)克、日經(jīng)、恒生等,但由于我國(guó)目前正處于股市動(dòng)蕩期,因此本文選擇我國(guó)股票市場(chǎng)最具有代表性的兩個(gè)股票指數(shù)——上證指數(shù)和滬深300的日收盤(pán)價(jià)進(jìn)行實(shí)證研究。研究樣本的時(shí)間范圍為2014年7月1日~2018年7月2日,兩種指數(shù)分別有978個(gè)觀測(cè)值,兩個(gè)股票指數(shù)的收盤(pán)價(jià)時(shí)間序列來(lái)自網(wǎng)易財(cái)經(jīng)數(shù)據(jù)庫(kù)。同時(shí)作為創(chuàng)新,本文也想探究互聯(lián)網(wǎng)搜索行為數(shù)據(jù)作為一種大數(shù)據(jù)時(shí)代的特有數(shù)據(jù),能否增強(qiáng)模型預(yù)測(cè)能力。我國(guó)互聯(lián)網(wǎng)搜索行為一般以百度指數(shù)數(shù)據(jù)作為代表,因此本文在進(jìn)行模型預(yù)測(cè)效果對(duì)比后,使用百度指數(shù)作為補(bǔ)充數(shù)據(jù),以驗(yàn)證搜索行為數(shù)據(jù)能否增強(qiáng)預(yù)測(cè)能力。百度指數(shù)將關(guān)鍵詞搜索行為按次數(shù)記錄成日度數(shù)據(jù),百度指數(shù)提供的數(shù)據(jù)分為PC趨勢(shì)與移動(dòng)趨勢(shì),本文使用兩種趨勢(shì)的求和數(shù)據(jù)作為具有代表性的在線大數(shù)據(jù),搜索關(guān)鍵詞選擇與股票指數(shù)密切相關(guān)的證券、股票等,具體數(shù)據(jù)來(lái)源于百度指數(shù)官方網(wǎng)站(https://index.baidu.com/)。
在數(shù)據(jù)輸入到神經(jīng)網(wǎng)絡(luò)模型之前,需要對(duì)數(shù)據(jù)進(jìn)行歸一化處理,從而避免數(shù)據(jù)對(duì)度量單位選擇的依賴,并且有助于提高模型性能。本文采用最大—最小歸一化方法將數(shù)據(jù)壓縮到[0,1]區(qū)間,經(jīng)過(guò)歸一化后的數(shù)據(jù)有利于進(jìn)行模型訓(xùn)練,如公式(7)所示。
2.2 模型性能評(píng)價(jià)與結(jié)果比較
為了使長(zhǎng)短期記憶網(wǎng)絡(luò)能與其它模型進(jìn)行比較,本文選擇平均絕對(duì)誤差(MAE)、平均誤差百分比(MAPE)、均方根誤差(RMSE)作為統(tǒng)一、客觀的評(píng)價(jià)標(biāo)準(zhǔn),相關(guān)評(píng)價(jià)指標(biāo)定義如下:
本文通過(guò)python中的神經(jīng)網(wǎng)絡(luò)構(gòu)建框架keras構(gòu)建2層LSTM網(wǎng)絡(luò)(第1層128個(gè)神經(jīng)元,第2層64個(gè)神經(jīng)元,其中,每層激活函數(shù)使用relu函數(shù)緩解梯度消失問(wèn)題)進(jìn)行股票指數(shù)預(yù)測(cè)研究,選擇的訓(xùn)練步長(zhǎng)為7,即將所有數(shù)據(jù)進(jìn)行劃分,用過(guò)去7個(gè)交易日數(shù)據(jù)作為特征,而將當(dāng)前交易日數(shù)據(jù)作為標(biāo)簽。將數(shù)據(jù)按上述方式確定數(shù)據(jù)特征及標(biāo)簽后,本文將所有樣本數(shù)據(jù)按9∶1的比例劃分,最后10%的數(shù)據(jù)作為測(cè)試集,即將978個(gè)觀測(cè)值中的最后98個(gè)數(shù)據(jù)作為測(cè)試集,而在前90%的數(shù)據(jù)中,再取其中的10%作為驗(yàn)證集,用來(lái)調(diào)整模型超參數(shù)以及檢驗(yàn)?zāi)P褪欠窬哂羞^(guò)擬合現(xiàn)象。上證指數(shù)與滬深300預(yù)測(cè)結(jié)果分別如圖2、圖3所示。
其中,訓(xùn)練擬合值是通過(guò)訓(xùn)練集訓(xùn)練得到LSTM模型后在訓(xùn)練集上的擬合值,測(cè)試預(yù)測(cè)值是通過(guò)訓(xùn)練集得到LSTM模型后在測(cè)試集上的表現(xiàn)。從圖中可以看出,LSTM模型在預(yù)測(cè)上證指數(shù)和滬深300方面表現(xiàn)優(yōu)異,除部分最高峰與最低峰外,幾乎與真實(shí)值完全擬合。為了能更清晰地看出長(zhǎng)短期網(wǎng)絡(luò)在測(cè)試集上的效果,可在測(cè)試集上單獨(dú)進(jìn)行可視化作圖后再進(jìn)行分析,上證指數(shù)預(yù)測(cè)效果如圖4所示。通過(guò)圖4可直觀地看出,LSTM神經(jīng)網(wǎng)絡(luò)在測(cè)試集上有著不錯(cuò)的表現(xiàn)。本文所有評(píng)價(jià)指標(biāo)數(shù)據(jù)由測(cè)試集測(cè)試結(jié)果得到,并且神經(jīng)網(wǎng)絡(luò)模型迭代次數(shù)都為200次。從模型評(píng)價(jià)指標(biāo)上看,LSTM模型對(duì)滬深300的預(yù)測(cè)不如對(duì)上證指數(shù)的預(yù)測(cè)精準(zhǔn),兩者評(píng)價(jià)指標(biāo)MAE、MAPE、RMSE分別為:0.011、0.022、0.015和0.008、0.025、0.011,但即便預(yù)測(cè)精度稍差的滬深300指數(shù)也達(dá)到了較高的預(yù)測(cè)精度。在此使用滬深300指數(shù)是為了說(shuō)明LSTM模型對(duì)所有股指預(yù)測(cè)的適用性,后文都使用上證指數(shù)作為股票指數(shù)代表進(jìn)行預(yù)測(cè)分析。
以上僅從單個(gè)模型角度對(duì)預(yù)測(cè)效果進(jìn)行分析,為了檢驗(yàn)LSTM模型是否如理論上所言的能實(shí)現(xiàn)更有效的預(yù)測(cè),本部分選取包括循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)、卷積神經(jīng)網(wǎng)絡(luò)(CNN)、BP神經(jīng)網(wǎng)絡(luò)、支持向量回歸(SVR)、ARMA模型等較為典型的深度學(xué)習(xí)、神經(jīng)網(wǎng)絡(luò)、機(jī)器學(xué)習(xí)及時(shí)間序列模型作對(duì)比分析,其中RNN同樣使用兩層神經(jīng)網(wǎng)絡(luò),每層神經(jīng)元個(gè)數(shù)和激活函數(shù)與長(zhǎng)短期記憶網(wǎng)絡(luò)相同,CNN使用兩個(gè)一維卷積層網(wǎng)絡(luò),BP神經(jīng)網(wǎng)絡(luò)使用3層網(wǎng)絡(luò)進(jìn)行構(gòu)建(第1層有128個(gè)神經(jīng)元,第2層有64個(gè)神經(jīng)元,第3層有32個(gè)神經(jīng)元),SVR參數(shù)為懲罰參數(shù)C=4,核函數(shù)為RBF核函數(shù),ARMA根據(jù)AIC準(zhǔn)則得到ARMA(2,4),比較結(jié)果如表1所示。
通過(guò)表1可以看出,LSTM模型作為對(duì)RNN神經(jīng)網(wǎng)絡(luò)的改進(jìn),其相比于RNN神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)精度更高;從評(píng)價(jià)指標(biāo)來(lái)看,由于RNN考慮了時(shí)間序列先后關(guān)系,因此在預(yù)測(cè)效果上略優(yōu)于BP神經(jīng)網(wǎng)絡(luò);傳統(tǒng)時(shí)間序列模型如ARMA模型,以及普通機(jī)器學(xué)習(xí)方法如SVR模型等,在預(yù)測(cè)時(shí)間序列精度上相比神經(jīng)網(wǎng)絡(luò)方法則略顯不足。由于股票指數(shù)的復(fù)雜非線性等特征,也使得時(shí)間序列模型預(yù)測(cè)方法表現(xiàn)最差。
本文除提出使用深度學(xué)習(xí)方法預(yù)測(cè)股票指數(shù)外,還將探究互聯(lián)網(wǎng)搜索行為數(shù)據(jù)是否能夠提高預(yù)測(cè)精度,因此選取一些百度指數(shù)數(shù)據(jù)作為補(bǔ)充數(shù)據(jù)加入LSTM模型。百度指數(shù)數(shù)據(jù)加入前后預(yù)測(cè)精度對(duì)比如表2所示。
通過(guò)表2數(shù)據(jù)可知,加入證券、股票等百度指數(shù)雖然對(duì)LSTM模型預(yù)測(cè)精度的提高并不顯著(MAE評(píng)價(jià)指標(biāo)在小數(shù)點(diǎn)后第5位上顯示出加入百度指數(shù)后預(yù)測(cè)精度更高),但仍在一定程度上有助于模型對(duì)上證指數(shù)的預(yù)測(cè)。百度指數(shù)對(duì)預(yù)測(cè)性能提高幅度小的一個(gè)可能原因是百度指數(shù)數(shù)據(jù)大多為非結(jié)構(gòu)化數(shù)據(jù),使用互聯(lián)網(wǎng)搜索“股票”能突出人們對(duì)股票的關(guān)注度上升,而這種關(guān)注度可能來(lái)自于恐慌下跌,也可能來(lái)自于持續(xù)牛市。
2.3 LSTM模型預(yù)測(cè)步長(zhǎng)研究
本部分旨在研究LSTM模型在改變模型超參數(shù)——預(yù)測(cè)步長(zhǎng)時(shí),模型預(yù)測(cè)性能的變化。之前研究都統(tǒng)一將預(yù)測(cè)步長(zhǎng)設(shè)置為7,即用過(guò)去7個(gè)交易日數(shù)據(jù)進(jìn)行預(yù)測(cè),因此本文選擇不同的預(yù)測(cè)步長(zhǎng):過(guò)去1個(gè)交易日、3個(gè)交易日、5個(gè)交易日、10個(gè)交易日、20個(gè)交易日及50個(gè)交易日進(jìn)行比較研究,在探索LSTM神經(jīng)網(wǎng)絡(luò)是否對(duì)預(yù)測(cè)步長(zhǎng)敏感的同時(shí),也希望尋找最精準(zhǔn)的預(yù)測(cè)步長(zhǎng),從而為今后的實(shí)踐研究提供思路。通過(guò)選擇1個(gè)交易日、3個(gè)交易日、5個(gè)交易日、10個(gè)交易日的訓(xùn)練步長(zhǎng),可研究如股票指數(shù)等高頻數(shù)據(jù)對(duì)短步長(zhǎng)的敏感性,選擇20個(gè)交易日及50個(gè)交易日,可探索LSTM模型對(duì)相對(duì)較長(zhǎng)步長(zhǎng)的敏感性,結(jié)果如表3所示。
通過(guò)表3可以直觀地看出,預(yù)測(cè)步長(zhǎng)的改變對(duì)LSTM神經(jīng)網(wǎng)絡(luò)的影響極小,從而體現(xiàn)出LSTM模型訓(xùn)練的穩(wěn)定性。另外當(dāng)預(yù)測(cè)步長(zhǎng)為10個(gè)交易日時(shí),LSTM模型對(duì)上證指數(shù)的預(yù)測(cè)相對(duì)最為準(zhǔn)確。但通過(guò)研究發(fā)現(xiàn),其余比較模型在改變訓(xùn)練步長(zhǎng)時(shí),不但預(yù)測(cè)能力依舊不如LSTM模型,而且還會(huì)出現(xiàn)無(wú)法訓(xùn)練或訓(xùn)練敏感性很強(qiáng)等問(wèn)題。
3 結(jié)論與啟示
本文將深度學(xué)習(xí)方法運(yùn)用于我國(guó)股票指數(shù)預(yù)測(cè),可以看出LSTM神經(jīng)網(wǎng)絡(luò)既繼承了RNN神經(jīng)網(wǎng)絡(luò)適合處理序列問(wèn)題的特點(diǎn),又進(jìn)一步解決了長(zhǎng)期依賴問(wèn)題,同時(shí)對(duì)時(shí)間序列數(shù)據(jù)進(jìn)行預(yù)測(cè)時(shí)能夠得到高精度的預(yù)測(cè)結(jié)果,其預(yù)測(cè)效果優(yōu)于RNN、CNN、BP神經(jīng)網(wǎng)絡(luò)、支持向量回歸、ARMA等模型。通過(guò)將百度指數(shù)加入模型后的預(yù)測(cè)結(jié)果可以看出,互聯(lián)網(wǎng)數(shù)據(jù)可以小幅提高LSTM神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)效果,而通過(guò)對(duì)LSTM神經(jīng)網(wǎng)絡(luò)的訓(xùn)練步長(zhǎng)參數(shù)作出調(diào)整,觀測(cè)不同訓(xùn)練步長(zhǎng)下LSTM神經(jīng)網(wǎng)絡(luò)的表現(xiàn),可以發(fā)現(xiàn)LSTM神經(jīng)網(wǎng)絡(luò)對(duì)訓(xùn)練步長(zhǎng)并不敏感??梢?jiàn),LSTM在金融經(jīng)濟(jì)預(yù)測(cè)領(lǐng)域有良好的應(yīng)用前景,未來(lái)可研究如何將LSTM網(wǎng)絡(luò)與其它模型相結(jié)合形成集成模型,以進(jìn)一步提高預(yù)測(cè)精度。
參考文獻(xiàn):
[1] 萬(wàn)建強(qiáng),文洲. ARIMA模型與ARCH模型在香港股指預(yù)測(cè)方面的應(yīng)用比較[J]. 數(shù)理統(tǒng)計(jì)與管理, 2001, 20(6):1-4.
[2] 薛勇,郭菊娥,梁偉. 股指期貨預(yù)測(cè)模型構(gòu)建及其應(yīng)用效果分析[J]. 統(tǒng)計(jì)與決策,2009(13):19-22.
[3] 田翔,鄧飛其. 精確在線支持向量回歸在股指預(yù)測(cè)中的應(yīng)用[J].計(jì)算機(jī)工程,2005,31(22):18-20.
[4] TAY F E H,CAO L J. Modified support vector machines in financial time series forecasting[J]. Neurocomputing, 2002,48:847-861.
[5] 孫彬,李鐵克. 基于v-SVR的金融股指預(yù)測(cè)及選時(shí)策略研究[J]. 統(tǒng)計(jì)與決策,2010, 30(3):45-48.
[6] WANG S,SHANG W. Forecasting direction of China security index 300 movement with least squares support vector machine[J]. Procedia Computer Science, 2014, 31:869-874.
[7] WANG J, HOU R, WANG C, et al. Improved-support vector regression model based on variable selection and brain storm optimization for stock price forecasting[J]. Applied Soft Computing, 2016, 49:164-178.
[8] 王光強(qiáng),周佩玲. 神經(jīng)網(wǎng)絡(luò)算法在股指預(yù)測(cè)中的應(yīng)用[J]. 計(jì)算機(jī)工程,2006,32(1):211-212.
[9] CHEN D L,DISSANAYAKA M K N. Using feed forward BPNN for forecasting all share price index[J]. Journal of Data Analysis and Information Processing, 2014,2(4):87-94.
[10] 鮑新中,劉澄,孫彬. LM-BP算法在金融股指預(yù)測(cè)中的參數(shù)設(shè)定[J]. 系統(tǒng)管理學(xué)報(bào),2009,18(6):667-671.
[11] 汪勁松,石薇. 多種群遺傳神經(jīng)網(wǎng)絡(luò)在股指預(yù)測(cè)中的應(yīng)用[J].統(tǒng)計(jì)與決策,2014(14):76-79.
[12] 黃宏運(yùn),朱家明,李詩(shī)爭(zhēng). 基于遺傳算法優(yōu)化的BP神經(jīng)網(wǎng)絡(luò)在股指預(yù)測(cè)中的應(yīng)用研究[J]. 云南大學(xué)學(xué)報(bào):自然科學(xué)版,2017(3):350-355.
[13] 崔銘元,楊成,溫尚敏. 基于灰色神經(jīng)網(wǎng)絡(luò)的宏觀經(jīng)濟(jì)因素修正股指預(yù)測(cè)模型[J].軟件,2012,33(9):85-87.
[14] 張雙. 基于遺傳算法的灰色神經(jīng)網(wǎng)絡(luò)的預(yù)測(cè)[J].統(tǒng)計(jì)與決策, 2014(17):79-81.
[15] 陳卓雷,蔣寒迪. 基于GARCH-BP模型的股指預(yù)測(cè)及實(shí)證分析[J]. 當(dāng)代財(cái)經(jīng),2006(6):41-44.
[16] 吳朝陽(yáng). 小波變換和GM—ARMA組合模型的股指預(yù)測(cè)[J]. 智能系統(tǒng)學(xué)報(bào),2011,6(3):279-282.
[17] 史文靜,高巖. EMD 結(jié)合 RBF 神經(jīng)網(wǎng)絡(luò)新混合模型及股指期貨價(jià)格預(yù)測(cè)[J]. 經(jīng)濟(jì)數(shù)學(xué),2015(1):47-51.
[18] 嚴(yán)駿宏. 基于離散小波分解和支持向量機(jī)的股指組合預(yù)測(cè)[J]. 統(tǒng)計(jì)與決策,2017(3):170-173.
[19] HOCHREITER S,SCHMIDHUBER J. Long short-term memory[J]. Neural Computation,1997,9(8):1735-1780.
[20] GERS F A,SCHMIDHUBER J,CUMMINS F. Learning to forget: continual prediction with LSTM[J]. Neural Computation, 2000, 12(10):2451-2471.
[21] GRAVES A,MOHAMED A R,HINTON G. Speech recognition with deep recurrent neural networks[C]. International Conference on Acoustics, Speech and Signal Processing,2013.
(責(zé)任編輯:黃 健)