摘要:為了提高股票價(jià)指數(shù)預(yù)測的準(zhǔn)確性、增強(qiáng)統(tǒng)計(jì)建模性能優(yōu)化與股票指數(shù)特征相依的交易策略效果,提出一種將指數(shù)預(yù)測與量化交易策略有效結(jié)合的門控循環(huán)單元深度進(jìn)化量化模型(GRU-DES)。首先,建立循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)、長短時(shí)記憶神經(jīng)網(wǎng)絡(luò)(LSTM)和門控循環(huán)單元網(wǎng)絡(luò)(GRU)預(yù)測模型, 分別對上海證券交易所(上證)超大盤股票指數(shù)、上證中盤股票指數(shù)和上證小盤股票指數(shù)進(jìn)行預(yù)測; 接著采用所提出的深度進(jìn)化量化模型(DES)對三大股票指數(shù)的預(yù)測值與真實(shí)值進(jìn)行回測研究, 通過比較預(yù)測結(jié)果與真實(shí)結(jié)果在同一策略下的各項(xiàng)回測指標(biāo)和交易細(xì)節(jié)等特性確定最優(yōu)網(wǎng)絡(luò)結(jié)構(gòu)和策略參數(shù),進(jìn)而優(yōu)化深度進(jìn)化策略; 最后根據(jù)優(yōu)化后的策略提出了GRU-DES模型,并再次對三大股票指數(shù)進(jìn)行樣本外數(shù)據(jù)回測來驗(yàn)證模型有效性。實(shí)證回測結(jié)果表明: 所提出的GRU-DES模型在各量化回測指標(biāo)上較LSTM-DES模型與RNN-DES模型的預(yù)測精度均高出14%以上, 有效解決了統(tǒng)計(jì)預(yù)測指標(biāo)的隨機(jī)性和過擬合的問題; 根據(jù)2016年至2024年7年間數(shù)據(jù)回測, 所提出的GRU-DES模型比強(qiáng)化學(xué)習(xí)模型在各回測指標(biāo)中均展現(xiàn)了穩(wěn)定性和有效性。
關(guān)鍵詞:股票指數(shù);量化模型;長短時(shí)記憶神經(jīng)網(wǎng)絡(luò);門控循環(huán)單元;收益率
中圖分類號:TP181 文獻(xiàn)標(biāo)志碼:A
DOI:10.7652/xjtuxb202502015 文章編號:0253-987X(2025)02-0146-10
Quantitative Model for Stock Indexes Based on Gated Recurrent Unit and Deep Evolution Strategy
REN Xiaoping1,2, CHEN Zhiping1
(1. School of Mathematics and Statistics, Xi’an Jiaotong University, Xi’an, 710049, China;
2. School of Mathematics and Statistics, Northeast Petroleum University, Daqing, Heilongjiang 163318, China)
Abstract:To improve the prediction accuracy of stock price indexes and enhance the performance of statistical modeling and the design of quantitative trading strategy based on the characteristics of indexes, a quantitative model was proposed, which was based on gated recurrent unit and deep evolution strategy (GRU-DES) and effectively integrated index prediction with quantitative trading strategies. Firstly, RNN, LSTM, and GRU neural network predictive models were established to forecast the SSE mega cap, SSE mid cap and SSE small cap indexes, respectively. Next, the proposed DES model was employed to backtest the predicted values and true values of the three indexes. By comprehensively comparing the backtesting metrics and trading details of the predicted results with the true results under the same strategy, after determining the network structure and strategy parameters, the DES was optimized. Finally, the GRU-DES model was developed on basis of the optimized strategy, and the model effectiveness was verified through out-of-sample backtesting of these indexes again. The results show that the proposed GRU-DES model was 14% higher than the LSTM-DES model and RNN-DES model in backtesting metrics, effectively avoiding the randomness and overfitting problems of statistical prediction indexes. According to the backtesting results over 7 years from 2016 to 2024, the proposed GRU-DES model sufficiently demonstrates the stability and effectiveness in all backtesting metrics compared to reinforcement learning model.
Keywords:stock index; quantitative model; long short term memory; gated recurrent unit; returns
近年來,研究人員不斷從量化策略和算法交易方面對量化投資進(jìn)行優(yōu)化,在資本市場風(fēng)險(xiǎn)增加、股票指數(shù)波動(dòng)劇烈的背景下,急需將機(jī)器學(xué)習(xí)算法與深度學(xué)習(xí)算法應(yīng)用到量化投資體系中。用混合方法生成交易信號也是近兩年投資機(jī)構(gòu)與量化學(xué)者研究的重點(diǎn),如Ayala等[1]結(jié)合機(jī)器學(xué)習(xí)算法與傳統(tǒng)技術(shù)指標(biāo),分別測試了線性模型(LM)、人工神經(jīng)網(wǎng)絡(luò)(ANN)、隨機(jī)森林(RF)和支持向量機(jī)回歸算法(SVR)的性能,但交易策略上缺乏創(chuàng)新性。
近年來,不少學(xué)者結(jié)合機(jī)器學(xué)習(xí)和深度學(xué)習(xí)算法對個(gè)股價(jià)格進(jìn)行預(yù)測,Wang等[2]構(gòu)建了多元線性回歸模型、最小絕對收縮和選擇算子、SVR算法、ANN網(wǎng)絡(luò)、循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)、長短時(shí)記憶神經(jīng)網(wǎng)絡(luò)(long short term memory,LSTM)、門控循環(huán)單元網(wǎng)絡(luò)(gated recurrent unit,GRU)和雙向門控循環(huán)單元網(wǎng)絡(luò)(bidirectional GRU,Bi GRU)8個(gè)單項(xiàng)模型,雖然實(shí)驗(yàn)數(shù)據(jù)充足,但模型性能評價(jià)標(biāo)準(zhǔn)仍是傳統(tǒng)統(tǒng)計(jì)計(jì)算標(biāo)準(zhǔn)。Peng等[3]采用LSTM網(wǎng)絡(luò)和Transformer模型對中國A股市場的銀行股價(jià)進(jìn)行預(yù)測,使用集成經(jīng)驗(yàn)?zāi)B(tài)分解方法對股票指數(shù)降噪后進(jìn)行預(yù)測,降噪與預(yù)測相結(jié)合的研究方法可能會(huì)造成預(yù)測信息的缺失。Lind等[4]基于股票交易策略,對比分析了LSTM網(wǎng)絡(luò)和GRU網(wǎng)絡(luò)的優(yōu)劣性。Sang等[5]結(jié)合了傳統(tǒng)技術(shù)指標(biāo)、簡單移動(dòng)平均指標(biāo)(SMA)、相對強(qiáng)弱指標(biāo)(RSI)與LSTM網(wǎng)絡(luò),通過實(shí)證表明技術(shù)指標(biāo)相結(jié)合比單獨(dú)使用可得到更好的預(yù)測效果。 Kanwal等[6]提出了一種基于混合深度學(xué)習(xí)(DL)的預(yù)測模型,該模型結(jié)合了雙向Cuda深度神經(jīng)網(wǎng)絡(luò)長短期記憶(Bi-Cu DNN-LSTM)和一維卷積神經(jīng)網(wǎng)絡(luò)(CNN),用于及時(shí)有效地預(yù)測股價(jià),但模型沒有經(jīng)過樣本外數(shù)據(jù)驗(yàn)證。 Lv等[7]將股票指數(shù)分解為一系列從高頻到低頻排列的本征模態(tài)函數(shù)(IMF),將其輸入深度自動(dòng)編碼器(DAE)去除冗余數(shù)據(jù)并提取深層特征,最后將高層抽象特征輸入LSTM網(wǎng)絡(luò),以預(yù)測下一個(gè)交易日的股票回報(bào)率。于孝建等[8]使用LSTM網(wǎng)絡(luò)對股票歷史數(shù)據(jù)進(jìn)行建模,同時(shí)從社交媒體、個(gè)股評論等文本數(shù)據(jù)中提取情感特征共同搭建股票預(yù)測模型;該模型可以對金融市場發(fā)生風(fēng)險(xiǎn)給出預(yù)警,但沒有提出金融風(fēng)險(xiǎn)的應(yīng)對策略。Liu等 [9]提出了一個(gè)用于日內(nèi)股市預(yù)測的包含CEEMDAN、Entropy和帶歷史注意力的門循環(huán)單元網(wǎng)絡(luò)(GRU-HA)的四階段混合(CEGH)模型。文獻(xiàn)[3,7,9]將股票交易數(shù)據(jù)去噪后進(jìn)行預(yù)測,而預(yù)測準(zhǔn)確度的提升主要是依靠因去噪而平滑的交易數(shù)據(jù),并沒有在預(yù)測算法上進(jìn)行創(chuàng)新。以上研究只依靠統(tǒng)計(jì)指標(biāo)評估股票價(jià)格預(yù)測的精度,沒有從量化交易的角度來驗(yàn)證預(yù)測的準(zhǔn)確性。
另外,也有很多研究人員致力于利用新型神經(jīng)網(wǎng)絡(luò)進(jìn)行金融資產(chǎn)定價(jià)。周章元等[10]結(jié)合主成分分析法和注意力機(jī)制優(yōu)化LSTM網(wǎng)絡(luò),對消費(fèi)行業(yè)板塊指數(shù)進(jìn)行預(yù)測,文中只闡明了策略的有效性,并沒有探討模型預(yù)測效果的優(yōu)劣。Bińkowski等[11]提出顯著性偏移卷積神經(jīng)網(wǎng)絡(luò)(significance-offset convolutional neural network, SOCNN)和RNN網(wǎng)絡(luò)的混合應(yīng)用,Luo等[12]提出一種基于多循環(huán)CNN-GRU網(wǎng)絡(luò)和注意力機(jī)制的甲醇價(jià)格預(yù)測方法;在模型構(gòu)建中,設(shè)計(jì)了一種并行混合網(wǎng)絡(luò)架構(gòu),模型框架上有一定的創(chuàng)新,但預(yù)測精度沒有明顯提升。Nourbakhsh等[13]將CNN網(wǎng)絡(luò)和LSTM網(wǎng)絡(luò)結(jié)合,并利用市盈率、盈利能力和公司交易次數(shù)等基本面數(shù)據(jù),提升股價(jià)趨勢預(yù)測性能,但多網(wǎng)絡(luò)結(jié)合在股票價(jià)格的預(yù)測上只有框架結(jié)構(gòu)的創(chuàng)新,對不同時(shí)期的交易數(shù)據(jù)預(yù)測效果缺乏魯棒性。
針對現(xiàn)有文獻(xiàn)方法的不足,本文提出新的應(yīng)對方案:① 簡化對股票指數(shù)預(yù)測的過程,選用預(yù)測較好的算法分別進(jìn)行預(yù)測對比; ② 交易策略不選用傳統(tǒng)的交易策略,而是采用加入具有網(wǎng)絡(luò)結(jié)構(gòu)的實(shí)時(shí)交易策略,即本文使用的深度進(jìn)化策略(deep evolution strategy, DES);③從交易的角度來驗(yàn)證預(yù)測的有效性,為預(yù)測與量化投資有效結(jié)合提供新的研究視角與框架。
1 GRU網(wǎng)絡(luò)
從現(xiàn)有研究中可知,循環(huán)神經(jīng)網(wǎng)絡(luò)存在梯度消失問題,無法解決輸入數(shù)據(jù)的長期依賴關(guān)系。LSTM作為一種特殊的循環(huán)神經(jīng)網(wǎng)絡(luò),在處理長期依賴關(guān)系時(shí)消除了梯度消失問題;該網(wǎng)絡(luò)通過維持一個(gè)能存儲(chǔ)較長時(shí)序的狀態(tài)來解決長期依賴關(guān)系,下一個(gè)狀態(tài)由前一個(gè)狀態(tài)計(jì)算得到。LSTM網(wǎng)絡(luò)結(jié)構(gòu)包含:一個(gè)遺忘門,決定t時(shí)刻獲得新數(shù)據(jù)后,存儲(chǔ)在長期記憶中的信息的重要性;輸入門,表示長期記憶更新方式;輸出門,計(jì)算最近輸入的短期記憶,同時(shí)記錄更新后的長期記憶[13]。
GRU網(wǎng)絡(luò)是簡化版的LSTM網(wǎng)絡(luò),兩者的主要區(qū)別在于GRU網(wǎng)絡(luò)將LSTM網(wǎng)絡(luò)中的遺忘門和輸入門集成在一個(gè)更新門中,從而減少了參數(shù),簡化了計(jì)算過程,從而達(dá)到網(wǎng)絡(luò)結(jié)構(gòu)簡化的目的。GRU網(wǎng)絡(luò)結(jié)合了時(shí)間序列單元的可見狀態(tài)和隱藏狀態(tài),目前實(shí)證結(jié)果表明GRU網(wǎng)絡(luò)在一定程度上加快了網(wǎng)絡(luò)計(jì)算速度。
根據(jù)文獻(xiàn)[12-14]中的金融預(yù)測方法的實(shí)證結(jié)果,為便于對照LSTM網(wǎng)絡(luò)與GRU網(wǎng)絡(luò)預(yù)測結(jié)果的準(zhǔn)確度,本文激活函數(shù)全部選取tanh函數(shù)。GRU網(wǎng)絡(luò)的具體模型方程如下
zt=φ(ωzxt,yt-1)
gt=φ(ωrxt,yt-1)
z′t=φ(ω′xt,gtyt-1)
yt=(1-zt)yt-1+ztz′t(1)
式中:zt為t時(shí)刻更新門狀態(tài);φ為激活函數(shù);ωz為更新門輸入狀態(tài)的權(quán)重;xt為t時(shí)刻輸入序列;gt為t時(shí)刻重置門狀態(tài);ωr為重置門輸入狀態(tài)的權(quán)重;z′t為t時(shí)刻更新記憶狀態(tài);ω′為更新記憶輸入狀態(tài)的權(quán)重;yt為t時(shí)刻最終狀態(tài)。
2 深度進(jìn)化策略
進(jìn)化策略(evolution strategy,ES)算法被廣泛應(yīng)用于解決工程和統(tǒng)計(jì)研究問題,如車間調(diào)度問題[15]、車輛自動(dòng)泊車視域規(guī)劃問題[16]和高維數(shù)據(jù)特征識(shí)別[17]問題等。目前,未見將進(jìn)化策略應(yīng)用于金融交易中。本文提出的深度進(jìn)化策略(DES)是一種在ES算法上加入了無損失函數(shù)網(wǎng)絡(luò)結(jié)構(gòu),可合理優(yōu)化開倉、平倉的一種高頻交易策略。DES模型包含兩個(gè)模塊:①DES模型訓(xùn)練過程,訓(xùn)練模型包含輸入層、隱藏層和輸出層;②DES模型決策交易過程。DES模型包含5個(gè)初始參數(shù),分別為:權(quán)重(w)、獎(jiǎng)勵(lì)函數(shù)(r)、參與擾動(dòng)種群大?。∕pop)、權(quán)重更新參數(shù)(σ)和學(xué)習(xí)率(lr)。
DES模型的訓(xùn)練模塊包括3個(gè)參數(shù):窗口期、輸入量和輸出量,其訓(xùn)練過程通過不斷執(zhí)行指定迭代次數(shù)的循環(huán)完成訓(xùn)練。首先,初始化變量,在每個(gè)循環(huán)訓(xùn)練epoch中,隨機(jī)生成種群后計(jì)算個(gè)體變異擾動(dòng)值和個(gè)體更新權(quán)重,進(jìn)行變異操作;接收新進(jìn)入的數(shù)據(jù)序列后進(jìn)行模型訓(xùn)練,計(jì)算交易策略權(quán)重。DES模型的決策交易模塊包含3個(gè)初始參數(shù):初始價(jià)值(Vini)、每次迭代跳過的序列數(shù)(G)和狀態(tài)空間(St)。決策過程如下:首先根據(jù)新進(jìn)入數(shù)據(jù)的排序位置確定波動(dòng)趨勢狀態(tài),獲取當(dāng)前價(jià)格趨勢狀態(tài)后,按照窗口期設(shè)置的值提取價(jià)格序列中相應(yīng)序列數(shù)的歷史數(shù)據(jù),進(jìn)入第一個(gè)模塊進(jìn)行訓(xùn)練完成模型優(yōu)化;然后根據(jù)優(yōu)化后的模型計(jì)算出決策值(D),D大于新進(jìn)入的價(jià)格值將執(zhí)行買入操作,D小于新進(jìn)入的價(jià)格值將進(jìn)行賣出操作;最后,計(jì)算每次交易的收益率,并將其標(biāo)準(zhǔn)化,進(jìn)行下一代模型的訓(xùn)練。決策過程連續(xù)接收優(yōu)化訓(xùn)練后更新的交易策略權(quán)重,根據(jù)模型預(yù)測的動(dòng)作執(zhí)行決策操作;DES模型通過逐漸優(yōu)化神經(jīng)網(wǎng)絡(luò)的個(gè)體權(quán)重,從而提高模型的性能。由于DES模型屬于高頻策略范疇,因此本文只包含買入和賣出兩種交易行動(dòng)。
本文提出的DES模型訓(xùn)練和決策交易參數(shù)的更新分步計(jì)算過程如下。
步驟1 模型個(gè)體權(quán)重的更新過程。根據(jù)種群中每一個(gè)個(gè)體i和預(yù)先設(shè)置的擾動(dòng)強(qiáng)度θ參數(shù)進(jìn)行擾動(dòng)操作,計(jì)算最新一期的變異擾動(dòng)值和更新增加擾動(dòng)項(xiàng)后的權(quán)重
Jt=θit(2)
ωt=ωt-1+Jt(3)
式中:it為種群中t時(shí)刻個(gè)體i的值;Jt為t時(shí)刻最新一期變異指數(shù)擾動(dòng)值;ωt為t時(shí)刻最新一期更新后的權(quán)重。
步驟2 確定模型訓(xùn)練中t時(shí)刻交易策略使用的權(quán)重值
ωtr,t=ωt+lrMpopσ∑Mpopi=1Ji,tPi(4)
式中:Mpop為參與擾動(dòng)的樣本數(shù);σ為權(quán)重更新參數(shù);lr為學(xué)習(xí)率可控制更新步長;Ji,t為第i個(gè)樣本t時(shí)刻擾動(dòng)值;Pi為第i個(gè)樣本獎(jiǎng)勵(lì)值。
步驟3 將收盤價(jià)格作為輸入,計(jì)算策略連續(xù)狀態(tài)空間的狀態(tài)值
St=vinωtr,t+ωtr,t-1St-1(5)
式中:vin為收盤價(jià)輸入值。
步驟4 根據(jù)連續(xù)狀態(tài)空間值,確定連續(xù)決策值
D=Stωtr,t+1(6)
步驟5 DES獎(jiǎng)勵(lì)函數(shù)定義為給定權(quán)重下進(jìn)行交易后的收益率
r=Vdec-ViniVini×100%(7)
式中:Vini為執(zhí)行決策后賬戶的價(jià)值; Vdec為執(zhí)行決策后賬戶的價(jià)值。
與傳統(tǒng)梯度下降等優(yōu)化方法相比,DES模型無需手動(dòng)設(shè)計(jì)損失函數(shù),沒有梯度下降過程,這使得DES模型更加簡約、高效。DES模型的工作流程如圖1所示。
3 GRU-DES精度檢驗(yàn)
3.1 模型預(yù)測檢驗(yàn)指標(biāo)
采用傳統(tǒng)的統(tǒng)計(jì)預(yù)測精度指標(biāo)均方根誤差(root mean squared error, ERMSE)和平均絕對百分比誤差(mean absolute percentage error, EMAPE)來評價(jià)模型精確度,在模型擬合效果上選擇多輸出的決策系數(shù)R2vw,3個(gè)評價(jià)模型指標(biāo)表示為
ERMSE= 1m∑mi=1(yi-i)2(8)
EMAPE=1m∑mi=1yi-iyi×100%(9)
R2vw=∑mj=1var(yj)R2j∑mj=1var(yj)(10)
式中:m為變量的數(shù)量;n為樣本的個(gè)數(shù);yi為第i個(gè)輸出;i為第i個(gè)輸出估計(jì)值;R2j為第j個(gè)輸出的R2值;var(yj)為第j個(gè)輸出的數(shù)學(xué)方差。
3.2 量化策略回測指標(biāo)
文獻(xiàn)[18-19]中使用投資組合中各股票收益率的線性加權(quán)和作為投資策略優(yōu)劣的標(biāo)準(zhǔn)。文獻(xiàn)[20]使用年化收益率、阿爾法、夏普比值、波動(dòng)率、勝率、最大回撤比率、信息比率等回測指標(biāo)對預(yù)測建模方法進(jìn)行評估。在現(xiàn)有文獻(xiàn)啟發(fā)下,本文從量化投資角度出發(fā),通過結(jié)合投資策略的回測結(jié)果衡量模型的預(yù)測精準(zhǔn)度,投資策略回測結(jié)果的評估包含以下幾個(gè)指標(biāo)。
(1)日收益率表示為
ra=Va,tVa,t-1-1(11)
式中:Va,t為第t日投資賬戶價(jià)值。
(2)年化收益率表示為
ran=VfinVini252n-1(12)
式中: Vfin為最終賬戶價(jià)值。
(3)最大回撤比率(MDD),反映了投資期間最大下跌幅度表示為
MDD=maxVroll-Va,tVroll(13)
式中:Vroll為賬戶價(jià)值的累積最大值。
(4)夏普比值(Rsh),衡量投資者承受一單位的風(fēng)險(xiǎn)獲得的超額回報(bào)表示為
Rsh=E(ra-rf) var(ra-rf)(14)
式中:E(ra-rf)為超額收益率數(shù)學(xué)期望;ra為日收益率;rf為無風(fēng)險(xiǎn)收益率;var(ra-rf)為超額收益率數(shù)學(xué)方差。
(5)歐米茄比值(Rom),衡量投資組合收益分布情況表示為
Rom=∑(ragt;rtar)∑(ra≤rtar)(15)
式中:rtar為目標(biāo)收益率。
(6)卡瑪比值(Rcal),衡量投資組合風(fēng)險(xiǎn)調(diào)整后收益表示為
Rcal=ranMDD(16)
式中:ran為年化收益率;MDD為最大回撤比率。
(7)索提諾比值(Rsor),衡量投資者承受一單位的下行風(fēng)險(xiǎn)獲得的超額回報(bào)表示為
Rsor=E(ra) var(rneg)(17)
式中:rneg為負(fù)日收益率。
4 實(shí)證分析
4.1 實(shí)證數(shù)據(jù)
上市公司流通市值大小和交易活躍度展現(xiàn)出不同的指數(shù)變動(dòng)特征。本文旨在對流通市值和交易活躍度綜合指數(shù)進(jìn)行對比研究。分別選取了上海證券交易所(以下簡稱上證)超大盤股票指數(shù)和上證中盤股票指數(shù)2006年1月1日至2024年6月30日的收盤價(jià)數(shù)據(jù),上證小盤股票指數(shù)由于其上市日期限制,只能獲取2010年1月1日至2024年6月30日的數(shù)據(jù)。最后,對于上證三大股票指數(shù),本文采用2016年1月1日至2024年6月30日的日交易數(shù)據(jù)進(jìn)行DES-GRU模型交易回測分析。本文所使用的數(shù)據(jù)來源于國泰安CSMAR數(shù)據(jù)庫。
實(shí)證分為3個(gè)部分:①采用RNN、LSTM和GRU 3個(gè)網(wǎng)絡(luò)預(yù)測模型分別對2006年1月1日至2015年12月31日的上證超大盤股票指數(shù)、上證中盤股票指數(shù)的日收盤價(jià)數(shù)據(jù)和2010年1月1日至2022年12月31日的上證小盤股票指數(shù)的日收盤價(jià)數(shù)據(jù)進(jìn)行訓(xùn)練及預(yù)測;②將第一部分預(yù)測出的收盤價(jià)和相同指數(shù)同一時(shí)期的真實(shí)收盤價(jià)分別進(jìn)行DES模型回測,對比研究預(yù)測價(jià)格和真實(shí)價(jià)格回測結(jié)果及交易細(xì)節(jié)的差別,確定最優(yōu)網(wǎng)絡(luò)結(jié)構(gòu)和策略參數(shù);③根據(jù)優(yōu)化出的GRU-DES模型對樣本外數(shù)據(jù)2016年1月1日至2024年6月30日7年間上證大盤指數(shù)、上證中盤股票指數(shù)和上證小盤股票指數(shù)進(jìn)行模型驗(yàn)證,以進(jìn)一步彰顯本文所提出模型的優(yōu)勢。
4.2 預(yù)測模型對比
基于文獻(xiàn)[20-25]中對相關(guān)預(yù)測網(wǎng)絡(luò)模型的對比研究結(jié)果,本文選用預(yù)測效果較好的3個(gè)網(wǎng)絡(luò)模型RNN、LSTM和GRU進(jìn)行對比研究,為了確定適合它們的最優(yōu)層次網(wǎng)絡(luò)結(jié)構(gòu),每個(gè)模型分別對層數(shù)為1、2、3、4的隱藏層(記為GRU-1層~GRU-4層)進(jìn)行網(wǎng)絡(luò)訓(xùn)練。具體地,將3個(gè)模型分別用于上證超大盤股票指數(shù)。上證中盤股票指數(shù)和上證小盤股票指數(shù)的預(yù)測。本文所選的數(shù)據(jù)以2016年初證券市場熔斷政策出現(xiàn)為分界點(diǎn),上證大盤指數(shù)和上證中盤股票指數(shù)使用2006年1月1日至2015年12月31日,共2 427條交易數(shù)據(jù),其中1 492條訓(xùn)練數(shù)據(jù)和485條測試數(shù)據(jù)個(gè)交易日數(shù)據(jù),上證小盤股票指數(shù)編制日期較短,所以使用2010年1月1日至2022年12月31日,共3153個(gè)交易日的數(shù)據(jù),其中2502條訓(xùn)練數(shù)據(jù)和630條測試數(shù)據(jù)。表1所示為各個(gè)模型預(yù)測結(jié)果的均方根誤差,表2所示各個(gè)模型預(yù)測結(jié)果的平均絕對百分比誤差,表3所示各個(gè)模型的決策系數(shù),依據(jù)均方根誤差值、平均絕對百分比誤差最小和決策系數(shù)最接近1的原則,選擇各模型的最優(yōu)層次網(wǎng)絡(luò)結(jié)構(gòu)。由于3個(gè)模型訓(xùn)練結(jié)果圖類似,限于篇幅本文只展示GRU模型對上證超大盤股票指數(shù)的最優(yōu)預(yù)測結(jié)果,效果圖如圖2所示。
由表1、表2和表3可以觀察到:① GRU模型的4個(gè)層次預(yù)測結(jié)果較穩(wěn)定,均方根誤差和平均絕對百分比誤差都是最小,對三大股票的預(yù)測精度最高,并且模型的擬合效果都較好; ② LSTM模型的整體預(yù)測能力較弱,預(yù)測精度與模型擬合效果基本一致; ③RNN模型也展示出較好的預(yù)測準(zhǔn)確性,但預(yù)測結(jié)果的穩(wěn)定性和模型擬合效果較弱。
4.3 GRU-DES精度分析
本文用DES模型對4.2節(jié)中RNN、 LSTM和GRU這3個(gè)模型預(yù)測的三大股票收盤價(jià)和同一時(shí)期真實(shí)收盤價(jià)格進(jìn)行量化策略回測。這里上證超大盤股票指數(shù)和上證中盤股票指數(shù)預(yù)測了484期,對應(yīng)交易日期為2013年10月16日至2015年12月30日;上證小盤股票指數(shù)預(yù)測了630期,對應(yīng)交易日期為2020年6月1日至2022年12月31日。 GRU模型的簡化特點(diǎn)與高頻策略DES模型的高效思想一致,DES模型的參數(shù)根據(jù)收益最大化進(jìn)行多次調(diào)整,選中擾動(dòng)強(qiáng)度為為0.1,學(xué)習(xí)率為0.03;策略執(zhí)行環(huán)境設(shè)置為:初始資金為10000元,手續(xù)費(fèi)比率為0.0001,數(shù)據(jù)頻率為日數(shù)據(jù),訂單類型為市價(jià)單,無杠桿,不存在做空機(jī)制,回測期間無風(fēng)險(xiǎn)收益率與目標(biāo)收益率均設(shè)置為0。
GRU-DES模型、LSTM-DES模型、RNN-DES模型與DES模型真實(shí)值回測的對比結(jié)果展示在表4中,顯而易見:① GRU-DES模型在年化收益率、最大回撤比率、卡瑪比值和索提諾比值與真實(shí)回撤指標(biāo)上保持高度一致,均比RNN-DES模型和LSTM-DES模型的預(yù)測精度高出14%以上;②LSTM-DES模型回測效果與真實(shí)值差別最大,LSTM模型在統(tǒng)計(jì)指標(biāo)上預(yù)測效果也不佳,其中最大回撤比率、歐米茄比值、卡瑪比值和索提諾比值變動(dòng)區(qū)間較大,說明LSTM-DES模型明顯沒有識(shí)別出行情的波動(dòng),LSTM模型預(yù)測存在隨機(jī)性問題;③RNN-DES模型在小盤股票指數(shù)回測出高于真實(shí)值的年化收益率和較大回撤,說明預(yù)測的結(jié)果波動(dòng)性大,導(dǎo)致在小盤股票指數(shù)計(jì)算與波動(dòng)率相關(guān)的回撤指標(biāo)中夏普比值、歐米茄比值、卡瑪比值和索提諾比值更為接近真實(shí)回測值的現(xiàn)象,4.2節(jié)中RNN模型從統(tǒng)計(jì)指標(biāo)角度展現(xiàn)出優(yōu)勢,但RNN-DES模型明顯與真實(shí)值回測結(jié)果相差較大,說明了RNN模型預(yù)測存在過擬合問題。
圖3展示了各模型賬戶價(jià)值變動(dòng)過程:①圖中顯示GRU-DES模型與真實(shí)值回測賬戶價(jià)值變動(dòng)最
為接近;②LSTM-DES模型雖然在超大盤回測中賬戶價(jià)值與真實(shí)回測結(jié)果較為相近,但另外兩個(gè)指數(shù)回測上表現(xiàn)出不穩(wěn)定性;③策略回測期間上證中盤股票指數(shù)波動(dòng)趨勢明顯,策略容易識(shí)別交易信號,導(dǎo)致3個(gè)模型從賬戶價(jià)值曲線中展現(xiàn)出相似的回測的效果。
4.4 GRU-DES模型樣本外驗(yàn)證
為了更準(zhǔn)確驗(yàn)證本文優(yōu)化后策略的盈利穩(wěn)定性,這里從交易策略的樣本外表現(xiàn)來進(jìn)一步驗(yàn)證GRU-DES模型的優(yōu)勢。將GRU-DES模型應(yīng)用于2016年1月1日至2024年6月30日上證三大股票收盤點(diǎn)位進(jìn)行測試,同時(shí)測試了3個(gè)雙強(qiáng)化學(xué)習(xí)模型Double-Duel Q learning、Duel Q learning和Double Q learning[26-27]的交易結(jié)果,回測環(huán)境與上文訓(xùn)練期間相同,回測結(jié)果如表5所示,其中三大股票以“買入并持有策略”為基準(zhǔn)。不難看出:本文提出的GRU-DES高頻交易量化策略遠(yuǎn)優(yōu)于3個(gè)強(qiáng)化學(xué)習(xí)算法策略和基準(zhǔn);雖然Double-Duel Q learning模型 和 Double Q learning模型有較高的歐米茄比率,說明這兩個(gè)量化模型的勝率較高,盈虧比率較低產(chǎn)生較大回撤,但GRU-DES模型各回測指標(biāo)在三大股票上展現(xiàn)出穩(wěn)定性。另外,樣本外數(shù)據(jù)驗(yàn)證期間指數(shù)行情一直處于低位震蕩中下行趨勢,而模型訓(xùn)練期間指數(shù)處于趨勢明顯上行區(qū)間故樣本外數(shù)據(jù)策略效果遠(yuǎn)低于訓(xùn)練期間回測效果,同時(shí)也說明GRU-DES模型在捕捉趨勢中有一定優(yōu)勢和穩(wěn)定性。GRU-DES模型回測賬戶價(jià)值曲線和交易細(xì)節(jié)如圖4和圖5所示,從賬戶價(jià)值逐步上漲中可以觀察到GRU-DES模型一直表現(xiàn)出穩(wěn)定的收益。
最后,將GRU-DES量化模型應(yīng)用于2023年10月9日至2024年9月30日上證三大股票指數(shù)收盤點(diǎn)位進(jìn)行測試,回測結(jié)果如表6所示,可見GRU-DES模型所有回測指標(biāo)都優(yōu)于基準(zhǔn)模型。
5 結(jié) 論
本文同時(shí)考慮RNN,LSTM和GRU 3種神經(jīng)網(wǎng)絡(luò)模型,選取上證超大盤股票指數(shù)、上證中盤股票指數(shù)和上證小盤股票指數(shù)進(jìn)行訓(xùn)練與回測,由此提出了GRU-DES模型并進(jìn)行樣本外數(shù)據(jù)驗(yàn)證,得出以下結(jié)論。
(1) 根據(jù)3個(gè)模型預(yù)測統(tǒng)計(jì)指標(biāo)的對比結(jié)果,GRU網(wǎng)絡(luò)模型顯示出一定的穩(wěn)定性和精確性; LSTM網(wǎng)絡(luò)模型在預(yù)測統(tǒng)計(jì)指標(biāo)上顯示出預(yù)測效果較弱,模型預(yù)測精度與模型擬合效果一致;RNN網(wǎng)絡(luò)模型預(yù)測結(jié)果的穩(wěn)定性和模型擬合效果較弱。
(2) 根據(jù)GRU-DES、LSTM-DES和RNN-DES量化模型回測結(jié)果的對比,GRU-DES模型在各回測指標(biāo)上,均比RNN-DES模型和LSTM-DES模型的預(yù)測精度高出14%以上,說明神經(jīng)網(wǎng)絡(luò)與交易策略的結(jié)合可以有效解決統(tǒng)計(jì)指標(biāo)的隨機(jī)性和過擬合問題。
(3) 本文提出的GRU-DES模型與Double Duel Q learning、Duel Q learning、Double Q learning強(qiáng)化學(xué)習(xí)模型對比,在各回測指標(biāo)中都表現(xiàn)出明顯的優(yōu)勢。GRU-DES模型將預(yù)測結(jié)果與動(dòng)態(tài)交易策略有效結(jié)合,在預(yù)測過程中動(dòng)態(tài)同步改進(jìn)交易策略,同時(shí)交易策略又反過來印證預(yù)測結(jié)果。
參考文獻(xiàn):
[1]AYALA J, GARCA-TORRES M, NOGUERA J L V, et al. Technical analysis strategy optimization using a machine learning approach in stock market indices [J]. Knowledge-Based Systems, 2021, 225: 107119.
[2]WANG Jia, WANG Xinyi, WANG Xu. International oil shocks and the volatility forecasting of Chinese stock market based on machine learning combination models [J]. The North American Journal of Economics and Finance, 2024, 70: 102065.
[3]PENG Zongyu, GUO Peichang. A data organization method for LSTM and transformer when predicting Chinese banking stock prices [J]. Discrete Dynamics in Nature and Society, 2022, 2022(1): 7119678.
[4]LIN Zili, TIAN Fangyuan, ZHANG Weiqian. Evaluation and analysis of an LSTM and GRU based stock investment strategy [C]//Proceedings of the 2022 International Conference on Economics, Smart Finance and Contemporary Trade (ESFCT 2022). Dordrecht, The Netherlands: Atlantis Press, 2022: 1615-1626.
[5]SANG Chenjie, DI PIERRO M. Improving trading technical analysis with TensorFlow long short-term memory (LSTM) neural network [J]. The Journal of Finance and Data Science, 2019, 5(1): 1-11.
[6]KANWAL A, LAU M F, NG S P H, et al. BiCuDNNLSTM-1dCNN: a hybrid deep learning-based predictive model for stock price prediction [J]. Expert Systems with Applications, 2022, 202: 117123.
[7]LV Pin, SHU Yating, XU Jia, et al. Modal decomposition-based hybrid model for stock index prediction [J]. Expert Systems with Applications, 2022, 202: 117252.
[8]于孝建, 劉國鵬, 劉建林, 等. 基于LSTM網(wǎng)絡(luò)和文本情感分析的股票指數(shù)預(yù)測 [J]. 中國管理科學(xué), 2024, 32(8): 25-35.
YU Xiaojian, LIU Guopeng, LIU Jianlin, et al. Stock index prediction based on LSTM network and text sentiment analysis [J]. Chinese Journal of Management Science, 2024, 32(8): 25-35.
[9]LIU Yijiao, LIU Xinghua, ZHANG Yuxin, et al. CEGH: a hybrid model using CEEMD, Entropy, GRU, and history attention for intraday stock market forecasting [J]. Entropy, 2023, 25(1): 71.
[10]周章元, 何小靈. 基于優(yōu)化LSTM模型的股價(jià)預(yù)測方法 [J]. 統(tǒng)計(jì)與決策, 2023, 39(6): 143-148.
ZHOU Zhangyuan, HE Xiaoling. Stock price prediction method based on optimized LSTM model [J]. Statistics amp; Decision, 2023, 39(6): 143-148.
[11]BIN′KOWSKI M, MARTI G, DONNAT P. Autoregressive convolutional neural networks for asynchronous time series [C]//Proceedings of the 35th International Conference on Machine Learning. Chia Laguna Resort, Sardinia, Italy: PMLR, 2018: 580-589.
[12]LUO Shuang, NI Zhiwei, ZHU Xuhui, et al. A novel methanol futures price prediction method based on multicycle CNN-GRU and attention mechanism [J]. Arabian Journal for Science and Engineering, 2023, 48(2): 1487-1501.
[13]NOURBAKHSH Z, HABIBI N. Combining LSTM and CNN methods and fundamental analysis for stock price trend prediction [J]. Multimedia Tools and Applications, 2023, 82(12): 17769-17799.
[14]LI Chengyu, QIAN Guoqi. Stock price prediction using a frequency decomposition based GRU transformer neural network [J]. Applied Sciences, 2023, 13(1): 222.
[15]KHURSHID B, MAQSOOD S. A hybrid evolution strategies-simulated annealing algorithm for job shop scheduling problems [J]. Engineering Applications of Artificial Intelligence, 2024, 133, Part A: 108016.
[16]ABOYEJI E T, AJANI O S, MALLIPEDDI R. Covariance matrix adaptation evolution strategy based on ensemble of mutations for parking navigation and maneuver of autonomous vehicles [J]. Expert Systems with Applications, 2024, 249, Part A: 123565.
[17]NEMATZADEH H, GARCA-NIETOJ, ALDANA-MONTES J F, et al. Pattern recognition frequency-based feature selection with multi-objective discrete evolution strategy for high-dimensional medical datasets [J]. Expert Systems with Applications, 2024, 249, Part A: 123521.
[18]LO A W, SINGH M. Deep-learning models for forecasting financial risk premia and their interpretations [J]. Quantitative Finance, 2023, 23(6): 917-929.
[19]劉偉龍, 張永, 楊興雨. 基于LSTM預(yù)測信息的在線融資融券組合交易策略 [J]. 系統(tǒng)工程理論與實(shí)踐, 2024, 44(8): 2493-2508.
LIU Weilong, ZHANG Yong, YANG Xingyu. Online margin trading strategy based on LSTM prediction information [J]. Systems Engineering-Theory amp; Practice, 2024, 44(8): 2493-2508.
[20]賀毅岳, 高妮, 韓進(jìn)博, 等. 基于長短記憶網(wǎng)絡(luò)的指數(shù)量化擇時(shí)研究 [J]. 統(tǒng)計(jì)與決策, 2020, 36(23): 128-133.
HE Yiyue, GAO Ni, HAN Jinbo, et al. Research on the exponential quantitative timing based on long short term memory [J]. Statistics amp; Decision, 2020, 36(23): 128-133.
[21]柴昱白, 陳偉, 趙舒欣, 等. 采用機(jī)器學(xué)習(xí)與二維伽馬函數(shù)的股票指數(shù)量化交易策略 [J]. 西安交通大學(xué)學(xué)報(bào), 2023, 57(5): 204-212.
CHAI Yubai, CHEN Wei, ZHAO Shuxin, et al. Quantitative trading strategy for stock index based on machining learning and 2D gamma function [J]. Journal of Xi’an Jiaotong University, 2023, 57(5): 204-212.
[22]賀毅岳, 劉磊, 高妮. 基于M-LSTM的股票指數(shù)日內(nèi)交易量分布預(yù)測研究 [J]. 運(yùn)籌與管理, 2022, 31(10): 196-203.
HE Yiyue, LIU Lei, GAO Ni. Research on forecasting intraday trading volume of stock index based on M-LSTM [J]. Operations Research and Management Science, 2022, 31(10): 196-203.
[23]GUPTA U, BHATTACHARJEE V, BISHNU P S. StockNet-GRU based stock index prediction [J]. Expert Systems with Applications, 2022, 207: 117986.
[24]蔡超, 何馨怡, 李麗. 大規(guī)模數(shù)據(jù)的分布式神經(jīng)網(wǎng)絡(luò)回歸模型研究 [J]. 統(tǒng)計(jì)與決策, 2023, 39(17): 34-39.
CAI Chao, HE Xinyi, LI Li. Research on distributed neural network regression model for large-scale data [J]. Statistics amp; Decision, 2023, 39(17): 34-39.
[25]KU C S, XIONG Jiale, CHEN Y L, et al. Improving stock market predictions: an equity forecasting scanner using long short-term memory method with dynamic indicators for Malaysia stock market [J]. Mathematics, 2023, 11(11): 2470.
[26]NING B, LIN F H T, JAIMUNGAL S. Double deep Q-learning for optimal execution [J]. Applied Mathematical Finance, 2021, 28(4): 361-380.
[27]XU Hongfeng, CHAI Lei, LUO Zhiming, et al. Stock movement prediction via gated recurrent unit network based on reinforcement learning with incorporated attention mechanisms [J]. Neurocomputing, 2022, 467: 214-228.
(編輯 劉楊 陶晴)