曹超凡,李 路
(上海工程技術(shù)大學(xué)數(shù)理與統(tǒng)計(jì)學(xué)院,上海 201620)
時(shí)間序列問題一直以來都是一個(gè)熱門研究話題。傳統(tǒng)研究模型如自回歸模型(AR)、移動(dòng)平均模型(MA)和移動(dòng)自回歸模型(ARMA)對(duì)小樣本平穩(wěn)時(shí)間序列數(shù)據(jù)預(yù)測(cè)起到了非常好的效果[1]。對(duì)于小樣本非平穩(wěn)時(shí)間序列也有相應(yīng)的方法,例如差分引入形成ARIMA 模型[2],但引入差分的方法可以充分提取確定信息,卻很難對(duì)模型進(jìn)行直觀解釋。由此開始對(duì)殘差進(jìn)行自回歸,建立殘差自回歸模型(Residual Auto-Regressive)[3],而為了能夠準(zhǔn)確模擬時(shí)間序列的波動(dòng)性,Beran[4]提出ARCH 模型和GARCH,用于處理具有異方差性和異方差自相關(guān)的時(shí)間序列數(shù)據(jù)。而對(duì)于處理多維時(shí)間序列,向量自回歸模型(VAR)模型作為AR 模型的高維擴(kuò)展起到了很好的預(yù)測(cè)效果[5]。
近些年,隨著大數(shù)據(jù)與人工智能的快速發(fā)展,人們研究的數(shù)據(jù)量和數(shù)據(jù)維度急劇增長,多維時(shí)間序列數(shù)據(jù)開始頻繁走進(jìn)研究人員的視野。在股票市場(chǎng)中,股價(jià)數(shù)據(jù)本身具有非線性、非平穩(wěn)等復(fù)雜特點(diǎn),精準(zhǔn)預(yù)測(cè)股票時(shí)間序列是投資者十分關(guān)注的話題[6]。
在時(shí)間序列分析中,傳統(tǒng)的時(shí)間序列模型在處理小樣本、線性且平穩(wěn)性數(shù)據(jù)時(shí)具有無可比擬的優(yōu)勢(shì)。但在處理大樣本、非線性、非平穩(wěn)數(shù)據(jù)時(shí)效果較差,并且存在計(jì)算成本大、最優(yōu)化難以實(shí)現(xiàn)等問題[7]。隨著信息技術(shù)的發(fā)展及大數(shù)據(jù)時(shí)代的到來,深度學(xué)習(xí)技術(shù)的引用使時(shí)間序列分析模式變得更加成熟[8]。Yu 等[9]將廣義線性自回歸(GLAR)與人工神經(jīng)網(wǎng)絡(luò)(ANN)相結(jié)合對(duì)時(shí)間序列進(jìn)行預(yù)測(cè),實(shí)證結(jié)果顯示其預(yù)測(cè)精度更高。Elman[10]以序列的演進(jìn)方向進(jìn)行遞歸,提出第一個(gè)具有記憶性的循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN),但隨著時(shí)間長度的增加,神經(jīng)網(wǎng)絡(luò)參數(shù)呈指數(shù)增長,簡單的RNN 無法解決由時(shí)間長度帶來的梯度爆炸和梯度消失問題[11-12]。Hochreiter 等[13]為解決循環(huán)神經(jīng)網(wǎng)絡(luò)長期以來存在的問題,提出長短期記憶網(wǎng)絡(luò)(Long Short-Term Memory networks,LSTM),解決了RNN 具有的長期依賴性問題。
而在股票時(shí)間序列預(yù)測(cè)中,股票數(shù)據(jù)自身具有較強(qiáng)的復(fù)雜性,同時(shí)具有線性和非線性部分。傳統(tǒng)的時(shí)間序列模型可以很好地處理時(shí)序數(shù)據(jù)的線性部分,當(dāng)前火熱的深度學(xué)習(xí)技術(shù)可以更加靈活地處理時(shí)序數(shù)據(jù)的非線性部分,但單一的模型只能側(cè)重研究時(shí)序數(shù)據(jù)的某一方面特征,對(duì)時(shí)間序列數(shù)據(jù)進(jìn)行預(yù)測(cè)會(huì)不可避免地丟失部分信息,無法同時(shí)兼顧線性與非線性部分[14]。由此,學(xué)者開始研究組合預(yù)測(cè)模型,融合線性預(yù)測(cè)模型與非線性預(yù)測(cè)模型的特點(diǎn),將深度學(xué)習(xí)與傳統(tǒng)的時(shí)間序列模型結(jié)合起來,發(fā)揮各自優(yōu)勢(shì),構(gòu)建各類組合預(yù)測(cè)模型,增強(qiáng)了時(shí)間序列預(yù)測(cè)的適用性,并達(dá)到更高的準(zhǔn)確率。吳曉峰等[15]提出基于BP 神經(jīng)網(wǎng)絡(luò)誤差修正的ARIMA 模型,優(yōu)化了時(shí)間序列非線性擬合部分。劉胤池[16]在用ARIMA 模型處理線性特征的基礎(chǔ)上,利用SVM 對(duì)非線性數(shù)據(jù)處理優(yōu)勢(shì)擬合殘差。王越敬[17]提出LSTM-ARIMA 混合模型以預(yù)測(cè)股價(jià)相關(guān)系數(shù),使模型具有較好的穩(wěn)定性和泛化能力。
綜上所述,學(xué)者在組合預(yù)測(cè)模型上有了較為深入的探究,但多數(shù)研究是將傳統(tǒng)的ARIMA 模型與機(jī)器學(xué)習(xí)模型融合,只能處理一維時(shí)間序列,對(duì)多維時(shí)間序列鮮有涉及。而像股票數(shù)據(jù),常常需要涉及到多個(gè)股票因子數(shù)據(jù),針對(duì)此問題,本文在基于組合預(yù)測(cè)的思想,引入可以處理多維時(shí)間序列的時(shí)序矩陣分解技術(shù)(Temporal Regularized Matrix Factorization,TRMF),該理論融合了可處理多維時(shí)間序列的VAR 模型與矩陣分解技術(shù),可以很好地處理線性數(shù)據(jù)。將其與LSTM 模型相結(jié)合,提出了TRMF-LSTM 組合預(yù)測(cè)模型,用TRMF 預(yù)測(cè)股價(jià)數(shù)據(jù)的線性部分,再用LSTM預(yù)測(cè)股價(jià)數(shù)據(jù)的非線性部分,為股票多維時(shí)間序列預(yù)測(cè)提供一個(gè)新的思路與方法。
在處理多變量時(shí)間序列數(shù)據(jù)時(shí),通常需要同時(shí)接觸到時(shí)間長度、變量數(shù),可用矩陣表示多維時(shí)間序列數(shù)據(jù)結(jié)構(gòu)。本文根據(jù)多元時(shí)間序列結(jié)構(gòu)構(gòu)建多元時(shí)序矩陣Y∈RN×M,假設(shè)矩陣Y表示一支包含N 個(gè)屬性M 個(gè)時(shí)間步長的時(shí)序矩陣,如式(1)所示。
Y的每一行向量表示某一屬性的時(shí)間序列,即該屬性值隨時(shí)間演進(jìn)方向的變化趨勢(shì)。Y的每一列向量表示在相同時(shí)間維度上,各屬性值所構(gòu)成的當(dāng)前狀態(tài)。為實(shí)現(xiàn)對(duì)多維時(shí)間序列的預(yù)測(cè),本文引用低秩矩陣分解技術(shù)。
低秩矩陣分解在人工智能領(lǐng)域得到了廣泛應(yīng)用,對(duì)時(shí)間序列的缺失值起到很好的補(bǔ)全作用,并可以直接從部分觀測(cè)的時(shí)間序列數(shù)據(jù)中進(jìn)行觀測(cè)和學(xué)習(xí)。Chen 等[18]首次使用矩陣低秩分解技術(shù)處理時(shí)空數(shù)據(jù)。Yu[19]考慮到時(shí)間相關(guān)性,提出時(shí)間正則化矩陣分解模型(Temporal Regularized Matrix Factorization,TRMF)實(shí)現(xiàn)對(duì)高維時(shí)間序列的預(yù)測(cè)。Chen 等[20]將在自回歸模型作為典型的時(shí)序模型與低秩矩陣分解結(jié)合,并應(yīng)用到交通時(shí)空數(shù)據(jù),更好地解決時(shí)間序列高相關(guān)性的特點(diǎn)。
根據(jù)該時(shí)序矩陣具有的時(shí)間與屬性兩個(gè)維度,將多元時(shí)序矩陣進(jìn)行低秩分解,得到兩個(gè)矩陣,如式(2)所示。
其中,矩陣W為R×N維的屬性矩陣,矩陣X為R×M維分解后的時(shí)序矩陣,估計(jì)出矩陣W和X,便可得到Y(jié)的估計(jì)矩陣元素表示為矩陣第i個(gè)屬性,第j個(gè)時(shí)間點(diǎn)的數(shù)據(jù),其估計(jì)值計(jì)算公式如式(3)所示。
其中,wi為樣本矩陣的第i列向量,xj為時(shí)序矩陣X的第j列向量,即為第j個(gè)時(shí)間點(diǎn)的R維向量。
現(xiàn)假設(shè)被分解后得到的時(shí)序矩陣X第t列向量xt為多元時(shí)間序列第t個(gè)時(shí)間點(diǎn)的向量,其有N個(gè)分量,即xt=(x1t,,x2t,…xRt)T。其中,xit表示多元時(shí)間序列第t個(gè)時(shí)間點(diǎn)第i個(gè)分量的值,而向量(x1,x2,…,xM)構(gòu)成了時(shí)序矩陣X,如式(4)所示。
矩陣X每一行向量表示一條單變量時(shí)間序列,矩陣X每一列向量表示多元時(shí)間序列的某一時(shí)間點(diǎn)對(duì)應(yīng)的序列向量,而由于時(shí)間序列具有自相關(guān)性,假設(shè)時(shí)序列向量xt與前幾列向量存在著強(qiáng)相關(guān)性,代入VAR 模型,可用如式(5)所示方程描述。
其中,θk表示時(shí)序回歸系數(shù)向量,d表示回歸階數(shù),xt-k表示為時(shí)序矩陣X第t-k列向量,*表示向量對(duì)應(yīng)元素相乘。將時(shí)序回歸系數(shù)向量拼成矩陣形式θ,最終可表示為如式(6)所示。
構(gòu)建的時(shí)序矩陣分解的優(yōu)化問題可以表示為如式(7)所示。
優(yōu)化問題即式(7)的第三項(xiàng)考慮時(shí)序矩陣X列向量存在著時(shí)序關(guān)系,在矩陣分解的基礎(chǔ)上引入時(shí)序正則項(xiàng),以自回歸的方式對(duì)自適應(yīng)該系統(tǒng)的時(shí)序系數(shù)矩陣θ、屬性矩陣W以及時(shí)序矩陣X進(jìn)行學(xué)習(xí),而不用實(shí)現(xiàn)人為設(shè)定時(shí)序系數(shù)θ。時(shí)序正則項(xiàng)如式(9)所示。
通過求解式(8)的優(yōu)化問題,采用最小二乘求解方式,可以得到時(shí)序矩陣X、屬性矩陣W和時(shí)序系數(shù)矩陣θ 每一項(xiàng)的迭代公式,如式(10)、式(11)、式(12)所示。
對(duì)3 個(gè)參數(shù)順著時(shí)間的演進(jìn)方向不斷進(jìn)行更新、迭代,得到完整的屬性矩陣與時(shí)序矩陣,進(jìn)而點(diǎn)乘得到預(yù)測(cè)矩陣,實(shí)現(xiàn)時(shí)間序列預(yù)測(cè)。具體算法步驟如下:
Step1:給定初始矩陣W0、θ0、X0及含待預(yù)測(cè)股票數(shù)據(jù)的矩陣Y。
Step2:根據(jù)式(10)、式(11)、式(12)分別對(duì)時(shí)序矩陣X、屬性矩陣W和時(shí)序系數(shù)矩陣θ 的每一列向量xt、wi、θh進(jìn)行交替迭代更新,從而完成新一輪矩陣W、θ、X的更新。
Step3:利用式(5)更新xM+1、xM+2…,得到擴(kuò)展矩陣Xnew。
總體而言,TRMF 結(jié)合了矩陣分解技術(shù)與VAR 模型,利用矩陣分解技術(shù)實(shí)現(xiàn)對(duì)時(shí)序矩陣的降維,增強(qiáng)了預(yù)測(cè)魯棒性,再利用時(shí)間的自相關(guān)性不斷對(duì)降維后的時(shí)序矩陣進(jìn)行更新,實(shí)現(xiàn)了多維時(shí)間序列預(yù)測(cè)。
長短期記憶網(wǎng)絡(luò)(LSTM)是循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)的改進(jìn)模型。為解決RNN 的梯度消失問題,LSTM 添加了細(xì)胞狀態(tài)ci用來存儲(chǔ)時(shí)間序列的歷史信息。LSTM 有3 個(gè)門控單元:遺忘門、輸入門與輸出門,用以處理歷史信息與輸入信息,進(jìn)行遺忘與更新。如圖1所示。
遺忘門確定從歷史信息中篩去哪些對(duì)當(dāng)前狀態(tài)無影響的信息,遺忘計(jì)算過程如下:
Fig.1 LSTM neural network structure圖1 LSTM 神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)
其中,fi是遺忘門的輸出;wfh、wfy是權(quán)重矩陣,hi-1是上一個(gè)存儲(chǔ)單元的輸出;vi是當(dāng)前輸入;bf是遺忘門的偏置項(xiàng)。σ是Sigmoid 函數(shù),可以將所有激活值映射至0-1 之間,0代表“丟棄”,1代表“保留”。
輸入門決定應(yīng)將哪些當(dāng)前輸入信息添加到細(xì)胞狀態(tài)。更新過程分為兩步,第一步計(jì)算ji確定需要更新哪些輸入信息添加至細(xì)胞狀態(tài),如式(16)所示。
輸出門定義確定當(dāng)前狀態(tài)需要輸出的信息,計(jì)算過程如式(19)、式(20)所示。
其中,oi是輸出門的輸出;woh、woy是權(quán)重矩陣;bo是偏差矢量;hi是當(dāng)前記憶單元的隱藏層輸出。
LSTM 因其具有激活函數(shù)和門控單元,在處理復(fù)雜時(shí)間序列,尤其是擬合非線性部分?jǐn)?shù)據(jù)時(shí)有著較大優(yōu)勢(shì)。
大量實(shí)驗(yàn)表明,單一模型的預(yù)測(cè)效果并不能很好地兼顧數(shù)據(jù)的線性部分與非線性部分。鑒于此,引入組合預(yù)測(cè)模型,將線性模型和非線性模型的預(yù)測(cè)優(yōu)勢(shì)結(jié)合起來,進(jìn)而提升預(yù)測(cè)精度。
假設(shè)時(shí)間序列yt可分為兩部分,即線性主體部分Lt和非線性殘差部分et,如式(21)所示。
其中,用線性模型預(yù)測(cè)線性主體部分將最大程度發(fā)揮出線性模型的優(yōu)勢(shì),預(yù)測(cè)結(jié)果為,再將真實(shí)值與預(yù)測(cè)值作差,得到殘差序列et,再用非線性模型(如深度學(xué)習(xí)技術(shù))對(duì)得到的殘差時(shí)間序列進(jìn)行擬合,得到的預(yù)測(cè)結(jié)果為,最后將線性主體的預(yù)測(cè)部分與非線性殘差的預(yù)測(cè)部分相加,得到組合模型的預(yù)測(cè)結(jié)果,如式(22)所示。
基于時(shí)序正則化矩陣分解的組合預(yù)測(cè)模型結(jié)合了矩陣分解技術(shù)與向量自回歸模型,利用時(shí)間序列的自相關(guān)性特點(diǎn)作出預(yù)測(cè),通過低秩假設(shè)學(xué)習(xí)全局序列信息,同時(shí)引入正則化項(xiàng),更好地處理過擬合問題,在多元時(shí)間序列的線性預(yù)測(cè)中體現(xiàn)出了自己獨(dú)特的優(yōu)勢(shì)。
但同時(shí),TRMF 處理非線性數(shù)據(jù)效果較差,而股票數(shù)據(jù)波動(dòng)性大,具有非線性、高噪聲等特點(diǎn),同時(shí)受政策變動(dòng)、市場(chǎng)情緒、經(jīng)濟(jì)因素等影響,股票時(shí)間序列具有高度不穩(wěn)定性。而深度學(xué)習(xí)在處理非線性數(shù)據(jù)有著天然優(yōu)勢(shì),本文將二者優(yōu)勢(shì)結(jié)合起來,形成矩陣分解與深度學(xué)習(xí)組合預(yù)測(cè)的方法。
Step1:首先對(duì)多元時(shí)間序列數(shù)據(jù)進(jìn)行預(yù)處理,將多個(gè)時(shí)間序列進(jìn)行歸一化,處于同一量綱中。
Step2:將多元時(shí)間序列按時(shí)間節(jié)點(diǎn)劃分訓(xùn)練集與測(cè)試集。
Step3:在訓(xùn)練集中,用TRMF 模型訓(xùn)練數(shù)據(jù)的線性主體部分,并將序列值yt與其作差,得到殘差序列et。
Step4:用et訓(xùn)練LSTM 模型,得到擬合后的殘差序列。
Step5:將測(cè)試集數(shù)據(jù)代入訓(xùn)練好的TRMF-LSTM 模型,得到預(yù)測(cè)線性主體部分與預(yù)測(cè)殘差序列,并將其相加,得到組合模型的預(yù)測(cè)值,并對(duì)其進(jìn)行反歸一化得到最終預(yù)測(cè)數(shù)據(jù)。
預(yù)測(cè)步驟如圖2所示。
為了評(píng)估TRMF-LSTM 模型在股價(jià)預(yù)測(cè)的準(zhǔn)確性,本文選取均方根誤差(RMSE)與平均絕對(duì)百分比誤差(MAPE)兩類指標(biāo)。
這兩類指標(biāo)均衡量預(yù)測(cè)值與真實(shí)值的偏差,越小則表明預(yù)測(cè)值越接近真實(shí)值,即預(yù)測(cè)精度越高。
Fig.2 TRMF-LSTM algorithm flow圖2 TRMF-LSTM 算法流程
本文數(shù)據(jù)選取滬深300、上證指數(shù)兩支股指以及三一重工、中國人壽、農(nóng)業(yè)銀行、牧原股份、美的集團(tuán)、隆基股份6 支個(gè)股共8 支股票。通過查閱文獻(xiàn),選取這8 支股票的開盤價(jià)、收盤價(jià)、最高價(jià)、最低價(jià)、成交量、成交金額6 個(gè)技術(shù)類因子,日換手率、流通市值、漲跌幅、市盈率、賬面杠桿、現(xiàn)金比率、流動(dòng)比率、產(chǎn)權(quán)比率、銷售毛利率9 個(gè)質(zhì)量類因子,凈利潤增長率、未預(yù)期盈余2 個(gè)成長類因子,分析師盈收預(yù)測(cè)變化、10 日乖離率、10 日順勢(shì)指標(biāo)3 個(gè)動(dòng)量類因子,共計(jì)20 個(gè)股票因子作為模型輸入,數(shù)據(jù)來源于優(yōu)礦平臺(tái),數(shù)據(jù)時(shí)間區(qū)間取自2011 年1 月1 日-2021 年3 月7 日,共2 472 條數(shù)據(jù),由此構(gòu)建出股票時(shí)序矩陣YN×M,其中N=20,M=2 472。
由于因子間量綱存在較大差異,先對(duì)各因子作歸一化處理,統(tǒng)一量綱。歸一化處理由式(25)所示。
對(duì)于獲取的股票數(shù)據(jù)存在缺失值情況,利用矩陣分解技術(shù)對(duì)歷史股價(jià)缺失數(shù)據(jù)進(jìn)行數(shù)據(jù)補(bǔ)全,以便于后續(xù)模型輸入。同時(shí),矩陣分解技術(shù)能從帶有噪聲的時(shí)間序列中自動(dòng)過濾噪聲和異常值,在數(shù)據(jù)處理方面體現(xiàn)了天然的優(yōu)勢(shì)。
設(shè)訓(xùn)練集與測(cè)試集比例為4∶1,由于股票交易日在星期一至星期五,將初始矩陣W0、X0、θ0設(shè)置為服從標(biāo)準(zhǔn)正態(tài)分布的矩陣,進(jìn)行單步預(yù)測(cè)。利用時(shí)序矩陣分解技術(shù),構(gòu)建時(shí)序矩陣XR×M與屬性矩陣WN×R并不斷更新,最終通過點(diǎn)乘求得待預(yù)測(cè)矩陣,其中將股票時(shí)序矩陣YN×M進(jìn)行降維,構(gòu)造了時(shí)序矩陣XR×M,從而去掉數(shù)據(jù)集中夾雜的噪聲,并增強(qiáng)魯棒性。TRMF 預(yù)測(cè)算法基于低秩假設(shè),對(duì)于秩R的選取要根據(jù)不同股票的時(shí)間特性確定最佳選擇,通過網(wǎng)格搜索,確定R=8 時(shí),預(yù)測(cè)效果最佳。對(duì)于正則化項(xiàng)λw、λX、λθ均設(shè)定為500。選取時(shí)間滯后項(xiàng)取前15 項(xiàng)數(shù)據(jù),即d=15。
TRMF 算法預(yù)測(cè)后將預(yù)測(cè)值與真實(shí)值作差得到殘差矩陣et,將其轉(zhuǎn)化為含有樣本、時(shí)間步長、因子屬性的三階張量并輸入至LSTM 模型,以收盤價(jià)殘差序列為標(biāo)簽,設(shè)隱藏層節(jié)點(diǎn)數(shù)設(shè)置為50,批量輸入batch_size 設(shè)置為32,迭代次數(shù)epoches=500。擬合出收盤價(jià)殘差序列后,將其與TRMF對(duì)收盤價(jià)的預(yù)測(cè)值相加,即得到股票收盤價(jià)的最終預(yù)測(cè)值。
3.3.1 TRMF-LSTM訓(xùn)練結(jié)果
將TRMF 擬合原時(shí)間序列后,將真實(shí)值與其作差,得到殘差時(shí)間序列。代入LSTM 模型,以滬深300 為例,訓(xùn)練效果如圖3所示。
Fig.3 Model training error graph圖3 模型訓(xùn)練誤差
橫軸為迭代次數(shù),縱軸為擬合的損失函數(shù),即:
根據(jù)模型訓(xùn)練經(jīng)驗(yàn),將學(xué)習(xí)率調(diào)為0.01,迭代次數(shù)設(shè)為500,迭代500 次后即停止訓(xùn)練??梢钥闯?,在訓(xùn)練過程中,迭代15 次時(shí)快速收斂,驗(yàn)證了殘差訓(xùn)練的有效性。同時(shí),誤差波動(dòng)穩(wěn)定在0.01左右,體現(xiàn)了模型的穩(wěn)定性。
3.3.2 TRMF-LSTM組合預(yù)測(cè)模型與對(duì)比模型預(yù)測(cè)效果
本文采用TRMF-LSTM 組合預(yù)測(cè)模型,將預(yù)測(cè)結(jié)果與深度學(xué)習(xí)LSTM 模型、Transformer 模型、傳統(tǒng)機(jī)器學(xué)習(xí)支持向量回歸SVR 預(yù)測(cè)的結(jié)果作比較,取最后100 天的預(yù)測(cè)結(jié)果。圖4—圖11 為TRMF-LSTM 預(yù)測(cè)結(jié)果與真實(shí)值的對(duì)比,橫軸為時(shí)間,以天為單位,縱軸為反歸一化后的股票收盤價(jià)格。
Fig.4 Forecast of CSI 300圖4 滬深300預(yù)測(cè)
Fig.5 Forecast of Shanghai Composite Index圖5 上證指數(shù)預(yù)測(cè)
Fig.6 Forecast of Longi's圖6 隆基股份預(yù)測(cè)
Fig.7 Forecast of Midea Group's圖7 美的集團(tuán)預(yù)測(cè)
Fig.8 Forecast of Muyuan Stock圖8 牧原股份預(yù)測(cè)
Fig.9 Forecast of Agricultural Bank of China圖9 農(nóng)業(yè)銀行預(yù)測(cè)
Fig.10 Forecast of Sany Heavy Industry圖10 三一重工預(yù)測(cè)
Fig.11 Forecast of China Life Insurance圖11 中國人壽預(yù)測(cè)
通過8 只股票預(yù)測(cè)結(jié)果對(duì)比可以發(fā)現(xiàn),LSTM、TRMFLSTM 和Transformer 相較于傳統(tǒng)機(jī)器學(xué)習(xí)SVR 均與真實(shí)值較為接近,預(yù)測(cè)趨勢(shì)基本保持一致,說明深度學(xué)習(xí)相較于傳統(tǒng)機(jī)器學(xué)習(xí)在股價(jià)預(yù)測(cè)上具有較大優(yōu)勢(shì)。而相較于上證指數(shù)、隆基股份、牧原股份、農(nóng)業(yè)銀行與中國人壽五支股票,TRMF-LSTM 的預(yù)測(cè)結(jié)果明顯最接近真實(shí)值,其余股票中,本文構(gòu)建的模型相較于對(duì)比模型,對(duì)股價(jià)趨勢(shì)預(yù)測(cè)有更高的水準(zhǔn),說明了本文組合預(yù)測(cè)模型的有效性,體現(xiàn)了線性與非線性預(yù)測(cè)方法相結(jié)合的優(yōu)勢(shì)。
為更好地觀察對(duì)比效果并進(jìn)行分析,計(jì)算每支股票每個(gè)模型預(yù)測(cè)的兩類誤差指標(biāo)RMSE 和MAPE,并在8 支股票中取平均,如表1所示。
Table 1 Average evaluation index of stock price forecast表1 股價(jià)預(yù)測(cè)平均評(píng)價(jià)指標(biāo)
可以看出,MAPE 和RMSE 的最小值均落在TRMFLSTM 組合預(yù)測(cè)模型中,Transformer 排在第二,LSTM 次之,SVR 排在最后。由此說明,本文構(gòu)建的模型預(yù)測(cè)相較于對(duì)比模型更精準(zhǔn),也更好地驗(yàn)證了該模型能兼顧線性與非線性趨勢(shì)。
本文通過結(jié)合時(shí)序矩陣分解(TRMF)技術(shù)與LSTM 模型結(jié)合,構(gòu)建TRMF-LSTM 組合預(yù)測(cè)模型,從而兼顧時(shí)間序列預(yù)測(cè)的線性與非線性部分。使用TRMF技術(shù)對(duì)股票數(shù)據(jù)集進(jìn)行降維處理,并對(duì)線性部分進(jìn)行擬合;然后將真實(shí)值與線性擬合值作差計(jì)算出殘差,再利用LSTM 模型對(duì)殘差進(jìn)行訓(xùn)練,對(duì)數(shù)據(jù)的非線性部分進(jìn)行擬合;最后將預(yù)測(cè)結(jié)果相加,得到新的組合預(yù)測(cè)值。該模型在選取的8 支股票預(yù)測(cè)中均取得了不錯(cuò)效果,相較于對(duì)比模型有著更低的誤差,驗(yàn)證了模型的有效性。
本文將構(gòu)建的模型應(yīng)用于股票數(shù)據(jù)集,以第二日收盤價(jià)作為預(yù)測(cè)標(biāo)簽??紤]將該模型應(yīng)用于其他數(shù)據(jù)集(如交通數(shù)據(jù)集),并利用多維時(shí)間序列的時(shí)間自相關(guān)性與因子相關(guān)性高精度預(yù)測(cè)多個(gè)標(biāo)簽,作為進(jìn)一步研究的重點(diǎn)。