姚小強(qiáng) ,侯志森
(1.空軍工程大學(xué) 防空反導(dǎo)學(xué)院,西安 710051; 2.西安交通大學(xué) 軟件學(xué)院, 西安 710049)(*通信作者電子郵箱icemissile@sina.com)
金融時(shí)間序列的預(yù)測(cè)一直備受關(guān)注,有效的預(yù)測(cè)手段卻十分稀少。長(zhǎng)短期記憶(Long Short-Term Memory, LSTM)神經(jīng)網(wǎng)絡(luò)是目前金融時(shí)間序列預(yù)測(cè)領(lǐng)域內(nèi)比較先進(jìn)的技術(shù)手段,它的記憶功能對(duì)解決蘊(yùn)含時(shí)間序列信息的問(wèn)題具有天然優(yōu)勢(shì)[1],這種網(wǎng)絡(luò)技術(shù)已被廣泛運(yùn)用到很多與時(shí)序相關(guān)的領(lǐng)域,如自然語(yǔ)言處理[2-3]、動(dòng)作識(shí)別[4]、語(yǔ)音識(shí)別[5]、金融時(shí)間序列預(yù)測(cè)[6-7]等。相比傳統(tǒng)的BP(Back Propagation)神經(jīng)網(wǎng)絡(luò),LSTM神經(jīng)網(wǎng)絡(luò)能利用選擇性記憶的高級(jí)機(jī)器學(xué)習(xí)功能,深入挖掘出金融價(jià)格時(shí)間序列中的固有規(guī)律,使預(yù)測(cè)得到更高的準(zhǔn)確性。Fischer等[8]的研究發(fā)現(xiàn)LSTM網(wǎng)絡(luò)的表現(xiàn)通常優(yōu)于無(wú)記憶的分類方法; Saini等[9]對(duì)傳統(tǒng)的前饋型神經(jīng)網(wǎng)絡(luò)與帶有記憶功能的循環(huán)結(jié)構(gòu)神經(jīng)網(wǎng)絡(luò)進(jìn)行了對(duì)比研究,通過(guò)考察它們?cè)谕鈪R價(jià)格預(yù)測(cè)上的表現(xiàn),發(fā)現(xiàn)這兩種網(wǎng)絡(luò)都為所有的貨幣提供了良好的預(yù)測(cè)結(jié)果,而循環(huán)網(wǎng)絡(luò)帶來(lái)的結(jié)果比前饋型網(wǎng)絡(luò)更好。
在時(shí)間序列的預(yù)測(cè)研究中,多周期尺度下的特征融合是一種重要的分析方法,然而多數(shù)應(yīng)用LSTM神經(jīng)網(wǎng)絡(luò)的時(shí)間序列預(yù)測(cè)方法,往往只針對(duì)某一特定周期進(jìn)行特征提取,忽視了時(shí)間序列在其他時(shí)間尺度上的信息,導(dǎo)致預(yù)測(cè)模型的能力得不到充分發(fā)揮; 故而,本文提出一種基于樹(shù)結(jié)構(gòu)神經(jīng)網(wǎng)絡(luò)模型用于預(yù)測(cè)未來(lái)黃金價(jià)格的變化方向與強(qiáng)度。樹(shù)結(jié)構(gòu)模型對(duì)蘊(yùn)含多尺度特征的問(wèn)題有很好的適配性,應(yīng)用樹(shù)結(jié)構(gòu)有利于同時(shí)對(duì)復(fù)雜的多尺度特征進(jìn)行提取挖掘,進(jìn)而提高分類預(yù)測(cè)的準(zhǔn)確性;遺憾的是,目前這種結(jié)構(gòu)還主要停留在圖像識(shí)別領(lǐng)域[10]。Zangeneh等[11]以卷積神經(jīng)網(wǎng)絡(luò)為基礎(chǔ),分別為高分辨率和低分辨率的人臉圖像建立擁有兩個(gè)分支的預(yù)測(cè)模型,結(jié)果顯示,引入分支的模型能夠顯著提高識(shí)別性能,這一結(jié)論為本文的方法提供了思路與靈感。
在金融時(shí)間序列的分類預(yù)測(cè)問(wèn)題上,類標(biāo)簽的可信度(即分類的合理性)是預(yù)測(cè)的基礎(chǔ),它的設(shè)置將直接影響輸入數(shù)據(jù)與輸出數(shù)據(jù)內(nèi)部關(guān)聯(lián)性的強(qiáng)弱。本文將盈虧比的概念融入類標(biāo)簽的劃分過(guò)程,綜合考慮到類標(biāo)簽的可信度與預(yù)測(cè)結(jié)果的價(jià)值和意義,建立合理有效的數(shù)據(jù)模型,使數(shù)據(jù)內(nèi)部的關(guān)聯(lián)性得以強(qiáng)化。即便如此,金融時(shí)間序列的前后關(guān)聯(lián)性還是在大量噪聲干擾下被削弱,一些較弱的關(guān)聯(lián)規(guī)則幾乎消散,致使關(guān)聯(lián)性樣本分布稀少,而噪聲樣本占據(jù)多數(shù)。這種非平衡的樣本分布給預(yù)測(cè)模型的訓(xùn)練過(guò)程帶來(lái)巨大障礙。本文從樣本抽取模式與目標(biāo)權(quán)值優(yōu)化兩個(gè)角度進(jìn)行研究,以降低樣本分布不均所帶來(lái)的負(fù)面影響。
利用過(guò)去一段時(shí)間內(nèi)黃金價(jià)格歷史時(shí)間序列信息,實(shí)現(xiàn)對(duì)未來(lái)一段時(shí)間內(nèi)黃金價(jià)格運(yùn)行方向與強(qiáng)度的預(yù)測(cè)。將之具體化為:利用過(guò)去60 h內(nèi)的K線數(shù)據(jù),預(yù)測(cè)未來(lái)20 h內(nèi)黃金價(jià)格的運(yùn)行方向與強(qiáng)度。
針對(duì)以上任務(wù),提出圖1所示的方法路線。
圖1 問(wèn)題求解方法路線
本文所建立的預(yù)測(cè)模型以LSTM神經(jīng)網(wǎng)絡(luò)為基礎(chǔ),同時(shí)考慮到金融時(shí)間序列多周期共振特點(diǎn),設(shè)計(jì)了融合多尺度特征的分支結(jié)構(gòu);在預(yù)測(cè)目標(biāo)的量化標(biāo)記方面,設(shè)計(jì)了檢索標(biāo)定算法;訓(xùn)練的過(guò)程中通過(guò)監(jiān)控盈利指數(shù)來(lái)保存性能優(yōu)越的過(guò)程模型;為提高預(yù)測(cè)模型對(duì)主要類別樣本的關(guān)注度,引入目標(biāo)權(quán)值優(yōu)化方法;另外還采用不同類別樣本平衡抽取的策略進(jìn)行訓(xùn)練,避免各類樣本不均衡可能帶來(lái)的問(wèn)題。
相比傳統(tǒng)的預(yù)測(cè)方法,具有如下優(yōu)勢(shì):
1)相比單個(gè)周期序列作為輸入的預(yù)測(cè)模型,本文方法能更加適應(yīng)金融時(shí)間序列多周期共振的特征,又比小波分解等多尺度特征提取方法更具有周期針對(duì)性,處理過(guò)程也更加簡(jiǎn)單高效。
2)目標(biāo)檢索標(biāo)定方法,充分考慮了金融價(jià)格實(shí)現(xiàn)周期與幅度的不確定性,相比價(jià)格回歸預(yù)測(cè)以及形態(tài)聚類等目標(biāo)量化標(biāo)定方法更符合金融價(jià)格波動(dòng)的內(nèi)在規(guī)律。
3)引入閾值調(diào)整、目標(biāo)權(quán)值優(yōu)化、多類別樣本平衡抽取等一系列方法策略,相比一般的預(yù)測(cè)方法更加系統(tǒng)、完善。
4)傳統(tǒng)的方法通常是將損失誤差作為過(guò)擬合監(jiān)控的標(biāo)準(zhǔn),使得最終模型往往無(wú)法取得理想的預(yù)測(cè)性能;為此,本文創(chuàng)造性提出了盈利指數(shù)的概念以及計(jì)算公式,并將其應(yīng)用到模型訓(xùn)練的監(jiān)控過(guò)程,為模型性能的評(píng)估提供了科學(xué)的依據(jù),也為過(guò)程模型的優(yōu)選帶來(lái)極大便利。
將黃金歷史價(jià)格時(shí)間序列表示成X,未來(lái)價(jià)格時(shí)間序列的變化結(jié)果表示成Y, 則價(jià)格的預(yù)測(cè)問(wèn)題就是尋找X與Y之間的映射關(guān)系,用函數(shù)形式可以表示為:
Y=f(X,θ)
(1)
式中:f為X到Y(jié)的映射函數(shù),也稱預(yù)測(cè)函數(shù);θ為預(yù)測(cè)函數(shù)內(nèi)部的所有參數(shù)。
X的表示 考慮到多周期共振特征可能帶來(lái)更好的預(yù)測(cè)效果,將1 h與15 min兩個(gè)周期的歷史序列數(shù)據(jù)同時(shí)作為輸入,分別記為xa、xb,兩個(gè)周期的窗口截取長(zhǎng)度都為60,即60根K線數(shù)據(jù),每根K線被表示成一個(gè)4維的向量[o,h,l,c], 則t時(shí)刻預(yù)測(cè)函數(shù)的輸入xt可表示成:
xt=[xa,xb]t=
(2)
式中:G為歸一化方法;R為利用歸一化方法G將原始窗口序列,轉(zhuǎn)換為預(yù)測(cè)模型可用的輸入。
歸一化方法 選擇3倍時(shí)間窗口的歷史序列作為搜索空間,得到期間的最高價(jià)格與最低價(jià)格,然后利用最大最小值的方法對(duì)當(dāng)前窗口中的每個(gè)輸入變量xi進(jìn)行歸一化處理。歸一化的結(jié)果按照式(3)計(jì)算:
(3)
式中:PriceMax為3倍時(shí)間窗口歷史序列中的最高價(jià)格;PriceMin為3倍時(shí)間窗口歷史序列中的最低價(jià)格。
Y的表示yt為t時(shí)刻Y的值,它是一個(gè)4維向量,各分量依次代表弱震蕩、上漲、下跌、強(qiáng)波動(dòng)4種情況。為了與交易系統(tǒng)很好銜接,將弱與強(qiáng)的量化邊界分別對(duì)應(yīng)止損價(jià)格與止盈價(jià)格。止損價(jià)格為3美元,止盈價(jià)格為7.5美元,對(duì)應(yīng)盈虧比為2.5。檢索標(biāo)定算法如下:
1)利用t時(shí)刻的收盤(pán)價(jià)格O,初始化上漲幅度h,與下跌幅度l。
2)遍歷未來(lái)20 h內(nèi)的價(jià)格變化,i為循環(huán)變量。
3)如果t+i時(shí)刻的最高價(jià)>h,更新h=最高價(jià)[t+i]。
4)如果t+i時(shí)刻的最低價(jià) 5)若h>O+7.5且l>O-3,則類別T=漲,退出遍歷。 6)若l 7)如果完成遍歷,轉(zhuǎn)下一步;否則轉(zhuǎn)到步驟3)。 8)若h 9)弱h>O+7.5且l 2.2.1 LSTM模型簡(jiǎn)介 LSTM結(jié)構(gòu)模型因其擁有記憶功能,在解決時(shí)間序列的回歸與分類問(wèn)題中具有很強(qiáng)優(yōu)勢(shì)。 如圖2所示,LSTM模塊由多個(gè)同構(gòu)單元格(Cell)構(gòu)成,單元格也常被稱作節(jié)點(diǎn)(Node)。每個(gè)節(jié)點(diǎn)內(nèi)部包括:遺忘門(mén)(Forget Gate)、輸入門(mén)(Input Gate)和輸出門(mén)(Output Gate),以及由它們控制的輸入到輸出的各種連接。三個(gè)門(mén)是LSTM的核心,可以看作是張量流在LSTM內(nèi)部流動(dòng)時(shí)的調(diào)節(jié)者。它們的具體功用如下: 遺忘門(mén) 負(fù)責(zé)對(duì)此前狀態(tài)空間中的信息進(jìn)行過(guò)濾調(diào)節(jié)。 輸入門(mén) 它的主要作用是調(diào)節(jié)各節(jié)點(diǎn)的輸入信息進(jìn)入狀態(tài)空間的比例。 輸出門(mén) 主要作用是對(duì)當(dāng)前節(jié)點(diǎn)下?tīng)顟B(tài)空間所保存的信息流入隱層的過(guò)程進(jìn)行調(diào)控。 圖2 LSTM結(jié)構(gòu) 經(jīng)過(guò)遺忘門(mén)與輸入門(mén)的調(diào)控,狀態(tài)空間C得到更新,t時(shí)刻的值為Ct。ht作為隱層的輸出將同時(shí)與狀態(tài)信息Ct被送入下一時(shí)刻的節(jié)點(diǎn)。 LSTM模塊中各門(mén)控函數(shù)以及狀態(tài)傳遞過(guò)程的計(jì)算公式如下: (4) LSTM模型有很多變體,但在性能上區(qū)別不是很大,因此本文提出的樹(shù)結(jié)構(gòu)LSTM神經(jīng)網(wǎng)絡(luò)就是在傳統(tǒng)的LSTM模型之上建立的。 2.2.2 樹(shù)結(jié)構(gòu)LSTM神經(jīng)網(wǎng)絡(luò)模型 網(wǎng)絡(luò)結(jié)構(gòu) 樹(shù)結(jié)構(gòu)LSTM神經(jīng)網(wǎng)絡(luò)總體結(jié)構(gòu)上由兩個(gè)分支子網(wǎng)與一個(gè)頂層全連接子網(wǎng)組成。兩個(gè)分支子網(wǎng)同構(gòu),前端包括3個(gè)LSTM神經(jīng)網(wǎng)絡(luò)模塊,末端引入一個(gè)全連接網(wǎng)絡(luò)層,兩個(gè)分支子網(wǎng)分別用于15 min與1 h兩個(gè)時(shí)間尺度下的特征提?。豁攲尤B接網(wǎng)絡(luò)首先通過(guò)一個(gè)ADD層將兩個(gè)分支LSTM子網(wǎng)的輸出拼接,然后通過(guò)兩個(gè)全連接神經(jīng)網(wǎng)絡(luò)層匯集的特征進(jìn)行綜合分類預(yù)測(cè)。模型結(jié)構(gòu)如圖3所示。 參數(shù)設(shè)置 神經(jīng)網(wǎng)絡(luò)在訓(xùn)練過(guò)程中容易陷入局部最小值,簡(jiǎn)單的做法是引入Dropout層,通過(guò)隨機(jī)抑制部分神經(jīng)元的輸出,讓所有神經(jīng)元實(shí)現(xiàn)更充分訓(xùn)練;該Dropout參數(shù)的大小應(yīng)與數(shù)據(jù)集的信息量負(fù)相關(guān),與網(wǎng)絡(luò)規(guī)模正相關(guān),經(jīng)測(cè)試,當(dāng)棄點(diǎn)概率設(shè)為0.2時(shí)基本可以滿足訓(xùn)練需要。網(wǎng)絡(luò)中所有LSTM層的激活函數(shù)均采用非線性函數(shù)“tanh”,它與門(mén)函數(shù)的取值(0-1)剛好適配,同時(shí)也適用于金融時(shí)間序列的非線性特征;頂層激活函數(shù)選擇適用于多分類的“softmax”;全連接層的激活函數(shù)采用線性函數(shù)“relu”,模型前端以非線性函數(shù)來(lái)映射金融時(shí)間序列的數(shù)值特征,后端的全連接層依據(jù)這些特征進(jìn)行線性整合劃分最終輸出分類向量,選擇“relu”可以保持可用性的同時(shí),提高訓(xùn)練效率;優(yōu)化器采用“rmsprop”,這是一種類似隨機(jī)梯度下降的權(quán)值優(yōu)化算法,在深度學(xué)習(xí)網(wǎng)絡(luò)的優(yōu)化中被廣泛試用。 過(guò)擬合監(jiān)控 神經(jīng)網(wǎng)絡(luò)分類器如果過(guò)度訓(xùn)練會(huì)出現(xiàn)過(guò)擬合情況,使得模型泛化能力不進(jìn)反退。為了防止這種情況的發(fā)生,采取的方法是每完成一次訓(xùn)練,利用模型對(duì)檢驗(yàn)集進(jìn)行預(yù)測(cè),得到一個(gè)模型泛化評(píng)價(jià)指標(biāo),如果指標(biāo)有提升則保存該模型到文件,保存模型時(shí)以非覆蓋的形式進(jìn)行,防止更好的模型被覆蓋掉,待完成訓(xùn)練后再參考擬合曲線或其他指標(biāo),對(duì)過(guò)程模型進(jìn)行甄選。 平衡抽取 為保持不同類別之間的平衡性,每次迭代隨機(jī)從4類樣本中隨機(jī)抽取相等數(shù)量的樣本,此方法可以防止預(yù)測(cè)模型向分布較多的樣本傾斜。 圖3 樹(shù)結(jié)構(gòu)LSTM神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu) 權(quán)值調(diào)整 通過(guò)動(dòng)態(tài)調(diào)整目標(biāo)函數(shù)中各樣本對(duì)應(yīng)的權(quán)值來(lái)實(shí)現(xiàn)注意力機(jī)制,目的是讓模型在訓(xùn)練時(shí)將注意力集中到更關(guān)注的類別(漲、跌類)。對(duì)于預(yù)測(cè)結(jié)果為漲、跌的樣本,預(yù)測(cè)結(jié)果高于閾值0.8的權(quán)值為2,否則設(shè)為1;對(duì)于預(yù)測(cè)結(jié)果為弱、強(qiáng)的樣本,預(yù)測(cè)結(jié)果高于閾值0.8的權(quán)值為1,否則為0.5。在模型訓(xùn)練過(guò)程中,模型會(huì)向更高權(quán)值樣本的分布特征傾斜。為了獲得在主類別樣本上更高的準(zhǔn)確率,可以適當(dāng)犧牲主類別的召回率,以及非主類別的判斷能力。 評(píng)價(jià)指標(biāo)是針對(duì)預(yù)測(cè)模型的預(yù)測(cè)結(jié)果與訓(xùn)練過(guò)程進(jìn)行評(píng)價(jià)與監(jiān)控的重要依據(jù),模型對(duì)數(shù)據(jù)的預(yù)測(cè)結(jié)果包括4種情況: 3) 利用公共管廊管道的風(fēng)險(xiǎn)評(píng)價(jià)模型,對(duì)上海某化工園區(qū)的氫氣管廊管道進(jìn)行了風(fēng)險(xiǎn)評(píng)價(jià)。結(jié)果表明: 該管廊管道失效概率等級(jí)為1級(jí),失效后果等級(jí)為B級(jí),風(fēng)險(xiǎn)評(píng)價(jià)結(jié)果為低風(fēng)險(xiǎn)。 1)TT:預(yù)測(cè)為真,實(shí)際為真,預(yù)測(cè)正確; 2)TF:預(yù)測(cè)為真,實(shí)際為假,預(yù)測(cè)錯(cuò)誤; 3)FF:預(yù)測(cè)為假,實(shí)際為假,預(yù)測(cè)正確; 4)FT:預(yù)測(cè)為假,實(shí)際為真,預(yù)測(cè)錯(cuò)誤。 準(zhǔn)確率 用于考察模型在測(cè)試集上對(duì)主類別樣本的預(yù)測(cè)準(zhǔn)確性,計(jì)算公式如下: (5) 召回率 用于考察模型對(duì)測(cè)試集中主類別樣本的漏判程度召回率越高,漏判程度越低。計(jì)算公式如下: (6) 盈利指數(shù) 準(zhǔn)確率與召回率相互依存,不能顧此失彼。對(duì)與金融投資來(lái)說(shuō),準(zhǔn)確率p對(duì)應(yīng)投資的勝率,并與召回率r共同決定交易機(jī)會(huì)的多少。結(jié)合盈虧比b,可以得到一個(gè)模型總體盈虧能力的一個(gè)指數(shù)IW,它可作為模型訓(xùn)練時(shí)的監(jiān)控量,盈利指數(shù)IW的公式推導(dǎo)如下: W=盈利總額-虧損總額=NTT·b·v-NTF·v= N·v·r·(b+1-1/p)? IW=r·(b+1-1/p) (7) 式中:N為總交易機(jī)會(huì),對(duì)于特定時(shí)間段而言,交易機(jī)會(huì)為常數(shù),等于該段時(shí)間內(nèi)所有主類別樣本數(shù)量;W為總盈虧,也稱凈盈利;v為每場(chǎng)交易的平均虧損額度,這里可視為常數(shù);NTT為盈利交易次數(shù),此時(shí)預(yù)測(cè)結(jié)果為主類別,且與實(shí)際值相符;NTF為虧損交易次數(shù),此時(shí)預(yù)測(cè)結(jié)果為主類別,但與主類別不符。 從式(7)可以看出,召回率與準(zhǔn)確率越高,IW的值越大。當(dāng)p=1且r=1時(shí),IW取最大值b;而當(dāng)p=0且r=0時(shí),IW取最小值,具體需要依據(jù)非主類樣本的數(shù)量比例來(lái)確定。 數(shù)據(jù)來(lái)源 數(shù)據(jù)是從MT4交易平臺(tái)中采集得到,交易品種為國(guó)際黃金現(xiàn)貨(黃金價(jià)格對(duì)美元進(jìn)行折算),其中包含2008- 01 — 2017- 12的15 min與1 h的K線數(shù)據(jù)。 數(shù)據(jù)集劃分 訓(xùn)練集來(lái)自2008- 01 — 2016- 12的數(shù)據(jù),用于預(yù)測(cè)模型的訓(xùn)練;測(cè)試集來(lái)自2017- 01 — 2017- 12的數(shù)據(jù),用于考察預(yù)測(cè)模型的準(zhǔn)確性與泛化性能;檢驗(yàn)集從訓(xùn)練集中無(wú)放回抽取5 000個(gè)樣本。樣本分布情況如圖4所示。 圖4中顯示了4類樣本(弱(價(jià)格小幅波動(dòng))、上(價(jià)格以上漲為主,下跌幅度不超過(guò)止損價(jià)格)、下(價(jià)格以下跌為主)、強(qiáng)(價(jià)格上下波動(dòng)的幅度均超過(guò)止盈價(jià)格))的占比情況,以及波動(dòng)強(qiáng)度信息,其中圖例中百分比的數(shù)值代表這類樣本占總體樣本數(shù)量的比例;最后的整數(shù)代表此類樣本的具體數(shù)量。圖中重疊較嚴(yán)重的區(qū)域,代表樣本分布密集。在樣本集劃分階段,主要關(guān)注樣本總體分布的平衡性。 訓(xùn)練過(guò)程模型擬合情況如圖5所示。從圖5(a)、5(b)中可以看到,漲、跌兩類樣本的準(zhǔn)確率在開(kāi)始階段波動(dòng)十分劇烈,多次觸及100%。然而不能將此時(shí)的模型作為最終的模型,因?yàn)檎倩芈?為方便查看,召回率被向上平移了0.1)此時(shí)還處于底部,即便是一味追求高勝率,而不關(guān)心模型的綜合盈利能力,也需結(jié)合圖5(c)的盈利指數(shù)變化情況,在模型迭代500次之后尋找準(zhǔn)確率高的位置選擇模型。 圖4 輸出數(shù)據(jù)分布 本文最終模型是在迭代訓(xùn)練1 500次之后選定的,從這個(gè)位置開(kāi)始上漲盈利指數(shù)已經(jīng)開(kāi)始逐漸下滑,而下跌盈利指標(biāo)相對(duì)保持平穩(wěn),說(shuō)明模型已經(jīng)開(kāi)始出現(xiàn)過(guò)擬合;而從圖5(c)可以看出,迭代1 530次時(shí),綜合盈利指數(shù)取得最大值,本文將其從保存的過(guò)程模型中調(diào)出,作為最終的預(yù)測(cè)模型。 預(yù)測(cè)模型的輸出形式為[y1,y2,y3,y4],每個(gè)分量的取值范圍為[0, 1]。為了提高預(yù)測(cè)結(jié)果的準(zhǔn)確率,將輸出閾值調(diào)整為[0.5, 1]內(nèi)的一個(gè)數(shù)值。當(dāng)閾值為0.77時(shí),預(yù)測(cè)結(jié)果為上漲與下跌的樣本分布情況如圖6所示。 從圖4(b)可知,測(cè)試集的樣本分布中漲跌樣本的分布數(shù)量分別為23%與22%,而圖6中顯示此時(shí)預(yù)測(cè)結(jié)果所對(duì)應(yīng)的分布數(shù)量分別為27%與31%。這一結(jié)果說(shuō)明預(yù)測(cè)模型學(xué)習(xí)到了一部分規(guī)律,使得預(yù)測(cè)結(jié)果的分布高于樣本的原始分布,但27%還沒(méi)有達(dá)到28.7%的最低概率要求。 圖5 預(yù)測(cè)模型訓(xùn)練過(guò)程曲線 圖6 閾值為0.77時(shí)預(yù)測(cè)結(jié)果為漲或跌的樣本分布 對(duì)圖4(a)觀察發(fā)現(xiàn),類別為“弱”的樣本在上漲樣本的附近分布比較密集,而預(yù)測(cè)為上漲和下跌的樣本中“弱”樣本都占據(jù)了40%以上的分布。為此,本文將盈虧限制調(diào)整為止損2美元,止盈5美元,其他參數(shù)保持不變。調(diào)整后,得到新的樣本分布如圖7所示,上漲與下跌的分布概率分別達(dá)到38.57%與38.27%,它們同時(shí)代表了預(yù)測(cè)的勝率,此時(shí)已經(jīng)高于最小成功概率(28.7%)將近10個(gè)百分點(diǎn)。 圖7 止損2美元時(shí)預(yù)測(cè)結(jié)果為漲或跌的樣本分布 通過(guò)繼續(xù)對(duì)閾值與止損價(jià)格進(jìn)行綜合調(diào)整,應(yīng)該還可以取得更好的預(yù)測(cè)準(zhǔn)確率,如果需要建立一個(gè)綜合盈利能力更強(qiáng)的預(yù)測(cè)模型,可以參考本文所給出的盈利指數(shù)計(jì)算方法,對(duì)閾值和止損價(jià)格進(jìn)行遍歷優(yōu)化。將預(yù)測(cè)模型應(yīng)用于自動(dòng)化交易系統(tǒng)之前,還需要對(duì)模型的連續(xù)虧損次數(shù)等數(shù)據(jù)進(jìn)行統(tǒng)計(jì),從而得到資金最大回撤幅度等風(fēng)險(xiǎn)指標(biāo),最終確定交易系統(tǒng)中的開(kāi)倉(cāng)比例等具體參數(shù)。 為了證實(shí)模型的通用性,將這種雙通道的結(jié)構(gòu)模型,在歐元兌美元的匯率指數(shù)變動(dòng)的預(yù)測(cè)中做了同樣的嘗試,選擇的輸入周期仍然是15 min與1 h,預(yù)測(cè)距離等其他參數(shù)保持不變。按照文中的方法,很容易得到一個(gè)積極的預(yù)測(cè)模型(準(zhǔn)確率高于28.7%)。 經(jīng)分析,取得積極預(yù)測(cè)效果的主要因素有3個(gè): 1)引入了樹(shù)結(jié)構(gòu)模型;2)時(shí)空分割法強(qiáng)化了數(shù)據(jù)內(nèi)部的關(guān)聯(lián);3)利用閾值來(lái)限制預(yù)測(cè)時(shí)機(jī),減少了一些不穩(wěn)定因素。為了證實(shí)樹(shù)結(jié)構(gòu)的優(yōu)勢(shì),引入文獻(xiàn)[7]中的建模方法,按如下步驟進(jìn)行對(duì)比實(shí)驗(yàn)。 第1步 選擇歸一化后的1 h的歷史收盤(pán)價(jià)格作為輸入序列,窗口長(zhǎng)度為60; 第2步 利用離散小波分解(db4)進(jìn)行降噪處理; 第3步 以降噪后的時(shí)序數(shù)據(jù)為輸入,利用自動(dòng)編碼器,建立三層編碼網(wǎng)絡(luò),節(jié)點(diǎn)數(shù)量設(shè)為50、30、20,傳遞函數(shù)為“tanh”; 第4步 以編碼結(jié)果為輸入,建立LSTM預(yù)測(cè)模型,并進(jìn)行簡(jiǎn)單訓(xùn)練; 第5步 聯(lián)合編碼網(wǎng)絡(luò)與LSTM網(wǎng)絡(luò)進(jìn)行整體調(diào)優(yōu)訓(xùn)練。 最后,在測(cè)試集上進(jìn)行預(yù)測(cè)。最終取得的準(zhǔn)確率為32.31%,經(jīng)過(guò)閾值調(diào)整,性能并沒(méi)有得到明顯提高。 根據(jù)多周期共振原理,建立樹(shù)結(jié)構(gòu)LSTM神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)模型,是金融時(shí)間序列預(yù)測(cè)的一種有效方法。配合本文設(shè)計(jì)的目標(biāo)類別標(biāo)定方法(見(jiàn)Y的表示方法)與過(guò)擬合監(jiān)控手段(引入盈利指數(shù)),預(yù)測(cè)性能可達(dá)到輔助交易的要求。這種樹(shù)結(jié)構(gòu)模型可進(jìn)一步融合多個(gè)關(guān)聯(lián)性較強(qiáng)的數(shù)據(jù)特征,如成交量、更多周期、關(guān)聯(lián)品種、相關(guān)基本面、消息面等信息。對(duì)這些數(shù)據(jù)特征的選擇需要一定的實(shí)踐經(jīng)驗(yàn)作為支撐,否則不但會(huì)增加訓(xùn)練成本,還達(dá)不到理想的預(yù)測(cè)效果。為提高預(yù)測(cè)的準(zhǔn)確率,本文的方法是調(diào)整盈虧比以及限制預(yù)測(cè)的精度。實(shí)踐發(fā)現(xiàn),并非所有訓(xùn)練得到的模型都能夠在提高閾值精度條件下,同時(shí)提高預(yù)測(cè)的準(zhǔn)確性,這一問(wèn)題并未在文中進(jìn)行著重提出,有待進(jìn)一步研究。2.2 網(wǎng)絡(luò)模型
3 評(píng)價(jià)指標(biāo)
4 實(shí)證結(jié)果與分析
5 結(jié)語(yǔ)