林 杰 李英超
(同濟大學(xué)經(jīng)濟與管理學(xué)院,上海 200092)
期貨市場是資本市場的重要分支,有著套期保值、發(fā)現(xiàn)價格等功能。期貨分為商品期貨和金融期貨,其中商品期貨的標的一般是大宗商品,比如農(nóng)產(chǎn)品、化工產(chǎn)品、有色金屬等。期貨價格的預(yù)測研究,對于金融市場和商品市場都有著重要的意義。
對于期貨價格可預(yù)測性的爭論,可以追溯到金融領(lǐng)域的兩個基本理論:有效市場理論和行為金融理論。有效市場理論認為,市場中的交易者是理性的,證券價格變化起因于市場上的新消息,并且新消息一出現(xiàn)就立刻被市場消化。由此,股市上的歷史數(shù)據(jù)是無用的,自然也不能通過歷史預(yù)測未來。行為金融學(xué)的觀點與之相反,它認為市場中交易者是非理性的,并且是系統(tǒng)性地非理性,即總是在特定的環(huán)境下,產(chǎn)生特定的偏差。前景理論指出人們面對收益時厭惡風險,面對損失時卻偏好風險。行為金融學(xué)間接肯定了“歷史將會重現(xiàn)”,這是技術(shù)分析的哲學(xué)基礎(chǔ),也是價格可預(yù)測性的理論背書。
價格預(yù)測相關(guān)的實證研究,可以分為兩類:價格影響因素研究和價格預(yù)測研究。
商品期貨兼具金融屬性和商品屬性,其價格的影響因素既包括金融環(huán)境因素,也包括商品供需因素。對于金融市場上的影響因素,Melichar等使用SVAR模型,分析了原油市場的沖擊對農(nóng)產(chǎn)品價格的影響,發(fā)現(xiàn)石油的需求方顯著影響各類農(nóng)產(chǎn)品的價格,但在供給方向上影響較小。Fernandez-Diaz等利用DCC-GARCH模型研究了農(nóng)產(chǎn)品與原油價格、宏觀經(jīng)濟變量和標普指數(shù)之間的關(guān)系,文章指出,玉米的金融化與原油價格間存在一定的聯(lián)動性,標普指數(shù)對其聯(lián)動性的影響較大。對于商品市場上的影響因素,李京棟等選取了大慶原油價格、化肥和農(nóng)機費用、氣溫月數(shù)據(jù)等變量構(gòu)建VAR模型,分析其對大蒜價格變動的動態(tài)影響。結(jié)果證明,貨幣因素、成本因素、氣候因素對大蒜價格都具有顯著的影響。Radha等通過ECM模型探究了農(nóng)產(chǎn)品的現(xiàn)貨與期貨之間的關(guān)系,發(fā)現(xiàn)現(xiàn)貨價格與近月期貨合約價格間存在協(xié)整關(guān)系。可以看出,相關(guān)性研究的研究范式如下:首先使用計量模型擬合數(shù)據(jù),進而進行變量間的相關(guān)關(guān)系解釋。
計量模型也可以用于價格預(yù)測的研究,但是隨著技術(shù)發(fā)展,機器學(xué)習(xí)模型逐漸成為價格預(yù)測領(lǐng)域的主流方法。傳統(tǒng)的機器學(xué)習(xí)方法,如人工神經(jīng)網(wǎng)絡(luò)、SVM等模型,適合處理結(jié)構(gòu)化數(shù)據(jù),在早期價格預(yù)測文獻中被廣泛使用。對于非結(jié)構(gòu)化的高維數(shù)據(jù), 以CNN、 LSTM為代表的深度學(xué)習(xí)模型是首選建模方法。LSTM適合處理時間序列,最早由Hochreiter和Schmidhuber提出,而后Schmidhuber的學(xué)生Alex Graves等將雙向LSTM應(yīng)用于語音識別,并取得了優(yōu)于隱馬爾可夫模型的分類效果;CNN適合處理圖像分類,2012年Alex Krizhevsky等人使用深層的CNN贏得了當年的ImageNet視覺識別比賽,并大幅度減低了分類誤差。此后,CNN和RNN模型受到了學(xué)者的廣泛關(guān)注,其在價格預(yù)測領(lǐng)域也逐漸受到重視。林杰和龔正采用BP神經(jīng)網(wǎng)絡(luò)和卷積神經(jīng)網(wǎng)絡(luò)(CNN)對滬鋅期貨價格漲跌進行預(yù)測,兩個模型都有不錯的預(yù)測準確度。胡聿文提出一種基于PCA和LASSO的LSTM神經(jīng)網(wǎng)絡(luò)股票價格預(yù)測模型,經(jīng)過對比發(fā)現(xiàn),PCA-LSTM模型能夠大幅削減數(shù)據(jù)冗余,并且獲得了更優(yōu)異的預(yù)測精度。景楠等提出了一種CNN-LSTM混合網(wǎng)絡(luò),并在 LSTM端引入注意力機制進行優(yōu)化,相比于CNN、LSTM、CNN-LSTM等基準模型,該改進模型顯著提高了預(yù)測準確度。有些學(xué)者也嘗試了將深度學(xué)習(xí)模型與其他模型結(jié)合使用。Jin等在股票預(yù)測中考慮了投資者情緒因素,并通過EMD模態(tài)分解后用LSTM對價格進行預(yù)測,提高了預(yù)測精度,降低了時延。Kim等將LSTM與GARCH模型進行結(jié)合,對股票波動性進行預(yù)測,同樣提高了預(yù)測準確度。
價格影響因素研究和價格預(yù)測研究應(yīng)該是緊密的遞進關(guān)系。然而在以往的文獻中,學(xué)者常割裂地看待二者,要么只是研究變量之間的相關(guān)關(guān)系,要么只是做價格預(yù)測而對變量的相關(guān)性不加任何證明。對此,本文提出改進,將價格影響因素研究作為價格預(yù)測的前置研究:在影響因素研究部分采用計量回歸的研究范式,進行回歸擬合和相關(guān)性分析;在價格預(yù)測研究部分采用深度學(xué)習(xí)研究范式,進行模型設(shè)計和預(yù)測效果分析。
本文的另一個創(chuàng)新點在于深度學(xué)習(xí)模型網(wǎng)絡(luò)結(jié)構(gòu)的設(shè)計。通過文獻分析可以看出,日度數(shù)據(jù)是學(xué)者在研究中普遍使用的數(shù)據(jù)粒度,但是日度數(shù)據(jù)樣本量較少,使用深度學(xué)習(xí)模型容易產(chǎn)生過擬合或陷入局部最優(yōu)。以往的研究在設(shè)計模型結(jié)構(gòu)時并沒有重點考慮這一問題。對此,本文設(shè)計了一個更為合理的多輸入多輸出神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu),通過多個預(yù)測目標訓(xùn)練共享網(wǎng)絡(luò),提高了特征提取的效率,取得了更高預(yù)測準確度。
本文的研究思路如圖1所示:首先做相關(guān)性研究,驗證輸入數(shù)據(jù)與價格之間的相關(guān)關(guān)系(圖中步驟1),而后進行深度學(xué)習(xí)模型設(shè)計和訓(xùn)練(圖中步驟二),最后檢驗該模型的預(yù)測效果是否有提高(步驟三)。
本文將采集到的數(shù)據(jù)分為兩類:一類是現(xiàn)貨商品的數(shù)據(jù),比如現(xiàn)貨價格、現(xiàn)貨庫存等;另一類是期貨的交易數(shù)據(jù),比如持倉量、成交量等。之所以選擇這兩類數(shù)據(jù),是因為商品期貨兼具金融屬性和商品屬性,金融市場和商品市場的信息同時影響期貨價格。
圖1 研究思路
在步驟一“相關(guān)性驗證”中,本文只驗證現(xiàn)貨商品的數(shù)據(jù)與期貨價格的相關(guān)性。這是因為,現(xiàn)貨價格、現(xiàn)貨庫存對期貨價格的影響方式簡單,易于構(gòu)建回歸方程;而期貨交易數(shù)據(jù)對期貨價格的影響是復(fù)雜非線性的,且是基于經(jīng)驗的,沒有理論支持,難以先驗地構(gòu)建回歸方程。由于理論價值不大,以往學(xué)者也較少去論證期貨交易數(shù)據(jù)對價格的影響。
在步驟二,本文設(shè)計了一個多輸入多輸出的神經(jīng)網(wǎng)絡(luò),其輸入特征為現(xiàn)貨數(shù)據(jù)和期貨交易數(shù)據(jù),輸出的預(yù)測指標有三個:期貨收盤價、期貨短期漲跌和期貨長期漲跌。使用多個目標訓(xùn)練共享網(wǎng)絡(luò),可以幫助網(wǎng)絡(luò)提取多維度特征,從而使得深度學(xué)習(xí)模型在較少的樣本下,也可以獲得較好的預(yù)測效果。
步驟二是本文的研究重點,步驟一對步驟二起到了輔助作用?!跋嚓P(guān)性驗證”一方面彌補了深度學(xué)習(xí)“黑盒”的缺點,為深度學(xué)習(xí)模型提供了更多的可解釋性;另一方面驗證了輸入數(shù)據(jù)與預(yù)測指標的相關(guān)性,避免了“Garbage In Garage Out”的問題。
在步驟三,本文對模型的預(yù)測效果進行量化和對比,證明該模型的優(yōu)越性。
本文選取的現(xiàn)貨相關(guān)因素包括兩個,一個是現(xiàn)貨的價格,另一個是現(xiàn)貨的社會庫存。理論上,現(xiàn)貨價格和期貨價格是正相關(guān)的;庫存和期貨價格負相關(guān),因為庫存是商品供需關(guān)系的另一種表現(xiàn)。當供大于求時,社會庫存將增加,當供小于求時,社會庫存將減少。
大多數(shù)金融時間序列都是不平穩(wěn)的,直接對非平穩(wěn)時間序列進行回歸,可能產(chǎn)生偽回歸,所以本文通過協(xié)整檢驗進行變量間相關(guān)性的驗證。協(xié)整檢驗的經(jīng)典方法是EG兩步法。EG兩步法的前提是兩個序列同階單整,即兩個序列經(jīng)過相同次數(shù)的差分后可以達到平穩(wěn)狀態(tài)。序列的平穩(wěn)性可以通過ADF檢驗進行驗證。
EG兩步法的第一步是回歸擬合,根據(jù)上文分析,可以構(gòu)建如下回歸方程:
future_pricet=a1+b1*inventoryt+ecm1t
(1)
future_pricet=a2+b2*current_pricet+ecm2t
(2)
其中future_pricet表示期貨價格,current_pricet表示現(xiàn)貨價格,inventoryt表示庫存數(shù)量。b1和b2應(yīng)該一個為負一個為正,分別表示負相關(guān)和正相關(guān)。
EG兩步法的第二步是對殘差ecmt進行平穩(wěn)性檢驗,若殘差平穩(wěn),則存在協(xié)整關(guān)系。
“協(xié)整”的概念與經(jīng)濟學(xué)中“均衡”的概念有本質(zhì)的聯(lián)系,即兩個統(tǒng)計上協(xié)整的序列,在經(jīng)濟學(xué)意義上應(yīng)該存在某種均衡。此時從經(jīng)濟意義上來看,殘差ecmt代表了價格理論值與實際值的偏差,當本期價格產(chǎn)生偏差時,下一期的價格將向回調(diào)整,此特性正好可以用來預(yù)測價格。
深度學(xué)習(xí)模型是通過最小化預(yù)測誤差來進行學(xué)習(xí)的。理論上,通過監(jiān)督學(xué)習(xí),神經(jīng)網(wǎng)絡(luò)可以自動提取特征,擬合樣本和標簽之間的復(fù)雜函數(shù)關(guān)系。但是自動的特征提取并不總能成功。深層神經(jīng)網(wǎng)絡(luò)參數(shù)量龐大,表達能力過剩,當樣本量不足時,模型訓(xùn)練可能很快陷入局部最優(yōu)或者出現(xiàn)過擬合。而期貨價格預(yù)測的研究又天然存在樣本量較少的問題。針對這一問題,本文設(shè)計了一個多輸入多輸出的網(wǎng)絡(luò)結(jié)構(gòu),通過多個預(yù)測目標來訓(xùn)練共享網(wǎng)絡(luò),幫助網(wǎng)絡(luò)提取多維度的特征,一定程度上避免陷入局部最優(yōu)和過擬合,同時加快了模型的學(xué)習(xí)速度。
該模型的網(wǎng)絡(luò)結(jié)構(gòu)如圖2所示,左半邊為收盤價預(yù)測,右半邊為漲跌預(yù)測。漲跌預(yù)測有兩個預(yù)測目標:短期漲跌(期貨收盤價的日度差價)和長期漲跌(期貨未來7天的平均收盤價與今天的差價,本文引入這一變量是為了度量期貨價格的長期趨勢)。兩個預(yù)測目標共享一個卷積層,使得卷積層提取的特征既包含長期趨勢,又包含短期趨勢。CNN層后是LSTM,而后是全連接層,最后通過單個神經(jīng)元輸出預(yù)測值。收盤價預(yù)測網(wǎng)絡(luò)只有一個預(yù)測目標,所以直接使用LSTM提取時空特征,將提取后的特征與漲跌預(yù)測網(wǎng)絡(luò)的提取的長期趨勢和短期趨勢整合,然后輸入全連接層,再通過單個神經(jīng)元輸出預(yù)測值。神經(jīng)網(wǎng)絡(luò)從上到下,特征在不斷整合、提純、濃縮,特征數(shù)依次遞減。CNN層提取空間特征,LSTM提取時間特征,最后將提取后的高級特征送入全連接網(wǎng)絡(luò)。全連接網(wǎng)絡(luò)的表達能力是最強的,同時學(xué)習(xí)代價也更高,所有只在最后一步使用。
漲跌預(yù)測網(wǎng)絡(luò)根據(jù)CNN和LSTM的結(jié)構(gòu)特點,整合二者進行特征提取。本文用于訓(xùn)練的輸入特征是一個二維向量,由多個一維時間序列橫向拼接而成,可以形象地將橫向看作空間維度,縱向看作時間維度。CNN提取特征的方式是將多個時間序列進行線性組合。假設(shè)共有m個序列,使用1 x m的卷積核,CNN便可以自適應(yīng)地對這m個時間序列進行線性組合。設(shè)置多個這樣的卷積核,便可以得出原序列的多個不同的線性組合,理論上可以模擬任何基于特征組合的技術(shù)分析指標(如布林帶)。LSTM提取特征的方式是使用循環(huán)核在時間步上移動,LSTM的隱藏層單元將記錄下每一個時間步獲得的信息,在最后一步輸出結(jié)果。CNN和LSTM網(wǎng)絡(luò)的整合結(jié)構(gòu)如圖3。
圖2 模型網(wǎng)絡(luò)結(jié)構(gòu)
圖3 CNN和RNN整合結(jié)構(gòu)圖
收盤價預(yù)測網(wǎng)絡(luò)(圖2左半部分)合理利用了漲跌預(yù)測網(wǎng)絡(luò)提取的高級特征。圖中abs_feature為收盤價預(yù)測網(wǎng)絡(luò)提取的特征,可以粗略地定位收盤價的位置;long_feature為長期漲跌網(wǎng)絡(luò)提取的特征,預(yù)測了長期趨勢;short_feature為短期漲跌網(wǎng)絡(luò)提取的特征,預(yù)測了短期趨勢。整合三個特征后輸入全連接層,全連接層通過學(xué)習(xí),充分理解三個特征后給出預(yù)測結(jié)果。
該模型的多個目標既有一定的獨立性,又相互關(guān)聯(lián)。獨立性保證了網(wǎng)絡(luò)可以提取數(shù)據(jù)中的多維度特征,關(guān)聯(lián)性使得各個網(wǎng)絡(luò)提取的特征都有助于幫助其他網(wǎng)絡(luò)提高預(yù)測準確性。
由于三個待預(yù)測序列的結(jié)構(gòu)特點不同,本文使用不同方法對三者進行檢驗。
期貨的價格依照一定的趨勢進行波動,規(guī)律性較強,預(yù)測的準確度較高,本文使用對比實驗來檢驗本模型的預(yù)測效果。對照模型是單輸入單輸出的CNN-LSTM混合網(wǎng)絡(luò),這是目前預(yù)測效果最佳的模型之一。傳統(tǒng)機器學(xué)習(xí)模型,如SVM,對于非結(jié)構(gòu)化數(shù)據(jù)的預(yù)測效果不佳,這已經(jīng)得到了許多驗證,所以不再將其與本文模型進行對比。用于對比的指標使用預(yù)測誤差率,計算公式如下:
(3)
期貨的漲跌波動十分頻繁且類似于白噪聲,任何預(yù)測模型都難以取得很高的預(yù)測準確度,所以本文使用間接法進行預(yù)測效果檢驗。漲跌網(wǎng)絡(luò)的預(yù)測值的大小,某種程度上表示了對漲跌看法的強弱:輸出大的正數(shù),表示強烈看漲;輸出大的負數(shù)表示強烈看跌;輸出0,表示觀望。為了度量預(yù)測結(jié)果的有效性,制定如下簡單投資策略:預(yù)測上漲多少,就買入多少;預(yù)測下跌多少,就賣出多少。該策略收益計算公式如式2.4,其中delt_price_truet是真實的漲跌,delt_price_predt是預(yù)測的漲跌。
revenuet=delt_price_truet*delt_price_predt
(4)
如果該投資策略可以獲得正的收益,則說明模型的漲跌預(yù)測是有效的。
本文選取PTA期貨作為研究對象,采集了PTA近5年的數(shù)據(jù)(2016—2021),數(shù)據(jù)的概覽如表1。
表1 數(shù)據(jù)概覽
表中“PTA華東市場價格”、“PTA到岸價(CIF)”、“PTA社會庫存”為現(xiàn)貨數(shù)據(jù),對于這部分數(shù)據(jù),本文將通過計量方法驗證其與期貨收盤價的關(guān)系。表中其余的數(shù)據(jù)為期貨交易數(shù)據(jù)或金融市場數(shù)據(jù),如前文論述,不再驗證這部分數(shù)據(jù)與期貨價格的相關(guān)性。
驗證后的數(shù)據(jù)將用于深度學(xué)習(xí)模型的訓(xùn)練。模型的預(yù)測目標(訓(xùn)練集標簽)共有3個: “PTA收盤價”、“PTA價格1日漲跌”和“PTA價格7日漲跌”。
模型的輸入(訓(xùn)練集樣本特征)為表中的所有數(shù)據(jù)(除“PTA價格7日漲跌”),共17個時間序列。對于模型輸入,本文進行了嚴格的時間界定,保證所有的輸入數(shù)據(jù)都比預(yù)測目標至少滯后1天。
將“華東市場現(xiàn)貨價格”、“PTA到岸價格”和“PTA社會庫存”,分別命名為martketing_pricet、cif_pricet和inventoryt,將期貨收盤價命名為pricet。其中cif_pricet原始數(shù)據(jù)單位為美元,這里已經(jīng)通過匯率折算為人民幣;庫存為周數(shù)據(jù),構(gòu)建庫存和期貨價格的回歸方程時,將期貨價格以周為單位求平均。
對變量進行ADF檢驗,所有變量都是一階單整,滿足協(xié)整檢驗的要求(表2)。分別以martketing_pricet、cif_pricet和inventoryt為被解釋變量,建立三個一元線性回歸方程:
pricet=967.242(0.000***)+0.808(0.000***)*market_pricet+ecm1t
(5)
pricet=926.043(0.000***)+0.933(0.000***)*cif_pricet+ecm2t
(6)
pricet=6203.324(0.000***)-0.622(0.000***)*inventoryt+ecm3t
(7)
可以看出,三個回歸方程的回歸系數(shù)都是顯著的,且殘差在95%的置信水平下達到平穩(wěn)(表3),說明三個協(xié)整關(guān)系都是成立的。由此可得出結(jié)論:1)PTA期貨收盤價和現(xiàn)貨價格存在長期均衡關(guān)系,相關(guān)關(guān)系為正相關(guān);2)PTA期貨收盤價和現(xiàn)貨的社會庫存存在長期均衡,二者負相關(guān)。回歸方程中的ecmt為價格理論值與實際值的偏差,根據(jù)協(xié)整關(guān)系的誤差修正特性,當實際值偏離理論值時,未來價格將向誤差的相反方向調(diào)整,這一特性說明:現(xiàn)貨價格和現(xiàn)貨庫存都可以作為價格預(yù)測的輸入特征。
表2 “社會庫存”和“收盤價”的ADF檢驗
表3 殘差A(yù)DF檢驗
本次實驗選取了PTA期貨近5年的數(shù)據(jù),共有樣本1231個。對樣本進行劃分,訓(xùn)練集比例為0.8,共984個樣本;測試集比例為0.2,共247個樣本。在訓(xùn)練之前,對數(shù)據(jù)進行歸一化處理,收盤價數(shù)據(jù)歸一化到(0,1)之間,計算公式如3.4;漲跌數(shù)據(jù)歸一化到(-1,1)之間,計算公式如3.5)。
(8)
(9)
模型的輸入有兩個(圖2中的兩個InputLayer),分別用來預(yù)測收盤價和漲跌,兩個輸入是相同的,由同一份數(shù)據(jù)復(fù)制得到的。該輸入特征由17個時間序列橫向拼接而成(如表3.1),每個特征序列包含60天的歷史數(shù)據(jù),即模型的輸入為60x17的二維向量。模型輸出的預(yù)測指標共有3個:收盤價、短期漲跌和長期漲跌,三個預(yù)測指標都是標量。
漲跌預(yù)測網(wǎng)絡(luò)(圖2右半部分)的卷積層包含10個卷積核,卷積核步長為1,只進行空間卷積,保留序列的時間特征。卷積層經(jīng)過relu激活函數(shù)后輸出,其提取的特征simple_feature將作為公共特征,供短期漲跌和長期漲跌預(yù)測共用。兩個漲跌預(yù)測網(wǎng)絡(luò)結(jié)構(gòu)相同,在CNN后是依次是兩個LSTM層,一個全連接層,最后通過單個神經(jīng)元輸出預(yù)測值。兩個LSTM層隱藏單元個數(shù)分別是10和8,對參數(shù)設(shè)置0.2的dropout,防止訓(xùn)練中出現(xiàn)過擬合。全連接層神經(jīng)元個數(shù)為5,激活函數(shù)為tanh。最后的輸出神經(jīng)元不設(shè)置激活函數(shù),全連接層的輸出值在該神經(jīng)元進行線性組合,最終輸出預(yù)測值。
收盤價預(yù)測網(wǎng)絡(luò)(圖2左半部分)的兩個LSTM層與漲跌預(yù)測網(wǎng)絡(luò)中的兩層LSTM結(jié)構(gòu)相同。經(jīng)過兩層LSTM后,網(wǎng)絡(luò)提取出absolute_feature,將其與漲跌預(yù)測網(wǎng)絡(luò)提取的long_feature和short_feature橫向拼接,得到mix_feature。mix_feature輸出到全連接層,由全連接層對三個高級特征進行最后的分析和組合。全連接層神經(jīng)元個數(shù)為5,激活函數(shù)為sigmoid。最后的輸出神經(jīng)元同樣不設(shè)置激活函數(shù)。
三個預(yù)測目標的損失函數(shù)均選擇均方誤差。收盤價網(wǎng)絡(luò)的預(yù)測誤差較小,漲跌網(wǎng)絡(luò)的預(yù)測誤差較大,所以對三個損失函數(shù)設(shè)置不同的權(quán)重,保證加權(quán)后三者大小在同一數(shù)量級。經(jīng)過實驗,最終將收盤價預(yù)測網(wǎng)絡(luò)、短期漲跌預(yù)測網(wǎng)絡(luò)和長期漲跌預(yù)測網(wǎng)絡(luò)的損失函數(shù)權(quán)重設(shè)置為10:2:1。選擇Adam算法對模型進行優(yōu)化,這是目前最受認可的優(yōu)化算法,可以自適應(yīng)地調(diào)整學(xué)習(xí)步長,適用于大多數(shù)優(yōu)化任務(wù)。算法的超參數(shù)使用Tensorflow推薦的默認參數(shù),學(xué)習(xí)率為0.001。經(jīng)過100此迭代后模型收斂。
2.4.1漲跌預(yù)測結(jié)果分析
漲跌預(yù)測結(jié)果如圖4(數(shù)據(jù)已歸一化),上方圖表為短期漲跌預(yù)測,下方圖表為長期漲跌預(yù)測。其中藍色折線為真實漲跌值,紅色折線為預(yù)測的漲跌值。可以看出,長期漲跌預(yù)測值較好地刻畫了真實值,尤其在價格出現(xiàn)明顯漲跌時,預(yù)測值與真實值很接近;短期預(yù)測網(wǎng)絡(luò)的輸出信號在0附近波動,預(yù)測值與真實值相差較大,但漲跌的趨勢是一致的。這與實際情況相符合:期貨交易中有大量的噪聲,價格的長期趨勢具有較高的可預(yù)測性,但短期趨勢更多地是噪聲主導(dǎo),可預(yù)測性較低。
圖4 神經(jīng)網(wǎng)絡(luò)預(yù)測結(jié)果
在測試集上計算各個樣本的revenuet,結(jié)果如表4,短期漲跌預(yù)測網(wǎng)絡(luò)指導(dǎo)的投資,平均日收益是51.25元;長期漲跌預(yù)測網(wǎng)絡(luò)指導(dǎo)的投資,平均日收益為2774.83元。需要指出的是,長期漲跌的計算方式是未來7天的均價減去當天的均價,這個值是未來的平均值,不是真實存在的,所以也無法以這個“未來價格”進行賣出,這里的買賣是對理想情況的一種模擬。對revenuet進行0均值T檢驗。結(jié)果顯示(表4),長期收益在99%的置信水平下大于0,短期收益在95%的置信水平下大于0。由此可以得出結(jié)論,長短期預(yù)測網(wǎng)絡(luò)都可以有效地預(yù)測收盤價的漲跌值。
表4 收益的0均值T檢驗
2.4.2收盤價預(yù)測結(jié)果分析
訓(xùn)練并調(diào)整對照模型(CNN-LSTM混合網(wǎng)絡(luò))的參數(shù)到最優(yōu)。兩個模型的價格預(yù)測效果如圖4(數(shù)據(jù)已歸一化),其中紅色折線為預(yù)測值,藍色折線為真實值。計算兩個模型在訓(xùn)練集上的預(yù)測誤差,對比結(jié)果如圖5。
圖5 模型預(yù)測效果對比圖
圖6 模型的誤差對比圖
對兩組誤差數(shù)據(jù)進行萊文方差等同性檢驗,得F值為25.58,P值為0.000,在99%的置信水平下,兩組誤差方差不同。本文模型預(yù)測誤差的方差更小,預(yù)測結(jié)果更穩(wěn)定。進行異方差的T檢驗(表5),零假設(shè)H0為“二者均值相等”,得到P值為0.00,在99%的置信水平否定原假設(shè),即:二者誤差均值不相等,本模型的預(yù)測精度高于對照模型。
表5 均值相等檢驗-T檢驗
商品期貨既有金融屬性又有商品屬性,研究其價格預(yù)測具有重要的理論和實踐意義。該研究領(lǐng)域很早就受到學(xué)者關(guān)注,并且如今依舊活躍。與以往文獻相比,本文的貢獻主要有兩點:
(1)本文采用了“相關(guān)性驗證+價格預(yù)測”的兩階段研究設(shè)計,將價格影響因素研究作為價格預(yù)測的前置研究:在影響因素研究部分采用計量回歸的研究范式,進行回歸擬合和相關(guān)性驗證;在價格預(yù)測研究部分采用深度學(xué)習(xí)研究范式,進行模型設(shè)計和預(yù)測效果分析。變量間的相關(guān)性驗證一方面彌補了深度學(xué)習(xí)模型可解釋性較弱的缺陷,另一方面也保證了數(shù)據(jù)質(zhì)量,避免了深度學(xué)習(xí)中常見的“Garbage In Garbage Out”的問題。
(2)針對期貨收盤價預(yù)測問題中樣本量偏少(對于深度學(xué)習(xí)模型來說)的問題,本文設(shè)計了一個多輸入多輸出的深度學(xué)習(xí)模型。該模型通過多個預(yù)測目標訓(xùn)練共享網(wǎng)絡(luò),提高了特征提取的效率。文中以PTA期貨為算例,證明了該模型的優(yōu)越性:1)對于收盤價預(yù)測,該模型的預(yù)測誤差顯著小于CNN-LSTM混合模型;2)對于收盤價漲跌預(yù)測,本文根據(jù)預(yù)測結(jié)果模擬投資,獲得了正的收益。