斯燕 陳藝
摘要:隨著國際大宗商品在金融和經(jīng)濟(jì)領(lǐng)域的影響力不斷增強(qiáng),會通過產(chǎn)業(yè)間的波及效應(yīng)作用于物價水平,進(jìn)而影響到國家的經(jīng)濟(jì)增長。近幾年掀起了機(jī)器學(xué)習(xí)研究的熱潮,基于機(jī)器學(xué)習(xí)的投資量化分析也越來越受到關(guān)注。文章基于LSTM神經(jīng)網(wǎng)絡(luò)模型,選取了2021年9月至12月底的鐵礦石主力合約高頻數(shù)據(jù)建立了趨勢預(yù)測模型。實驗結(jié)果表明,該模型擬合良好,能夠較好地預(yù)測鐵礦石期貨短期內(nèi)的趨勢。
關(guān)鍵詞:機(jī)器學(xué)習(xí);LSTM神經(jīng)網(wǎng)絡(luò)模型;鐵礦石期貨;量化投資
一、引言
隨著社會經(jīng)濟(jì)的不斷增長,科學(xué)技術(shù)的不斷提高,機(jī)器學(xué)習(xí)在對數(shù)據(jù)分析方面展現(xiàn)其絕對優(yōu)勢。在信息時代的今天,合理應(yīng)用機(jī)器學(xué)習(xí)技術(shù)具有十分重要的作用,它可以科學(xué)高效地處理海量數(shù)據(jù)信息,給人們的生活和工作帶去極大的便利,各行各業(yè)也在該技術(shù)的發(fā)展應(yīng)用中不斷進(jìn)步,尤其將機(jī)器學(xué)習(xí)模型應(yīng)用到量化交易市場越來越受到重視和追捧。在大數(shù)據(jù)背景下,利用機(jī)器學(xué)習(xí)技術(shù)不僅對大宗商品市場的發(fā)展與趨勢預(yù)測都有很重要的影響,而且對我國經(jīng)濟(jì)發(fā)展也起到非常重要的影響。近幾年大型證券公司、私募基金、金融機(jī)構(gòu)紛紛增加人力物力財力進(jìn)行機(jī)器學(xué)習(xí)量化模型構(gòu)建與策略分析。
鐵礦石是鋼鐵行業(yè)的重要原料之一,被我國廣泛應(yīng)用,需求量非常大,因此鐵礦石價格的波動對我國相關(guān)企業(yè)以及國民經(jīng)濟(jì)都有重要影響。鐵礦石期貨是一種金融衍生產(chǎn)品,一般是以鐵礦石原料為標(biāo)的物的期貨品種,并且利用期貨合約的標(biāo)準(zhǔn)化特性,在未來約定的時間進(jìn)行交割的交易合同。我國2013年開始可以在大連商品交易所上市交易鐵礦石期貨合約,至今一直保持著穩(wěn)步發(fā)展,合約制度日趨合理。通過大量閱讀參考文獻(xiàn),發(fā)現(xiàn)目前國內(nèi)外專家學(xué)者針對鐵礦石期貨研究主要圍繞:期貨價格影響因素研究;鐵礦石期貨國際化研究;鐵礦石期貨的量化分析,其中有傳統(tǒng)的時間序列模型分析和人工智能算法研究。專家學(xué)者們在進(jìn)行量化交易的大量研究成果中提出了理論模型,并通過實證研究對模型進(jìn)行檢驗,不斷優(yōu)化與完善。同時發(fā)現(xiàn)當(dāng)前基于機(jī)器學(xué)習(xí)的量化投資模型更多集中在股票市場,大宗商品期貨市場并不多。因此本文嘗試通過LSTM神經(jīng)網(wǎng)絡(luò)模型對鐵礦石期貨市場進(jìn)行量化分析,以便為后續(xù)進(jìn)行更深入研究起到拋磚引玉的作用。
二、影響鐵礦石期貨價格因素
大宗商品主要由能源商品、基礎(chǔ)原材料以及農(nóng)副產(chǎn)品組成,鐵礦石的價格波動在大宗商品中異?;钴S,而且我國是鐵礦石進(jìn)口大國,對外依存度相當(dāng)高,因此對其價格波動進(jìn)行預(yù)測是非常必要。想了解其價格變化,需要深入研究影響鐵礦石價格波動的因素。
(一)供需因素
在對鐵礦石價格運(yùn)用LSTM神經(jīng)網(wǎng)絡(luò)模型預(yù)測前需要分析其價格波動的影響因素。根據(jù)美國地質(zhì)調(diào)查局(USGS)在《Mineral Commodity Summaries 2021》報告中公布,全球2020年鐵礦石原礦的儲量約1800億噸。全球鐵礦石資源主要集中在四個國家(澳大利亞、巴西、俄羅斯和中國),可用鐵礦石儲量共占全球儲量的70%以上。鐵礦石是鋼鐵的重要原料,基礎(chǔ)設(shè)施、樓宇建設(shè)等領(lǐng)域均需大量的鋼鐵,盡管我國是鐵礦石儲量和產(chǎn)量大國,但每年依然進(jìn)口大量鐵礦石且逐年攀升,從2015年起鐵礦石對外依存度突破80%,截至2021年年末,進(jìn)口量為11.26億噸,當(dāng)年全球鐵礦石產(chǎn)量約為26億噸,近一半的鐵礦石進(jìn)口到我國。從我國鐵礦石進(jìn)口來源地來看,據(jù)統(tǒng)計,2021年我國主要從澳大利亞和巴西進(jìn)口,從澳大利亞進(jìn)口鐵礦石達(dá)到6.94億噸,盡管進(jìn)口量下降2.7%;但占全部進(jìn)口礦的比重為61.65%,比重依然很高。從巴西進(jìn)口鐵礦石2.38億噸,進(jìn)口量增長0.8%,占全部進(jìn)口礦比重21.10%。鐵礦石價格比2020年上升1.6%,其價格上漲并沒有讓非主流礦占比擴(kuò)大,相反使得供給端更為集中。通過數(shù)據(jù)預(yù)計未來我國依然是全球鐵礦石進(jìn)口大國,鐵礦石高度依賴從澳大利亞和巴西兩國進(jìn)口。當(dāng)供給量下降或需求量提升,鐵礦石的價格就會上漲。
(二)政治及政策因素
國際政治因素對期貨價格波動起著非常重要的作用。澳大利亞是我國鐵礦石主要輸出國,但隨著中澳關(guān)系日趨緊張,我國從澳大利亞鐵礦石進(jìn)口量明顯減少,數(shù)據(jù)顯示,2021年前11個月,中國自澳大利亞進(jìn)口同比下降了4.9%還不到2020年全年的九成,但同年基礎(chǔ)建設(shè)規(guī)模保持穩(wěn)定增長,因此對鐵礦石的需求依然強(qiáng)勁,在雙重作用下,鐵礦石在2021年6月高達(dá)214.43美元/噸,超2019年均價2倍以上。國內(nèi)政策因素對鐵礦石期貨價格在短期內(nèi)有較強(qiáng)的影響,我國近幾年一直提倡綠色環(huán)保理念,因此對礦石開采已經(jīng)鋼鐵廠的污水排放、環(huán)境污染等環(huán)保指標(biāo)有嚴(yán)格要求,這讓許多小規(guī)模的礦石開采企業(yè)出現(xiàn)成本增加,開工工時縮短,開工率不足等問題,直接導(dǎo)致本國鐵礦石供給量下降,從而推高鐵礦石價格。
(三)金融貨幣因素
國際鐵礦石的價格是以美元計價,中國進(jìn)口鐵礦石需要支付外匯,匯率的波動直接影響國內(nèi)鐵礦石的價格。美元如果上漲意味著需要花更多的人民幣進(jìn)口鐵礦石,購買相同數(shù)量的鐵礦石將支付更高的成本,因此國內(nèi)的進(jìn)口商們會減少鐵礦石進(jìn)口量。美國進(jìn)入加息縮減美債周期,美元進(jìn)入強(qiáng)勢上漲通道,2021年1美金兌換6.4元人民幣,進(jìn)入2022年7月之后美元匯率一路走高,已經(jīng)突破1美金兌換7元人民,未來還會持續(xù)上漲,這對我國的出口貿(mào)易有著非常好的支撐,但進(jìn)口鐵礦石顯然不利。
(四)經(jīng)濟(jì)發(fā)展因素
鐵礦石價格在很大程度上受經(jīng)濟(jì)發(fā)展的影響,如2008年歐債及美債危機(jī),全球經(jīng)濟(jì)都受到極大的影響,企業(yè)開工不足,鋼材的需求端急劇萎縮,以至于鐵礦石的需求也下降,導(dǎo)致庫存積壓。近兩年,由于新冠疫情影響,鐵礦石供應(yīng)鏈的穩(wěn)定性受到嚴(yán)峻考驗,澳大利亞、巴西的鐵礦石主要生產(chǎn)國供應(yīng)持續(xù)中斷,隨著疫苗的推廣,疫情給鐵礦石生產(chǎn)帶來的負(fù)面影響將逐漸降低,鐵礦石的生產(chǎn)逐漸恢復(fù)正常,鐵礦石尤其是2101合約的上漲空間逐漸收窄。
綜上可以看出,鐵礦石價格波動受供需因素、金融貨幣因素、政治、政策因素等諸多因素作用,當(dāng)然還有國際海運(yùn)價格、大資金介入的投機(jī)等因素,要準(zhǔn)確預(yù)測其價格波動非常困難,在此通過收集大量的高頻交易數(shù)據(jù)借助機(jī)器學(xué)習(xí)量化模型對鐵礦石價格趨勢進(jìn)行分析,找到其變化的規(guī)律,從而可以有效規(guī)避鐵礦石進(jìn)口風(fēng)險,降低進(jìn)口成本。
三、鐵礦石期貨價格實證分析
(一)實驗環(huán)境
本文中使用windows10操作系統(tǒng),python3.7環(huán)境,深度學(xué)習(xí)框架為tensorflow2.3.1版本,除此以外在本文的編程中還使用numpy、pandas、matplotlib、os等python第三方數(shù)據(jù)庫。LSTM在一定程度有效地彌補(bǔ)了循環(huán)神經(jīng)網(wǎng)絡(luò)(Recurrent Neural Network,RNN)在梯度消失、爆炸和長期記憶力不足等三個方面的問題,從而能有效地使得RNN利用長距離的時序信息。
本研究主要以鐵礦石期貨價格預(yù)測為研究對象,并在LSTM鐵礦石價格預(yù)測模型建立、LSTM網(wǎng)絡(luò)訓(xùn)練、預(yù)測結(jié)果的評價等方面進(jìn)行詳細(xì)研究,從而為鐵礦石的價格研究以及交易策略等提供參考意義。
(二)LSTM神經(jīng)網(wǎng)絡(luò)模型
神經(jīng)網(wǎng)絡(luò)(Neural Network,NN)最早于19世紀(jì)中期提出,具有三層結(jié)構(gòu),可以從輸入層輸入訓(xùn)練樣本的特征向量,然后通過隱藏層計算,最后從輸出層獲得分類結(jié)果,但單層感知機(jī)處理簡單問題尚可,一旦后處理復(fù)雜問題就無能為力。隨后出現(xiàn)了較為強(qiáng)大的RNN有效解決時序問題,通過循環(huán)的鏈?zhǔn)浇Y(jié)構(gòu),神經(jīng)元可以讓不同階段的序列數(shù)據(jù)所包含的信息得以保留。LSTM是一種改進(jìn)的RNN結(jié)構(gòu),通過改變隱藏層的內(nèi)部結(jié)構(gòu)來解決了RNN中梯度消失的問題。LSTM保留了RNN神經(jīng)網(wǎng)絡(luò)分析時間序列的優(yōu)勢,只是在內(nèi)部結(jié)構(gòu)上進(jìn)行了改變。LSTM神經(jīng)網(wǎng)絡(luò)如圖1所示,對比傳統(tǒng)RNN,LSTM在網(wǎng)絡(luò)結(jié)構(gòu)中具有“遺忘”單元,這使得它能夠進(jìn)行更長時間跨度的預(yù)測。一系列循環(huán)連接的記憶單元組成了LSTM神經(jīng)網(wǎng)絡(luò),每個記憶單元包括一個或多個自連接的細(xì)胞,以及遺忘門(Forget gate)、輸入門(Input gate)和輸出門(Input gate)。
1. 遺忘門
在機(jī)器學(xué)習(xí)中,遺忘門控制著LSTM單元中的“記憶細(xì)胞”是否保留之前的狀態(tài)。它接收上一時間步的信息ht-1和當(dāng)前時間步的數(shù)據(jù)xt,并生成介于0~1之間的向量。該值表示要保留的記憶量,當(dāng)其越接近 0 意味著越應(yīng)該忘記,越接近 1 意味著越應(yīng)該記住。計算公式如下:
公式中的ht-1表示前一個細(xì)胞單元的輸出,xt表示現(xiàn)在細(xì)胞單元的輸入。w 和 b 分別表示遺忘門里的權(quán)重矩陣、偏置向量,σ代表激活函數(shù) sigmoid。
2. 輸入門
輸入門決定如何將當(dāng)前的輸入合并到記憶細(xì)胞中。含有σ(sigmoid)函數(shù)的輸入門可以更新那些有需要被更新的信息,然后tanh層生成新的值。
3. 輸出門
輸出門主要控制著LSTM中細(xì)胞單元的輸出。通常先用σ(sigmoid) 函數(shù)輸出LSTM細(xì)胞單元狀態(tài)的一部分,接著用 tanh 函數(shù)處理細(xì)胞單元的狀態(tài),最后可以獲得當(dāng)前時間步的輸出ht。一旦輸出門的輸出結(jié)果被細(xì)胞單元狀態(tài)確定,繼續(xù)通過 sigmoid 函數(shù)輸出細(xì)胞單元狀態(tài)的一部分,接著tanh 函數(shù)處理細(xì)胞單元狀態(tài),最終可以獲取當(dāng)前時間步的輸出ht。
(三)LSTM模型建立
通過以下四個步驟建立LSTM模型。
1. 數(shù)據(jù)處理
選取鐵礦石期貨數(shù)據(jù),共計243天數(shù)據(jù),數(shù)據(jù)每5分鐘一條數(shù)據(jù),每天期貨數(shù)據(jù)由9:00~11:30、13:30~23:00兩個時間段構(gòu)成,每天共計有69條數(shù)據(jù),數(shù)據(jù)預(yù)處理過程主要針對數(shù)據(jù)類型、數(shù)據(jù)字段、數(shù)據(jù)缺失值情況進(jìn)行查看,在本文使用數(shù)據(jù)中,不存在缺失值情況,且需要字段均為浮點型數(shù)據(jù),因此無須針對數(shù)據(jù)缺失值進(jìn)行處理。
本文中選取數(shù)據(jù)中的“開”“高” “低” “收”四個字段作為輸入特征,選取“收”這單一字段作為輸出特征,使用當(dāng)前日期前5天數(shù)據(jù)即69*5=345條形狀為345*4的數(shù)據(jù)作為輸入,預(yù)測當(dāng)前日期后一天的收盤價格,即69條形狀為69*1的數(shù)據(jù)。
2. 模型參數(shù)設(shè)定
在設(shè)定的LSTM模型中,在輸入層中主要規(guī)定輸入數(shù)據(jù)的大小,本文中輸入數(shù)據(jù)為345*4的輸入格式;其次為第一層LSTM層,其中神經(jīng)元數(shù)量設(shè)置為32,緊接著設(shè)置Dropout層,參數(shù)為0.4,這一層的主要目的是針對上一層隨機(jī)丟棄40%的神經(jīng)元,防止出現(xiàn)過擬合現(xiàn)象;第二層LSTM層,其中神經(jīng)元數(shù)量為16,緊接著設(shè)置Dropout層,參數(shù)為0.5;最后一層為Dense輸出層,共有69個神經(jīng)元,即預(yù)測當(dāng)前日期后一天的69條數(shù)據(jù)。本文中設(shè)置的深度學(xué)習(xí)模型使用Adam為損失函數(shù),學(xué)習(xí)率設(shè)定為0.0001,使用平均絕對誤差(MSE)為損失函數(shù),訓(xùn)練輪數(shù)為100輪,單次訓(xùn)練數(shù)據(jù)(batch_size)數(shù)量為256組。
3. 模型訓(xùn)練
使用時間滑窗法得到數(shù)據(jù)集,共計13654條數(shù)據(jù),使用前9558條數(shù)據(jù)為訓(xùn)練數(shù)據(jù)集,后4096條數(shù)據(jù)為測試集數(shù)據(jù);根據(jù)上一步操作進(jìn)行深度學(xué)習(xí)模型參數(shù)設(shè)定,然后反復(fù)訓(xùn)練深度學(xué)習(xí)模型,訓(xùn)練過程如圖2所示。隨著訓(xùn)練輪數(shù)的增加,模型損失率在不斷減小,在訓(xùn)練100輪左右,模型已經(jīng)接近收斂。
4. 模型預(yù)測及評價
將測試數(shù)據(jù)集帶入訓(xùn)練好的模型中,對測試數(shù)據(jù)集展開預(yù)測并獲得預(yù)測結(jié)果,預(yù)測結(jié)果和實際測試集數(shù)據(jù)對應(yīng)結(jié)果進(jìn)行對比,以評價預(yù)測效果;模型預(yù)測結(jié)果與真實數(shù)據(jù)對比(見圖3);由圖3可知,預(yù)測結(jié)果整體趨勢與真實數(shù)據(jù)基本相同。
為了提升量化 LSTM 模型對鐵礦石期貨預(yù)測的精度,本文采用了四種量化分析指標(biāo)來評估預(yù)測精度。一是平均絕對誤差(Mean Absolute Error,MAE),MAE可以評估模型對預(yù)測值與真實值之間偏差的大小,越小表示模型的預(yù)測精度越高。二是均方根誤差(Root Mean Square Error,RMSE),RMSE與MAE相比,對預(yù)測誤差的敏感度更靈敏,它對較大的預(yù)測誤差會給予更高的懲罰。三是平均絕對百分比誤差(Mean Absolute Percent Error,MAPE),在不同取值范圍下MAPE評估模型的預(yù)測精度,并給予較大取值的更高權(quán)重,因此適用于比較不同數(shù)據(jù)集的模型性能。四是決定系數(shù)(Coefficient of Determination,R2),表示模型所解釋的數(shù)據(jù)方差相對于總方差的百分比,R^2是一個標(biāo)準(zhǔn)統(tǒng)計指標(biāo),取值范圍從0到1,越接近1表示模型的預(yù)測能力越好。四個指標(biāo)計算公式如表1所示。
其中,i為 第i個時間步;N為總時間步; i為預(yù)測數(shù)據(jù);yi表示真實數(shù)據(jù); 表示真實數(shù)據(jù)的平均值。
依據(jù)第四步中采用四種評價方法對測試數(shù)據(jù)預(yù)測結(jié)果進(jìn)行評價,評價結(jié)果如表 1 所示。根據(jù)上述評價指標(biāo)可得,模型擬合良好,平均絕對誤差、均方根誤差較小,在100以內(nèi),說明模型在鐵礦石應(yīng)用中具有較好表現(xiàn),R2大小為0.31,說明模型仍有優(yōu)化空間。
四、結(jié)語
本文選用了2021年9月至12月月底的中國期貨市場鐵礦石主力合約每天的tick高頻數(shù)據(jù),基于期貨市場微觀結(jié)構(gòu)運(yùn)用LEST神經(jīng)模型進(jìn)行分析,選取其中的開盤價、收盤價等特征數(shù)據(jù),并建立LSTM深度神經(jīng)網(wǎng)絡(luò)模型做時間序列預(yù)測分析,由損失函數(shù)變化情況及評價指標(biāo)可得,模型訓(xùn)練良好,并達(dá)到收斂,在測試集上表現(xiàn)良好,誤差較小,預(yù)測精度較高,為后續(xù)研究提供一定參考意義。
但本次研究中依然存在不足之處。一方面,存在數(shù)據(jù)的局限性,數(shù)據(jù)的觀測期跨度較小,如果選取較為久遠(yuǎn)的數(shù)據(jù)帶入模型進(jìn)行訓(xùn)練是否會改善模型,還需要進(jìn)一步驗證。同時,也可以收集其他期貨品種的數(shù)據(jù)來驗證該模型的實用性,進(jìn)一步比較優(yōu)化。另一方面,算法模型依然有優(yōu)化空間。算法沒有考慮到時間外部信息特征和外部事件等的影響,數(shù)據(jù)擴(kuò)充后模型預(yù)測精度是否能夠提升,還需進(jìn)一步驗證后續(xù)可以針對一些典型的外部事件發(fā)生后,從時間截取多個特征,從時間上發(fā)掘某些潛在規(guī)律。
參考文獻(xiàn):
[1]Libing Fang,Baizhu Chen,Honghai Yu,Cheng Xiong.The effect of economic policy uncertainty on the long-run correlation between crude oil and the U.S. stock markets[J].Finance Research Letters,2018,24.
[2]Markus Leippold,Qian Wang,Wenyu Zhou.Machine learning in the Chinese stock market[J].Journal of Financial Economics,2021(01).
[3]雷元安,刁節(jié)文.我國鐵礦石期貨價格發(fā)現(xiàn)功能的實證研究[J].經(jīng)濟(jì)研究導(dǎo)刊,2019(36):67-68.
[4]朱才斌,段蘊(yùn)珂.我國銅期貨市場國際定價能力研究[J].商業(yè)經(jīng)濟(jì)研究,2020(04):166-169.
[5]袁祥楓.基于LSTM的商品期貨高頻數(shù)據(jù)趨勢預(yù)測模型的研究[D].北京:北京郵電大學(xué),2019.
[6]王超.鐵礦石期貨價格與現(xiàn)貨價格的關(guān)系研究[D].杭州:浙江大學(xué),2018.
*基金項目:國內(nèi)大宗商品期貨市場量化交易研究(項目編號:20KJD520007);2021年江蘇高?!扒嗨{(lán)工程”優(yōu)秀教學(xué)團(tuán)隊資助項目。
(作者單位:無錫科技職業(yè)學(xué)院)