吳青山
摘? ?要:量化擇時策略是量化投資和量化交易的核心策略,需要考慮到特征因子的含義和資產價格的漲跌幅度。基于此,使用XGBoost、LightGBM等樹類模型提取了分類指標,構建了考慮到止盈止損區(qū)間的量化交易模型,并用于滬銅期貨的量化投資交易分析。實證結果表明,該方法能有效預測資產價格的漲跌幅度,且使用機器學習可解釋性分析得到的解釋結果具有解釋能力,符合實際情況。
關鍵詞:機器學習;量化投資;期貨
中圖分類號:F832.5? ? ? ?文獻標志碼:A? ? ? 文章編號:1673-291X(2023)02-0083-03
引言
隨著大數據技術以及人工智能技術,在金融領域逐漸被廣泛使用,帶來了量化擇時交易的興起。量化擇時交易具體是指使用數量化的方法對諸如股票之類的金融產品進行價格預測,從而在某一段時間進行交易的行為?,F有的關于量化擇時交易的相關文獻大致可分為兩類,一類是基于基本面數據指標進行量化交易操作,另一類是基于技術面數據指標進行量化交易操作。
基于基本面數據指標的量化交易策略,是指分析股票的基本面因素,從而使用基本面指標對股票的未來價格進行預測,投資者根據預測價格做出相應的交易行為。在基本面分析中,不同的因子對股票的價格影響趨勢不同,對不同股票的影響程度也不同?;诩夹g面數據指標的量化交易策略,是指分析股票的技術指標,對比價和量、識別趨勢以及反轉,從而預判股票將來的價格區(qū)間,投資者根據預判做出相應的交易行為。關于技術面,國內外已有不少學者做出了深入的研究。例如,Murphy通過對前人的研究進行分析和總結,概括出了技術分析得到假設前提,并預判了各種事件和因素對股票的交易價格和交易量的影響趨勢和影響程度。
根據機器學習模型和深度學習模型突出的擬合性能,該類模型被廣泛應用于預測股票的價格和趨勢,進而被引入到量化投資領域中。譬如,Tenti使用神經網絡模型預測期貨價格,并做出交易策略;Kamruzzaman使用神經網絡模型與傳統(tǒng)ARIMA模型進行對比分析研究,發(fā)現神經網絡模型對股票價格的預測精度明顯高于ARIMA模型。
一、技術指標和模型介紹
在量化交易領域的常用技術指標分為趨勢類、動量類、能量類和區(qū)間突破類等,部分技術指標是用開盤價、收盤價、最低價、最高價以及成交量和換手率等歷史數據計算得到。下面列出本文用到的技術指標。
移動平均線(SMA)計算一段時間內的標的資產價格的平均值,是一種通過平滑數據消除標的資產價格短期波動,對資產價格的長期趨勢進行分析的技術指標。動量指數(MOM)是研究金融資產價格波動速度的技術指標,原理是金融資產價格的漲跌幅會隨著時間的推移而慢慢減小。威廉指標(WR)研究金融資產價格波動幅度的技術指標。相對強弱指數(RSI)是研究金融資產價格波動幅度的技術指標。隨機森林(Random Forest,RF)算法是一種經典的裝袋法(Bagging)模型,由Breiman(2001)提出其基學習器為決策樹模型。XGBoost(eXtreme Gradient Boosting)最早提出于2016年(Chen and Guestrin,2016),它是在GBDT的基礎上引入正則化損失函數來實現弱學習器的生成,加入正則化的損失函數可以起到降低過擬合的風險。LightGBM算法是Boosting算法的新成員,它和XGBoost算法一樣是對GBDT算法的高效實現(Ke et al.,2017)在框架上做了優(yōu)化。決策樹是一種基本的分類和回歸算法,模型結構呈現樹狀。
二、量化擇時系統(tǒng)構建
本文選取的數據是2000年1月19日到2021年10月31日的滬銅期貨合約的歷史交易數據,數據來源為wind數據庫。該數據包括期貨合約的開盤價、收盤價、最高價、最低價還有成交量。本文使用的XGBoost、LightGBM、隨機森林和決策樹等模型都屬于有監(jiān)督學習,訓練該類模型都需要標簽。本文的標簽定義為是否買入或者賣出標的資產,若買入則為“+1”,若賣出則為“-1”。
關于機器學習算法在量化投資中的運用,現有的大部分做法都是將計算出來的技術指標直接帶入模型中進行預測,沒有考慮到技術指標本身特有的含義和性質,若使用這些技術指標的特性可能會對標的的價格走勢進行更好預測。在實際操作中,交易狀態(tài)不僅僅有買入和賣出,還有觀望狀態(tài),而且針對不同的特征,其閾值是不同的。因此,本文使用分位數代替閾值,在增加靈活性的同時不丟失特征本身的特性。仍以SMA為例,當SMA數值大于75%分位數時,標簽為“-1”;當數值小于25%分位數時,標簽為“-1”;當數值在25%分位數和75%分位數之間時,標簽為“0”,表示觀望。
本文參考相關學者的文獻,選用累計收益率、夏普比率(Sharpe Ratio)和索提諾比率(Sortino Ratio)作為量化交易模型的評價指標。其中,Sharpe Ratio主要被用于評價基金的投資績效。其計算方法為超額收益的期望除以收益的標準差。該指標全面考慮了風險和收益。具體表現為,該指標數值越大,說明該投資組合的表現越好;反之,則說明該投資組合的表現越差。后來,研究者在Sharpe Ratio的基礎上提出了Sortino Ratio,該指標剔除了股票價格上漲的風險,即獲得的收益不計入風險的計算中。
三、實證結果
滬銅描述性統(tǒng)計如表1所示。
本文選用的基準策略為多數投票策略和隨機策略,多數投票策略是指根據特征的買入和賣出標簽的個數進行投票,個數多的信號為最終信號,決定買入或者賣出行為。隨機策略是根據隨機信號進行買入或者賣出操作。
本文使用的投資模型為滾動訓練集的方法進行訓練,用最近的50個樣本訓練模型,預測當前期的結果;并根據模型特征重要性選出了重要特征,對模型進行了可解釋性分析。實驗結果如表2所示。
表2是在各種量化投資模型下的投資績效,可以從表中看出隨機森林模型下的累計收率最高,擇時準確率也最高,綜合表現優(yōu)于其他模型。說明該模型可提升技術指標對標的資產的預測能力以及擇時交易的能力。
圖1為各模型下的累計收益率曲線圖,從圖中可看出,收益率最高的為隨機森林模型,其次為XGBoost模型、LightGBM模型和決策樹模型。
結語
隨著金融市場的發(fā)展,量化交易也在發(fā)展并成為交易市場中的重要組成部分。因此,科學合理地設計量化交易策略就顯得尤為重要。目前,機器學習算法由于其良好的擬合能力和預測能力,已被廣泛應用量化投資領域中。本文使用的機器學習模型就可以印證這一點。還有,本文使用的具有止盈止損限制的交易方式,對于模擬實際交易有現實意義。本文的研究為投資者的交易提供了有效的參考,具有實際應用價值。
參考文獻:
[1]? ?張華,任若恩.基于Dempster-Shafer證據理論的外匯交易策略研究[J].數理統(tǒng)計與管理,2013,32(3):452-461.
[2]? ?林文修,蔡秉洲.集成基因表達規(guī)劃法應用于動態(tài)股票交易策略探勘之研究[J].中國管理科學,2015,23(S1):510-517.
[3]? ?禹建麗,孫增圻,Valeri.Kroumov,成久洋之,劉治軍.基于BP神經網絡的股市建模與決策[J].系統(tǒng)工程理論與實踐,2003,(5):15-19,58.
[4]? ?陳榮達,虞歡歡.基于啟發(fā)式算法的支持向量機選股模型[J].系統(tǒng)工程,2014,32(2):40-48.
[5]? ?周銘山,馮新力,林靚,方旭赟,周開國.A股市場均線策略有效性與收益率隨機特征研究[J].證券市場導報,2013,(1):58-64.
Research on Futures Quantitative Timing Strategy Based on Machine Learning
WU Qing-shan
(School of Economics, Guizhou University, Guiyang 550025, China)
Abstract: Quantitative timing strategy is the core strategy of quantitative investment and quantitative trading, which needs to take into account the meaning of characteristic factors and the rise and fall of asset prices. If so, we use XGBoost, LightGBM and other tree models to extract classification indicators, build a quantitative trading model considering the stop-loss interval, and use it to analyze the quantitative investment and trading of Shanghai Copper Futures. The empirical results show that this method can effectively predict the rise and fall of asset prices, and the interpretation results obtained by machine learning interpretability analysis have explanatory power, which is consistent with the actual situation.
Key words: machine learning; quantitative investment; futures
[責任編輯? ?若? ?云]