作者簡(jiǎn)介:吳迪(1990-),男,漢族,湖北武漢市人,工學(xué)碩士研究生在讀,貴州大學(xué)管理學(xué)院管理科學(xué)與工程專業(yè),研究方向:金融工程。
摘要:高頻交易算法是利用計(jì)算機(jī)實(shí)現(xiàn)短期的量化投資策略,通常用于股票,期貨和一些電子交易,需要設(shè)計(jì)一個(gè)適應(yīng)性很強(qiáng)的交易算法。由算法的技術(shù)指標(biāo)要求,本文以移動(dòng)平均數(shù)、相對(duì)強(qiáng)弱指標(biāo)等一系列函數(shù)為基礎(chǔ),并基于Matlab語言環(huán)境下選用相應(yīng)函數(shù),設(shè)計(jì)金融模型,再由所提供的數(shù)據(jù)通過最優(yōu)化模型掃描得出最優(yōu)參數(shù),由此實(shí)現(xiàn)高頻交易算法的設(shè)計(jì)與實(shí)際一般性的運(yùn)用。
關(guān)鍵詞:高頻數(shù)據(jù);程序化交易;遺傳算法;技術(shù)指標(biāo)
一、引言
算法交易指的是通過使用計(jì)算機(jī)程序來發(fā)出交易指令遺傳算法可以解決各類問題,而不論這個(gè)問題本身是否有明確的函數(shù)表達(dá)式。因此,它在各個(gè)學(xué)科都有所應(yīng)用。遺傳算法在金融學(xué)的應(yīng)用已經(jīng)屢見不鮮,在資產(chǎn)定價(jià)、風(fēng)險(xiǎn)對(duì)沖等方面都有很好的應(yīng)用。本文采用遺傳算法更多的是基于數(shù)學(xué)的層面,是為了尋求最優(yōu)。的參數(shù)組合,使投資策略的累積收益率盡可能大。本文采取的類似遺傳算法中基因編碼的序列,將交易信號(hào)及之間的邏輯關(guān)系以二進(jìn)制表示,本文所使用二進(jìn)制組合,對(duì)于每一種信號(hào)以“1”表示可以使用,以“0”表示無法使用;信號(hào)之間存在兩種邏輯關(guān)系,即“AND”(用“00”表示)和“OR”(用“01”表示)“AND”表示信號(hào)之間同時(shí)使用,“OR”則表示只能選取一種類別的信號(hào)。
二、技術(shù)指標(biāo)說明
(一)移動(dòng)平均線,原本的意思是移動(dòng)平均,由于我們將其制作成線形,所以一般稱之為移動(dòng)平均線,簡(jiǎn)稱均線。
(二)相對(duì)強(qiáng)弱指標(biāo):RSI強(qiáng)弱指標(biāo)是由爾斯.懷爾德最早應(yīng)用于期貨買賣,后來人們發(fā)現(xiàn)在眾多的圖表技術(shù)分析中,強(qiáng)弱指標(biāo)的理論和實(shí)踐極其適合于股票市場(chǎng)的短線投資,于是被用于股票升跌的測(cè)量和分析中
(三)廉指標(biāo)這個(gè)指標(biāo)是一個(gè)振蕩指標(biāo),是依股價(jià)的擺動(dòng)點(diǎn)來度量股票/指數(shù)是否處于超買或超賣的現(xiàn)象。
三、交易策略的判斷依據(jù)
本文采取夏普比率和作為策略的判斷指標(biāo),在既定風(fēng)險(xiǎn)范圍之內(nèi)策略年化收益率與夏普比率越高則代表策略越優(yōu)化。
四、實(shí)證部分
對(duì)于每一種技術(shù)指標(biāo)而言,本文都將80%的數(shù)據(jù)用于建模數(shù)據(jù),20%的數(shù)據(jù)用于驗(yàn)證數(shù)據(jù)。這次使用的數(shù)據(jù)是同花順(300033)三年來每日收盤價(jià)和近三個(gè)月每分鐘收盤價(jià),數(shù)據(jù)來于萬得數(shù)據(jù)庫(kù)。
(一)移動(dòng)平均數(shù)
指標(biāo)及變量的說明:lead提前指標(biāo);lag滯后指標(biāo);movavg移動(dòng)平均指標(biāo);frequency交易頻率sharpe ratio沒風(fēng)險(xiǎn)單位能夠換取的平均收益率;final return最終回報(bào)(率)。
模型的建立與求解,調(diào)用matlab中movavg函數(shù),設(shè)定lead=5,lag=20,做為原始測(cè)試,到大致以下規(guī)律,當(dāng)lead位于lag之上股價(jià)上行,當(dāng)lead位于lag之下股價(jià)下行。由此設(shè)立交易信號(hào)當(dāng)s(lead>lag)=1時(shí)視為買入信號(hào);當(dāng)s(lead 參數(shù)掃描確定最優(yōu)值,依次確定提前與滯后指標(biāo),提前指標(biāo)設(shè)置為1,滯后指標(biāo)設(shè)置為m,從1-200之間取值,利用for循環(huán)獲得最大sharpe ratio。由圖5可知,當(dāng)lead=65,lag=67時(shí),Maxsharpe ratio=2.32,Maxfinal return=927%。利用窮舉法對(duì)lead和lag同時(shí)進(jìn)行掃描。 模型的完善,設(shè)置cost=0.2%,現(xiàn)在利用2015年06月30日—2015年08月27日每分鐘收盤價(jià)的高頻交易數(shù)據(jù)進(jìn)行模型的掃描統(tǒng)計(jì),將數(shù)據(jù)分為80%的建模數(shù)據(jù),20%的檢驗(yàn)數(shù)據(jù)。同時(shí)引入f(交易頻率)這一參數(shù),掃描變量為lead/lag/f,掃描范圍相應(yīng)增加,檢測(cè)結(jié)果如下:當(dāng)lead=1,lag=11,f=28時(shí),sharpe ratio=5.84,final return=78.7%。 (二)RSI相對(duì)強(qiáng)弱指標(biāo) 指標(biāo)及變量的說明:rsi相對(duì)強(qiáng)弱指標(biāo);threshhold閥值。RSI交易策略:交易信號(hào)的產(chǎn)生當(dāng)RSI的值高于或者低于閥值?,F(xiàn)在利用2015年06月30日-2015年08月27日每分鐘收盤價(jià)的高頻交易數(shù)據(jù)進(jìn)行模型的掃描統(tǒng)計(jì),將數(shù)據(jù)分為80%的建模數(shù)據(jù),20%的檢驗(yàn)數(shù)據(jù),同樣考慮交易成本。 RSI通常被用于更長(zhǎng)的時(shí)間趨勢(shì)中從而到達(dá)優(yōu)化的目的,當(dāng)RSI=2時(shí),sharpe ratio=6.53,final return=84.5%。 (三)MA+RSI交易策略 設(shè)置參數(shù)N=1,M=11,threshhold=55利用遺傳進(jìn)化算法重復(fù)以上過程,交易信號(hào)的產(chǎn)生并用遺傳進(jìn)化算法確定交易信號(hào), best=100111 這里對(duì)結(jié)果進(jìn)行說明,MA與RSI之間的邏輯關(guān)系是“00”,既并列,最后連續(xù)的“11”表示兩種交易信號(hào)可以使用。利用參數(shù)掃描確定最優(yōu)化數(shù)值,sharpe ratio=9.87,final return=80.1% 五、結(jié)語 本文采取科技類股票進(jìn)行模擬交易,基于選擇的幾只股票的2015年的高頻交易數(shù)據(jù),首先利用技術(shù)指標(biāo)模型構(gòu)建交易量持續(xù)期預(yù)測(cè)模型,確定交易時(shí)點(diǎn)。而投資策略的設(shè)計(jì)則結(jié)合理論和實(shí)踐,充分利用了本論文的參數(shù),根據(jù)技術(shù)指標(biāo)給予關(guān)鍵參數(shù)以閾值,只有當(dāng)參數(shù)都達(dá)到閾值時(shí),交易信號(hào)才能夠被觸發(fā),這樣就能在給定的范疇內(nèi)最大程度的保證交易信號(hào)的高質(zhì)量,從而提高收益率。然后分別建立交易量分布預(yù)測(cè)模型和股票價(jià)格波動(dòng)預(yù)測(cè)模型,并根據(jù)價(jià)格波動(dòng)的預(yù)測(cè)對(duì)交易量進(jìn)行修正,進(jìn)一步,本文引入了遺傳算法的思想,利用這種科學(xué)計(jì)算法,以求能夠快速的尋找出最優(yōu)的參數(shù)組合,與此同時(shí)采取for循環(huán)進(jìn)行參數(shù)掃描,大大縮短了參數(shù)確定的時(shí)間并提高了精確度。(作者單位:貴州大學(xué)管理學(xué)院) 參考文獻(xiàn): [1]張連華.基于高頻數(shù)據(jù)的股指期貨期現(xiàn)統(tǒng)計(jì)套利程序交易[J].計(jì)算機(jī)應(yīng)用與軟件,2011,28(9):93—95. [2]謝中華.MATLAB統(tǒng)計(jì)分析與應(yīng)用:40個(gè)案例分析[M].第1版.北京:北京航空航天大學(xué)出版社,2010.187-213. [3]Eric P.Xing,Qirong Ho,Pengtao Xie,Wei Dai.Strategies and Principles of Distributed Machine Learning on Big Data[D],School of Computer Science,Carnegie Mellon University,2016. [4]W.Dai,A.Kumar,J.Wei,Q.Ho,G.Gibson,and E.P.Xing.High-performance distributed ml at scale through parameter server consistency models[Z].In AAAI,2015. [5]C.J.Hsieh,H.-F.Yu,and I.S.Dhillon.Passcode:Parallel asynchronous stochastic dual co-ordinatedescent[J].In ICML[Z],2015.