田佳敏 孫禮娜
摘要:隨著機器學(xué)習(xí)的不斷完善,機器學(xué)習(xí)對于股指、股價的預(yù)測也吸引了業(yè)界越來越多人的研究與分析。本文則是選取了機器學(xué)習(xí)中最為突出的兩個代表——神經(jīng)網(wǎng)絡(luò)與支持向量機為例研究基于其對股價的量化預(yù)測。進行回測,分別從收益、風(fēng)險等角度分析該模型的回測情況從而分析機器學(xué)習(xí)股價量化預(yù)測的可行性,并對量化策略模型的優(yōu)化、改進和應(yīng)用提出相關(guān)建議。
關(guān)鍵詞:神經(jīng)網(wǎng)絡(luò);支持向量機;量化預(yù)測;PYTHON
1.引言
股市行情可能受到很多方面的影響,比如公司的財務(wù)因素、宏觀經(jīng)濟走勢等等,只有將機器學(xué)習(xí)結(jié)合合理有效的特征因子的選取,才能發(fā)揮其真正的作用。而21世紀,機器學(xué)習(xí)飛速發(fā)展,作為其核心方法的神經(jīng)網(wǎng)絡(luò)和支持向量機在在生物、金融、醫(yī)療等各個領(lǐng)域得到不斷的發(fā)展和廣泛的運用。
2.數(shù)據(jù)來源及處理
同花順iFind金融數(shù)據(jù)終端平臺。假設(shè):假設(shè)數(shù)據(jù)來真實、可靠和準(zhǔn)確,且不存在較為嚴重的異常波動,既數(shù)據(jù)為正常情況下的實際股市行情數(shù)據(jù)。
本文采用高斯預(yù)處理方法,即標(biāo)準(zhǔn)化法(去均值,方差規(guī)?;?。具體是有特征因子減去它對應(yīng)的均值再除以它的標(biāo)準(zhǔn)差如下式所示
3.神經(jīng)網(wǎng)絡(luò)
3.1策略思想
選取了滬深300成份股的總市值,OBV能量潮,市盈率,布林線,KDJ隨機指標(biāo),RSI相對強弱指標(biāo)作為訓(xùn)練樣本的輸入層。而對于輸出層,如果未來20個工作日上漲的幅度超過10%則標(biāo)記為1,否則為-1。然后采用神經(jīng)網(wǎng)絡(luò)算法數(shù)據(jù)進行訓(xùn)練學(xué)習(xí)[4,5]。然后基于訓(xùn)練出來的函數(shù)進行預(yù)測,如果預(yù)測結(jié)果為1且沒有持倉則買入,如果預(yù)測結(jié)果為-1且已經(jīng)持倉則賣出。
3.2回測分析
我們通過Python編程實現(xiàn)量化交易策略,并對結(jié)果進行分析。
3.2.1收益分析
回測結(jié)果顯示策略的收益大約是在17.08%,而基準(zhǔn)收益 為-3.97%。策略的收益走勢大致與基準(zhǔn)收益的走勢相相吻合,策略受到市場行情波動的影響較大。但策略的止損能力往往超過基準(zhǔn)利率在基準(zhǔn)利率跌幅較大甚至超過10%時,策略收益的跌幅仍處于一個較低的水平。
3.4.2 Alpha——投資中面臨的非系統(tǒng)性風(fēng)險
Alpha代表超額收益,指投資組合獲取的超過市場平均收益的那部分收益[7]。
從圖3中我們不能看出超額收益Alpha值表現(xiàn)的較為穩(wěn)健。策略在回測過程中所面臨的非系統(tǒng)性風(fēng)險較小,表現(xiàn)較好。因為超額收益率是剔除了基準(zhǔn)收益率的,所以超額收益率也反映該策略實際的盈利水平。
3.4.3 Beta——投資中面臨的系統(tǒng)風(fēng)險
Beta的計算公式為:
Beta表示股票的收益和風(fēng)險收大盤的影響。
由圖4可以看出來該策略的Beta值處于0到1之間, 表示某種股票的價格波動比市場小,方向與市場相同,表明風(fēng)險程度低于整個市場的風(fēng)險水平。而且從圖4中我們不難看出該策略波動范圍主要是在0.7-1之間,波動范圍較小,雖然而且不難看出在之前基準(zhǔn)收益較低的4、5、7、11等月份,β也較低,趨近于零。
4.基于SVM的量化選股策略——基于財務(wù)因子
4.1策略思想
支持向量機是一種數(shù)據(jù)挖掘的新技術(shù),借助最優(yōu)化方法來解決機器學(xué)習(xí)問題的新工具[9]。而其基本思想就是通過找到一個超平面,使其能夠盡可能得將兩類數(shù)據(jù)點正確分來,同時使分開的兩類數(shù)據(jù)點數(shù)據(jù)分類面最遠[10]。
以季度為單位,選取一些財務(wù)因子作為訓(xùn)練樣本,對于類別值,如果未來一個季度漲幅超過5%標(biāo)記為1,反之為-1,然后用支持向量機算法進行訓(xùn)練,預(yù)測結(jié)果為1且未持倉則買入,預(yù)測結(jié)果為-1且已持倉則賣出[11]。
4.2特征因子選取
選取2017-06-30(2015年半年報)時刻,滬深300成分股的市盈率、市凈率、總市值等共21個財務(wù)因子。
4.3回測結(jié)果分析
通過編程實現(xiàn)策略回測,接下來對回測交易結(jié)果進行收益、風(fēng)險等方面的分析。
4.3.1.收益分析
回測結(jié)果顯示策略收益16.98%,而基準(zhǔn)收益則為6.67%。策略前段和后段的表現(xiàn)較好,且收益情況均高于基準(zhǔn)收益。
4.3.2.Alpha——投資中面臨的非系統(tǒng)性風(fēng)險
該策略的超額收益率Alpha值雖然較低,但是絕大多數(shù)為正值,表現(xiàn)仍較為穩(wěn)健,說明該策略的超額收益較好且較為穩(wěn)定。由圖9可知該策略整體所面臨的非系統(tǒng)性風(fēng)險較低且較為穩(wěn)定。
4.3.3. Beta——投資中面臨的系統(tǒng)風(fēng)險
由圖10中我們不難看出該策略Beta值波動范圍主要是在0.4-0.6之間,波動范圍較小,風(fēng)險程度低于整個市場的風(fēng)險水平且處于穩(wěn)定狀態(tài)。
5.總結(jié)
經(jīng)過對回測結(jié)果的分析,我們不難看出無論是神經(jīng)網(wǎng)絡(luò)量化選股策略還是支持向量機量化選股策略均能夠獲取一定的收益,且高于基準(zhǔn)收益,能獲得一定的超額收益,兩個模型的超過一半的月份數(shù)的sharpe率值超過了1,不過收益率有限,但是卻在風(fēng)險控制上表現(xiàn)不俗,策略的收益波動率均在10%以內(nèi),后期均穩(wěn)定在5%左右。且支持向量機模型在防范非系統(tǒng)性風(fēng)險的表現(xiàn)上優(yōu)與神經(jīng)網(wǎng)絡(luò)量化策略。機器學(xué)習(xí)(神經(jīng)網(wǎng)絡(luò)和支持向量機)能夠很好的進行風(fēng)險防控,卻無法保證較高的高收益率。
參考文獻
[1]季峰. 智能投資引領(lǐng)量化策略風(fēng)向[N]. 中國證券報,2017-02-13(005).
[2] 白凱敏.神經(jīng)網(wǎng)絡(luò)和深度學(xué)習(xí)在量化投資中的應(yīng)用[D] .2016.
[3]陳笑,王發(fā)信,戚王月,周婷.基于遺傳算法的BP神經(jīng)網(wǎng)絡(luò)模型在地下水埋深預(yù)測中的應(yīng)用——以蒙城縣為例[J].水利水電技術(shù),2018,49(04):1-7.
[4] 胡謙.基于機器學(xué)習(xí)的量化選股研究[D] .2016.
[5] 李子睿.量化投資交易策略研究[D] .天津大學(xué),2013.
[6] 朱晨曦.我國A股市場多因子量化選股模型實證分析[D] .2017.
[7]章宏帆. 運用量化投資策略實現(xiàn)超額收益Alpha的理論與實踐[D].浙江大學(xué),2015.
[8]周曉志.我國內(nèi)部人交易獲得超額收益分析[J].廣東農(nóng)工商職業(yè)技術(shù)學(xué)院學(xué)報,2012,28(02):41-44.
[9]于靜,韓魯青.一種改進的求解支持向量機模型的坐標(biāo)梯度下降算法[J].系統(tǒng)科學(xué)與數(shù)學(xué),2018,38(05):583-590.
[10] 魏妹金.支持向量機多因子選股模型[D] .2015.
[11] 湯凌冰.機器學(xué)習(xí)在量化投資中的應(yīng)用研究[M] .電子工業(yè)出版社,2014.
[12] 張學(xué)工.關(guān)于統(tǒng)計學(xué)習(xí)理論與支持向量機[J] .自動化學(xué)報,2000(1).
[13]楊陽.銀華基金張凱:量化投資將在未來A股實戰(zhàn)中凸顯優(yōu)勢[J].股市動態(tài)分析,2016(10):56.
作者簡介:田佳敏(1996—09月)女漢族,四川成都人,安徽財經(jīng)大學(xué)金融學(xué)院,2016級本科生,研究方向:投資學(xué)。
(作者單位:1.安徽財經(jīng)大學(xué)金融學(xué)院;
2.統(tǒng)計與應(yīng)用數(shù)學(xué)學(xué))