王倫
摘 要:近年來(lái),機(jī)器學(xué)習(xí)技術(shù)在完善傳統(tǒng)金融投資模型中的應(yīng)用受到了學(xué)術(shù)界和金融界的廣泛關(guān)注。以滬深300股票為研究對(duì)象,利用Adaboost提高原線性支持向量機(jī)的分類能力,結(jié)合所有主要因素構(gòu)建基于Adaboost增強(qiáng)的Adaboost-SVM多因子選股模型。在回測(cè)分析中,將原始線性支持向量機(jī)的選股策略與基于Adaboost增強(qiáng)的Adaboost-SVM多因子選股策略進(jìn)行了比較。結(jié)果表明,基于Adaboost增強(qiáng)的Adaboost-SVM多因子選股策略比原始算法模式具有更強(qiáng)的盈利能力和更小的收入波動(dòng)。
關(guān)鍵詞:多因子選股;Adaboost;SVM
中圖分類號(hào):F830.91? ? ? ? 文獻(xiàn)標(biāo)志碼:A? ? ? 文章編號(hào):1673-291X(2019)10-0107-02
一、理論模型
1.支持向量機(jī)。SVM算法是根據(jù)訓(xùn)練樣本找到最優(yōu)超平面的過程。在二維坐標(biāo)點(diǎn)的情況下,SVM算法是找到一條直線來(lái)分離兩種類型的坐標(biāo)點(diǎn)。然而在這些無(wú)數(shù)條線中,如果它們太靠近坐標(biāo)點(diǎn),噪聲干擾將對(duì)分類結(jié)果產(chǎn)生很大影響。因此,我們可以定義SVM算法是找到離訓(xùn)練樣本最遠(yuǎn)的線,也稱為最佳直線。消除優(yōu)化過程的推導(dǎo),產(chǎn)生的優(yōu)化問題是:
2.Adaboost模型。Adaboost是一種迭代算法,其核心思想是在同一訓(xùn)練集的目標(biāo)下訓(xùn)練不同的弱分類器,特別是對(duì)難以準(zhǔn)確分類的數(shù)據(jù)進(jìn)行重復(fù)訓(xùn)練,然后收集所有弱分類器以形成更強(qiáng)強(qiáng)分類。Adaboost算法本身是通過改變數(shù)據(jù)的布局來(lái)實(shí)現(xiàn)的,它通過樣本的分類在訓(xùn)練集中是否正確以及通過上次總分類準(zhǔn)確率,這使得難以分類的數(shù)據(jù)得到了培訓(xùn)。發(fā)送帶有修正權(quán)重的新數(shù)據(jù)集,由Bottom,classifiers訓(xùn)練,最后將從每次訓(xùn)練中獲得的分類器聚合為最終決策分析器。
3.基于Adaboost的增強(qiáng)型Adaboost-SVM選股模型。首先調(diào)用12個(gè)月的股票數(shù)據(jù),設(shè)定權(quán)重D1(1),N作為樣本的數(shù)量,選取的數(shù)據(jù)為每月第一天的收盤價(jià),然后得到SVM分類器。接下來(lái),最終的Adaboost-SVM算法可表示為:
二、實(shí)證分析
1.基于SVM原始選股策略模型的測(cè)試。在不考慮非線性分析的情況下,從Adaboost算法、傳統(tǒng)回歸方法、SVM算法中得出長(zhǎng)短投資組合凈值的對(duì)比(見圖1),可以看到,SVM算法的最終凈值最高,而其波動(dòng)度低于傳統(tǒng)的回歸方法。
2.基于增強(qiáng)Adaboost的Adaboost-SVM選股模型測(cè)試(如圖2所示)。
與上述傳統(tǒng)的SVM算法相比,基于Adaboost的增強(qiáng)型Adaboost-SVM算法分類模型的長(zhǎng)短策略的利潤(rùn)凈值顯著增加,這意味著它整體上優(yōu)于傳統(tǒng)的SVM模型。
三、總結(jié)
本文對(duì)多因素選股策略進(jìn)行了新的嘗試——基于增強(qiáng)Adaboost的Adaboost-SVM算法分類,每個(gè)因素的每個(gè)因素都具有特征,具有68個(gè)因子的維度,Adaboost-SVM算法可以有效地對(duì)投資組合的標(biāo)簽進(jìn)行分類和預(yù)測(cè)。與線性支持向量算法的主動(dòng)組合凈值相比,Adaboost-SVM算法產(chǎn)生更高的凈值利潤(rùn)。對(duì)于模型的進(jìn)一步方向,純SVM算法對(duì)二元分類問題有更好的效果,盡管從實(shí)踐的角度來(lái)看,對(duì)于多個(gè)或連續(xù)的分類變量,它沒有達(dá)到更好的回測(cè)結(jié)果,但是,Adaboost算法的思想也適用于多變量或連續(xù)變量問題。因此,Adaboost-SVM算法的組合值得進(jìn)一步研究和測(cè)試多變量問題。
參考文獻(xiàn):
[1]? Huang Qin.Research on the application of support vector machines in China a-share market quantitative strategy based on fama-fench three-factor model[J].Times Finance,2017,(11):172-173.
[2]? Dong Zhi-qiang,Liu Yong-nian&Wei Li-hua.Fault detection of automatic car equipment based on AdaBoost and SVM combination[J].Electronics World,2018,(2):17-19.