吳員福
(中國人民大學(xué)數(shù)學(xué)學(xué)院,北京 100872)
構(gòu)建量化投資組合的關(guān)鍵在于尋找到有效的風(fēng)格因子,并據(jù)此建立穩(wěn)定、靈活的多因子模型。這種多因子模型多為靜態(tài)模型。所謂“靜態(tài)”,是指多因子模型不能及時追蹤和把握市場環(huán)境的變化和宏觀經(jīng)濟(jì)的變化[1]。若要獲取長期穩(wěn)定的Alpha 收益,及時追蹤、把握市場環(huán)境的變化并調(diào)整風(fēng)格因子的構(gòu)成及相應(yīng)的權(quán)重是關(guān)鍵[2]。
本文旨在研究資本市場中資產(chǎn)價格數(shù)據(jù)的風(fēng)格因子“擇時”,在多因子模型的構(gòu)建過程中引入機(jī)器學(xué)習(xí)方法,以標(biāo)的資產(chǎn)歷史價格數(shù)據(jù)的分析為基礎(chǔ),尋找共性風(fēng)格特征的分化輪動規(guī)律,對因子的未來表現(xiàn)進(jìn)行估計(jì),并據(jù)此調(diào)整綜合因子中風(fēng)格因子的構(gòu)成與賦權(quán)[3]。
多因子模型的一般表達(dá)式如式(1)所示。
式中:Xjk——標(biāo)的證券j 在共性特征k 上的暴露;μj——標(biāo)的證券j 的殘差收益率[4]。
如果某投資組合由N 個標(biāo)的證券組成,各標(biāo)的證券在組合中所占比重分別是hp1,hp2,…,hpn,則整體收益率為表示如式(2)所示。
決策樹生成的原理如下:如果X 為輸入變量,Y 為輸出變量,并且Y 是連續(xù)變量,給定的訓(xùn)練集如式(3)所示。
按照上述原理進(jìn)行遍歷,以求尋找到最佳的j,獲得一個對(j,s),依次將其分成兩個部分,然后對分割出的每個部分重復(fù)上述操作,直到符合條件為止[6]。
XGBoost 學(xué)習(xí)中,假設(shè)構(gòu)造了K 顆樹的情況下,則總體值可表示為:
式中:K——決策樹個數(shù);F——一個泛函數(shù),表示決策樹的函數(shù)空間;q——每棵樹的結(jié)構(gòu);T——決策樹葉子節(jié)點(diǎn)的數(shù)目;w——一個權(quán)重向量;每一個fk都對應(yīng)著一個獨(dú)立的樹結(jié)構(gòu)q 和葉節(jié)點(diǎn)權(quán)重w[7]。
XGBoost 模型可采用如下步驟進(jìn)行構(gòu)建:
本文中首先選取主流的標(biāo)的資產(chǎn)共性特征,然后將宏觀經(jīng)濟(jì)指標(biāo)數(shù)據(jù)、共性特征歷史IC 數(shù)據(jù)、相關(guān)市場變量數(shù)據(jù)等共同作為機(jī)器學(xué)習(xí)算法的輸入,基于XGBoost 模型來估計(jì)每個共性風(fēng)格特征在下一時段的IC 值,也就是說,估計(jì)資本市場中標(biāo)的資產(chǎn)在未來時間的回報率與共性特征值之間的關(guān)聯(lián)程度ρ。計(jì)算共性特征未來IC 值的目的在于后續(xù)按照此IC 值對各個共性特征進(jìn)行賦權(quán)[11]。
本文基于XGBoost 模型預(yù)測標(biāo)的資產(chǎn)未來時期的回報率與共性特征當(dāng)前值之間的關(guān)聯(lián)程度ρ,然后根據(jù)估計(jì)的IC 值決定綜合因子中的各風(fēng)格因子的構(gòu)成以及風(fēng)格因子的權(quán)重。主要選擇共性特征歷史IC 序列數(shù)據(jù)、市場指標(biāo)、宏觀指標(biāo)作為機(jī)器學(xué)習(xí)模型的輸入特征[12]。
本文中以周為調(diào)倉頻率,在某一時刻t 通XGBoost機(jī)器學(xué)習(xí)模型預(yù)測預(yù)測標(biāo)的資產(chǎn)在一周后的收益率與當(dāng)前特征取值之間的相關(guān)系數(shù)ρ。針對風(fēng)格因子進(jìn)行賦權(quán)的具體規(guī)則如下。
(1)在某一時刻t,采用XGBoost 模型對共性特征i下一時段選股的IC 值進(jìn)行估算,得到ICi,t。
(2)若風(fēng)格因子為正向因子,在ICi,t>0 時,權(quán)值wi,t=ICi,t,否則認(rèn)為風(fēng)格因子在下一時段失效,權(quán)值wi,t=0。
(3)若風(fēng)格因子為負(fù)向因子,在ICi,t<0 時,權(quán)值wi,t=-ICi,t,否則認(rèn)為風(fēng)格因子在下一時段失效,權(quán)值wi,t=0。
(4)對wi,t做歸一化的處理,使得,如果預(yù)測在下一時段所有因子都失效,則使用等權(quán)方式對風(fēng)格因子進(jìn)行賦權(quán)[13]。
從回測結(jié)果的對比分析中可知,模型滾動訓(xùn)練的多因子策略的信息比為1.76,分別較因子等權(quán)策略和固定模型的多因子策略提高了62.9%和33.3%,而且在勝率、年化收益率、最大回撤等多項(xiàng)指標(biāo)上也有明顯提升。各模型回測表現(xiàn)對比如表1 所示。
表1 各模型回測表現(xiàn)對比
隨著市場環(huán)境的變化以及市場參與者之間的博弈,量化投資中某一風(fēng)格因子帶來的回報率會產(chǎn)生波動。前期產(chǎn)生穩(wěn)定Alpha 收益的風(fēng)格因子其有效性可能在未來轉(zhuǎn)弱,甚至于完全失效,降低資產(chǎn)組合的超額收益率。本文提出基于XGBoost 模型的多因子策略旨在及時把握市場環(huán)境的變化以及風(fēng)格因子的輪動情況,并根據(jù)市場的變化靈活地選擇風(fēng)格因子以及在必要時調(diào)整風(fēng)格因子的權(quán)重。
歷史回測表明,相較于因子等權(quán)策略,基于XGBoost模型的多因子動態(tài)策略的表現(xiàn)優(yōu)勢明顯,回測期累積收益率由55.81%提升到88.28%,信息比也由1.08 提升到1.32,但最大回撤比因子等權(quán)策略要高。若采用模型滾動訓(xùn)練的模型,則能進(jìn)一步提升回測表現(xiàn),在策略的勝率、信息比、最大回撤等方面都顯著優(yōu)于傳統(tǒng)的因子等權(quán)策略,在波動性較大的區(qū)間,基于模型滾動訓(xùn)練的多因子策略也能及時把握市場變化,始終獲得比因子等權(quán)策略更好的表現(xiàn)。
本文不足之處在于未做限制換手率方面的研究。實(shí)證分析結(jié)果表明,相對于因子等權(quán)策略,基于XGBoost 模型的機(jī)器學(xué)習(xí)多因子動態(tài)調(diào)倉策略在最大回撤方面的表現(xiàn)不如傳統(tǒng)的因子等權(quán)策略。究其原因在于綜合因子中各風(fēng)格因子權(quán)重的動態(tài)調(diào)整導(dǎo)致了資產(chǎn)組合換手率的明顯提高。資產(chǎn)組合換手率的提高意味著交易成本更高,導(dǎo)致資產(chǎn)組合回報降低。如果資產(chǎn)組合的換手率能夠得到降低,則可以大大降低交易成本,進(jìn)一步提升策略的表現(xiàn)[14]。