亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

基于機(jī)器學(xué)習(xí)的多因子選股策略實(shí)證研究

2022-12-25 06:45:36吳員福

大科技 2022年48期

吳員福

（中國人民大學(xué)數(shù)學(xué)學(xué)院，北京 100872）

0 引言

構(gòu)建量化投資組合的關(guān)鍵在于尋找到有效的風(fēng)格因子，并據(jù)此建立穩(wěn)定、靈活的多因子模型。這種多因子模型多為靜態(tài)模型。所謂“靜態(tài)”，是指多因子模型不能及時追蹤和把握市場環(huán)境的變化和宏觀經(jīng)濟(jì)的變化[1]。若要獲取長期穩(wěn)定的Alpha 收益，及時追蹤、把握市場環(huán)境的變化并調(diào)整風(fēng)格因子的構(gòu)成及相應(yīng)的權(quán)重是關(guān)鍵[2]。

本文旨在研究資本市場中資產(chǎn)價格數(shù)據(jù)的風(fēng)格因子“擇時”，在多因子模型的構(gòu)建過程中引入機(jī)器學(xué)習(xí)方法，以標(biāo)的資產(chǎn)歷史價格數(shù)據(jù)的分析為基礎(chǔ)，尋找共性風(fēng)格特征的分化輪動規(guī)律，對因子的未來表現(xiàn)進(jìn)行估計(jì)，并據(jù)此調(diào)整綜合因子中風(fēng)格因子的構(gòu)成與賦權(quán)[3]。

1 多因子模型

多因子模型的一般表達(dá)式如式（1）所示。

式中：Xjk——標(biāo)的證券j 在共性特征k 上的暴露；μj——標(biāo)的證券j 的殘差收益率[4]。

如果某投資組合由N 個標(biāo)的證券組成，各標(biāo)的證券在組合中所占比重分別是hp1，hp2，…，hpn，則整體收益率為表示如式（2）所示。

2 基于機(jī)器學(xué)習(xí)的因子擇時策略

2.1 決策樹模型

決策樹生成的原理如下：如果X 為輸入變量，Y 為輸出變量，并且Y 是連續(xù)變量，給定的訓(xùn)練集如式（3）所示。

按照上述原理進(jìn)行遍歷，以求尋找到最佳的j，獲得一個對（j，s），依次將其分成兩個部分，然后對分割出的每個部分重復(fù)上述操作，直到符合條件為止[6]。

2.2 XGBoost 模型

XGBoost 學(xué)習(xí)中，假設(shè)構(gòu)造了K 顆樹的情況下，則總體值可表示為：

式中：K——決策樹個數(shù)；F——一個泛函數(shù)，表示決策樹的函數(shù)空間；q——每棵樹的結(jié)構(gòu)；T——決策樹葉子節(jié)點(diǎn)的數(shù)目；w——一個權(quán)重向量；每一個fk都對應(yīng)著一個獨(dú)立的樹結(jié)構(gòu)q 和葉節(jié)點(diǎn)權(quán)重w[7]。

XGBoost 模型可采用如下步驟進(jìn)行構(gòu)建：

2.3 因子擇時框架

本文中首先選取主流的標(biāo)的資產(chǎn)共性特征，然后將宏觀經(jīng)濟(jì)指標(biāo)數(shù)據(jù)、共性特征歷史IC 數(shù)據(jù)、相關(guān)市場變量數(shù)據(jù)等共同作為機(jī)器學(xué)習(xí)算法的輸入，基于XGBoost 模型來估計(jì)每個共性風(fēng)格特征在下一時段的IC 值，也就是說，估計(jì)資本市場中標(biāo)的資產(chǎn)在未來時間的回報率與共性特征值之間的關(guān)聯(lián)程度ρ。計(jì)算共性特征未來IC 值的目的在于后續(xù)按照此IC 值對各個共性特征進(jìn)行賦權(quán)[11]。

3 實(shí)證研究

3.1 預(yù)測模型

本文基于XGBoost 模型預(yù)測標(biāo)的資產(chǎn)未來時期的回報率與共性特征當(dāng)前值之間的關(guān)聯(lián)程度ρ，然后根據(jù)估計(jì)的IC 值決定綜合因子中的各風(fēng)格因子的構(gòu)成以及風(fēng)格因子的權(quán)重。主要選擇共性特征歷史IC 序列數(shù)據(jù)、市場指標(biāo)、宏觀指標(biāo)作為機(jī)器學(xué)習(xí)模型的輸入特征[12]。

3.2 多因子動態(tài)調(diào)倉策略

本文中以周為調(diào)倉頻率，在某一時刻t 通XGBoost機(jī)器學(xué)習(xí)模型預(yù)測預(yù)測標(biāo)的資產(chǎn)在一周后的收益率與當(dāng)前特征取值之間的相關(guān)系數(shù)ρ。針對風(fēng)格因子進(jìn)行賦權(quán)的具體規(guī)則如下。

（1）在某一時刻t，采用XGBoost 模型對共性特征i下一時段選股的IC 值進(jìn)行估算，得到ICi，t。

（2）若風(fēng)格因子為正向因子，在ICi，t＞0 時，權(quán)值wi，t=ICi，t，否則認(rèn)為風(fēng)格因子在下一時段失效，權(quán)值wi，t=0。

（3）若風(fēng)格因子為負(fù)向因子，在ICi，t＜0 時，權(quán)值wi，t=-ICi，t，否則認(rèn)為風(fēng)格因子在下一時段失效，權(quán)值wi，t=0。

（4）對wi，t做歸一化的處理，使得，如果預(yù)測在下一時段所有因子都失效，則使用等權(quán)方式對風(fēng)格因子進(jìn)行賦權(quán)[13]。

3.3 實(shí)證結(jié)果對比分析

從回測結(jié)果的對比分析中可知，模型滾動訓(xùn)練的多因子策略的信息比為1.76，分別較因子等權(quán)策略和固定模型的多因子策略提高了62.9%和33.3%，而且在勝率、年化收益率、最大回撤等多項(xiàng)指標(biāo)上也有明顯提升。各模型回測表現(xiàn)對比如表1 所示。

表1 各模型回測表現(xiàn)對比

4 結(jié)語

隨著市場環(huán)境的變化以及市場參與者之間的博弈，量化投資中某一風(fēng)格因子帶來的回報率會產(chǎn)生波動。前期產(chǎn)生穩(wěn)定Alpha 收益的風(fēng)格因子其有效性可能在未來轉(zhuǎn)弱，甚至于完全失效，降低資產(chǎn)組合的超額收益率。本文提出基于XGBoost 模型的多因子策略旨在及時把握市場環(huán)境的變化以及風(fēng)格因子的輪動情況，并根據(jù)市場的變化靈活地選擇風(fēng)格因子以及在必要時調(diào)整風(fēng)格因子的權(quán)重。

歷史回測表明，相較于因子等權(quán)策略，基于XGBoost模型的多因子動態(tài)策略的表現(xiàn)優(yōu)勢明顯，回測期累積收益率由55.81%提升到88.28%，信息比也由1.08 提升到1.32，但最大回撤比因子等權(quán)策略要高。若采用模型滾動訓(xùn)練的模型，則能進(jìn)一步提升回測表現(xiàn)，在策略的勝率、信息比、最大回撤等方面都顯著優(yōu)于傳統(tǒng)的因子等權(quán)策略，在波動性較大的區(qū)間，基于模型滾動訓(xùn)練的多因子策略也能及時把握市場變化，始終獲得比因子等權(quán)策略更好的表現(xiàn)。

本文不足之處在于未做限制換手率方面的研究。實(shí)證分析結(jié)果表明，相對于因子等權(quán)策略，基于XGBoost 模型的機(jī)器學(xué)習(xí)多因子動態(tài)調(diào)倉策略在最大回撤方面的表現(xiàn)不如傳統(tǒng)的因子等權(quán)策略。究其原因在于綜合因子中各風(fēng)格因子權(quán)重的動態(tài)調(diào)整導(dǎo)致了資產(chǎn)組合換手率的明顯提高。資產(chǎn)組合換手率的提高意味著交易成本更高，導(dǎo)致資產(chǎn)組合回報降低。如果資產(chǎn)組合的換手率能夠得到降低，則可以大大降低交易成本，進(jìn)一步提升策略的表現(xiàn)[14]。