亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        機(jī)器學(xué)習(xí)驅(qū)動(dòng)的大類資產(chǎn)因子配置研究

        2022-09-17 03:42:16
        金融發(fā)展研究 2022年8期
        關(guān)鍵詞:森林預(yù)測因子

        周 亮 蔣 練

        (1.湖南財(cái)政經(jīng)濟(jì)學(xué)院財(cái)政金融學(xué)院,湖南 長沙 410205;2.湖南師范大學(xué)商學(xué)院,湖南 長沙 410081)

        一、引言

        自Fama 和French (1993)提出三因子模型以來,因子投資便成為投資理論研究及實(shí)踐應(yīng)用的焦點(diǎn),之后大量新的因子被提出并得到廣泛應(yīng)用。如Carhart(1997)基于美國共同基金數(shù)據(jù)提出了動(dòng)量因子(李富軍等,2019),Amihud(2002)基于換手率數(shù)據(jù)提出了非流動(dòng)性因子,Ang 等(2006)在發(fā)現(xiàn)低風(fēng)險(xiǎn)異象的基礎(chǔ)上提出了異質(zhì)波動(dòng)率因子,F(xiàn)ama和French(2015)在三因子的基礎(chǔ)上增加了投資因子和盈利因子構(gòu)造了五因子模型等(趙勝民等,2016)。除此以外,行為金融學(xué)的大量研究成果也被應(yīng)用到因子構(gòu)建上,最具代表性的是投資者情緒因子(Sun 等,2016;余傳明等,2018)。隨著數(shù)據(jù)的豐富和計(jì)算機(jī)性能的提高,越來越多的因子被挖掘出來,形成了Cochrane(2011)所說的“因子動(dòng)物園”。Harvey 等(2016)發(fā)現(xiàn)在頂級(jí)金融學(xué)術(shù)期刊和SSRN 高評(píng)價(jià)工作論文上的定價(jià)因子多達(dá)316 個(gè),其中59 個(gè)新因子是在2010—2012年短短三年間提出的。但是這么多因子并不都是有效的,Green 等(2017)和Hou等(2020)的研究發(fā)現(xiàn),大部分因子在后續(xù)的樣本外檢驗(yàn)中難以持續(xù)地提供超額收益。因此,在處理如此眾多的因子時(shí),必須使用不同的研究工具(Cochrane,2011)。在此背景下,在處理非線性及共線性關(guān)系方面表現(xiàn)頗佳的機(jī)器學(xué)習(xí)模型得到了金融理論界和實(shí)務(wù)界的廣泛關(guān)注。

        機(jī)器學(xué)習(xí)具有以下優(yōu)勢,使得其在金融領(lǐng)域表現(xiàn)出顯著優(yōu)于傳統(tǒng)計(jì)量建模技術(shù)的能力:第一,大部分機(jī)器學(xué)習(xí)技術(shù)設(shè)計(jì)的初衷就是用來進(jìn)行預(yù)測,如多層神經(jīng)網(wǎng)絡(luò)能夠逼近任意非線性函數(shù),基于樹模型的boosting 算法能夠根據(jù)預(yù)測誤差不斷更新樣本權(quán)重,因此,相比于傳統(tǒng)的計(jì)量經(jīng)濟(jì)模型,機(jī)器學(xué)習(xí)模型的預(yù)測能力顯著較高(Gu 等,2020)。第二,傳統(tǒng)計(jì)量經(jīng)濟(jì)模型只能處理有限變量,當(dāng)變量數(shù)量較多且存在共線性等問題時(shí),模型擬合能力及外推能力將會(huì)大幅降低,但是機(jī)器學(xué)習(xí)模型利用變量篩選及降維等技術(shù),可以有效解決共線性問題,從而可以向模型中添加大量變量,保證模型輸入信息的全面性、系統(tǒng)性(Bluwstein 等,2020)。第三,決策樹、支持向量機(jī)、神經(jīng)網(wǎng)絡(luò)和集成學(xué)習(xí)等機(jī)器學(xué)習(xí)算法均能對非線性函數(shù)進(jìn)行逼近,能夠通過參數(shù)尋優(yōu)擬合變量間的非線性關(guān)系,而傳統(tǒng)的計(jì)量建模技術(shù)只能擬合線性關(guān)系,或者通過在模型中添加變量的高階項(xiàng)或交互項(xiàng)對非線性關(guān)系進(jìn)行部分?jǐn)M合。具體到因子投資領(lǐng)域,國內(nèi)外大量學(xué)者利用各種公司特征或技術(shù)指標(biāo)作為自變量,構(gòu)造了機(jī)器學(xué)習(xí)的選股模型,無一例外,均發(fā)現(xiàn)模型具有較好的選股或擇時(shí)能力(李斌等,2019)。

        綜上,學(xué)者們對因子投資以及機(jī)器學(xué)習(xí)選股進(jìn)行了大量研究,但是存在著兩方面的改進(jìn)空間:一是現(xiàn)有研究大部分聚焦于直接進(jìn)行資產(chǎn)配置,但是正如Bass 等(2017)和Bender 等(2019)所指出的,基于因子的配置方法將資產(chǎn)配置的決策過程從資產(chǎn)層面轉(zhuǎn)向更為微觀的因子層面,投資者能夠通過其對因子收益分布以及相關(guān)性的預(yù)測更好地進(jìn)行資產(chǎn)配置(周亮和李寧,2021)。二是現(xiàn)有研究較少涉及機(jī)器學(xué)習(xí)最廣受詬病的“黑箱”屬性,對于金融投資而言,如果不清楚模型的內(nèi)部構(gòu)造及運(yùn)行機(jī)制,必然導(dǎo)致投資者在模型失效時(shí)容易喪失信心,從而不敢輕易使用。

        基于此,本文選取2004年1月—2021年12月我國股票市場、債券市場及商品期貨市場的8 個(gè)大類資產(chǎn)因子作為研究對象,利用隨機(jī)森林(Random Forrest,RF)模型構(gòu)造了因子配置模型,并利用特征重要性及部分依賴圖(Partial Dependence Plot,以下簡稱PDP)等方法對模型進(jìn)行解構(gòu),以打開機(jī)器學(xué)習(xí)的“黑箱”。相對于已有研究,本文的可能貢獻(xiàn)在于:一方面,不同于常見的多因子模型或二次規(guī)劃,本文利用機(jī)器學(xué)習(xí)模型,從非線性角度構(gòu)造投資組合,拓展了投資組合理論的研究邊界,同時(shí)通過解構(gòu)變量的相對重要性、非線性影響以及交互作用,部分打開了機(jī)器學(xué)習(xí)的“黑箱”;另一方面,將資產(chǎn)配置的研究視角拓展到因子層面,有助于投資者深入理解投資收益和風(fēng)險(xiǎn)的關(guān)鍵驅(qū)動(dòng)因素,明確風(fēng)險(xiǎn)和收益的來源。

        二、研究設(shè)計(jì)

        (一)隨機(jī)森林模型

        機(jī)器學(xué)習(xí)模型眾多,不存在所謂的最強(qiáng)模型,不同的數(shù)據(jù)、不同的問題適用不同的模型。其中,隨機(jī)森林方法結(jié)構(gòu)簡單,參數(shù)少,過擬合概率低,同時(shí)還具有非常強(qiáng)的樣本外預(yù)測能力。實(shí)證顯示,隨機(jī)森林模型得到的多空組合在收益性和穩(wěn)健性上都優(yōu)于傳統(tǒng)的線性模型,更重要的是它可以幫助我們省去“因子篩選”“因子加權(quán)”和“線性轉(zhuǎn)換”的中間過程,提升預(yù)測效率。

        圖1:隨機(jī)森林模型原理圖

        CART 對數(shù)據(jù)很敏感,隨機(jī)森林算法使得它生成的決策樹預(yù)測結(jié)果的相關(guān)性很低,但偏差變化不大,因此,把多個(gè)低相關(guān)性的預(yù)測結(jié)果組合在一起,方差會(huì)明顯降低。隨機(jī)森林是通過降低預(yù)測結(jié)果的波動(dòng)性來提升樣本外預(yù)測的準(zhǔn)確度,其性能通常要比單個(gè)決策樹和許多其他機(jī)器學(xué)習(xí)算法好得多(Fernández-Delgado 等,2014;周亮,2021)。隨機(jī)森林有兩個(gè)重要參數(shù),分別是決策樹的數(shù)量以及每個(gè)決策樹所使用的特征數(shù)量。為了避免模型過擬合,本文均使用模型的默認(rèn)參數(shù),決策樹數(shù)量為500 棵,每個(gè)決策樹所使用的特征數(shù)量為6 個(gè)(即18/3,本文共選擇了18個(gè)特征)。

        (二)模型檢驗(yàn)指標(biāo)

        為了對模型預(yù)測績效進(jìn)行評(píng)估,本文除選擇常見的RMSE、MAE 及Theil-U 進(jìn)行評(píng)估外,還選擇了方向預(yù)測準(zhǔn)確度DAR 及可決系數(shù),計(jì)算公式分別如式(2)—(6)所示。

        (三) PDP方法

        本文除了采用特征重要性分析評(píng)估隨機(jī)森林模型中各特征的相對重要程度外,還利用PDP方法探討了特征的非線性影響以及特征間的交互作用。PDP的核心思想是考察某項(xiàng)特征的不同取值對模型輸出值的影響,如圖2所示。將某項(xiàng)特征X全部設(shè)為常數(shù),其余特征保持不變,可得到一組新的模型輸入值X,再利用原模型進(jìn)行預(yù)測,比較預(yù)測值與初始預(yù)測值的差異,從而可以觀察到每個(gè)變量的相對重要性。

        圖2:PDP方法檢測特征重要性

        (四) 指標(biāo)選取及樣本說明

        為了檢驗(yàn)隨機(jī)森林模型在大類因子配置上的預(yù)測能力,本文選擇了6 個(gè)常見的股票類因子(包括市場因子MKT、規(guī)模因子SMB、估值因子HML、盈利因子RMW、投資因子CMA、動(dòng)量因子UMD)、1 個(gè)債券因子(BOND)、1 個(gè)商品期貨因子(METAL)的周數(shù)據(jù)作為分析對象,樣本周期為2004年1月至2021年12月。股票類因子中市場因子為滬深300指數(shù)的收益率,規(guī)模因子、估值因子、盈利因子、投資因子的構(gòu)造方法參照Fama-French 五因子模型,動(dòng)量因子參照Carhart 四因子模型;債券因子用中證全債指數(shù)收益率衡量;商品因子選擇了收益相對較高的南華金屬期貨指數(shù)收益率來衡量。隨機(jī)森林模型中,因變量為因子當(dāng)期收益率r,在特征(自變量)選取上,我們選擇了18 個(gè)常見的指標(biāo),包括動(dòng)量、波動(dòng)率、技術(shù)面指標(biāo)以及宏觀指標(biāo)等,具體如表1所示,其中ˉ為收益率均值。因子數(shù)據(jù)來自BetaPlus 小組(www.factorwar.com),其他數(shù)據(jù)來自萬得數(shù)據(jù)庫。

        表1:指標(biāo)及其說明

        三、實(shí)證結(jié)果及分析

        (一)因子描述性統(tǒng)計(jì)

        表2報(bào)告了所選因子的描述性統(tǒng)計(jì)結(jié)果??梢钥吹?,在所選樣本期內(nèi),估值因子HML 和投資因子CMA 表現(xiàn)不佳,年化收益率均為負(fù)值,說明二者在我國股票市場的整體有效性不強(qiáng);動(dòng)量因子UMD 表現(xiàn)也較為一般,年化收益率僅為0.33%,這符合大部分學(xué)者的研究結(jié)論,即動(dòng)量效應(yīng)在我國股市并不明顯;市場因子MKT 和商品期貨因子METAL 表現(xiàn)較好,年化收益率分別達(dá)到了9.51%和9.38%,說明整體來看,我國的股市及商品期貨(有色金屬)市場保持了穩(wěn)定的上升趨勢;除此以外,規(guī)模因子SMB 及盈利因子RMW 在樣本區(qū)間也具有一定的有效性;債券因子BOND 雖然年化收益率只有4.44%,但是其風(fēng)險(xiǎn)遠(yuǎn)低于股票類和商品期貨類因子,年化波動(dòng)率僅為2.13%,最大回撤也僅為4.06%,因此,其風(fēng)險(xiǎn)調(diào)整后收益(用夏普比率、索提諾比率及卡爾瑪比率衡量)遠(yuǎn)高于其他因子。

        表2:因子描述性統(tǒng)計(jì)

        圖3展示了部分因子的凈值曲線,可以看到,相對于其他因子,盈利因子RMW 及債券因子BOND 表現(xiàn)較為穩(wěn)定,但是由于收益不高,最終凈值遠(yuǎn)低于其他三個(gè)因子;規(guī)模因子SMB 在2016年以前有效性非常強(qiáng),但是從2017年開始出現(xiàn)了顯著回撤;商品因子METAL 在2015年以前波動(dòng)較為劇烈,凈值幾乎沒有上漲,但是從2016年開始進(jìn)入大牛市,最終凈值高達(dá)5.37;市場因子MKT 雖然最終凈值高達(dá)5.5,但是波動(dòng)也非常劇烈。從圖3總體來看,各因子之間的相關(guān)性較低,更詳細(xì)的相關(guān)性分析結(jié)果見表3。從表3可以看到,大部分因子間的相關(guān)系數(shù)很低,只有規(guī)模因子SMB 和投資因子CMA 的相關(guān)系數(shù)略高于0.4;很多因子間的相關(guān)系數(shù)顯著為負(fù),盈利因子RMW 與規(guī)模因子SMB、投資因子CMA 間的相關(guān)系數(shù)分別為-0.75 和-0.63,負(fù)相關(guān)性非常顯著。綜合來看,本文所選的8 個(gè)因子相關(guān)性較低,適合通過分散化投資降低風(fēng)險(xiǎn),提高投資收益。

        表3:因子相關(guān)系數(shù)矩陣

        圖3:因子凈值曲線

        (二)隨機(jī)森林模型預(yù)測及變量重要性分析

        1.模型預(yù)測能力分析。我們利用縮尾及標(biāo)準(zhǔn)化處理后的特征值對同樣經(jīng)過縮尾和標(biāo)準(zhǔn)化處理后的因子收益率進(jìn)行隨機(jī)森林回歸。具體而言,我們采用第t-250期至第t-1期的數(shù)據(jù)作為滾動(dòng)訓(xùn)練樣本,在訓(xùn)練樣本中采用第h-1 期(t-249

        表4:模型預(yù)測能力分析

        2.特征重要性分析。機(jī)器學(xué)習(xí)模型最廣受詬病的問題在于其“黑箱”屬性,即無法知道特征與因變量之間的關(guān)系。隨機(jī)森林模型可以通過基尼系數(shù)評(píng)估變量的相對重要性,相對于神經(jīng)網(wǎng)絡(luò)、支持向量機(jī)等其他機(jī)器學(xué)習(xí)算法,更像一個(gè)“白箱”。圖4給出了本文的特征重要性研究結(jié)果,其中上圖是將所有數(shù)據(jù)構(gòu)造靜態(tài)隨機(jī)森林計(jì)算出的結(jié)果,下圖是采用滾動(dòng)方法構(gòu)造隨機(jī)森林,根據(jù)最后一個(gè)隨機(jī)森林計(jì)算出的結(jié)果。通過整體和最后一個(gè)隨機(jī)森林的對比,可以判斷特征的相對重要程度以及特征重要性的變化??梢钥吹剑谡w的分析結(jié)果中,動(dòng)量指標(biāo)起到了最重要的作用,其次是波動(dòng)率指標(biāo),宏觀指標(biāo)的預(yù)測能力較弱;最后一個(gè)隨機(jī)森林的分析結(jié)果中,動(dòng)量指標(biāo)和波動(dòng)率指標(biāo)的預(yù)測能力仍然是最強(qiáng)的,只是25 周波動(dòng)率的預(yù)測能力有所降低,大部分宏觀指標(biāo)的預(yù)測能力仍然很弱??傮w而言,雖然不同的隨機(jī)森林中變量重要性并不完全一致,但是動(dòng)量和波動(dòng)率等量價(jià)指標(biāo)的重要性相對更強(qiáng),而宏觀指標(biāo)的作用微乎其微。

        圖4:特征重要性分析

        (三)變量非線性及交互作用分析

        機(jī)器學(xué)習(xí)模型的預(yù)測精度之所以遠(yuǎn)遠(yuǎn)好于普通的線性模型,除了其能輸入大量特征而不會(huì)導(dǎo)致共線性外,更關(guān)鍵在于它能處理特征與因變量之間的非線性關(guān)系以及特征之間的交互作用。我們采用PDP 方法計(jì)算特征不同取值對預(yù)測能力的影響,并根據(jù)預(yù)測能力的改變程度評(píng)估特征的重要性以及影響的非線性;同時(shí),我們還可以對不同特征同時(shí)進(jìn)行賦值,從而觀察特征間的交互影響。圖5和圖6報(bào)告了研究結(jié)果,其中圖5是部分特征(選取了重要性較高的四個(gè)特征,包括動(dòng)量、波動(dòng)率及宏觀特征)的特征依賴圖,可以觀察特征的非線性影響;圖6是部分特征預(yù)測能力的熱力圖,可以觀察特征間的交互作用。

        1.非線性作用分析。從圖5可以看到,所有特征的非線性都非常明顯,如兩周動(dòng)量指標(biāo)MOM2 取值在0.6附近時(shí)對因變量的預(yù)測能力最強(qiáng),取值趨向于0或1 時(shí)預(yù)測能力較弱,取值在0.4 附近時(shí)預(yù)測能力最弱;一周動(dòng)量指標(biāo)MOM1 取值在0.4 附近時(shí)預(yù)測能力最弱,但是當(dāng)取值趨向于0 時(shí)預(yù)測能力較強(qiáng);十二周波動(dòng)率指標(biāo)VOL12 的預(yù)測能力波動(dòng)較強(qiáng),隨著取值的升高,經(jīng)歷了幾輪上漲再下跌的趨勢;匯率Exchange 對因變量的影響則符合兩端高、中間低的特征。綜合來看,所有特征的非線性均非常明顯,這也是機(jī)器學(xué)習(xí)模型預(yù)測能力普遍較強(qiáng)的原因之一。

        圖5:變量非線性影響分析

        2.交互作用分析。圖6中上圖報(bào)告了一周動(dòng)量指標(biāo)MOM1 和兩周動(dòng)量指標(biāo)MOM2 的交互作用,下圖報(bào)告了十二周波動(dòng)率VOL12 和匯率Exchange 的交互作用,顏色越深說明模型預(yù)測能力越強(qiáng),變量越重要。從上圖可以看到,當(dāng)MOM2 取值較高、MOM1取值趨向于兩端的時(shí)候,模型預(yù)測能力最強(qiáng);當(dāng)MOM2 取值較低、MOM1 取值趨向于兩端的時(shí)候,模型預(yù)測能力較強(qiáng);而在MOM1 和MOM2 取值都中等的時(shí)候,模型預(yù)測能力很弱。從下圖可以看到,當(dāng)VOL12取值較高、Exchange取值較低的時(shí)候,模型預(yù)測能力最強(qiáng);當(dāng)VOL12 和Exchange 取值均較高的時(shí)候,模型預(yù)測能力較強(qiáng);在VOL12 取值較低、Exchange取值中等的時(shí)候,模型預(yù)測能力最差。綜合來看,變量間的交互作用非常明顯,機(jī)器學(xué)習(xí)模型對交互作用的識(shí)別同樣是其預(yù)測能力強(qiáng)于線性模型的關(guān)鍵原因之一。

        圖6:變量間交互作用分析

        (四)投資績效分析

        除了利用預(yù)測誤差來檢驗(yàn)隨機(jī)森林模型的預(yù)測能力外,我們還利用構(gòu)造投資組合的非參數(shù)方法來對隨機(jī)森林模型的有效性進(jìn)行檢驗(yàn)。具體而言,根據(jù)隨機(jī)森林模型的滾動(dòng)預(yù)測結(jié)果(滾動(dòng)樣本為100 周,即約2年的建模周期),每期選擇表現(xiàn)最好的3個(gè)因子進(jìn)行等權(quán)投資。作為對比,我們考慮了隨機(jī)森林分類(以下簡稱RF分類)模型、等權(quán)重、均值—方差(MV組合)、最小風(fēng)險(xiǎn)、風(fēng)險(xiǎn)平價(jià)及Faber 策略等投資組合。其中RF 分類模型是對每個(gè)因子建立分類模型,配置概率最高的3 個(gè)因子;等權(quán)重組合是將8 個(gè)因子進(jìn)行等權(quán)配置;均值—方差及最小風(fēng)險(xiǎn)組合采用馬科維茨方法構(gòu)造;風(fēng)險(xiǎn)平價(jià)組合是每期使8 個(gè)因子的風(fēng)險(xiǎn)貢獻(xiàn)相一致的組合;Faber 策略是趨勢投資組合,每期選擇在120 周均線以上的資產(chǎn)進(jìn)行等權(quán)投資(Faber,2007)。表5報(bào)告了不同投資組合的績效表現(xiàn),可以看到,隨機(jī)森林模型的收益最高,達(dá)到了8.29%,雖然其波動(dòng)率較高,但是最大回撤反而低于等權(quán)重、MV 和Faber 策略組合,較高的收益加上適當(dāng)?shù)娘L(fēng)險(xiǎn)水平,使得其風(fēng)險(xiǎn)調(diào)整后收益普遍高于其他策略;最小風(fēng)險(xiǎn)及風(fēng)險(xiǎn)平價(jià)組合的波動(dòng)及回撤均較低,主要是因?yàn)檫@兩個(gè)組合中債券因子的權(quán)重較高;RF 分類模型的收益率雖然相對于其他模型較優(yōu),但是遠(yuǎn)遜于RF 模型,可能的原因在于RF 分類模型相對于隨機(jī)森林模型損失了過多信息。圖7展示了各策略的凈值曲線,因?yàn)樵跇?gòu)建預(yù)測指標(biāo)的時(shí)候用到了50 周的數(shù)據(jù)(1年),在建模的時(shí)候需要用到100 周的滾動(dòng)樣本(2年),因此,凈值計(jì)算從2007年6月開始。可以看到,隨機(jī)森林和RF 分類策略的凈值高于其他策略,但是RF 分類策略的凈值從2018年開始持續(xù)震蕩,而隨機(jī)森林策略的凈值保持了持續(xù)上升趨勢,最終達(dá)到3.25,遠(yuǎn)高于其他策略。

        圖7:策略凈值曲線

        表5:投資績效分析

        (五)穩(wěn)健性檢驗(yàn)

        1.分階段檢驗(yàn)。我們先將樣本時(shí)間段分為2007—2011年、2012—2016年和2017—2021年三個(gè)跨度大致相等的時(shí)間段,每段包含五年的交易時(shí)間,并分別統(tǒng)計(jì)不同時(shí)間段內(nèi)各策略的投資績效,結(jié)果如表6所示。可以看到,除了2012—2016年RF 分類策略的收益率略高于RF策略外,其他時(shí)間段RF策略的收益率均高于其他所有策略,且RF 策略的最大回撤在大部分時(shí)間內(nèi)好于RF 分類、等權(quán)重、MV 及Faber 策略組合。因此,綜合來看,前文的研究結(jié)論是穩(wěn)健的,相對于其他策略,隨機(jī)森林策略由于考慮了特征的非線性影響及交互作用,能夠顯著提高投資策略的績效表現(xiàn)。

        表6:分階段穩(wěn)健性檢驗(yàn)

        2.更改策略特征的穩(wěn)健性檢驗(yàn)。除了分階段進(jìn)行檢驗(yàn),我們還針對因子數(shù)量及變量特征進(jìn)行了穩(wěn)健性分析,表7報(bào)告了分析結(jié)果。其中,“2因子”是指選擇每期僅選擇表現(xiàn)最好的2 個(gè)因子進(jìn)行等權(quán)配置;“5 因子”是僅利用市場因子MKT、規(guī)模因子SMB、盈利因子RMW、債券因子BOND、商品期貨因子METAL 五個(gè)表現(xiàn)較好的因子,每期從中選擇表現(xiàn)最好的2個(gè)因子進(jìn)行配置;“10特征”是指從18個(gè)特征中選擇重要性最強(qiáng)的10個(gè)特征建立隨機(jī)森林模型,再滾動(dòng)建模構(gòu)造投資組合;“技術(shù)特征”指僅利用12 個(gè)技術(shù)特征進(jìn)行建模;“宏觀特征”指僅利用6個(gè)宏觀經(jīng)濟(jì)指標(biāo)進(jìn)行建模;“偏態(tài)特征”指在18個(gè)特征的基礎(chǔ)上,增加上行波動(dòng)率、下行波動(dòng)率、偏度和峰度(均包括25周和50周兩個(gè)周期)特征進(jìn)行建模;“正交特征”是指對18個(gè)特征進(jìn)行施密特正交化后再進(jìn)行建模。

        表7:更改因子和特征的穩(wěn)健性檢驗(yàn)

        可以看到,“2 因子”策略提高了策略收益率,但是波動(dòng)率和最大回撤也有所增加,風(fēng)險(xiǎn)調(diào)整后收益略微不及原始的RF 策略,說明集中化投資對結(jié)果的影響并不大;“5因子”策略在降低收益的同時(shí)反而提高了風(fēng)險(xiǎn),說明雖然其他3 個(gè)因子(HML、CMA 和UMD)整體投資收益不高,但是其階段性表現(xiàn)可以提高整個(gè)策略的投資績效。對特征進(jìn)行篩選對投資績效有一定影響,“10 特征”策略略微降低了投資風(fēng)險(xiǎn),但是投資收益也出現(xiàn)了一定下滑;“技術(shù)特征”策略則在略微降低投資風(fēng)險(xiǎn)的同時(shí),使收益發(fā)生了輕微上升,從而導(dǎo)致夏普比率從0.94 提高到0.95;宏觀特征在隨機(jī)森林模型中的重要性并不高,故“宏觀特征”策略表現(xiàn)遠(yuǎn)差于原始隨機(jī)森林策略;加入偏態(tài)特征因子是無效的,“偏態(tài)特征”策略的收益率反而大幅低于原始隨機(jī)森林策略,說明向機(jī)器學(xué)習(xí)模型中加入過多的、效果不強(qiáng)的因子,并不能提高模型的預(yù)測能力;將特征進(jìn)行正交化有助于提高收益,但是風(fēng)險(xiǎn)也隨之升高,從風(fēng)險(xiǎn)調(diào)整后的收益來看,這樣的操作得不償失。綜合來看,無論是改變因子的組合,還是對特征進(jìn)行重新篩選,隨機(jī)森林策略均能表現(xiàn)出較高的投資績效,前文的研究結(jié)論是穩(wěn)健的,而且在建模前進(jìn)行一定的特征工程(如精選技術(shù)特征)對于進(jìn)一步提高投資績效可能是有幫助的。

        四、結(jié)論與展望

        機(jī)器學(xué)習(xí)模型能夠有效解決變量間的共線性問題,處理變量間的非線性關(guān)系及交互影響,故其預(yù)測能力顯著高于普通的線性模型。選取2004—2021年8個(gè)大類資產(chǎn)因子(包括股票市場的MKT、SMB、HML、RMW、CMA 和UMD 因子,債券市場的BOND 因子,商品期貨市場的METAL 因子)以及18個(gè)量價(jià)及宏觀特征,構(gòu)造隨機(jī)森林模型,考察了模型的預(yù)測能力、特征的重要性和影響,以及所構(gòu)造投資組合的投資績效。研究結(jié)果表明:第一,相較于普通OLS 及LASSO 模型,隨機(jī)森林模型預(yù)測能力顯著提高;第二,量價(jià)特征尤其是動(dòng)量因子在隨機(jī)森林模型中的重要性遠(yuǎn)高于宏觀特征;第三,特征對因變量的影響是非線性的,且特征之間存在著顯著的交互作用,這也是機(jī)器學(xué)習(xí)模型能夠取得較好預(yù)測效果的重要原因;第四,隨機(jī)森林模型構(gòu)造的投資組合的投資績效遠(yuǎn)好于常見的等權(quán)重、MV、最小風(fēng)險(xiǎn)、風(fēng)險(xiǎn)平價(jià)及趨勢投資組合,也要好于RF 分類算法構(gòu)造的投資組合;第五,研究結(jié)論在不同的樣本期內(nèi)均是穩(wěn)健的,更改因子或特征的性質(zhì)后的結(jié)果依然穩(wěn)健,在建模前進(jìn)行一定的特征工程(如精選技術(shù)特征)對于進(jìn)一步提高投資績效可能是有幫助的。

        本文的研究結(jié)論是對投資組合理論以及人工智能理論的有益補(bǔ)充,對于投資實(shí)踐也具有較強(qiáng)的借鑒意義。未來可以從以下方面進(jìn)一步開展深入研究:首先,本文選擇了8 個(gè)常見的大類資產(chǎn)因子,但是實(shí)際上發(fā)表在金融學(xué)期刊的因子成百上千(Harvey 等,2016),未來的研究可以選擇更多、更為有效的因子進(jìn)行配置,通過分散化投資的方法可以實(shí)現(xiàn)更穩(wěn)健的收益;其次,正如本文穩(wěn)健性檢驗(yàn)中所發(fā)現(xiàn)的,對特征進(jìn)行特征工程有利于提高投資績效,未來可以嘗試降維、降噪等更多方法進(jìn)行先期的特征工程,使特征的提取及輸入更有效,必將帶來更高的投資績效;再次,可以對所選因子進(jìn)行更為有效的配置,而不是簡單的等權(quán)重,如均值—方差優(yōu)化、風(fēng)險(xiǎn)平價(jià)、尾部風(fēng)險(xiǎn)優(yōu)化等方法均可以用來構(gòu)造更穩(wěn)健的組合;最后,本文研究的是因子配置,但是實(shí)際上,本文提出的8 個(gè)因子中,只有債券因子BOND 和商品期貨因子METAL是可以直接投資的,6個(gè)股票類因子并非可以直接投資,因此,可以進(jìn)一步研究如何利用可投資資產(chǎn)進(jìn)行因子的投資和配置,代表性方法包括但不限于因子映射、組合優(yōu)化等。

        猜你喜歡
        森林預(yù)測因子
        無可預(yù)測
        黃河之聲(2022年10期)2022-09-27 13:59:46
        選修2-2期中考試預(yù)測卷(A卷)
        選修2-2期中考試預(yù)測卷(B卷)
        因子von Neumann代數(shù)上的非線性ξ-Jordan*-三重可導(dǎo)映射
        一些關(guān)于無窮多個(gè)素因子的問題
        影響因子
        影響因子
        不必預(yù)測未來,只需把握現(xiàn)在
        哈Q森林
        哈Q森林
        极品少妇在线观看视频| 精品成人乱色一区二区| 亚洲天堂成人在线| 日韩精品一区二区三区四区五区六| 在线观看国产白浆一区三区| 男人边做边吃奶头视频| 四虎影视永久在线精品| 亚洲日日噜噜噜夜夜爽爽| 亚洲精品一区二区三区四区久久| √天堂中文官网在线| 亚洲av成人精品日韩一区| 激,情四虎欧美视频图片| 人妻一区二区三区在线看| 国产激情无码一区二区三区| 中文字幕av在线一二三区| 久久亚洲一级av一片| 日本不卡的一区二区三区中文字幕| 美女把尿囗扒开让男人添| 91视频免费国产成人| 国产精品毛片av一区二区三区| 国产精品女主播福利在线| 国产精品无码成人午夜电影 | 欧美日韩高清一本大道免费| 免费看片的网站国产亚洲| 三级做a全过程在线观看| 亚洲精品永久在线观看| 视频一区视频二区亚洲免费观看| 国产自拍偷拍视频免费在线观看| 中文字幕av免费专区| 國产AV天堂| 日本女优爱爱中文字幕| 国产猛男猛女超爽免费视频| 国产999精品久久久久久| 无码视频一区=区| 麻豆视频在线播放观看| 亚洲性啪啪无码av天堂| 91久久国产综合精品| 人妻有码av中文幕久久| 中文字幕乱码亚洲精品一区| 亚洲欧洲国产日产国码无码| 久久人妻精品免费二区|