亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于梯度決策提升樹的選股方法研究

        2021-10-09 11:28:28盧笛
        商訊·公司金融 2021年24期

        作者簡介:盧笛(2000-),女,漢族,吉林長春人,主要研究方向:金融數(shù)學(xué)。

        摘 要:多因子的選股模型作為投資領(lǐng)域的重要方法,一直以來活躍在主流量化投資領(lǐng)域決策中,而如何根據(jù)股票的各個(gè)因子來準(zhǔn)確地預(yù)測個(gè)股的月度超額收益,也是多因子模型希望解決的主要問題之一。本文將梯度決策提升樹引入量化投資決策,建立了一套基于梯度決策提升樹模型的多因子量化投資策略,并利用滬深300成分股進(jìn)行選股回測,選取模型預(yù)測收益率靠前的30只股票進(jìn)行實(shí)證分析。研究表明,梯度決策提升樹模型指導(dǎo)下的年華收益率為29.1%,較基準(zhǔn)年化收益率有大幅提升,且回撤率更低,驗(yàn)證了該量化選股模型的有效性。

        關(guān)鍵詞:多因子選股;梯度決策提升樹;量化投資

        近年來,隨著機(jī)器學(xué)習(xí)理論的高速發(fā)展,其在量化投資領(lǐng)域也得到了廣泛應(yīng)用,美國的許多投資機(jī)構(gòu)早已在投資策略,選股方案指定上引入了多種機(jī)器學(xué)習(xí)模型輔助決策;而國內(nèi)的股票基金行業(yè)也逐漸開始使用機(jī)器學(xué)習(xí)模型來指導(dǎo)選股,相較于傳統(tǒng)的多因子策略取得了較高的超額收益。

        本質(zhì)來說,選股問題可以抽象為一個(gè)回歸問題,選股即是對(duì)股票的多個(gè)因子構(gòu)成的向量進(jìn)行對(duì)收益率的擬合。該分類問題可分解為兩個(gè)子問題,一方面是因子的選擇,即選用股票的哪些方面的特征;另一方面是回歸模型的選擇,即使用的分類算法。傳統(tǒng)的多因子策略模型需要為因子分配合理權(quán)重,否則會(huì)極大的影響模型效果,通常是超額收益越大,為因子賦予的權(quán)重越大,但衡量因子選股效果的指標(biāo)有很多,如收益相關(guān)系數(shù),跑贏指數(shù)概率等,難以人為進(jìn)行均衡來配置。本文擬以梯度決策提升樹為核心回歸算法,建立一套選股指導(dǎo)系統(tǒng)來探索量化交易市場。

        一個(gè)優(yōu)秀的量化選股策略能夠有效克服投資者面臨的信息過載,令投資者的投資獲得提升。對(duì)于買方機(jī)構(gòu)來說,既可以以該策略為指導(dǎo)自營獲得收益,也可以基于此發(fā)布理財(cái)產(chǎn)品,以管理費(fèi)、贖回費(fèi)等方式賺取零風(fēng)險(xiǎn)收益;對(duì)于賣方機(jī)構(gòu),則能夠?qū)⒉呗源虬鼮楣善蓖扑]功能來作為軟件賣點(diǎn),獲取更多傭金。

        梯度決策提升樹選股模型

        選股問題本質(zhì)是分類問題,因此選擇合適的分類模型能極大影響量化投資策略的效果。在選股領(lǐng)域,常用的決策模型有決策樹、神經(jīng)網(wǎng)絡(luò)、支持向量機(jī)等,其中決策樹在處理噪音數(shù)據(jù)時(shí)效果交叉,且存在過擬合的可能;而神經(jīng)網(wǎng)絡(luò)模型對(duì)個(gè)股的走勢預(yù)測效果欠佳;支持向量機(jī)模型雖然優(yōu)于傳統(tǒng)神經(jīng)網(wǎng)絡(luò)推斷,但支持向量機(jī)自身的特性使得其在多分類問題上天生弱于決策樹模型,因而還存在一定提升空間。基于以上模型的特點(diǎn),本文選擇梯度決策提升樹作為選股模型。

        梯度決策提升樹(Gradient Boosted Decision Tree,GBDT)是由Friedman等[1]在2001年提出的一種經(jīng)典的機(jī)器學(xué)習(xí)方法,屬于boosting系列算法中的一個(gè)代表算法,它是一種迭代的決策樹算法,所有樹的結(jié)論累加起來作為最終答案。GBDT設(shè)計(jì)的目的為了求解損失函數(shù)的優(yōu)化,具體思路為對(duì)損失函數(shù)求梯度,以負(fù)梯度的方向代入模型的當(dāng)前值,以當(dāng)前值作為殘差值的近似。它采用了加法模型,通過向著減小殘差的方向收斂得到將輸入數(shù)據(jù)分類或回歸的模型。圖 1說明了GBDT的訓(xùn)練過程:

        GBDT的經(jīng)多次迭代后收斂,每輪訓(xùn)練多個(gè)分類器,每個(gè)分類器基于上一次迭代得到的殘差礎(chǔ)上進(jìn)行訓(xùn)練。作為集成學(xué)習(xí)方法的一種,GBDT的基分類器屬于弱分類器,需要結(jié)構(gòu)簡單且滿足低方差、高偏差的條件,這與GBDT的損失函數(shù)是基于降低偏差有關(guān);通常來說,GBDT通常以CART TREE作為基分類器,且每棵CART TREE的深度相對(duì)較低以保證基分類器的復(fù)雜度不會(huì)過高。最終將每輪訓(xùn)練得到的基分類器加權(quán)求和,得到總的分類器。

        GBDT既可以解決分類問題,也可以解決回歸問題,對(duì)于選股適用于回歸模型,數(shù)學(xué)語言表述如下:

        對(duì)訓(xùn)練樣本,最大迭代次數(shù)T,損失函數(shù)為L,其中為股票因子組成的向量,為股票價(jià)格。

        1.初始化弱分類器

        a)樣本負(fù)梯度

        b)利用 擬合一個(gè)CART回歸樹,得到第棵回歸樹,其對(duì)應(yīng)葉子結(jié)點(diǎn)區(qū)域?yàn)椋渲袨榛貧w樹葉子節(jié)點(diǎn)的個(gè)數(shù)

        股票因子選擇

        在確定了核心模型后,還需要確定參與訓(xùn)練和股價(jià)預(yù)測股票因子,股票因子的選擇將和模型一起決定股價(jià)預(yù)測的效果。目前,多因子的選股模型是國際上主流的量化選股模型,該模型認(rèn)為股票的未來收益率受公司的財(cái)務(wù)指標(biāo)和其他某些行情指標(biāo)影響,且這種影響在時(shí)間上是可重復(fù)的,因此通過對(duì)歷史數(shù)據(jù)中各種因子的分析,能夠發(fā)現(xiàn)那些有投資價(jià)值的公司,因而適合的股票因子選擇也對(duì)選股策略的準(zhǔn)確性有著很大影響。本文參考了多篇文獻(xiàn)[2-4]的分析,從動(dòng)量因子,交易量因子,估值因子等多個(gè)方面初步選取了28個(gè)有效因子。

        首先對(duì)因子進(jìn)行歸一化處理,這里使用均值方差法將因子值域歸一到區(qū)間[0,1];另外為了減少噪聲,將當(dāng)月超額收益分為數(shù)在20%到80%之間的數(shù)據(jù)去除。

        對(duì)于機(jī)器學(xué)習(xí)來說,雖然更多的特征通常意味著對(duì)樣本更全面的表示,但使用的特征過多也會(huì)帶來訓(xùn)練樣本數(shù)的增加,甚至可能引發(fā)維度災(zāi)難[5],所以本文對(duì)28個(gè)因子的特征進(jìn)行一次主成分分析,并根據(jù)分析結(jié)果選擇了前20維的因子,最終使用的股票因子如表 1所示。

        實(shí)驗(yàn)數(shù)據(jù)選用了2015年1月1日至2020年12月31日期間滬深300成分股全部股票每月最后交易日的股票因子值和月收益率。2015年1月1日至2019年5月31日的數(shù)據(jù)被作為訓(xùn)練集來訓(xùn)練模型,2019年6月1日到2020年12月31日的數(shù)據(jù)用于回測部分,經(jīng)缺失值篩選后,剩余股票數(shù)據(jù)為11634條。

        我們在計(jì)算因子時(shí),需要獲得公司的某些財(cái)務(wù)數(shù)據(jù),但在實(shí)際的投資過程中,公司財(cái)務(wù)數(shù)據(jù)的獲取往往并不是及時(shí)的,比如在6月底7月初時(shí),第二季度已經(jīng)結(jié)束,但有些公司的二季報(bào)仍未公布,這就帶來了信息的滯后性,為了使實(shí)驗(yàn)結(jié)論能夠指導(dǎo)實(shí)際的投資,我們也需要對(duì)訓(xùn)練的數(shù)據(jù)做相應(yīng)的滯后處理。從公司財(cái)報(bào)最晚的公布時(shí)間來看,一二三季報(bào)的時(shí)間分別是當(dāng)年4月底、8月底、10月底,而年報(bào)則是次年的4月底,由此可知我們在11、12月和次年前4個(gè)月應(yīng)使用前一年三季報(bào)的數(shù)據(jù),而5、6、7、8月則應(yīng)使用本年度一季報(bào)及前一年的年報(bào)數(shù)據(jù),9、10月份則正常使用三季報(bào)即可,如此可以貼合實(shí)際的操作。

        日本女优中文字幕在线播放| 91精品国产丝袜在线拍| 欧美日本国产亚洲网站免费一区二区| 久久精品伊人久久精品| 精品高朝久久久久9999 | 青草视频在线播放| 久久精品国产亚洲不av麻豆| 国内偷拍第一视频第一视频区| 少妇一级淫片中文字幕| 99久久婷婷国产综合精品电影| 亚洲欧美日韩专区一| 色婷婷精品国产一区二区三区| 亚洲综合日韩精品一区二区| 午夜福利院电影| 2021年国产精品每日更新| 人妻av中文字幕精品久久| 极品少妇被黑人白浆直流| 玩弄少妇高潮ⅹxxxyw| 亚洲男人堂色偷偷一区| 亚洲成在人线天堂网站| 天堂中文а√在线| 欧美国产成人精品一区二区三区| 亚洲AV无码成人精品区H| 亚洲国产精品区在线观看| 久久精品国产亚洲av高清热| 日本一本久道| av天堂在线免费播放| 真人做爰试看120秒| 亚洲国产精品嫩草影院久久| 污污污国产免费网站| 久久精品国产亚洲av麻豆床戏| 玩弄丰满奶水的女邻居 | 亚洲捆绑女优一区二区三区| 亚洲国产欧美在线观看| 在线看片无码永久免费aⅴ| 亚洲精品精品日本日本| 日本不卡高字幕在线2019| 精品国产aⅴ无码一区二区| 小13箩利洗澡无码免费视频| 国产无套一区二区三区久久| 精品人妻午夜一区二区三区四区|