摘要:量化投資在國(guó)外應(yīng)用已經(jīng)非常普遍,目前國(guó)內(nèi)正處于快速發(fā)展階段。隨著我國(guó)股票市場(chǎng)的不斷改革,市場(chǎng)化程度日益提高,加上計(jì)算機(jī)和人工智能技術(shù)快速發(fā)展,使得量化投資在我國(guó)具備良好的發(fā)展前景。本文選取2016年1月1日至2019年12月31日期間滬深300指數(shù)成分股為研究對(duì)象構(gòu)建多因子量化投資策略,以2016年1月1日至2017年12月31日作為有效因子篩選期,2018年1月1日至2019年12月31日作為多因子策略的回測(cè)期,以檢測(cè)所構(gòu)建多因子模型的有效性。
關(guān)鍵詞:量化投資;多因子模型;滬深300;有效因子
一、研究背景
量化投資的蓬勃發(fā)展離不開金融學(xué)的發(fā)展,量化投資的很多理論都是建立在數(shù)理和金融學(xué)理論之上。Markowitz 在1952年建立了現(xiàn)代資產(chǎn)組合管理理論,提出了收益與風(fēng)險(xiǎn)均衡的分析范式,成為現(xiàn)代金融學(xué)的奠基理論。Sharpe、Litner、Mossin在資產(chǎn)組合理論基礎(chǔ)上研究了資產(chǎn)價(jià)格的均衡結(jié)構(gòu),提出了資本資產(chǎn)定價(jià)模型(CAPM),為度量風(fēng)險(xiǎn)和收益的關(guān)系提供了一個(gè)簡(jiǎn)化的線性模型。Ross于1970年提出了著名的無(wú)套利定價(jià)理論(APT),認(rèn)為股票收益是由多個(gè)因素共同決定的,對(duì)資本資產(chǎn)定價(jià)模型做了進(jìn)一步的深化,該理論成為量化投資選股的基本理論。
得益于國(guó)外資本市場(chǎng)的完善和高度市場(chǎng)化,量化投資在國(guó)外已有30多年的發(fā)展歷史。1969年,愛(ài)德華·索普成立了第一個(gè)量化投資基金——可轉(zhuǎn)換對(duì)沖合伙基金,后改名為普林斯頓-紐波特合伙基金,主要從事可轉(zhuǎn)換債券的套利。1973年美國(guó)芝加哥期權(quán)交易所成立,以金融衍生品創(chuàng)新和估值的量化投資革命拉開了序幕。
隨著我國(guó)資本市場(chǎng)的不斷完善和市場(chǎng)化程度不斷提高,量化投資迎來(lái)了快速發(fā)展時(shí)期,目前國(guó)內(nèi)越來(lái)越多的大學(xué)開設(shè)了量化投資課程,以培養(yǎng)量化投資人才。2015年以來(lái),中國(guó)量化投資基金行業(yè)已進(jìn)入快速發(fā)展軌道,截至2019年5月我國(guó)量化基金產(chǎn)品已有 362只,總規(guī)模在 1200 億元人民幣左右。量化投資成為了市場(chǎng)參與者進(jìn)行資產(chǎn)管理的重要工具之一。
二、模型構(gòu)建
(一)數(shù)據(jù)選取
本文選取2016年1月1日至2019年12月31日期間滬深300指數(shù)成分股作為研究對(duì)象,構(gòu)建多因子量化投資策略,研究量化多因子模型在我國(guó)A股市場(chǎng)的適用性。構(gòu)架多因子模型的第一步就是進(jìn)行有效因子的選取,以2016年1月1日至2017年12月31日作為有效因子篩選期,2018年1月1日至2019年12月31日作為多因子策略的回測(cè)期,檢測(cè)所構(gòu)建多因子選股策略的有效性。
構(gòu)建多因子模型的理論基礎(chǔ)是Ross提出的無(wú)套利定價(jià)理論(APT),其一般表達(dá)式為:
本文選取了估值因子,成長(zhǎng)因子,財(cái)務(wù)質(zhì)量,換手率因子,杠桿因子等五大類因子,共14個(gè)因子作為備選因子。分別是:賬面市值比、總市值、市盈率、市銷率、每股收益、roe、roa、毛利率、現(xiàn)金比率、總資產(chǎn)/股東權(quán)益、長(zhǎng)期債務(wù)/股東權(quán)益、資產(chǎn)負(fù)債率、換手率。
(二)數(shù)據(jù)處理
初始因子值數(shù)據(jù)存在離群值,量綱不一致等問(wèn)題,需要進(jìn)行去極值和標(biāo)準(zhǔn)化處理,消除離群值和量綱不一致對(duì)實(shí)證分析的影響。本文中,去極值采用均值標(biāo)準(zhǔn)差法,又稱為3sigma法,即將樣本數(shù)據(jù)當(dāng)中超過(guò)樣本均值3倍標(biāo)準(zhǔn)差的數(shù)據(jù)判定為離群值,上限為均值加上3倍標(biāo)準(zhǔn)差,下限為均值減去3倍標(biāo)準(zhǔn)差,超過(guò)上限的數(shù)據(jù)用上限代替,低于下限的數(shù)據(jù)用下限代替。
關(guān)于標(biāo)準(zhǔn)化,業(yè)界一般使用z-score法進(jìn)行標(biāo)準(zhǔn)化處理。該方法回答這樣一個(gè)問(wèn)題“給定數(shù)據(jù)距離其均值多少個(gè)標(biāo)準(zhǔn)差",在均值之上的數(shù)據(jù)會(huì)得到一個(gè)正的標(biāo)準(zhǔn)化分?jǐn)?shù),反之會(huì)得到一個(gè)負(fù)的標(biāo)準(zhǔn)化分?jǐn)?shù)。
(三)有效因子選取
找到能夠解釋股票收益的有效因子是構(gòu)建多因子策略的關(guān)鍵一步,本文選取IC值、IR值,作為篩選有效因子的標(biāo)準(zhǔn)。IC均值越大,表明排名分越靠前的股票,未來(lái)收益排名也越靠前。IR值代表因子在歷史上表現(xiàn)的穩(wěn)定性,IR值越大,因子越有效。根據(jù)分析,將賬面市值比、市凈率、市盈率、每股收益等10個(gè)因子初步選定為有效因子,并對(duì)有效因子進(jìn)行共線性分析,去除相關(guān)性高的因子。最終剩下賬面市值比、市凈率、、市銷率、每股收益、ROE、ROA、毛利率、換手率八個(gè)因子為最終有效因子。
三、策略回測(cè)
構(gòu)建多因子模型的常見(jiàn)方法有打分法和回歸法,本文使用打分法構(gòu)建模型,選取得分排名前5%的股票,構(gòu)建等權(quán)重股票投資組合,在2018年1月1日至2019年12月31日進(jìn)行回測(cè)檢驗(yàn)?;販y(cè)結(jié)果如圖1所示,相比于滬深300基準(zhǔn)收益,本文所構(gòu)造的多因子模型獲得了11.45%的累計(jì)收益,和基準(zhǔn)收益相比,有9.66%的超額收益率。
四、總結(jié)
本文基于無(wú)套利定價(jià)理論構(gòu)建了一個(gè)簡(jiǎn)單的多因子選股模型,以滬深300指數(shù)為基準(zhǔn),在回測(cè)期間獲得了超額收益,證明多因子量化模型在A股市場(chǎng)是適用的。本文研究還存在很多不足,比如候選因子的數(shù)量過(guò)少,因子篩選的樣本期不夠長(zhǎng),因子有效性的標(biāo)準(zhǔn)還應(yīng)該更嚴(yán)格一些。目前證明有效的因子在未來(lái)是可能失效的,因此在研究多因子模型時(shí),應(yīng)該充分考慮因子有效性的期限和范圍。
參考文獻(xiàn):
[1]薛海霞. 基于滬深300成分股的多因子選股策略研究[D].河北經(jīng)貿(mào)大學(xué),2020.
[2]李倩倩. 多因子量化選股模型建立及優(yōu)化[D].山東大學(xué),2019.
[3]孫奕迪,李恒昊,韓夢(mèng)雪.多因子模型在中國(guó)股票市場(chǎng)的選股應(yīng)用[J].現(xiàn)代營(yíng)銷(經(jīng)營(yíng)版),2020(11):242-243.
[4]趙子銘,趙文聲.基于有效因子復(fù)合檢驗(yàn)法的多因子選股策略[J].廣州航海學(xué)院學(xué)報(bào),2019,27(03):74-78.
[5]董曉波,常裕琦.基于因子IC的多因子量化選股模型及績(jī)效分析[J].長(zhǎng)春理工大學(xué)學(xué)報(bào)(社會(huì)科學(xué)版),2019,32(06):82-87.
[6]Markowitz,H.Portfolio Selection[J].Journal of Finance.1952,Vol.12,71–91.
[7]王曉霞. 基于成長(zhǎng)性的多因子選股模型的中國(guó)A股量化投資策略研究[D].浙江工商大學(xué),2020.
四川大學(xué)黃強(qiáng)