摘 要:隨著我國(guó)股票市場(chǎng)規(guī)模的不斷擴(kuò)大,交易復(fù)雜程度不斷加深,如何在眾多上市公司中選擇值得投資的股票,實(shí)現(xiàn)資產(chǎn)最優(yōu)配置和風(fēng)險(xiǎn)控制是個(gè)人和機(jī)構(gòu)投資者非常關(guān)心的問(wèn)題。多因子選股策略通過(guò)選取與股價(jià)高度相關(guān)的影響因子,可以幫助投資者在實(shí)現(xiàn)可觀收益的同時(shí)控制風(fēng)險(xiǎn)?;诖?,本文選取滬深300股指的成分股作為多因子模型分析的股票池,通過(guò)4個(gè)價(jià)值因子、4個(gè)成長(zhǎng)因子、4個(gè)質(zhì)量因子共12個(gè)因子進(jìn)行單因子和多因子分析,利用t檢驗(yàn)和回歸分析對(duì)上述12個(gè)因子進(jìn)行有效性檢驗(yàn),選出有效因子并構(gòu)造適合一般投資者使用的多因子模型。研究結(jié)果表明:正向和負(fù)向因子分別有成長(zhǎng)和價(jià)值因子,實(shí)證效果比較好的有市盈率因子、市銷率因子、市現(xiàn)率因子,而質(zhì)量類因子的結(jié)果顯示賬面市值比和總資產(chǎn)周轉(zhuǎn)率對(duì)個(gè)股回報(bào)率的正向效果明顯。表明,財(cái)務(wù)質(zhì)量與該公司的股票收益相關(guān)。
關(guān)鍵詞:量化投資;多因子模型;回歸分析
本文索引:鄒陸曦.基于多因子模型的量化投資研究[J].中國(guó)商論,2021(24):-103.
中圖分類號(hào):F832.48 文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):2096-0298(2021)12(b)--04
隨著我國(guó)資本市場(chǎng)日趨成熟,人們的投資理念日趨科學(xué)和理性,投資方式也變得多元化,開(kāi)始將國(guó)外引入的量化投資思想結(jié)合中國(guó)資本市場(chǎng)的具體情況,而不是依賴于情感和過(guò)去的感性經(jīng)驗(yàn)[1]。這種投資模式的變化使得我國(guó)量化投資研究得到迅速發(fā)展,逐漸增加的量化基金及其他定量金融產(chǎn)品在投資策略中越來(lái)越重要,因此在我國(guó)金融市場(chǎng)中,量化投資得到了越來(lái)越多的關(guān)注[2]。信息不對(duì)稱使得我國(guó)資本市場(chǎng)出現(xiàn)較多的市場(chǎng)失靈現(xiàn)象,往往造成市場(chǎng)非完全有效,與內(nèi)在價(jià)值偏離(定價(jià)錯(cuò)誤)的股票也較多,因此在這樣的市場(chǎng)中,量化策略具有特有的紀(jì)律性、分散化持股、套利組合、系統(tǒng)性等優(yōu)勢(shì),量化投資策略的應(yīng)用前景廣闊[3]。
多因子選股模型作為一種應(yīng)用較為廣泛的量化投資策略[4],基本原理是通過(guò)經(jīng)濟(jì)邏輯和市場(chǎng)經(jīng)驗(yàn),捕獲模型信息并采用一系列的因子,如價(jià)值因子、質(zhì)量因子、成長(zhǎng)因子、動(dòng)量因子等作為選股標(biāo)準(zhǔn),選入滿足標(biāo)準(zhǔn)的因子,并剔除冗余因子[5]。根據(jù)中國(guó)的A股市場(chǎng)特性,本文試圖基于多因子模型,從眾多的候選因子中找出能夠有效解釋股票收益率且非冗余的因子,根據(jù)這些因子所占權(quán)重來(lái)構(gòu)建量化投資組合,并驗(yàn)證其有效性,對(duì)該策略運(yùn)行的風(fēng)險(xiǎn)程度進(jìn)行度量。建立一種基于多因素模型的股票量化選擇策略,希望為投資者提供可行的量化投資參考。
1 文獻(xiàn)回顧
國(guó)外學(xué)者及機(jī)構(gòu)投資者都將上市公司基本面作為研究客體,分別從公司的財(cái)務(wù)狀況、盈利能力、長(zhǎng)期償債能力和現(xiàn)金流等方面研究相應(yīng)指標(biāo)對(duì)公司股票內(nèi)在價(jià)值的影響[6~8]。既往的研究成果揭示了諸多因素都會(huì)影響上市公司的賬面價(jià)值[9,10],上市公司的內(nèi)在價(jià)值及股票價(jià)格漲跌的內(nèi)在原因不能通過(guò)單個(gè)因素精確地反映,往往由多個(gè)因素決定[11,12]。結(jié)合因子投資的概念,Dichtl等(2021)設(shè)計(jì)了一個(gè)靈活的框架,為傳統(tǒng)的多資產(chǎn)分配構(gòu)建不同的因子完成策略[13]。他們的因子完成概念包括一個(gè)固定在多資產(chǎn)、多元風(fēng)險(xiǎn)模型中的最大多樣化參考組合,該模型包含市場(chǎng)因子,如股票、持續(xù)時(shí)間和商品,以及攜帶因子、價(jià)值、動(dòng)量和質(zhì)量等風(fēng)格因子,給定因子完成策略的具體性質(zhì)因投資者的偏好和限制而不同。Horváth等(2020)介紹了一種函數(shù)方法來(lái)研究因子模型如何隨時(shí)間而變化?;谖覈?guó)的數(shù)據(jù),直接從函數(shù)數(shù)據(jù)回歸中估計(jì)時(shí)變假設(shè)。實(shí)證結(jié)果表明,我國(guó)A股市場(chǎng)的所有風(fēng)險(xiǎn)因素都具有一定的時(shí)變模式[14]。在金融市場(chǎng)上,有大量的指標(biāo)被用來(lái)描述股票價(jià)格的變化,為股價(jià)預(yù)測(cè)提供了良好的數(shù)據(jù)依據(jù)。不同的股票因其不同的行業(yè)類型和地區(qū)而受到不同因素的影響。因此,找到一個(gè)適合特定股票的多因素組合來(lái)預(yù)測(cè)股票的價(jià)格是非常重要的。Chen和Zhou(2021)提出了利用遺傳算法進(jìn)行特征選擇,并開(kāi)發(fā)了一種優(yōu)化的長(zhǎng)期短期記憶神經(jīng)網(wǎng)絡(luò)股票預(yù)測(cè)模型[15]。Zhu等(2020)人提出了一種新的高維金融數(shù)據(jù)算法——分組可解釋基選擇the Groupwise Interpretable Basis Selection (GIBS)算法,以估計(jì)一種新的自適應(yīng)多因子資產(chǎn)定價(jià)模型,由最近發(fā)展的廣義套利定價(jià)理論所示,放寬了風(fēng)險(xiǎn)因素?cái)?shù)量較小的約定,文章發(fā)現(xiàn)AMF模型與GIBS算法 Fama-French 5因子模型具有更好的擬合和預(yù)測(cè)能力[16]。
受到國(guó)外量化投資研究興起的影響,我國(guó)關(guān)于量化投資的研究如雨后春筍般出現(xiàn)在學(xué)界的視野中[17,18]。通過(guò)研究上證180指數(shù)成分股, 王春麗等(2018)人建立了基于回歸法的多因子模型進(jìn)行量化模型選股,實(shí)證結(jié)果揭示,基于多因素量化股票選擇模型構(gòu)建的證券投資組合,其收益率優(yōu)于市場(chǎng)的基準(zhǔn)收益率。張寧等(2020)人探究了PCANet這樣一種深度架構(gòu)在量化選股中的應(yīng)用。具體來(lái)說(shuō),該框架一方面將金融時(shí)間序列預(yù)測(cè)問(wèn)題轉(zhuǎn)變?yōu)閳D像分類問(wèn)題,另一方面,充分發(fā)揮PCANet深度架構(gòu)的能力,提供了其在金融行業(yè)的可解釋性[19,20]。馬廣奇和陳靜(2017) 基于因子分析對(duì)我國(guó)采掘業(yè)類股票投資進(jìn)行價(jià)值分析[21]。綜上,越來(lái)越多的學(xué)者利用金融市場(chǎng)上大量的指標(biāo)進(jìn)行投資研究。
2 研究設(shè)計(jì)
2.1 研究假設(shè)
因子選取方面應(yīng)該盡量考慮可用性、普遍性和較強(qiáng)的差異性。本文考慮到上述候選因子的特性,選取可用性的金融數(shù)據(jù)更符合量化投資數(shù)據(jù)的特征。同時(shí),在選取被研究的股票時(shí)考慮到因子的普遍性。此外,考慮到只有差異性較強(qiáng)的候選因子才能更好地挑選出高質(zhì)量的股票。本文提出以下假設(shè):
假設(shè)1:總體上來(lái)說(shuō),成長(zhǎng)因子屬于正向因子,成長(zhǎng)因子對(duì)年個(gè)股回報(bào)率具有明顯的正向效果。
假設(shè)2:總體上來(lái)說(shuō),價(jià)值因子屬于負(fù)向因子,價(jià)值因子對(duì)年個(gè)股回報(bào)率具有明顯的負(fù)向效果。
假設(shè)3:總體上來(lái)說(shuō),質(zhì)量因子屬于正向因子,質(zhì)量因子對(duì)年個(gè)股回報(bào)率具有明顯的正向效果。
2.2 數(shù)據(jù)的選取與處理
本文先要選取有效因子,選擇2017年1月進(jìn)入滬深300指數(shù)的成分股作為本研究的股票池,時(shí)間方面選取2000—2016年作為因子選擇的樣本時(shí)間段。本研究的數(shù)據(jù)來(lái)自國(guó)泰安CSMAR(China Stock Market & Accounting Research Database)數(shù)據(jù)庫(kù),數(shù)據(jù)類型主要包括上市公司交易和財(cái)務(wù)數(shù)據(jù)。所選樣本的數(shù)據(jù)量比較大,尤其是財(cái)務(wù)數(shù)據(jù)中常常會(huì)出現(xiàn)缺失和極端值。特別的,可能出現(xiàn)突發(fā)、偶然的狀況以及無(wú)法獲取公司年報(bào)的情況,往往無(wú)法獲取一些公司的財(cái)務(wù)數(shù)據(jù)。由于選取的數(shù)據(jù)量很大,本文對(duì)數(shù)據(jù)庫(kù)中的異常值和缺失數(shù)據(jù)進(jìn)行剔除,對(duì)于個(gè)別極端值也進(jìn)行了刪除處理。數(shù)據(jù)分析軟件為SAS9.4。
3 實(shí)證分析
本文考慮到我國(guó)金融市場(chǎng)的情況,計(jì)劃從價(jià)值、成長(zhǎng)、質(zhì)量三個(gè)角度進(jìn)行因子分析。通過(guò)研究與比較,分別選取了四個(gè)價(jià)值因子、四個(gè)成長(zhǎng)因子和四個(gè)質(zhì)量因子。
3.1 時(shí)間序列回歸
本文的時(shí)間序列選取2000—2016年,針對(duì)滬深300股票的每一年、每只股票數(shù)據(jù)及其對(duì)應(yīng)的因子,時(shí)間序列回歸采用個(gè)股回報(bào)率 (漲跌幅)作為因變量,公式具體如下:
本文采用SAS9.4版本的并行計(jì)算提高數(shù)據(jù)處理的效率,剔除缺失和異常值的影響,得到每只股票個(gè)股回報(bào)率(漲跌幅)對(duì)各個(gè)因子的回歸系數(shù)(i=1, 2, 3, 4, …, 300),在5%的顯著性水平上,對(duì)有效的β值進(jìn)行t檢驗(yàn) (H0:β=0;H1:β≠0),表1顯示了檢驗(yàn)的結(jié)果。
根據(jù)計(jì)算結(jié)果,在我國(guó)股市滬深300成分股票中,2000—2016年,市盈率、市銷率、市凈率、投入資本回報(bào)率、賬面市值比與總資產(chǎn)周轉(zhuǎn)率這些因子比較有效。資產(chǎn)負(fù)債率雖然未通過(guò)β值在5%的顯著性水平上進(jìn)行的t檢驗(yàn),但如果放寬到10%的顯著性水平上進(jìn)行t檢驗(yàn)還是顯著的,所以也應(yīng)該相應(yīng)地予以關(guān)注。單變量回歸的結(jié)果也論證了本文的假設(shè)??傮w上來(lái)說(shuō),正向因子主要有成長(zhǎng)因子和質(zhì)量因子,成長(zhǎng)因子對(duì)年個(gè)股回報(bào)率正向效果顯著。負(fù)向因子有價(jià)值因子,價(jià)值因子對(duì)年個(gè)股回報(bào)率負(fù)向效果顯著,而且單變量分析的結(jié)果更加細(xì)化。
3.2 基于面板數(shù)據(jù)的回歸模型
考慮到所選因子量綱間的不同,在利用2000—2016年間的原始數(shù)據(jù)構(gòu)建面板數(shù)據(jù)之前,對(duì)單項(xiàng)因子先采取標(biāo)準(zhǔn)化方法處理,標(biāo)準(zhǔn)化公式為:
上式中,代表各指標(biāo)的原始值,i (i=1, 2, 3, 4 …, 17) 代表各個(gè)因子,代表因子的最大值,而代表該因子的最小值,表示因子標(biāo)準(zhǔn)化后的值。
標(biāo)準(zhǔn)化處理數(shù)據(jù)后,構(gòu)建計(jì)量模型如下:
其中,n(n=1,2,3,…,300)為滬深300成分股,t表示時(shí)間。下一期的股票個(gè)股回報(bào)率(漲跌幅) 為CHGnt+1;凈資產(chǎn)收益率同比增長(zhǎng)率為ROEgnt;凈利潤(rùn)增長(zhǎng)率為NPGRnt;ROAnt表示總資產(chǎn)凈利潤(rùn)率;PEnt表示市盈率;PSnt表示市銷率;PCFnt表示市現(xiàn)率;PBnt表示市凈率;ROEnt表示凈資產(chǎn)收益率;IRMBRnt代表營(yíng)業(yè)收入增長(zhǎng)率;ROICnt代表投入資本回報(bào)率;BMnt代表賬面市值比;RRTAnt代表總資產(chǎn)周轉(zhuǎn)率;DARnt表示資產(chǎn)負(fù)債率;an概括了不按照時(shí)間變化且影響CHGnt的因素,表示非觀測(cè)效應(yīng);特異性誤差用unt表示,面板數(shù)據(jù)回歸后結(jié)果如表2所示。
取閾值為0.5,由相關(guān)性檢驗(yàn)矩陣圖(如圖1)可證明并未有兩兩因子間出現(xiàn)較高的相關(guān)系數(shù),說(shuō)明該多元回歸模型沒(méi)有多重共線性,也證明最初的多因子模型無(wú)冗雜因子。
面板數(shù)據(jù)構(gòu)建的計(jì)量模型實(shí)證結(jié)果,印證了本文的研究假設(shè),賬面市值比、總資產(chǎn)周轉(zhuǎn)率對(duì)股價(jià)漲跌存在顯著性影響,且均與股票個(gè)股回報(bào)率(漲跌幅)存在相關(guān)性。凈資產(chǎn)收益率并未通過(guò)多元回歸模型中的顯著性檢驗(yàn),但在單因子回歸中通過(guò)了有效性檢驗(yàn);與上文所述一樣,市凈率對(duì)個(gè)股回報(bào)率(漲跌幅)仍存在負(fù)向影響且影響顯著。
4 結(jié)語(yǔ)
本文基于滬深300股指成分股交易和財(cái)務(wù)數(shù)據(jù),選擇候選因子進(jìn)行分析,通過(guò)多因子量化投資模型,利用2000—2016年的滬深300股票的行情數(shù)據(jù)及財(cái)務(wù)數(shù)據(jù)進(jìn)行實(shí)證研究。本文從可投資性角度考察公司股票的價(jià)值、成長(zhǎng)、財(cái)務(wù)質(zhì)量因子指標(biāo)對(duì)一個(gè)公司進(jìn)行定量評(píng)估,對(duì)動(dòng)量因子進(jìn)行了定性分析。定量研究主要選取價(jià)值因子:市盈率、市銷率、市現(xiàn)率和市凈率;成長(zhǎng)因子:凈利潤(rùn)增長(zhǎng)率、凈資產(chǎn)收益率、營(yíng)業(yè)收入增長(zhǎng)率、投入資本回報(bào)率;質(zhì)量因子:總資產(chǎn)凈利潤(rùn)率、資產(chǎn)負(fù)債率、賬面市值比、總資產(chǎn)周轉(zhuǎn)率。
研究結(jié)果表明:正向因子有成長(zhǎng)因子,負(fù)向因子有價(jià)值因子;市盈率、市銷率、市現(xiàn)率這些估值因子實(shí)證結(jié)果比較好。結(jié)果顯示質(zhì)量類因子:正向效果顯著的有賬面市值比和總資產(chǎn)周轉(zhuǎn)率,說(shuō)明公司的股票收益與財(cái)務(wù)質(zhì)量相關(guān)。在我國(guó)股票市場(chǎng)上,多因子組合預(yù)測(cè)效果較好,多因子量化模型符合國(guó)情,能夠進(jìn)行股票預(yù)測(cè)。
參考文獻(xiàn)
[1]周志中,徐杰.中美股市配對(duì)因子實(shí)證分析[J].系統(tǒng)管理學(xué)報(bào),2020,29(3):417-424.
[2]侯曉輝,王博.基于基本面分析的量化投資:研究述評(píng)與展望[J].東北師大學(xué)報(bào)(哲學(xué)社會(huì)科學(xué)版),2021(1):124-131+141.
[3]張文娟.淺談量化投資在國(guó)內(nèi)市場(chǎng)的發(fā)展[J].中國(guó)商論,2020(16):16-17.
[4]干偉明,張滌新.基于價(jià)值投資的多因子定價(jià)模型在中國(guó)資本市場(chǎng)的實(shí)證研究[J].經(jīng)濟(jì)經(jīng)緯,2018,35(4):136-140.
[5]齊岳,周藝丹,張雨.公司治理水平對(duì)股票資產(chǎn)定價(jià)的影響研究:基于擴(kuò)展的Fama-French三因子模型實(shí)證分析[J].工業(yè)技術(shù)經(jīng)濟(jì),2020,39(4):113-122.
[6]Blau BM, Griffith TG, Whitby RJ. Price Clustering, Preferences for Round Prices, and Expected Returns[J]. Journal of Behavioral Finance, 2021: 1-15.
[7]Yurteri K?seda?l? B, Huyugüzel K??la G, ?at?k AN. The time-varying effects of oil prices on oil–gas stock returns of the fragile five countries[J]. Financial Innovation, 2021,7(1): 1-16.
[8]Recchioni MC, Iori G, Tedeschi G, et al. The complete Gaussian kernel in the multi-factor Heston model: Option pricing and implied volatility applications[J]. European Journal of Operational Research, 2021,293(1):336-360.
[9]Lewellen J. The Cross-section of Expected Stock Returns[J]. Critical Finance Review, 2015,4(1):1-44.
[10]Salisu AA, Swaray R, Sa'id H. Improving forecasting accuracy of the Phillips curve inOECDcountries: The role of commodity prices[J]. International Journal of Finance & Economics,2021, 26(2):2946-2975.
[11]Johnk DW, Soydemir G. Time-Varying Market Price of Risk and Investor Sentiment: Evidence from a Multivariate GARCH Model[J]. Journal of Behavioral Finance, 2015,16(2):105-119.
[12]Dhaoui A, Bensalah N. Asset valuation impact of investor sentiment: A revised Fama-French five-factor model[J]. Journal of Asset Management, 2017,18(1):16-28.
[13]Dichtl H, Drobetz W, Lohre H, et al. Active Factor Completion Strategies[J]. Journal of Portfolio Management, 2021, 47(2):9-37.
[14]Horváth L, Li B, Li H, et al. Time-varying beta in functional factor models: Evidence from China[J]. The North American Journal of Economics and Finance, 2020,54:101-283.
[15]Chen SL, Zhou CJ. Stock Prediction Based on Genetic Algorithm Feature Selection and Long Short-Term Memory Neural Network[J]. Ieee Access, 2021, 9: 9066-9072.
[16]Zhu L, Basu S, Jarrow RA, et al. High-Dimensional Estimation, Basis Assets, and the Adaptive Multi-Factor Model[J]. Quarterly Journal of Finance, 2020, 10(4):2050017.
[17]賈圓斐,梁艷彬.我國(guó)上市公司財(cái)務(wù)狀況與股價(jià)的相關(guān)性研究[J].華北金融.2019(9):17-23.
[18]宋湘燕,金瑩.美元匯率變動(dòng)因素分析[J].中國(guó)金融,2020(5):84-86.
[19]王春麗,劉光,王齊.多因子量化選股模型與擇時(shí)策略[J].東北財(cái)經(jīng)大學(xué)學(xué)報(bào),2018(5):81-87.
[20]張寧,石鴻偉,鄭朗,等.基于PCANet的價(jià)值成長(zhǎng)多因子選股模型[J].計(jì)算機(jī)科學(xué),2020,47(S2):64-67.
[21]馬廣奇,陳靜.基于因子分析的采掘業(yè)類股票投資價(jià)值分析[J].財(cái)會(huì)通訊,2017(23):38-41.
基金項(xiàng)目:徐州市科技局重點(diǎn)研發(fā)計(jì)劃(社會(huì)發(fā)展)項(xiàng)目(KC20182);2021年度江蘇高校哲學(xué)社會(huì)科學(xué)研究一般項(xiàng)目“金融創(chuàng)新之互聯(lián)網(wǎng)金融平臺(tái)實(shí)證研究”部分研究成果。
Research on Quantitative Investment Based on Multi-factor Model
School of Management, Xuzhou Medical University? ZOU Luxi
Abstract: With the continuous expansion of the scale of China’s stock market and the deepening of the transaction complexity, how to choose the stock worthy of investment among numerous listed companies, to achieve the optimal allocation of assets and risk control is an issue that people are much concerned about for individual and institutional investors. Multi-factor stock selection strategy can help investors to control risks while achieving considerable returns by selecting influential factors that are highly correlated with stock prices. Based on this, this paper selects the constituent stocks of CSI 300 stock index as the stock pool for multi-factor model analysis, conducts single-factor and multi-factor analysis through 12 factors including four value factors, four growth factors and four quality factors, and uses T test and regression analysis to test the validity of the above 12 factors. The effective factors are selected and a multi-factor model suitable for common investors is constructed. The results show that the positive and negative factors have growth and value factors respectively, and the empirical effect is better for the price-earnings ratio factor, the price-sales ratio factor, the price-cash ratio factor, and the quality factor results show that the book-to-market ratio and the total asset turnover ratio have a significant positive effect on the return rate of individual stocks. Results show that financial quality is related to the company’s stock returns.
Keywords: quantitative investment; multi-factor model; regression analysis