倪麗云,沈傳河,王向榮
積極指數(shù)化投資(Active Indexing Portfolio)作為全新的投資模式,其主要表現(xiàn)形式之一為“積極”的指數(shù)組合管理(陳春峰、陳偉忠,2004)[1],包括如何復(fù)制指數(shù)這個最主要環(huán)節(jié),并要求確定精選成分股和選擇有利于平衡組合、產(chǎn)生超額回報的賦權(quán)方式。這種投資方法的實質(zhì)是通過采取科學(xué)的選股和賦權(quán)方式,在控制跟蹤誤差的基礎(chǔ)上實現(xiàn)預(yù)期的超額收益。
本文將在積極指數(shù)化投資模式框架下,建立基于支持向量機(jī)的雙目標(biāo)指數(shù)跟蹤模型,實現(xiàn)在控制跟蹤誤差的基礎(chǔ)上,尋求預(yù)期的超額收益,實現(xiàn)投資收益最大化。具體思路是:首先借鑒Francesco Corielli與Massimiliano Marcellino(2002)提出的基于因素的指數(shù)跟蹤方法以及張鵬、瞿寶忠(2004)使用的關(guān)鍵因素擬合方法,對擬構(gòu)建投資組合進(jìn)行前期的成分股票選擇[2-3]。然后,在滿足投資約束條件下,利用支持向量機(jī)完成成分股票的權(quán)重優(yōu)化,求出投資組合的資金分配系數(shù)。最后,根據(jù)選定的度量指標(biāo),在測試數(shù)據(jù)環(huán)境下分析投資組合的效果。
指數(shù)跟蹤要求構(gòu)建一個證券投資組合,使得它的變化行為盡可能地接近給定的目標(biāo)指數(shù)。一般情況下,這個投資組合中的證券數(shù)目應(yīng)該比目標(biāo)指數(shù)少,并且在跟蹤誤差中也不應(yīng)該含有較低頻率(即較差持續(xù)性)的成分,這意味著正常誤差應(yīng)該源自于投資組合中主要的或是關(guān)鍵性的影響因素,進(jìn)而才能保證這個復(fù)制的投資組合很好地適應(yīng)或捕捉目標(biāo)指數(shù)未來的變化,包括收益率和波動性。
正因如此,F(xiàn)rancesco Corielli和Massimiliano Marcellino(2002)和張鵬、瞿寶忠(2004)先后提出基于因素或關(guān)鍵因素擬合的指數(shù)化投資策略,以力圖解決這個問題[2-3]。這種方法需要兩步來完成,即構(gòu)建與目標(biāo)指數(shù)具有同樣可持續(xù)性(也即高頻率)因素組成的復(fù)制組合,然后再盡可能地使跟蹤誤差減少到最小。
首先,找出影響目標(biāo)指數(shù)走勢的關(guān)鍵性因素。
設(shè)設(shè)It、Pit分別為目標(biāo)指數(shù)和第i只股票在時刻t的價格,Rt、rit分別為它們在第 t個周期內(nèi)的相對收益率,則有:
相應(yīng)地,投資組合在第t個周期內(nèi)的相對收益率R't則為:,其中n為投資組合待定成分股票的數(shù)量,wit為第i只股票在時刻t的權(quán)重。
根據(jù)目標(biāo)指數(shù)成份股個股的日收益率為基礎(chǔ)進(jìn)行因子分析,提取出反映目標(biāo)指數(shù)走勢的m個共同因子,這m個共同因子即代表了影響目標(biāo)指數(shù)走勢的m個關(guān)鍵因素。在此基礎(chǔ)上,構(gòu)造以下的多因素模型:
式中Fmt為第m個共同因子Fm在時刻t的值,Am為這個共同因子對目標(biāo)指數(shù)的貢獻(xiàn)率,ξ為殘差。
在找出這m個關(guān)鍵因素之后,需進(jìn)一步找出這m種關(guān)鍵性的共同因子所代表的樣本股。它們對應(yīng)的關(guān)系如下:
其中stock為共同因子所代表的樣本股;a、b、…、m為樣本股對共同因子的貢獻(xiàn)率,即因子負(fù)荷。
觀察共同因子的因子負(fù)荷強(qiáng)弱,據(jù)此可以分析判斷出各個共同因子所反映的關(guān)鍵因素,并對它們進(jìn)行相應(yīng)的解釋。
其次,需驗證挖掘出的這m個關(guān)鍵因素是否真的能夠反映目標(biāo)指數(shù)的走勢?,F(xiàn)在,可用它們中最具代表性的一組樣本股構(gòu)造出一個投資組合,與目標(biāo)指數(shù)進(jìn)行比較,驗證是否投資組合與目標(biāo)指數(shù)等價。
為此,找出這m個關(guān)鍵因素最有代表性的n個樣本股,按照其方差對總方差解釋的貢獻(xiàn)率所占比重作為權(quán)重構(gòu)造投資組合如下:
計算出投資組合的日收益率和目標(biāo)指數(shù)的日收益率,在通過相關(guān)性檢驗之后,將它們進(jìn)行線性回歸分析。構(gòu)造以下回歸模型:
式中b為常數(shù)項,a為回歸系數(shù),ξ為殘差。
如果該模型經(jīng)檢驗成立,并且b趨近于0,同時a趨近于1,那么R't≈Rt,即投資組合與目標(biāo)指數(shù)等價,說明找出的這m個關(guān)鍵性因素能夠真實地反映目標(biāo)指數(shù)的走勢,投資組合可以代替目標(biāo)指數(shù)進(jìn)行指數(shù)化投資。
以上方法可以通過主成分分析法(Principal Components Analysis)來實現(xiàn)。但這種方法會不可避免地?fù)p失一些有價值的信息,而且各因素對應(yīng)的樣本股選擇及其權(quán)重確定在一定程度上存在主觀性,勢必增大投資組合的跟蹤誤差,影響指數(shù)化投資的效果。為克服這種情況,下面將采用支持向量機(jī)對(3)式擬選定的成分股進(jìn)行權(quán)重優(yōu)化,而不僅僅根據(jù)它們的因子負(fù)荷(即方差貢獻(xiàn))來確定。
支持向量機(jī)SVM(Support Vector Machines)是Vapnik等人建立的一種新的機(jī)器學(xué)習(xí)方法[4]。它是在以解決有限樣本機(jī)器學(xué)習(xí)問題為目標(biāo)的統(tǒng)計學(xué)習(xí)理論(Statistic Learning Theory,SLT)基礎(chǔ)上發(fā)展起來的。SVM建立在SLT的VC維理論和結(jié)構(gòu)風(fēng)險最小化(SRM)原理的基礎(chǔ)上,根據(jù)有限的樣本信息在模型的復(fù)雜性(即對特定訓(xùn)練樣本的學(xué)習(xí)精度)和學(xué)習(xí)能力(即無錯誤地識別任意樣本的能力)之間尋找最佳折衷,以期獲得最好的推廣能力。它通過使用結(jié)構(gòu)風(fēng)險最小化(SRM)代替?zhèn)鹘y(tǒng)的經(jīng)驗風(fēng)險最小化(ERM),使用滿足Mercer條件的核函數(shù),把輸入空間的數(shù)據(jù)變換到一高維的Hilbert空間,訓(xùn)練的復(fù)雜度與輸入空間的維數(shù)無關(guān),只與訓(xùn)練的樣本數(shù)目有關(guān)。因此,SVM能夠有效地避免經(jīng)典學(xué)習(xí)方法中出現(xiàn)的過學(xué)習(xí)、欠學(xué)習(xí)、“維數(shù)災(zāi)難”以及陷入局部極小點等諸多問題,因而在解決小樣本、非線性及高維模式識別問題中表現(xiàn)出很多獨特的優(yōu)勢。在這里,將分析普通的、采用ε-不敏感函數(shù)的支持向量回歸機(jī)ε-SVR。
給定訓(xùn)練集{ }xi,yi,i=1,2,…,l,其中輸入數(shù)據(jù)x是一個歐式空間Rn,y∈R,是實數(shù)R的封閉子集。借助特定的非線性映射φ(x),輸入x被映射到高維空間(或稱特征空間)。函數(shù)逼近問題,就是在像空間上通過機(jī)器學(xué)習(xí)能夠選擇一個特定的函數(shù):
根據(jù)推廣理論,要解出決策函數(shù) f(x),可考慮經(jīng)過適當(dāng)定義的核函數(shù) K(?,?):
引入ε-不敏感損失函數(shù),即:
式中:
其對偶問題為:
解上式,得到:
因此:
任何滿足Mercer條件的對稱函數(shù)都可以成為核函數(shù),并可建立不同的學(xué)習(xí)模型[5]。目前最常使用的核函數(shù)為多項式核函數(shù):
徑向基核函數(shù)(RBF)
Sigmoid核函數(shù):
其中u>0,v<0,并且,任何核函數(shù)的非負(fù)線性組合仍然是一個Mercer核。一旦核函數(shù)確定后,參數(shù)γ和σ2(sig2)就可以進(jìn)一步優(yōu)化出來。
現(xiàn)在,利用測試集來檢驗這個模型。模型的預(yù)測精度用標(biāo)準(zhǔn)均方差(the normalized mean squared error,NMSE)和平均絕對差(the mean absolute error,MAE)等統(tǒng)計標(biāo)準(zhǔn)來測度,其定義如下:
其中,σ2是數(shù)據(jù)的標(biāo)準(zhǔn)方差。
利用支持向量機(jī)構(gòu)建投資組合的主要任務(wù)是對(3)式中的權(quán)重Wit進(jìn)行優(yōu)化。考慮到Wit與時間有關(guān),直接求解將非常困難,可采取固定比例策略,即Wit變?yōu)閃i。這意味著在任何周期內(nèi),投資組合成分股票各自權(quán)重將保持不變,并存在一定優(yōu)勢(張鵬、瞿寶忠,2004)[2-3]。
在ωi給定為固定比例的前提下,參考(3)式,則第t個周期內(nèi)的投資組合與目標(biāo)指數(shù)收益之間的跟蹤誤差et滿足:
所以,確定投資組合的權(quán)重wi可以看成是在訓(xùn)練集{ }xi,yi上對(8)式進(jìn)行多元線性回歸。在這里,xt=Rˉt=(r1t,r2t,…,rnt)',yt=Rt。
這時,需考慮(5)式中約束條件的變化。在投資組合構(gòu)建中,應(yīng)考慮資本預(yù)算約束、成分股票投資比例限制、整數(shù)約束、交易成本及管理費用約束等。設(shè)投資組合成分股票i最小比例為ηi、最大比例為δi。相應(yīng)地,(4)式應(yīng)變?yōu)?
解(9)式,即可得到形如(6)式的回歸函數(shù),其中的系數(shù)即為欲求的權(quán)重。
以“上證50”指數(shù)(000016)為例,數(shù)據(jù)取自清華金融研究數(shù)據(jù)庫(THFD)。時間為2008、2009兩年內(nèi)的市場交易數(shù)據(jù),具體為2008年7月1日至2009年12月31日,扣除休盤時間,計得370個指數(shù)的日收盤價格。同時,得到該指數(shù)50個成分股票在上述時間期限內(nèi)的各自370個日收盤價格。然后根據(jù)(1)式可計算得到指數(shù)及其成分股票各自對應(yīng)的369個日收益率。
將上述370個日收益率數(shù)據(jù)分成兩部分,即2008年7月1日至2009年9月30日和2009年10月9日至2009年12月31日,分別對應(yīng)309個和60個數(shù)據(jù)用于訓(xùn)練和測試。
利用Eviews 5.0軟件進(jìn)行主成分分析。首先,對各樣本股日收益率數(shù)據(jù)采用KMO統(tǒng)計量和Bartlett’s球形檢驗,以判斷樣本數(shù)據(jù)是否符合因子分析的前提條件。其次,采用正交旋轉(zhuǎn),具體旋轉(zhuǎn)方法為方差最大化正交旋轉(zhuǎn)(Varimax)。根據(jù)提取的主成分共同因子的累積貢獻(xiàn)率達(dá)到約85%以上為標(biāo)準(zhǔn),一共提取19個共同因子、20個共同因子代表樣本股,其結(jié)果顯示在表1中。
在(9)式中,考慮到我國基金管理辦法規(guī)定,取δi≤10%;盡管融資融券業(yè)務(wù)正在展開,但由于涉及到的股票品種少,“上證50”指數(shù)成分股票并沒有全部惠及,所以在這里還是規(guī)定wi>0,強(qiáng)調(diào)不允許賣空交易;進(jìn)而存在ηi>0,即不允許剔除出投資組合,主要因為作為投資組合的成分股票,已經(jīng)過關(guān)鍵因素擬合方法選擇,它們本身已代表了目標(biāo)指數(shù)收益和波動中的不同影響因數(shù)。
通過MATALAB 7.0軟件運行,先根據(jù)(9)式對常規(guī)支持向量回歸機(jī)ε-SVR的程序進(jìn)行調(diào)整,以充分反映投資組合的約束條件。然后,采用徑向基核函數(shù)(RBF),參數(shù)ε、c和σ2(sig2)分別置為。求得的權(quán)重系數(shù)詳見表1:
表1 投資組合成分股列表
利用Sharp指數(shù)和信息比率(Information Ratio,IR)兩個指標(biāo)來衡量投資組合的效果,考察其積極化程度。同時,又與完全復(fù)制方法相比較,進(jìn)一步分析基于支持向量機(jī)的關(guān)鍵因數(shù)擬合指數(shù)化投資方法的特性。
在Grinold和Kahn(2005)關(guān)于積極組合管理的討論中,信息比率被視為積極組合管理的關(guān)鍵,它用跟蹤誤差來衡量投資組合的風(fēng)險水平,考察了投資組合在特定的跟蹤誤差下實現(xiàn)超額收益的能力。通常,信息比率大于0.5被認(rèn)為是較好的水平;而純粹指數(shù)投資的信息比率為0[6]。而Sharp指數(shù)則同時考慮了包括系統(tǒng)風(fēng)險和非系統(tǒng)風(fēng)險在內(nèi)的總風(fēng)險,側(cè)重于投資組合在分散和降低非系統(tǒng)風(fēng)險的能力,反映了投資組合的內(nèi)在質(zhì)量。具體結(jié)果見表2,其中的跟蹤誤差依據(jù)(8)式計算得出。
表2 模型的效果測試
可以看出,本文建立的基于支持向量機(jī)的投資組合權(quán)重確定方法達(dá)到了較好的效果,對目標(biāo)指數(shù)的跟蹤誤差無論是NMSE值還是MAE值,都比較小,并優(yōu)于完全復(fù)制方法。而且,Sharp指數(shù)和信息比率IR也都高于完全復(fù)制方法,也因此取得了0.38%的平均超額收益。
本文利用基于結(jié)構(gòu)風(fēng)險最小化原則的支持向量機(jī)進(jìn)行指數(shù)化投資組合的構(gòu)建,提高了投資組合的樣本外跟蹤效果,有效解決了現(xiàn)有指數(shù)化投資組合方法由于使用經(jīng)驗最小化原則而帶來的不足,克服了過度依賴樣本進(jìn)行跟蹤誤差分析的局限。而且基于關(guān)鍵因素擬合方法的投資組合成分股票的前期選擇,能夠有效捕捉目標(biāo)指數(shù)波動中的高頻因數(shù),增強(qiáng)了投資組合把握目標(biāo)指數(shù)動態(tài)特性的能力。因此,上述兩種方法的集成無疑克服了各自的缺點,而由此形成的優(yōu)化復(fù)制目標(biāo)指數(shù)的途徑將不啻是一種有效的嘗試。正如實證分析所示,這種方法在模型魯棒性和指數(shù)跟蹤誤差方面都具有良好的表現(xiàn)。進(jìn)一步的研究方向應(yīng)集中在雙目標(biāo)函數(shù)上,即在控制跟蹤誤差基礎(chǔ)上,實現(xiàn)超額收益最大化。并且,改進(jìn)投資組合成分股票的前期選擇方法,相應(yīng)調(diào)整常規(guī)支持向量機(jī)程序,優(yōu)化算法設(shè)計,提高數(shù)據(jù)挖掘性能。
[1]陳春峰,陳偉忠.積極指數(shù)化:一種全新的投資模式[J].證券市場導(dǎo)報,2004,(11).
[2]Francesco Corielli,Massimiliano Marcellino.Factor Based Index Tracking[J].Centrefor Economic Policy Research,2002,(3).
[3]張鵬,瞿寶忠.關(guān)鍵因素擬合指數(shù)化投資方法的實證研究[J].證券市場導(dǎo)報,2004,(11).
[4]Vapnik V N.The Nature of Statistical Learning Theory[M].New York:Springer-Verlag,1995.
[5]Wahba G.Support Vector Machines,Reproducing Kernel Hilbert Spaces,and Randomized GACV.Advances in Kernel Methods-Sup?port Vector Learning[M].Cambridge:The MITPress,1999.
[6]Richard C.Grinold,Ronald N.Kahn.Active Portfolio Management:A Quantitative Approach for Providing Superior Returns and Controlling Risk[M].New York:McGraw-Hill,2000.