任 丹
(上海交通大學(xué) 安泰經(jīng)濟(jì)管理學(xué)院,上海 200030)
現(xiàn)代組合投資理論是建立在1952年馬科維茨提出的均值-方差模型的基礎(chǔ)之上。馬科維茨運(yùn)用方差和預(yù)期收益率對(duì)風(fēng)險(xiǎn)和收益刻畫,企圖在風(fēng)險(xiǎn)和收益之間尋求平衡,在這個(gè)過程中,收益率的協(xié)方差矩陣起到了分配風(fēng)險(xiǎn)和收益的橋梁作用。隨著現(xiàn)代金融市場(chǎng)的發(fā)展,金融數(shù)據(jù)的維度變得十分龐大,通過歷史數(shù)據(jù)估計(jì)得出的協(xié)方差矩陣往往呈現(xiàn)出奇異的特征,因此高維度情況下的協(xié)方差矩陣估計(jì)成了熱門研究問題。
在傳統(tǒng)研究和應(yīng)用中,人們通常采用樣本協(xié)方差矩陣作為總體協(xié)方差矩陣的估計(jì)量,但當(dāng)矩陣的維度變得很大時(shí),估計(jì)顯得十分困難。尤其是橫截面維度超過時(shí)間維度時(shí),樣本協(xié)方差矩陣是奇異的,均值方差模型是不能求解的。同時(shí),估計(jì)過程中產(chǎn)生的累積誤差會(huì)對(duì)最終的估計(jì)結(jié)果產(chǎn)生影響。為了解決前述問題,學(xué)者們提出了許多有效的估計(jì)方法,在金融投資實(shí)踐中取得了顯著的成果。
高維協(xié)方差矩陣估計(jì)方法的研究主要集中在以下三個(gè)方面:1.基于因子模型的高維協(xié)方差矩陣估計(jì),即通過有限的因子來達(dá)到降維的目的,得到有效的估計(jì)量,該方法在學(xué)界和業(yè)界均取得了顯著的效果。2.壓縮估計(jì)方法,該方法盡可能地保證估計(jì)量的特征向量同真實(shí)協(xié)方差矩陣估計(jì)量的關(guān)系,通過最小化損失函數(shù)來控制估計(jì)量的特征值。3.基于橢圓分布的高維協(xié)方差矩陣估計(jì)方法,該方法假設(shè)金融數(shù)據(jù)服從橢圓分布,建立了一系列性質(zhì)優(yōu)良的估計(jì)量。
本文首先介紹基于因子模型的高維協(xié)方差矩陣估計(jì)的一般方法。假設(shè)n個(gè)因子為Fnt構(gòu)成的因子列向量為Ft,bt為各個(gè)因子上的暴露程度向量,eit為資產(chǎn)的特征收益,則相應(yīng)的資產(chǎn)配置模型為
單個(gè)資產(chǎn)模型(1)整合成多維資產(chǎn)模型便有
假設(shè)特質(zhì)收益et與公共因子Ft不相關(guān),對(duì)模型(2)兩邊取方差便有
在模型(3)中,?為資產(chǎn)的協(xié)方差矩陣,W為因子的協(xié)方差矩陣,Se為特質(zhì)收益的協(xié)方差矩陣,通常假設(shè)該矩陣為稀疏的。從估計(jì)流程不難發(fā)現(xiàn),有限的因子起到了降維的作用,同時(shí)保證了估計(jì)得出的協(xié)方差矩陣是非奇異的?;谝蜃幽P偷母呔S協(xié)方差矩陣估計(jì)方法主要分為兩類:可觀測(cè)因子和不可觀測(cè)因子。二者的整體框架是一致的,不同點(diǎn)在于因子的刻畫上。
從可觀測(cè)因子的研究角度來看,學(xué)者認(rèn)為資產(chǎn)收益率可以由公共因子解釋,比如市場(chǎng)收益率、市值、估值等因子,通過這些公共因子達(dá)到降維目的。Sharpe(1964)最早提出了單因子模型,認(rèn)為股票的收益率可以由市場(chǎng)收益率解釋(CAPM)。Fama和French(1993)認(rèn)為企業(yè)自身因素才是影響資產(chǎn)價(jià)格的重要因素,采用市值、賬面市值比和市場(chǎng)收益率作為新的因子對(duì)資產(chǎn)定價(jià)??捎^測(cè)因子的好處在于因子的易獲得性和可解釋性強(qiáng)。
從不可觀測(cè)因子的研究角度來看,研究者提出的最典型方法為主成分估計(jì)法(PCA)和極大似然估計(jì)。主成分估計(jì)法是通過對(duì)樣本協(xié)方差矩陣進(jìn)行分析,獲得相應(yīng)的主成分作為主要的因子。典型地,如Fan(2013)提出了基于主成分的非參估計(jì)量——主成分正交補(bǔ)閾值估計(jì)量(POET)。但是主成分分析法主要是基于樣本協(xié)方差矩陣來完成的,樣本協(xié)方差矩陣的特征值和特征向量對(duì)與因子相關(guān)的假設(shè)檢驗(yàn)起到了約束作用。為了突破此局限,Doz等(2012)將極大似然估計(jì)引入高維協(xié)方差矩陣估計(jì)領(lǐng)域,Bai和Li(2012,2016)完善了此框架,并證明了極大似然估計(jì)量的一致性。
壓縮估計(jì)方法主要分為兩類:線性壓縮和非線性壓縮。從線性壓縮方法的研究角度來看,給定壓縮目標(biāo)和樣本協(xié)方差矩陣,最小化二者的線性組合與真實(shí)協(xié)方差矩陣之間的距離,來獲得最優(yōu)的線性壓縮權(quán)重。該方法不考慮具體的因子和因子結(jié)構(gòu),通過壓縮目標(biāo)對(duì)樣本協(xié)方差矩陣進(jìn)行改進(jìn)。Ledoit和Wolf選取單指數(shù)模型等相關(guān)稀疏矩陣和單位陣作為壓縮目標(biāo),利用美股數(shù)據(jù)做了實(shí)證研究,發(fā)現(xiàn)單位陣的表現(xiàn)效果是最好的。從非線性壓縮的研究角度來看,該方法是控制樣本協(xié)方差矩陣的特征向量不變,對(duì)特征值進(jìn)行優(yōu)化,Leodit和 Wolf(2012,2014a,2015)系統(tǒng)地研究如何將非線性壓縮的不可解轉(zhuǎn)化為依賴樣本特征值極限分布的理想估計(jì)量,再利用前面得出的估計(jì)量進(jìn)行優(yōu)化分析。
通常的金融研究中,研究者們會(huì)假設(shè)收益率向量服從高維正態(tài)分布,即X∶Nd(m,S),但是金融市場(chǎng)中的數(shù)據(jù)大多呈現(xiàn)出非正態(tài)和厚尾的特征,因此學(xué)者們通常假設(shè)金融數(shù)據(jù)服從橢球分布,以此為基礎(chǔ)提出新的高維協(xié)方差矩陣估計(jì)方法。協(xié)方差矩陣可以分解成皮爾遜相關(guān)系數(shù)矩陣和資產(chǎn)標(biāo)準(zhǔn)差對(duì)角陣的乘積,即
問題轉(zhuǎn)化為對(duì)皮爾遜相關(guān)系數(shù)矩陣和標(biāo)準(zhǔn)差對(duì)角陣D的估計(jì),Zhao和Liu(2014)基于這一思路提出了EPIC估計(jì)方法。對(duì)于皮爾遜相關(guān)系數(shù)矩陣R的估計(jì),F(xiàn)an等(1990)提出了正弦變化的肯德爾t估計(jì)量,即計(jì)算資產(chǎn)i和資產(chǎn)j之間的肯德爾t相關(guān)系數(shù),并用正弦函數(shù)進(jìn)行轉(zhuǎn)換后作為矩陣R的(i,j)元估計(jì)。Catoni(2012)提出了均值和標(biāo)準(zhǔn)差的M—估計(jì)量,該估計(jì)量在厚尾分布中表現(xiàn)出極好的性質(zhì),可以作為標(biāo)準(zhǔn)差對(duì)角陣D對(duì)角元的估計(jì)量。沿著這一方向,許多學(xué)者提出了新的估計(jì)方法,如Liu等(2014)提出的EC2估計(jì)法。
由于國內(nèi)的金融市場(chǎng)發(fā)展較國外晚,國內(nèi)學(xué)者對(duì)高維協(xié)方差矩陣估計(jì)的研究是最近幾年才興起的。劉麗萍(2016)將主成分法和門限方法相結(jié)合,提出了門限主成分正交補(bǔ)(TPO)估計(jì)量,并通過實(shí)證發(fā)現(xiàn)該方法能提高協(xié)方差的估計(jì)效率、有效降低噪聲的影響。趙釗(2017)總結(jié)了國內(nèi)外學(xué)者對(duì)高維協(xié)方差矩陣估計(jì)問題的相關(guān)文獻(xiàn),發(fā)現(xiàn)非線性壓縮方法提高了DKK和BEKK模型的估計(jì)效率,在高維協(xié)方差矩陣估計(jì)方面起到的重要作用。宋鵬、胡永宏(2017)提出了基于Cholesky分解的可預(yù)測(cè)值因子模型,并同VAR-LASSO方法進(jìn)行比較,發(fā)現(xiàn)其在降維方面的優(yōu)勢(shì)較為明顯且二者的估計(jì)誤差接近。
目前國內(nèi)外學(xué)者對(duì)高維協(xié)方差矩陣的研究已經(jīng)十分深入,對(duì)后續(xù)的研究具有重要的借鑒意義。本文的研究是基于Ledoit和wolf的線性壓縮模型,將壓縮目標(biāo)改為協(xié)方差矩陣的另一個(gè)估計(jì)量,即將距離多個(gè)估計(jì)量線性組合最近的對(duì)稱正定矩陣作為高維協(xié)方差矩陣的估計(jì)量。本文的創(chuàng)新之處在于克服了Ledoit和Wolf中的線性壓縮估計(jì)模型之中必須有一個(gè)正定矩陣的限制,并考慮了估計(jì)量的稀疏性問題,同時(shí)對(duì)該方法在資產(chǎn)配置中的實(shí)際運(yùn)用進(jìn)行了實(shí)證研究。
Ledoit和Wolf(2003)認(rèn)為給定樣本協(xié)方差陣S和壓縮目標(biāo)矩陣F,最優(yōu)的估計(jì)量應(yīng)該是二者的線性組合。定義二次損失函數(shù)(總體協(xié)方差陣)如下:
最小化二次損失函數(shù)(5)便可以得到最優(yōu)權(quán)重a*,但總體協(xié)方差矩陣S是未知的,因此Ledoit和Wolf(2003)從統(tǒng)計(jì)角度給出了最優(yōu)權(quán)重a*的估計(jì)量a*est,故樣本協(xié)方差矩陣的最優(yōu)估計(jì)量可以寫成樣本協(xié)方差矩陣和壓縮目標(biāo)矩陣的線性組合:
Ledoit和Wolf(2003)認(rèn)為樣本協(xié)方差矩陣S和壓縮目標(biāo)矩陣F中至少有一個(gè)矩陣是正定可逆的,這樣可以保證最后的估計(jì)量W是可逆的。但當(dāng)壓縮目標(biāo)矩陣和樣本協(xié)方差矩陣均不正定時(shí),最后的估計(jì)量便不具備正定性的特征。
假設(shè)Sn+為對(duì)稱正定矩陣的集合,借鑒壓縮估計(jì)量的思想,假設(shè)F和S均為協(xié)方差矩陣的估計(jì)量,本文想求解距離該凸組合距離最近的對(duì)稱正定矩陣作為總體協(xié)方差矩陣的估計(jì)量,即求解以下優(yōu)化模型(7),來確定最優(yōu)的樣本協(xié)方差矩陣估計(jì)量X*:
當(dāng)a給定的時(shí)候,模型(7)轉(zhuǎn)化為最近相關(guān)矩陣問題(nearest correlation matrix)。最近相關(guān)矩陣問題如下:給定矩陣G?Sn+,求解距離其最近的對(duì)稱正定矩陣:
模型(8)已經(jīng)被很多學(xué)者進(jìn)行了研究。Qi和Sun(2006)提出了高斯梯度下降法來求解模型(8),并取得了顯著的效果。學(xué)者們不滿足于模型(8)的求解,因?yàn)樽罴训膮f(xié)方差矩陣估計(jì)量具有一定的稀疏性。因此,在問題(8)的基礎(chǔ)上,Liu等(2014)提出了在目標(biāo)函數(shù)中引入懲罰項(xiàng)來保證解的稀疏性,即
其中,Pwt(x)為懲罰函數(shù),起到控制優(yōu)化結(jié)果稀疏的作用。因此,本文在模型(7)的目標(biāo)函數(shù)中加入l1懲罰函數(shù),使得模型的優(yōu)化結(jié)果具有稀疏性,即
接下來,本文會(huì)討論模型(7)和模型(10)的求解方法。
定義無偏估計(jì)量G1和G2的凸組合為
在模型(7)的基礎(chǔ)上,加入條件X3eI,目的是控制優(yōu)化結(jié)果特征根的范圍,因?yàn)榻鹑谫Y產(chǎn)始終是存在波動(dòng)的e,在這里假設(shè)最小波動(dòng)為e。因此,模型(7)便更新為
對(duì)于模型(12)給定m0,假設(shè)m0的n個(gè)特征值為l1(m0),…,ln(m0),則m0的譜分解為m0=?ni=1li(m0)vivi,那么模型(12)的最優(yōu)解為X*=?i=1max(li(m0),e)vivi′。由于模型(12)的目標(biāo)函數(shù)本身是凸函數(shù),當(dāng)給定m0的時(shí)候,模型(12)存在前述解析解,為了確定最優(yōu)的a,采用三分法進(jìn)行求解。模型(12)的目標(biāo)函數(shù)為l(a,X)=1/2‖X-aG1-(1-a)G1‖2,不斷迭代a,使目標(biāo)函數(shù)的差值直至收斂,具體的迭代算法如下:
模型(12)的迭代解法:
1.初始化:a0=0,a1=1/3,a2=2/3,a3=1,閾值d;
2.計(jì)算相應(yīng)的目標(biāo)函數(shù)值:l(a1,),l(a2,);
3.如果l(a1,)>l(a2,):
a0=a1,a3=a3,a1=a0+1/3(a3-a0),a2=a0+2/3(a3-a0);
如果l(a1,),l(a2,):
a0=a0,a3=a2,a1=a0+1/3(a3-a0),a2=a0+2/3(a3-a0);
4.循環(huán)上述步驟到兩次結(jié)果的絕對(duì)值小于d時(shí),停止迭代。
在模型(12)中,考慮的是求解距離給定凸組合最近的對(duì)稱正定矩陣,但是在實(shí)際運(yùn)用中,優(yōu)化結(jié)果的稀疏性也是必須考慮的重點(diǎn)之一,所以加入l1懲罰方程,便有
給定m0,模型(13)轉(zhuǎn)化為
當(dāng)m0給定的時(shí)候,問題就轉(zhuǎn)變?yōu)閄ue(2012)研究的問題,其求解方法主要是可選方向迭代算法(alternating direction method),Xue(2012)引入新的變量,將模型(14)改寫成如下形式,即
Xue為了求解該問題,采用矩陣形式的拉格朗日方法,即寫出模型(15)的拉格朗日方程,便有
對(duì)于模型(16),Xue建立了可選方向迭代算法(alternating direction method),并證明了該算法能收斂到最優(yōu)的解以及解具有良好的統(tǒng)計(jì)性質(zhì),求解的算法步驟如下:
模型(16)的迭代解法:
1.初始化:m,X0,L0;
2.第步迭代過程如下:
(1)求解Qi=(Xi=m Li)+;
(2)求解Xi+1={S(m(m0-Li)+Qi+1,lm}/(1+m);
(3)求解Li+1=Li-(Qi+1-Xi+1)/m;
3.循環(huán)上述步驟至收斂。
上述S為閾值函數(shù),對(duì)矩陣的非對(duì)角元進(jìn)行控制,在給定矩陣G時(shí),具體形式如下:
對(duì)于模型(14),結(jié)合上面可選方向理論算法以及f(a,X)是[0,1]′Sn+上的凸函數(shù),運(yùn)用三分法求解相應(yīng)的結(jié)果,具體算法步驟如下:
模型(13)的迭代算法:
1.初始化:a0=0,a1=1/3,a2=1及閾值d;
2.運(yùn)用可選方向理論算法求解:f(a1,X*1),f(a2,X*2);
4.循環(huán)上面的步驟到兩次結(jié)果的絕對(duì)值小于d時(shí),停止迭代。
附錄里給出算法(13)的收斂性證明,但是模型(13)的求解方法屬于暴力求解算法,模型求解速度慢。因此,本文對(duì)于模型(13)只做理論上的探索,不考慮進(jìn)行實(shí)證分析。
本文實(shí)證數(shù)據(jù)來自已有的A股數(shù)據(jù),時(shí)間跨度為2014年1月1日至2017年12月31日,剔除節(jié)假日,實(shí)際交易日共977天。本文采用最小方差模型來衡量估計(jì)出的協(xié)方差矩陣的優(yōu)劣。最小方差模型是指通過最小化風(fēng)險(xiǎn)獲得投資組合中的資產(chǎn)權(quán)重,然后根據(jù)求出的權(quán)重進(jìn)行組合投資。求解帶懲罰項(xiàng)的協(xié)方差估計(jì)模型具有極大的計(jì)算成本,因此本文的實(shí)證部分不進(jìn)行探討,故只考慮不帶懲罰項(xiàng)的協(xié)方差矩陣估計(jì)模型。
假設(shè)估計(jì)樣本協(xié)方差矩陣的時(shí)間窗口長度為T,利用2T的數(shù)據(jù)估計(jì)出兩個(gè)協(xié)方差矩陣,再用不帶懲罰項(xiàng)的模型求得相應(yīng)的協(xié)方差矩陣估計(jì)S。為了檢驗(yàn)協(xié)方差矩陣估計(jì)的優(yōu)劣,本文采用的模型為最小方差模型,通過最小化波動(dòng)率來獲得全市場(chǎng)股票的投資權(quán)重,模型為
其中,q為資產(chǎn)組合中資產(chǎn)的權(quán)重,S為通過前述算法得到的協(xié)方差矩陣。根據(jù)模型(18)所求權(quán)重構(gòu)建投資組合,并考慮該投資組合在未來一年里的收益曲線,計(jì)算相應(yīng)的年化收益率Rt、方差st、夏普比率ST t。將時(shí)間由t變成t+1,重復(fù)前面的步驟,獲得年化收益率Rt+1、方差st+1和夏普比率SRt+1,這樣便可以得到年化收益率序列、方差序列和夏普比率序列。
取窗口長度T為100、200、300天,得到上述不同序列,計(jì)算相應(yīng)指標(biāo)的均值得到表1結(jié)果。
從年化收益的角度來看,不同周期下的估計(jì)模型對(duì)應(yīng)的年化收益率均值均高于基準(zhǔn)指數(shù)的年化收益均值,二者比值的變動(dòng)區(qū)間為[3.13,3.23];從波動(dòng)率的角度來看,二者波動(dòng)率比值的變動(dòng)區(qū)間為[0.95,1.17];從夏普比率的角度來看,二者夏普比率比值的變動(dòng)區(qū)間為[2.48,2.93]。以上三個(gè)指標(biāo)的比較表明,基于估計(jì)模型的資產(chǎn)組合表現(xiàn)比基準(zhǔn)組合更加優(yōu)異,能夠獲得超額收益,本文的基準(zhǔn)組合為上證綜指。
表1 不同周期下的評(píng)價(jià)指標(biāo)結(jié)果
表1結(jié)果是從均值角度出發(fā)來進(jìn)行比較的,不能充分反映每個(gè)指標(biāo)在時(shí)間維度上的變化情況,因此本文繪制了不同指標(biāo)隨著時(shí)間變化的曲線,得到的結(jié)果如圖1、圖2、圖3所示。
圖1 不同組合年化收益率變化曲線
圖2 不同組合波動(dòng)率變化曲線
圖3 不同組合夏普比率變化曲線
圖1 的年化收益率曲線表明估計(jì)模型的年化收益率是高于基準(zhǔn)的年化收益,圖2的波動(dòng)率曲線表明估計(jì)模型的風(fēng)險(xiǎn)暴露程度在絕大多數(shù)情況下是高于基準(zhǔn)的,圖3的夏普比率曲線表明估計(jì)模型所獲得夏普比率是高于基準(zhǔn)的夏普比率??偠灾诠烙?jì)模型的資產(chǎn)組合與基準(zhǔn)資產(chǎn)組合相比較,其在承擔(dān)更多風(fēng)險(xiǎn)的同時(shí),獲得了更高的資產(chǎn)收益,且對(duì)風(fēng)險(xiǎn)分散十分有效,單位風(fēng)險(xiǎn)所獲得的收益更高。
隨著金融市場(chǎng)的發(fā)展,金融產(chǎn)品的種類越來越多,金融數(shù)據(jù)呈現(xiàn)出爆炸級(jí)的增長態(tài)勢(shì),這給傳統(tǒng)的資產(chǎn)配置模型帶來了新的挑戰(zhàn)——資產(chǎn)維度超過時(shí)間維度導(dǎo)致樣本協(xié)方差矩陣奇異問題,因此如何有效地估計(jì)高維協(xié)方差矩陣引起了研究者們的極大興趣。本文回顧了高維協(xié)方差矩陣估計(jì)領(lǐng)域的研究成果,對(duì)不同的研究思路進(jìn)行了總結(jié)。
本文的研究主要是在Leodit和 Wolf(2003)的壓縮估計(jì)量的研究成果基礎(chǔ)上展開的,從運(yùn)籌優(yōu)化的角度出發(fā),提出了新的估計(jì)方法,即尋找距離多個(gè)無偏估計(jì)量的凸組合最近的對(duì)稱正定矩陣作為高維協(xié)方差矩陣的估計(jì)量。按照對(duì)優(yōu)化結(jié)果稀疏性的要求,本文討論了兩種估計(jì)模型:1.不帶懲罰項(xiàng)的模型;2.帶懲罰項(xiàng)的模型。對(duì)于上述兩種模型,本文給出相應(yīng)的解法和解法的收斂證明。在理論部分之后,本文結(jié)合A股的數(shù)據(jù)對(duì)不帶懲罰項(xiàng)的模型方法進(jìn)行了實(shí)證研究,即基于不帶懲罰項(xiàng)模型求出協(xié)方差矩陣的估計(jì)量,采用最小方差模型構(gòu)建投資組合,獲得相應(yīng)的年化收益率序列、波動(dòng)率序列和夏普比率序列。通過與基準(zhǔn)組合的比較發(fā)現(xiàn),該方法相對(duì)于基準(zhǔn)帶來了顯著的超額收益,取得了較好的投資效果。