楊小卜
蘭州財(cái)經(jīng)大學(xué) 統(tǒng)計(jì)學(xué)院,蘭州 730030
隨著信息技術(shù)的發(fā)展與數(shù)據(jù)可獲取性的提高,金融資產(chǎn)的維度也隨即呈現(xiàn)出爆炸增長(zhǎng)的趨勢(shì).金融資產(chǎn)維度的增加會(huì)給資產(chǎn)協(xié)方差矩陣的估計(jì)帶來(lái)困難,甚至?xí)?dǎo)致病態(tài)協(xié)方差矩陣的產(chǎn)生.而資產(chǎn)協(xié)方差矩陣又是投資組合理論的基礎(chǔ),其估計(jì)的精確與否最終會(huì)直接干擾與影響投資組合模型.
為了對(duì)高維協(xié)方差矩陣進(jìn)行精準(zhǔn)的估計(jì),學(xué)者們進(jìn)行了許多相關(guān)的研究,主要的思想是對(duì)矩陣進(jìn)行稀疏與降維處理.如文獻(xiàn)[1-2]通過(guò)引入不同的門限函數(shù)把總體協(xié)方差矩陣的一些非對(duì)角線元素替換為0,在保留對(duì)角線元素的基礎(chǔ)上來(lái)避免維數(shù)詛咒.文獻(xiàn)[3-4]使用因子模型來(lái)降低數(shù)據(jù)維度,提升其估計(jì)效率.上述2類方法雖然可以提升協(xié)方差矩陣的估計(jì)精確性,但沒(méi)有從時(shí)間變化的角度去分析與研究協(xié)方差矩陣,沒(méi)有將不同時(shí)間段的協(xié)方差矩陣看成是一組時(shí)間序列,也沒(méi)有考慮因時(shí)間變化而產(chǎn)生的信息對(duì)于協(xié)方差矩陣估計(jì)的影響.
文獻(xiàn)[5]發(fā)現(xiàn)協(xié)方差矩陣隨著時(shí)間的推移有著較強(qiáng)的自回歸結(jié)構(gòu),并且發(fā)現(xiàn)預(yù)期收益與這一變化密切相關(guān).隨著這一發(fā)現(xiàn),學(xué)者們開(kāi)始將時(shí)間序列的估計(jì)方法運(yùn)用于協(xié)方差矩陣的估計(jì)中,如文獻(xiàn)[6]提出的條件自回歸威沙特(CAW)模型、文獻(xiàn)[7]提出的結(jié)合DCC框架的雙不對(duì)稱GARCH-MIDAS模型、文獻(xiàn)[8]提出的DCC-GARCH模型.但上述模型所估計(jì)的協(xié)方差矩陣維度較低,沒(méi)有考慮高維的情況.此外,高頻數(shù)據(jù)也逐漸成為近些年來(lái)的研究熱點(diǎn).文獻(xiàn)[9]的研究表明低頻協(xié)方差矩陣轉(zhuǎn)化為高頻協(xié)方差矩陣的經(jīng)濟(jì)價(jià)值是巨大的,但是文中也只是討論了低維資產(chǎn)配置的問(wèn)題.文獻(xiàn)[10]提出了基于高頻數(shù)據(jù)的高維協(xié)方差矩陣估計(jì)模型——VAR-LASSO模型,該模型在VAR模型的基礎(chǔ)上,引入LASSO懲罰函數(shù),對(duì)待估向量的參數(shù)進(jìn)行稀疏處理,來(lái)提高模型估計(jì)的精確性.通過(guò)實(shí)證分析發(fā)現(xiàn),該模型的估計(jì)精確性明顯優(yōu)于傳統(tǒng)的DCC模型與EWMA模型.雖然VAR-LASSO模型可以估計(jì)高維協(xié)方差矩陣,但由于LASSO懲罰函數(shù)不滿足Oracle性質(zhì),當(dāng)面對(duì)較大的真實(shí)未知參數(shù)時(shí),會(huì)產(chǎn)生較大的估計(jì)誤差,導(dǎo)致參數(shù)估計(jì)為有偏估計(jì).
因此,本文擬借鑒文獻(xiàn)[10]提出的VAR-LASSO方法,嘗試對(duì)高維已實(shí)現(xiàn)協(xié)方差矩陣進(jìn)行建模.為了克服LASSO懲罰函數(shù)不滿足Oracle性質(zhì)的缺陷,將滿足Oracle性質(zhì)的SCAD懲罰函數(shù)與MCP懲罰函數(shù)引入VAR模型中,提出VAR-SCAD模型與VAR-MCP模型,并證明兩種模型估計(jì)參數(shù)的Oracle性質(zhì).最后用實(shí)際高頻股票數(shù)據(jù)對(duì)高維已實(shí)現(xiàn)協(xié)方差矩陣進(jìn)行建模,使用文獻(xiàn)[11]提出的特征值替換方法來(lái)確保預(yù)測(cè)協(xié)方差矩陣的正定性,并對(duì)模型構(gòu)建最小方差投資組合模型,探究其在實(shí)際投資組合中的應(yīng)用.
與傳統(tǒng)的低頻數(shù)據(jù)相比,高頻數(shù)據(jù)會(huì)包含更為細(xì)致與豐富的數(shù)據(jù)信息,其估計(jì)值也更接近真實(shí)的協(xié)方差矩陣.本文采用文獻(xiàn)[12]提出的方法來(lái)構(gòu)造已實(shí)現(xiàn)協(xié)方差矩陣(RCOV,簡(jiǎn)記為R).假設(shè)一個(gè)投資組合具有n維資產(chǎn),則其已實(shí)現(xiàn)協(xié)方差矩陣構(gòu)造為
(1)
觀察(1)式可以發(fā)現(xiàn),自回歸模型中的待估參數(shù)的個(gè)數(shù)k以n2的速度增加,會(huì)產(chǎn)生大量的待估參數(shù),導(dǎo)致最小二乘估計(jì)懲罰函數(shù)的精確度大幅度下降.為了解決這一問(wèn)題,文獻(xiàn)[11]使用文獻(xiàn)[13]提出的LASSO懲罰函數(shù)來(lái)提升估計(jì)的精確度.為了方便模型的估計(jì)與計(jì)算,在使用LASSO懲罰函數(shù)之前,可以先對(duì)模型進(jìn)行如下的改寫(xiě):
y=Xβ*+ε
(2)
變換模型之后,引入LASSO懲罰函數(shù),該懲罰函數(shù)不但可以將不重要的參數(shù)壓縮為0,同時(shí)還可以同步進(jìn)行特征選擇,實(shí)現(xiàn)數(shù)據(jù)的降維.文獻(xiàn)[10]中模型(1)的參數(shù)β*通過(guò)最小化
(3)
進(jìn)行估計(jì).
為了改進(jìn)LASSO懲罰函數(shù)不滿足Oracle性質(zhì)的缺點(diǎn),本文使用滿足無(wú)偏性的MCP懲罰函數(shù)與SCAD懲罰函數(shù)來(lái)對(duì)VAR-LASSO模型進(jìn)行改進(jìn).
1.4.1SCAD懲罰函數(shù)與MCP懲罰函數(shù)
文獻(xiàn)[14]基于LASSO懲罰函數(shù)不滿足Oracle性質(zhì)提出了如下的SCAD懲罰函數(shù):
(4)
其中a>2,λT≥0.為了更進(jìn)一步了解其懲罰的背后含義,可以對(duì)(4)式求導(dǎo),得
(5)
可以發(fā)現(xiàn),當(dāng)|βi|≤λT時(shí),SCAD懲罰函數(shù)與LASSO懲罰函數(shù)擁有相同的懲罰力度,但是隨著|βi|的增加,SCAD懲罰函數(shù)的懲罰力度會(huì)逐漸降低,當(dāng)|βi|>aλT時(shí),懲罰力度降為0,這保證了較大的|β|不會(huì)被過(guò)度地懲罰,確保了較大參數(shù)估計(jì)的無(wú)偏性.
文獻(xiàn)[15]提出的MCP懲罰函數(shù)也同樣滿足Oracle性質(zhì),且在處理特征之間有很高相關(guān)性數(shù)據(jù)時(shí),表現(xiàn)要比SCAD懲罰函數(shù)更好.MCP懲罰函數(shù)的懲罰項(xiàng)為
(6)
其中a>1,λT≥0.
(7)
MCP懲罰函數(shù)與SCAD懲罰函數(shù)的懲罰邏輯類似,隨著|βi|的增加,懲罰力度會(huì)逐漸地降低到0.
1.4.2VAR-SCAD模型與VAR-MCP模型
在VAR-LASSO模型的基礎(chǔ)上,將(3)式中的λT‖βi‖l1項(xiàng)代換為(4)式,則VAR-SCAD模型的參數(shù)可通過(guò)如下函數(shù)估計(jì):
(8)
將(6)式代換為(3)式中的λT‖βi‖l1項(xiàng),可以得出VAR-MCP模型的參數(shù)估計(jì)函數(shù)為
(9)
在(8)式與(9)式中,還有未知的參數(shù)a需要進(jìn)行估計(jì).不同參數(shù)a的取值會(huì)直接影響(8)式與(9)式的估計(jì)性能.對(duì)于(8)式中的參數(shù)a,文獻(xiàn)[14]通過(guò)蒙特卡洛模擬得出a的最優(yōu)值約等于3.7,(9)式的a在實(shí)際的使用中通常默認(rèn)為3.通常使用CV法、L曲線法[16]、AIC信息準(zhǔn)則等方法對(duì)λT進(jìn)行估計(jì),本文使用CV法進(jìn)行估計(jì).
1.4.3VAR-SCAD模型與VAR-MCP模型估計(jì)參數(shù)的Oracle性質(zhì)
為了后續(xù)估計(jì)參數(shù)Oracle性質(zhì)的證明,先給出如下4個(gè)正則條件:
1)εi,1具有有限四階矩,i=1,…,k;
按照施工比例配置并用電動(dòng)攪拌機(jī)充分?jǐn)嚢杈鶆颉13志鶆蛩俣葒娡慷嗖视∠笫瘜S妹嫫?,提供涂層表面光潔明快的手感以及涂層更具耐污、耐擦洗、耐候、耐變色性能力?/p>
定理1在條件1)-4)成立的情況下,當(dāng)T→∞時(shí),VAR-SCAD模型的估計(jì)參數(shù)滿足如下性質(zhì):
定義
由文獻(xiàn)[17]中的定理11.2.1與文獻(xiàn)[18]中第十章的定理1可得
則
綜上所述,由Slutsky定理可得
由于VT(μ)是一個(gè)凸函數(shù),且V(μ)有唯一最小值點(diǎn)(Ik?C)-1w,可得
定理1(ii)得證,下面證明定理1(i).
由假設(shè)4)可得
綜上所述,可以得
定理2在條件1)-4)成立的情況下,當(dāng)T→∞時(shí),VAR-MCP模型的估計(jì)參數(shù)滿足如下性質(zhì):
定理2的證明過(guò)程與定理1類似,區(qū)別在于兩種模型的懲罰項(xiàng),結(jié)合定理1的證明過(guò)程可得證定理2.
上述4種指標(biāo)越小,代表模型的估計(jì)精確度越高,l2測(cè)試誤差對(duì)比如圖1、圖2所示.
將清洗后的數(shù)據(jù)劃分為訓(xùn)練集與測(cè)試集兩個(gè)部分,其中訓(xùn)練集404天,測(cè)試集100天.在VAR模型的擬合中,默認(rèn)VAR模型的滯后階數(shù)為1.
表1 3種模型的測(cè)試誤差比較
觀察表1可得,VAR-LASSO模型在h=1,5的情況下,F范數(shù)(F)分別為26.925 0,29.577 9,而VAR-SCAD模型僅為27.036 8,29.599 3,VAR-LASSO模型的表現(xiàn)要優(yōu)于VAR-SCAD模型.但在平均最大絕對(duì)誤差(AMaxE)與平均測(cè)試誤差中位數(shù)(AMedE)這兩項(xiàng)指標(biāo)上,VAR-LASSO模型均最大,表現(xiàn)遜色于VAR-MCP模型與VAR-SCAD模型.當(dāng)h=10,20時(shí),VAR-LASSO模型的F范數(shù)(F)分別為29.070 3與27.992 8,擁有3種模型中最差的測(cè)試精度.雖然VAR-SCAD模型在h=1,5時(shí),從指標(biāo)F范數(shù)(F)來(lái)看,VAR-SCAD模型的優(yōu)勢(shì)相較于VAR-LASSO模型不明顯,但是h=10,20時(shí),從表1的3種指標(biāo)來(lái)看,VAR-SCAD模型的測(cè)試精確度僅次于VAR-MCP模型.無(wú)論h取何值,VAR-MCP模型均擁有最優(yōu)的估計(jì)精確性,3種評(píng)價(jià)指標(biāo)均最?。?/p>
更為直觀的信息可以從圖1與圖2中獲得.觀察圖1可以發(fā)現(xiàn),當(dāng)h=1時(shí),3種模型的測(cè)試誤差差異不大,VAR-LASSO模型與VAR-SCAD模型在前期的測(cè)試誤差幾乎重合,VAR-MCP模型的測(cè)試誤差與其誤差曲線都明顯較低,在測(cè)試的后期,3種模型的測(cè)試誤差十分貼近,3條線幾乎重合.h=5,10時(shí),3種模型的測(cè)試誤差光滑曲線走勢(shì)相同,在測(cè)試前期,VAR-MCP模型與VAR-SCAD模型的測(cè)試誤差點(diǎn)與其誤差曲線較低,但當(dāng)T=50時(shí),VAR-LASSO模型的表現(xiàn)反而會(huì)優(yōu)于VAR-MCP模型與VAR-SCAD模型.當(dāng)h=20時(shí),可以明顯看出VAR-MCP模型與VAR-SCAD模型的測(cè)試誤差要小于VAR-LASSO模型.不同h情況下的3種模型的測(cè)試誤差光滑曲線走勢(shì)大致相同,都是在測(cè)試前期誤差較大,測(cè)試中期誤差會(huì)逐漸減小,到了測(cè)試后期,誤差又會(huì)慢慢增大.
圖1 3種模型在不同h下的誤差光滑曲線圖
圖2是小提琴圖,圖形內(nèi)部是一個(gè)箱線圖,箱線圖外部顏色的寬度代表著數(shù)值分布的密集程度.由圖2可知,相較于VAR-LASSO模型,VAR-MCP模型的異常值較小且集中.VAR-SCAD模型在h=1,5時(shí),異常值的大小與分布與VAR-LASSO模型類似,而當(dāng)h=10,20時(shí),VAR-SCAD模型的異常值的大小與分布和VAR-MCP模型類似.同時(shí)也可以發(fā)現(xiàn),當(dāng)h=20時(shí),VAR-LASSO模型的上四分位數(shù)偏大,說(shuō)明VAR-LASSO模型較大測(cè)試誤差值的數(shù)量要多于VAR-SCAD模型與VAR-MCP模型.VAR-SCAD模型與VAR-MCP模型的小提琴圖的底部相較于VAR-LASSO模型來(lái)說(shuō)更為圓潤(rùn)與寬大,表明這兩種模型的測(cè)試誤差分布相對(duì)集中,模型也更為穩(wěn)?。?/p>
圖2 3種模型在不同h下的小提琴圖
綜上所述,相較于VAR-LASSO模型,VAR-SCAD模型與VAR-MCP模型的測(cè)試精確性有著明顯的提升,VAR-SCAD模型與VAR-MCP模型的穩(wěn)健性也要優(yōu)于VAR-LASSO模型.VAR-SCAD模型在h較大的情況下表現(xiàn)較好,VAR-MCP模型全局表現(xiàn)最優(yōu).
文獻(xiàn)[19]研究指出,在變量具有相關(guān)性的情況下,SCAD懲罰函數(shù)的表現(xiàn)會(huì)不如LASSO懲罰函數(shù),下面從股票相關(guān)性角度分析VAR-SCAD模型表現(xiàn)不佳的原因.
圖3 18種股票的相關(guān)性圖
圖3中間為股票名,上三角單元格餅圖的填充程度代表相關(guān)系數(shù)的大小,下三角單元格為相關(guān)系數(shù)熱力圖.18支股票的最低相關(guān)度為0.16,51%的股票之間的相關(guān)性要高于0.5,這導(dǎo)致VAR-SCAD模型的參數(shù)雖然具有Oracle性質(zhì),但測(cè)試精確性在h較小的情況下不如VAR-LASSO模型,更不如可以較好處理相關(guān)性數(shù)據(jù)的VAR-MCP模型,這也與文獻(xiàn)[19]的研究結(jié)果保持一致.
采用上文18種股票的已實(shí)現(xiàn)協(xié)方差矩陣構(gòu)建均值—方差投資組合模型.選取100個(gè)已實(shí)現(xiàn)協(xié)方差矩陣進(jìn)行投資組合模型的模擬研究,在投資組合分析中,將h分別設(shè)置為1與10.
假定股票交易中沒(méi)有手續(xù)費(fèi)的產(chǎn)生,無(wú)風(fēng)險(xiǎn)收益為0.投資組合模型的表達(dá)式為
為了對(duì)比3種模型構(gòu)建的投資組合模型的績(jī)效,選用夏普比率(SP)這一指標(biāo)對(duì)投資組合模型進(jìn)行評(píng)價(jià).夏普比率表示單位風(fēng)險(xiǎn)所帶來(lái)的收益,夏普比率值越大表示投資組合的收益越好.
通過(guò)表2可以發(fā)現(xiàn),在各種情況之下,VAR-MCP模型構(gòu)建的投資組合均擁有最大的夏普比率.在h=1時(shí),VAR-LASSO模型構(gòu)建的投資組合的夏普比率為0.101 010 1,僅略大于VAR-SCAD模型構(gòu)建的投資組合的夏普比率.當(dāng)h=10時(shí),VAR-SCAD模型構(gòu)建的投資組合的夏普比率為0.101 037 2,略小于VAR-MCP模型構(gòu)建的投資組合的夏普比率0.102 079 6,此時(shí)VAR-LASSO模型構(gòu)建的投資組合的表現(xiàn)最差,擁有最小的夏普比率0.101 003 9.
表2 3種模型的投資組合的夏普比率
隨著信息技術(shù)的發(fā)展與數(shù)據(jù)可獲取性的提高,金融數(shù)據(jù)的維度與頻率都呈現(xiàn)出快速增長(zhǎng)的趨勢(shì).基于高頻金融數(shù)據(jù),本文在VAR-LASSO模型的基礎(chǔ)上,將非凸懲罰函數(shù)即MCP懲罰函數(shù)與SCAD懲罰函數(shù)引入VAR-LASSO模型,得到了新的VAR-SCAD模型與VAR-MCP模型,并證明了VAR-SCAD模型與VAR-MCP模型估計(jì)參數(shù)的Oracle性質(zhì).使用VAR-SCAD模型與VAR-MCP模型對(duì)高維已實(shí)現(xiàn)協(xié)方差矩陣進(jìn)行建模,通過(guò)高頻股票數(shù)據(jù)的實(shí)證研究,發(fā)現(xiàn)將SCAD懲罰函數(shù)與MCP懲罰函數(shù)引入VAR模型后,較好地克服了LASSO懲罰函數(shù)面對(duì)較大真實(shí)未知參數(shù)會(huì)產(chǎn)生較大估計(jì)誤差的缺點(diǎn),VAR-MCP模型在不同h的情況下均擁有最小的測(cè)試誤差.VAR-SCAD模型在h較大的情況下表現(xiàn)優(yōu)于VAR-LASSO模型,但在h較小的情況下,因?yàn)楣善睌?shù)據(jù)之間的高相關(guān)性,VAR-SCAD模型的表現(xiàn)不如VAR-LASSO模型.
最后通過(guò)構(gòu)建均值—方差投資組合模型可以發(fā)現(xiàn),VAR-MCP模型構(gòu)建的投資組合可以為投資人帶來(lái)最高的經(jīng)濟(jì)收益.VAR-SCAD模型構(gòu)造的投資組合在h較大的情況下,表現(xiàn)僅次于VAR-MCP模型構(gòu)造的投資組合.
西南師范大學(xué)學(xué)報(bào)(自然科學(xué)版)2023年4期