阮素梅,于 寧
(1.安徽財(cái)經(jīng)大學(xué)商學(xué)院,安徽蚌埠233041;2.北京第二外國(guó)語(yǔ)學(xué)院經(jīng)貿(mào)與會(huì)展學(xué)院,北京100024)
證券投資基金收益概率密度預(yù)測(cè)
——基于神經(jīng)網(wǎng)絡(luò)分位數(shù)回歸模型
阮素梅1,于 寧2
(1.安徽財(cái)經(jīng)大學(xué)商學(xué)院,安徽蚌埠233041;2.北京第二外國(guó)語(yǔ)學(xué)院經(jīng)貿(mào)與會(huì)展學(xué)院,北京100024)
證券投資基金收益往往具有更高的峰度與更大的偏度,建立在古典假定基礎(chǔ)上的均值回歸分析難以給出準(zhǔn)確預(yù)測(cè)結(jié)果??紤]到證券投資基金收益中的高峰、非對(duì)稱等典型特征與各因素對(duì)收益序列的非線性影響模式,建立神經(jīng)網(wǎng)絡(luò)分位數(shù)回歸模型,一方面,可以通過(guò)分位數(shù)回歸功能,揭示各因素對(duì)證券投資收益整個(gè)條件分布的影響規(guī)律;另一方面,可以通過(guò)神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu),模擬金融系統(tǒng)中的非線性關(guān)系。在神經(jīng)網(wǎng)絡(luò)分位數(shù)回歸模型基礎(chǔ)上,對(duì)證券投資基金收益整個(gè)條件密度函數(shù)進(jìn)行預(yù)測(cè),提供比點(diǎn)預(yù)測(cè)更多的有用信息,便于進(jìn)行科學(xué)決策。
投資基金;神經(jīng)網(wǎng)絡(luò);分位數(shù)回歸;概率密度;預(yù)測(cè)
證券投資基金是一種間接的證券投資方式,由基金托管人托管、基金管理人管理,以實(shí)現(xiàn)收益共享、風(fēng)險(xiǎn)共擔(dān)。證券投資基金收益準(zhǔn)確預(yù)測(cè),有利于基金風(fēng)格分析與績(jī)效評(píng)價(jià),便于引導(dǎo)廣大投資者根據(jù)自己的風(fēng)險(xiǎn)偏好,有針對(duì)性地選擇具有特定風(fēng)格的證券投資基金。由于證券投資基金與有價(jià)證券在經(jīng)濟(jì)關(guān)系、投資方式、投資方向等方面有顯著區(qū)別,兩者在收益模式與收益特征方面也大相徑庭。已有研究表明,與證券投資收益不同,由于基金經(jīng)理往往過(guò)分追求基金業(yè)績(jī),導(dǎo)致基金風(fēng)格漂移,證券投資基金收益往往具有更高的峰度與更大的偏度。這不僅影響到投資者選擇特定風(fēng)格基金進(jìn)行投資的初衷,也影響到證券投資基金收益的準(zhǔn)確預(yù)測(cè)。
經(jīng)典的基金收益預(yù)測(cè)與風(fēng)格分析方法當(dāng)屬Sharpe(1992)[1]風(fēng)格識(shí)別模型以及Fama等(1993)[2]的三因素模型,這些模型對(duì)于準(zhǔn)確把握證券投資基金收益變動(dòng)規(guī)律至關(guān)重要。然而,這些經(jīng)典模型都是建立在均值回歸分析基礎(chǔ)之上,只能用于刻畫(huà)證券投資基金收益的平均變動(dòng)趨勢(shì)。許啟發(fā)等(2011)[3]指出,當(dāng)響應(yīng)變量的條件分布散布較大或者服從非對(duì)稱分布時(shí),均值回歸難以具有代表性。Bassett等(2001)[4]將Sharpe模型拓展到分位數(shù)回歸框架下,給出了Sharpe模型的分位數(shù)回歸分析方法;胡豐等(2012)[5]將三因素模型拓展到分位數(shù)回歸框架下,給出了Fama-French三因子模型的分位數(shù)回歸分析方法。這些研究工作,在分位數(shù)回歸分析框架下,開(kāi)展相關(guān)建模理論與方法研究,能夠更好地揭示各因素對(duì)證券投資基金收益整個(gè)條件分布的影響模式,從而能夠準(zhǔn)確地揭示證券投資基金收益變動(dòng)規(guī)律。
此外,在金融系統(tǒng)中,各金融變量之間往往存在非線性影響范式?;趨?shù)方法進(jìn)行非線性系統(tǒng)建模存在較大的困難,主要表現(xiàn)為模型誤設(shè)問(wèn)題,見(jiàn)許啟發(fā)等(2010)[6]的研究工作。而非參數(shù)方法則可以避免參數(shù)方法的這一局限,表現(xiàn)出較強(qiáng)的穩(wěn)健性。在眾多非參數(shù)方法中,人工智能是其中重要的一種方法,如Broomhead等(1988)[7]提出的RBF神經(jīng)網(wǎng)絡(luò),它們可以較好地逼近金融系統(tǒng)中的非線性結(jié)構(gòu)。White(1992)[8]最早提出使用神經(jīng)網(wǎng)絡(luò)方法對(duì)條件分位數(shù)進(jìn)行估計(jì);Taylor(2002)[9]在此基礎(chǔ)上,提出了神經(jīng)網(wǎng)絡(luò)分位數(shù)回歸(QRNN)模型;Feng等(2010)[10]將神經(jīng)網(wǎng)絡(luò)分位數(shù)回歸模型與局部線性分位數(shù)回歸、樣條函數(shù)分位數(shù)回歸等非線性分位數(shù)回歸方法進(jìn)行了比較,證實(shí)了神經(jīng)網(wǎng)絡(luò)分位數(shù)回歸模型具有較強(qiáng)的非線性擬合與穩(wěn)健性功能;Cannon(2011,2012)[11-12]則詳細(xì)給出了神經(jīng)網(wǎng)絡(luò)分位數(shù)回歸模型的計(jì)算方法。何耀耀等(2013)[13]成功地將神經(jīng)網(wǎng)絡(luò)分位數(shù)回歸模型應(yīng)用于電力負(fù)荷預(yù)測(cè),不僅得到了較為準(zhǔn)確的點(diǎn)預(yù)測(cè)結(jié)果,而且得到了短期電力負(fù)荷的概率密度預(yù)測(cè)結(jié)果。迄今,尚未見(jiàn)到將神經(jīng)網(wǎng)絡(luò)分位數(shù)回歸模型應(yīng)用于金融市場(chǎng)預(yù)測(cè)的研究報(bào)道。
本文在證券投資基金收益影響因素分析基礎(chǔ)上,建立了收益序列的神經(jīng)網(wǎng)絡(luò)分位數(shù)回歸模型,并給出其條件密度預(yù)測(cè)方法。選擇中國(guó)開(kāi)放式基金作為研究對(duì)象,將基于神經(jīng)網(wǎng)絡(luò)分位數(shù)回歸模型的預(yù)測(cè)結(jié)果與均值回歸模型、線性分位數(shù)回歸模型的預(yù)測(cè)結(jié)果進(jìn)行了對(duì)比,實(shí)證結(jié)果表明:前者能夠更加準(zhǔn)確地揭示證券投資基金收益整個(gè)條件分布的變動(dòng)規(guī)律,從而提供比點(diǎn)預(yù)測(cè)更多有用信息。
(一)線性分位數(shù)回歸
1.模型表示
回歸分析在整個(gè)統(tǒng)計(jì)學(xué)中占據(jù)重要地位,可以進(jìn)行結(jié)構(gòu)分析、經(jīng)濟(jì)預(yù)測(cè)與政策評(píng)價(jià)。建立在古典假定基礎(chǔ)上的傳統(tǒng)均值回歸分析方法,由于具有簡(jiǎn)單的模型結(jié)構(gòu)與優(yōu)良的統(tǒng)計(jì)性質(zhì),至今仍被廣泛使用。然而,隨著理論研究深入和實(shí)踐發(fā)展,均值回歸受到了越來(lái)越多的挑戰(zhàn),主要表現(xiàn)為兩個(gè)方面:第一,其依賴的前提假設(shè)較為苛刻,現(xiàn)實(shí)中往往難以滿足;第二,均值回歸只能揭示響應(yīng)變量條件均值的變動(dòng)規(guī)律,難以滿足差異化統(tǒng)計(jì)的需要。Koen?ker等(1978)[14]提出的分位數(shù)回歸,較好地克服了均值回歸的不足。關(guān)于分位數(shù)回歸研究進(jìn)展與應(yīng)用領(lǐng)域,可以參見(jiàn)Koenker(2005)、Yu等(2003)[15]和陳建寶等(2008)[16]。
為研究中國(guó)開(kāi)放式基金收益變動(dòng)模式,將基金收益作為被解釋變量,選取中信標(biāo)普風(fēng)格指數(shù)作為解釋變量。這樣,中信標(biāo)普風(fēng)格指數(shù):大盤(pán)純成長(zhǎng)(BPG)、大盤(pán)純價(jià)值(BPV)、小盤(pán)純成長(zhǎng)(SPG)、小盤(pán)純價(jià)值(SPV)、中盤(pán)純成長(zhǎng)(MPG)、中盤(pán)純價(jià)值(MPV)、大盤(pán)成長(zhǎng)(BG)、大盤(pán)價(jià)值(BV)、小盤(pán)成長(zhǎng)(SG)、小盤(pán)價(jià)值(SV)、中盤(pán)成長(zhǎng)(MG)、中盤(pán)價(jià)值(MV)、中標(biāo)國(guó)債(ZBTB)、中標(biāo)企債(ZBEB)、可轉(zhuǎn)債(ZBCB)等共計(jì)15個(gè)指數(shù),可以組成解釋變量向量Xt≡(BPGt,BPVt,…,ZBCBt)′。因此,可以建立線性分位數(shù)回歸模型如下:
其中,Rt表示基金收益;QRt(τ|Xt)為解釋變量給定條件下響應(yīng)變量Rt的第τ條件分位數(shù);τ∈(0,1)為分位點(diǎn);β(τ)=(β0(τ),β1(τ),β2(τ),…,βk(τ))′為依賴于τ的回歸系數(shù)向量。與均值回歸的顯著不同表現(xiàn)在兩個(gè)方面:第一,依賴于τ的回歸系數(shù)向量β(τ),能夠揭示在不同分位點(diǎn)處,風(fēng)格因子對(duì)基金收益的不同影響模式,表現(xiàn)出異質(zhì)性;第二,通過(guò)條件分位數(shù)QRt(τ|Xt),能夠揭示基金收益整個(gè)條件分布的變動(dòng)規(guī)律,而不僅僅局限于條件均值。
2.參數(shù)估計(jì)
Koenker等(1978)[14]證明,基于二次損失函數(shù)的優(yōu)化,能夠得到均值;基于絕對(duì)損失函數(shù)的優(yōu)化,能夠得到中位數(shù);而基于非對(duì)稱損失函數(shù)(2)式的優(yōu)化,能夠得到分位數(shù)。
圖1給出了三類(lèi)損失函數(shù)的結(jié)果,其中:“square”表示二次損失函數(shù),見(jiàn)粗實(shí)線;“rho_ 050”表示絕對(duì)損失函數(shù),見(jiàn)細(xì)實(shí)線;“rho_025”與“rho_075”分別表示τ=0.25與τ=0.75的非對(duì)稱損失函數(shù),見(jiàn)兩條細(xì)虛線。由圖1可知,絕對(duì)損失函數(shù)是非對(duì)稱損失函數(shù)在τ=0.50時(shí)的特例,二次損失函數(shù)對(duì)極端值較為敏感。因此,均值回歸的結(jié)果往往受到極端值的干擾,而分位數(shù)回歸的結(jié)果則較為穩(wěn)健。
基于非對(duì)稱損失函數(shù),可以通過(guò)下面的規(guī)劃問(wèn)題實(shí)現(xiàn)回歸系數(shù)向量的估計(jì):
其中,T為樣本量大小。由于(2)式所示的非對(duì)稱損失函數(shù)是分段線性函數(shù),規(guī)劃問(wèn)題(3)實(shí)質(zhì)為一個(gè)分段線性凸規(guī)劃問(wèn)題,見(jiàn)圖2。圖2中兩條虛線所夾線段為直線段。圖2為使用模擬數(shù)據(jù)求得的(3)式目標(biāo)函數(shù)值隨ξt≡X′tβ變動(dòng)結(jié)果,模擬工具使用了R軟件,模擬過(guò)程:第一,設(shè)置隨機(jī)數(shù)種子:set.seed(1);第二,生成樣本量為12的標(biāo)準(zhǔn)正態(tài)分布隨機(jī)數(shù)作為響應(yīng)變量Rt,y<-rnorm(n=12,mean=0,sd=1);第三,均勻生成100個(gè)ξt,xi<-seq(min(y),max(y),length=100);第四,設(shè)置τ=1/3。線性凸規(guī)劃可以保證得到全局最優(yōu)解,不過(guò)這一最優(yōu)解并非唯一,如圖2中折線段最底的平坦部分都是最優(yōu)解。實(shí)際中,可以采用Portnoy等(1997)[17]給出的內(nèi)點(diǎn)算法進(jìn)行求解。
圖1 三類(lèi)損失函數(shù)
圖2 目標(biāo)函數(shù)取值
3.密度預(yù)測(cè)
在獲得參數(shù)向量估計(jì)β?(τ)之后,可以將新觀測(cè)的風(fēng)格因子X(jué)*取值(或者測(cè)試集取值)代入線性分位數(shù)回歸模型,得到未觀測(cè)基金收益R*的條件分位數(shù)函數(shù)預(yù)測(cè):
當(dāng)分位點(diǎn)τ在[0,1]連續(xù)取值時(shí),條件分位數(shù)曲線就是條件分布曲線。許啟發(fā)等(2011)[3]證明,概率密度函數(shù)可以由分位數(shù)函數(shù)的差商的倒數(shù)求得,即
因此,R*的條件密度預(yù)測(cè)可以依據(jù)(5)式對(duì)條件分布預(yù)測(cè)進(jìn)行條件化和離散化通過(guò)得到:
其中,hT為最優(yōu)窗寬,可以根據(jù)Portnoy等(1989)[18]提供的自適應(yīng)核密度估計(jì)方法來(lái)確定。
(二)神經(jīng)網(wǎng)絡(luò)分位數(shù)回歸
1.模型表示
本文采用RBF神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu),建立神經(jīng)網(wǎng)絡(luò)分位數(shù)回歸(QRNN)模型。RBF神經(jīng)網(wǎng)絡(luò)是一種高效的前饋式神經(jīng)網(wǎng)絡(luò),具有最佳逼近性能和全局最優(yōu)特性,廣泛應(yīng)用于非線性函數(shù)逼近等領(lǐng)域,其結(jié)構(gòu)為:含有k個(gè)輸入變量(Xi,i=1,2,…,k)的輸入層、含有n個(gè)神經(jīng)單元的隱含層和一個(gè)輸出層Y。為討論風(fēng)格因子對(duì)基金收益的影響,可以分兩步建立相應(yīng)的神經(jīng)網(wǎng)絡(luò)分位數(shù)回歸模型。
第一步,建立從輸入層到隱層的連接。
其中,tanh(?)為雙曲正切函數(shù);b(h)j為隱層閾值,w(h)ij(j=1,2,…,n)為隱層權(quán)重。
第二步,建立從隱層到輸出層的連接。
這里建立的基金收益神經(jīng)網(wǎng)絡(luò)分位數(shù)回歸模型是一種非參數(shù)的分位數(shù)回歸方法,無(wú)需設(shè)定明確的函數(shù)形式,就能很好地模擬系統(tǒng)中的非線性結(jié)構(gòu),它結(jié)合了神經(jīng)網(wǎng)絡(luò)能夠模擬非線性結(jié)構(gòu)與分位數(shù)回歸能夠揭示基金收益完整分布特征這兩個(gè)方面的優(yōu)勢(shì),能夠準(zhǔn)確地刻畫(huà)與預(yù)測(cè)基金收益變動(dòng)規(guī)律。
2.模型估計(jì)
神經(jīng)網(wǎng)絡(luò)分位數(shù)回歸模型中的參數(shù),可以通過(guò)優(yōu)化目標(biāo)函數(shù)(9)式來(lái)實(shí)現(xiàn)。
但是,在QRNN模型中,還需要進(jìn)一步考慮模型的復(fù)雜程度:由輸入層變量數(shù)目k與隱層節(jié)點(diǎn)數(shù)目n決定。過(guò)于復(fù)雜的模型,容易導(dǎo)致過(guò)度訓(xùn)練問(wèn)題,即過(guò)度擬合了噪音而不是信號(hào)。為防止過(guò)度擬合問(wèn)題,可以考慮如下經(jīng)驗(yàn)損失函數(shù):
其中,λ為正的常數(shù),用以控制權(quán)重項(xiàng)的貢獻(xiàn);二次懲罰項(xiàng),用以對(duì)大的隱層權(quán)重進(jìn)行懲罰。對(duì)規(guī)劃問(wèn)題(10)進(jìn)行求解,可以實(shí)現(xiàn)參數(shù)估計(jì),即
3.密度預(yù)測(cè)
以得到參數(shù)向量估計(jì)W?(τ)、b?(τ)之后,將新觀測(cè)的風(fēng)格因子X(jué)*取值(或者測(cè)試集取值)代入(8)式,就可以得到基金收益R*的條件分位數(shù)估計(jì):
進(jìn)而,由(6)式可以完成基金收益R*的條件密度預(yù)測(cè)。
(一)數(shù)據(jù)選取與分析
本文以中國(guó)開(kāi)放式基金為研究對(duì)象,研究其收益變動(dòng)模式,選用中信標(biāo)普風(fēng)格指數(shù)作為解釋變量,考察其對(duì)證券投資基金收益的影響。對(duì)于開(kāi)放式基金,累積凈值增長(zhǎng)率能夠更好地反映基金收益,其計(jì)算公式如下:
其中,NAVi,t表示基金i在t時(shí)刻單位累積凈值。整個(gè)樣本區(qū)間為2008年5月至2014年3月,共計(jì)70個(gè)月度數(shù)據(jù),數(shù)據(jù)來(lái)源于國(guó)泰安(CSMAR)數(shù)據(jù)庫(kù),所有計(jì)算使用R3.0.1進(jìn)行編程。
表1給出了15個(gè)風(fēng)格指數(shù)的描述統(tǒng)計(jì)結(jié)果,可見(jiàn)風(fēng)格指數(shù)取值之間存在較大差異,可以度量不同投資風(fēng)格的收益情況,具有較好的代表性。J-B檢驗(yàn)結(jié)果表明,除了中標(biāo)企債與可轉(zhuǎn)債兩個(gè)指數(shù)的分布特征與正態(tài)分布存在較大差異,其余指數(shù)都較好地服從正態(tài)分布。
鑒于多數(shù)開(kāi)放式基金收益序列存在類(lèi)似的變動(dòng)規(guī)律,本文只報(bào)告東吳行業(yè)輪動(dòng)股票型證券投資基金(編號(hào)為:580003)的研究結(jié)果,感興趣的讀者可以來(lái)函索取其他結(jié)果。圖3與圖4給出了收益序列的正態(tài)性檢驗(yàn)結(jié)果。在圖3中,直方圖呈現(xiàn)明顯的雙峰特征,表明該收益序列并非服從正態(tài)分布,同時(shí)其無(wú)條件概率密度(實(shí)線)與正態(tài)概率密度(虛線)存在較大偏差。在圖4中,Q-Q的上尾部顯著偏離了直線,因此,拒絕該基金收益序列服從正態(tài)分布的假定。這一結(jié)果意味著,建立在古典假定基礎(chǔ)上的均值回歸模型,其前提條件已經(jīng)不成立,難以準(zhǔn)確刻畫(huà)基金收益的變動(dòng)規(guī)律。為此,需要使用線性分位數(shù)回歸或者神經(jīng)網(wǎng)絡(luò)分位數(shù)回歸,對(duì)基金收益變動(dòng)規(guī)律進(jìn)行揭示。
表1 風(fēng)格指數(shù)描述性統(tǒng)計(jì)與J-B檢驗(yàn)
圖3 基金收益序列直方圖與無(wú)條件概率密度
圖4 基金收益序列Q-Q檢驗(yàn)
(二)實(shí)證結(jié)果分析
為比較預(yù)測(cè)效果,本文以15個(gè)中信標(biāo)普風(fēng)格指數(shù)作為解釋變量,以基金收益作為響應(yīng)變量,分別建立均值回歸模型、線性分位數(shù)回歸模型、神經(jīng)網(wǎng)絡(luò)分位數(shù)回歸模型。在建立神經(jīng)網(wǎng)絡(luò)分位數(shù)回歸模型時(shí),選取神經(jīng)網(wǎng)絡(luò)隱層節(jié)點(diǎn)數(shù)為5、懲罰參數(shù)λ=500、迭代次數(shù)為1 000。建模過(guò)程中,將整個(gè)樣本區(qū)間劃分為兩個(gè)部分:2008年5月至2010年12月作為樣本內(nèi),建立模型;2011年1月至2014年3月作為樣本外,檢驗(yàn)?zāi)P皖A(yù)測(cè)效果。模型預(yù)測(cè)效果評(píng)價(jià),本文采用了三個(gè)指標(biāo):平均絕對(duì)誤差(MAE)、均方根誤差(RMSE)、TheilU不等系數(shù),分別定義如下:
表2中,報(bào)告了均值回歸與線性分位數(shù)回歸模型參數(shù)估計(jì)結(jié)果。限于篇幅,只給出分位數(shù)回歸在τ=0.1,0.3,0.5,0.7,0.9五個(gè)代表性分位點(diǎn)的估計(jì)結(jié)果。可以看出,均值回歸結(jié)果與分位數(shù)回歸結(jié)果存在較大差異,即便與中位回歸的結(jié)果也存在一定的差異。由均值回歸結(jié)果,認(rèn)為對(duì)基金收益存在顯著影響的只有兩個(gè)風(fēng)格因子:小盤(pán)純價(jià)值(SPV)、小盤(pán)價(jià)值(SV),不過(guò)這一信息顯然不能代表基金收益在極端尾部(高分位點(diǎn)與低分位點(diǎn))的變動(dòng)特征。由分位數(shù)回歸的結(jié)果可知,基金收益在低分位點(diǎn)處受到較少風(fēng)格因子的影響,而在高分位點(diǎn)處則受到較多風(fēng)格因子的影響。這一結(jié)果表明,要想解釋基金收益的極端正值需要引入更多的風(fēng)格因子。
表2 風(fēng)格指數(shù)描述性統(tǒng)計(jì)與J-B檢驗(yàn)
在表3中,報(bào)告了在0.1~0.9共計(jì)9個(gè)分位點(diǎn)中,線性分位數(shù)回歸模型與神經(jīng)網(wǎng)絡(luò)分位數(shù)回歸模型對(duì)測(cè)試集的擬合效果。除了在0.2分位點(diǎn)處,基于神經(jīng)網(wǎng)絡(luò)分位數(shù)回歸模型對(duì)測(cè)試集的擬合效果要優(yōu)于線性分位數(shù)回歸模型,這表明15個(gè)中信標(biāo)普風(fēng)格指數(shù)對(duì)基金收益的影響范式主要表現(xiàn)為非線性影響。圖5給出了基于神經(jīng)網(wǎng)絡(luò)分位數(shù)回歸模型的實(shí)際收益預(yù)測(cè)結(jié)果,包括中位數(shù)預(yù)測(cè)與眾數(shù)預(yù)測(cè)兩個(gè)結(jié)果。
表3 基于樣本內(nèi)數(shù)據(jù)的非對(duì)稱損失函數(shù)值
圖5 收益序列樣本外預(yù)測(cè)結(jié)果
表4的評(píng)價(jià)結(jié)果顯示:①就三種模型而言,其樣本內(nèi)預(yù)測(cè)精度都要高于樣本外預(yù)測(cè)精度;②基于線性分位數(shù)回歸模型的中位數(shù)預(yù)測(cè)結(jié)果都不如基于均值回歸模型的均值預(yù)測(cè)結(jié)果,基于神經(jīng)網(wǎng)絡(luò)分位數(shù)回歸模型的中位數(shù)預(yù)測(cè)也只是在RMSE指標(biāo)上優(yōu)于基于均值回歸模型的均值預(yù)測(cè)結(jié)果;③無(wú)論在樣本內(nèi)還是在樣本外,基于神經(jīng)網(wǎng)絡(luò)分位數(shù)回歸模型的眾數(shù)預(yù)測(cè)在各個(gè)指標(biāo)上都優(yōu)于其他兩個(gè)模型。眾所周知,眾數(shù)是最可能發(fā)生的數(shù)。因此,表4的結(jié)果表明基于神經(jīng)網(wǎng)絡(luò)分位數(shù)回歸模型預(yù)測(cè)的最可能結(jié)果是最接近真實(shí)收益的。
表4 預(yù)測(cè)評(píng)價(jià)結(jié)果
神經(jīng)網(wǎng)絡(luò)分位數(shù)回歸模型不僅能夠提供中位數(shù)預(yù)測(cè)和眾數(shù)預(yù)測(cè)這兩個(gè)點(diǎn)預(yù)測(cè),而且能夠提供整個(gè)條件密度預(yù)測(cè),從而可以獲得比均值回歸模型只能得到條件均值預(yù)測(cè)更多的有用信息。圖6報(bào)告了在2011年第3、6、9、12個(gè)月時(shí)的基金收益條件密度預(yù)測(cè)結(jié)果,圖中的豎線為真實(shí)的基金收益,曲線為基金收益概率密度預(yù)測(cè)結(jié)果。由圖6可知,第一,預(yù)測(cè)的概率密度曲線都包含了真實(shí)值,而且眾數(shù)非常接近真實(shí)值;第二,在概率密度預(yù)測(cè)基礎(chǔ)上,可以進(jìn)一步給出帶有一定概率水平的區(qū)間預(yù)測(cè)結(jié)果。
圖6 基于QRNN的概率密度預(yù)測(cè)結(jié)果
為解決證券投資基金收益中存在的高峰厚尾和非線性特征,本文建立了神經(jīng)網(wǎng)絡(luò)分位數(shù)回歸模型用以描述證券投資基金收益行為。該模型一方面通過(guò)神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)能夠模擬金融系統(tǒng)中的非線性關(guān)系,另一方面通過(guò)分位數(shù)回歸能夠揭示響應(yīng)變量完整分布特征,整體提升了回歸分析的功能,能夠準(zhǔn)確刻畫(huà)基金收益整個(gè)條件分布(密度)特征,便于深入揭示基金收益模式。以中國(guó)開(kāi)放式基金作為對(duì)象進(jìn)行了實(shí)證研究,結(jié)果表明:①各因素主要通過(guò)非線性范式影響基金收益,表現(xiàn)為基于神經(jīng)網(wǎng)絡(luò)分位數(shù)回歸模型對(duì)測(cè)試集的擬合效果要優(yōu)于線性分位數(shù)回歸模型,從而能夠得到更為準(zhǔn)確的預(yù)測(cè)結(jié)果;②神經(jīng)網(wǎng)絡(luò)分位數(shù)回歸模型可以得到整個(gè)條件密度預(yù)測(cè),這意味著在獲得各影響因素或可控因素的變化趨勢(shì)之后,就可以準(zhǔn)確地描述基金收益的完整條件分布,提供比點(diǎn)預(yù)測(cè)更加豐富的信息。
[1]Sharpe W F.Asset allocation:Management style and perfor?mance measurement[J].The Journal of Portfolio Manage?ment,1992,18(2):7-19.
[2]Fama E F,F(xiàn)rench K R.Common risk factors in the returns on stocks and bonds[J].Journal of Financial economics,1993,33(1):3-56.
[3]許啟發(fā),蔣翠俠.分位數(shù)局部調(diào)整模型及應(yīng)用[J].數(shù)量經(jīng)濟(jì)技術(shù)經(jīng)濟(jì)研究,2011,28(8):115-133.
[4]Bassett G W,Chen H L.Portfolio style:return-based attribu?tion using quantile regression[J].Empirical Economics,2001,26(1):293-305.
[5]胡豐,許啟發(fā),蔣翠俠.基于分位數(shù)回歸的基金風(fēng)格分析與業(yè)績(jī)?cè)u(píng)價(jià)[J].鄭州航空工業(yè)管理學(xué)院學(xué)報(bào),2012,30(6):84-90.
[6]許啟發(fā),蔡超,蔣翠俠.基于半?yún)?shù)模型的Kuznets“倒U假說(shuō)”再檢驗(yàn)[J].統(tǒng)計(jì)與信息論壇,2010,25(8):3-9.
[7]Broomhead D,Lowe D.Multivariable functional interpola?tion and adaptive networks[J].Complex systems,1988,2(1):321-355.
[8]White H.Nonparametric estimation of conditional quantiles using neural networks[M].Gallant A R.Artificial Neural Networks:Approximation and Learning Theory.Oxford:Blackwell,1992:191-205.
[9]Taylor J W.A quantile regression neural network approach to estimating the conditional density of multiperiod returns[J].Journal of Forecasting,2000,19(4):299-311.
[10]Feng Y,Li R,Sudjianto A,et al.Robust neural network with applications to credit portfolio data analysis[J].Statis?tics and its interface,2010,3(4):437-444.
[11]Cannon A J.Quantile regression neural networks:Imple?mentation in R and application to precipitation downscaling[J].Computers&Geosciences,2011,37(9):1277-1284.
[12]Cannon A J.Neural networks for probabilistic environmen?tal prediction:Conditional Density Estimation Network Cre?ation and Evaluation(CaDENCE)in R[J].Computers& Geosciences,2012,41(4):126-135.
[13]何耀耀,許啟發(fā),楊善林,等.基于RBF神經(jīng)網(wǎng)絡(luò)分位數(shù)回歸的電力負(fù)荷概率密度預(yù)測(cè)方法[J].中國(guó)電機(jī)工程學(xué)報(bào),2013,33(1):93-98.
[14]Koenker R,Bassett G W.Regression quantiles[J].Econo?metrica,1978,46(1):33-50.
[15]Yu K,Lu Z,Stander J.Quantile regression:applications and current research areas[J].The Statistician,2003,52(3):331-350.
[16]陳建寶,丁軍軍.分位數(shù)回歸技術(shù)綜述[J].統(tǒng)計(jì)與信息論壇,2008,23(3):89-96.
[17]Portnoy S,Koenker R.The Gaussian hare and the Lapla?cian tortoise:computability of squared-error versus abso?lute-error estimators[J].Statistical Science,1997,12(4):279-300.
[18]Portnoy S,Koenker R.Adaptive L-estimation for linear models[J].Annals of Statistics,1989,17(1):362-381.
[責(zé)任編輯:余志虎]
Prediction of the Probability Density of Securities Investment Fund Returns—Based on Quantile Regression Neural Network Model
RUAN Su-mei1,YU Ning2
(1.School of Business,Anhui University of Finance and Economics,Bengbu 233041,China; (2.School of Economics,Trade and Event Management,Beijing International Studies University,Beijing 100024,China)
It is difficult for mean regression analysis,which is based on classical assumptions,to give an accurate prediction of securities investment fund returns since they have a higher kurtosis and larger skewness.The quantile regression neural net?work(QRNN)model is set up for revealing the stylized facts of securities investment fund returns,such as leptokurtic and asymmetry,and nonlinear impact mode of all types of factors.On the one hand,the QRNN model can describe the influenc?ing rules of all factors in the whole conditional distribution of the returns through quantile regression approach.On the other hand,it is especially good at simulating the nonlinear relationship of financial system via the structure of neural network.Fur?thermore,we predict the whole conditional density function of securities investment fund returns based on the QRNN model,which provides more useful information than point forecast for scientific decision-making.
investment fund;neural network;quantile regression;probability density;prediction
F830
A
1007-5097(2015)02-0105-06
10.3969/j.issn.1007-5097.2015.02.017
2014-05-11
國(guó)家社會(huì)科學(xué)基金項(xiàng)目(13CGL075);國(guó)家自然科學(xué)基金項(xiàng)目(71403001);安徽省教育廳人文社會(huì)科學(xué)研究重點(diǎn)項(xiàng)目(SK2013A011);河北省社會(huì)科學(xué)發(fā)展研究課題(2014021408);北京市社會(huì)科學(xué)基金項(xiàng)目(14JG090)
阮素梅(1974-),女,安徽太和人,副教授,碩士生導(dǎo)師,博士,研究方向:銀行管理,公司治理;
于寧(1982-),男,河北石家莊人,講師,特華博士后科研工作站博士后,美國(guó)紐約大學(xué)訪問(wèn)學(xué)者,研究方向:國(guó)際金融,銀行管理。