郭文英
(首都經(jīng)濟貿(mào)易大學統(tǒng)計學院,北京 1000070)
基于貝葉斯學習的動態(tài)投資組合選擇
郭文英
(首都經(jīng)濟貿(mào)易大學統(tǒng)計學院,北京 1000070)
假設(shè)金融市場中有兩種風險資產(chǎn),并且每種資產(chǎn)的收益中均含有不可觀測項、對應的風險既有系統(tǒng)性風險又有自身特有風險,具有冪效用函數(shù)的投資者運用貝葉斯學習方法最優(yōu)地選取自己的動態(tài)投資組合。理論模型與數(shù)值分析顯示,在一定的投資期限內(nèi),對風險資產(chǎn)的投入是風險厭惡程度的減函數(shù);但超過某一時刻,則相反。當風險厭惡程度不變時,對不可觀測因素的了解使得長、短期的投資策略不同。而且這個轉(zhuǎn)折點隨投資者的風險厭惡程度的增加而減小。風險資產(chǎn)與不可觀測因素的相關(guān)性與風險的大小成反比例關(guān)系。
貝葉斯學習;HJB方程;動態(tài)投資
投資組合選擇問題是金融理論與實務的基本問題。Markowitz提出經(jīng)典的均值方差投資組合選擇模型,隨后許多的學者分析了離散或連續(xù)時間投資,在理論、實證分析等方面極大地豐富了投資組合選擇。Kolm[1]對此作了綜述。
在金融市場中,隨著時間的變化和金融數(shù)據(jù)的增加,投資者不斷地更新所獲得的信息,并將新信息應用到自己的投資組合選擇中?,F(xiàn)有理論中,貝葉斯學習過程是一種能夠較好地描述投資者的這種調(diào)整過程的方法??紤]連續(xù)時間投資:Xia Yihong[2]假設(shè)股票的收益是某可觀測變量的線性函數(shù),其中的斜率遵循O—U過程,投資者通過對斜率的學習構(gòu)建投資組合;袁子甲等[3]假設(shè)金融市場只有一種風險資產(chǎn),具有CRRA型效用函數(shù)的投資者運用貝葉斯學習不斷更新資產(chǎn)的收益,然后運用鞅方法給出最優(yōu)投資組合策略。考慮離散時間投資:Brandt等[4]討論了當風險資產(chǎn)的收益是可預測時,對收益中不確定參數(shù)應用貝葉斯學習,從而導致了對風險資產(chǎn)需求的減少;楊朝軍等[5]實證分析了中國證券市場數(shù)據(jù),在已知資產(chǎn)收益率的歷史數(shù)據(jù)和預測變量的條件下,運用貝葉斯學習分析了參數(shù)不確定性對投資組合的影響。陳志英[6]假設(shè)市場狀態(tài)之間的轉(zhuǎn)換符合馬爾科夫機制,投資者運用貝葉斯學習準則更新他們對當前市場狀態(tài)的判斷,建立了狀態(tài)變化和投資者學習行為下資產(chǎn)組合選擇模型??紤]單期投資,Ando[7]運用貝葉斯理論估計經(jīng)典的均值方差模型中的不確定性參數(shù)的值,得到改進的多期均值方差模型并用實際金融數(shù)據(jù)和蒙特卡羅模擬給出數(shù)值分析;Virbickaite等[8]運用非參數(shù)貝葉斯學習估計投資組合收益的分布,通過最小化單期收益的方差得到最優(yōu)投資策略;Zhu Shushang等[9]討論了基于貝葉斯概率的均值CVaR模型。本文也利用貝葉斯過程分析投資者的學習行為。
以上以及大量的文獻認為超額收益是可預測到的[10-12]。然而在學術(shù)界,關(guān)于影響收益的所有因素是否均可以被預測到這個話題仍存在不同看法[13-14])。Brennan[15]認為金融決策模型最為一般性的設(shè)定應該是投資策略集依賴于一系列不可觀測的狀態(tài)變量。但是,鮮有文獻討論存在不可觀測因素的動態(tài)投資組合選擇。Nicole等[16]分析市場中只有一種風險資產(chǎn),假設(shè)收益受可觀測到的與不可觀測到的隨時間變化的因素的共同影響,投資者能夠從已實現(xiàn)的收益中利用貝葉斯學習來了解這兩種因素,最后給出了此時的投資策略,并作了數(shù)值分析。本文在此基礎(chǔ)上,假設(shè)市場中有兩種風險資產(chǎn),并且收益受不可觀測因素的影響,同時每種風險資產(chǎn)都有系統(tǒng)風險與自身特有風險時,然后運用貝葉斯學習過程分析投資者的最優(yōu)動態(tài)投資策略,并作數(shù)值分析。
假設(shè)投資期為[0,T],金融市場有一種無風險資產(chǎn)、兩種風險資產(chǎn),其中風險資產(chǎn)的收益不僅與已知參數(shù)有關(guān),而且與不可觀測到的變量有關(guān),風險資產(chǎn)不僅有系統(tǒng)性風險,而且還有自身的特有風險。因此,在t時刻無風險資產(chǎn)的價格S0(t)、風險資產(chǎn)的價格Si(t)滿足:
dyi(t)=kyi(μyi-yi(t))dt+σyi(t)dWi(t)
其中r(t)為無風險利率,θi(t)為預期收益率,假設(shè)θi(t)>0,yi(t)為不可觀測到的變量。Z(t)為市場因素,Wi(t)為第i種風險資產(chǎn)特有的因素,并且Z(t)與Wi(t)均為標準Brown運動、且相互獨立。
因此風險資產(chǎn)的超額收益θi(t)+ai(t)yi(t)就是已知參數(shù)與不可觀測到的變量的代數(shù)和。不可觀測到變量yi(t)的存在說明,已知參數(shù)(或可預測變量)不可能解釋超額收益的所有可能變化,它是已知參數(shù)的良好補充。如果ai(t)=0,則不存在不可觀測到的變量;如果ai(t)≠0,投資者不能夠觀測到預期超額收益,但他可以通過觀測已實現(xiàn)的收益,對不可觀測的收益運用貝葉斯學習。根據(jù)Liptser 等[17],這個貝葉斯學習過程滿足:
(1)
(2)
其中ρyisi是風險資產(chǎn)與不可觀測變量的相關(guān)系數(shù),ksi與ρyisi密切相關(guān)。
在投資組合中,記對第i種風險資產(chǎn)的投資比例為xi(t),i=1,2。則對無風險資產(chǎn)的投資就是1-x1(t)-x2(t)。
假設(shè)交易是連續(xù)的,且無交易費用,在任意時刻對無風險資產(chǎn)沒有借貸限制、對風險資產(chǎn)可以買空。設(shè)初始財富為R(0)=R,則投資組合的收益R(t)滿足:
(3)
投資的目的是通過選取一定的投資策略在T時刻基于最終財富RT的預期效用達到最優(yōu)。假設(shè)投資者的效用函數(shù)為風險厭惡程度為λ>1的冪函數(shù)。因此對應的優(yōu)化模型為:
(4)
模型(4)是一個標準的隨機優(yōu)化問題。投資組合的收益R(t)由x控制,因此x是t、R(t)的函數(shù)式。根據(jù)優(yōu)化理論,模型(4)的價值函數(shù)為:
J(R,t)是目前給定信息集Ft上基于最終財富的效用函數(shù)的條件預期。設(shè)J(R,t)關(guān)于t、R(t)、y是二次連續(xù)可導的。因此運用動態(tài)規(guī)劃理論,模型(4)的HJB方程為:
(5)
定理1:基于貝葉斯學習的動態(tài)投資組合的最優(yōu)策略為:
(6)
證明:由(5)式可得到。
定理2:基于貝葉斯學習的動態(tài)投資組合的價值函數(shù)為:
(7)
證明:將(6)代入(5)式有:
(8)
由價值函數(shù)的表達式(7)有:
將上述表達式代入(8)式,可以得到:
(9)
(10)
(11)
(12)
(13)
(14)
求解微分方程組(9)——(14)式,可以得到價值函數(shù)中的系數(shù)A0(t),A1(t),A2(t),B1(t),B2(t),B3(t)的解。從而得到(7)式的表達式。
對于以上(9)——(14)式微分方程組,無法求出它們的解析解,但可以求得數(shù)值解。有了數(shù)值解后,同樣可以分析投資者對風險資產(chǎn)的投入比例。
由定理2,將JR,JRR的表達式代入(6),可以得到所對應的最優(yōu)策略為:
(15)
可以看到,最優(yōu)投資策略依賴于風險厭惡程度與風險資產(chǎn)的波動大小,并且由兩部分構(gòu)成,第一部分只與已知參數(shù)的預期超額收益有關(guān);第二項與貝葉斯學習有關(guān)。
為了更清楚地看到貝葉斯學習對投資組合選擇的影響,本文借鑒文獻[16]的原始數(shù)據(jù),給出數(shù)值分析。為了突出顯示模型(4)的結(jié)論,同時也為了計算簡單,本文假設(shè)所需參數(shù)均為常數(shù)。
表1 數(shù)值分析中參數(shù)的值
在表1所給參數(shù)下,利用Matlab2012b可以得到微分方程組(9)——(14)式的數(shù)值解,圖1——6給出λ=4時的價值函數(shù)(7)中的系數(shù)A0(t),A1(t),A2(t),B1(t),B2(t),B3(t)解。
圖1 λ=4時A0的解
圖2 λ=4時A1的解
圖3 λ=4時A2的解
圖4 λ=4時B1的解
圖5 λ=4時B2的解
圖6 λ=4時B3的解
將微分方程(9)—(14)式的解帶入(15)可以得到對風險資產(chǎn)的最優(yōu)投入策略。下面分析風險厭惡程度、不可觀測的因素等對組合選擇的影響。
首先分析風險厭惡程度對組合選擇的影響。圖7給出了λ=2和4時對兩種風險資產(chǎn)的最優(yōu)投資比例。
圖7 不同風險厭惡程度對投資策略的影響
當投資時間在一定的范圍內(nèi)時,隨著風險厭惡程度的增大,對風險資產(chǎn)的投入都會減少。但當投資超過一定時間時,隨著風險厭惡程度的增大,對收益較大的資產(chǎn)人們反倒是會加大投入,表現(xiàn)出一種類似“賭博”的非理性投資方式。
當風險厭惡程度不變時,隨著投資期的變長,對風險小的資產(chǎn),投資者會增加投資比例;對風險大的資產(chǎn),則會逐漸減少投入。
同時,圖7也顯示,當風險厭惡程度不變時,進行短期投資時,投資者關(guān)注收益,風險資產(chǎn)的收益越大投資比例越大;但進行長期投資時,投資者開始關(guān)注風險資產(chǎn)的波動率,他們會減少對風險大的資產(chǎn)的投入。同時,長、短期投資的轉(zhuǎn)折點與投資者的風險厭惡程度有關(guān),圖7顯示風險厭惡程度越大,這個轉(zhuǎn)折時刻越小。
其次分析不可觀測因素對投資組合選擇的影響。表2、3給出了λ=4、λ=2時不可觀測因素的存在對兩種風險資產(chǎn)的投資比例的影響。
不考慮不可測因素時,同樣有隨著風險厭惡程度的增大,對風險資產(chǎn)的投入都會減少。
不論風險厭惡程度如何,對收益較小、風險較小的資產(chǎn),投資者會逐漸增加對其的投入,并且對不可觀測因素的了解導致隨著投資期的越長,投資者越會增加投入。對收益較大、風險較大的資產(chǎn),投資者會逐漸減少對其的投入,但在短期投資內(nèi),對不可觀測因素的了解導致對此資產(chǎn)的投入增加;但長期投資時,不考慮不可觀測因素的投資反而超過了考慮不可觀測因素時的投資,這個轉(zhuǎn)折點同樣與投資者的風險厭惡程度有關(guān),風險厭惡程度越大,轉(zhuǎn)折時刻越小。
同時不可觀測因素的存在,使得投資者對風險資產(chǎn)投入比例的變動幅度隨風險厭惡程度的增加而增大。
最后分析貝葉斯學習對投資組合選擇的影響。主要考察了不可觀測因素與風險資產(chǎn)的相關(guān)性對投資組合的影響。圖8給出了λ=4貝葉斯學習對投資組合選擇的影響。
可以看到,對收益較小、風險較小的資產(chǎn),在相同的投資期內(nèi),相關(guān)性越大投入比例越大,并且隨著投資期的變長,投資比例增加的越多。對收益較大、風險較大的資產(chǎn),則相反。即,在相同的投資期內(nèi),相關(guān)性越大投入比例越小,并且隨著投資期的變長,投資比例減少的越多。
表2 λ=4不可觀測因素的存在對兩種風險資產(chǎn)的投資比例的影響
表3 λ=2不可觀測因素的存在對兩種風險資產(chǎn)的投資比例的影響
圖8 λ=4貝葉斯學習對投資組合選擇的影響
收益與風險是投資者關(guān)心的兩大問題,而有許多因素會影響資產(chǎn)的收益,有的因素可以觀測到、而有的因素確不可以觀測到。本文研究了金融市場中有一種無風險資產(chǎn)、兩種風險資產(chǎn),并且每種風險資產(chǎn)的超額收益中存在不可觀測項,對應的風險既有系統(tǒng)性風險又有自身特有風險。對不可觀測到的因素投資者根據(jù)已有的經(jīng)驗,利用貝葉斯學習過程進行調(diào)整,從而通過最優(yōu)的投資策略使自己的最終財富達到最大。
假設(shè)投資者具有基于最終財富的、定常風險厭惡的冪效用函數(shù),風險資產(chǎn)的價格服從一般的布朗運動,因此投資組合的收益就是一個隨機過程,這樣就構(gòu)建了基于貝葉斯學習的動態(tài)投資組合優(yōu)化模型,通過求解HJB方程,得到了對風險資產(chǎn)投入的最優(yōu)策略,它與投資者的風險厭惡程度、投資期的長短、是否存在不可觀測因素、學習過程等因素都有一定的關(guān)系。具體的數(shù)值分析表明,在一定的投資期限內(nèi),投資者表現(xiàn)出理性行為,即隨著風險厭惡程度的增大,對風險資產(chǎn)的投入都會減少;但超過某一時刻,非理性的投資行為就會出現(xiàn)。當風險厭惡程度不變時,進行短期投資時,投資者關(guān)注收益,長期投資時,投資者開始關(guān)注風險資產(chǎn)的波動率。同時對不可觀測因素的了解導致對收益較大、風險較大的資產(chǎn),短期投資內(nèi)增加其投入,而長期投資時,不存在不可觀測因素的投資反而超過了存在不可觀測因素時的投資。并且這個轉(zhuǎn)折點隨投資者的風險厭惡程度的增加而減小。不可觀測因素與風險資產(chǎn)的相關(guān)性也使得對風險較小資產(chǎn)的投資比例與之成正比、風險較大資產(chǎn)的投資比例與之成反比。
[1] Kolm P N,Tutuncu R,F(xiàn)abozzi F J,60 Years of portfolio optimization: Practical challenges and current trends [J].European Journal of Operational Research,2014,234(2):356-371.
[2] Xia Yihong. Learning about predictability: The effects of parameter uncertainty on dynamic asset allocation [J]. Journal of Finance,2001,56 (1):205-244.
[3] 袁子甲,李仲飛.參數(shù)不確定性和效用最大化下的動態(tài)投資組合選擇[J].中國管理科學,2010,18(5):1-6.
[4] Brandt M W, Goyal A, Santa-Clara P, et al.A simulation approach to dynamic portfolio choice with an application to learning about return predictability [J].The Review of Financial Studies,2005,18(3):830-874.
[5] 楊朝軍,陳浩武.參數(shù)不確定性對投資者最優(yōu)資產(chǎn)組合的影響:基于中國的實證[J].中國管理科學,2008,16(3):37-44.
[6] 陳志英.狀態(tài)變化和學習行為下的最優(yōu)資產(chǎn)組合選擇[J].管理科學,2013,26(2):81-90.
[7] Ando T,Bayesian portfolio selection using a multifactor model[J].International Journal of Forecasting,2009,25(3):550-566.
[8] Virbickaite A, Ausin M C, Galeano P. A Bayesian non-parametric approach to asymmetric dynamic conditional correlation model with application to portfolio selection[J].Computational Statistics and Data Analysis,2016,100:814-829.
[9] Zhu Shushang, Fan Minjie,Li Duan.Portfolio management with robustness in both prediction and decision: A mixture model based learning approach[J].Journal of Economic Dynamics & Control,2014,48:1-25.
[10] Fama E F,F(xiàn)rench K R.Permanent and temporary components of stock prices [J]. Journal of Political Economy, 1988,96 (2):246-273.
[11] Boudoukh J,Michaely R,Richardson M,et al.On the importance of measuring payout yield: Implications for empirical asset pricing [J].Journal of Finance, 2007,62 (2):877-916.
[12] Drechsler I,Yaron A. What’s vol got to do with it[J]. Review of Financial Studies,2011,24 (1):1-45.
[13] Ang A, Bekaert G.Stock return predictability: Is it there? [J].Review of Financial Studies,2007,20 (3): 651-707.
[14] Lettau M,Van Nieuwerburgh S.Reconciling the return predictability evidence [J]. Review of Financial Studies,2008,21 (4):1607-1652.
[15] Brennan M J.The role of learning in dynamic portfolio decisions [J].European Finance Review, 1998,1(3):295-306.
[16] Branger N, Larsen L S,Munk C.Robust portfolio choice with ambiguity and learning about return predictability[J].Journal of Banking & Finance,2013,37(5):1397-1411.
[17] Liptser R S,Shiryaev A N.Statistics of random processes [M]. New York-Hedelberg: Springer-Verlag,1978.
[18] Jacquier E. Polson N,Bayesian methods in finance [M]//Geweleke J,Koop G,Van Dijk H.The Oxford handbook of Bayesian econometrics.Oxfor:Oxford University Press,2011.
Dynamic Portfolio Choice based Bayesian Learning Approach
GUO Wen-ying
(School of Statistics Capital University of Economics and Business, Beijing 1000070,China)
In this paper, the optimal dynamic portfolio choice is analyzed under Bayesian learning. Assuming that there are two kinds of risky assets, the returns of each asset are predictable by unobservable predictor, and risks of each asset have both systematic and own risks. The empirical results highlight that the proportion of the investor’s wealth invested in every risky asset is decreasing with the degree of risk aversion over short horizon, but it is opposite when the investment horizon is long. When the degree of risk aversion is constant, the Bayesian learning makes different about the long and short-horizon investment strategy. This critical point decreases with the degree of risk aversion of investor. The correlation between risk assets and the unobservable predictor is inversely proportional to the size of the risk of asset.
Bayesian learning; HJB equation; dynamic portfolio choice
1003-207(2017)08-0039-07
10.16381/j.cnki.issn1003-207x.2017.08.005
2015-10-13;
2016-11-21
國家自然科學基金資助項目(11371001);首都經(jīng)濟貿(mào)易大學科研水平提高定額項目
郭文英(1967-),女(漢族),北京人,首都經(jīng)濟貿(mào)易大學統(tǒng)計學院,教授,博士,研究方向:數(shù)理金融,E-mail:guowy67@126.com.
F830
A