楊 鵬, 惠小健, 劉 琦
(西京學(xué)院 理學(xué)院, 陜西 西安 710123)
基于效用和均值-方差準(zhǔn)則的多人隨機(jī)微分博弈
楊 鵬, 惠小健, 劉 琦
(西京學(xué)院 理學(xué)院, 陜西 西安 710123)
以3人為例研究多人隨機(jī)微分博弈,其中2人為相互合作的投資者,另一人為2投資者博弈的“虛擬”對(duì)手——金融市場(chǎng).研究2種情形的隨機(jī)微分博弈,一種情形為基于效用的博弈,另一種為基于均值-方差準(zhǔn)則的博弈.對(duì)于第一種情形,2個(gè)投資者的目標(biāo)是使終值財(cái)富的期望效用達(dá)到最大,金融市場(chǎng)的目標(biāo)是使該期望效用最小.對(duì)于第二種情形,2個(gè)投資者的目標(biāo)是在終值財(cái)富的期望給定時(shí)使終值財(cái)富的方差最小,金融市場(chǎng)的目標(biāo)是使方差最大.應(yīng)用隨機(jī)控制理論求得2個(gè)博弈問題的最優(yōu)投資策略、最優(yōu)市場(chǎng)策略、最優(yōu)值函數(shù)的顯式解.通過研究,可以指導(dǎo)相互合作的兩投資者在金融市場(chǎng)情況惡劣時(shí),選擇恰當(dāng)?shù)耐顿Y策略使終值財(cái)富的期望效用最大,或使自身獲得一定的財(cái)富而面臨的風(fēng)險(xiǎn)最小.
冪效用; 均值-方差準(zhǔn)則; 隨機(jī)微分博弈; 投資
博弈論是一門古老的學(xué)科,但是文獻(xiàn)[1]的發(fā)表才標(biāo)志著現(xiàn)代博弈論的開始.隨機(jī)微分博弈是博弈論的一個(gè)重要分支,它主要研究決策者隨時(shí)間變化的相互作用的決策過程.文獻(xiàn)[2]首次將數(shù)學(xué)模型用于隨機(jī)微分博弈之中.之后很多人沿著文獻(xiàn)[2]的方向研究隨機(jī)微分博弈問題.如今,隨機(jī)微分博弈已成為數(shù)理金融和經(jīng)濟(jì)學(xué)的一個(gè)重要研究分支.
近年來基于投資組合最優(yōu)化的隨機(jī)微分博弈,成為一個(gè)研究熱點(diǎn).文獻(xiàn)[3]考慮了連續(xù)時(shí)間模型下2個(gè)有著不同但相關(guān)投資機(jī)會(huì)的投資者之間的零和隨機(jī)微分投資組合博弈.文獻(xiàn)[4]研究了在馬氏調(diào)制模型下,以最小化風(fēng)險(xiǎn)為目標(biāo)的兩投資者之間的零和隨機(jī)微分博弈.文獻(xiàn)[5]研究了保險(xiǎn)公司在跳-擴(kuò)散模型下面對(duì)一個(gè)未知模型的投資組合選擇問題.文獻(xiàn)[6]在指數(shù)效用下研究了擴(kuò)散風(fēng)險(xiǎn)模型的最優(yōu)再保險(xiǎn)和投資問題.他們通過求解最優(yōu)控制問題對(duì)應(yīng)的HJBI方程,得到了最優(yōu)再保險(xiǎn)、投資策略、最優(yōu)市場(chǎng)策略和值函數(shù)的顯示解.文獻(xiàn)[7]應(yīng)用線性-二次控制的理論,研究了負(fù)債情形下投資者與市場(chǎng)之間的隨機(jī)微分博弈.在投資者具有指數(shù)效用和冪效用下,求得了最優(yōu)投資組合策略、最優(yōu)市場(chǎng)策略和值函數(shù)的顯式解.
已往文獻(xiàn)對(duì)隨機(jī)微分博弈的研究大多數(shù)都是基于效用的,很少研究基于均值-方差準(zhǔn)則的隨機(jī)微分博弈.文獻(xiàn)[8]對(duì)于擴(kuò)散風(fēng)險(xiǎn)模型,研究了基于均值-方差準(zhǔn)則的隨機(jī)微分博弈.利用線性二次控制理論得到了最優(yōu)策略和有邊界的顯示解.文獻(xiàn)[9]研究了資產(chǎn)負(fù)債情形下基于均值-方差準(zhǔn)則的隨機(jī)微分博弈,和文獻(xiàn)[8]類似地得到了最優(yōu)策略和有邊界的顯示解.然而,很少有學(xué)者研究多人微分博弈.因此,本文研究了3人隨機(jī)微分博弈的投資組合選擇問題.3人中其中2人為投資者,另一人為這2個(gè)投資者競(jìng)爭(zhēng)的“虛擬”對(duì)手——金融市場(chǎng),兩投資之間是合作關(guān)系.基于投資者和金融市場(chǎng)之間的隨機(jī)微分博弈的投資組合選擇已有很多學(xué)者研究,如文獻(xiàn)[5-7]等.本文考慮了有2個(gè)投資者的情況,這給研究帶來了一定的困難.本文在冪效用函數(shù)下通過猜出解的形式,對(duì)解的形式應(yīng)用It公式,通過進(jìn)一步計(jì)算得到了最優(yōu)策略和值函數(shù)的顯式解.另外,本文還把隨機(jī)微分博弈和均值-方差投資組合選擇問題聯(lián)系了起來.與文獻(xiàn)[8-9]相似,本文研究的問題轉(zhuǎn)化后,成為基于冪效用隨機(jī)微分博弈問題中p=2的情況.這樣,就進(jìn)一步得到了原基于均值-方差準(zhǔn)則隨機(jī)微分博弈問題的最優(yōu)策略和有效邊界.本文的結(jié)果也可推廣到有n(n>2)人的情況,我們只要把n人分成2組即可.本文的研究還可以考慮推廣到CEV模型、Heston模型、Vasicek模型等更一般的模型,這些問題將在以后進(jìn)一步研究.
為了使數(shù)學(xué)上更為嚴(yán)格,假設(shè)所有的隨機(jī)過程和隨機(jī)變量都定義在完備的概率空間(Ω,F,P)上,并且有一滿足通常條件的σ-流{Ft,t≥0},即Ft右連續(xù)且P完備.W1(t)、W2(t)是概率空間上2個(gè)相關(guān)系數(shù)為ρ的標(biāo)準(zhǔn)布朗運(yùn)動(dòng).考慮一個(gè)金融市場(chǎng),由3個(gè)金融資產(chǎn)組成,其中一個(gè)是無風(fēng)險(xiǎn)資產(chǎn)(債券),時(shí)刻t的價(jià)格{Bt,t≥0}滿足方程
dBt=rBtdt,
其中r>0為無風(fēng)險(xiǎn)利率.2個(gè)風(fēng)險(xiǎn)資產(chǎn)(股票),在時(shí)刻t的價(jià)格Si(t)滿足隨機(jī)微分方程
dSi(t)=Si(t)[μidt+σidWi(t)],
其中,μi≥r,σi>0為常數(shù),i=1,2.
有2個(gè)投資者,投資者A和投資者B,投資者A只能在無風(fēng)險(xiǎn)資產(chǎn)和第一種風(fēng)險(xiǎn)資產(chǎn)上投資;投資者B只能在無風(fēng)險(xiǎn)資產(chǎn)和第二種風(fēng)險(xiǎn)資產(chǎn)上投資.設(shè)πi(t)分別為兩投資者在時(shí)刻t在風(fēng)險(xiǎn)資產(chǎn)上投資的比例,則考慮投資后兩投資者的財(cái)富過程Xi(t)滿足下面的隨機(jī)微分方程
dXi(t)=Xi(t)[r+(μi-r)πi(t)]dt+Xi(t)πi(t)σidWi(t),i=1,2.
(1)
定義1一個(gè)策略πi(t)稱為可行的,如果πi(t)關(guān)于流Ft是可料的,且對(duì)于t≥0過程πi(t)滿足下面的條件:
2) 隨機(jī)微分方程(1)有唯一的強(qiáng)解.
所有可行的策略記為π.
注1假設(shè)X(0)=x0.(2)式考慮的是有2個(gè)投資者共同作用的財(cái)富過程,不同于有一個(gè)投資者投資到2個(gè)風(fēng)險(xiǎn)資產(chǎn)和無風(fēng)險(xiǎn)資產(chǎn)的情況.若有一個(gè)投資者,財(cái)富過程應(yīng)為下面的方程
dX(t)=X(t)[r+(μ1-r)π1(t)+(μ2-r)π2(t)]dt+X(t)[π1(t)σ1dW1(t)+π2(t)σ1dW2(t)].
(3)
顯然(2)式和(3)式是不一樣的,因此它們對(duì)應(yīng)的最優(yōu)策略是不一樣的.文獻(xiàn)[7]研究了有n個(gè)投資者帶負(fù)債的隨機(jī)微分博弈,本文只針對(duì)(2)式進(jìn)行研究,通過本文的研究對(duì)相互合作的投資者進(jìn)行投資時(shí)會(huì)有一定的指導(dǎo)意義.
設(shè){θ(t),t≥0}是定義在概率空間(Ω,F,P)上實(shí)值的滿足下列條件的隨機(jī)過程:
1) {θ(t),t≥0}是Ft循序可測(cè)的;
2) 對(duì)幾乎所有的(t,ω)∈[0,+∞)×Ω,θ(t)=θ(t,ω)<1;
對(duì)滿足上述條件的全體θ(t)記為Θ(t).
這里{θ(t),t≥0}代表了金融市場(chǎng)選擇的經(jīng)濟(jì)環(huán)境,顯然(2)式及風(fēng)險(xiǎn)資產(chǎn)價(jià)格過程的概率分布都依賴{θ(t),t≥0}的選擇,同時(shí){θ(t),t≥0}也體現(xiàn)了模型的不確定性因素.下文中研究2投資者和金融市場(chǎng)選擇的經(jīng)濟(jì)環(huán)境之間的博弈.對(duì)每個(gè){θ(t),t≥0}定義{Zθ(t),t≥0}如下
dZθ(t)=-Zθ(t)θ[dW1(t)+dW2(t)],Zθ(0)=1,
(4)
因此Zθ(t)是(Ft,P)上的局部鞅,因?yàn)閧θ(t),t≥0}滿足Novikov條件,所以Zθ(t)是(Ft,P)上的鞅,則
EZθ(T)=EZθ(0)=1.
考慮一個(gè)嚴(yán)格遞增嚴(yán)格凹的效用函數(shù)u,即u′<0,u″>0.記XT為終值時(shí)刻T時(shí)2個(gè)投資者的共同財(cái)富,對(duì)每一個(gè)可行策略π1、π2,定義兩投資者的終值財(cái)富在Pθ下的期望效用為
Vπ1,π2,θ(t,x)=Eθ[u(XT)|Zθ(t)=z,X(t)=x],
其中Eθ是在市場(chǎng)策略θ下的期望.2投資者和市場(chǎng)進(jìn)行如下的博弈,金融市場(chǎng)選擇一個(gè)策略θ最小化Vπ1,π2,θ(t,x),投資者A和投資者B分別選擇策略π1、π2最大化金融市場(chǎng)的選擇,即如下問題
(5)
引理1f′(t)+pf(t)l=0,f(T)=1,則f(t)=epl(T-t).
證明引理1給出來的是常微分方程,比較容易求解.求解過程略.
定理1(5)式定義的隨機(jī)微分博弈問題的最優(yōu)投資策略為:
(6)
(7)
(8)
值函數(shù)為
(9)
從t到T上求積分,在Zθ(t)=z,X(t)=x的條件下在概率測(cè)度Pθ下取條件期望,結(jié)合引理1應(yīng)用Beyes準(zhǔn)則,得到
因?yàn)閒(t)>0,Zθ(t)>0,所以問得證.證畢.
2個(gè)投資者的目的是,在終值財(cái)富的均值EXT=k時(shí),在市場(chǎng)出現(xiàn)最壞的情況下找到一個(gè)最優(yōu)投資策略使終值財(cái)富的方差VarXT最小.該問題稱為基于均值方差準(zhǔn)則的隨機(jī)微分博弈.可描述如下.
定義2基于均值-方差準(zhǔn)則隨機(jī)微分博弈的投資組合選擇問題是以參數(shù)k∈R為限制的隨機(jī)最優(yōu)化問題,也就是
(10)
其中(X(·),π1(·),π2(·))滿足(2)式,Eθ是在概率測(cè)度Pθ下的期望.
下面將求解(10)式定義的問題的最優(yōu)策略和有效邊界.受文獻(xiàn)[9-10]的啟發(fā)可以引入拉格朗日乘子λ把(10)式做如下變形
其中(X(·),π1(·),π2(·))滿足(2)式,λ前面添了數(shù)字2是為了下面處理方便.注意到(10)和(11)式是不等價(jià)的,要通過求(11)式的最優(yōu)策略和有效邊界得到(10)式的最優(yōu)策略和有效邊界.(11)式求得最優(yōu)策略和有效邊界后,應(yīng)用對(duì)偶定理可得到(10)式的最優(yōu)策略和有效邊界.顯然問題(11)等價(jià)于下面的問題
(12)
其中(X(·),π1(·),π2(·))滿足(2)式.受文獻(xiàn)[8]的啟發(fā),可以對(duì)g(t)[X(t)-(k-λ)]2Zθ應(yīng)用It公式.但是如果這些做的話會(huì)出現(xiàn)[X(t)-(k-λ)]X(t)這樣一些項(xiàng),處理起來不方便.這里能不能把[X(t)-(k-λ)]看作一個(gè)整體呢?這是可以的.令Y(t)=X(t)-(k-λ),則Y(t)滿足下面的隨機(jī)微分方程
(13)
接下來,先求解如下微分博弈問題的解
(14)
定理2(12)式定義的隨機(jī)微分博弈問題的最優(yōu)投資策略為
(15)
(16)
最優(yōu)的市場(chǎng)策略為
(17)
有效邊界為
(18)
因?yàn)閅(t)=X(t)-(k-λ),所以有:
X(t)=Y(t)+(k-λ),
X(0)=Y(0)+(k-λ),
因此有
因此對(duì)于固定的λ有
V2(t,x(t),λ)=2V3(0,y(0),λ))-λ2,
所以
(19)
其中
(20)
[1] VON NEUMANN J, MORGENSTERN O. The Theory of Games and Economic Behavior[M]. Princeton:Princeton University Press,1944.
[2] ISAACS R. Differential Games[M]. New York:John Wiley & Sons,1965.
[3] BROWNE S. Stochastic differential portfolio games[J]. Journal of Applied Probability,2000,37(1):126-147.
[4] ELLIOT R J, SIU T K. On risk minimizing portfolios under a markovian regime switching Black-Scholes economy[J]. Annals of Operations Research,2010,176(1):271-291.
[5] LIN X, ZHANG C H, SIU T K. Sotchastic differential portfolio games for an insurer in a jump-diffusion risk process[J]. Mathematical Methods of Operations Research,2012,75(1):83-100.
[6] 羅琰,楊招軍. 基于隨機(jī)微分博弈的保險(xiǎn)公司最優(yōu)決策模型[J]. 保險(xiǎn)研究,2010(8):48-52.
[7] 楊鵬. 隨機(jī)微分博弈下的資產(chǎn)負(fù)債管理[J]. 中山大學(xué)學(xué)報(bào)(自然科學(xué)版),2013,52(6):30-33.
[8] 楊鵬,劉琦. 基于均值方差隨機(jī)微分博弈的再保險(xiǎn)和投資[J]. 四川師范大學(xué)學(xué)報(bào)(自然科學(xué)版),2016,32(2):248-253.
[9] 楊鵬,王震,孫衛(wèi). 均值-方差準(zhǔn)則下具有負(fù)債的隨機(jī)微分博弈[J]. 經(jīng)濟(jì)數(shù)學(xué),2016,33(1):25-29.
Stochastic Differential Gamer for Multiple Decision MakersBased on Utility and Mean-variance Criterion
YANG Peng, XI Xiaojian, LIU Qi
(SchoolofScience,XijingCollege,Xi’an710123,Shaanxi)
Taking an example of three people, stochastic differential game between multiple decision makers is studied. Two of them are the mutual cooperation investors and the last one is the two investors “virtual” opponents-the financial markets. Two kinds of stochastic differential games are studied, one is the game based on utility and the other one is based on the mean-variance criterion. For the first case, the goal of two investors is to make the expected utility of the final value wealth maximum, the financial market goal is to minimize the expected utility. For the second case, the two investor target is to minimize the variance of the terminal value of wealth with a given final expected value. For financial markets the goal is to make the variance of financial markets maximum. By applying stochastic control theory, we obtained the optimal investment strategy, the optimal market strategy and the explicit solution of the optimal value function two game problems. Our result can guide the choice of appropriate investment strategy in the mutual cooperation of the two investors in the financial market to maximize the expected utility of the final wealth, or to minimize risk for wealth for themselves.
power utility; mean-variance criterion; stochastic differential games; investment
2016-05-18
陜西省自然科學(xué)基礎(chǔ)研究項(xiàng)目(2016JM1024)
楊 鵬(1983—),男,講師,主要從事隨機(jī)微分博弈和數(shù)理金融的研究,E-mail:yangpeng511@163.com
F830; O225
A
1001-8395(2017)05-0655-06
10.3969/j.issn.1001-8395.2017.05.016
2010MSC: 91B30
(編輯 周 俊)