孫有發(fā) ,邱梓杰 ,姚宇航 ,劉彩燕
(廣東工業(yè)大學a.經(jīng)濟與貿(mào)易學院;b.管理學院,廣州 510520)
行為資產(chǎn)定價模型(Behavioral Asset Pricing Model,BAPM)是理性交易者和有限理性交易者交互的必然產(chǎn)物,是行為金融理論的核心,近年來受到眾多學者的關(guān)注[1-3]。在BAPM 中,理性交易者遵循市場有效性假說,被預設為具有良好認知與專業(yè)技術(shù)、均值方差偏好者;有限理性交易者則秉承行為金融學精髓,被預設為僅具有限認知、有限控制力和有限自利[4-6]。BAPM 在解釋金融資產(chǎn)價格異象方面獲得極大成功[7]。如針對中國A 股市場經(jīng)常表現(xiàn)出“個股同漲落以及股指走勢脫離基本面實際狀況”等異象,行為金融學認為這是因為中國A 股市場受政策因素影響極大,投資者面臨相同的政策變化,容易做出趨同性的投資行為調(diào)整,這種趨同性又在自激勵反饋作用下往往導致股價暴漲暴跌[8-11]。
盡管BAPM 相關(guān)研究已經(jīng)取得豐富的成果,但是到目前為止,BAPM 下的期權(quán)定價相關(guān)研究卻不多見[13-16],遠未匯成系統(tǒng)化的研究成果。從現(xiàn)有文獻可歸納出,當前行為期權(quán)定價有兩個主要研究分支:其一,標的資產(chǎn)行為價格模型下的期權(quán)定價研究,著眼于標的風險資產(chǎn)的行為價格建模,依據(jù)期權(quán)定價理論,推導出相應的期權(quán)定價公式或給出數(shù)值定價結(jié)果[11-18]。其二,基于投資者心理和行為的期權(quán)交易價格研究,假設期權(quán)市場交易者遵從行為金融學說中的有限理性、有限認知、有限控制力以及有限自利等,依據(jù)期權(quán)市場交易機制,推理、推導或計算相應的期權(quán)價格。如期權(quán)市場上的追漲殺跌現(xiàn)象,上漲時投資者追入認購期權(quán),推高認購期權(quán)的隱含波動率;下跌時瘋狂追入認沽期權(quán),造成認沽期權(quán)的隱含波動率的非理性上升[14,16,19]。也有從期權(quán)市場的流動性直接推導期權(quán)價格[13]等。
本文沿襲第1個研究分支,在前期已有基礎上,應用深度學習算法,給出行為期權(quán)的數(shù)值定價。考慮到投資者的有限理性預期、羊群效應以及投資者類型自適應遷移等因素,孫有發(fā)[11]構(gòu)建了一類行為資產(chǎn)定價模型,推導出該模型下的歐式期權(quán)定價偏微分方程。遺憾的是,限于技術(shù)手段,文獻[11]中暫未得到期權(quán)價格的解析表達式。
針對文獻[11]中推導出的期權(quán)定價偏微分方程,盡管傳統(tǒng)數(shù)值方法,如有限差分法、有限元法等,都可得到期權(quán)的數(shù)值定價結(jié)果;但對于高維資產(chǎn)情形的期權(quán)定價,偏微分方程的計算時間和記憶容量隨著資產(chǎn)數(shù)量的增加呈指數(shù)級增長,使得這些數(shù)值方法并未表現(xiàn)出特別的優(yōu)勢。應用蒙特卡羅方法對高維資產(chǎn)情形下的期權(quán)進行定價是一個活躍且不斷發(fā)展的研究領域。Gestel等[20]提出了基于迭代的共軛梯度(CG)法來解決維數(shù)大規(guī)模問題。盡管蒙特卡羅方法能夠最終有效地逼近理論值,然而,隨著資產(chǎn)數(shù)量的增加,其所需時間也急劇增加,這也限制了它在高維情景中的應用。
近年來,機器學習方法在金融領域得到了廣泛應用。由此建立了一種算法模型,可通過輸入經(jīng)濟變量后預測期權(quán)價格,輸入和輸出之間的復雜關(guān)系由算法本身對大量數(shù)據(jù)的學習得到。在這類模型的運用方面,Yang 等[21]通過對基礎神經(jīng)網(wǎng)絡結(jié)構(gòu)的不斷改進,最終提出了一種含門控單元的神經(jīng)網(wǎng)絡方法對歐式看漲期權(quán)進行定價,使模型對期權(quán)價格的預測更加精確、穩(wěn)健。在行為期權(quán)價格預測方面,林焰等[22]提出了一種考慮投資者情緒的基于改進粒子群算法優(yōu)化的BP 神經(jīng)網(wǎng)絡,結(jié)合GARCH 模型用于預測歐式期權(quán)價格,并將其作為改進神經(jīng)網(wǎng)絡模型的輸入變量之一,模型最終輸出期權(quán)價格的估計值。普通的機器學習算法在高維期權(quán)定價方面的運用相對較少,對現(xiàn)實市場中存在高維資產(chǎn)的情況,如場外期權(quán),這些方法很難得到運用。
作為機器學習的重要組成部分,深度學習方法比傳統(tǒng)機器學習方法更加適應高維、非線性的復雜數(shù)據(jù)。由于深度學習近幾年才興起且算法本身極為復雜,從已有文獻來看,深度學習在金融領域的應用研究文獻還很少,尤其是高維行為資產(chǎn)定價方面,更多是運用在對指數(shù)、期貨價格的預測。關(guān)于期權(quán)定價方面,Culkin等[23]訓練了一個全連接的前饋深度學習神經(jīng)網(wǎng)絡,準確地重現(xiàn)了Black-Scholes期權(quán)定價公式的結(jié)果,并分析了在期權(quán)定價模型上運用深度學習方法的可行性,提出了可利用深度學習方法來學習真實市場期權(quán)定價模型的建議,但其并未將深度學習運用到具體的期權(quán)定價中。Weinan等[24]提出了一種求解拋物型偏微分方程和后向高維隨機微分方程的算法,通過深度學習中的神經(jīng)網(wǎng)絡逼近策略函數(shù),構(gòu)建網(wǎng)絡并求解Allen-Cahn 方程等問題。其雖然沒有對期權(quán)定價方面進行深入研究,但提出的方法證明了深度學習求解高維偏微分方程的有效性。基于上述文獻成果,本文將深度學習方法運用在行為資產(chǎn)模型期權(quán)定價,解決行為資產(chǎn)模型高維復雜偏微分方程“無法求解解析式”的難題。
為了解決高維復雜BAPM 期權(quán)定價方面的難題,首先基于費曼卡茲公式推導出行為期權(quán)價格的迭代方程,然后用神經(jīng)網(wǎng)絡來逼近迭代方程中的期權(quán)價格關(guān)于標的模型空間變量的梯度,最后通過深度神經(jīng)網(wǎng)絡參數(shù)尋優(yōu)得到期權(quán)價格。數(shù)值實驗可用于測試該深度學習方法在BAPM 期權(quán)定價的精度和性能,與傳統(tǒng)的蒙特卡洛方法進行比較,證明了該方法的有效性及其運用價值。本研究可望為現(xiàn)實金融市場上高維標的資產(chǎn)的期權(quán)定價提供模型和方法層面上的參考。
為使本文內(nèi)容自洽、便于理解,本節(jié)對文獻[11]中有關(guān)行為資產(chǎn)定價模型構(gòu)建的過程進行概述。
1.1.1 市場微觀結(jié)構(gòu) 假設市場上投資者數(shù)量N(N∈Z+)在考察期內(nèi)基本保持不變,且在tk(k=1,2,…)時刻的理性投資者數(shù)量為,有限理性和非理性投資者數(shù)量合計為,進而假設有限理性和非理性投資者合計占比為χk,即χk=
假設在tk+1時刻,χk+1僅有3種取值狀態(tài),分別對應3 種情形:①一個理性投資者轉(zhuǎn)變?yōu)橛邢蘩硇?或非理性)投資者;②投資者類型不發(fā)生任何變化;③一個有限理性(或非理性)投資者轉(zhuǎn)變?yōu)槔硇酝顿Y者。情形①、③分別假設轉(zhuǎn)變概率為:
式中:a為投資者結(jié)構(gòu)趨于穩(wěn)定時有限理性(和非理性)投資者占比;b為投資者結(jié)構(gòu)趨于穩(wěn)定的速度;c為羊群效應程度;N(1-χ)和Nχ分別表示理性投資者和非理性投資者在獨立決策后的成效;和b(1-a)分別為在時間段內(nèi)相應的轉(zhuǎn)變概率和分別為有限理性(及非理性)和理性投資者釋放的羊群效應。為使概率空間完備,情形②將ρ(χk+1=概率假設為適當值。
1.1.2 投資者需求 假設所有投資者在tk+1時刻的超額需求函數(shù)在形式上統(tǒng)一表達為
1.1.3 投資者預期收益 進一步,假設理性投資者與有限理性(及非理性)投資者對tk+1時刻的資產(chǎn)未來收益有如下預期形式:
式中:γ為非理性(情緒)程度,γ∈[0,1];μk表示投資者的理性預期部分。
文獻[11]中依據(jù)市場出清條件以及極限定理,在前面假設基礎上,推導出行為資產(chǎn)價格模型,即
式中:χt為有限理性和非理性投資者合計占總投資者的比例;a為投資者結(jié)構(gòu)趨于穩(wěn)定時有限理性(和非理性)投資者占比;b為投資者結(jié)構(gòu)趨于穩(wěn)定的速度;c為羊群效應程度;γ為非理性(情緒)程度,γ∈[0,1]與為獨立的布朗運動,且相關(guān)系數(shù)為ρ。
行為資產(chǎn)價格模型式(5)雖不同于一般Heston類模型,但卻具有Heston類模型的核心優(yōu)點——能夠較好地捕獲真實金融市場中資產(chǎn)對數(shù)收益率分布具有的某些重要統(tǒng)計特征。圖1 所示為行為資產(chǎn)價格模型式(5)隨機輸出的一個對數(shù)收益率時間序列,表現(xiàn)出了收益率的“波動聚集性”。圖2 中的統(tǒng)計量表明,該對數(shù)收益率的統(tǒng)計分布呈現(xiàn)出顯著的“尖峰”“厚尾”“有偏”等特征。
圖1 模型輸出的對數(shù)收益序列
圖2 對數(shù)收益率分布的統(tǒng)計特性
此外,模型式(5)表明,資產(chǎn)價格隨機過程受制于另一隨機過程,即有限理性和非理性投資者在投資者總體中的比例為。即式(5)中的資產(chǎn)價格波動項被隨機放大了倍。這意味著市場中有限理性和非理性投資者比例無須大范圍變化,就可驅(qū)動資產(chǎn)價格大幅度波動,因此,式(5)較好地刻畫了“真實市場上的投資者類型在短期內(nèi)具有相對剛性,但資產(chǎn)價格可以變化很大”的事實。由于模型的這一特點,使其能反映真實市場的情況,故研究此模型具有現(xiàn)實意義。
令xt=lnSt,風險中性測度下的行為資產(chǎn)價格模型式(5)轉(zhuǎn)變?yōu)?
式中:r為無風險利率與為獨立的布朗運動,且相關(guān)系數(shù)為ρ。應用Feynman-Kac定理到隨機波動方程式(6),可知特征函數(shù)?X(ω,T;t0,x0,χ0)是如下偏微分方程的解:
其帶初值條件:G(0,x,χ;ω)=1。
注意到,方程式(7)是一個(狀態(tài)依賴的)時變系數(shù)偏微分方程。到目前為止,從現(xiàn)有的偏微分方程解析方法工具書中還沒有找到有效的解決辦法,因此也就得不到標的資產(chǎn)到期收益率的密度函數(shù)。這意味著,對于一個執(zhí)行價為K、到期日為T的歐式看漲期權(quán),直接由期權(quán)價格定義
是無法計算得到期權(quán)價格的。而根據(jù)經(jīng)典的蒙特卡羅定價表達式
可以得到期權(quán)的估計值。其中,N為總模擬次數(shù),為第i次模擬期末時刻的資產(chǎn)價格對數(shù)。雖然該方法可能有效,但是由于蒙特卡羅方法本質(zhì)上屬于數(shù)值解方法,當模擬次數(shù)N較小時,得到的定價結(jié)果方差較大,故通常需要模擬次數(shù)N足夠大才能使得接近理論值。然而,對于一個高維標的資產(chǎn)的期權(quán),需要模擬資產(chǎn)的大量路徑,導致運行時間、內(nèi)存消耗急劇增加。
鑒于蒙特卡羅方法的缺陷,本文在Weinan等[24]的基礎上,提出一種基于深度學習數(shù)值解的期權(quán)定價方法。該方法的核心思路是以期權(quán)的期末支付價格為最終網(wǎng)絡輸出,通過深度學習進行參數(shù)尋優(yōu),進而得到初始時刻的期權(quán)價格。
為搭建深度神經(jīng)網(wǎng)絡總體構(gòu)架,下文分別針對單個行為資產(chǎn)模型和多個行為資產(chǎn)模型,推導其基于深度神經(jīng)網(wǎng)絡算法的期權(quán)價格遞推形式。
2.1.1 單資產(chǎn)期權(quán)價格的深度學習迭代方程 應用伊藤引理,推導出期權(quán)價格的隨機微分方程(SDE)形式:
根據(jù)費曼卡茲公式,可得期權(quán)價格滿足的偏微分方程(PDE)形式:
分別對式(10)、(11)求時間上的積分,再經(jīng)過簡單運算,可得
最后,通過離散化和化簡可得期權(quán)價格的迭代方程:
由于xt和χt的梯度項和無法得出精確的表達式,故采用神經(jīng)網(wǎng)絡的方法逼近梯度值,在此基礎上構(gòu)建深度學習網(wǎng)絡框架,優(yōu)化網(wǎng)絡以獲得期權(quán)價格估計值。
2.1.2 高維資產(chǎn)期權(quán)價格的深度學習迭代方程 現(xiàn)實市場中同樣存在多個資產(chǎn)的情形,本文將從低維資產(chǎn)拓展到高維資產(chǎn)。同樣對高維資產(chǎn)情形下行為資產(chǎn)價格模型的期權(quán)定價進行探討??紤]一個標的為多資產(chǎn)的期權(quán),不同資產(chǎn)的價格過程均滿足隨機波動率形式。假設在風險中性測度下,多資產(chǎn)價格模型為:
式中:r為無風險利率;j=1,2,…,M,M為資產(chǎn)數(shù)量,同個資產(chǎn)間相關(guān)性,不同資產(chǎn)間。參考單資產(chǎn)標的期權(quán)推導式(10)~(13),可以得到多資產(chǎn)標的期權(quán)價格的迭代方程:
式中,dW x、dWχ、x、χ、和為M維列向量,分別為:
w=[w1,w2,…,wM]T為不同資產(chǎn)的權(quán)重。
同理,采用神經(jīng)網(wǎng)絡的方法,每個神經(jīng)網(wǎng)絡單元以不同對數(shù)資產(chǎn)的價格和有限理性者占總體投資者的占比作為輸入,輸出對數(shù)資產(chǎn)價格和有限理性者占總體投資者的占比的梯度項。
神經(jīng)網(wǎng)絡結(jié)構(gòu)如圖3所示。
圖3 一個簡單的神經(jīng)網(wǎng)絡結(jié)構(gòu)
這是一個簡單的4層網(wǎng)絡結(jié)構(gòu)圖,包含輸入層(input layer)、中間隱藏層(hidden layer)和輸出層(output layer),通過神經(jīng)元全連接的方式構(gòu)建起網(wǎng)絡框架,其中隱藏層和輸出層含有激活函數(shù)(本文運用relu函數(shù))。神經(jīng)網(wǎng)絡通過非線性的方式連接各個結(jié)構(gòu)單元,運用反向傳播和梯度下降的方法自動調(diào)整參數(shù)值以優(yōu)化目標函數(shù),目前已在各個領域得到了廣泛運用。本文將基于該網(wǎng)絡單元構(gòu)建深度神經(jīng)網(wǎng)絡框架,實現(xiàn)期權(quán)價格估計的功能。
本文以t時刻的對數(shù)資產(chǎn)價格和有限理性者占總體投資者的占比作為網(wǎng)絡單元的輸入項,以t時刻對數(shù)資產(chǎn)價格和有限理性者占總體投資者的占比的梯度項作為網(wǎng)絡的輸出項。如本文實驗部分,在單一資產(chǎn)情形下,輸入層神經(jīng)元個數(shù)為2,隱藏層神經(jīng)元個數(shù)為12,輸出層相應的神經(jīng)元個數(shù)為2。相對于單資產(chǎn)的情況,高維資產(chǎn)情形下深度神經(jīng)網(wǎng)絡的框架沒有發(fā)生較大變化。在t時刻網(wǎng)絡輸入的數(shù)據(jù)為M個資產(chǎn)對應的xt和χt,輸入層的神經(jīng)元個數(shù)為2M。在50個資產(chǎn)的情形下,設置隱藏層神經(jīng)元個數(shù)為110,相應的t時刻網(wǎng)絡單元的輸出是xt和χt的梯度項和,輸出層的神經(jīng)元個數(shù)也是100。
假設在初始時刻x0、χ0,通過式(6)或式(14)可仿真生成(單資產(chǎn)或多資產(chǎn))每一時刻的對數(shù)資產(chǎn)價格xt和有限理性者占總體投資者的占比χt,通過神經(jīng)網(wǎng)絡單元去逼近每一個時刻xt和χt的梯度項。通過上述說明,在每一時刻均有一個對應的相同結(jié)構(gòu)的網(wǎng)絡單元來逼近梯度項,并以此作為深度網(wǎng)絡框架的基本單元。進而,神經(jīng)網(wǎng)絡單元通過式(13)或式(15)(單資產(chǎn)或多資產(chǎn))將每一時刻的網(wǎng)絡單元連接起來,構(gòu)成深度神經(jīng)網(wǎng)絡的最終框架,使得網(wǎng)絡的最終輸出為T時刻的期權(quán)價格。最后,通過輸出的期權(quán)價格和支付價格進行對比和梯度反向傳播,優(yōu)化網(wǎng)絡。整體的深度神經(jīng)網(wǎng)絡框架如圖4所示。
圖4 深度神經(jīng)網(wǎng)絡整體結(jié)構(gòu)
在T和dt確定的情況下,本文整體網(wǎng)絡由T-1個結(jié)構(gòu)相同的神經(jīng)網(wǎng)絡單元構(gòu)建(t=0,t=T時刻的f(tT)不需要訓練和。在理論上,期末時刻的期末價格應該等于支付價格。據(jù)此,可構(gòu)建單個資產(chǎn)模型及多資產(chǎn)情形下神經(jīng)網(wǎng)絡的損失函數(shù)分別為:
式中,wj為第j個資產(chǎn)對應的權(quán)重。在實驗中,為簡便起見,參考亞式期權(quán)定義,采取等權(quán)重處理。
大體網(wǎng)絡框架構(gòu)建完成后,令初始時刻的期權(quán)價格為神經(jīng)網(wǎng)絡的一個參數(shù)(隨機初始化),通過反向傳播對神經(jīng)網(wǎng)絡整體權(quán)重進行優(yōu)化,在最小化損失函數(shù)的同時,可得初始時刻的期權(quán)價格理論估計值。
在參數(shù)優(yōu)化過程中,采用Adam 梯度優(yōu)化算法,該算法不僅具有自適應學習率的特點,同時能夠使迭代過程更具有動量特點,可以跳出局部最優(yōu)點,因而在參數(shù)尋優(yōu)過程中得到廣泛運用。為了對輸入數(shù)據(jù)進行無量綱化、避免反向傳播時神經(jīng)網(wǎng)絡出現(xiàn)梯度消失,在輸入層及每一層數(shù)據(jù)輸入激活函數(shù)之前,需對數(shù)據(jù)進行批標準化處理,該方法已經(jīng)被證明其有效性和重要性[25]。
(1)考察深度神經(jīng)網(wǎng)絡方法在高維資產(chǎn)期權(quán)定價上的性能。當仿真路徑數(shù)趨于無窮大時,蒙特卡洛的估計值趨于理論值,故選取500 000條仿真路徑數(shù)下的蒙特卡羅估計值作為基準。為了檢驗深度學習方法能否在精度和效率上優(yōu)于蒙特卡羅方法,本文保持不同方法采用相同的模型參數(shù),設計如下實驗:
①在單資產(chǎn)情形下,選取一個資產(chǎn)作為標的,基于相同的10 000條仿真路徑數(shù),分別采用蒙特卡洛方法和深度網(wǎng)絡估計期權(quán)價格。重復實驗10次,記錄兩種方法每次的估計值。
②在多個資產(chǎn)情形下,選取50個資產(chǎn)作為標的,為了簡化計算,設定每個資產(chǎn)在組合中的權(quán)重相同,對每個資產(chǎn)的路徑分別模擬10 000次;再分別采用蒙特卡洛方法和深度網(wǎng)絡估計期權(quán)價格。重復實驗10次,記錄兩種方法每次的估計值。
③為了考察深度神經(jīng)網(wǎng)絡在不同資產(chǎn)維度上的表現(xiàn),實驗從單資產(chǎn)情形過渡到多個資產(chǎn)情形,分別選取5個、10個直至50個資產(chǎn),分別記錄蒙特卡洛方法(500 000 條路徑)與深度神經(jīng)網(wǎng)絡(10 000條路徑)下每次的估計值和運行時間。
(2)考察行為因子(投資者微觀結(jié)構(gòu)趨于穩(wěn)定速度、羊群效應和投資者非理性程度)對不同成熟度市場上的期權(quán)價格的影響?;诒?中的參數(shù)集1、2(參數(shù)集1、2分別反映的是有限理性和非理性投資者在總體投資者中占絕對優(yōu)勢比例的市場(如中國股票市場)和相對較為成熟的股票市場),考察模型式(5)中相關(guān)變量或參數(shù)對期權(quán)價格的影響。
表1 參數(shù)表
本文所有數(shù)值實驗,均在google colab提供的內(nèi)存25.51 GB(RAM)、Tensorflow 2.3.0、python 3.6環(huán)境下運行。
3.2.1 單資產(chǎn)情形 設置深度神經(jīng)網(wǎng)絡學習率為3×10-4,批量數(shù)據(jù)(batch)大小為128,驗證集大小為256,仿真10 000條路徑?;诒?(a)中關(guān)于深度神經(jīng)網(wǎng)絡的參數(shù)數(shù)據(jù),在單資產(chǎn)情形下,利用式(13)構(gòu)建如圖4所示的神經(jīng)網(wǎng)絡框架,最小化損失函數(shù)式(16),最終得到期權(quán)價格。
為了直觀地展示深度學習的收斂過程,繪制其中一次運行結(jié)果,如圖5所示。通過500 000條路徑進行蒙特卡洛求解期權(quán)的近似理論價格為3.271 9,深度網(wǎng)絡進行3 000 次迭代后,期權(quán)價格收斂于3.288 0,損失函數(shù)值也收斂,而相同路徑下蒙特卡洛估計值為3.181 1。
圖5 單資產(chǎn)深度神經(jīng)網(wǎng)絡優(yōu)化結(jié)果
為了比較蒙特卡洛方法和深度神經(jīng)網(wǎng)絡在定價方面的表現(xiàn),本文另外做了10次不同路徑(10 000條)的獨立實驗,記錄蒙特卡洛方法和深度神經(jīng)網(wǎng)絡在相同路徑下的估計值,實驗結(jié)果如表2所示。
表2 單資產(chǎn)不同路徑實驗結(jié)果(Benchmark=3.271 9)
數(shù)據(jù)進行可視化如圖6 所示。在低維(單資產(chǎn))情形下,深度學習的計算效率低于蒙特卡羅方法,但深度網(wǎng)絡的估計值相對于蒙特卡洛更接近于期權(quán)價格的理論值,而且估計方差低于蒙特卡洛方法。分析可知,當仿真次數(shù)較少時,資產(chǎn)價格路徑的隨機性較強,蒙特卡羅方法受到的影響較大。深度神經(jīng)網(wǎng)絡的輸入數(shù)據(jù)采用相同的路徑,因此也在一定程度上受到同方向的影響(即深度網(wǎng)絡的估計值和蒙特卡洛有類似偏向)。
圖6 單資產(chǎn)不同路徑下蒙特卡洛期權(quán)價格估計與深度神經(jīng)網(wǎng)絡期權(quán)價格估計
3.2.2 多資產(chǎn)情形 考察50個標的資產(chǎn)。通過隨機生成S0和χ0取值范圍內(nèi)均勻分布數(shù),獲得初始x0和χ0的值(見表3),選取表1(b)中一組模型參數(shù)進行仿真。對于神經(jīng)網(wǎng)絡結(jié)構(gòu)的設置,批量數(shù)據(jù)(batch)大小為128,驗證大小為256,學習率為3×10-4,在10 000條仿真路徑的情況下進行試驗。
表3 50個資產(chǎn)的初始數(shù)據(jù)
為了展示深度神經(jīng)網(wǎng)絡的優(yōu)化效果,同樣繪制一次運行結(jié)果如圖7 所示。期權(quán)的理論價格為0.396 9,由于初始化參數(shù)的隨機性,深度神經(jīng)網(wǎng)絡進行600次迭代(不同初始值迭代次數(shù)不同)后,期權(quán)的估計價格收斂于0.396 6,損失函數(shù)值也收斂,而蒙特卡洛估計值為0.401 1。
圖7 多資產(chǎn)深度神經(jīng)網(wǎng)絡優(yōu)化結(jié)果
獨立運行實驗10次,記錄蒙特卡洛方法和深度神經(jīng)網(wǎng)絡在相同路徑下的估計值,實驗結(jié)果如表4所示。
表4 50個資產(chǎn)不同路徑實驗結(jié)果(Benchmark=0.396 9)
在50個資產(chǎn)情形下,深度學習的計算效率和精度,高于相同路徑下的蒙特卡羅方法,估計方差低于蒙特卡羅方法。分析可知,在仿真次數(shù)較少的情況下,每個資產(chǎn)價格路徑的隨機性疊加,對蒙特卡羅方法的影響進一步加大。為了降低估計方差和逼近理論價格,需要進行大量的蒙特卡洛模擬,隨之帶來的問題是時間的消耗和內(nèi)存的占用。本文的實驗均在google colab提供的環(huán)境下進行,分配的運行內(nèi)存為25.51 GB。在分別模擬50個資產(chǎn)的500 000條路徑時,RAM 占用最高達到了9.51 GB(其中0.93 GB為其他占用),時間達到154.141 s。在更高的維度、更長的到期時間時,若為了追求精度,需要更大的成本,這是普通個人電腦所不支持的。而運行10 000條路徑的深度神經(jīng)網(wǎng)絡時的運行內(nèi)存只有1.68 GB,且運行時長為71.384 s,其估計精度也較高。為了得到較為接近參考值的期權(quán)價格估計值,可以通過少量路徑在深度神經(jīng)網(wǎng)絡上估計的方式,避免使用大量路徑帶來的時間和內(nèi)存上的消耗。
通過對表4數(shù)據(jù)的可視化(見圖8),可以清晰地觀察到相同路徑下蒙特卡洛方法和深度神經(jīng)網(wǎng)絡在期權(quán)價格估價方面的表現(xiàn)。
圖8 50個資產(chǎn)不同路徑下蒙特卡洛期權(quán)價格估計與深度神經(jīng)網(wǎng)絡期權(quán)價格估計
3.2.3 從單資產(chǎn)到多資產(chǎn)的情形 利用表3中的初始化數(shù)據(jù),分別選取前5,10,…,50個資產(chǎn)進行分析,記錄神經(jīng)網(wǎng)絡損失函數(shù)收斂時期權(quán)價格估計值以及運行時間,如表5所示。
表5 不同資產(chǎn)數(shù)量下蒙特卡洛與深度神經(jīng)網(wǎng)絡期權(quán)價估計效果
隨著資產(chǎn)數(shù)量的增加,蒙特卡羅的運行時間呈線性增長,深度學習的運行時間變化不大,且估計值和500 000條仿真數(shù)據(jù)估計值相近,進一步論證了少量數(shù)據(jù)在深度神經(jīng)網(wǎng)絡上進行期權(quán)價格估價的有效性和穩(wěn)定性。
綜上實驗結(jié)果表明,在單資產(chǎn)情形下,10 000條仿真路徑時蒙特卡洛估計方法的隨機性較大,深度神經(jīng)網(wǎng)絡估計方法的隨機性相對較小,然而,深度神經(jīng)網(wǎng)絡由于網(wǎng)絡框架的構(gòu)建導致其運行時間相對較長。在高維度情形下,為了獲得更準確的估計結(jié)果,蒙特卡洛估計方法需要的路徑數(shù)較多,其占用內(nèi)存、運行的時間(見圖9)也隨之發(fā)生了很大變化。此時,在保證估計精度的條件下,少量路徑在深度學習框架上運行,其估計值接近500 000條仿真路徑的蒙特卡洛估計方法,而運行時間沒有發(fā)生較大變化,這體現(xiàn)了深度神經(jīng)網(wǎng)絡在高維期權(quán)定價方面的優(yōu)勢。
圖9 不同資產(chǎn)數(shù)量下蒙特卡洛與深度神經(jīng)網(wǎng)絡期權(quán)價估計時的運行時間
為考察行為資產(chǎn)價格模型式(5)中“具有現(xiàn)實意義的參數(shù)”的動態(tài)變化對期權(quán)價格的影響,設計如下實驗方案:分別以參數(shù)集為基準,每次實驗只改變感興趣的某個參數(shù)、而保持剩余參數(shù)值不變,考察模型特征參數(shù)如何影響期權(quán)價格變化。利用參數(shù)集1和參數(shù)集2,在控制變量的條件下,進行10 000條仿真路徑的深度學習期權(quán)定價。其中,γ的變動范圍為[0.1,0.9],a為[0.1,1.0],b為[0.1,4.0],c為[0.1,2.0]。參數(shù)集1和參數(shù)集2的情形分別如圖10、11所示。
通過對比圖10、11,可以清晰地看到,行為資產(chǎn)價格模型式(5)中行為因子是如何影響期權(quán)價格的。
概括地說,市場中理性投資者長期穩(wěn)定占比(1-a)越高,期權(quán)價格越低(見圖10(a)和圖11(a));而市場中有限理性和非理性投資者的情緒程度越嚴重,期權(quán)價格越高(見圖10(d)和圖11(d)),且這種相關(guān)關(guān)系不受市場成熟度的影響。
然而,股市微觀結(jié)構(gòu)調(diào)整速度和羊群效應對期權(quán)價格的影響,因市場成熟度的不同而不同。在不成熟市場上(對應的是參數(shù)集1),投資者結(jié)構(gòu)回復長期均衡速度越快(見圖10(b)),投資者的羊群效應越嚴重(見圖10(c)),期權(quán)價格越高;而對于成熟市場(對應的是參數(shù)集2),投資者結(jié)構(gòu)回復長期均衡速度(見圖11(b))以及投資者的羊群效應(見圖11(c)),均起到穩(wěn)定期權(quán)價格的作用。不同市場、相同因素作用效果存在差異的原因在于:在不成熟市場,非理性是吸引子,股市投資者均衡結(jié)構(gòu)調(diào)整和羊群效應都朝向了非理性這一面;而在成熟市場,理性是吸引子,因而股市微觀結(jié)構(gòu)調(diào)整順暢和羊群效應加速了市場回歸理性。這一點又可直接從數(shù)學角度分析模型式(5)得出。
圖10 行為資產(chǎn)價格模型中特征參數(shù)對期權(quán)價格的影響:配置參數(shù)1
圖11 行為資產(chǎn)價格模型中特征參數(shù)對期權(quán)價格的影響:配置參數(shù)2
本文針對一類考慮了投資者微觀結(jié)構(gòu)隨機變遷、投資者行為存在羊群效應以及非理性情緒的高維行為資產(chǎn)價格模型,構(gòu)建了基于深度學習算法的行為期權(quán)定價方法。用神經(jīng)網(wǎng)絡逼近迭代方程中的期權(quán)價格關(guān)于標的模型空間變量的梯度函數(shù),通過深度神經(jīng)網(wǎng)絡參數(shù)尋優(yōu)得到期權(quán)價格,是該定價方法的亮點。這種非線性尋優(yōu)的定價性能,顯著優(yōu)于傳統(tǒng)的蒙特卡洛方法的“蠻力求均值”定價性能。此外,研究還發(fā)現(xiàn),投資者的行為因素對于不同成熟度市場上的期權(quán)價格的影響,存在異質(zhì)性。這是因為不同成熟度市場的吸引子存在差異。本研究可望為現(xiàn)實行為金融市場上高維標的資產(chǎn)的行為期權(quán)定價提供一類模型和方法層面的參考。