謝合亮,游 濤
(1.中央財經(jīng)大學 統(tǒng)計與數(shù)學學院,北京 100081;2.深圳證券交易所綜合研究所,深圳 518028)
期權(quán)定價模型一直是金融衍生品領(lǐng)域熱門的研究方向。最早的期權(quán)定價模型稱為Black-Scholes(B-S)模型,該模型第一次給出了完整的歐式期權(quán)的定價方法[1]。之后,Merton給出了計算期權(quán)合理價格的理論,Stoll比較了看漲和看跌期權(quán)的差異,這一系列研究成果對完善期權(quán)定價理論做出了重要貢獻[2-3]。從當時的研究成果可以看出,B-S模型的公式推導是在滿足大量的假設(shè)條件下進行的,而在實際應(yīng)用中這些條件往往并不存在。在假設(shè)的模型沒有確定的解析解的情況下,可以運用數(shù)值解近似逼近解析解,如二叉樹期權(quán)定價方法和蒙特卡洛模擬法[3]。這類期權(quán)定價模型都是由經(jīng)濟學家提出,而且需要一定的假設(shè)條件,根據(jù)一些市場信息(例如無風險利率、到期時間)來確定模型結(jié)構(gòu)。
與之不同的是,機器學習方法在確定期權(quán)定價方面建立的是一種算法模型,將經(jīng)濟變量作為輸入數(shù)據(jù),而輸出為期權(quán)價格,輸入和輸出之間的復雜關(guān)系由算法本身對大量數(shù)據(jù)的學習得到,不需考慮模型本身的經(jīng)濟學原理。機器學習可以用于訓練回歸模型,比如核函數(shù)模型和神經(jīng)網(wǎng)絡(luò),這方面的研究文獻也不少。如Malliaris和Salchenberger提出了一種利用神經(jīng)網(wǎng)絡(luò)進行期權(quán)定價的模型,并與B-S模型進行了比較,發(fā)現(xiàn)基于神經(jīng)網(wǎng)絡(luò)模型的期權(quán)定價預測值的誤差更小,而且不需要在嚴格的統(tǒng)計假設(shè)條件下進行[4]。Hutchinson提出了一種利用機器學習方法對金融衍生品進行資產(chǎn)定價的非參數(shù)方法,通過模擬B-S期權(quán)定價公式,并且對普通最小二乘法,徑向基函數(shù)網(wǎng)絡(luò),多層感知器和投影追蹤四種方法進行了比較,研究結(jié)果表明,神經(jīng)網(wǎng)絡(luò)期權(quán)定價法更加準確和有效。Garcia和Timmermann研究發(fā)現(xiàn),當采用與B-S公式相同的變量作為前饋神經(jīng)網(wǎng)絡(luò)模型的輸入變量時,神經(jīng)網(wǎng)絡(luò)的期權(quán)定價預測值比Black-Scholes模型具有更小的均方誤差[5]。但是,研究人員也發(fā)現(xiàn),利用神經(jīng)網(wǎng)絡(luò)來預測期權(quán)價格也有一個缺點,就是對所有期權(quán)都使用一個算法模型,這容易高估執(zhí)行期較遠的期權(quán)而低估已經(jīng)快到期的期權(quán),這一問題與神經(jīng)網(wǎng)絡(luò)容易過擬合有很大的關(guān)系[6]。Gradojevic等研究了一種非參數(shù)模糊神經(jīng)網(wǎng)絡(luò)(MNN)模型來對標準普爾500指數(shù)的歐式看漲期權(quán)進行定價,實驗結(jié)果表明,與其他期權(quán)定價模型相比,MNN方法始終保持優(yōu)異的樣本外的定價能力,并得出結(jié)論,模塊化提高了標準前饋神經(jīng)網(wǎng)絡(luò)期權(quán)定價模型的泛化能力[7]。對于如何提高神經(jīng)網(wǎng)絡(luò)在樣本外期權(quán)定價的預測能力,Guidolin 、Hahn 與Tang也都進行了深入的研究[5,8,9]。
深度學習是從機器學習中的人工神經(jīng)網(wǎng)絡(luò)(Artificial Neural Network,ANN)發(fā)展出來的新方法,Bengio等和Hinton等人發(fā)現(xiàn)多層前饋神經(jīng)網(wǎng)絡(luò)可以先通過逐層預訓練,再用反向傳播算法進行精調(diào)的方式實行有效學習,至此神經(jīng)網(wǎng)絡(luò)再次被人們所重視[10-11]。由于深度學習是近幾年才興起的機器學習方法,并且算法本身極為復雜。從已有國內(nèi)外文獻來看,深度學習在金融領(lǐng)域的應(yīng)用研究文獻還很少,并且主要集中在指數(shù)、期貨價格預測方面,通過對大量高頻交易數(shù)據(jù)進行分析,預測未來價格的漲跌。在期權(quán)定價方面,有少量的研究成果出現(xiàn),如Heaton等研究了深度學習在金融領(lǐng)域的應(yīng)用,并認為在金融衍生品定價方面,深度學習可以具有很強的優(yōu)勢[12]。Yang等設(shè)計了一種帶有門限函數(shù)的深度神經(jīng)網(wǎng)絡(luò)進行歐式期權(quán)定價研究,并發(fā)現(xiàn)這種神經(jīng)網(wǎng)絡(luò)對SP500指數(shù)期權(quán)的定價準確率要高于BS模型等傳統(tǒng)期權(quán)定價模型[13]。國內(nèi)利用神經(jīng)網(wǎng)絡(luò)進行期權(quán)定價研究的論文還很少,運用深度學習進行期權(quán)定價的研究文獻還未出現(xiàn)[14]。
深度學習方法比傳統(tǒng)機器學習方法更加適應(yīng)高維、非線性的復雜數(shù)據(jù),同時金融數(shù)據(jù)往往具有時間序列數(shù)據(jù)的特征,而遞歸神經(jīng)網(wǎng)絡(luò)(Recurrent Neural Networks,RNN)是專門設(shè)計用于處理序列數(shù)據(jù)的深度神經(jīng)網(wǎng)絡(luò)。從這一角度考慮,本文從傳統(tǒng)的B-S期權(quán)定價算法入手,根據(jù)期權(quán)定價的特征,將深度學習算法LSTM引入到傳統(tǒng)的期權(quán)定價理論,提出了一種全新的LSTM期權(quán)定價的方法,并利用國內(nèi)ETF50期權(quán)進行實證分析,驗證深度學習在金融衍生品定價方面的應(yīng)用。
深度學習由于包含多個隱藏層,是一種比傳統(tǒng)人工神經(jīng)網(wǎng)絡(luò)更加強大的算法。含多個隱藏層的多層感知器就是一種深度學習結(jié)構(gòu)。多層感知器包含兩個以上的隱藏層,層與層之間是全連接的,每層的節(jié)點之間是無連接的(如圖1)。從圖1還能看出,在多層全連接前饋神經(jīng)網(wǎng)絡(luò)中,上一層的每個節(jié)點都同下一層的每個節(jié)點相連接,每條連接線都代表一個不同的權(quán)重。
圖1 含有兩個隱藏層的神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)圖
在深度學習領(lǐng)域,多層感知器雖然在很多方面都具有出色的表現(xiàn),卻不能分析輸入信息之間的整體邏輯序列,然而這些序列數(shù)據(jù)往往含有大量的內(nèi)容,這種信息彼此之間有著復雜的時間關(guān)聯(lián)性,并且信息的長度也不同,這是傳統(tǒng)的多層感知器無法解決的問題,遞歸神經(jīng)網(wǎng)絡(luò)就是為了解決系列問題而產(chǎn)生的。而在遞歸神經(jīng)網(wǎng)絡(luò)中,一個序列的輸出與前面的輸入有關(guān),網(wǎng)絡(luò)會對前面的信息進行記憶并用于當前輸出的計算中,即隱藏層節(jié)點之間有聯(lián)系,這種網(wǎng)絡(luò)結(jié)構(gòu)表現(xiàn)出了更好的預測能力。遞歸神經(jīng)網(wǎng)絡(luò)通過使用帶自反饋的神經(jīng)元,能夠處理任意長度的序列,這更加符合生物神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu)。傳統(tǒng)神經(jīng)網(wǎng)絡(luò)不能共享每個網(wǎng)絡(luò)層參數(shù),但在遞歸神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)中,每層都共享參數(shù),這就大大降低了整個網(wǎng)絡(luò)中需要學習的參數(shù)。圖2為一個展開的遞歸神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)圖,其中xt為某一時刻的輸入,是一個n維向量,ht代表t時刻的隱藏狀態(tài),ot代表t時刻的輸出,輸入層到隱藏層的權(quán)重為U,隱藏層到隱藏層的權(quán)重為W,隱藏層到輸出層的權(quán)重為V。
圖2 遞歸神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)圖
遞歸神經(jīng)網(wǎng)絡(luò)的工作原理包括兩個階段,第一個階段是前饋階段,在t=0時刻,首先將U、V、W進行隨機初始化,h0通常初始化為0,然后進行以下計算:
s1=Ux1+Wh0
h1=f(s1)
o1=g(Vh1)
(1)
根據(jù)時間的推進,此時的狀態(tài)h1作為時刻0的記憶狀態(tài)參與下一步的預測活動,有:
s2=Ux2+Wh1
h2=f(s2)
o2=g(Vh2)
(2)
同理:
st=Uxt+Wht-1
ht=f(Uxt+Wht-1)
ot=g(Vht)
(3)
其中f是激活函數(shù),通常為tanh,relu,sigmoid函數(shù),g通常是softmax函數(shù),幾種函數(shù)的表達式見表1。
表1 遞歸神經(jīng)網(wǎng)絡(luò)常用激活函數(shù)表
由于遞歸神經(jīng)網(wǎng)絡(luò)需要做序列化預測,逐步預測出o0,o1…ot,ot+1…的值,對于每一時刻t,輸出結(jié)果ot會產(chǎn)生一定的損失Lt,損失的判斷可以采用交叉信息熵(Cross-entropy)或者均方誤差(Mse)等。整個序列的損失為L=∑tLt,目標就是要求?。?/p>
(4)
其中,損失L關(guān)于U的梯度為:
(5)
并且,ht是關(guān)于U和ht-1的函數(shù),而ht-1又是關(guān)于U和ht-2的函數(shù),利用鏈式法則得:
(6)
其中
(7)
所以
(8)
設(shè)γ=‖UTdiag(f′(hi-1))‖則括號中為γt-k。若γ>1,當t-k→,γt-k→,將造成系統(tǒng)不穩(wěn)定,存在所謂的梯度爆炸問題。如果γ<1,t-k→,γt-k→0,則存在梯度消失問題。簡單的遞歸神經(jīng)網(wǎng)絡(luò)理論上可以建立長時間間隔的狀態(tài)之間的依賴關(guān)系,但由于存在梯度爆炸和梯度消失的問題,在實際訓練過程中只能學到短周期的依賴關(guān)系。
圖3 LSTM網(wǎng)絡(luò)內(nèi)部結(jié)構(gòu)圖
為了解決循環(huán)神經(jīng)網(wǎng)絡(luò)梯度消失或梯度爆炸的問題,研究人員發(fā)現(xiàn)了一個更加巧妙的方法,即引入一個新的狀態(tài)ct,專門來進行線性的反饋傳遞,同時將ct的信息非線性。但是,由于ct和ct-1是線性關(guān)系,不斷積累的xt信息,會使ct越來越大,LSTM通過引入門機制來控制信息的積累速度,并可選擇遺忘之前累積的信息,是遞歸神經(jīng)網(wǎng)絡(luò)的一個變體,可以有效地解決簡單遞歸神經(jīng)網(wǎng)絡(luò)的梯度爆炸和梯度消失問題。圖5為LSTM模型的網(wǎng)絡(luò)結(jié)構(gòu)。LSTM模型引入了一組記憶單元,在t時刻,記憶單元ct記錄了到當期時刻為止的所有歷史信息,這些信息受三個門控制,這三個門分別叫做輸入門it,遺忘門ft和輸出門ot,三個門都是logistic函數(shù),元素值在[0,1]范圍中。LSTM模型的基本結(jié)構(gòu)為:
it=σ(W(i)xt+U(i)ht-1)
ft=σ(W(f)xt+U(f)ht-1)
ot=σ(W(o)xt+U(o)ht-1)
ht=ot?tanh(ct)
(9)
其中,xt為當前的輸入,σ為logistic函數(shù),遺忘門ft控制每個內(nèi)存單元加入多少新的信息,輸出門ot控制每一個內(nèi)存單元輸出多少信息,因此LSTM可以學習到長周期的歷史信息。
1973年black和scholes 建立的歐式看漲期權(quán)定價公式:V=SN(d1)-Ke-rTN(d2)。其中S為標的資產(chǎn)價格,K為期權(quán)到期執(zhí)行價格,T為期權(quán)的到期時間,t為時間變量,r為在T時刻到期的無風險利率。
black-scholes期權(quán)定價模型推導的假設(shè)條件為:
標的資產(chǎn)的價格St遵循幾何Brown運動
dSt=μStdt+σStdWt
(10)
即
(11)
其他假設(shè)條件還有:期權(quán)有效期內(nèi)沒有股利支付、無風險利率r是常數(shù)、不考慮交易費用和稅收成本且資產(chǎn)都高度可分、市場不存在無風險套利機會、投資者能夠以相同的r進行借貸、證券交易是連續(xù)的。
設(shè)V=V(S,t)是歐式期權(quán)價格,它在期權(quán)的到期日t=T時
構(gòu)造資產(chǎn)組合:
∏=V-ΔS
這里的Δ是標的資產(chǎn)的數(shù)量,選取適當?shù)摩な沟迷?t,t+dt)時間段內(nèi),資產(chǎn)組合∏是無風險的。在時刻t+dt,投資組合的回報是:
得到:
dVt-ΔdSt=r∏rdt=r(Vt-ΔSt)dt
(12)
帶入式(12)得:
(13)
由于式(13)右端為是無風險的,則等式左邊隨機項dWt的系數(shù)為0,即選?。?/p>
帶入式(13)得到:
(14)
得到歐式期權(quán)價格變化的B-S偏微分方程。
從以上模型的介紹可以看出,B-S模型需要在布朗運動的假設(shè)條件下進行隨機過程分解,從而構(gòu)造出一個復雜精細的數(shù)學公式,變量之間有著確定的關(guān)系。而LSTM神經(jīng)網(wǎng)絡(luò)只關(guān)注神經(jīng)網(wǎng)絡(luò)模型自身內(nèi)部結(jié)構(gòu)的合理性,而對變量之間的結(jié)構(gòu)完全沒有任何要求,也是就是說在相同的變量條件下,LSTM神經(jīng)網(wǎng)絡(luò)構(gòu)造出的期權(quán)定價模型與B-S推導出的偏微分方程式(14)可能并無任何結(jié)構(gòu)上的相似。因此,在金融資產(chǎn)價格預測方面,利用算法模型與傳統(tǒng)的數(shù)據(jù)模型進行對比,從而分析兩種模型的優(yōu)劣將有重大理論和實踐意義。
實驗數(shù)據(jù)為2016—2017年之間已經(jīng)退市的部分執(zhí)行期在3個月以上的期權(quán),包括看漲期權(quán)和看跌期權(quán),部分實驗期權(quán)數(shù)據(jù)見表2。根據(jù)B-S期權(quán)定價模型和其他文獻的研究成果[22],對看漲和看跌期權(quán)定價需要考慮以下因素:
S:標的資產(chǎn)價格
K:期權(quán)到期執(zhí)行價格
r:無風險利率
T:期權(quán)到期時間
Sigma:歷史波動率
表2 實驗樣本數(shù)據(jù)集表
注:數(shù)據(jù)來源于wind資訊。
為了對模型預測效果進行對比,實驗將對看漲期權(quán)和看跌期權(quán)分開進行。其中,看漲期權(quán)數(shù)據(jù)共4 281行,看跌期權(quán)數(shù)據(jù)4 373行,將每種期權(quán)的前4 000行數(shù)據(jù)作為訓練集,剩余數(shù)據(jù)作為測試集。本次實驗共得到看漲期權(quán)價格預測值280個,看跌期權(quán)價格預測值372個。根據(jù)50ETF期權(quán)的特點,模型的輸入為:50ETF開盤價(S)、為期權(quán)到期執(zhí)行價格(K)、6個月國債收益率(r)、期權(quán)到期時間/365(T)、90天歷史波動率(sigma)。模型的輸出為:期權(quán)預測值(P)。在tensorflow深度學習環(huán)境下,構(gòu)建雙層LSTM網(wǎng)絡(luò)結(jié)構(gòu),損失函數(shù)判斷標準采用均方誤差(mean squared error,MSE),參數(shù)學習算法采用隨機梯度下降(Stochastic Gradient Descent,SGD),每個mini-batch設(shè)為30。在Epoch=10的情況下,實驗結(jié)果見圖4與圖5。
圖4 訓練集loss 變化情況圖(Epoch=10)
圖5 預測值與真實值對比圖(Epoch=10)
從圖4可以看出,當Epoch=10時,損失函數(shù)開始逐步趨向平穩(wěn),但仍然有下降的趨勢。從圖5來看,預測值與真實值差距很大,表明神經(jīng)網(wǎng)絡(luò)在Epoch=10的情況下還沒有學習到數(shù)據(jù)的特征,說明模型的泛化能力很差。在繼續(xù)增加迭代的次數(shù)的情況下,當Epoch=50時,實驗結(jié)果見圖6、圖7。
圖6 訓練集loss 變化情況圖(Epoch=50)
圖7 預測值與真實值對比圖(Epoch=50)
從圖6可以看出,當Epoch=10時,損失函數(shù)開始有收斂的趨勢,但之后損失又快速下降,在Epoch=40時損失函數(shù)逐漸出現(xiàn)收斂趨勢。從圖7來看,預測值已經(jīng)能較好的擬合真實值,說明LSTM神經(jīng)網(wǎng)絡(luò)在迭代次數(shù)增加的情況可以很好的學習到數(shù)據(jù)中包含的信息,模型泛化能力逐漸提高。為了讓實驗結(jié)果更加可靠,繼續(xù)增加迭代次數(shù),當Epoch=100時,實驗結(jié)果見圖8、圖9。
圖8 訓練集loss 變化情況圖(Epoch=100)
圖9 預測值與真實值對比圖(Epoch=100)
從圖8可以看出,當Epoch=100時,損失函數(shù)不再下降,說明模型已經(jīng)收斂。從圖9來看,利用收斂后的模型產(chǎn)生的預測值能很好的擬合真實值,說明LSTM神經(jīng)網(wǎng)絡(luò)對期權(quán)價格有較好的預測能力。
為了繼續(xù)考察LSTM網(wǎng)絡(luò)的預測能力,繼續(xù)進行跌期權(quán)定價預測試驗,利用與看漲期權(quán)定價預測同樣的LSTM網(wǎng)絡(luò)結(jié)構(gòu),在Epoch=10的情況下,預測結(jié)果見圖10、圖11。
從圖10可以看出,當Epoch=10時,損失函數(shù)在下降并開始平穩(wěn)。從圖11的模型預測結(jié)果來看,預測效果不佳,說明LSTM網(wǎng)絡(luò)還需要繼續(xù)學習。在Epoch=50時,實驗結(jié)果見圖12、圖13。
圖10 訓練集loss 變化情況圖(Epoch=10)
圖11 預測值與真實值對比圖(Epoch=10)
圖12 訓練集loss 變化情況圖(Epoch=50)
圖13 預測值與真實值對比圖(Epoch=50)
從圖12可以看出,當Epoch=50時,損失函數(shù)依然沒有完全收斂。從圖13來看,相對于圖11,在迭代次數(shù)增加到50時,LSTM神經(jīng)網(wǎng)絡(luò)模型的泛化能力已經(jīng)有了很大程度的提高。繼續(xù)增加迭代次數(shù),當Epoch=100時,實驗結(jié)果見圖14、圖15。
圖14 訓練集loss 變化情況圖(Epoch=100)
圖15 預測值與真實值對比圖(Epoch=100)
從圖14的實驗結(jié)果可以看出,當Epoch=100時,損失函數(shù)已經(jīng)收斂,同時從圖15可以看出,預測值能一定程度的擬合真實值,但預測效果不如看漲期權(quán),這也符合看跌期權(quán)定價模型準確率低于看漲期權(quán)定價模型的一般規(guī)律。
為了更直觀地比較LSTM神經(jīng)網(wǎng)絡(luò)的預測效果,將LSTM網(wǎng)絡(luò)的預測結(jié)果與傳統(tǒng)的B-S 蒙特卡洛方法進行對比。B-S Monte Carlo可以這樣理解:在風險中性的條件下,考慮與市場變量S有關(guān)的期權(quán),利率設(shè)為常數(shù),期權(quán)到期時間為T,則期權(quán)定價過程可以由以下過程進行:
第一步,在風險中性條件下對變量S的變化路徑進行抽樣;
第二步,計算期權(quán)收益;
第三步,多次重復第一和第二步獲得多個期權(quán)收益分布;
第四步,求第三步的獲得的多個期權(quán)的期望值,并以無風險利率進行貼現(xiàn),貼現(xiàn)后的現(xiàn)值則為期權(quán)定價的值。
利用B-S Monte Carlo期權(quán)定價算法,對每個預測的期權(quán)價格進行250 000次蒙特卡洛模擬,并將其結(jié)果與LSTM預測結(jié)果進行對比,看漲期權(quán)預測結(jié)果見圖16。
圖16 看漲期權(quán)LSTM與B-S預測對比圖
從圖16可以看出,LSTM神經(jīng)網(wǎng)絡(luò)對看漲期權(quán)的預測效果要明顯優(yōu)于傳統(tǒng)的B-S Monte Carlo算法。同樣條件下兩種方法對看跌期權(quán)的預測見圖17。
圖17 看跌期權(quán)LSTM預測情況圖
表3 看漲期權(quán)B-S Monte Carlo 、LSTM模型比較表
從表3可以看出,對于看漲50EFT期權(quán),在250 000次蒙特卡洛模擬條件下,傳統(tǒng)B-S模型均方誤差(MSE)為0.001 638,而在100次迭代條件下的LSTM神經(jīng)網(wǎng)絡(luò)的MSE值為0.000 215。從表3還可以看出,其他指標如RMSE、MAE、MAPE在深度學習算法下也比傳統(tǒng)B-S Monte Carlo方法表現(xiàn)更加優(yōu)越。另外,在同樣條件下,看跌期權(quán)定價預測結(jié)果見表4。
表4 看跌期權(quán)B-S、LSTM模型比較表
和表4可以看出,對于ETF50看跌期權(quán),LSTM神經(jīng)網(wǎng)絡(luò)算法的MSE、RMSE、MAE、MAPE值均優(yōu)于B-S Monte Carlo方法。
目前,人工智能在金融領(lǐng)域的應(yīng)用已經(jīng)成為研究的熱點,機器學習方法下的金融衍生品定價問題尤其值得關(guān)注。然而,已有的研究主要集中在利用傳統(tǒng)的前饋神經(jīng)網(wǎng)絡(luò)進行期權(quán)定價研究,而神經(jīng)網(wǎng)絡(luò)由于計算黑箱和泛化能力差的問題,使得算法模型在期權(quán)定價研究中并沒有得到廣泛的應(yīng)用。而深度學習算法具有很好的模型泛化能力,且根據(jù)最近的研究文獻也能發(fā)現(xiàn),深度學習在金融資產(chǎn)價格預測方面的準確性已經(jīng)超越了傳統(tǒng)的金融計量模型。基于此,本文研究了循環(huán)神經(jīng)網(wǎng)絡(luò)在期權(quán)定價中的應(yīng)用,并通過同傳統(tǒng)的B-S蒙特卡洛算法進行對比,得出了以下結(jié)論:
第一,模型的預測精度與深度學習訓練次數(shù)有關(guān)。從LSTM網(wǎng)絡(luò)本身來看,隨著模型訓練的次數(shù)的增加,損失函數(shù)逐漸下降并趨于收斂,預測準確度開始上升。從實驗結(jié)果也能發(fā)現(xiàn),無論對看漲期權(quán)還是看跌期權(quán)來說,經(jīng)過100次訓練的模型的預測效果已經(jīng)遠遠高于經(jīng)過10次訓練的模型。
第二,基于深度學習算法的期權(quán)定價方法實驗結(jié)果要優(yōu)于傳統(tǒng)B-S Monte Carlo期權(quán)定價法。首先,從LSTM與B-S Monte Carlo預測結(jié)果的對比來看,250 000次蒙特卡洛模擬的B-S 模型得到的MSE值為 0.001 638,而在100次迭代的條件下的LSTM神經(jīng)網(wǎng)絡(luò)預測的看漲期權(quán)的MSE為0.000 251。其次,看跌期權(quán)LSTM預測值 MSE為0.000 617,也小于B-S Monte Carlo方法0.015 105的值。其他誤差評價標準仍然是LSTM算法結(jié)果優(yōu)于B-S Monte Carlo方法。
第三,深度學習在金融領(lǐng)域的應(yīng)用還需要進行更深入的研究。雖然從實驗結(jié)果可以看出,在金融資產(chǎn)價格預測方面,深度學習算法可以比傳統(tǒng)統(tǒng)計模型更加準確。然而,神經(jīng)網(wǎng)絡(luò)面臨的“黑箱”問題依然無法避免,基于神經(jīng)網(wǎng)絡(luò)構(gòu)建的金融資產(chǎn)價格預測模型,既無法從數(shù)學上進行嚴格的推理證明,也不能通過傳統(tǒng)的金融理論進行解釋,這使得機器學習方法在金融資產(chǎn)價格預測方面的能力備受質(zhì)疑。
第四,傳統(tǒng)的期權(quán)定價模型依然存在改進的空間。從本文的研究可以看出,在采用相同的變量參數(shù)的條件下,深度學習的預測準確率已經(jīng)超越傳統(tǒng)期權(quán)定價模型,而且深度學習并不關(guān)注輸入變量之間的具體意義,這使得該方法可以不斷嘗試通過輸入不同的變量組合來提高期權(quán)定價的預測精度。而且從傳統(tǒng)期權(quán)定價理論來看,在同樣變量條件下,要構(gòu)建一個新的期權(quán)定價微分方程將是一個及其復雜的過程。
第五,人工智能在金融領(lǐng)域?qū)⒂芯薮蟮膽?yīng)用價值。由于金融數(shù)據(jù)具有高維、復雜等特征,這使得金融資產(chǎn)價格的預測難度極大,然而基于深度學習方法的算法模型,無需構(gòu)建復雜的數(shù)學模型,也無需建立在嚴格統(tǒng)計假設(shè)條件下,并且預測效果更加準確。雖然從理論上很難證明機器學習方法的優(yōu)越性,但是隨著大數(shù)據(jù)的時代的到來,人工智能特別是深度學習在金融領(lǐng)域的應(yīng)用價值已經(jīng)越來越被當今社會認可。如何將最前沿的人工智能方法應(yīng)用在金融投資領(lǐng)域,將是未來值得重點研究的問題。
參考文獻:
[1] Black F,Scholes M.The Pricing of Optionsand Corporate Liabilities[J].Journal of Political Economy .1973,81(3).
[2] Merton R C.Theory of Rational Option Pricing[J].Bell Journal of Economics,1973,4(1).
[3] Stoll H R.The Relationship Between Put and Call Option Prices[J].The Journal of Finance,1973,24(1).
[4] Malliaris M,Salchenberger L.A Neural Network Model for Estimating Option Prices[J].Applied Intelligence,1993,3(3).
[5] Guidolin M,Timmermann A.Option Prices under Bayesian Learning:Implied Volatility Dynamics and Predictive Densities[J].Journal of Economic Dynamics & Control,2001,27(5).
[6] Dugas C,Bengio Y,Belisle F,Nadeau C,Garcia R.Incorporating Second-order Functional Knowledgefor Better Option Pricing[C].In Neural Information Processing Systems(NIPS),2000.
[7] Gradojevic N,Gen?ay R,Kukolj D.Option Pricing With Modular Neural Networks[J].IEEE Transactions on Neural Networks,2009,20(4).
[8] Hahn T.Option Pricing Using Artificial Neural Networks :An Australian Perspective[J].Bond University Computational Finance Research Group,2013,12(1).
[9] Tang S.American-style Option Pricing and Improvement of Regression-based Monte Carlo Methods by Machine Learning Techniques[J].2015,23(2).
[10] Bengio Y,Lamblin P,Popovici D,et al.Greedy Layer-wise Training of Deep Networks[J].Advances in Neural Information Processing Systems,2007,23(4).
[11] Hinton G,Deng L,Yu D,et al.Deep Neural Networks for Acoustic Modeling in Speech Recognition:The Shared Views of Four Research Groups[J].IEEE Signal Processing Magazine,2012,29(6).
[12] Heaton J B,Polson N G,Witte J H.Deep Learning for Finance:Deep Portfolios[J].Applied Stochastic Models in Business & Industry,2017,33(1).
[13] Yang Y,Zheng Y,Hospedales T M.Gated Neural Networks for Option Pricing:Rationality by Design[J].Papers,2016.
[14] 譚朵朵.基于BP神經(jīng)網(wǎng)絡(luò)的S&P 500指數(shù)期權(quán)定價[J].統(tǒng)計信息論壇,2008,23(11).