張賀鵬 周偉(通訊作者)
(蘭州交通大學(xué)數(shù)理學(xué)院 甘肅蘭州 730070)
在金融市場的形成過程中,金融衍生品所擁有的風(fēng)險(xiǎn)轉(zhuǎn)移或套期保值功能,使其逐漸出現(xiàn)在人們的視野中。而期權(quán)以其特有的高杠桿特性,以及其具有非線性損益結(jié)構(gòu)、尖峰厚尾等結(jié)構(gòu)特征,更因其發(fā)揮了風(fēng)險(xiǎn)投資、價(jià)值發(fā)現(xiàn)、套期保值等功能,受到投資者們的推崇。
直至今天,期權(quán)市場仍在飛速發(fā)展,學(xué)者們對于期權(quán)理論的相關(guān)研究也愈加深入。在期權(quán)價(jià)值確定方面,對于期權(quán)定價(jià)相關(guān)研究,1973年,F(xiàn)ischer Black和Myron Scholes基于市場有效等一系列假設(shè),提出了第一個(gè)完整的Black-Scholes期權(quán)定價(jià)模型[1],但由于實(shí)際的期權(quán)交易市場無法滿足其一系列理想化的假設(shè)條件,因此在實(shí)際應(yīng)用中一般會產(chǎn)生較大誤差。
隨著大數(shù)據(jù)時(shí)代的到來,學(xué)者們著眼于研究以歷史數(shù)據(jù)為驅(qū)動而構(gòu)建的深度學(xué)習(xí)理論。在尋求誤差最小化的過程中,機(jī)器學(xué)習(xí)及神經(jīng)網(wǎng)絡(luò)的出現(xiàn),可以借助現(xiàn)實(shí)市場中的實(shí)際數(shù)據(jù)對神經(jīng)網(wǎng)絡(luò)模型進(jìn)行訓(xùn)練與測試,最終達(dá)到規(guī)避理想化的模型假設(shè)及數(shù)據(jù)不兼容問題的目的。
本文以期權(quán)作為研究對象,基于B-S期權(quán)定價(jià)公式,結(jié)合深度學(xué)習(xí)相關(guān)理論構(gòu)建出符合預(yù)期的期權(quán)價(jià)格預(yù)測模型。
首先,在對B-S期權(quán)定價(jià)模型進(jìn)行充分研究后借助深度學(xué)習(xí)理論的優(yōu)勢,在文中結(jié)合B-S公式,應(yīng)用深度學(xué)習(xí)理論中的神經(jīng)網(wǎng)絡(luò)方法構(gòu)建期權(quán)價(jià)格預(yù)測模型,以期根據(jù)現(xiàn)存期權(quán)相關(guān)數(shù)據(jù)對未來的期權(quán)價(jià)格進(jìn)行精度較高的預(yù)測與分析。
其次,對比分析利用BP神經(jīng)網(wǎng)絡(luò)及LSTM神經(jīng)網(wǎng)絡(luò)構(gòu)建出的模型所預(yù)測出的期權(quán)價(jià)格,同時(shí)運(yùn)用多種評價(jià)指標(biāo)對預(yù)測值與真實(shí)值之間的誤差進(jìn)行分析對比,并評價(jià)模型擬合程度。
1.3.1 期權(quán)定價(jià)模型
有關(guān)期權(quán)定價(jià)理論的研究最早在1900年被提出,Louis Bachelier以“投機(jī)交易理論”為基礎(chǔ),首次提出了用隨機(jī)游動思想給出股票價(jià)格運(yùn)行的隨機(jī)模型,它被公認(rèn)為現(xiàn)代金融學(xué)的里程碑[2]。
1973年,F(xiàn)ischer Black和Myron Scholes在對期權(quán)市場做出嚴(yán)格假設(shè)的情況下,提出了第一個(gè)完整的期權(quán)定價(jià)模型,即B-S期權(quán)定價(jià)模型,這篇文章的發(fā)表為后來學(xué)者研究期權(quán)定價(jià)理論提供了根本框架。同年,Merton在其基礎(chǔ)上進(jìn)行修改,使之更加接近現(xiàn)實(shí)情況,發(fā)展出了Black-Scholes-Merton模型[3-5]。
在具有期權(quán)性質(zhì)的各種實(shí)物定價(jià)方面,龍海明(2007)等將B-S期權(quán)定價(jià)模型應(yīng)用于消費(fèi)貸款定價(jià),指出對貸款抵押物處置靈活度較高的銀行可以用期權(quán)定價(jià)法代替?zhèn)鹘y(tǒng)成本加成定價(jià)法來確定消費(fèi)貸款利率,理論依據(jù)是抵押物價(jià)值的不確定性將給貸款帶來風(fēng)險(xiǎn),銀行可以持有以抵押物為標(biāo)的物的歐式看跌期權(quán)來對沖風(fēng)險(xiǎn),進(jìn)而基于這個(gè)樞紐將B-S期權(quán)定價(jià)模型應(yīng)用于貸款價(jià)格的確定上[6]。馮芬玲等(2012)將二叉樹定價(jià)法應(yīng)用于鐵路貨運(yùn)價(jià)格制定,使得傳統(tǒng)固定協(xié)議定價(jià)所導(dǎo)致雙方都不能從鐵路貨運(yùn)現(xiàn)價(jià)波動中獲利的弊端得到克服[7]。
1.3.2 基于深度學(xué)習(xí)的期權(quán)價(jià)格預(yù)測模型構(gòu)建
Hutchinson等人首先將深度學(xué)習(xí)中的神經(jīng)網(wǎng)絡(luò)方法應(yīng)用于期權(quán)價(jià)格預(yù)測,他們以標(biāo)準(zhǔn)普爾500指數(shù)期貨期權(quán)為實(shí)證對象,建立神經(jīng)網(wǎng)絡(luò)模型,通過對比四種模型估計(jì)方法,經(jīng)過反復(fù)訓(xùn)練后得出神經(jīng)網(wǎng)絡(luò)模型,其精度較B-S期權(quán)定價(jià)模型有所提高[8]。Anders等人比較了神經(jīng)網(wǎng)絡(luò)模型和B-S期權(quán)定價(jià)模型在DAX30期權(quán)定價(jià)過程中的表現(xiàn),發(fā)現(xiàn)神經(jīng)網(wǎng)絡(luò)模型的定價(jià)準(zhǔn)確度高于B-S期權(quán)定價(jià)模型[9]。國內(nèi)的一些研究如2021年,Liu等人在基于自注意力機(jī)制(Self-Attention Mechanism)的神經(jīng)網(wǎng)絡(luò)中引入了特殊的期權(quán)定價(jià)形式,在如歐式和亞式期權(quán)等的情景下,比之前的方法更準(zhǔn)確地捕獲了期權(quán)時(shí)間價(jià)值的特征[10]。
B-S期權(quán)定價(jià)模型,主要用于為歐式期權(quán)定價(jià)。B-S對市場做出了以下假設(shè):
(1)市場無摩擦,即不存在交易成本與稅收;
(2)市場是完全的,可以無限制賣空,不存在無風(fēng)險(xiǎn)套利機(jī)會;
(3)標(biāo)的資產(chǎn)的價(jià)格運(yùn)動遵循幾何布朗運(yùn)動,即標(biāo)的股票(以下均假設(shè)標(biāo)的資產(chǎn)為股票)的收益率和波動率均為常數(shù);
(4)標(biāo)的資產(chǎn)收益為0,即在到期日內(nèi)標(biāo)的股票無現(xiàn)金收益;
(5)標(biāo)的資產(chǎn)可以任何數(shù)量在任何連續(xù)時(shí)間交易;
(6)在期權(quán)的到期日內(nèi),無風(fēng)險(xiǎn)連續(xù)復(fù)利利率是一個(gè)常數(shù),且任何期限內(nèi)的借貸利率均相等。
基于以上假設(shè),可以得出歐式看漲期權(quán)的表達(dá)式:
式(1)中:C表示歐式看漲期權(quán)的市場價(jià)格,S表示期權(quán)交割價(jià)格,N表示正態(tài)分布的累積概率函數(shù),X表示期權(quán)的行權(quán)價(jià)格,r表示無風(fēng)險(xiǎn)利率,
根據(jù)歐式看漲期權(quán)與看跌期權(quán)之間的關(guān)系,即C+Xe-r(T-t)=P+S,可以得出歐式看跌期權(quán)的定價(jià)公式為:
2.2.1 BP神經(jīng)網(wǎng)絡(luò)
BP神經(jīng)網(wǎng)絡(luò)算法可分為以下六個(gè)步驟:
(1)對網(wǎng)絡(luò)中所有權(quán)值與閾值進(jìn)行隨機(jī)初始化,得到初始化連接權(quán)重;
(2)輸入訓(xùn)練集,從前向后依次計(jì)算;
(3)基于各層輸出結(jié)果,計(jì)算各輸出層的誤差;
(4)對于神經(jīng)網(wǎng)絡(luò)中的每一個(gè)隱含層單元k,計(jì)算其誤差項(xiàng);
(5)通過得到的各層的誤差項(xiàng),對權(quán)重進(jìn)行調(diào)整訓(xùn)練;
(6)對神經(jīng)網(wǎng)絡(luò)訓(xùn)練設(shè)置訓(xùn)練終止條件。若神經(jīng)網(wǎng)絡(luò)訓(xùn)練結(jié)果達(dá)到訓(xùn)練終止條件,則停止訓(xùn)練,若未達(dá)到,則返回第二步,直至滿足終止條件后結(jié)束訓(xùn)練。
2.2.2 長短期記憶神經(jīng)網(wǎng)絡(luò)
LSTM神經(jīng)網(wǎng)絡(luò)通過門機(jī)制,使其可以有選擇性地記憶或遺忘長短距離的信息,以防止信息過載。
(1)遺忘門
遺忘門的輸入由上一時(shí)刻隱藏狀態(tài)和當(dāng)前時(shí)刻的輸入共同決定。
(2)輸入門
輸入門決定t-1時(shí)刻輸入保留至t時(shí)刻單元狀態(tài)的多少;t時(shí)刻記憶單元的單元狀態(tài)更新值由t-1時(shí)刻隱含層的輸出與t時(shí)刻的輸入共同決定;當(dāng)前單元狀態(tài)由t-1時(shí)刻狀態(tài)和t時(shí)刻輸入單元的狀態(tài)共同決定。
(3)輸出門
輸出代表單元狀態(tài)保留至輸出時(shí)的剩余量;t時(shí)刻的輸出門狀態(tài)和單元狀態(tài)共同決定t時(shí)刻的輸出。
3.1.1 樣本產(chǎn)品描述
基于上證50ETF的良好特性,本文實(shí)證研究所選取的樣本主體是上證50ETF認(rèn)購期權(quán)。該期權(quán)的標(biāo)的資產(chǎn)為上證50ETF,即由上證50指數(shù)的50只樣本股票組成的上市交易基金。
3.1.2 樣本數(shù)據(jù)范圍
本文樣本數(shù)據(jù)的時(shí)間跨度為2022年1月1日至2022年12月31日,剔除因節(jié)假日等市場休市情形導(dǎo)致的缺失數(shù)據(jù)后,共得到13771組數(shù)據(jù),數(shù)據(jù)均來自wind數(shù)據(jù)庫。其中,選取2022年1月1日至2022年9月30日,共11657組數(shù)據(jù)作為訓(xùn)練集;選取2022年10月10日至2022年12月31日,共2114組數(shù)據(jù)作為測試集。
3.2.1 輸入輸出變量確定
在確定輸入變量指標(biāo)的過程中,通過對B-S期權(quán)定價(jià)模型的理論研究,本文選取公式中的5個(gè)已知變量,包括期權(quán)從當(dāng)前距離到期日剩余時(shí)間T、標(biāo)的資產(chǎn)的市場價(jià)格S、期權(quán)的行權(quán)價(jià)格X、無風(fēng)險(xiǎn)利率r、標(biāo)的資產(chǎn)價(jià)格的歷史波動率σ(本文在數(shù)據(jù)中用HV表示,以示區(qū)分)。此外,本文還選擇了影響期權(quán)市場價(jià)格的開盤價(jià)open、結(jié)算價(jià)SP、成交量deal、持倉量host這四個(gè)變量,共計(jì)9個(gè)指標(biāo)作為輸入變量,輸出變量為當(dāng)前收盤價(jià)格P。
3.2.2 數(shù)據(jù)預(yù)處理
(1)期權(quán)從當(dāng)前距離到期日剩余時(shí)間T
將剩余時(shí)間T以年為單位進(jìn)行轉(zhuǎn)化。本文選取交易市場的實(shí)際天數(shù),即交易日天數(shù)作為基數(shù)對距到期日剩余時(shí)間T進(jìn)行轉(zhuǎn)化,公式為
(2)數(shù)據(jù)歸一化
本文采取離差標(biāo)準(zhǔn)化的方法對原始數(shù)據(jù)進(jìn)行歸一化,而且未對無風(fēng)險(xiǎn)利率r及歷史波動率HV進(jìn)行歸一化。
本文使用python構(gòu)建神經(jīng)網(wǎng)絡(luò)模型,使用版本為3.8.0。
3.3.1 基于BP神經(jīng)網(wǎng)絡(luò)的期權(quán)價(jià)格預(yù)測模型構(gòu)建
(1)網(wǎng)絡(luò)結(jié)構(gòu)設(shè)計(jì)及參數(shù)選擇
本文構(gòu)建三層BP神經(jīng)網(wǎng)絡(luò),并選取tansig和purlin作為激活函數(shù),選取traingdm函數(shù)作為訓(xùn)練函數(shù),選取均方誤差(MSE)作為損失函數(shù)。
本文在訓(xùn)練時(shí),根據(jù)經(jīng)驗(yàn)法則,首先設(shè)置最大允許誤差為0.01;其次,利用訓(xùn)練樣本對迭代次數(shù)進(jìn)行訓(xùn)練并調(diào)整;最后,將迭代次數(shù)確定為100,學(xué)習(xí)率設(shè)為0.01。
(2)預(yù)測結(jié)果分析
采用BP神經(jīng)網(wǎng)絡(luò)所預(yù)測的期權(quán)價(jià)格如圖1所示:
圖1 BP神經(jīng)網(wǎng)絡(luò)模型期權(quán)價(jià)格預(yù)測結(jié)果
部分預(yù)測數(shù)據(jù)如表1所示:
表1 部分預(yù)測數(shù)據(jù)(歸一化后)
3.3.2 基于LSTM神經(jīng)網(wǎng)絡(luò)的期權(quán)價(jià)格預(yù)測模型構(gòu)建
具體結(jié)構(gòu)設(shè)計(jì)及參數(shù)選擇如下:
(1)結(jié)構(gòu)設(shè)計(jì)及參數(shù)選擇
本文在模型劃分?jǐn)?shù)據(jù)集時(shí),選擇通過日期對其進(jìn)行劃分。其中訓(xùn)練集日期劃分為2022年1月1日至2022年9月30日,共計(jì)11657組數(shù)據(jù);測試集日期劃分為2022年10月10日至2022年12月31日,共計(jì)2114組數(shù)據(jù)。
本文選擇sigmoid函數(shù)作為三個(gè)門的激活函數(shù),使用tanh作為隱含狀態(tài)和輸出狀態(tài)的激活函數(shù)。
在LSTM模型層級結(jié)構(gòu)設(shè)定方面,本文將LSTM層數(shù)設(shè)置為單層。選取均方誤差(MSE)作為損失函數(shù),優(yōu)化器設(shè)置為RMSProp優(yōu)化器。同時(shí)將fit函數(shù)中的epoch項(xiàng)定為30,batch_size項(xiàng)定為512。
(2)預(yù)測結(jié)果分析
采用LSTM神經(jīng)網(wǎng)絡(luò)所預(yù)測的期權(quán)價(jià)格如圖2所示:
圖2 LSTM模型期權(quán)價(jià)格預(yù)測結(jié)果
部分預(yù)測數(shù)據(jù)如表2所示:
表2 部分預(yù)測數(shù)據(jù)(歸一化后)
在上述期權(quán)價(jià)格預(yù)測模型的構(gòu)建及預(yù)測過程中,本文通過計(jì)算各個(gè)模型的誤差及擬合情況對各個(gè)模型的預(yù)測結(jié)果進(jìn)行對比分析。這里選取三個(gè)評價(jià)指標(biāo)作為模型評價(jià)指標(biāo),分別為均方誤差、平均絕對誤差及決定系數(shù),綜合使用多因素對模型優(yōu)劣性進(jìn)行評價(jià),可以得出更為客觀的結(jié)論。
(1)均方誤差(MSE,Mean Squared Error)
MSE是指模型預(yù)測值與真實(shí)值之間差額的期望值。其表達(dá)式如下:
(2)平均絕對誤差(MAE,Mean Absolute Error)
MAE是指模型預(yù)測值與真實(shí)值之間距離絕對值的平均值。其表達(dá)式如下:
(3)R2(決定系數(shù))
R2是指回歸平方和占總平方和的比例。R2越接近1,表明回歸平方和占總平方和的比例越大,模型真實(shí)值與預(yù)測值越接近,神經(jīng)網(wǎng)絡(luò)模型的擬合程度就越好。其表達(dá)式如下:
使用MSE、MAE、R2三類誤差評價(jià)指標(biāo)對兩個(gè)模型結(jié)果進(jìn)行對比分析,如表3所示:
表3 神經(jīng)網(wǎng)絡(luò)模型預(yù)測結(jié)果對比
由表3可知,LSTM模型預(yù)測的精確度高于BP神經(jīng)網(wǎng)絡(luò)模型。
結(jié)合前述分析我們可以得出以下結(jié)論:相較于BP神經(jīng)網(wǎng)絡(luò)模型,LSTM神經(jīng)網(wǎng)絡(luò)模型具有更高水平的非線性組合運(yùn)算能力,對于上證50ETF期權(quán)這一實(shí)證對象,顯示出更好的擬合高維性金融數(shù)據(jù)的能力,其模型預(yù)測結(jié)果的精度較高。
本文分別利用BP神經(jīng)網(wǎng)絡(luò)和LSTM神經(jīng)網(wǎng)絡(luò)理論,選取上證50ETF指數(shù)的期權(quán)作為研究樣本,建立期權(quán)價(jià)格預(yù)測模型,得出以下結(jié)論:
作為基于數(shù)據(jù)驅(qū)動的期權(quán)價(jià)格預(yù)測模型,LSTM神經(jīng)網(wǎng)絡(luò)預(yù)測的期權(quán)價(jià)格的精度高于BP神經(jīng)網(wǎng)絡(luò)。在三種模型評價(jià)指標(biāo)下,LSTM神經(jīng)網(wǎng)絡(luò)在價(jià)格預(yù)測誤差方面明顯優(yōu)于BP神經(jīng)網(wǎng)絡(luò)。LSTM神經(jīng)網(wǎng)絡(luò)具有獨(dú)特的結(jié)構(gòu)和較高的非線性計(jì)算能力,這使得它在有大量數(shù)據(jù)時(shí)能夠更準(zhǔn)確地預(yù)測期權(quán)價(jià)格。
本文對基于深度學(xué)習(xí)的期權(quán)價(jià)格預(yù)測進(jìn)行探索,并取得了一些成果。但仍有一些地方存在不足之處,今后需要進(jìn)一步改進(jìn):
(1)除本文選取的9個(gè)輸入變量外,依舊存在諸多其他可能影響期權(quán)價(jià)格的因素,在后續(xù)的研究中可以進(jìn)一步探索,從而使得期權(quán)價(jià)格預(yù)測模型的普遍性有所提升。
(2)文中選取的9個(gè)指標(biāo)中,各個(gè)指標(biāo)之間的相關(guān)性并未解決,這種相關(guān)性對于期權(quán)價(jià)格預(yù)測模型的影響也未可知。
(3)本文基于Black-Scholes期權(quán)所確定的輸入變量之一選取了歷史波動率,在相關(guān)文獻(xiàn)中顯示,若選擇隱含波動率代替歷史波動率,作為輸入變量對期權(quán)價(jià)格預(yù)測模型進(jìn)行訓(xùn)練,模型誤差可能會減小。