摘要:基于溫度指數(shù)的天氣衍生品定價(jià)研究是一個(gè)熱點(diǎn).擬應(yīng)用物理信息神經(jīng)網(wǎng)絡(luò)(PINNs)以求解基于O-U過(guò)程的天氣衍生品定價(jià)偏微分方程,對(duì)HDD看跌期權(quán)進(jìn)行了數(shù)值模擬.改進(jìn)了PINNs算法的采樣點(diǎn),調(diào)整了梯度下降算法、學(xué)習(xí)率、迭代次數(shù)、權(quán)重分配等以加快收斂速度和提升擬合效果.通過(guò)與MCMC仿真模擬和單側(cè)有限差分求解方法對(duì)比發(fā)現(xiàn)基于PINNs的方法具有相當(dāng)?shù)木群陀?jì)算速度,證明了PINNs算法求解天氣衍生品定價(jià)偏微分方程的可行性.
關(guān)鍵詞:天氣衍生品定價(jià);O-U過(guò)程;深度學(xué)習(xí);PINNs神經(jīng)網(wǎng)絡(luò)
中圖分類號(hào):F831.5;O244;O242.2 文獻(xiàn)標(biāo)志碼:A
Research on Pricing of Weather Derivatives Based
on Physical Information Neural Networks
XU Xiao-yun, LI Peng
(School of Mathematics and Statistics,
North China University of Water Resources and Electric Power, Zhengzhou 450046, China)
Abstract:The research on the pricing of weather derivatives based on temperature index is a hot topic. In this paper, physical information neural networks (PINNs) are applied to solve the partial differential equation of weather derivatives pricing based on O-U process, and HDD put options are numerically simulated. We improve the sampling points of the PINNs algorithm, and adjust the gradient descent algorithm, learning rate, iteration times, weight distribution, etc. to speed up the convergence speed and improve the fitting effect. Finally, by comparing with MCMC simulation and one-sided finite difference method, it is found that the method based on PINNs has considerable accuracy and calculation speed, which proves the feasibility of PINNs algorithm to solve the partial differential equation of weather derivatives pricing.
Key words:weather derivatives pricing; O-U process; deep learning; PINNs neural network
0 引言
天氣衍生品市場(chǎng)的經(jīng)典模型有基于O-U過(guò)程的溫度模型[1].例如,Harris[2]建立了基于累積HDD和溫度的偏微分方程(PDE).Shi[3]提出了風(fēng)險(xiǎn)中性定價(jià)模型.Edwin 等[4]通過(guò)引入與氣溫不完全相關(guān)的套期保值工具,導(dǎo)出了天氣期權(quán)的PDE.關(guān)于求解該類PDE,目前的數(shù)值算法有中心差分方法[5-6]和半拉格朗日方法[7].考慮到天氣衍生品定價(jià)公式中的對(duì)流主導(dǎo)性,Li[8]運(yùn)用單側(cè)有限差分方法進(jìn)行求解.Li[9]建立了關(guān)于溫度導(dǎo)數(shù)的單邊Crank-Nicolson格式,分別求解無(wú)擴(kuò)散和有跳躍擴(kuò)散的PDE和PIDE.
與傳統(tǒng)的求解偏微分方程的數(shù)值方法相比,基于深度學(xué)習(xí)的數(shù)值偏微分方程計(jì)算方法是一種無(wú)網(wǎng)格方法,具有克服維數(shù)災(zāi)難的潛力.如Lu等[10]提出的物理信息神經(jīng)網(wǎng)絡(luò)(PINNs)方法在求解偏微分方程(如Navier-Stokes方程、積分微分方程、分?jǐn)?shù)階微分方程和隨機(jī)方程)中表現(xiàn)得相當(dāng)優(yōu)異.
基于O-U過(guò)程的溫度模型,本文利用PINNs求解天氣衍生品價(jià)格的偏微分方程系統(tǒng),利用方程本身、初始條件和邊界條件構(gòu)造機(jī)器學(xué)習(xí)的加權(quán)損失函數(shù),再通過(guò)梯度下降算法進(jìn)行優(yōu)化,改進(jìn)PINNs算法采樣點(diǎn)方案,優(yōu)化物理信息損失權(quán)重組合,添加正則化處理來(lái)加快收斂速度,提高模型的擬合效果.
1 天氣衍生品定價(jià)系統(tǒng)
天氣衍生品通常被構(gòu)建為基于不同基礎(chǔ)天氣指數(shù)的掉期、期貨和期權(quán).HDD是一天的平均溫度低于基溫的度數(shù),其中基溫取xbase=18 ℃.芝加哥商品交易所的HDD期權(quán)就是基于一段時(shí)間內(nèi)每日HDD的累計(jì)總和.
基于取暖指數(shù)(HDD)的累計(jì)度日指數(shù)yHt為
基于Ornstein-Uhlenbeck過(guò)程來(lái)對(duì)溫度進(jìn)行模擬,得到如下方程:
其中:xmt是溫度變化過(guò)程的長(zhǎng)期均值;α是均值回復(fù)速率;σt是波動(dòng)率;dWt是布朗增量.時(shí)間t處的平均溫度服從
A、B、C和?通過(guò)歷史DAT數(shù)據(jù)進(jìn)行擬合.
在風(fēng)險(xiǎn)中性度量Q(以市場(chǎng)價(jià)格風(fēng)險(xiǎn)為λ)下,服從O-U過(guò)程的氣溫指數(shù)xt和度日指數(shù)yt滿足以下形式:
基于Feynman-Kac[5-6]公式,可以得到以下天氣衍生品V(xt,yt,t)的定價(jià)偏微分方程:
其中:
基于Ornstein-Uhlenbeck過(guò)程的HDD期權(quán)價(jià)格PDE實(shí)際上是一個(gè)對(duì)流主導(dǎo)的PDE,擴(kuò)散效應(yīng)比對(duì)流效應(yīng)小得多.為了解決這個(gè)問(wèn)題,將引入的歐式HDD看跌期權(quán)的邊界和初始條件指定如下:
2 PINNs算法應(yīng)用
2.1 PINNs算法
物理信息神經(jīng)網(wǎng)絡(luò)(PINNs)將偏微分方程本身作為物理信息嵌入到深度神經(jīng)網(wǎng)絡(luò)當(dāng)中,通過(guò)自動(dòng)微分構(gòu)造方程和邊界以及初始條件的損失函數(shù),加權(quán)后作為統(tǒng)一的機(jī)器學(xué)習(xí)損失函數(shù),再進(jìn)行神經(jīng)網(wǎng)絡(luò)深度學(xué)習(xí),通過(guò)不斷地優(yōu)化神經(jīng)網(wǎng)絡(luò)中的權(quán)重來(lái)最小化損失函數(shù),最后由神經(jīng)網(wǎng)絡(luò)輸出所求的偏微分方程的數(shù)值解.PINNs算法流程如圖1所示.
通過(guò)PINNs獲得偏微分方程的近似解的關(guān)鍵步驟就是約束神經(jīng)網(wǎng)絡(luò)使偏微分方程殘差最小.與傳統(tǒng)的基于網(wǎng)格的方法(如有限差分法和有限元方法)相比,深度學(xué)習(xí)是一種利用自動(dòng)微分的無(wú)網(wǎng)格方法,并且可以打破維數(shù)詛咒.同時(shí)與傳統(tǒng)的數(shù)值方法不同,PINNs不能保證解的唯一性,因?yàn)镻INNs解是通過(guò)求解非凸優(yōu)化問(wèn)題得到的,而非凸優(yōu)化問(wèn)題一般不存在唯一解.
2.2 PINNs算法求解定價(jià)方程
用于求解基于O-U過(guò)程的溫度模型的偏微分方程定價(jià)系統(tǒng)的PINNs算法的主要步驟如下:
(1)構(gòu)造神經(jīng)網(wǎng)絡(luò)
應(yīng)用前饋神經(jīng)網(wǎng)絡(luò)Nx,θ,輸入?yún)?shù)θ=Wl,bl,神經(jīng)網(wǎng)絡(luò)函數(shù)為
其中:m為l層神經(jīng)網(wǎng)絡(luò)節(jié)點(diǎn)數(shù);n為l+1層神經(jīng)網(wǎng)絡(luò)節(jié)點(diǎn)數(shù);w為神經(jīng)網(wǎng)絡(luò)權(quán)重;b為偏置向量;f為激活函數(shù).
(2)選擇訓(xùn)練數(shù)據(jù)
指定Ti,Tj和Tk以滿足PDE方程和邊界以及初始條件,這里Ti,Tj和Tk分別是方程定義域內(nèi)和定義域邊界上的點(diǎn).
(3)構(gòu)建基于天氣衍生品定價(jià)方程的神經(jīng)網(wǎng)絡(luò)模型
其中x為方程的幾何空間向量.神經(jīng)網(wǎng)絡(luò)的輸出為所求的偏微分方程的解.令Nx=Vx,通過(guò)在神經(jīng)網(wǎng)絡(luò)中嵌入自動(dòng)微分、偏微分方程的殘差函數(shù)形式為
將方程的邊界條件值 Vbxjb和初始條件值Vcxjc代入式(11)和(12)得到神經(jīng)網(wǎng)絡(luò)損失函數(shù)為
(4)訓(xùn)練神經(jīng)網(wǎng)絡(luò)
訓(xùn)練神經(jīng)網(wǎng)絡(luò),通過(guò)調(diào)整神經(jīng)網(wǎng)絡(luò)的權(quán)重w和基于梯度的優(yōu)化器來(lái)最小化損失函數(shù).當(dāng)floss趨近于0時(shí),Nx趨近于Vx.在訓(xùn)練過(guò)程中設(shè)置合適的ε,當(dāng)floss小于ε時(shí)停止訓(xùn)練,輸出結(jié)果.
3 算法實(shí)現(xiàn)
3.1 初始參數(shù)確定
衍生品定價(jià)偏微分方程中的參數(shù)如表1所列.A、B、C通過(guò)斯德哥爾摩地區(qū)的溫度數(shù)據(jù)進(jìn)行擬合,均值回復(fù)速度α用Moreno[11]和Bhowan[12]的鞅函數(shù)估計(jì)得到.由于同一地區(qū)的氣溫?cái)?shù)據(jù)較為穩(wěn)定,波動(dòng)率σ采用了斯德哥爾摩地區(qū)2001年2月的數(shù)據(jù)來(lái)估計(jì)得到.
接下來(lái)使用Dirichlet邊界和Operator邊界來(lái)設(shè)置天氣衍生品價(jià)格PDE系統(tǒng)的邊界條件和初始條件,選取雙曲正切函數(shù)作為神經(jīng)網(wǎng)絡(luò)的激活函數(shù),在Python中使用DEEPXDE軟件包內(nèi)置模塊設(shè)置包括計(jì)算域(幾何和時(shí)間)、PDE方程、邊界/初始條件、損失函數(shù)、訓(xùn)練數(shù)據(jù)、神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)和訓(xùn)練超參數(shù)來(lái)實(shí)現(xiàn)HDD看跌期權(quán)定價(jià)模擬.訓(xùn)練中選擇前饋神經(jīng)網(wǎng)絡(luò)來(lái)訓(xùn)練模型,經(jīng)過(guò)調(diào)試最終確定網(wǎng)絡(luò)的深度為3,寬度為50,激活函數(shù)為雙曲正切(Tanh).
3.2 超參數(shù)優(yōu)化
期權(quán)合約期為10天,T=10,氣溫指數(shù)x和度日指數(shù)y在表1給出.訓(xùn)練數(shù)據(jù)通過(guò)給定采樣點(diǎn)數(shù)目在定義域內(nèi)、邊界條件上、初始條件上隨機(jī)取樣,PINNs采樣點(diǎn)可視化圖如圖2所示.
基于O-U過(guò)程的天氣衍生品定價(jià)方程是具有2個(gè)空間維度、對(duì)流占優(yōu)的擴(kuò)散方程,并且方程對(duì)亞式期權(quán)定價(jià).在只給出定解條件(初值條件和邊界條件)前提下,PINNs解變得更加復(fù)雜、混沌、不斷震蕩,PINNs在定義域內(nèi)隨機(jī)取點(diǎn)很難訓(xùn)練得到好的結(jié)果.同時(shí)由于邊界和初始條件處有方程的限制,度日指數(shù)y值可以正常取點(diǎn),但在定義域內(nèi)部隨機(jī)取點(diǎn)時(shí)神經(jīng)網(wǎng)絡(luò)忽略了氣溫指數(shù)x和度日指數(shù)y的關(guān)系,為了精確采樣所需的點(diǎn)數(shù),需要改進(jìn)采樣點(diǎn)方案.
在模型中加入氣溫指數(shù)x和度日指數(shù)y關(guān)系的限制條件,也就是根據(jù)公式(1)在定義域內(nèi)錨定訓(xùn)練點(diǎn),添加錨點(diǎn)數(shù)據(jù),調(diào)整采樣點(diǎn)分布.添加的錨點(diǎn)數(shù)據(jù)如圖3所示.
由于天氣期權(quán)數(shù)據(jù)值范圍較大,為了增強(qiáng)神經(jīng)網(wǎng)絡(luò)的抗擾動(dòng)能力,接下來(lái)考慮通過(guò)對(duì)神經(jīng)網(wǎng)絡(luò)進(jìn)行正則化處理來(lái)防止模型過(guò)擬合,同時(shí)設(shè)置偏微分方程、邊界條件、初始條件、正則化項(xiàng)的損失權(quán)重來(lái)得到更好的模型擬合效果.
正則化后的神經(jīng)網(wǎng)絡(luò)損失函數(shù)為
其中,Pf、Pb、Pc和Pl分別為偏微分方程、邊界條件、初始條件和正則化項(xiàng)的損失權(quán)重.
優(yōu)化算法、學(xué)習(xí)率、網(wǎng)格點(diǎn)選取、迭代次數(shù)、權(quán)重分配的調(diào)整選取一部分展示如表2所列.
天氣衍生品定價(jià)偏微分方程沒(méi)有解析解,σSSE是PINNs訓(xùn)練得到的數(shù)值解與Li[8]運(yùn)用單側(cè)有限差分方法求得數(shù)值解的均方誤差值.
損失權(quán)重分配a, b為PDE本身、式(8)的三個(gè)邊界條件、式(9)的初始條件以及正則化項(xiàng).
a=(1,1,1,1,1,1);
b=(1e-6, 1e-4,1e-4,1e-4,1e-7,1e-3).
由于L-BFGS優(yōu)化算法在訓(xùn)練過(guò)程中立即收斂導(dǎo)致訓(xùn)練結(jié)果不準(zhǔn)確,最終決定使用Adam優(yōu)化算法進(jìn)行6 000次迭代,學(xué)習(xí)率為0.001,對(duì)執(zhí)行價(jià)格K=100的HDD看跌期權(quán)進(jìn)行定價(jià).Adam的訓(xùn)練誤差為2.82×10-4,訓(xùn)練時(shí)間為376494秒,得到平均殘差值為0.59,均方誤差值為1.23.訓(xùn)練結(jié)果如圖4所示.在圖4中,左邊繪制了當(dāng)t=T時(shí)的數(shù)值解,右邊是模型的訓(xùn)練歷史.
對(duì)于HDD看跌期權(quán),斯德哥爾摩地區(qū)的氣溫條件下期權(quán)價(jià)格隨著溫度的升高而增加.
3.3 數(shù)值結(jié)果對(duì)比
由于MCMC仿真可以逼近連續(xù)采樣溫度的數(shù)值解,MCMC仿真和Li[8]單側(cè)有限差分方法和訓(xùn)練結(jié)果對(duì)比如圖5所示.可以看出同數(shù)值方法
相比,PINNs可以得到相當(dāng)精確的結(jié)果,證明了PINNs方法求解天氣衍生品定價(jià)偏微分方程的可行性.
4 結(jié)語(yǔ)
本文將PINNs推廣到求解天氣衍生品定價(jià)偏微分方程,對(duì)HDD看跌期權(quán)進(jìn)行了定價(jià)模擬,比較了PINNs數(shù)值解與單側(cè)有限差分方法數(shù)值解的均方誤差.與經(jīng)典的MCMC模擬方法對(duì)比,本文的方法基于PINNs算法求解復(fù)雜的天氣衍生品定價(jià)方程,計(jì)算速度快、精確度高,為天氣衍生品的偏微分定價(jià)方程求解提供了新的技術(shù)途徑.
參考文獻(xiàn):
[1] ALATON P,DJEHICHE B,STILLBERGER D.On modelling and pricing weather derivatives[J].Applied Mathematical Finance,2002,9(1):1-20.
[2] HARRIS C.The valuation of weather derivatives using partial differential equations[D].Redding:University of Reading,2003.
[3] SHI Y Y.Weather Derivatives and Seasonal Forecasts [J].Korean Journal of Financial Studies,2004,33(4):213-246.
[4] BRONI M E.Numerical Solution of Weather Derivatives and other Incomplete Market Problems [D].Manchester:University of Manchester,2012.
[5] HAMISULTANE H .Extracting Information from the Market to Price the Weather Derivatives[EB/OL](2007-11-14)[2022-06-01].http://halsha.archives ouvertes.fr/halshs-00079192,2006.
[6] HAMISULTANE H.Which Method for Pricing Weather Derivatives ?[EB/OL](2009-01-25)[2022-06-01].http://shs.hal.science/halshs-00355856,2008.
[7] TANG W G,CHANG S H.Semi-Lagrangian method for the weather options of mean-reverting Brownian motion with jump diffusion[J].Computers and Mathematics with Applications,2016,71(5):1045-1058.
[8] LI P.Pricing weather derivatives with partial diferential equations of the Ornstein–Uhlenbeck process[J].Computers and Mathematics with Applications,2018,75(3):1044-1059.
[9] LI P.The Valuation of Weather Derivatives Using One Sided Crank–Nicolson Schemes [J].Computational Economics,2021,58:825-847.
[10] LU Lu,MENG Xuhui,MAO Zhiping,et al.DeepXDE: A deep learning library for solving differential equations[J].SIAM Review,2021,63(1): 208-228.
[11] MORENO M.Riding the temp[J].Futures amp; Options World,2000(1):1-11.
[12] BHOWAN A.Temperature derivatives School of Computational and Applied Mathematics[D].Johannesburg:University of Witwatersrand,2003.
[責(zé)任編輯:趙慧霞]
蘭州文理學(xué)院學(xué)報(bào)(自然科學(xué)版)2023年3期