董 艷
(陜西鐵路工程職業(yè)技術(shù)學(xué)院基礎(chǔ)部,渭南 714000)
在眾多行業(yè)里,不間斷地連續(xù)營業(yè)是不現(xiàn)實(shí)的,金融業(yè)亦是如此,從而許多金融數(shù)據(jù),常常出現(xiàn)數(shù)據(jù)缺失現(xiàn)象.圖1 給出了2018 年9 月20 日至9 月27 日的歐元兌美元匯率的開盤價,由于周末不開盤,出現(xiàn)了48 小時的數(shù)據(jù)缺失.符合此情形的案例還有很多,國內(nèi)上交所和深交所各種股票和指數(shù)均在周末和節(jié)假日閉盤.
圖1 2018 年9 月20 日至9 月27 日的歐元兌美元匯率
數(shù)據(jù)的缺失不但會影響投資者對市場的判斷,還給金融序列的預(yù)測增加了難度.雖然一級市場上的金融活動在閉盤期間已經(jīng)停止,由于次級市場受監(jiān)管的程度較小,其金融活動仍持續(xù)進(jìn)行,且此部分?jǐn)?shù)據(jù)并不能被有效搜集.文獻(xiàn)[1,2]已經(jīng)證實(shí)忽略缺失值、僅采用營業(yè)時間獲取的金融數(shù)據(jù)進(jìn)行估計常常會低估波動率.這提示我們必須采用某些缺失值的替補(bǔ)方案進(jìn)行插值.
當(dāng)前可用于缺失數(shù)據(jù)替補(bǔ)的方法有很多,總體來看,主要包括均值替代法[3-5]、聚類分析法[6,7]、關(guān)聯(lián)規(guī)則法[8,9]、閥值填補(bǔ)法[10]、回歸填補(bǔ)法[11]以及多重插補(bǔ)方法[12].但綜合分析這些方法,仍然存在以下幾個問題:第一,大多數(shù)方法,沒能考量填補(bǔ)數(shù)據(jù)對總體分布的影響,如均值替代法和基于線性回歸的填補(bǔ)方法;第二,有些方法對基于特定的分布的樣本數(shù)據(jù)有效,將其推廣至?xí)r間序列是困難的,例如聚類分析法和關(guān)聯(lián)規(guī)則法.
目前,基于貝葉斯的馬爾科夫鏈蒙特卡羅(MCMC)抽樣方法的時間序列研究是統(tǒng)計學(xué)的熱點(diǎn)之一.文獻(xiàn)[13]利用二項算子并結(jié)合MCMC 模擬研究了一種推廣的ARMA 過程.文獻(xiàn)[14]采用數(shù)據(jù)擴(kuò)充法、切片抽樣法以及MCMC 方法,給出了具有穩(wěn)定分布噪聲的ARMA 模型更為簡潔、有效的貝葉斯建模方法.文獻(xiàn)[15]則用MCMC 模型選擇考察了ARMA 模型的階數(shù)問題.在工程實(shí)踐方面,文獻(xiàn)[16]通過收集1994 年第1 季度至2009 年2 月10 日的國際原油Brent 價格的時間序列數(shù)據(jù),并對其建立了ARIMA(p,d,q)模型.在ARMA 模型參數(shù)估計上,文獻(xiàn)[16]在Winbugs 軟件平臺上運(yùn)用MCMC 方法進(jìn)行了參數(shù)估值運(yùn)算,得到Brent 原油季度價格ARIMA(1,1,1)模型的模擬結(jié)果.
基于以上分析,本文提出一種潛變量Metropolis-Hastings(M-H)抽樣方法、在缺失數(shù)據(jù)情形下,研究ARMA 匯率模型的參數(shù)估計問題,該方法綜合考量了填補(bǔ)數(shù)據(jù)對序列分布、自相關(guān)性的影響.模擬結(jié)果表明:相比于傳統(tǒng)Gibbs 方法,潛變量M-H 方法產(chǎn)生的抽樣序列不存在波動聚集現(xiàn)象.
本文考察掛鉤于匯率的觸發(fā)式理財產(chǎn)品定價問題.假設(shè)匯率過程xt遵循
其中r0表示匯率長期水平,匯率的對數(shù)序列yt具有均值為0,且有ARMA 模型形式
這里m0=m2-m1, m2>m1.考慮時間序列模型的穩(wěn)定性,假設(shè)|φ|<1,并且模型的先驗分布設(shè)置如下:
1) 假設(shè)自回歸系數(shù)φi(i=1,2,··· ,p)和滑動平均系數(shù)θi(i=1,2,··· ,q)服從(-1,1)上的均勻分布,那么它們的密度函數(shù)為
2) 假設(shè)隨機(jī)誤差項的方差σ2~I(xiàn)GA(α,β),即σ2服從參數(shù)為α和β的逆伽馬分布,其密度函數(shù)為
同時,為了方便論述定義隨機(jī)誤差項
其中
考慮到當(dāng)t=m1+1,m1+2,··· ,m2時,yt為缺失值,從而在公式(7)—(8)用et和εt區(qū)別對待隨機(jī)誤差項.這也意味著中間m0個缺失值ym1+1,··· ,ym2可以采用下面的公式插補(bǔ)
本節(jié)在構(gòu)造一種潛變量數(shù)據(jù)插補(bǔ)方法之后,分析相應(yīng)的共軛后驗分布,以便之后進(jìn)行M-H 抽樣.注意插補(bǔ)數(shù)據(jù)的目的并不是預(yù)測單個缺失值,而是預(yù)測缺失數(shù)據(jù)所服從的分布.通過數(shù)據(jù)的插補(bǔ),既要克服數(shù)據(jù)缺失帶來的不便,同時又不能改變原有的數(shù)據(jù)分布.據(jù)此,本文依據(jù)文獻(xiàn)[17]構(gòu)造潛變模型,采用潛變量方法彌補(bǔ)缺失部分對應(yīng)的隨機(jī)誤差項
則全數(shù)據(jù)似然函數(shù)為
它滿足
其中
接下來,構(gòu)造參數(shù)φ, θ, σ2的后驗分布,并根據(jù)此后驗分布獲取參數(shù)的Gibbs 抽樣序列.已知時間序列{y-p+1,··· ,y-1,y0,y1,y2,··· ,yn}和各個參數(shù)的先驗分布后,由貝葉斯定理可得參數(shù)的后驗分布為
其中ηk表示參數(shù)向量η={φ,θ,σ2}中的任一參數(shù).下面不加證明地給出潛變量情形下的幾個有關(guān)后驗分布的結(jié)果,其證明過程可以類推不附加潛變量情形的證明[15,17],這里不再贅述.
推論1 設(shè)φ-i表示自回歸系數(shù)向量φ除去φi以外的部分,i=1,2,··· ,p,則其后驗條件分布滿足
其中
推論2 在假設(shè)(5)下,白噪聲的方差σ2的先驗分布共軛,且
在接下來的章節(jié)中,將采用基于潛變量M-H 抽樣的MCMC 算法研究匯率序列的參數(shù)估計.
考察Markov 鏈抽樣序列的平穩(wěn)性,如果具有轉(zhuǎn)移矩陣P和分布π(φi)的Markov 鏈對所有的狀態(tài)θi, θj滿足下面的等式
上式稱為細(xì)致平衡方程,此時該馬氏鏈的分布π(x)是平穩(wěn)的.
那么
本節(jié)采用獨(dú)立Markov 鏈,其轉(zhuǎn)移概率與當(dāng)前狀態(tài)無關(guān),則
從而自回歸系數(shù)的MCMC 采樣方法分為以下幾個步驟:
則公式(2)可以寫成
定義序列
從而,公式(15)可以寫成向量形式
獲取先驗分布為IG(α,β)的參數(shù)的初始值
其中ei,-1= 1/e, i= 1,2,··· ,m1,m2,m2+ 1,··· ,n, εi,-1= 1/εi, i=m1,m1+1,··· ,m2.本節(jié)以零均值的ARMA(p,q)為例,給出基于M-H 抽樣的潛變量MCMC 模擬算法的步驟:
步驟1 采用OLS 估計獲取自回歸系數(shù)、滑動平均系數(shù)以及隨機(jī)誤差項的初值
同時,獲取一次隨機(jī)誤差項
在金融市場上存在許多理財產(chǎn)品,其中就包括觸發(fā)式理財產(chǎn)品,例如見表1,其到期日的收益可以歸結(jié)為如下公式
表1 掛鉤于歐元兌美元匯率的觸發(fā)式理財產(chǎn)品(起購金額:50000 元)
其中隨機(jī)過程{xt,t ≥0}表示歐元兌美元的匯率,其隨機(jī)結(jié)構(gòu)見公式(1).
為了實(shí)現(xiàn)對理財產(chǎn)品進(jìn)行價值分析,采用潛變量M-H 抽樣方法獲取匯率模型(1)的參數(shù)之后,對匯率的軌跡進(jìn)行模擬.假定當(dāng)前時刻為t時刻,理財產(chǎn)品在T時刻,將觸發(fā)式理財產(chǎn)品剩余存續(xù)期(t,T]進(jìn)行劃分,即
其中dt表示1 天,與圖1 中的時間間隔相同,并假設(shè)匯率在理財產(chǎn)品存續(xù)期內(nèi)的預(yù)測軌跡為
其中下標(biāo)j表示{xj(ti), i= 1,2,··· ,n}對匯率的第j條軌跡模擬,從而觸發(fā)式理財產(chǎn)品在到期日的第j次模擬結(jié)果表示為
依據(jù)風(fēng)險中性測度定價方法,收益為(18)的觸發(fā)式理財產(chǎn)品在當(dāng)前時刻t的價值滿足
其中r表示銀行的無風(fēng)險利率,E[·|Ft]表示關(guān)于當(dāng)前時刻σ-代數(shù)的條件期望.注意t0=t, tn=T,從而當(dāng)M足夠大時,采用矩估計方法可得觸發(fā)式理財產(chǎn)品的一個估計
為了考察缺失序列MCMC 估計方法的有效性,本節(jié)考察ARMA 序列,將MCMC 方法和傳統(tǒng)的OLS 方法進(jìn)行比對分析.實(shí)驗環(huán)境為Windows XP 系統(tǒng),Intel(R)Core(TM)i7-6700K @4.00GHZ,內(nèi)存16.0GB.本節(jié)的模擬計算采用編程軟件R3.4.2.
設(shè)定p=q= 1, φ1= 0.8, θ1= 0.5, σ= 0.1, m1= 100, m2= 150, n= 500,在樣本數(shù)據(jù)實(shí)驗中學(xué)者們常常采用Gibbs 抽樣完成MCMC 模擬.遺憾的是,金融市場中的序列(例如匯率、股票以及指數(shù)的歷史數(shù)據(jù))往往存在異方差效應(yīng),Gibbs 抽樣依據(jù)這些歷史數(shù)據(jù)的后驗分布進(jìn)行采樣,所獲取的模擬序列也通常具備波動率聚集現(xiàn)象,這違背了Gibbs 抽樣算法關(guān)于抽樣序列的平穩(wěn)性假設(shè).為了說明這一問題,我們考察ARMA(1,1)序列,設(shè)置模型常數(shù)項c= 0,其R 語言模擬的AR(1)序列見圖2.將模擬結(jié)果的中間去除視為缺失數(shù)據(jù),其模擬結(jié)果見圖3.
圖2 ARMA(1,1)序列
圖3 數(shù)據(jù)缺失情形下ARMA(1,1)序列
考察傳統(tǒng)的Gibbs 抽樣方法.自回歸系數(shù)φ1的Gibbs 抽樣序列見圖4,可以看出抽樣序列出現(xiàn)了波動聚集現(xiàn)象.由于MCMC 法要求抽樣序列平穩(wěn),這顯然與MCMC 方法的基本原理不符.
圖4 自回歸系數(shù)φ1 的Gibbs 抽樣序列
接下來,考察基于潛變量M-H 抽樣的MCMC 算法的模擬效果.注意由于傳統(tǒng)的Gibbs 抽樣在模擬ARMA 序列時產(chǎn)生了異方差效應(yīng),這不符合MCMC 算法的模擬條件,這里主要模擬潛變量M-H 方法的抽樣參數(shù)序列是平穩(wěn)的,這意味著針對ARMA 序列潛變量M-H 方法有更好的適應(yīng)性.同時也比對模擬潛變量M-H 方法比傳統(tǒng)的OLS 方法精度有所提高.
采用傳統(tǒng)的OLS 方法、Gibbs 抽樣方法以及M-H 抽樣方法進(jìn)行AR MA(1,1)序列的參數(shù)估計,結(jié)果見表2.在M-H 抽樣運(yùn)算中,首先對每個參數(shù)進(jìn)行2500 次的預(yù)迭代消除初值對模擬結(jié)果的影響.從圖5、圖6 及圖7 可以看出M-H 抽樣獲取的Markov 鏈趨于平穩(wěn),說明M-H 抽樣估計的結(jié)果收斂.
圖7 σ 的M-H 抽樣序列
圖6 滑動平均系數(shù)θ1 的M-H 抽樣序列
表2 模擬參數(shù)設(shè)定及估計效果
圖5 自回歸系數(shù)φ1 的M-H 抽樣序列
之后再進(jìn)行2500 次迭代,結(jié)果見表2,可以看出基于潛變量M-H 抽樣的MCMC 方法有更好的模擬結(jié)果.連續(xù)模擬10000 個輪次,發(fā)現(xiàn):
1) 就自回歸系數(shù)φ1而言,潛變量M-H 抽樣方法優(yōu)于OLS 方法的次數(shù)為9903;
2) 就滑動平均系數(shù)θ1而言,潛變量M-H 抽樣方法優(yōu)于OLS 方法的次數(shù)為9647;
3) 就隨機(jī)誤差項的標(biāo)準(zhǔn)差σ而言,潛變量M-H 抽樣方法優(yōu)于OLS 方法的次數(shù)為9501.
在之后的部分,將利用MCMC 方法獲取的匯率序列模型,研究觸發(fā)式理財產(chǎn)品定價問題.
本節(jié)將嘗試分析表2 中觸發(fā)式理財產(chǎn)品的價值,由于它們均掛鉤于歐元兌美元的匯率,從而在新浪網(wǎng)財經(jīng)板塊收集了該匯率2018 年9 月20 日至9 月27 日的數(shù)據(jù),時間間隔為4 小時,受開盤制度的影響周末的匯率出現(xiàn)了數(shù)據(jù)缺失,見圖1.
根據(jù)Eacf 方法、AIC 準(zhǔn)則和BIC 準(zhǔn)則,確定匯率模型為AR(1),再依據(jù)M-H 抽樣方法,模型的參數(shù)為
從而匯率模型(1)可以確定為
根據(jù)2018 年9 月20 日的銀行利率信息,選取無風(fēng)險利率r=0.0435, M=300000,并利用公式(19),獲取三款來自農(nóng)業(yè)銀行的觸發(fā)式理財產(chǎn)品的估計價格,其模擬價格情況見表1 最后一列.