亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        集成學(xué)習(xí)方法的已實(shí)現(xiàn)波動(dòng)率預(yù)測(cè)和偏度信息含量研究

        2022-05-18 06:27:42王云潤(rùn)喬高秀
        關(guān)鍵詞:方法模型

        王云潤(rùn),喬高秀

        (西南交通大學(xué) 數(shù)學(xué)學(xué)院,成都 611756)

        0 引言

        金融資產(chǎn)的波動(dòng)率是衡量市場(chǎng)風(fēng)險(xiǎn)的重要指標(biāo),在資產(chǎn)的定價(jià)和分配、風(fēng)險(xiǎn)管理和貨幣政策制定方面都起著重要作用。因此,對(duì)波動(dòng)率的預(yù)測(cè)在金融計(jì)量學(xué)研究中受到了極大關(guān)注。Bollerslev[1]提出了廣義自回歸條件異方差(GARCH)模型,該模型能捕捉到波動(dòng)率聚集效應(yīng)等,但其估計(jì)大多基于日數(shù)據(jù)。隨著對(duì)日內(nèi)高頻數(shù)據(jù)的可獲取,Andersen 等[2]提出將已實(shí)現(xiàn)波動(dòng)作為對(duì)高頻波動(dòng)率的度量,以便更好地觀測(cè)和評(píng)估波動(dòng)率。為了刻畫已實(shí)現(xiàn)波動(dòng)的長(zhǎng)記憶性,Corsi[3]引入異質(zhì)性自回歸(HAR)模型,該模型由于結(jié)構(gòu)簡(jiǎn)潔、估算容易在研究界被廣泛使用。Byun 等[4]將風(fēng)險(xiǎn)中性偏度直接作為解釋變量加入HAR 模型,發(fā)現(xiàn)風(fēng)險(xiǎn)中性偏度包含已實(shí)現(xiàn)波動(dòng)和隱含波動(dòng)率中沒有包含的信息,這些信息有助于波動(dòng)率預(yù)測(cè)。其中,隱含波動(dòng)率是由期權(quán)的市場(chǎng)價(jià)格倒推出的波動(dòng)率,反映了投資者對(duì)標(biāo)的資產(chǎn)未來波動(dòng)率的預(yù)期。Mei 等[5]將已實(shí)現(xiàn)偏度加入HAR 模型中,發(fā)現(xiàn)已實(shí)現(xiàn)偏度對(duì)未來的波動(dòng)率有明顯的負(fù)面影響。樣本外結(jié)果表明,已實(shí)現(xiàn)偏度有助于中長(zhǎng)期預(yù)測(cè),但無法提高短期預(yù)測(cè)的準(zhǔn)確性。鄭振龍等[6]在比較偏度和峰度對(duì)波動(dòng)率的影響時(shí),發(fā)現(xiàn)期權(quán)隱含偏度所包含的信息要多于基于歷史信息的已實(shí)現(xiàn)偏度,對(duì)波動(dòng)率的影響更顯著。

        在金融預(yù)測(cè)領(lǐng)域,傳統(tǒng)研究假定經(jīng)濟(jì)系統(tǒng)是穩(wěn)定的。但是,受到政治、經(jīng)濟(jì)和環(huán)境等多方面因素的影響,金融市場(chǎng)數(shù)據(jù)可能因?yàn)橐恍O端事件引起結(jié)構(gòu)突變,使得時(shí)間序列的數(shù)據(jù)特征受到影響,從而導(dǎo)致參數(shù)不穩(wěn)定性和模型不確定性。在數(shù)據(jù)存在結(jié)構(gòu)突變時(shí),通常使用突變后的數(shù)據(jù)進(jìn)行預(yù)測(cè),而數(shù)據(jù)有限使得模型存在較高的不確定性。因此,金融預(yù)測(cè)研究的最大挑戰(zhàn)來自于考慮市場(chǎng)發(fā)生結(jié)構(gòu)突變時(shí)存在預(yù)測(cè)模型的不確定性和估計(jì)參數(shù)的不穩(wěn)定性。Pesaran 等[7]認(rèn)為這可能不會(huì)使均方預(yù)測(cè)誤差最小化,故在參數(shù)不確定性建模時(shí),Dangl 等[8]和Zhu 等[9]使用時(shí)變參數(shù)模型,允許參數(shù)隨時(shí)間變化;Wang 等[10]提出時(shí)間加權(quán)最小二乘回歸方法,通過為距離預(yù)測(cè)時(shí)間越近的樣本賦予越高的權(quán)重來解決參數(shù)不穩(wěn)定性。Zhang 等[11]繼Pesaran 等[7]和Pesaran 等[12]之后,使用窗口平均預(yù)測(cè)方法(AveW),將在不同估計(jì)窗口長(zhǎng)度上計(jì)算的同一模型進(jìn)行平均,通過與其他預(yù)測(cè)方法比較發(fā)現(xiàn),該方法能提高股票收益預(yù)測(cè)效果,在參數(shù)不穩(wěn)定和結(jié)構(gòu)突變情況下具有簡(jiǎn)單而可靠的特點(diǎn)。

        盡管已有文獻(xiàn)考慮到將偏度引入HAR-RV 模型,但尚無研究系統(tǒng)地比較過不同偏度指標(biāo)所包含的信息差異和對(duì)波動(dòng)率的預(yù)測(cè)能力。本文中主要探討風(fēng)險(xiǎn)中性偏度,基于日內(nèi)高頻數(shù)據(jù)和日數(shù)據(jù)的不同偏度指標(biāo)對(duì)已實(shí)現(xiàn)波動(dòng)預(yù)測(cè)能力的信息差異,從這一新的角度對(duì)已有研究進(jìn)行補(bǔ)充。在預(yù)測(cè)方法上,首先基于單個(gè)機(jī)器學(xué)習(xí)方法[13]預(yù)測(cè)已實(shí)現(xiàn)波動(dòng)。考慮到市場(chǎng)結(jié)構(gòu)突變導(dǎo)致的模型不確定性和參數(shù)不穩(wěn)定性,且已有研究提出基于時(shí)間維度的改進(jìn)方法來提高收益率預(yù)測(cè)效果[10-11],因此將這一思想應(yīng)用到數(shù)據(jù)驅(qū)動(dòng)的機(jī)器學(xué)習(xí)算法中,充分考慮金融時(shí)間序列數(shù)據(jù)的時(shí)間維度特征,對(duì)距離預(yù)測(cè)點(diǎn)越近的樣本給予更多的關(guān)注,并與傳統(tǒng)的集成學(xué)習(xí)方法[14]相比較,從而提出具有更高預(yù)測(cè)精度的集成學(xué)習(xí)方法。

        本文結(jié)構(gòu)安排如下:第2 節(jié)介紹各種偏度指標(biāo)和擴(kuò)展模型以及研究方法;第3 節(jié)為實(shí)證結(jié)果,包括相關(guān)性分析、參數(shù)估計(jì)結(jié)果、每個(gè)方法的預(yù)測(cè)結(jié)果等;第4 節(jié)為穩(wěn)健性檢驗(yàn),通過調(diào)整訓(xùn)練集長(zhǎng)度來驗(yàn)證方法是否具有穩(wěn)健性;第5 節(jié)為結(jié)論。

        1 方法和模型

        1.1 已實(shí)現(xiàn)波動(dòng)和波動(dòng)率的偏度指標(biāo)

        根據(jù)Andersen 等[2]的方法,通過將相應(yīng)的高頻日內(nèi)平方收益相加得出每日已實(shí)現(xiàn)波動(dòng),計(jì)算式如下:

        其中:rt,i表示第t 天,第i 次交易的對(duì)數(shù)收益。

        Andersen 等[15]證明了已實(shí)現(xiàn)波動(dòng)有以下極限結(jié)果:

        其中:Δps=ps-ps-表示在s 時(shí)刻跳的大小。

        根據(jù)Barndorff-Nielsen 等[16]的研究,將已實(shí)現(xiàn)波動(dòng)分解為已實(shí)現(xiàn)上半變差和已實(shí)現(xiàn)下半變差,定義如下:

        并且證明了:

        其中:I(*)表示示性函數(shù),易知已實(shí)現(xiàn)波動(dòng)RVt=。

        使用4 種不同的方法來刻畫波動(dòng)率偏度:

        1)參考鄭振龍等[6]的研究,利用m 個(gè)交易日的日對(duì)數(shù)收益率滾動(dòng)計(jì)算已實(shí)現(xiàn)偏度(RSt),計(jì)算式如下:

        其中:rt為第t 天的日對(duì)數(shù)收益率;為m 個(gè)交易日的收益率均值,m 取值為22。

        2)根據(jù)Chen 等[17]的研究,基于日收益率滾動(dòng)計(jì)算負(fù)偏度(NRSt)為:

        其中:rt定義和m 的取值同上。

        3)參考Amaya 等[18]的研究,基于日內(nèi)高頻收益計(jì)算已實(shí)現(xiàn)偏度為:

        Barndorff-Nielsen 等[16]和Mathieu 等[19]的研究結(jié)果表明:

        根據(jù)Feunou 等[20]提供的理論支持,可將已實(shí)現(xiàn)上半變差與已實(shí)現(xiàn)下半變差之差看作是上述已實(shí)現(xiàn)偏度(INTRSkewt)的一種度量,記為波動(dòng)率偏度(RSVt)。計(jì)算如下:

        當(dāng)RSVt<0 時(shí),收益率分布是左偏的;當(dāng)RSVt>0時(shí),則分布是右偏的。

        4)芝加哥期權(quán)交易所(CBOE)于2011 年推出風(fēng)險(xiǎn)中性偏度指數(shù),記為QSt,計(jì)算如下:

        其中:Skt=,表示風(fēng)險(xiǎn)中性偏度;為S&P 500 對(duì)數(shù)收益;μ=,σ=分別是其在風(fēng)險(xiǎn)中性測(cè)度Q 下的期望和標(biāo)準(zhǔn)差,其具體計(jì)算方式參考文獻(xiàn)[21]。可以看出,RSt越小,左偏越明顯;而NRSt和QS 越大,左偏越明顯。

        1.2 模型設(shè)定

        使用由Corsi[3]提出的HAR 模型研究已實(shí)現(xiàn)波動(dòng)的預(yù)測(cè)。由于該模型能很好地刻畫資產(chǎn)收益波動(dòng)率中的長(zhǎng)記憶特性,且模型僅包含代表日、周和月效應(yīng)的3 個(gè)變量,易于處理,因此該模型是已實(shí)現(xiàn)波動(dòng)預(yù)測(cè)最受歡迎的模型。本文中采用對(duì)數(shù)回歸,模型設(shè)定為:

        為了比較以上幾種偏度指標(biāo)包含的信息對(duì)已實(shí)現(xiàn)波動(dòng)預(yù)測(cè)的差異性和準(zhǔn)確性,分別將上述4種偏度指標(biāo)加入HAR-RV 模型,設(shè)定如下:

        1.3 研究方法

        1.3.1 支持向量回歸

        傳統(tǒng)的線性回歸方法只要真實(shí)值與擬合值不相等就計(jì)算誤差,而在支持向量回歸[22]方法下,僅當(dāng)二者之差的絕對(duì)值大于某個(gè)正數(shù)ε 時(shí)才計(jì)算損失,相當(dāng)于以擬合值為中心,構(gòu)建了一個(gè)寬度為2ε 的間隔帶。若訓(xùn)練樣本落入間隔帶中,則認(rèn)為是預(yù)測(cè)正確。

        支持向量回歸的求解表示為:

        其中:C 為正則化常數(shù);lε為ε-不敏感損失函數(shù),表示為:

        通過拉格朗日乘子法和對(duì)偶問題可以得到SVR 的解為:

        若考慮到特征映射形式,則對(duì)應(yīng)的核函數(shù)SVR 解形式為:

        其中κ(xi,xj)=φ(xi)Tφ(xj)為核函數(shù),φ(x)表示將x 映射后的特征向量。本文中選取的核函數(shù)為徑向基(RBF)核函數(shù),其定義為κ(x,z)=。采用五折交叉驗(yàn)證法和網(wǎng)格搜索法相結(jié)合來選取最優(yōu)參數(shù)組合[23]。

        采用同模型(11)—(15)一致的輸入變量和輸出變量構(gòu)建SVR 模型。以模型(11)為例,具體形式如下:

        其中:x·=[(ln(RVd,·),ln(RVw,·),ln(RVm,·)]T。

        1.3.2 帶懲罰項(xiàng)的線性回歸

        在普通最小二乘回歸基礎(chǔ)上,引入帶懲罰項(xiàng)的線性回歸來解決簡(jiǎn)單回歸分析可能產(chǎn)生的過擬合問題,即在最小化損失函數(shù)中加入懲罰函數(shù)φ(β),形式為:

        根據(jù)φ(β)的不同,采用嶺回歸(ridge regression)和彈性網(wǎng)絡(luò)方法(elasticnet)[24],φ(β)形式分別表示為:

        其中:λ 為正則化參數(shù),控制著模型的復(fù)雜度,λ 過大容易欠擬合,太小容易過擬合;α 為0~1 的正數(shù),控制著L1 和L2 范數(shù)的比重;當(dāng)α=1 時(shí),此時(shí)彈性網(wǎng)絡(luò)退化為套索回歸;當(dāng)α=0 時(shí),則退化為嶺回歸。由此可見彈性網(wǎng)絡(luò)結(jié)合了嶺回歸和套索回歸的共同特點(diǎn)。

        1.3.3 集成學(xué)習(xí)

        集成學(xué)習(xí)先通過已有的學(xué)習(xí)算法從訓(xùn)練集中訓(xùn)練得到個(gè)體學(xué)習(xí)器,再將若干個(gè)這樣的個(gè)體學(xué)習(xí)器通過某種方法結(jié)合,最終得到一個(gè)強(qiáng)學(xué)習(xí)器。根據(jù)個(gè)體學(xué)習(xí)器之間是否存在強(qiáng)依賴關(guān)系,分為串行生成的序列化方法和可同時(shí)生成的并行化方法,二者的代表方法分別是Boosting 和Bagging。

        1)Adaboost 方法

        本文中采用Boosting 族算法中最具代表性的Adaboost 方法[25],并在處理回歸問題時(shí)用平方誤差來衡量誤差率。在最后進(jìn)行個(gè)體學(xué)習(xí)器集成時(shí),用各個(gè)體學(xué)習(xí)器的預(yù)測(cè)結(jié)果乘以各自權(quán)重再求和作為最終結(jié)果。算法過程如下:

        步驟1初始化訓(xùn)練數(shù)據(jù)的分布權(quán)重:D1=(w11,w12,…,w1i,…,w1m),w1i=,i=1,2,…,m;

        步驟2使用某個(gè)學(xué)習(xí)算法訓(xùn)練具有權(quán)重D1的訓(xùn)練集,得到第1 個(gè)基本學(xué)習(xí)器;

        步驟3計(jì)算基本學(xué)習(xí)器T1(x)在訓(xùn)練集上的預(yù)測(cè)誤差率e1:

        Ⅰ)計(jì)算訓(xùn)練集上的最大誤差:E1=,i=1,2,…,m。

        Ⅱ)采用平方誤差,計(jì)算每個(gè)樣本的相對(duì)誤差e1i=,i=1,2,…,m。

        Ⅲ)計(jì)算回歸預(yù)測(cè)誤差率:e1=。

        步驟4計(jì)算基本學(xué)習(xí)器T1(x)的投票權(quán)重α1,并更新第2 輪訓(xùn)練集的權(quán)重D2:

        步驟5對(duì)第2 輪權(quán)重樣本再次訓(xùn)練得到第2個(gè)基本學(xué)習(xí)器,重復(fù)上述過程N(yùn) 次,得到N 個(gè)基本學(xué)習(xí)器T1(x),T2(x),…,TN(x)和相應(yīng)的權(quán)重α1,α2,…,αN,則:

        其中:T(x)是所有αnTn(x)的中位數(shù)(n=1,2,…,N)。

        Adaboost 方法的本質(zhì)是不改變訓(xùn)練數(shù)據(jù),改變訓(xùn)練數(shù)據(jù)權(quán)重分布,每一輪訓(xùn)練提高前一輪誤差大的樣本權(quán)重;最后加權(quán)平均得到預(yù)測(cè)值,誤差率越低的基本學(xué)習(xí)器權(quán)重越高。

        2)Bagging 方法

        Bagging 方法[26]是并行式集成學(xué)習(xí)方法中最著名的代表。采用自助采樣法,即從包含n 個(gè)樣本的數(shù)據(jù)集中隨機(jī)取出一個(gè)樣本放在采樣集中,再將該樣本放回?cái)?shù)據(jù)集,使之在下次采樣時(shí)仍有機(jī)會(huì)被選中,這樣隨機(jī)放回采樣m 次,然后重復(fù)N次該過程,即可得到N 個(gè)含有m 個(gè)訓(xùn)練樣本的采樣集;對(duì)每個(gè)采樣集訓(xùn)練得到一個(gè)基本學(xué)習(xí)器,對(duì)于分類問題用簡(jiǎn)單投票法,對(duì)于回歸問題用簡(jiǎn)單平均法。

        3)窗口平均預(yù)測(cè)法

        除上述2 種集成方法外,本文中采用窗口平均預(yù)測(cè)方法(AveW)[7,11]。該方法可以看作是固定取樣的Bagging。Bagging 集成預(yù)測(cè)方法在獲得采樣集時(shí),由于自助采樣法的隨機(jī)性,對(duì)于時(shí)間序列預(yù)測(cè)來說可能并不是最優(yōu)選擇。而AveW 方法在不同估計(jì)窗口上擬合相同模型,并對(duì)模型的預(yù)測(cè)結(jié)果求平均。即終止日期相同,根據(jù)起始日期的不同獲得若干個(gè)窗口長(zhǎng)度不同的訓(xùn)練集,在這些訓(xùn)練集上訓(xùn)練得到基本學(xué)習(xí)器,將這些基本學(xué)習(xí)器的預(yù)測(cè)結(jié)果簡(jiǎn)單平均作為最終結(jié)果。窗口平均預(yù)測(cè)法的優(yōu)勢(shì)是充分考慮數(shù)據(jù)在縱向時(shí)間維度上的特征,時(shí)間越近的樣本利用率越高,信息挖掘越充分。

        以SVR 的窗口平均為例(記為 SVR +AveW),用數(shù)學(xué)語(yǔ)言描述為:將給定的訓(xùn)練集作為最長(zhǎng)的觀測(cè)窗口W=,其中m是訓(xùn)練集長(zhǎng)度,xt與2.3.1 部分提到的一致。首先,將W 分為N 個(gè)訓(xùn)練窗口:

        其中:wi=wmin+,wmin為給定的最小的訓(xùn)練窗口。Wi由最小窗口逐步遞增到最大窗口。

        然后,在每個(gè)Wi訓(xùn)練窗口上利用SVR 進(jìn)行擬合,得到N 個(gè)擬合結(jié)果,i=1,2,…,N。則SVR+AveW 預(yù)測(cè)結(jié)果為:

        傳統(tǒng)的OLS 背后假定經(jīng)濟(jì)系統(tǒng)是穩(wěn)定的,Zhang 等[11]在預(yù)測(cè)股票收益率時(shí)考慮市場(chǎng)系統(tǒng)結(jié)構(gòu)發(fā)生突變時(shí)模型的不確定性和參數(shù)的不穩(wěn)定性,發(fā)現(xiàn)窗口平均預(yù)測(cè)方法能有效提高股票收益率的預(yù)測(cè)效果。與Zhang 等[11]的研究不同,本文中分別在線性O(shè)LS、帶懲罰項(xiàng)的線性回歸和非線性SVR 方法預(yù)測(cè)的基礎(chǔ)上采用窗口平均集成預(yù)測(cè)方法來研究已實(shí)現(xiàn)波動(dòng)預(yù)測(cè)。采用固定窗口大小的滾動(dòng)估計(jì),對(duì)于每個(gè)估計(jì)窗口,都用窗口平均預(yù)測(cè)法來向前一步預(yù)測(cè)已實(shí)現(xiàn)波動(dòng)。

        2 實(shí)證分析

        2.1 描述性統(tǒng)計(jì)

        數(shù)據(jù)選取標(biāo)準(zhǔn)普爾500 指數(shù)從2000-02-04 到2019-12-31 共4 983 個(gè)交易日數(shù)據(jù)。數(shù)據(jù)來自https://realized.oxford-man.ox.ac.uk/,風(fēng)險(xiǎn)中性偏度數(shù)據(jù)來源于芝加哥期權(quán)交易所網(wǎng)站。由于QS 的數(shù)值全部大于100,由式(10)可知,式中S 均小于0,因此QS 實(shí)際上刻畫的是左偏風(fēng)險(xiǎn)。由于左偏風(fēng)險(xiǎn)與市場(chǎng)崩盤風(fēng)險(xiǎn)更直接密切相關(guān),也為了與QS 保持一致,本文中對(duì)其余3 個(gè)偏度指標(biāo)進(jìn)行處理,提取RS 和RSV 中小于0 的部分并取絕對(duì)值,大于0 的部分賦值為0;對(duì)NRS 中小于0 的部分賦值為0,保留其大于0 的部分。RS-、RSV-和NRS+分別表示按上述處理之后的偏度;RS、RSV和NRS 分別表示未經(jīng)處理的偏度。

        表1 給出了處理后的各個(gè)偏度指標(biāo)和已實(shí)現(xiàn)波動(dòng)自然對(duì)數(shù)的描述性統(tǒng)計(jì)結(jié)果。RS-和NRS+均為基于每日收益的偏度指標(biāo),可以看出,二者在數(shù)量級(jí)上相比于另外2 個(gè)指標(biāo)差別不是很大,差異主要由指標(biāo)本身計(jì)算公式引起,即由中心化調(diào)整和前面系數(shù)的調(diào)整引起,在數(shù)據(jù)特征上均呈現(xiàn)右偏厚尾;RSV-的量級(jí)由于基于已實(shí)現(xiàn)波動(dòng)數(shù)據(jù)本身的原因,仍然是右偏厚尾,而QS 則是右偏瘦尾。由JB統(tǒng)計(jì)量可知,所有指標(biāo)均不服從正態(tài)分布。

        表1 各個(gè)變量的描述性統(tǒng)計(jì)結(jié)果

        通過表2 得知,已實(shí)現(xiàn)波動(dòng)與4 個(gè)偏度指標(biāo)均存在一定相關(guān)性,但相關(guān)性方向不盡相同,證明偏度指標(biāo)所包含的信息也存在一定的差異。

        表2 各個(gè)變量間的皮爾遜相關(guān)系數(shù)

        2.2 參數(shù)估計(jì)結(jié)果

        表3 給出了式(11)—(15)的最小二乘估計(jì)結(jié)果,在進(jìn)一步放寬顯著性水平和有效位數(shù)的前提下(即可近似認(rèn)為在10%顯著性水平下RS-對(duì)已實(shí)現(xiàn)波動(dòng)有顯著影響),可以確定各個(gè)偏度指標(biāo)對(duì)已實(shí)現(xiàn)波動(dòng)預(yù)測(cè)確實(shí)有顯著性影響,但QS 的回歸系數(shù)與其他3 個(gè)偏度指標(biāo)的回歸系數(shù)方向不同,因此QS 對(duì)已實(shí)現(xiàn)波動(dòng)的影響與基于歷史數(shù)據(jù)的3個(gè)偏度指標(biāo)的影響不同,進(jìn)一步證實(shí)了各個(gè)偏度指標(biāo)包含著不同的信息。后續(xù)將考慮用不同方法來比較不同偏度指標(biāo)對(duì)已實(shí)現(xiàn)波動(dòng)的預(yù)測(cè)能力。

        表3 普通最小二乘回歸(OLS)參數(shù)估計(jì)結(jié)果

        2.3 多種機(jī)器學(xué)習(xí)方法與波動(dòng)率預(yù)測(cè)

        本文研究中,重點(diǎn)關(guān)注不同方法對(duì)樣本外已實(shí)現(xiàn)波動(dòng)的預(yù)測(cè)效果。因此,將前70% (3 488個(gè))的數(shù)據(jù)(2000 年2 月4 日至2014 年1 月16日)作為樣本內(nèi)數(shù)據(jù),用于訓(xùn)練模型;將2014 年1月17 日至2019 年12 月31 日的1 495 個(gè)數(shù)據(jù)作為樣本外數(shù)據(jù),用于預(yù)測(cè)。采用以下2 個(gè)損失函數(shù)來評(píng)估模型的預(yù)測(cè)能力:

        1)平均絕對(duì)誤差:

        2)均方根誤差:

        其中:T 表示樣本內(nèi)的觀測(cè)點(diǎn)個(gè)數(shù);N 是樣本外滾動(dòng)窗口的長(zhǎng)度;和RVT+i分別表示波動(dòng)率的預(yù)測(cè)值和真實(shí)值。

        表4 給出了OLS、Ridge、ElasticNet 和SVR 估計(jì)方法的預(yù)測(cè)誤差。由于帶懲罰項(xiàng)的線性回歸沒有表現(xiàn)出比OLS 更好的預(yù)測(cè)效果,因此表4 中集成方法只給出在基于OLS 和SVR 的Adaboost、Bagging 以及窗口平均(AveW)的預(yù)測(cè)誤差。方法上,對(duì)相同偏度的不同方法預(yù)測(cè)中,可以看到SVR的預(yù)測(cè)誤差明顯低于ElasticNet、Ridge 和OLS,說明非線性的SVR 方法優(yōu)于本文所選取的3 種線性回歸方法;在基于OLS 和SVR 的集成方法中,窗口平均預(yù)測(cè)法均有明顯提升,其中基于SVR 的窗口平均預(yù)測(cè)效果最佳。比較不同偏度的預(yù)測(cè)能力時(shí),綜合比較各個(gè)方法得出:QS 對(duì)已實(shí)現(xiàn)波動(dòng)的預(yù)測(cè)能力最強(qiáng),基于日數(shù)據(jù)和日內(nèi)高頻數(shù)據(jù)的偏度指標(biāo)對(duì)已實(shí)現(xiàn)波動(dòng)預(yù)測(cè)沒有特別明顯的改善;僅將QS 加入HAR-RV 模型時(shí),模型性能才有提升,說明QS 包含已實(shí)現(xiàn)波動(dòng)中沒有的信息,并有利于預(yù)測(cè)。

        表4 測(cè)試集長(zhǎng)度比例為30%時(shí)不同方法下各個(gè)偏度模型的預(yù)測(cè)誤差

        2.4 MCS 檢驗(yàn)

        采用MCS 檢驗(yàn)來進(jìn)一步驗(yàn)證上述結(jié)果。MCS檢驗(yàn)常用于評(píng)價(jià)不同模型的預(yù)測(cè)能力[27-28],根據(jù)Hansen 等[29]的研究,其檢驗(yàn)統(tǒng)計(jì)量為:

        其中:模型i 與模型j 是來自模型集合M 任意2 個(gè)互異的模型;dij表示其損失差,表示模型i 與模型j 的平均損失;的自舉估計(jì)。MCS 檢驗(yàn)程序?yàn)槌跏荚O(shè)置中的每個(gè)模型分配P 值。對(duì)于給定的模型i,MCS 的P 值確定模型是否屬于MCS 的閾值置信水平,當(dāng)且僅當(dāng)≥α 時(shí)(i∈,α 為顯著性水平),越大的模型預(yù)測(cè)能力越強(qiáng)。

        表5 給出了測(cè)試集長(zhǎng)度比例為30%時(shí)的MCS檢驗(yàn)結(jié)果。MCS 檢驗(yàn)的模型集合M 分為2 種情形:①相同方法之下,5 個(gè)不同HAR 模型預(yù)測(cè)誤差所組成的模型集合(見Panel A);②相同模型之下,10 種方法的預(yù)測(cè)誤差組成的模型集合(見Panel B)。由A 部分可以看出,在2 種誤差標(biāo)準(zhǔn)下,對(duì)于單個(gè)方法而言,除了基于OLS 的Bagging方法是HAR-RV 模型最優(yōu)外,其余9 種方法均為加入風(fēng)險(xiǎn)中性偏度(QS)的結(jié)果最優(yōu)。因此,將風(fēng)險(xiǎn)中性偏度(QS)加入到HAR-RV 模型能提高模型對(duì)已實(shí)現(xiàn)波動(dòng)的預(yù)測(cè)能力,而基于歷史信息的偏度對(duì)模型幾乎沒有提升作用;B 部分表示在2 種誤差標(biāo)準(zhǔn)下,對(duì)于不同的模型,其結(jié)果均為基于SVR 的窗口平均預(yù)測(cè)方法最優(yōu)??梢钥闯?,MCS檢驗(yàn)結(jié)果與上述表4 的預(yù)測(cè)結(jié)果一致。

        表5 測(cè)試集長(zhǎng)度比例為30%時(shí)2 種情況下的MCS 檢驗(yàn)結(jié)果

        3 穩(wěn)健性檢驗(yàn)

        上述結(jié)果基于測(cè)試集長(zhǎng)度占樣本總長(zhǎng)度的30%得到。為了驗(yàn)證其是否具有穩(wěn)健性,表6 給出了測(cè)試集長(zhǎng)度比例為50%時(shí)不同方法下各個(gè)偏度的預(yù)測(cè)誤差。以MAE 為衡量標(biāo)準(zhǔn)時(shí),不同方法的最小誤差均出現(xiàn)在QS;以RMSE 為衡量標(biāo)準(zhǔn)時(shí),QS 在OLS、Ridge、ElasticNet 這3 種方法下預(yù)測(cè)誤差小于NRS+,而其余7 種方法則是NRS+的預(yù)測(cè)結(jié)果略優(yōu)于QS。因此,綜合2 種標(biāo)準(zhǔn)可認(rèn)為QS 的結(jié)果略優(yōu)于NRS+。

        表7 給出了MCS 檢驗(yàn)結(jié)果。由A 部分可以看出,以MAE 為衡量標(biāo)準(zhǔn)時(shí),除SVR+Bagging、SVR+AveW 外,其余8 種方法下,均為HAR-RVQS 模型明顯優(yōu)于HAR-RV-NRS+模型;而以RMSE 為衡量標(biāo)準(zhǔn)時(shí),同理可以得出,HAR-RVNRS+略優(yōu)于HAR-RV-QS,但綜合比較A 部分的2個(gè)誤差標(biāo)準(zhǔn)可知,HAR-RV-QS 模型表現(xiàn)優(yōu)越的情況居多,因此認(rèn)為當(dāng)測(cè)試集長(zhǎng)度比例為50%時(shí),QS 的結(jié)果要略優(yōu)于NRS+。由B 部分可以看出,在2 種誤差標(biāo)準(zhǔn)下的最佳方法仍為基于SVR 的窗口平均(SVR+AveW),MCS 檢驗(yàn)結(jié)果和表6 預(yù)測(cè)誤差結(jié)果一致。

        表6 測(cè)試集長(zhǎng)度比例為50%時(shí)不同方法下各個(gè)偏度的預(yù)測(cè)誤差

        表7 測(cè)試集長(zhǎng)度比例為50%時(shí)兩種情況下的MCS 檢驗(yàn)結(jié)果

        續(xù)表(表7)

        4 結(jié)論

        研究了風(fēng)險(xiǎn)中性偏度、基于日數(shù)據(jù)和日內(nèi)高頻數(shù)據(jù)的偏度指標(biāo)所包含的信息差異,通過機(jī)器學(xué)習(xí)方法比較不同偏度對(duì)已實(shí)現(xiàn)波動(dòng)的預(yù)測(cè)能力。經(jīng)實(shí)證發(fā)現(xiàn),隨著訓(xùn)練數(shù)據(jù)的增加,風(fēng)險(xiǎn)中性偏度的預(yù)測(cè)能力逐漸增強(qiáng),且優(yōu)于基于日數(shù)據(jù)和日內(nèi)高頻數(shù)據(jù)的偏度指標(biāo)。在預(yù)測(cè)方法上,非線性的支持向量回歸(SVR)優(yōu)于普通最小二乘回歸(OLS)、嶺回歸(Ridge)以及彈性網(wǎng)絡(luò)(Elastic-Net)。在對(duì)OLS 和SVR 進(jìn)行集成學(xué)習(xí)時(shí),窗口平均預(yù)測(cè)法能明顯改善模型的預(yù)測(cè)能力,基于SVR的窗口平均預(yù)測(cè)法的預(yù)測(cè)能力最強(qiáng)。本文的研究方法和結(jié)論對(duì)我國(guó)金融市場(chǎng)風(fēng)險(xiǎn)管理具有借鑒意義。

        猜你喜歡
        方法模型
        一半模型
        重要模型『一線三等角』
        重尾非線性自回歸模型自加權(quán)M-估計(jì)的漸近分布
        學(xué)習(xí)方法
        可能是方法不對(duì)
        3D打印中的模型分割與打包
        用對(duì)方法才能瘦
        Coco薇(2016年2期)2016-03-22 02:42:52
        FLUKA幾何模型到CAD幾何模型轉(zhuǎn)換方法初步研究
        四大方法 教你不再“坐以待病”!
        Coco薇(2015年1期)2015-08-13 02:47:34
        賺錢方法
        亚洲av狠狠爱一区二区三区| 青青青爽国产在线视频| 久久一区二区三区四区| 久久人妻精品中文字幕一区二区| 中国亚洲一区二区视频| 久久国产亚洲高清观看| 宅男噜噜噜| 亚洲精品国产av一区二区| 香蕉国产人午夜视频在线观看 | 日韩人妻无码免费视频一区二区三区| 国产精品爆乳在线播放| 国产精品女人一区二区三区| 五月激情综合婷婷六月久久| 国产办公室秘书无码精品99| 国外精品视频在线观看免费| 亚洲一区二区欧美色妞影院| 国产一区二区三区在线影院| 国产精品理论片在线观看| 内射少妇36p九色| 亚洲九九九| 日本视频在线播放一区二区| 久久不见久久见免费影院| 99久久精品国产一区二区蜜芽| 绿帽人妻被插出白浆免费观看| 亚洲av网站在线观看一页| 久久精品国产久精国产| 国产精品三级一区二区按摩| 视频一区视频二区亚洲| 亚洲国产精品日本无码网站 | 亚洲日韩国产精品不卡一区在线| 亚洲一区亚洲二区视频在线| 爆乳熟妇一区二区三区霸乳| 亚洲国产精品国自产电影| 日韩视频午夜在线观看| 国产a∨天天免费观看美女| 亚洲爆乳少妇无码激情| 中文字幕亚洲精品码专区| 亚洲国产色婷婷久久精品| 亚洲av无码av制服另类专区 | 国产极品裸体av在线激情网| 99国内精品久久久久久久|