李建平,袁佳鑫,尚書(shū)凡,郝 俊
(中國(guó)科學(xué)院大學(xué) 經(jīng)濟(jì)與管理學(xué)院,北京 100049)
國(guó)家風(fēng)險(xiǎn)是指在國(guó)際資本流動(dòng)中當(dāng)事人所面臨的、因特定國(guó)家層面的事件引發(fā)的目標(biāo)國(guó)“不能”或“不愿”履行國(guó)際契約,從而造成當(dāng)事人利益損失的風(fēng)險(xiǎn)。[1-2]由于地緣政治與國(guó)家安全沖突不斷加劇,全球動(dòng)蕩源和風(fēng)險(xiǎn)點(diǎn)顯著增多,各種固有和新生、一國(guó)內(nèi)部和跨國(guó)聯(lián)動(dòng)的風(fēng)險(xiǎn)相互交織,國(guó)家風(fēng)險(xiǎn)傳染速度更快,傳染路徑更加復(fù)雜[3-5],這無(wú)疑給國(guó)家風(fēng)險(xiǎn)預(yù)測(cè)帶來(lái)了嚴(yán)峻的挑戰(zhàn)[6]。作為企業(yè)跨國(guó)投資面臨的重要宏觀風(fēng)險(xiǎn),國(guó)家風(fēng)險(xiǎn)的變化趨勢(shì)將直接影響企業(yè)、機(jī)構(gòu)和個(gè)人的投資決策。[7-8]因此,科學(xué)準(zhǔn)確地預(yù)測(cè)國(guó)家風(fēng)險(xiǎn)的變化趨勢(shì)對(duì)于保障跨國(guó)企業(yè)海外投資以及國(guó)際投資者資產(chǎn)安全具有重要的意義。
目前,國(guó)家風(fēng)險(xiǎn)預(yù)測(cè)模型主要分為傳統(tǒng)的計(jì)量模型和人工智能模型兩類。國(guó)家風(fēng)險(xiǎn)的誘因復(fù)雜性與多變性使得傳統(tǒng)計(jì)量模型如ARIMA(Autoregressive Integrated Moving Average)、GARCH(Generalized Autoregressive Conditional Heteroskedasticity)、指數(shù)平滑、線性回歸等,難以有效刻畫(huà)國(guó)家風(fēng)險(xiǎn)的波動(dòng)特性,從而導(dǎo)致模型精度較低。隨著信息技術(shù)與人工智能的快速發(fā)展,以神經(jīng)網(wǎng)絡(luò)模型為代表的機(jī)器學(xué)習(xí)方法往往具有較強(qiáng)的非線性特征提取能力而被廣泛關(guān)注和應(yīng)用。[9-10]例如,湯鈴等[11]利用分解集成方法對(duì)主要能源輸出國(guó)的國(guó)家風(fēng)險(xiǎn)進(jìn)行預(yù)測(cè)研究;Li等[12]利用分解重構(gòu)方法對(duì)國(guó)家主權(quán)風(fēng)險(xiǎn)進(jìn)行預(yù)測(cè)建模。相較于單一模型而言,集成學(xué)習(xí)將多種單體模型進(jìn)行有機(jī)融合,充分挖掘不同模型的特性與優(yōu)勢(shì),能夠有效降低單一預(yù)測(cè)模型所帶來(lái)的系統(tǒng)性偏差。例如,Yuan等[13]提出一種基于線性模型、機(jī)器學(xué)習(xí)模型和深度學(xué)習(xí)模型的集成預(yù)測(cè)方法,通過(guò)簡(jiǎn)單平均、最佳均值、修剪平均以及聚類均值的方式進(jìn)行模型集成,結(jié)果驗(yàn)證了集成模型預(yù)測(cè)性能的優(yōu)越性;Hao等[14]提出了一種基于多目標(biāo)規(guī)劃的動(dòng)態(tài)集成預(yù)測(cè)模型對(duì)價(jià)格波動(dòng)風(fēng)險(xiǎn)進(jìn)行預(yù)測(cè),結(jié)果表明其所提出模型顯著優(yōu)于單一模型和其他集成模型,進(jìn)一步證明了集成學(xué)習(xí)是有效的預(yù)測(cè)工具。
對(duì)于集成學(xué)習(xí)而言,集成策略對(duì)預(yù)測(cè)結(jié)果具有顯著影響。在早期研究中,簡(jiǎn)單平均法由于操作簡(jiǎn)單且便于計(jì)算而被廣泛采用。然而,該方法對(duì)所有單體模型賦予相同的權(quán)重,無(wú)法有效發(fā)揮表現(xiàn)優(yōu)異的模型的貢獻(xiàn)。[15]為了充分提取單體模型的信息、發(fā)揮集成學(xué)習(xí)的優(yōu)勢(shì),基于單體模型表現(xiàn)賦權(quán)的集成建模成為趨勢(shì),也受到越來(lái)越多的關(guān)注?;凇拔镆灶惥邸钡乃枷?本文提出了基于聚類策略的國(guó)家風(fēng)險(xiǎn)集成預(yù)測(cè)方法。以聚類策略實(shí)現(xiàn)單體模型的集成,可以充分挖掘數(shù)據(jù)本身的潛在結(jié)構(gòu),在一定程度上避免了因權(quán)重分配不當(dāng)而導(dǎo)致的誤差。[13]聚類策略的運(yùn)用使異常值的影響在一定程度上被消除,且每個(gè)預(yù)測(cè)模型都被分配了適當(dāng)?shù)臋?quán)重,能夠有效提升集成模型的預(yù)測(cè)精度和穩(wěn)健性。此外,在眾多聚類算法中,BIRCH(Balanced Iterative Reducing and Clustering using Hierarchies)聯(lián)合AP(Affinity Propagation)聚類方法具有較高的執(zhí)行效率和準(zhǔn)確性。為此,本文構(gòu)建了基于BIRCH-AP聯(lián)合聚類策略的國(guó)家風(fēng)險(xiǎn)預(yù)測(cè)模型,以期有效提升預(yù)測(cè)模型的精度,實(shí)現(xiàn)精準(zhǔn)的國(guó)家風(fēng)險(xiǎn)預(yù)測(cè)預(yù)警。
為了避免備選單體模型同質(zhì)化導(dǎo)致的集成預(yù)測(cè)模型失效的問(wèn)題,本文選取了8種不同類型的單體模型作為備選模型。具體來(lái)說(shuō),這8種單體模型分別是:長(zhǎng)短期記憶網(wǎng)絡(luò)、最小絕對(duì)收縮選擇算子、支持向量回歸、貝葉斯嶺回歸、隨機(jī)梯度下降、極端梯度提升、LightGBM以及極限學(xué)習(xí)機(jī)。
1.長(zhǎng)短期記憶網(wǎng)絡(luò)
長(zhǎng)短期記憶網(wǎng)絡(luò)(Long Short Term Memory,LSTM)通過(guò)遺忘門、輸入門和輸出門共同控制信息的流動(dòng),既能充分解決梯度消失或爆炸問(wèn)題,又能在一定程度上避免欠擬合的風(fēng)險(xiǎn)。LSTM當(dāng)前時(shí)刻的隱藏層輸出ht和內(nèi)部狀態(tài)ct由上一時(shí)刻的隱藏層輸出ht-1、內(nèi)部狀態(tài)ct-1以及當(dāng)前時(shí)刻的輸入xt協(xié)同決定。LSTM用三個(gè)門結(jié)構(gòu)來(lái)控制信息的流動(dòng),遺忘門ft用于設(shè)置權(quán)重以選擇所需保留的信息比重,輸入門it用于篩選當(dāng)前時(shí)刻輸入的新信息,輸出門ot用于從當(dāng)前內(nèi)部狀態(tài)中提取有效信息以產(chǎn)生新的隱藏層,三個(gè)門的計(jì)算方法分別如式(1)—式(3)所示。
ft=σ(Wt·(ht-1,xt)+bt)
(1)
it=σ(Wi·(ht-1,xt)+bi)
(2)
ot=σ(Wo·(ht-1,xt)+bo)
(3)
式中:Wt、bt分別為遺忘門的權(quán)重矩陣和對(duì)應(yīng)偏置項(xiàng),Wi、bi分別為輸入門的權(quán)重矩陣和對(duì)應(yīng)偏置項(xiàng),Wo、bo分別為輸出門的權(quán)重矩陣和對(duì)應(yīng)偏置項(xiàng)。
(4)
(5)
ht=ot?tanh(ct-1)
(6)
2.最小絕對(duì)收縮選擇算子
最小絕對(duì)收縮選擇算子(Least Absolute Shrinkage and Selection Operator,LASSO)通過(guò)構(gòu)造懲罰函數(shù)壓縮回歸系數(shù)獲得一個(gè)較為精煉的模型。相較于其他回歸方法,LASSO模型更易于解釋,在小部分輸入變量有效而其他輸入變量系數(shù)接近于零時(shí)表現(xiàn)出色。相關(guān)系數(shù)通過(guò)最小化L1范數(shù)懲罰項(xiàng)擬合公式得到,如式(7)所示。
(7)
式中:λ為調(diào)節(jié)參數(shù)。
3.支持向量回歸
支持向量回歸(Support Vector Regressor,SVR)具有容錯(cuò)性好、魯棒性高、泛化能力強(qiáng)的性質(zhì)。當(dāng)樣本線性不可分時(shí),可將樣本從原始空間映射到更高維的特征空間,使得樣本在高維特征空間內(nèi)線性可分。令φ(x)表示將x映射后的特征向量,對(duì)應(yīng)劃分超平面如式(8)所示,求解式(8)可得式(9)和式(10)。
f(x)=wTφ(x)+b
(8)
(9)
(10)
式中:k(xi,x)為核函數(shù)。
4.貝葉斯嶺回歸
貝葉斯嶺回歸(Bayesian Ridge Regression,BRR)是結(jié)合貝葉斯線性回歸和嶺回歸兩種模型優(yōu)勢(shì)的預(yù)測(cè)模型。貝葉斯嶺回歸在參數(shù)估計(jì)時(shí)引入正則項(xiàng),得到參數(shù)的后驗(yàn)分布,對(duì)含異常值的時(shí)序預(yù)測(cè)任務(wù)表現(xiàn)良好。貝葉斯線性回歸函數(shù)如式(11)所示,其目的是求解能使式(11)最小的參數(shù)向量分布式(12)。
(11)
(12)
式中:n為樣本空間維度,m為樣本容量,w為參數(shù)向量,ψ(x)為輸入向量的非線性函數(shù)。
觀測(cè)值分布t是以y(x,w)為均值的高斯分布,t的類條件概率密度函數(shù)為式(13),w的先驗(yàn)概率為式(14)。
(13)
(14)
根據(jù)貝葉斯規(guī)則,則得到式(15)和式(16)。
(15)
(16)
式中:p(w|t)為后驗(yàn)概率,c為常數(shù),先驗(yàn)概率對(duì)應(yīng)嶺回歸中的L2正則項(xiàng)。
5.隨機(jī)梯度下降
隨機(jī)梯度下降法(Stochastic Gradient Descent,SGD)是求解最小二乘問(wèn)題的迭代方法。該方法是對(duì)梯度下降法的改進(jìn),其在每次更新參數(shù)時(shí)僅選取一個(gè)樣本來(lái)計(jì)算梯度,可逐步求解損失函數(shù)最小值,從而得到模型參數(shù)。參數(shù)更新公式如式(17)所示。由于每次更新參數(shù)僅需計(jì)算一個(gè)樣本梯度,因此SGD訓(xùn)練速度快,在樣本量很大的情況下可能只需部分樣本就能迭代到最優(yōu)解。
θt+1=θt-η·θtJ(θ;(xi,yi))
(17)
式中:(xi,yi)為隨機(jī)選取的樣本。
6.極端梯度提升
極端梯度提升法(eXtreme Gradient Boosting,XGBoost)是由GBDT改進(jìn)而來(lái)的串行提升算法。利用不同的分類回歸樹(shù)訓(xùn)練彌補(bǔ)前一次訓(xùn)練后模型存在的不足,同時(shí)對(duì)損失函數(shù)做泰勒展開(kāi)并添加正則項(xiàng)防止過(guò)擬合,最終將每次訓(xùn)練產(chǎn)生的結(jié)果進(jìn)行加和得到最終預(yù)測(cè)值。
7.LightGBM
LightGBM是一種高效并行計(jì)算的梯度提升框架,其在GBDT的基礎(chǔ)上使用基于Histogram的決策樹(shù)優(yōu)化算法,降低了時(shí)間復(fù)雜度;同時(shí)又采用帶深度限制Leaf-wise的葉子生長(zhǎng)策略,提升了訓(xùn)練效率。
8.極限學(xué)習(xí)機(jī)
極限學(xué)習(xí)機(jī)(Extreme Learning Machine,ELM)模型是一種包含輸入層、隱藏層和輸出層三層結(jié)構(gòu)的單隱藏層前饋神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)算法。相較于其他神經(jīng)網(wǎng)絡(luò)模型需要人為設(shè)置大量訓(xùn)練參數(shù),ELM只需要設(shè)置網(wǎng)絡(luò)的隱層節(jié)點(diǎn)數(shù),是一種簡(jiǎn)單易用且有效的機(jī)器學(xué)習(xí)算法。傳統(tǒng)的神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)算法(如反向傳播算法)由于人為設(shè)置了大量的訓(xùn)練參數(shù),容易產(chǎn)生局部最優(yōu)解;而ELM不需要在算法執(zhí)行過(guò)程中調(diào)整網(wǎng)絡(luò)的輸入權(quán)重,具有學(xué)習(xí)速度快、泛化性能好的特點(diǎn)。
1.聯(lián)合聚類算法
本文引入層次聚類算法BIRCH并嵌套AP聚類的聯(lián)合方法對(duì)數(shù)據(jù)進(jìn)行聯(lián)合聚類分析。首先,利用基于樹(shù)結(jié)構(gòu)的BIRCH算法在保留數(shù)據(jù)內(nèi)在聚類結(jié)構(gòu)的前提下對(duì)數(shù)據(jù)進(jìn)行多層壓縮,并建立一棵聚類特征樹(shù);然后,使用AP聚類方法將BIRCH算法得到的各聚類特征結(jié)果作為樣本點(diǎn)進(jìn)行聚類,具體如圖1所示。
圖1 聚類結(jié)構(gòu)
將BIRCH算法和AP聚類方法相結(jié)合,一方面,可以使用BIRCH算法避免離群值的干擾;另一方面,與傳統(tǒng)的基于層次/密度的聚類技術(shù)相比,將BIRCH算法和AP聚類方法結(jié)合有利于快速生成較高質(zhì)量的聚類結(jié)果。BIRCH算法利用分層方法實(shí)現(xiàn)平衡迭代規(guī)劃和聚類算法。BIRCH單遍掃描數(shù)據(jù)集就可以完成聚類,執(zhí)行效率和準(zhǔn)確性較高。AP聚類是通過(guò)在樣本對(duì)之間發(fā)送消息,直到收斂來(lái)創(chuàng)建聚類。具體而言,AP算法將數(shù)據(jù)點(diǎn)對(duì)之間的相似度作為輸入,并同時(shí)將所有數(shù)據(jù)點(diǎn)視為潛在的簇中心,數(shù)據(jù)點(diǎn)之間交換實(shí)值信息,直到逐漸形成高質(zhì)量的示例集和相應(yīng)的簇;然后,使用少量有代表性的樣本作為聚類中心描述數(shù)據(jù)集,而這些樣本對(duì)被認(rèn)為是最能代表數(shù)據(jù)集中其他數(shù)據(jù)的樣本。
2.基于聯(lián)合聚類算法的集成預(yù)測(cè)模型
本文所提出的集成預(yù)測(cè)框架如圖2所示,具體可以劃分為5個(gè)步驟。
步驟1:劃分集合。為了避免數(shù)據(jù)泄露問(wèn)題,我們將全部樣本按照80%和20%的比例劃分為訓(xùn)練集和測(cè)試集,其中,80%樣本被視為訓(xùn)練集,其余20%用于測(cè)試模型的樣本外表現(xiàn)。
步驟2:建立聚類特征樹(shù)。根據(jù)設(shè)定的滑動(dòng)窗口,對(duì)給定樣本選擇合適的數(shù)據(jù),使窗口的最后一個(gè)數(shù)據(jù)點(diǎn)為當(dāng)前待預(yù)測(cè)點(diǎn),對(duì)于窗口中的數(shù)據(jù)使用BIRCH進(jìn)行壓縮并建立聚類特征樹(shù)。
步驟3:選定評(píng)估聚類簇。使用AP算法將各聚類特征結(jié)果進(jìn)行聚類,根據(jù)最終聚類結(jié)果,選取與當(dāng)前待預(yù)測(cè)點(diǎn)數(shù)據(jù)結(jié)構(gòu)相同的簇作為單體模型評(píng)估的數(shù)據(jù)基礎(chǔ)。
步驟4:預(yù)測(cè)表現(xiàn)評(píng)價(jià)?;谄骄^對(duì)百分比誤差(Mean Absolute Percentage Error,MAPE)指標(biāo),計(jì)算各單體模型在預(yù)測(cè)所選定簇中的各個(gè)觀察點(diǎn)上的預(yù)測(cè)表現(xiàn)。
步驟5:集成預(yù)測(cè)。對(duì)比各單體模型在所選定簇中的各個(gè)觀察點(diǎn)上的表現(xiàn),選擇表現(xiàn)最好的模型作為對(duì)當(dāng)前待預(yù)測(cè)點(diǎn)集成預(yù)測(cè)的輸出。
考慮到數(shù)據(jù)的可獲取性,本文選取了歐佩克成員國(guó)中石油產(chǎn)量較大的4個(gè)國(guó)家,即沙特阿拉伯(Saudi Arabia)、科威特(Kuwait)、伊朗(Iran)、利比亞(Libya)的ICRG(International Country Risk Guide)數(shù)據(jù),以驗(yàn)證所提出模型的樣本外預(yù)測(cè)表現(xiàn)。樣本數(shù)據(jù)時(shí)間跨度為:2001年5月—2022年3月,共251個(gè)觀測(cè)點(diǎn)。這4個(gè)國(guó)家風(fēng)險(xiǎn)評(píng)分描述性統(tǒng)計(jì)結(jié)果如表1所示。此外,我們選擇“官僚主義”“內(nèi)戰(zhàn)”“消費(fèi)者信心”“腐敗”“跨境沖突”“政府穩(wěn)定性”等40個(gè)評(píng)價(jià)指標(biāo)作為外部變量,具體如表2所示。為了直觀展示實(shí)驗(yàn)對(duì)象,本研究繪制了國(guó)家風(fēng)險(xiǎn)評(píng)分序列圖,如圖3所示。由圖3可以看出,在樣本時(shí)段內(nèi),國(guó)家風(fēng)險(xiǎn)評(píng)分具有明顯的波動(dòng),各國(guó)風(fēng)險(xiǎn)波動(dòng)規(guī)律也不盡相同。其中,利比亞ICRG在2014—2016年間有明顯下跌,可能是因?yàn)樵谠摃r(shí)段其恐怖襲擊多發(fā)、政治局勢(shì)動(dòng)蕩,這也表明ICRG國(guó)家風(fēng)險(xiǎn)評(píng)分?jǐn)?shù)據(jù)的可靠性。
表1 國(guó)家風(fēng)險(xiǎn)評(píng)分統(tǒng)計(jì)結(jié)果
表2 國(guó)家風(fēng)險(xiǎn)相關(guān)的影響因素清單
圖3 國(guó)家風(fēng)險(xiǎn)評(píng)分序列
根據(jù)ICRG的均值與中位數(shù)可知,科威特的國(guó)家風(fēng)險(xiǎn)評(píng)分最高,然后依次是沙特阿拉伯、利比亞和伊朗。根據(jù)標(biāo)準(zhǔn)差和極差結(jié)果,利比亞國(guó)家風(fēng)險(xiǎn)評(píng)分的波動(dòng)性顯著高于其他三國(guó)。此外,根據(jù)偏度測(cè)算結(jié)果可知,各國(guó)國(guó)家風(fēng)險(xiǎn)評(píng)分均呈現(xiàn)左偏分布,表明序列中可能存在極小值;峰度測(cè)算結(jié)果則表明各國(guó)國(guó)家風(fēng)險(xiǎn)評(píng)分?jǐn)?shù)據(jù)分布有“寬平臺(tái)短尾巴”的特征。
表3 備選模型與參數(shù)選擇
為了更為全面地比較所提出的集成預(yù)測(cè)模型相較于其他基準(zhǔn)模型的表現(xiàn),本文從水平預(yù)測(cè)精度和方向預(yù)測(cè)精度兩個(gè)方面對(duì)預(yù)測(cè)表現(xiàn)進(jìn)行評(píng)價(jià)。為此,本文引入2個(gè)評(píng)價(jià)標(biāo)準(zhǔn):均方根誤差(Root Mean Square Error,RMSE)和方向性精度(Directional Accuracy,DA)。其中,RMSE是水平預(yù)測(cè)精度指標(biāo),DA是方向預(yù)測(cè)精度指標(biāo)。具體公式為
(18)
(19)
為驗(yàn)證所提模型的預(yù)測(cè)性能,本文選擇8個(gè)單體模型以及不進(jìn)行聚類的集成模型作為對(duì)比模型,分別計(jì)算預(yù)測(cè)模型在不同提前期下的評(píng)價(jià)指標(biāo)結(jié)果。以伊朗為例,研究選擇具有代表性的4個(gè)提前期:1、6、12和24,分別代表一個(gè)月、半年、一年以及兩年,并計(jì)算水平預(yù)測(cè)精度指標(biāo)RMSE和方向性預(yù)測(cè)精度指標(biāo)DA,結(jié)果如表4所示。
由表4可知,所提模型在不同提前期下均具有良好的預(yù)測(cè)表現(xiàn),尤其是在長(zhǎng)期預(yù)測(cè)中。其中,在提前期為24時(shí),所提模型的RMSE比次優(yōu)模型(BRR)降低5.72%,而其DA值則比次優(yōu)模型(LightGBM)提升16.13%,這表明所提模型具有優(yōu)異的預(yù)測(cè)表現(xiàn)。此外,伊朗國(guó)家風(fēng)險(xiǎn)預(yù)測(cè)結(jié)果還符合以下規(guī)律:(1)從不同指標(biāo)來(lái)看,所提模型在方向精度方面具有顯著的良好表現(xiàn);(2)對(duì)比不同模型,所提模型相較于不聚類模型有明顯的預(yù)測(cè)優(yōu)勢(shì);(3)從不同提前期來(lái)看,所提模型在較長(zhǎng)期時(shí)仍能保持較好的預(yù)測(cè)性能。為直觀呈現(xiàn)模型預(yù)測(cè)效果,本研究繪制了提前期為1時(shí)不同預(yù)測(cè)模型在4個(gè)國(guó)家的評(píng)價(jià)指標(biāo),如圖4所示。綜合表4和圖4可以發(fā)現(xiàn):所提模型在DA指標(biāo)上表現(xiàn)出更為顯著的優(yōu)勢(shì),這可能是因?yàn)榧赡P驮谝欢ǔ潭壬媳苊饬藛误w模型的預(yù)測(cè)慣性。將差異化的單體模型通過(guò)聚類策略進(jìn)行集成,有利于降低預(yù)測(cè)的系統(tǒng)性風(fēng)險(xiǎn)。每次對(duì)當(dāng)前預(yù)測(cè)點(diǎn)進(jìn)行不同單體模型的評(píng)估與預(yù)測(cè),能夠避免對(duì)歷史數(shù)據(jù)的過(guò)度依賴,因此集成策略的使用能有效提升方向性預(yù)測(cè)精度。
圖4 提前期為1時(shí)不同模型的預(yù)測(cè)評(píng)價(jià)指標(biāo)結(jié)果
此外,為了進(jìn)一步驗(yàn)證所提模型在預(yù)測(cè)方面的優(yōu)勢(shì),本文對(duì)伊朗、科威特、利比亞和沙特阿拉伯4個(gè)國(guó)家在不同提前期下進(jìn)行實(shí)驗(yàn)并計(jì)算RMSE指標(biāo),其結(jié)果如圖5所示。由圖5可以看出,不同提前期下模型預(yù)測(cè)精度有所波動(dòng)。整體而言,隨著提前期的增加,所提模型的預(yù)測(cè)優(yōu)勢(shì)也愈加明顯。同時(shí),所提模型在較長(zhǎng)提前期下(2年)表現(xiàn)較好,這說(shuō)明所提模型能夠較好地捕捉國(guó)家風(fēng)險(xiǎn)的數(shù)據(jù)特征與內(nèi)在規(guī)律,其表現(xiàn)不會(huì)因數(shù)據(jù)變化而產(chǎn)生較為嚴(yán)重的劣化,這進(jìn)一步驗(yàn)證所提模型的有效性。綜合圖4和圖5可以看出,所提模型相較于不聚類模型具有更好的表現(xiàn),表明聚類集成策略的有效性。通過(guò)聚類方法將單體模型進(jìn)行集成,能夠達(dá)到“取長(zhǎng)補(bǔ)短”的效果,既充分利用了各單體模型的優(yōu)勢(shì),也能規(guī)避因各單體模型本身特性所造成的誤差,最終達(dá)到最優(yōu)的預(yù)測(cè)效果。
圖5 不同提前期下4個(gè)國(guó)家的預(yù)測(cè)評(píng)價(jià)指標(biāo)結(jié)果(以RMSE為例)
準(zhǔn)確預(yù)測(cè)國(guó)家風(fēng)險(xiǎn)能夠有效降低一國(guó)在對(duì)外貿(mào)易中期望收益受損的可能性。然而,國(guó)家風(fēng)險(xiǎn)構(gòu)成復(fù)雜、誘因多樣,且相關(guān)因素往往具有突發(fā)性,使得精準(zhǔn)預(yù)測(cè)國(guó)家風(fēng)險(xiǎn)面臨嚴(yán)峻挑戰(zhàn)。為此,本文提出了一種基于BIRCH嵌套AP算法的聯(lián)合聚類集成預(yù)測(cè)模型,并基于所提模型及其對(duì)比模型在不同國(guó)家和不同提前期下進(jìn)行實(shí)驗(yàn),計(jì)算了多個(gè)評(píng)價(jià)指標(biāo)值以比較模型的預(yù)測(cè)性能。實(shí)證結(jié)果表明:所提模型在不同提前期下較對(duì)比模型體現(xiàn)出優(yōu)異的預(yù)測(cè)表現(xiàn),尤其在方向性精度上,總體表現(xiàn)出較顯著且穩(wěn)定的優(yōu)勢(shì);所提模型在不同國(guó)家中也表現(xiàn)出較高的預(yù)測(cè)精度,進(jìn)一步體現(xiàn)了所提模型預(yù)測(cè)的穩(wěn)定性;此外,基于聚類策略的集成模型在較長(zhǎng)提前期內(nèi)表現(xiàn)均較好,表明該模型能夠較好地捕捉預(yù)測(cè)時(shí)序的數(shù)據(jù)特征,其表現(xiàn)不會(huì)隨著數(shù)據(jù)的變化而產(chǎn)生較為嚴(yán)重的劣化,這進(jìn)一步證明了所提模型的有效性。
中國(guó)石油大學(xué)學(xué)報(bào)(社會(huì)科學(xué)版)2023年5期