張居營(yíng),張 鏑,趙宣凱
(1.河北金融學(xué)院 金融與投資學(xué)院,河北 保定 071051;2.中信建投證券股份有限公司,北京 100010;3.中央財(cái)經(jīng)大學(xué)a.經(jīng)濟(jì)學(xué)院;b.中國(guó)互聯(lián)網(wǎng)經(jīng)濟(jì)研究院,北京 100081)
宏觀(guān)經(jīng)濟(jì)預(yù)測(cè)對(duì)政府、企業(yè)、居民等部門(mén)具有重要的信號(hào)指示作用,有助于及時(shí)決策,更好地進(jìn)行經(jīng)濟(jì)預(yù)判和防范風(fēng)險(xiǎn)。但數(shù)據(jù)采集和整理需要時(shí)間,數(shù)據(jù)發(fā)布往往具有滯后性,例如我國(guó)年度、季度GDP 數(shù)據(jù)通常滯后一個(gè)多月發(fā)布,現(xiàn)實(shí)情況突發(fā)變化可能導(dǎo)致決策陷入被動(dòng)。近年來(lái),由于受到全球競(jìng)爭(zhēng)格局重塑、地緣沖突加劇以及重大公共衛(wèi)生事件等一系列因素的影響,各國(guó)經(jīng)濟(jì)波動(dòng)愈加劇烈,趨勢(shì)反轉(zhuǎn)概率加大,促使決策者更加注重宏觀(guān)經(jīng)濟(jì)預(yù)判,以提前布局、制定合理決策來(lái)化解風(fēng)險(xiǎn),這便產(chǎn)生了實(shí)時(shí)預(yù)測(cè)(Nowcasting)的方法。目前,實(shí)時(shí)預(yù)測(cè)仍面臨兩大障礙:一是數(shù)據(jù)統(tǒng)計(jì)方面,宏觀(guān)經(jīng)濟(jì)變量門(mén)類(lèi)眾多,項(xiàng)目繁雜,且方法不斷更新,統(tǒng)計(jì)指標(biāo)與統(tǒng)計(jì)口徑紛繁復(fù)雜,頻率各不相同,時(shí)常面臨日、周、旬、月、季度、年度等混頻數(shù)據(jù)問(wèn)題,且存在數(shù)據(jù)缺失問(wèn)題,如何高質(zhì)量地從多維數(shù)據(jù)中提取有效信息,并進(jìn)行精準(zhǔn)、及時(shí)預(yù)測(cè)是一大難題;二是預(yù)測(cè)方法方面,采用單一指標(biāo)的預(yù)測(cè)方法,如ARMA、GARCH 等容納的信息量相對(duì)有限,預(yù)測(cè)的波動(dòng)性較大,采用多指標(biāo)預(yù)測(cè)方法中以VAR 為代表的傳統(tǒng)模型存在“維度詛咒”問(wèn)題,變量個(gè)數(shù)較多時(shí)參數(shù)難以估計(jì),而采用稀疏建模的高維數(shù)據(jù)處理方法篩選部分變量參與預(yù)測(cè)的過(guò)程中必定會(huì)損失一部分信息,同時(shí)對(duì)于混頻數(shù)據(jù)缺失值過(guò)多的問(wèn)題也缺少合理辦法進(jìn)行有效填補(bǔ),導(dǎo)致其使用存在限制。
動(dòng)態(tài)因子模型在一定程度上能解決上述問(wèn)題,它將宏觀(guān)變量視為“公共因子”和“特質(zhì)擾動(dòng)項(xiàng)”兩個(gè)部分,通過(guò)信息組合和噪聲過(guò)濾,提取主要因素,在假設(shè)宏觀(guān)經(jīng)濟(jì)不同部門(mén)的波動(dòng)是由若干“公共因子”共同驅(qū)動(dòng)的條件下,對(duì)相應(yīng)變量進(jìn)行預(yù)測(cè)[1]。動(dòng)態(tài)因子模型可以表示為狀態(tài)空間的形式,應(yīng)用卡爾曼濾波構(gòu)造似然函數(shù),并用極大似然估計(jì)法來(lái)估計(jì)參數(shù),從而處理不規(guī)則混頻數(shù)據(jù),但是估計(jì)過(guò)程中會(huì)用到非線(xiàn)性的數(shù)值優(yōu)化算法,對(duì)高維度的數(shù)據(jù)處理能力有限。后期Stock 和Watson(2002)[2]、Forni 等(2005)[3]通過(guò)放松假定條件,在允許特質(zhì)擾動(dòng)項(xiàng)滿(mǎn)足一定條件時(shí)應(yīng)用主成分分析法提取因子。Doz等(2011)[4]進(jìn)一步應(yīng)用卡爾曼濾波算法對(duì)主成分估計(jì)的各因子初始值進(jìn)行修正,得到了較為穩(wěn)健而準(zhǔn)確的因子估計(jì)值,形成了卡爾曼濾波算法兩步估計(jì)框架。目前動(dòng)態(tài)因子模型的實(shí)時(shí)預(yù)測(cè)得到廣泛應(yīng)用,劉漢和劉金全(2011)[5]對(duì)我國(guó)季度GDP 進(jìn)行實(shí)時(shí)預(yù)測(cè),取得了較好的預(yù)測(cè)效果,Allan 等(2014)[6]用實(shí)時(shí)預(yù)測(cè)方法估計(jì)了部分?jǐn)?shù)據(jù)沒(méi)有專(zhuān)門(mén)發(fā)布的蘇格蘭的GDP 增長(zhǎng),為地區(qū)經(jīng)濟(jì)實(shí)時(shí)預(yù)報(bào)提供了借鑒。
基于動(dòng)態(tài)因子模型的實(shí)時(shí)預(yù)測(cè)方法雖然能夠解決混頻數(shù)據(jù)發(fā)布不同步、數(shù)據(jù)缺失的問(wèn)題,但是,在不確定性沖擊下,宏觀(guān)預(yù)測(cè)仍存在效果不佳、時(shí)滯性等問(wèn)題,如不確定性沖擊導(dǎo)致經(jīng)濟(jì)先下降再回升的“V”型反轉(zhuǎn)加大了實(shí)時(shí)預(yù)測(cè)難度[7]。尚泰等(2016)[8]提出了基于卡爾曼濾波的三階段固定區(qū)間平滑算法,指出該算法能夠循環(huán)多次使用卡爾曼濾波,提高估計(jì)精度,并在初始狀態(tài)未知的情況下具有較強(qiáng)應(yīng)用價(jià)值,但是該方面尚未應(yīng)用到宏觀(guān)經(jīng)濟(jì)實(shí)時(shí)預(yù)測(cè)方法中。鑒于此,本文在動(dòng)態(tài)因子模型實(shí)時(shí)預(yù)測(cè)的參數(shù)估計(jì)中改進(jìn)卡爾曼濾波的固定區(qū)間平滑算法,引入再次前向?yàn)V波平滑過(guò)程的三階段算法,探討其預(yù)測(cè)效果,并驗(yàn)證改進(jìn)算法是否能夠更有效地利用先驗(yàn)信息,提升預(yù)測(cè)精度,在經(jīng)濟(jì)運(yùn)行非常規(guī)狀態(tài)下是否也能快速響應(yīng),改善預(yù)測(cè)時(shí)滯性問(wèn)題。
動(dòng)態(tài)因子模型假設(shè)n個(gè)變量在t期的觀(guān)測(cè)向量yt=(yi,t,…,yn,t)T可以由r個(gè)難以觀(guān)測(cè)到的動(dòng)態(tài)公共因子向量ft=(fi,t,…,fr,t)T以及特異因子et=( ei,t,…,en,t)T來(lái)描述,形式如下:式(1)為測(cè)量方程,描述了數(shù)據(jù)yt和動(dòng)態(tài)因子ft之間的關(guān)系,其中C 為n×r 的因子載荷矩陣(通常r ?n)。ft、et分別為不同變量序列之間的共同成分、特異成分,并且假定et~N(0,R)。 R 是測(cè)量噪聲協(xié)方差,實(shí)際操作中一般可以觀(guān)測(cè)到,是濾波器的已知條件。式(2)為轉(zhuǎn)移方程,假定隱含的動(dòng)態(tài)因子向量服從VAR(1)過(guò)程,A 為r×r 的VAR 過(guò)程轉(zhuǎn)移稀疏矩陣。 μt為r 維列向量且μt~N(0,Q)。式(1)和式(2)共同構(gòu)成了一個(gè)狀態(tài)空間模型,ft、et都是未觀(guān)測(cè)到的狀態(tài)。通過(guò)計(jì)算主成分初始化模型的待估參數(shù),將主成分視為真正的公共因子。用yt對(duì)ft的初始估計(jì)值做最小二乘回歸,即可得到C 的初始估計(jì)和et向量,計(jì)算et的協(xié)方差矩陣即得到R 的初始估計(jì)。將ft的協(xié)方差矩陣記為P ,根據(jù)ft的初始值計(jì)算出P 的初始估計(jì)。
在得到所有未知參數(shù)的初始估計(jì)后,就可以使用基于卡爾曼濾波的兩階段固定區(qū)間平滑算法進(jìn)行參數(shù)估計(jì)和數(shù)據(jù)更新,主要分為前向?yàn)V波和后向平滑過(guò)程。
前向?yàn)V波過(guò)程將ft與P 的初始估計(jì)記為對(duì)C 、A、R、Q 分別賦予初始值然后利用t-1 期的數(shù)據(jù)來(lái)預(yù)測(cè)t 期的參數(shù),這一步對(duì)ft與P 的預(yù)測(cè)結(jié)果分別記為,通過(guò)計(jì)算卡爾曼增益:并設(shè)定閾值,來(lái)實(shí)現(xiàn)對(duì)第1期到第t 期的預(yù)測(cè)更新,從和開(kāi)始迭代循環(huán)得到和,完成前向?yàn)V波的過(guò)程。后向平滑過(guò)程是將正向?yàn)V波最后得到的和按時(shí)間t 逆向倒推,t 依次取N-1,N-2,…,0,每一步的平滑步驟如下:首先,計(jì)算平滑增益矩陣其次,進(jìn)行平滑估計(jì)fs,k=ff,k+Hs,k(fs,k+1-ff,k+1/k);最后,計(jì)算平滑協(xié)方差矩陣變量下標(biāo)f 和s 分別代表該時(shí)刻的正向?yàn)V波結(jié)果和平滑結(jié)果。其中,為系統(tǒng)狀態(tài)轉(zhuǎn)移矩陣。
尚泰等(2016)[8]提出了基于卡爾曼濾波的三階段固定區(qū)間平滑算法,相比兩階段平滑算法,用第二階段后向平滑過(guò)程得到的作為濾波初始值,再次從頭到尾處理觀(guān)測(cè)值,并得到最終的狀態(tài)估計(jì),即為三階段固定區(qū)間平滑估計(jì)的輸出。與兩階段固定區(qū)間平滑算法相比,三階段算法由于多次使用卡爾曼濾波,理論上使得穩(wěn)定性獲得進(jìn)一步提升,充分利用了現(xiàn)有數(shù)據(jù)中公共因子與特異因子信息的先驗(yàn)信息,并做了變化趨勢(shì)上的再次平滑,因此更接近經(jīng)濟(jì)實(shí)際運(yùn)行狀態(tài)。
考慮到宏觀(guān)經(jīng)濟(jì)中的統(tǒng)計(jì)變量門(mén)類(lèi)的復(fù)雜性、變量間信息交叉性,本文在構(gòu)建數(shù)據(jù)集時(shí),將宏觀(guān)經(jīng)濟(jì)分為經(jīng)濟(jì)運(yùn)行、景氣與信心、工業(yè)、投資、消費(fèi)與價(jià)格、勞動(dòng)力、金融與貨幣七大門(mén)類(lèi)。不同門(mén)類(lèi)混頻指標(biāo)的選取見(jiàn)下頁(yè)表1和下文表2,共計(jì)81 個(gè)指標(biāo),其中月度指標(biāo)66 個(gè),季度指標(biāo)15 個(gè),時(shí)間跨度為2005 年1 月1 日至2022 年11 月31日,數(shù)據(jù)來(lái)自國(guó)家統(tǒng)計(jì)局官網(wǎng)季度與月度公開(kāi)數(shù)據(jù)、CEIC數(shù)據(jù)庫(kù)、Wind數(shù)據(jù)庫(kù)等??紤]到預(yù)測(cè)對(duì)象的不同,參考唐曉彬等(2022)[9]在對(duì)宏觀(guān)經(jīng)濟(jì)進(jìn)行實(shí)時(shí)預(yù)測(cè)時(shí)選取的指標(biāo),對(duì)于季度GDP同比增速的預(yù)測(cè),主要從投資、消費(fèi)、貿(mào)易、就業(yè)以及相關(guān)行業(yè)、工業(yè)運(yùn)行、金融狀況等方面選取變量;對(duì)于月度CPI的預(yù)測(cè),主要考慮整體經(jīng)濟(jì)運(yùn)行狀況、景氣指數(shù)、貨運(yùn)物流、消費(fèi)與價(jià)格、金融貨幣等與價(jià)格有關(guān)的變量,具體見(jiàn)表1和表2的第5列。
表1 數(shù)據(jù)集變量選擇情況表(2)
數(shù)據(jù)處理主要包括缺失值填補(bǔ)、標(biāo)準(zhǔn)化處理、季節(jié)性調(diào)整等,在將季度指標(biāo)數(shù)據(jù)視為同時(shí)期對(duì)應(yīng)月度數(shù)據(jù)最后一期的數(shù)據(jù)時(shí),其余時(shí)期的數(shù)據(jù)將視為缺失值,獲取的宏觀(guān)數(shù)據(jù)中還有一些月份也存在缺失值,如“春節(jié)效應(yīng)”導(dǎo)致部分指標(biāo)缺少1月份的數(shù)據(jù)等。缺失值填補(bǔ)、標(biāo)準(zhǔn)化處理都納入動(dòng)態(tài)因子模型初始環(huán)節(jié)中,標(biāo)準(zhǔn)化處理則在主成分的因子提取中。缺失值填補(bǔ)是基于卡爾曼濾波進(jìn)行的,引入實(shí)時(shí)估計(jì)得到的動(dòng)態(tài)因子對(duì)缺失值進(jìn)行動(dòng)態(tài)補(bǔ)充,將缺失值視為上一期觀(guān)測(cè)值與權(quán)重的乘積,再加上動(dòng)態(tài)因子的和,然后根據(jù)卡爾曼濾波估計(jì)結(jié)果進(jìn)行更新。本文還對(duì)除比率、增長(zhǎng)率之外的指數(shù)數(shù)據(jù)采用X-12-ARIMA 等進(jìn)行季節(jié)性調(diào)整。
按照上述步驟,利用本文所提及的兩階段、三階段平滑方法,分別以我國(guó)實(shí)際GDP 同比增速、CPI 同比增速為被預(yù)測(cè)變量,納入動(dòng)態(tài)因子模型中進(jìn)行實(shí)時(shí)預(yù)測(cè),每月預(yù)測(cè)一次,將得到的擬合值與實(shí)際值,以及與單指標(biāo)預(yù)測(cè)方法ARMA、ARMA-GARCH 的結(jié)果進(jìn)行比對(duì)。參照以往做法,采用均方根預(yù)測(cè)誤差(RMSFE)、平均絕對(duì)百分比誤差(MAPE)、對(duì)稱(chēng)平均絕對(duì)百分比誤差(SMAPE)評(píng)價(jià)采用兩階段與三階段固定區(qū)間平滑算法的實(shí)時(shí)預(yù)測(cè)效果。
下頁(yè)圖1為GDP同比增速的預(yù)測(cè)值與實(shí)際值比較,每月實(shí)際值是將該季度GDP按月填充。2020年以前經(jīng)濟(jì)處于平穩(wěn)發(fā)展階段,宏觀(guān)經(jīng)濟(jì)各部門(mén)、各要素保持慣性運(yùn)行狀態(tài),因此,2018—2019年兩階段與三階段固定區(qū)間平滑算法的預(yù)測(cè)值、實(shí)際值的偏差較小,且兩個(gè)預(yù)測(cè)值的差別也不大,而ARMA、ARMA-GARCH 雖然保持了GDP 增長(zhǎng)趨勢(shì),但預(yù)測(cè)值與實(shí)際值仍有較大偏差。2020 年以后重大公共衛(wèi)生事件對(duì)經(jīng)濟(jì)的結(jié)構(gòu)性沖擊導(dǎo)致GDP增長(zhǎng)呈現(xiàn)“V”型反轉(zhuǎn)與不穩(wěn)定波動(dòng),非常規(guī)情況下兩階段與三階段算法實(shí)時(shí)預(yù)測(cè)均出現(xiàn)偏差,體現(xiàn)了預(yù)測(cè)的時(shí)滯性,如2020年第一季度的“V”型反轉(zhuǎn)、2021年第一季度的“倒V”型反轉(zhuǎn),當(dāng)期均無(wú)法直接捕捉到,相比較而言,三階段算法響應(yīng)速度較快,體現(xiàn)了對(duì)經(jīng)濟(jì)增長(zhǎng)“V”型反轉(zhuǎn)的更快預(yù)測(cè),因?yàn)閷?duì)先驗(yàn)信息利用更充分以及前次的前向?yàn)V波平滑,對(duì)月度頻率數(shù)據(jù)提取因子的再次平滑可以較好地預(yù)測(cè)季度數(shù)據(jù)值,所以使得3月、6月、9月、12月的預(yù)測(cè)值更接近實(shí)際值,兩階段算法則具有1 期的滯后性。ARMA、ARMA-GARCH 則會(huì)出現(xiàn)5 期以上的滯后性,只是趨勢(shì)上的預(yù)測(cè),難以提取更多信息,因此效果較差。
圖1 不同方法GDP同比增速預(yù)測(cè)值與實(shí)際值比較
下頁(yè)表3 顯示了采用RMSFE、MAPE、SMAPE 三個(gè)指標(biāo)評(píng)價(jià)不同方法的預(yù)測(cè)效果的結(jié)果??梢钥吹?,非常規(guī)狀態(tài)下各方法的預(yù)測(cè)誤差均變大,但相比較而言,三階段算法預(yù)測(cè)誤差最低,因此,其預(yù)測(cè)精度最高,兩階段算法次之,ARMA、ARMA-GARCH的預(yù)測(cè)精度遠(yuǎn)低于前兩者。
表3 GDP同比增速預(yù)測(cè)的效果評(píng)價(jià)
下頁(yè)圖2和表4為CPI同比增速的實(shí)時(shí)預(yù)測(cè)結(jié)果與效果評(píng)價(jià)結(jié)果。可以看到,經(jīng)濟(jì)平穩(wěn)運(yùn)行狀態(tài)時(shí)CPI增速在較窄區(qū)間內(nèi)波動(dòng),兩階段、三階段算法能夠較好地預(yù)測(cè)其走勢(shì),非常規(guī)狀態(tài)下CPI增速波動(dòng)區(qū)間變大,“V”型反轉(zhuǎn)出現(xiàn)較為頻繁,導(dǎo)致部分時(shí)點(diǎn)兩階段、三階段算法預(yù)測(cè)具有滯后性,如2020年5月、2021年5月、2022年1月,由于CPI是月度發(fā)布指標(biāo),三階段算法也無(wú)法做到對(duì)反轉(zhuǎn)信號(hào)的快速響應(yīng),因此需要更高頻的周度、日度數(shù)據(jù)來(lái)實(shí)現(xiàn)有效實(shí)時(shí)預(yù)測(cè)。另外,在預(yù)測(cè)精度上,三階段算法也是最高的,ARMA、ARMA-GARCH的預(yù)測(cè)精度都相對(duì)較低。
圖2 不同方法CPI預(yù)測(cè)值與實(shí)際值比較
表4 CPI同比增速預(yù)測(cè)的效果評(píng)價(jià)
本文將基于卡爾曼濾波算法改進(jìn)的三階段固定區(qū)間平滑算法引入高維混頻數(shù)據(jù)的動(dòng)態(tài)因子模型參數(shù)估計(jì)過(guò)程,令其替代傳統(tǒng)的兩階段平滑算法,并應(yīng)用于我國(guó)宏觀(guān)經(jīng)濟(jì)預(yù)測(cè)中以探討該種估計(jì)方法的優(yōu)勢(shì)與不足。實(shí)證結(jié)果表明:(1)實(shí)時(shí)預(yù)測(cè)能夠較好地預(yù)測(cè)經(jīng)濟(jì)平穩(wěn)狀態(tài)下的發(fā)展趨勢(shì),預(yù)測(cè)偏差較小,但是當(dāng)經(jīng)濟(jì)處于非常規(guī)情況下,針對(duì)“V”型反轉(zhuǎn)的預(yù)測(cè)會(huì)出現(xiàn)時(shí)滯性;(2)基于卡爾曼濾波的三階段固定區(qū)間平滑算法能夠?qū)崿F(xiàn)對(duì)現(xiàn)有數(shù)據(jù)的再次平滑,相比兩階段平滑算法,有效利用了現(xiàn)有數(shù)據(jù)中的公共因子與特異因子的先驗(yàn)信息,并通過(guò)再次前向?yàn)V波平滑,預(yù)測(cè)精度進(jìn)一步提升,針對(duì)“V”型反轉(zhuǎn)走勢(shì)也能快速響應(yīng),應(yīng)用月度指標(biāo)能夠較好預(yù)測(cè)當(dāng)季GDP增速,但面對(duì)月度CPI 增速預(yù)測(cè)時(shí)實(shí)時(shí)響應(yīng)能力不足,因此,需要結(jié)合更高頻的周度、日度數(shù)據(jù)等,應(yīng)用三階段固定區(qū)間平滑算法才能實(shí)現(xiàn)對(duì)宏觀(guān)經(jīng)濟(jì)的多層面、高質(zhì)量的監(jiān)測(cè)與預(yù)警。