孫 妮,潘 璠,肖婭晨,彭 放,周曉磊
(1.國家電網(wǎng)有限公司大數(shù)據(jù)中心,北京 100052;2.清華大學(xué)社會科學(xué)學(xué)院,北京 100084)
無論政府經(jīng)濟政策的制定,還是企業(yè)經(jīng)營策略的選擇,都需要及時、準(zhǔn)確的了解當(dāng)前宏觀經(jīng)濟形勢。GDP 是刻畫宏觀經(jīng)濟形勢的最核心經(jīng)濟指標(biāo),一直以來備受各經(jīng)濟主體的關(guān)注。盡管GDP 的預(yù)測是許多學(xué)者及機構(gòu)研究的重點,但傳統(tǒng)預(yù)測技術(shù)的不足以及常用經(jīng)濟統(tǒng)計數(shù)據(jù)的滯后限制了GDP 預(yù)測的時效性與精準(zhǔn)度。伴隨著人類社會步入大數(shù)據(jù)時代,基于大數(shù)據(jù)的宏觀經(jīng)濟現(xiàn)時預(yù)測受到越來越多的重視。電力數(shù)據(jù)與經(jīng)濟活動密切相關(guān)是經(jīng)濟的“晴雨表”,本文將利用電力大數(shù)據(jù)實時、客觀、顆粒度細(xì)等優(yōu)勢實現(xiàn)對GDP 更精準(zhǔn)的現(xiàn)時預(yù)測,以為政府、企業(yè)的決策提供及時可靠的數(shù)據(jù)支撐。
就現(xiàn)有文獻來看,當(dāng)前的宏觀經(jīng)濟預(yù)測模型依據(jù)其是否可以直接應(yīng)用不同頻率的數(shù)據(jù)可分為同頻數(shù)據(jù)預(yù)測模型和混頻數(shù)據(jù)預(yù)測模型兩類。同頻數(shù)據(jù)預(yù)測模型的預(yù)測基于同頻數(shù)據(jù)進行,高頻數(shù)據(jù)應(yīng)該轉(zhuǎn)化為低頻數(shù)據(jù)。當(dāng)前Sims(1980)[1]提出的VAR模型是各國中央銀行構(gòu)建宏觀經(jīng)濟預(yù)測模型的基礎(chǔ)(張勁帆等,2018)[2],國內(nèi)許多宏觀經(jīng)濟預(yù)測模型的構(gòu)建也是基于VAR 進行,如中國人民銀行的季度VAR模型及Logit-VAR 月度模型,周建和況明(2015)[3]建立的中型宏觀系統(tǒng)季度同頻貝葉斯模型。隨著深度學(xué)習(xí)技術(shù)的發(fā)展,國內(nèi)有學(xué)者利用深度學(xué)習(xí)預(yù)測GDP,如肖爭艷等(2020)[4]、徐映梅和陳堯(2021)[5]利用LSTM模型就GDP 進行預(yù)測并取得較好的預(yù)測效果。
混頻數(shù)據(jù)預(yù)測模型能夠直接基于混頻數(shù)據(jù)進行宏觀經(jīng)濟分析,這意味著預(yù)測時可以利用高頻數(shù)據(jù)提供的當(dāng)期信息,如此預(yù)測的準(zhǔn)確性與時效性都將得以提高。當(dāng)前應(yīng)用較多的混頻數(shù)據(jù)模型為Ghysels等(2005)[6]提出的混頻數(shù)據(jù)抽樣模型(MIDAS),國內(nèi)有部分學(xué)者利用該模型開展GDP 的預(yù)測研究。劉漢和劉金全(2011)[7]以消費、投資、出口作為解釋變量的研究結(jié)果表明,就中國宏觀經(jīng)濟的短期預(yù)測而言MIDAS模型比同頻數(shù)據(jù)模型具有顯著更佳的精確性,而且包含自回歸項的MIDAS模型較之于不包含自回歸項的MIDAS模型具有更佳的預(yù)測精確性。鄭挺國和尚玉皇(2013)[8]基于股票波動率、人民幣實際有效匯率等金融變量的研究支持了劉漢和劉金全(2011)[7]的上述研究結(jié)論,而且發(fā)現(xiàn)基于包含自回歸項的MIDAS模型的預(yù)測組合的精確性占優(yōu)。王維國和于揚(2016)[9]針對等權(quán)重等四類不同權(quán)重下MIDAS預(yù)測組合精確性的研究發(fā)現(xiàn),基于BIC 構(gòu)建的MIDAS模型預(yù)測組合在短期預(yù)測中表現(xiàn)最優(yōu)。
近年來國內(nèi)學(xué)者開始關(guān)注基于新興數(shù)據(jù)的GDP 預(yù)測,如劉濤雄和徐曉飛(2015)[10]、何強和董志勇(2020)[11]利用互聯(lián)網(wǎng)大數(shù)據(jù)的預(yù)測,范強等(2019)[12]、盧秀等(2020)[13]利用燈光數(shù)據(jù)的預(yù)測。然而當(dāng)前鮮有學(xué)者利用電力大數(shù)據(jù)預(yù)測GDP,探究電力大數(shù)據(jù)預(yù)測宏觀經(jīng)濟形勢的能力。許多學(xué)者就電力消費與經(jīng)濟發(fā)展關(guān)系的研究表明,盡管研究方法與數(shù)據(jù)存在差異,但大多數(shù)研究表明電力消費增長與經(jīng)濟增長間在短期存在因果關(guān)系,在長期存在均衡關(guān)系(楊東偉,2013)[14]。作為社會經(jīng)濟活動的結(jié)果,電力數(shù)據(jù)是必然可以反映經(jīng)濟發(fā)展的情況,成為預(yù)測宏觀經(jīng)濟的有效指標(biāo)。
1.單變量MIDAS模型。MIDAS模型由Ghysels等(2005)[6]首次提出,其主要特點為通過權(quán)重函數(shù)B(L1/m;θ)將高頻數(shù)據(jù)直接引入模型避免了高頻數(shù)據(jù)的低頻化處理,表達形式如式(1)所示。
其中,m表示的是高頻數(shù)據(jù)與低頻數(shù)據(jù)間頻率的倍差,為加權(quán)函數(shù),其中表示高頻數(shù)據(jù)的滯后算子0,1,…,K,t=1,2,…,T),K為所設(shè)定的高頻數(shù)據(jù)的最大滯后階數(shù)。
基于式(1)可得相應(yīng)的預(yù)測模型MIDAS(m,K,h)如下:
其中,h表示預(yù)測步長。就本文的分析而言,GDP 增長率為季度數(shù)據(jù)頻率較低,而選擇的解釋變量為月度數(shù)據(jù)頻率較高,在這種情形下當(dāng)h小于3(此時在預(yù)測GDP 時用到了解釋變量季度的一部分信息)時即為現(xiàn)時預(yù)測。h等于0、1、2 意味著在現(xiàn)時預(yù)測中分別用到季度3 個月、2 個月及1 個月的月度數(shù)據(jù)。關(guān)于權(quán)重函數(shù)我們選擇指數(shù)Almon 多項式函數(shù)。
文中將基于常用的兩參數(shù)指數(shù)Almon 多項式函數(shù)進行分析,同時我們還將參考Clements 和Galva軇o(2008)[15]的做法令θ1≤300,θ2<0。此處對指數(shù)Almon 多項式參數(shù)限制一方面可以確保分析所需的權(quán)重得到滿足,另一方面可以確保權(quán)重為正并使得方差的誤差逼近于零(劉漢和劉金全,2011)[7]。
2.MIDAS-AR模型。宏觀經(jīng)濟變量一般存在慣性,因此在預(yù)測宏觀經(jīng)濟變量時有必要將其滯后項作為解釋變量引入單變量MIDAS模型。帶有p階自回歸滯后項的MIDAS-AR模型可表示如下。
如式(5)給出了相應(yīng)的預(yù)測模型MIDAS(m,K,h)-AR(p):
3.M(n)-MIDAS模型。宏觀經(jīng)濟變量處于復(fù)雜的經(jīng)濟系統(tǒng)中,受到諸多經(jīng)濟因素的影響,故有必要采用多變量MIDAS模型進行預(yù)測?;谏鲜龅氖剑?)和式(4)可以得到相應(yīng)的多變量模型M(n)-MIDAS和M(n)-MIDAS-AR,如下的式(6)和式(7)為相應(yīng)的表達式:
其中,n表示模型中解釋變量的數(shù)目。
由式(6)和式(7)可進一步得到相應(yīng)的預(yù)測模型M(n)-MIDAS(m,K,h)、M(n)-MIDAS(m,K,h)-AR(p)如下:
4.預(yù)測組合。當(dāng)被預(yù)測目標(biāo)受多個解釋變量影響時,數(shù)據(jù)樣本容量及過多的待估參數(shù)將限制M(n)-MIDAS的預(yù)測效果。這種情況下,預(yù)測組合(Forecast combination)是一個常用的解決方法。Timmermann(2006)[16]對預(yù)測組合方法進行總結(jié),認(rèn)為通過一定的權(quán)重將若干模型的預(yù)測結(jié)果組合起來可以提高預(yù)測精度。基于n個模型的預(yù)測組合可表示如公式(10)所示。
其中,表示t時刻的第i個預(yù)測結(jié)果,wi,t表示組合預(yù)測中第i個預(yù)測結(jié)果的權(quán)重,本文選擇比較常用的BIC 權(quán)重。
其中,BICi表示第i個預(yù)測結(jié)果的BIC信息準(zhǔn)則值。
1.基準(zhǔn)模型。為比較分析不同預(yù)測模型及預(yù)測方法組合的優(yōu)劣程度,本文選ARMA(Autoregressive moving average model,自回歸滑動平均模型)作為基準(zhǔn)模型,采用MSFE(mean squared forecast errors,均方預(yù)測誤差)測度模型的預(yù)測效果,MSFE 的計算公式如(12)所示。
其中,和yt分別表示預(yù)測值和實際值。進一步的本文用均方預(yù)測誤差的比值(ratio ofmean squared forecast errors,rMSFE)來衡量預(yù)測模型的優(yōu)劣,rMSFE可以用公式(13)表示。
公式(13)中,MSFENBM和MSFEBM分別表示所用非基準(zhǔn)模型和基準(zhǔn)預(yù)測模型的MSFE值。若rMSFE小于1 則意味著非基準(zhǔn)模型有更好的預(yù)測準(zhǔn)確度,而且比值越小意味著準(zhǔn)確度越高。
2.數(shù)據(jù)說明。本文的預(yù)測基于電力大數(shù)據(jù)和傳統(tǒng)的經(jīng)濟統(tǒng)計數(shù)據(jù)兩類數(shù)據(jù)開展。文中所用購電大數(shù)據(jù)為通過加總國內(nèi)26 個省5 億多用戶的用電數(shù)據(jù)而得到的月度同比購電數(shù)據(jù)指標(biāo),包含全行業(yè)及其三種不同劃分下的電力數(shù)據(jù)指標(biāo)共65 個。第一種劃分按產(chǎn)業(yè)進行,即將整個行業(yè)劃分為第一產(chǎn)業(yè)、第二產(chǎn)業(yè)、第三產(chǎn)業(yè)三類。第二種劃分將整個行業(yè)分為農(nóng)林牧漁、工業(yè)、建筑業(yè)等八類。第三種劃分為對第二種劃分的進一步分類,此處不再給出具體類別。電力數(shù)據(jù)均來自國家電網(wǎng)有限公司大數(shù)據(jù)中心,時間跨度為2014 年1 月至2019 年12 月。
為了充分比較說明電力大數(shù)據(jù)在GDP 現(xiàn)時預(yù)測中的價值,文中還將選擇傳統(tǒng)的經(jīng)濟統(tǒng)計數(shù)據(jù)作為解釋變量。關(guān)于經(jīng)濟統(tǒng)計變量的選擇,考慮到消費、投資、出口是影響經(jīng)濟增長的重要因素故將其作為解釋變量,同時選擇社會消費品零售總額月度同比增速、固定資產(chǎn)投資完成額月度同比增速以及出口總額月度同比增速作為相應(yīng)的測度指標(biāo)。本文所用經(jīng)濟統(tǒng)計數(shù)據(jù)均來源于國家統(tǒng)計局,其中季度GDP 增長率的時間區(qū)間為2000 年第一季度至2019年第四季度,其他經(jīng)濟變量同比數(shù)據(jù)的時間區(qū)間為2000 年1 月至2019 年12 月。
為得到更加精確的預(yù)測結(jié)果,本文首先采用X12 方法對所有數(shù)據(jù)進行季節(jié)性調(diào)整進一步消除季節(jié)性,然后采用ADF 方法檢驗季調(diào)后時間序列的平穩(wěn)性,若時間序列不平穩(wěn)則進行差分處理直至序列平穩(wěn)。限于篇幅本文不再給出平穩(wěn)性檢驗及差分次數(shù)的相應(yīng)結(jié)果。
本部分基于電力數(shù)據(jù)和MIDAS模型現(xiàn)時預(yù)測GDP,預(yù)測采用移動窗口和累積窗口兩種方法,樣本外預(yù)測區(qū)間為2018 年第四季度至2019 年第四季度。為充分分析電力數(shù)據(jù)的現(xiàn)時預(yù)測效果,本文不僅分析了不同劃分下分類指標(biāo)預(yù)測組合的預(yù)測效果,對第二、三兩種劃分。還給出了基于各劃分下所有分類指標(biāo)所提取動態(tài)因子的預(yù)測效果以及基于因子的預(yù)測組合的預(yù)測效果。限于篇幅文中將不再給出第二、三兩種劃分下各分類電力數(shù)據(jù)指標(biāo)的預(yù)測效果。
1.單變量MIDAS及其預(yù)測組合的效果分析。鑒于文中所用電力大數(shù)據(jù)的樣本較少,在應(yīng)用MIDAS模型時我們僅考慮最大滯后階數(shù)為6 和9 兩種情況。根據(jù)預(yù)測結(jié)果,當(dāng)最大滯后階數(shù)為6 時MIDAS具有更優(yōu)的預(yù)測效果。限于篇幅如下僅給出滯后階數(shù)為6 時現(xiàn)時預(yù)測的rMSFE,相關(guān)預(yù)測結(jié)果如表1、表2、表3 所示。表1 給出了全行業(yè)、各產(chǎn)業(yè)總購電指標(biāo)的預(yù)測rMSFE,以及三個產(chǎn)業(yè)預(yù)測組合的rMSFE。表2、表3 分別給出了第二劃分和第三劃分下相應(yīng)分類指標(biāo)預(yù)測組合、因子以及因子預(yù)測組合的預(yù)測rMSFE。
比較分析表1、表2、表3 中的rMSFE值可以得出如下結(jié)論:第一,所有預(yù)測的rMSFE值均小于1,這意味著基于ARMA模型并不能得到最優(yōu)的預(yù)測結(jié)果,即僅僅利用GDP 歷史信息的預(yù)測效果不是最優(yōu)的。第二,就總量指標(biāo)與其細(xì)分指標(biāo)預(yù)測組合的預(yù)測效果來看,預(yù)測組合的精準(zhǔn)度更佳。此外,比較三種劃分下預(yù)測組合的效果可知,第三種劃分明顯優(yōu)于第二種劃分和第一種劃分,而第二種劃分優(yōu)于第一種劃分。第三,就細(xì)分指標(biāo)預(yù)測組合與因子預(yù)測組合的預(yù)測效果來看,基于細(xì)分指標(biāo)預(yù)測組合的精準(zhǔn)度更佳。此外,比較兩種劃分下因子預(yù)測組合的預(yù)測效果可知,總體來看第二種劃分下預(yù)測效果更優(yōu)。
表1 基于全行業(yè)第一種劃分現(xiàn)時預(yù)測GDP 的rMSFE
表2 基于全行業(yè)第二種劃分現(xiàn)時預(yù)測GDP 的rMSFE
表3 基于全行業(yè)第三種劃分現(xiàn)時預(yù)測GDP 的rMSFE
2.單變量MIDAS-AR及其預(yù)測組合的效果分析。本部分利用分別引入1 階及4 階滯后自回歸項的MIDAS-AR模型進行預(yù)測,根據(jù)預(yù)測結(jié)果,當(dāng)引入4 階自回歸滯后項、最大滯后階數(shù)為6 時MIDASAR模型的預(yù)測效果更優(yōu),如表4、表5、表6 給出了相應(yīng)的預(yù)測結(jié)果。
表4 全行業(yè)第三種劃分現(xiàn)時預(yù)測GDP 的rMSFE
表5 基于全行業(yè)第二種劃分現(xiàn)時預(yù)測GDP 的rMSFE
表6 基于全行業(yè)第三種劃分現(xiàn)時預(yù)測GDP 的rMSFE
比較分析表4、表5、表6 中的rMSFE值可以得出如下結(jié)論:第一,所有預(yù)測的rMSFE值均小于1,這意味著基于ARMA模型并不能得到最優(yōu)的預(yù)測結(jié)果,即僅僅利用GDP 歷史信息的預(yù)測效果不是最優(yōu)的。第二,就總量指標(biāo)與其細(xì)分指標(biāo)預(yù)測組合的預(yù)測效果來看,總量指標(biāo)的預(yù)測效果未必優(yōu)于其細(xì)分指標(biāo)預(yù)測組合的預(yù)測效果,預(yù)測組合的預(yù)測效果可能顯著占優(yōu)。比較表4、表5、表6 中預(yù)測組合的效果可以發(fā)現(xiàn),表6 中預(yù)測組合的rMSFE值明顯小于表4、表5 中rMSFE值,同時也明顯小于全行業(yè)總電量相應(yīng)的rMSFE值,即對總量更細(xì)劃分的預(yù)測組合具有更佳的預(yù)測效果。第三,關(guān)于細(xì)分指標(biāo)預(yù)測組合與因子預(yù)測組合的預(yù)測效果,總體而言基于細(xì)分指標(biāo)的預(yù)測組合擁有更佳的精準(zhǔn)度。
關(guān)于MIDAS模型與MIDAS-AR模型預(yù)測效果,對比表1、表2、表3 中rMSFE的值與表4、表5、表6 中rMSFE的值可以發(fā)現(xiàn),單變量MIDAS-AR模型具有更佳的精準(zhǔn)度。這與劉漢和劉金全(2011)[7]以及鄭挺國和尚玉皇(2013)[8]的研究結(jié)論相一致,進一步支持了他們的結(jié)論。
本部分將就電力大數(shù)據(jù)和傳統(tǒng)經(jīng)濟統(tǒng)計指標(biāo)現(xiàn)時預(yù)測GDP 同比增長率中的預(yù)測效果進行比較。我們基于分別引入1 階及4 階滯后自回歸項的MIDAS-AR模型分析經(jīng)濟統(tǒng)計指標(biāo)的現(xiàn)時預(yù)測效果,根據(jù)結(jié)果發(fā)現(xiàn)引入4 階滯后自回歸項時的預(yù)測效果最佳。限于篇幅文中僅給出包含4 階自回歸滯后項的MIDAS-AR模型預(yù)測結(jié)果,相應(yīng)的預(yù)測rMSFE結(jié)果詳見如表7 所示。表7 不僅呈現(xiàn)分別基于消費、投資、出口的GDP 現(xiàn)時預(yù)測結(jié)果,還給出了基于消費、投資、出口的預(yù)測組合以及多元MIDAS模型的預(yù)測結(jié)果??梢园l(fā)現(xiàn),較之于消費、投資、出口,基于電力數(shù)據(jù)的預(yù)測效果全部占優(yōu)。這表明就GDP 的現(xiàn)時預(yù)測而言電力數(shù)據(jù)包含更多有用的信息。另外,還可以發(fā)現(xiàn)消費、投資的預(yù)測效果明顯的優(yōu)于出口,而且多元MIDAS模型的預(yù)測效果明顯優(yōu)于單變量MIDAS模型及其預(yù)測組合的預(yù)測效果。
表7 基于消費、投資、出口現(xiàn)時預(yù)測GDP 的rMSFE
對宏觀經(jīng)濟形勢進行更加及時準(zhǔn)確的預(yù)測,不僅是宏觀經(jīng)濟研究的重要領(lǐng)域,也是各經(jīng)濟主體普遍關(guān)注的重要內(nèi)容。本文充分利用電力大數(shù)據(jù)實時準(zhǔn)確、顆粒度細(xì)等優(yōu)勢,探究電力大數(shù)據(jù)在宏觀經(jīng)濟現(xiàn)時預(yù)測中的能力,從宏觀經(jīng)濟預(yù)測的角度進一步展示了電力數(shù)據(jù)經(jīng)濟“晴雨表”的作用。綜合實證分析的結(jié)果可得出如下結(jié)論:一是單變量MIDASAR模型的預(yù)測效果要顯著的優(yōu)于單變量MIDAS模型的預(yù)測效果,這與劉漢和劉金全(2011)[7]以及鄭挺國和尚玉皇(2013)[8]的研究結(jié)論相一致。二是相對于包含一階自回歸項的MIDAS-AR模型,包含四階自回歸項的MIDAS-AR模型具有更優(yōu)的現(xiàn)時預(yù)測效果;三是比較電力數(shù)據(jù)指標(biāo)與消費、投資、出口的GDP 現(xiàn)時預(yù)測效果發(fā)現(xiàn),電力數(shù)據(jù)指標(biāo)的預(yù)測能力顯著占優(yōu);四是通過比較電力數(shù)據(jù)總量指標(biāo)與其分量指標(biāo)預(yù)測組合的預(yù)測效果發(fā)現(xiàn),預(yù)測組合具有更佳的現(xiàn)時預(yù)測效果。