凌立文,張大斌,2
(1.華南農(nóng)業(yè)大學(xué) 數(shù)學(xué)與信息學(xué)院,廣州 510642;2.廣東白云學(xué)院 大數(shù)據(jù)與計(jì)算機(jī)學(xué)院,廣州 510450)
組合預(yù)測(cè)是預(yù)測(cè)領(lǐng)域的重要研究分支,自1969年Bates和Granger首次提出組合預(yù)測(cè)理論體系后,該方法隨即得到國(guó)內(nèi)外學(xué)者廣泛關(guān)注。單項(xiàng)預(yù)測(cè)模型通常僅包含預(yù)測(cè)對(duì)象的部分信息,通過(guò)一定規(guī)則組合各單項(xiàng)模型,可通過(guò)包含更全面的預(yù)測(cè)信息從而提高預(yù)測(cè)精度[1]。特別地,時(shí)間序列分析中真實(shí)數(shù)據(jù)生成過(guò)程通常具有區(qū)制轉(zhuǎn)換或參數(shù)漂移等特性,組合預(yù)測(cè)方法的引入,可減少由參數(shù)或模型錯(cuò)誤識(shí)別帶來(lái)的預(yù)測(cè)誤差[2];甚至在單項(xiàng)預(yù)測(cè)結(jié)果存在有偏性的情況下,通過(guò)組合能產(chǎn)生具有無(wú)偏性的預(yù)測(cè)結(jié)果[3]。因此,將不同預(yù)測(cè)模型進(jìn)行有效組合,可視為對(duì)無(wú)限逼近真實(shí)數(shù)據(jù)生成過(guò)程的有效補(bǔ)充[4]。
盡管組合預(yù)測(cè)的實(shí)證研究文獻(xiàn)數(shù)量繁多,但絕大多數(shù)是對(duì)已有方法的簡(jiǎn)單套用,缺乏針對(duì)組合預(yù)測(cè)模型構(gòu)建方法的系統(tǒng)研究。這涉及是否應(yīng)該進(jìn)行組合、應(yīng)該選取多少模型進(jìn)行組合以及選取哪種方法進(jìn)行組合等影響組合預(yù)測(cè)性能的關(guān)鍵問(wèn)題。為此,本文對(duì)組合預(yù)測(cè)領(lǐng)域相關(guān)文獻(xiàn)進(jìn)行梳理,圍繞以上三個(gè)關(guān)鍵問(wèn)題展開(kāi)述評(píng),簡(jiǎn)介組合預(yù)測(cè)模型的主要應(yīng)用領(lǐng)域,在此基礎(chǔ)上提出今后的研究方向,以期為該領(lǐng)域?qū)W者提供參考與借鑒。
面對(duì)當(dāng)今數(shù)量繁多的單項(xiàng)預(yù)測(cè)模型,是否應(yīng)該進(jìn)行組合預(yù)測(cè)成為學(xué)者決策的首要問(wèn)題。盡管大量文獻(xiàn)均報(bào)道組合模型預(yù)測(cè)性能優(yōu)于單項(xiàng)模型[5-8],但也存在個(gè)別例外情況[9,10]。為證明組合預(yù)測(cè)模型的普遍性?xún)?yōu)勢(shì),Hibon和Evgeniou[11]選擇M3競(jìng)賽數(shù)據(jù)庫(kù)中3003個(gè)時(shí)間序列和14種預(yù)測(cè)方法展開(kāi)實(shí)驗(yàn)研究,運(yùn)用全體樣本計(jì)算各預(yù)測(cè)方法的平均預(yù)測(cè)誤差(sMAPE),針對(duì)每一樣本窮盡所有可能的組合方式,基于海量實(shí)驗(yàn)數(shù)據(jù)得到以下結(jié)論。
(1)隨著組合模型個(gè)數(shù)的增加,最大預(yù)測(cè)誤差也隨之下降,這表明組合模型確實(shí)有助于改進(jìn)預(yù)測(cè)性能。但是,組合模型個(gè)數(shù)增加所引起預(yù)測(cè)誤差減小的邊際效應(yīng)會(huì)逐漸減弱,最優(yōu)組合數(shù)目通常為7個(gè)。
(2)從數(shù)據(jù)上看,組合模型的最小預(yù)測(cè)誤差略小于單項(xiàng)模型的最小預(yù)測(cè)誤差。但基于DM檢驗(yàn)框架發(fā)現(xiàn)不同方法最小預(yù)測(cè)誤差之間并不存在顯著性差異,表明組合模型中最佳策略的效果與最佳單項(xiàng)預(yù)測(cè)模型相當(dāng)。
(3)若以預(yù)測(cè)誤差的方差表征預(yù)測(cè)風(fēng)險(xiǎn),實(shí)驗(yàn)中隨著組合模型個(gè)數(shù)增加,預(yù)測(cè)誤差的方差隨之減少。這說(shuō)明,雖然組合模型未必是最優(yōu)模型,但總體而言,選擇組合模型的預(yù)測(cè)風(fēng)險(xiǎn)要小于選擇單項(xiàng)模型。
該研究基于大樣本實(shí)驗(yàn),論證了組合預(yù)測(cè)模型的普遍性?xún)?yōu)勢(shì),由此解決組合預(yù)測(cè)中的首要問(wèn)題。但最佳單項(xiàng)預(yù)測(cè)模型未必遜色于組合模型,這表明當(dāng)前絕大多數(shù)組合模型都是非劣性模型而非最優(yōu)模型。并特意指出,“是否應(yīng)該進(jìn)行組合預(yù)測(cè)”這一表述應(yīng)被替換為“如何選擇最佳的組合策略”,即如何進(jìn)一步提高組合預(yù)測(cè)精度。
如何提高組合預(yù)測(cè)精度,使其從非劣性模型轉(zhuǎn)為最優(yōu)模型,是預(yù)測(cè)領(lǐng)域?qū)<覍W(xué)者長(zhǎng)久以來(lái)的努力方向。從現(xiàn)有研究看,進(jìn)一步優(yōu)化單項(xiàng)模型選擇策略和組合權(quán)重確定方法,為改進(jìn)組合預(yù)測(cè)性能提供了可能性。
選擇哪些單項(xiàng)模型進(jìn)行組合是組合預(yù)測(cè)領(lǐng)域的一大難題[12]。實(shí)踐中大多將本領(lǐng)域應(yīng)用較為成熟的單項(xiàng)模型全部納入組合模型,這看似大而全,但缺少模型選擇依據(jù)、導(dǎo)致計(jì)算工作量巨大,且對(duì)預(yù)測(cè)性能提升效果不明顯。此外,學(xué)者還發(fā)現(xiàn)若引入不恰當(dāng)?shù)膯雾?xiàng)模型,甚至可能降低組合模型預(yù)測(cè)精度[13],由此可見(jiàn)正確選擇單項(xiàng)模型的必要性與重要性。
2.1.1 基于模型裁剪的視角
模型裁剪(model trimming)本質(zhì)上是一種收縮策略,即按照一定準(zhǔn)則(通常以預(yù)測(cè)精度為標(biāo)準(zhǔn))縮小備選模型數(shù)量。Aiolfi和Timmermann(2006)[14]依據(jù)單項(xiàng)模型在訓(xùn)練集的預(yù)測(cè)表現(xiàn),依次在備選模型中選取表現(xiàn)最好的前75%、50%和25%進(jìn)行組合,發(fā)現(xiàn)這種外生性固定裁剪方法可顯著提升組合預(yù)測(cè)性能,即以更少模型產(chǎn)生更好效果。然而,該方法并未考慮不同備選模型預(yù)測(cè)結(jié)果的統(tǒng)計(jì)性差異,Samuels和Sekkel(2017)[15]在此基礎(chǔ)上提出基于模型置信集(Model Confidence Set,MCS)的裁剪方法,篩選出統(tǒng)計(jì)意義上的最佳模型進(jìn)行組合,并對(duì)美國(guó)GDP、新建住房量和工業(yè)產(chǎn)出等宏觀經(jīng)濟(jì)指標(biāo)展開(kāi)預(yù)測(cè)。通過(guò)對(duì)比簡(jiǎn)單平均組合法、外生性固定裁剪法和基于MCS的模型裁剪法,發(fā)現(xiàn)經(jīng)模型裁剪的組合預(yù)測(cè)性能普遍優(yōu)于簡(jiǎn)單平均法;同時(shí),基于MCS的模型裁剪方法比外生性固定裁剪方法具有更好的魯棒性以及更大的預(yù)測(cè)性能提升空間。此外,有學(xué)者認(rèn)為基于模型裁剪的組合預(yù)測(cè)法僅在原始數(shù)據(jù)包含極值時(shí)才顯現(xiàn)出優(yōu)越性,因?yàn)橥ㄟ^(guò)裁剪可以對(duì)極端數(shù)據(jù)/信息賦予零權(quán)重,減少組合模型的噪聲,從而提高預(yù)測(cè)準(zhǔn)確度。然而,需要進(jìn)行多大程度的裁剪值得探討,Granger等[16]建議裁剪5%或10%的最差模型,Aiolfi等[17]則認(rèn)為裁剪R2排序后80%的模型能取得最佳效果,總體而言,當(dāng)前研究并未給出通用的判斷標(biāo)準(zhǔn)[18]。
2.1.2 基于信息論的視角
Colino等[19]就如何提高生豬價(jià)格預(yù)測(cè)精度展開(kāi)研究,其中的關(guān)鍵問(wèn)題即為是否要組合不同預(yù)測(cè)模型。文中設(shè)定1個(gè)基準(zhǔn)模型和15個(gè)備選模型,其認(rèn)為,是否進(jìn)行組合取決于新模型能否提供額外信息。就信息的完備性而言,若新模型與基準(zhǔn)模型相比能夠提供額外信息,將其進(jìn)行組合則可降低預(yù)測(cè)誤差,新模型能否提供額外信息通過(guò)公式(1)判斷實(shí)現(xiàn)。
其中,e1t表示基準(zhǔn)模型預(yù)測(cè)誤差,e2t表示備選模型預(yù)測(cè)誤差。原假設(shè)β=0,意味著e1t與( )e1t-e2t的協(xié)方差為0,即基準(zhǔn)模型已包含備選模型的信息,無(wú)需進(jìn)行組合。若拒絕原假設(shè),則需要進(jìn)行模型組合。并通過(guò)驗(yàn)證不同預(yù)測(cè)模型所包含信息量的差異,為判斷是否進(jìn)行組合預(yù)測(cè)提供通用的決策方法。
此外,Cang和Yu(2014)[20]同樣基于信息論視角,提出以互信息(mutual information,MI)為判斷準(zhǔn)則的組合預(yù)測(cè)最佳子集選擇算法。其中,互信息可度量隨機(jī)變量間的統(tǒng)計(jì)相關(guān)性[21],而最佳子集是指該集合中的組合模型能提供充分有效的預(yù)測(cè)信息,其預(yù)測(cè)性能優(yōu)于包含所有備選模型的集合。實(shí)驗(yàn)證明,由MI算法確定的最佳子集具有更高的預(yù)測(cè)精度和更好的魯棒性,且最佳組合模型數(shù)量為2~5個(gè),再次印證數(shù)量更少的組合策略具有與包含所有備選模型的組合策略相當(dāng)、甚至是更優(yōu)的預(yù)測(cè)表現(xiàn)。但是只考慮了3種線(xiàn)性組合預(yù)測(cè)方法,并未涉及非線(xiàn)性組合。
篩選出待組合的單項(xiàng)模型后,進(jìn)一步需明確使用哪種組合方法。組合方法選擇是否恰當(dāng)、有效,直接影響組合預(yù)測(cè)效果。以下從線(xiàn)性組合及非線(xiàn)性組合視角出發(fā),介紹各種常用的組合方法。
2.2.1 線(xiàn)性組合方法
(1)等權(quán)重法
等權(quán)重法是一種最簡(jiǎn)單的權(quán)重確定方法,也稱(chēng)簡(jiǎn)單/算術(shù)平均法,即賦予每個(gè)預(yù)測(cè)模型相同權(quán)重。假設(shè)一共有n個(gè)預(yù)測(cè)模型,則每個(gè)預(yù)測(cè)結(jié)果的權(quán)重為1/n。等權(quán)重法看似沒(méi)有過(guò)多的數(shù)理依據(jù),但在實(shí)踐中,等權(quán)重的預(yù)測(cè)精度往往高于通過(guò)復(fù)雜數(shù)學(xué)估計(jì)過(guò)程所確定的權(quán)重,這一現(xiàn)象也因此被稱(chēng)為“組合預(yù)測(cè)之謎”[22,23]。
(2)最小方差法
該方法從組合預(yù)測(cè)結(jié)果方差最小化的角度給出權(quán)重確定的準(zhǔn)則與方法。假設(shè)有兩種具有無(wú)偏預(yù)測(cè)結(jié)果的單項(xiàng)模型,其方差分別為,協(xié)方差為σ12,則方法1的權(quán)重方法2的權(quán)重ω2=1-ω1。
(3)誤差倒數(shù)法
誤差倒數(shù)法是一種直觀且便于理解的權(quán)重確定方法,若模型在訓(xùn)練中具有較小誤差,則在組合模型中賦予其更大權(quán)重,均方根誤差(RMSE)、均方誤差(MSE)是常用的誤差衡量指標(biāo)。假設(shè)兩個(gè)單項(xiàng)模型在訓(xùn)練集內(nèi)的均方根誤差總和分別為RMSE1和RMSE2,則模型1的權(quán)重ω1=
(4)優(yōu)勢(shì)矩陣法
假設(shè)兩個(gè)單項(xiàng)模型,令Z1表示研究期限內(nèi)模型1預(yù)測(cè)效果優(yōu)于模型2的次數(shù),同理,Z2表示模型2預(yù)測(cè)效果優(yōu)于模型1的次數(shù),則模型1的權(quán)重,模型2的權(quán)重該方法可推廣到包含多個(gè)單項(xiàng)預(yù)測(cè)模型的情形中,最終得到一個(gè)確定權(quán)重的優(yōu)勢(shì)矩陣。Aiolfi和Timmermann(2006)[14]的研究證明該方法與誤差倒數(shù)法相比具有更好的魯棒性。
(5)最小二乘估計(jì)法
通過(guò)實(shí)施最小二乘得到的β1和β2即為模型1和模型2的組合權(quán)重,若設(shè)定β1和β2之和為1,則回歸方程中只有1個(gè)待估參數(shù),從而可得到更小的估計(jì)誤差εt。在此基礎(chǔ)上式(2)可拓展為多元回歸形式,但是,各待估參數(shù)之間的高度共線(xiàn)性有可能導(dǎo)致參數(shù)估計(jì)不穩(wěn)定,即樣本數(shù)據(jù)的細(xì)微變動(dòng)引起參數(shù)估計(jì)量的顯著變化。為解決該問(wèn)題,學(xué)者提出使用最小一乘法(Least Absolute Deviation,LAD),即以誤差絕對(duì)值之和取代誤差平方和作為回歸方程的損失函數(shù)。此外,回歸得到的參數(shù)有可能為負(fù),為使參數(shù)更具解釋性,可限定所有參數(shù)為正。
(6)權(quán)重收縮法
鑒于等權(quán)重法具有良好的樣本外預(yù)測(cè)性能,有時(shí)甚至接近于最優(yōu)模型,因此通過(guò)施加一個(gè)隨機(jī)約束,將組合權(quán)重趨近于等權(quán)重,可減少組合權(quán)重抽樣中的波動(dòng)性[13]。假設(shè)某組合模型共包括m個(gè)單項(xiàng)模型,其中模型i的最小二乘權(quán)重為ωi,通過(guò)引入收縮參數(shù)γ,得到模型i的組合權(quán)重收縮參數(shù)γ∈(0,1),取值越大,說(shuō)明組合權(quán)重越趨向于等權(quán)重。收縮至等權(quán)重的組合權(quán)重確定方法應(yīng)用較廣,此外,近年來(lái)隨著貝葉斯方法的普及,也有學(xué)者嘗試使用基于貝葉斯的收縮權(quán)重確定方法。
2.2.2 非線(xiàn)性組合方法
盡管非線(xiàn)性組合方法提出時(shí)間晚于線(xiàn)性方法,且實(shí)際應(yīng)用較少,但在有限的研究中仍被證明是一種有效的組合方法,有時(shí)甚至能取得比算術(shù)平均更好的預(yù)測(cè)結(jié)果[2,24]。
(1)加權(quán)幾何/調(diào)和平均
假設(shè)存在m個(gè)單項(xiàng)預(yù)測(cè)模型,其對(duì)應(yīng)預(yù)測(cè)值為fi,每個(gè)模型在組合模型中權(quán)重為li,且具有非負(fù)和歸一化特性。若組合預(yù)測(cè)值,則稱(chēng)其為加權(quán)幾何平均組合預(yù)測(cè)模型。若滿(mǎn)足則為加權(quán)調(diào)和平均組合預(yù)測(cè)模型。陳華友(2008)[25]將權(quán)重求解過(guò)程轉(zhuǎn)化為線(xiàn)性規(guī)劃問(wèn)題,以誤差平方和為決策目標(biāo)給出幾何平均和調(diào)和平均的權(quán)重求解算法。
(2)人工神經(jīng)網(wǎng)絡(luò)
人工神經(jīng)網(wǎng)絡(luò)模擬人腦對(duì)信息的加工處理過(guò)程,能夠反映輸入數(shù)據(jù)和輸出數(shù)據(jù)之間高度的非線(xiàn)性映射關(guān)系。將m種預(yù)測(cè)方法得到的預(yù)測(cè)結(jié)果yit(i=1,2…m)作為網(wǎng)絡(luò)輸入層,實(shí)際值yt作為網(wǎng)絡(luò)輸出層,神經(jīng)網(wǎng)絡(luò)通過(guò)正向與反向傳播過(guò)程進(jìn)行權(quán)重學(xué)習(xí),最終各層神經(jīng)元確定的權(quán)值相當(dāng)于各種方法在組合模型中的權(quán)重[26]。相關(guān)學(xué)者的研究均證實(shí)基于神經(jīng)網(wǎng)絡(luò)的非線(xiàn)性組合預(yù)測(cè)方法具有優(yōu)良的特性和更高的預(yù)測(cè)精度[27-29]。
盡管線(xiàn)性組合方法應(yīng)用廣泛,但學(xué)者提出,如果僅考慮線(xiàn)性組合,則會(huì)削減組合預(yù)測(cè)的意義,甚至只能稱(chēng)其為合成模型(composite model)。因此有必要納入非線(xiàn)性組合方法,以增強(qiáng)組合方法的全面性。Andrawis(2011)[2]的研究中構(gòu)建了6種線(xiàn)性組合和4種非線(xiàn)性組合策略,分別選取2個(gè)最佳線(xiàn)性方法和2個(gè)最佳非線(xiàn)性方法,對(duì)這4種組合方法所取得預(yù)測(cè)結(jié)果進(jìn)行簡(jiǎn)單平均后得到最終的預(yù)測(cè)結(jié)果,從而實(shí)現(xiàn)具有層級(jí)性的組合預(yù)測(cè)。
2.2.3 組合方法遴選標(biāo)準(zhǔn)
盡管存在多種組合方法,但如何依據(jù)模型自身特點(diǎn)選擇恰當(dāng)?shù)姆椒ǎ嚓P(guān)研究還較為空白。蔣傳進(jìn)(2015)[30]基于預(yù)測(cè)誤差的分布形態(tài)(即偏度)提出組合方法遴選準(zhǔn)則,并以M3競(jìng)賽中N115季度宏觀數(shù)據(jù)序列為樣本進(jìn)行實(shí)驗(yàn)。實(shí)驗(yàn)的控制變量包括單項(xiàng)模型的偏度、預(yù)測(cè)誤差的序列相關(guān)性ρ和誤差方差比?,考慮包括線(xiàn)性與非線(xiàn)性方法在內(nèi)共6種組合方法,得到表1。
表1 組合方法遴選準(zhǔn)則
實(shí)驗(yàn)證明,簡(jiǎn)單平均法在中長(zhǎng)期(提前3~8步)預(yù)測(cè)中表現(xiàn)優(yōu)異,原因是當(dāng)數(shù)據(jù)序列發(fā)生結(jié)構(gòu)突變時(shí),簡(jiǎn)單平均法具有比其他方法更高的外推預(yù)測(cè)精度。鑒于大多數(shù)單項(xiàng)模型預(yù)測(cè)結(jié)果都具有有偏性,短期預(yù)測(cè)中選擇線(xiàn)性回歸或人工神經(jīng)網(wǎng)絡(luò)的組合方法可消除單項(xiàng)模型的有偏影響。此外,文章還就簡(jiǎn)單平均法的適用條件展開(kāi)理論分析,結(jié)論是當(dāng)?≥2,即較差模型預(yù)測(cè)標(biāo)準(zhǔn)差為較好模型預(yù)測(cè)標(biāo)準(zhǔn)差的2倍及以上時(shí),簡(jiǎn)單平均組合預(yù)測(cè)法并不能提高預(yù)測(cè)精度,此時(shí)更應(yīng)選擇單項(xiàng)最佳模型,這在一定程度上回應(yīng)了“組合預(yù)測(cè)之謎”。
組合預(yù)測(cè)理念一經(jīng)提出隨即引起學(xué)者高度重視,現(xiàn)已廣泛應(yīng)用于各類(lèi)預(yù)測(cè)問(wèn)題研究中。從形式上看,可分為同質(zhì)組合模型和異質(zhì)組合模型,以下簡(jiǎn)要介紹組合預(yù)測(cè)在能源、宏觀經(jīng)濟(jì)等領(lǐng)域的應(yīng)用情況。
電力與原油價(jià)格預(yù)測(cè)是能源領(lǐng)域傳統(tǒng)研究熱點(diǎn),Nan(2009)[31]在19個(gè)單項(xiàng)模型基礎(chǔ)上構(gòu)建組合模型預(yù)測(cè)英國(guó)地區(qū)提前一天的電力價(jià)格,發(fā)現(xiàn)組合模型僅在電力需求較為平穩(wěn)的春季取得較好效果。Weron(2014)[32]認(rèn)為其預(yù)測(cè)效果不佳的根本原因在于19個(gè)單項(xiàng)模型中有大量相似模型,它們都源于ARIMA、線(xiàn)性回歸、馬爾科夫區(qū)制轉(zhuǎn)移模型的變型。該結(jié)論似乎否定了同質(zhì)組合模型的作用,但Nowotarski等(2016)[33]以回歸模型為基準(zhǔn)建立8個(gè)同質(zhì)模型對(duì)國(guó)際能源競(jìng)賽和ISO兩個(gè)公開(kāi)數(shù)據(jù)集進(jìn)行實(shí)驗(yàn),不同模型具有相似結(jié)構(gòu),但包含變量個(gè)數(shù)以及變量滯后期有所區(qū)別。結(jié)果表明盡管只采用簡(jiǎn)單的組合策略,但組合模型預(yù)測(cè)準(zhǔn)確度明顯高于基準(zhǔn)模型。由此看來(lái),組合模型的同質(zhì)性或異質(zhì)性并不是影響模型性能的絕對(duì)因素。
原油價(jià)格時(shí)間序列具有非線(xiàn)性、非平穩(wěn)性和多尺度特征,普通的組合模型難以取得理想結(jié)果[34]。學(xué)者研究發(fā)現(xiàn),基于一種先分解后集成的組合預(yù)測(cè)方法論可有效提高原油價(jià)格預(yù)測(cè)精度[35,36]。該方法論首先對(duì)原始價(jià)格數(shù)據(jù)進(jìn)行多尺度分解,得到相對(duì)簡(jiǎn)單但具有不同波動(dòng)頻率和含義的分量;然后基于一定規(guī)則重構(gòu)各分量,并根據(jù)各分量數(shù)據(jù)特征選擇適合的預(yù)測(cè)方法;最后將各分量預(yù)測(cè)結(jié)果進(jìn)行組合。實(shí)證研究均證實(shí)該方法論在原油價(jià)格預(yù)測(cè)中的適用性以及與其他預(yù)測(cè)方法相比的優(yōu)越性[37-39]。此外,隨著人們對(duì)清潔能源關(guān)注度不斷提升,近年來(lái)組合模型也開(kāi)始應(yīng)用于風(fēng)速、風(fēng)電功率預(yù)測(cè)等相關(guān)問(wèn)題的研究中[40-43]。
Hubrich和Skudelny(2010)[44]對(duì)歐元區(qū)居民消費(fèi)價(jià)格指數(shù)展開(kāi)研究,以AR模型為基準(zhǔn)模型,VAR模型和非線(xiàn)性模型為對(duì)比模型。通過(guò)多對(duì)象和多周期對(duì)比實(shí)驗(yàn)證明,幾乎所有組合模型預(yù)測(cè)精度都高于備選單項(xiàng)模型,且對(duì)時(shí)間序列轉(zhuǎn)折點(diǎn)識(shí)別準(zhǔn)確度較高。Melo等[45]對(duì)哥倫比亞通貨膨脹率的研究證實(shí),通過(guò)引入貝葉斯收縮方法,單項(xiàng)模型預(yù)測(cè)精度得以提高;并且基于滾動(dòng)貝葉斯組合策略,可減少預(yù)測(cè)所需數(shù)據(jù)量并提高預(yù)測(cè)精度,該結(jié)論與Kapetanios等[46]對(duì)英國(guó)通貨膨脹率的研究相符。國(guó)內(nèi)方面,于志軍等[47]在指數(shù)平滑法、偏最小二乘法和灰色預(yù)測(cè)法基礎(chǔ)上構(gòu)建稅收收入組合預(yù)測(cè)模型,通過(guò)算例證明組合模型具有較優(yōu)預(yù)測(cè)性能。薛倩等[48]基于方差倒數(shù)法、殘差倒數(shù)法和最小二乘法確定組合預(yù)測(cè)模型權(quán)重以預(yù)測(cè)重慶市GDP。皮進(jìn)修等[49]基于自組織數(shù)據(jù)挖掘理論構(gòu)建SARIMA-GMDH組合模型,通過(guò)擬合優(yōu)度檢驗(yàn)和預(yù)測(cè)性能檢驗(yàn),證實(shí)組合模型具有更好的魯棒性和抗隨機(jī)干擾能力。
組合預(yù)測(cè)模型還應(yīng)用于金融資產(chǎn)、交通工程、農(nóng)產(chǎn)品市場(chǎng)等領(lǐng)域研究。Pai和Lin[50]基于ARIMA和SVM構(gòu)建組合模型預(yù)測(cè)10家公司的股票價(jià)格,結(jié)果顯示,就單項(xiàng)模型預(yù)測(cè)性能而言,SVM與ARIMA相比并無(wú)明顯差異;但組合模型能顯著降低預(yù)測(cè)誤差。周榮喜等[51]構(gòu)造靜態(tài)利率期限結(jié)構(gòu)組合優(yōu)化模型,以解決單個(gè)靜態(tài)利率期限結(jié)構(gòu)模型在擬合收益率曲線(xiàn)時(shí)的不足。耿睿等[52]將SVM與多項(xiàng)式和魯棒自回歸預(yù)測(cè)模型相結(jié)合對(duì)北京空中交通流量進(jìn)行預(yù)測(cè)。沈國(guó)江等[53]構(gòu)建包含卡爾曼濾波、人工神經(jīng)網(wǎng)絡(luò)和模糊綜合模型在內(nèi)的智能組合模型預(yù)測(cè)短時(shí)交通流量,實(shí)驗(yàn)證明組合模型在眾多評(píng)價(jià)指標(biāo)中都具有領(lǐng)先優(yōu)勢(shì)。平平[54]、王川[55]等將組合預(yù)測(cè)方法應(yīng)用于豬肉、蘋(píng)果等農(nóng)產(chǎn)品的價(jià)格預(yù)測(cè)中,進(jìn)一步拓寬組合預(yù)測(cè)的應(yīng)用領(lǐng)域。
近年來(lái),學(xué)者們?cè)谕晟茊雾?xiàng)模型篩選方法和單項(xiàng)模型組合形式等方面展開(kāi)了許多有益嘗試,豐富了組合預(yù)測(cè)的理論內(nèi)涵。同時(shí),還就預(yù)測(cè)模型結(jié)構(gòu)設(shè)定、參數(shù)估計(jì)和模型檢驗(yàn)方法進(jìn)行修正和擴(kuò)展,推動(dòng)組合預(yù)測(cè)方法快速發(fā)展。在此基礎(chǔ)上,本文認(rèn)為今后該領(lǐng)域還有以下值得進(jìn)一步研究的問(wèn)題。
(1)基于模型裁剪的單項(xiàng)模型篩選方法簡(jiǎn)單易操作,但裁剪比例具有較大主觀性。此外,個(gè)別預(yù)測(cè)精度較差的單項(xiàng)模型可能包含獨(dú)特信息,若依據(jù)預(yù)測(cè)誤差將其排除在外,有違組合預(yù)測(cè)本質(zhì)。相比之下,基于信息論的單項(xiàng)模型篩選準(zhǔn)則更為科學(xué),然而,當(dāng)前文獻(xiàn)對(duì)基準(zhǔn)模型的選擇大多較為隨意且缺乏依據(jù),如何科學(xué)地確定基準(zhǔn)模型值得進(jìn)一步探討。
(2)當(dāng)前社會(huì)經(jīng)濟(jì)系統(tǒng)結(jié)構(gòu)日趨復(fù)雜,傳統(tǒng)線(xiàn)性預(yù)測(cè)模型難以捕捉復(fù)雜系統(tǒng)的變化特征,預(yù)測(cè)效果不甚理想。自引入對(duì)復(fù)雜系統(tǒng)具有更好自適應(yīng)性和學(xué)習(xí)能力的人工神經(jīng)網(wǎng)絡(luò)方法后,模型預(yù)測(cè)性能顯著提升。然而,當(dāng)前組合權(quán)重的確定仍以線(xiàn)性方法為主,為更好適應(yīng)數(shù)據(jù)的非線(xiàn)性特征,采用非線(xiàn)性權(quán)重確定方法并將其與線(xiàn)性方法進(jìn)行層級(jí)性組合,是今后值得嘗試的一個(gè)方向。
(3)先分解后集成的組合預(yù)測(cè)方法論基于對(duì)原始復(fù)雜時(shí)序數(shù)據(jù)的多尺度分解,在不同尺度上剖析復(fù)雜系統(tǒng)的波動(dòng)特征及趨勢(shì)規(guī)律,在掌握系統(tǒng)內(nèi)在運(yùn)行規(guī)律的基礎(chǔ)上展開(kāi)預(yù)測(cè)研究,顯著提升預(yù)測(cè)性能。該方法論的核心是選擇有效的數(shù)據(jù)分解工具,除傳統(tǒng)的季節(jié)分解、小波分解、經(jīng)驗(yàn)?zāi)B(tài)分解法外,如何將現(xiàn)代信號(hào)處理領(lǐng)域的新技術(shù),如壓縮感知等,應(yīng)用到復(fù)雜時(shí)序數(shù)據(jù)預(yù)測(cè),是今后研究中具有挑戰(zhàn)性的一個(gè)問(wèn)題。
(4)實(shí)驗(yàn)數(shù)據(jù)的樣本量與規(guī)范性是國(guó)內(nèi)外研究的主要差異之一。國(guó)外研究多基于公開(kāi)的競(jìng)賽數(shù)據(jù)集(如M3、NN3、國(guó)際能源預(yù)測(cè)競(jìng)賽等)進(jìn)行某種方法或模型的性能檢驗(yàn),首先通過(guò)大樣本數(shù)據(jù)實(shí)驗(yàn)篩選出優(yōu)性模型,再將模型用于特定數(shù)據(jù)集的預(yù)測(cè)研究,遵循從一般到特殊的研究過(guò)程,結(jié)論可信度高。反觀國(guó)內(nèi),實(shí)驗(yàn)數(shù)據(jù)選取的主觀性及差異性較大,樣本量小且不具有普遍性,局限了研究方法的推廣與應(yīng)用。此外,國(guó)外研究通常包括多步長(zhǎng)(提前1月、3月、6月、12月)實(shí)驗(yàn)方案,可驗(yàn)證模型對(duì)不同預(yù)測(cè)周期的適用性;國(guó)內(nèi)研究相對(duì)簡(jiǎn)單,通常只有一種步長(zhǎng)設(shè)計(jì)。由此可見(jiàn),完善實(shí)驗(yàn)方案設(shè)計(jì)并選用公開(kāi)數(shù)據(jù)集進(jìn)行模型驗(yàn)證,是進(jìn)一步提高模型普適性的有效途徑。