黨 升,馮 曉,盧志豪,韋春桃
(1. 重慶交通大學 測繪與國土信息工程系,重慶 400074; 2. 重慶交通大學 工程信息與3S研究所,重慶 400074)
監(jiān)測數(shù)據(jù)處理、分析包括數(shù)據(jù)粗差剔除、濾波去噪、建模預報等,而建模預報是當中非常重要的一部分,其采用的方法一般有回歸分析[1]、時間序列[2]、灰色模型[3]、神經(jīng)網(wǎng)絡[4]等。由于某些模型在實際應用中存在一定的不足,有些學者基于原模型提出了相應的優(yōu)化改進模型,例如穩(wěn)健回歸分析[5]、模糊AR(p)模型[6]、殘差修正ARMA模型、小波神經(jīng)網(wǎng)絡[7]模型、改進灰色模型[8]等。為了進一步融合各模型的優(yōu)點,提高預測精度,又有學者提出建立組合預測模型,例如改進的MEEMD-ARMA殘差修正組合預測模型[9]、GM-BP組合模型[10]、灰色-回歸組合模型[11]等。
文獻[12]在建立最優(yōu)權(quán)組合預測模型時,以全部建模樣本的殘差平方和作為目標函數(shù),采用最小二乘準則確定多個預測模型的最優(yōu)權(quán)值,從而使組合模型達到基于整個樣本數(shù)據(jù)的全局最優(yōu)。但由于不同模型的建模原理、建?;鶞?、擬合精度等不同,采用該方法對各個模型進行分權(quán),可能出現(xiàn)權(quán)重過度偏向于擬合精度較高的模型而忽略其余模型所特有的隱藏信息,使組合模型的預測精度降低。從系統(tǒng)角度看,隨著系統(tǒng)的發(fā)展,老數(shù)據(jù)刻畫系統(tǒng)演化的作用將逐漸降低[13],以此建立的模型并不一定能較好地反應事物發(fā)展的真實狀況。因此,在對各模型分權(quán)時,若能利用近期數(shù)據(jù)作為權(quán)值劃分的依據(jù),將一定程度上避免老數(shù)據(jù)對模型的不利影響?;诖?,本文提出一種改進最優(yōu)的權(quán)系數(shù)組合預測模型,即基于局部最優(yōu)的權(quán)系數(shù)組合預測模型。
(1)
為了保證模型的無偏性,wj應滿足如下約束條件:
誤差統(tǒng)計量為:
(2)
若以最小二乘準則將目標函數(shù)極小化來求解權(quán)系數(shù)矩陣W,則可設:
(3)
式中,j∈(1,J);t∈(t0,N)且t0∈(1,N)。
組合預測模型的模型誤差可表示為:
(4)
(5)
式中,WT=(w1,w2,…,wJ);RT=(1,1,…,1);E=(eij)J×J;
若各個預測模型的預測誤差是不相關(guān)的,則E矩陣可逆,按最小二乘法求得最優(yōu)權(quán)向量為:
W0=(RTE-1R)-1E-1R
(6)
如果上述式中t0=1,所求的權(quán)系數(shù)即為文獻[12]中的最優(yōu)組合預測模型(整個樣本數(shù)據(jù)的全局最優(yōu))。
為了驗證改進模型在預測中的有效性,本文選用下列幾個誤差指標作為單項預測模型、最優(yōu)權(quán)系數(shù)組合預測模型、局部最優(yōu)的權(quán)系數(shù)組合預測模型的精度評價指標[13]:
(4)平均絕對百分比誤差:
(5)均方百分比誤差:
以萬州區(qū)濱江路某項目的水位監(jiān)測數(shù)據(jù)為例,取2018年2月17日~2018年3月16日SW4點的監(jiān)測數(shù)據(jù)(28期),以前22期為建模數(shù)據(jù),后6期為模型預測驗證數(shù)據(jù)。
根據(jù)文獻[14]中記錄的方法,建立均值灰色模型(EGM),得出模型的發(fā)展系數(shù)a=0.001 616 79,灰色作用量b=170.123 795 2。該模型的時間響應式如下:
-105 223.186)e-0.001 616 79(k-1)
通過MATLAB編程計算,得出基于樣本數(shù)據(jù)的三次多項式模型:
通過建立的EGM(1,1)模型和三次多項式模型,分別計算出各自模型前22期數(shù)據(jù)的擬合值,經(jīng)計算,得出EGM(1,1)模型和三次多項式模型擬合值的平均相對誤差分別是0.069%和0.012%;同時也對第23~28期值進行預測,最終擬合結(jié)果、預測結(jié)果如表1~表2所示,擬合、預測值比較圖如圖1所示。
圖1 EGM、三次多項式模型的擬合、預測值比較
表1 EGM(1,1)模型與三次多項式模型擬合值/m
表2 EGM(1,1)模型與三次多項式模型預測值/m
從圖1中可以明顯看出EGM(1,1)模型和三次多項式模型后期的預測值均存在部分時域偏離真實值的情況,因此,采用文獻[12]介紹的方法(權(quán)系數(shù)組合預測模型),對上述兩種模型進行分權(quán),得出最優(yōu)權(quán)系數(shù)w1,w2,如表3所示。并將兩個模型預測值進行分權(quán)組合,得出第23~28期組合預測模型的預測值,如表4所示,預測值對比圖如圖2所示。從上述圖表中可以看出,最優(yōu)權(quán)系數(shù)組合預測模型的預測趨勢與三次多項式模型的大致相當,預測值存在一定偏差,造成該情況的原因是三次多項式模型對原始建模數(shù)據(jù)的擬合精度遠遠高于EGM(1,1),在使用極小化準則分權(quán)時過于置信三次多項式模型,導致三次多項式模型權(quán)重過大。但僅由模型的擬合精度就過于忽略了EGM(1,1)模型中蘊藏灰色信息,很明顯也是不合理的。
表3 最優(yōu)權(quán)系數(shù)
表4 權(quán)系數(shù)組合模型預測值/m
基于2.1章節(jié)中所建立的EGM和三次多項式模型,選取第17~22期作為求解局部最優(yōu)權(quán)系數(shù)的范圍區(qū)段。以第17~22期模型擬合值的殘差平方和作為目標函數(shù),結(jié)合式(5)、(6)可得出局部最優(yōu)權(quán)系數(shù)值,如表5所示。
圖2 三種模型預測值比較
表5 局部最優(yōu)權(quán)系數(shù)
應用式(1),將EGM和三次多項式模型進行加權(quán)組合,經(jīng)計算可得到第23~28期的局部最優(yōu)權(quán)系數(shù)組合預測值,如表6所示,各模型預測值對比圖如圖3所示。根據(jù)預測精度評價指標體系對單項模型、最優(yōu)權(quán)系數(shù)組合模型、局部最優(yōu)權(quán)系數(shù)組合模型進行評價,如表7所示,可以看出最優(yōu)權(quán)系數(shù)組合模型的指標均高于單項預測模型,這也表現(xiàn)了組合模型在預測中的優(yōu)越性。根據(jù)表7和圖3可以看出局部最優(yōu)的權(quán)系數(shù)組合預測模型的預測值較為符合真實值變化趨勢,預測評價指標在各方面均優(yōu)于單項預測模型和原組合模型,預測精度有了較大的提升。
表6 局部最優(yōu)權(quán)系數(shù)組合模型預測值/m
本文基于EGM(1,1)和三次多項式模型,針對最優(yōu)權(quán)系數(shù)組合預測模型存在的問題,提出一種基于局部最優(yōu)的權(quán)系數(shù)組合預測模型的計算方法。通過建立最優(yōu)權(quán)系數(shù)組合預測模型和局部最優(yōu)的權(quán)系數(shù)組合預測模型,得到第23~28期水位的預測值,與測量值對比后,分析總結(jié)得出:
圖3 局部最優(yōu)權(quán)系數(shù)組合模型預測值比較
表7 預測評價指標
組合模型可以充分考慮各模型的不同特性和優(yōu)點,當多個單項預測模型擬合值的平均相對誤差存在相對較大差異時,采用最優(yōu)組合預測模型(基于全部樣本數(shù)據(jù)的最優(yōu))進行分權(quán)時,會導致偏權(quán)情況?;诰植孔顑?yōu)的權(quán)系數(shù)組合預測模型以t0~N時刻各個預測模型的殘差平方和為目標函數(shù),通過最小二乘準則確定模型在t0~N時刻的最優(yōu)權(quán),并將該權(quán)作為組合模型的權(quán)值,在處理時很大程度上保護了擬合精度較低模型的灰色信息,提高組合模型精度。在短期預測中,改進權(quán)系數(shù)組合預測模型的效果與權(quán)系數(shù)組合預測模型相當,但在中長期預測中,局部最優(yōu)的權(quán)系數(shù)組合預測模型的預測精度和趨勢明顯優(yōu)于原模型。