盧 捷,李 峰
(江南大學(xué) 商學(xué)院,江蘇 無錫 214122)
灰色預(yù)測是灰色系統(tǒng)理論的主要內(nèi)容之一,GM(1,1)模型作為灰色預(yù)測理論的核心和基礎(chǔ)[1],在很多領(lǐng)域都得到了廣泛的應(yīng)用。然而在實(shí)際應(yīng)用中,經(jīng)典GM(1,1)模型會(huì)出現(xiàn)預(yù)測精度不穩(wěn)定、甚至出現(xiàn)偏差的情況[2]。由于經(jīng)典GM(1,1)模型誤差來源主要集中于初始值的選取以及背景值的構(gòu)造,為此學(xué)者們從不同角度對GM(1,1)模型的改進(jìn)進(jìn)行了研究,并在初始值、背景值方面取得了一定的成果。
在初始值優(yōu)化方面,考慮到新信息在建模中應(yīng)當(dāng)發(fā)揮關(guān)鍵作用,羅佑新[3]直接以x(0)(n)作為灰色模型初始條件,雖然可以在一定程度上減少誤差,但缺乏嚴(yán)格的理論依據(jù);黨耀國[4]分別以x(1)(n)作為灰色模型初始條件,彌補(bǔ)了以往學(xué)者研究的缺陷,但同樣沒有嚴(yán)格的理論證明;Wang等針對白化方程為非齊次指數(shù)函數(shù)對模型初始值進(jìn)行優(yōu)化,進(jìn)而構(gòu)造新的背景值表達(dá)式減少模型誤差,提高模型預(yù)測精度[5],優(yōu)化方法適用范圍較窄。
在對背景值優(yōu)化方面,經(jīng)典模型對于背景值z(1)(k)的構(gòu)造并沒有嚴(yán)格的理論依據(jù),故學(xué)者們從不同角度對背景值進(jìn)行改進(jìn),大致可分為從幾何意義以及數(shù)列特征兩個(gè)方面進(jìn)行優(yōu)化。從積分的幾何意義出發(fā),蔣詩泉等[6]利用分段低次插值,結(jié)合復(fù)化梯形公式計(jì)算各區(qū)間積分之和,以減少因在[k-1,1]區(qū)間直接計(jì)算整個(gè)梯形面積造成的誤差;而江藝羨[7]則利用黎曼積分,以不規(guī)則梯形面積取代傳統(tǒng)梯形面積構(gòu)造法,對傳統(tǒng)GM(1,1)模型背景值進(jìn)行優(yōu)化。從序列數(shù)值特點(diǎn)出發(fā),彭振斌等[8]將數(shù)據(jù)序列抽象為非齊次指數(shù)函數(shù)構(gòu)造背景值,構(gòu)建GM(1,1)模型;Cai[9]則在原始序列間距不一致情況下對背景值進(jìn)行改進(jìn),以擴(kuò)展經(jīng)典模型的適用性和精確性。此外,也有學(xué)者基于不同角度提出了z(1)(k)的數(shù)學(xué)表達(dá)式[10~12],也在一定程度上提高了預(yù)測精度。而在模型參數(shù)估計(jì)方面,孟偉等[13]采用粒子群優(yōu)化算法,Lee等[14]采用遺傳算法等對經(jīng)典模型進(jìn)行優(yōu)化都取得了較好的預(yù)測效果。
可以看出,在對背景值優(yōu)化方面,現(xiàn)有研究主要是對緊鄰均值構(gòu)造方法進(jìn)行改進(jìn),且均提出了一定的改進(jìn)方法,但大部分學(xué)者都是對模型某一方面的優(yōu)化,雖然可以在一定程度上提高精度,但不能系統(tǒng)地減少模型誤差;同時(shí)在初始值選取方面,由最小二乘法原理可知,擬合曲線并不一定通過點(diǎn)(1,x(1)(1))。雖然有部分學(xué)者提出改進(jìn)方法分別以x(1)(n)為固定點(diǎn),但在模型涉及多變量的情況下,這種方法的效果還有待檢驗(yàn)。
根據(jù)GM(1,1)模型基本形式x(0)(k)+az(1)(k)=b的白化方程,即
(1)
對式(1)在[k-1,k]上求積分可得
(2)
(3)
圖1 GM(1,1)模型背景值誤差來源
經(jīng)典模型對背景值的計(jì)算公式為
z(1)(k)=0.5(x(1)(k)+x(1)(k-1)),k=2,3,…,n
當(dāng)一次累加生成序列變化較為平緩,且當(dāng)時(shí)間間隔較小時(shí),采取以上方法計(jì)算是合適的;但當(dāng)一階累加生成序列波動(dòng)較大時(shí),采取以上方法則會(huì)造成較大的誤差。從數(shù)列生成特征來看,經(jīng)典模型人為地規(guī)定舊信息和新信息同等重要,這并不符合實(shí)際。本文將背景值視為變量,即z(1)(k)=(αz(1)(k)+(1-α)z(1)(k-1)),由MRE取到最小值時(shí)再確定背景值參數(shù)值以及時(shí)間響應(yīng)式具體形式,可以顯著降低人為因素造成的誤差,提高預(yù)測精度。
同時(shí),在對背景值進(jìn)行優(yōu)化的基礎(chǔ)上,也對初始值進(jìn)行優(yōu)化?;疑獹M(1,1)模型作為指數(shù)預(yù)測模型,本質(zhì)是以x(1)(1)為固定點(diǎn)的靜態(tài)方程。相較于動(dòng)態(tài)方程,靜態(tài)方程并不具有基準(zhǔn)選值無關(guān)性,步長無關(guān)性,內(nèi)在一致性等特征,擬合效果通常要比動(dòng)態(tài)方程更差一些,應(yīng)用范圍也沒有動(dòng)態(tài)方程廣闊[15]。利用一階線性差分方程,用一個(gè)變動(dòng)的已知時(shí)刻去預(yù)測將來的未知時(shí)刻的值,對傳統(tǒng)數(shù)值解法進(jìn)行改進(jìn),可提高擬合精度。
定義1[16]設(shè)非負(fù)原始序列
X(0)=(x(0)(1),x(0)(2),…,x(0)(n))
稱X(1)為X(0)的一次累加生成(1-AGO)序列:
X(1)=(x(1)(1),x(1)(2),…,x(1)(n))
GM(1,1)模型的原始形式為
x(0)(k)+ax(1)(k)=b
(4)
定義2[17]X(0),X(1)如定義1所示,令
Z(1)=(z(1)(2),z(1)(3),…,z(1)(n))
則GM(1,1)模型的基本形式為
x(0)(k)+az(1)(k)=b
(5)
其白化方程為
(6)
(7)
其還原值為
(8)
(9)
其中k=2,3,…,n。
從(9)式可以看出,GM(1,1)模型的預(yù)測精度取決于固定點(diǎn)的選取和參數(shù)a,b的值,而a,b的值又取決于背景值的構(gòu)造。將初始值和背景值進(jìn)行組合優(yōu)化可顯著提高模型精度。
2.2.1 初步改進(jìn)方法(1)
GM(1,1)模型的基本形式為x0(k)+az(1)(k)=b,其中,
z(1)(k)=0.5(x(1)(k)+x(1)(k-1)),k=2,3,…,n
(10)
帶入(8)式可得:
(11)
則a,b可以由下式估計(jì)得到:
將a,b計(jì)算結(jié)果帶入(7)式,并根據(jù)(5)和(6)式得到擬合序列。
2.2.2 初步改進(jìn)方法(2)
在方法(1)基礎(chǔ)上對模型的背景值進(jìn)行改進(jìn),使平均相對誤差取到最小值。其他條件不變,將(10)式改寫為
z(1)(k)=(αx(1)(k)+(1-α)x(1)(k-1)),k=2,3,…,n
權(quán)重α滿足0≤α≤1。由x(0)(k)=x(1)(k)-x(1)(k-1),k=2,3,…,n可得:
(x(1)(k)-x(1)(k-1))+(αx(1)(k)+(1-α)x(1)(k-1))=b
其一階線性差分方程形式為:
(12)
則a,b可以由下式估計(jì)得到:
設(shè)上式計(jì)算結(jié)果為(c1,c2)T,解方程組可得:
a=(c1-1)/(α-αc1-1)
(13)
b=(-c2)/(α-αc1-1)
(14)
2.2.3 綜合改進(jìn)方法(3)
x(1)(k+1)=(x(1)(m)-b/a)e-a(k-m+1)+b/a
其中,m可依次選用m=1,2,…,n。將(13)和(14)帶入下式
(15)
(16)
帶入(16)式可得
我國目前是世界第一大石油進(jìn)口和消費(fèi)國。由于我國目前處于工業(yè)化階段的中后期,能耗較大的汽車、家電等產(chǎn)品在經(jīng)濟(jì)中比重較高;同時(shí),隨著我國經(jīng)濟(jì)水平的快速發(fā)展,國內(nèi)對于石油需求大幅提升,石油消費(fèi)持續(xù)較快增長。然而,我國國內(nèi)石油產(chǎn)量當(dāng)前還滿足不了巨大需求,使得在面臨國內(nèi)外市場供需失衡、市場供給不足時(shí),難以短時(shí)間內(nèi)保障油品供應(yīng),不斷增長的需求只能通過加大進(jìn)口來彌補(bǔ)。石油作為我國重要的能源,不僅為生活和生產(chǎn)提供強(qiáng)力的支撐,也關(guān)系到社會(huì)的安全與穩(wěn)定。對我國石油年消費(fèi)量進(jìn)行預(yù)測,不僅有利于維持國內(nèi)石油供需平衡,也可以為國家重大政策的制定提供依據(jù)。
從國家統(tǒng)計(jì)局網(wǎng)站獲取2006~2017年中國國內(nèi)石油年消費(fèi)量,以2006~2015年數(shù)據(jù)為定參序列數(shù)據(jù),2016~2017年數(shù)據(jù)為模擬序列預(yù)測對比數(shù)據(jù),即
X(0)=(322,346,364,388,438,453,476,488,518,543)
2016~2017年數(shù)據(jù)分別為578,590(單位:百萬噸)。
首先用未加改進(jìn)的GM(1,1)模型進(jìn)行計(jì)算。對原始序列進(jìn)行一階累加,可得
X(1)=(322,668,1032,1420,1858,
2311,2787,3275,3793,4336)
根據(jù)(8)式可得擬合序列并計(jì)算MRE。
應(yīng)用初步改進(jìn)方法(1)進(jìn)行計(jì)算,將原始數(shù)據(jù)帶入可得
根據(jù)(8)式可得擬合序列并計(jì)算MRE。擬合數(shù)據(jù)和預(yù)測數(shù)據(jù)見表1。
將原始數(shù)據(jù)帶入方法(2)中,
可得
a=0.0537/(α-1.0537α-1)
(17)
b=-340.6913(α-1.0537α-1)
(18)
不妨可先設(shè)α=0,然后令其在區(qū)間[0,1]變化且Δα=0.01,利用matlab可得到MRE隨α變化圖2。
圖2 方法(2)條件下MRE隨α變化圖
根據(jù)(8)式可得擬合序列并計(jì)算MRE。經(jīng)典模型、改進(jìn)方法(1)和方法(2)擬合數(shù)據(jù)和預(yù)測數(shù)據(jù)見表1。
表1 中國國內(nèi)石油年消費(fèi)量預(yù)測(百萬噸)
圖3 MRE隨m和α變化圖
在計(jì)算方法(2)的基礎(chǔ)上,將原始數(shù)據(jù)帶入綜合改進(jìn)方法(3)中,
將(c1,c2)T帶入MRE表達(dá)式中。不妨可先設(shè)α=0,然后令其在區(qū)間[0,1]變化且Δα=0.01,同時(shí)令m依次取1,2,…,n,利用matlab可得到MRE隨m和α變化的圖3。
再根據(jù)(8)式可得擬合序列并計(jì)算MRE。未改進(jìn)模型與改進(jìn)方法(3)擬合數(shù)據(jù)與相對誤差、平均相對誤差見表2。
從表2可以看出,綜合改進(jìn)模型無論是模擬精度還是預(yù)測精度均高于未加優(yōu)化的模型以及僅對初始值或者背景值進(jìn)行優(yōu)化的模型。其中,預(yù)測精度的提升尤其顯著,經(jīng)典模型誤差為0.033,而改進(jìn)后模型僅為0.016,改進(jìn)后的模型取得了良好的預(yù)測效果。
將三種改進(jìn)方法和經(jīng)典模型進(jìn)行綜合比較,可得到表3、圖4:
表2 中國國內(nèi)石油年消費(fèi)量預(yù)測(百萬噸)
表3 經(jīng)典模型及改進(jìn)模型誤差情況
圖7 2007~2017年四種方法相對誤差
綜合來看,改進(jìn)方法(3),即綜合改進(jìn)方法,無論是擬合誤差還是預(yù)測誤差均低于經(jīng)典模型以及其他兩種改進(jìn)方法。隨著改進(jìn)程度的深入,模型誤差呈現(xiàn)出遞減的趨勢,驗(yàn)證了模型優(yōu)化的有效性。
實(shí)際上,在建模過程中,變量越多的模型,預(yù)測精度往往越高。如果把模型初始值、背景值等都看作變量,優(yōu)化的變量越多,得到的模型精度越高。所以通過優(yōu)化多個(gè)變量和某種參數(shù)估計(jì)方法提高預(yù)測精度是未來的一個(gè)研究方向。