楊孝良,周 猛,曾 波
(重慶工商大學(xué)a.長(zhǎng)江上游經(jīng)濟(jì)研究中心;b.國(guó)家智能制造服務(wù)國(guó)際科技合作基地,重慶 400067)
灰色理論[1]是研究和解決現(xiàn)實(shí)世界不確定性問(wèn)題的主要方法之一,以GM(1,1)模型為基礎(chǔ)的灰色預(yù)測(cè)模型是灰色理論的重要組成部分,而背景值[2]則是影響灰色預(yù)測(cè)模型性能的重要參數(shù)之一。為了改善灰色預(yù)測(cè)模型性能,研究人員從不同角度對(duì)灰色預(yù)測(cè)模型背景值的構(gòu)造方式與優(yōu)化方法進(jìn)行了深入研究,并取得了較為豐碩的研究成果。
灰色預(yù)測(cè)模型背景值構(gòu)造方式的優(yōu)化?;疑A(yù)測(cè)模型背景值z(mì)(1)(k)是一個(gè)平滑公式,當(dāng)建模數(shù)據(jù)變化平緩時(shí),通過(guò)緊鄰均值來(lái)計(jì)算灰色預(yù)測(cè)模型背景值是合理的;反之,當(dāng)建模數(shù)據(jù)具有一定的波動(dòng)性或振蕩特征時(shí),假如同樣使用z(1)(k)作為灰色預(yù)測(cè)模型背景值,往往導(dǎo)致灰色預(yù)測(cè)模型誤差偏大。為了解決該問(wèn)題,譚冠軍[3]、劉樂(lè)[4]、蔣詩(shī)泉[5]等對(duì)灰色預(yù)測(cè)模型背景值的構(gòu)造方法進(jìn)行研究。如蔣詩(shī)泉[5]基于積分幾何意義的視角,利用函數(shù)逼近的思想并結(jié)合復(fù)化梯形公式,提出了一種新的GM(1,1)模型背景值優(yōu)化方法,所建立的GM(1,1)模型在預(yù)測(cè)精度上有顯著的提高。
灰色預(yù)測(cè)模型背景值計(jì)算方式的優(yōu)化?;疑A(yù)測(cè)模型背景值z(mì)(1)(k)=0.5x(1)(k -1)+0.5x(1)(k),換言之,建模時(shí)通過(guò)x(1)(k -1)與x(1)(k)的均值來(lái)作為灰色預(yù)測(cè)模型的背景值。實(shí)際上這是一種簡(jiǎn)化處理,為此,肖新平[6]、謝開(kāi)貴[7]等將z(1)(k)推廣為z(1)(k)=αx(1)(k -1)+(1-α)x(1)(k ),其中α∈(0,1)為待定參數(shù),通常利用遺傳算法等智能尋優(yōu)算法來(lái)確定α的相對(duì)最優(yōu)值,并稱(chēng)該模型為GM(1,1,α)模型。另外,李俊峰[8]、童明余[9]、劉震[10]等提出用插值和數(shù)值積分中的Newton-Cores公式、數(shù)值積分中的Gauss公式等來(lái)優(yōu)化和改善灰色預(yù)測(cè)模型背景值,并將其應(yīng)用于我國(guó)城市內(nèi)分泌、營(yíng)養(yǎng)和代謝疾病及免疫病致死人數(shù)占死亡總?cè)藬?shù)的百分比預(yù)測(cè),取得了較好的效果。
灰色預(yù)測(cè)模型背景值構(gòu)造的非等間距拓展?,F(xiàn)有灰色預(yù)測(cè)模型主要研究和討論等時(shí)距情況下的系統(tǒng)預(yù)測(cè)問(wèn)題,實(shí)際上等時(shí)距只是一種理想情況,現(xiàn)實(shí)生活中大量實(shí)際應(yīng)用是非等時(shí)距的。因此,如何在非等時(shí)距情況下實(shí)現(xiàn)灰色預(yù)測(cè)背景值的合理構(gòu)造,是構(gòu)建非等時(shí)距灰色預(yù)測(cè)模型的重要內(nèi)容[11,12]。為此,李翠鳳等[13]提出用 x(1)(t)在區(qū)間[ki, ki+1]中點(diǎn)的實(shí)際值來(lái)構(gòu)造非等時(shí)距灰色預(yù)測(cè)模型的背景值;王葉梅等[14]根據(jù)灰色模型的指數(shù)特性和積分特點(diǎn),利用非齊次指數(shù)函數(shù)來(lái)擬合一次累加生成序列,提出了一種重構(gòu)非等間距灰色模型背景值的方法。
灰色預(yù)測(cè)模型背景值構(gòu)造方式與計(jì)算方法的優(yōu)化,對(duì)提高灰色預(yù)測(cè)模型模擬及預(yù)測(cè)性能,拓展灰色預(yù)測(cè)模型應(yīng)用范圍,豐富和完善灰色預(yù)測(cè)模型理論體系,具有重要的理論意義和應(yīng)用價(jià)值。然而,現(xiàn)有灰色預(yù)測(cè)模型的構(gòu)造或優(yōu)化都是建立在x(1)(k -1)與x(1)(k)的基礎(chǔ)之上,這導(dǎo)致灰色預(yù)測(cè)模型背景值容易受到建模序列中極端數(shù)據(jù)的影響,從而影響灰色預(yù)測(cè)模型性能。為此,本文提出一種灰色預(yù)測(cè)模型背景值構(gòu)造的新方法。
定 義1:設(shè) 非 負(fù) 原 始 序 列Y(0)=(y(0)(1),y(0)(2),…,y(0)(m )) ,其中 y(0)(k )≥0,k=1,2,…m ,序列 Y(1)是序列Y(0)的1-AGO生成序列,即:
其中:
則,當(dāng)k=3,4,…,m,
稱(chēng)公式(1)為背景值含三參數(shù)的新型灰色預(yù)測(cè)模型,簡(jiǎn)稱(chēng)NGM3(1,1)模型。
定理1:序列Y(0)及Y(1)如定義1所述,p^=(a ,b,c)T為NGM3(1,1)模型的參數(shù)列,且:
則稱(chēng)NGM3(1,1)模型的最小二乘估計(jì)參數(shù)列滿(mǎn)足:
證明:將數(shù)據(jù)代入NGM3(1,1)模型,即公式(1),得:
上述方程組的矩陣形式為:
對(duì)參數(shù)a,b及c的一堆估計(jì)值,以-a(y(1)(k)+y(1)(k -1)+y(1)(k -2))/3+kb+c來(lái)代替 y(0)(k ),k=3,4,…,m ,可得誤差序列:
設(shè):
使s最小的參數(shù)a,b及c應(yīng)滿(mǎn)足:
即:
根據(jù)公式(4),可以做出如下推導(dǎo):
即:
證明結(jié)束。
根據(jù)定義1可知:
則:
即:
整理公式(5),可得:
設(shè):
可得:
根據(jù)定義1可知,NGM3(1,1)模型的最終還原式可以表示為:
當(dāng)k=3,4時(shí),根據(jù)公式(6)可得:在公式(8)中,y(1)(1)及y(1)(2)=y(1)(1)+y(0)(2)分別稱(chēng)為NGM3(1,1)模型的初始值,視為已知數(shù)據(jù)?,F(xiàn)根據(jù)公式(6),推導(dǎo)NGM3(1,1)模型的時(shí)間響應(yīng)函數(shù)。
將公式(8)代入公式(9),整理得:
類(lèi)似地,當(dāng)k=5時(shí),根據(jù)公式(6)可得:
將公式(8)及公式(10)代入公式(11),可得:
當(dāng)k=5時(shí):
即:
根據(jù)上文的推導(dǎo)過(guò)程可以發(fā)現(xiàn),NGM3(1,1)模型時(shí)間響應(yīng)函數(shù)的構(gòu)成是非常復(fù)雜的,很難發(fā)現(xiàn)其遞推規(guī)律。實(shí)際上,構(gòu)建NGM3(1,1)模型的主要目的是模擬或預(yù)測(cè)數(shù)據(jù)(k)及y^(0)(k)。因此,NGM3(1,1)模型時(shí)間響應(yīng)函數(shù)并非建模的必須環(huán)節(jié)。根據(jù)公式(7)可知,NGM3(1,1)模型滿(mǎn)足遞推算法,因此可以通過(guò)一段簡(jiǎn)單的遞推程序來(lái)完成NGM3(1,1)模型的建模過(guò)程,實(shí)現(xiàn)NGM3(1,1)模型的模擬及預(yù)測(cè)功能。
相對(duì)于傳統(tǒng)的灰色預(yù)測(cè)模型,NGM3(1,1)模型具有如下優(yōu)點(diǎn):
(1)NGM3(1,1)模型將背景值參數(shù)從兩個(gè)拓展至三個(gè),提高了灰色預(yù)測(cè)模型背景值的平滑效果,弱化了原始序列中的極端數(shù)據(jù)對(duì)灰色預(yù)測(cè)模型性能的影響。考慮到背景值的光滑度是影響灰色預(yù)測(cè)模型模擬及預(yù)測(cè)性能的重要因素,因此,理論上NGM3(1,1)模型性能優(yōu)于傳統(tǒng)的灰色預(yù)測(cè)模型。
(3)傳統(tǒng)的灰色預(yù)測(cè)模型主要應(yīng)用于小數(shù)據(jù)建模,隨著樣本量的增加,其預(yù)測(cè)性能往往變得更差。由于NGM3(1,1)模型背景值的光滑度優(yōu)于傳統(tǒng)的灰色預(yù)測(cè)模型,因此基于三參數(shù)的背景值構(gòu)造方法對(duì)大樣本數(shù)據(jù)具有更好的平滑效果,使得NGM3(1,1)模型能夠模擬及預(yù)測(cè)更大樣本量的應(yīng)用場(chǎng)合,從而拓展傳統(tǒng)灰色預(yù)測(cè)模型的適用范圍。
為了測(cè)試模型性能,以文獻(xiàn)[15]中的時(shí)序數(shù)據(jù)為基礎(chǔ),分別建立NGM3(1,1)模型、GM(1,1)模型及CNDGM(1,1)模型,計(jì)算這些模型的殘差、相對(duì)模擬誤差及平均相對(duì)模擬誤差,并對(duì)上述模型的模擬性能進(jìn)行比較。
表1 來(lái)自文獻(xiàn)[15]的建模數(shù)據(jù)
根據(jù)表1中的數(shù)據(jù)建立灰色預(yù)測(cè)模型,模擬值及模擬誤差如表2所示。表2中,模擬誤差Δk及平均相對(duì)模擬誤差的計(jì)算過(guò)程分為:
公式(16)用于計(jì)算灰色預(yù)測(cè)模型的平均相對(duì)模擬誤差。由于初始值不是通過(guò)模型計(jì)算得到的,視為已知數(shù)據(jù),在計(jì)算時(shí)應(yīng)剔除。由于NGM3(1,1)模型具有與GM(1,1)模型及CNDGM(1,1)模型不同的初始值個(gè)數(shù),因此對(duì)于GM(1,1)模型及CNDGM(1,1)模型,n=1;對(duì)于NGM3(1,1)模型,n=2,特此說(shuō)明。
表2 NGM3(1,1)模型、GM(1,1)模型及CNDGM(1,1)模型的模擬值及模擬誤差
從表2可以看出,本文所構(gòu)建的NGM3(1,1)模型平均相對(duì)模擬誤差為2.96%,精度等級(jí)接近I級(jí),性能最優(yōu);其次為文獻(xiàn)[15]提出的CNDGM(1,1)模型,其模型精度等級(jí)為II級(jí);而傳統(tǒng)的GM(1,1)模型精度最差。實(shí)例分析說(shuō)明了NGM3(1,1)模型的背景值參數(shù)從兩個(gè)增加至三個(gè),能明顯改善灰色預(yù)測(cè)模型背景值的平滑效果,進(jìn)一步弱化了原始序列中的極端數(shù)據(jù)對(duì)灰色預(yù)測(cè)模型性能的影響,因此其模型性能優(yōu)于傳統(tǒng)的灰色預(yù)測(cè)模型。
本文擬通過(guò)建立NGM3(1,1)模型,對(duì)三峽庫(kù)區(qū)農(nóng)村居民人均可支配收入進(jìn)行了預(yù)測(cè)和分析。表3是2009—2016年三峽庫(kù)區(qū)農(nóng)村居民的人均可支配收入情況(數(shù)據(jù)來(lái)源于重慶市2009—2016年統(tǒng)計(jì)年鑒)。
表3 三峽庫(kù)區(qū)2009—2016年農(nóng)村居民人均可支配收入情況表 (單位:元)
根據(jù)表3可知,原始序列Y(0)=(y(0)(1),y(0)(2),y(0)(3),y(0)(4),y(0)(5),y(0)(6),y(0)(7) y(0)(8))=(21.62,22.83,23.74,23.89,24.50,26.88,27.66,26.31,32.44,37.67,39.50)
建立序列Y(0)的NGM3(1,1)模型,模型參數(shù) μ1,μ2, μ3及μ4分 別 為 : μ1=1.0276; μ2=0.0138; μ3=667.3954; μ4=4234.6345
根據(jù)公式(7)可知,三峽庫(kù)區(qū)農(nóng)村居民可支配收入的NGM3(1,1)模型為:
公式(17)中,當(dāng) k=3,4,...,8時(shí),y^(0)(k +1)為模擬數(shù)據(jù);當(dāng) k=9,10,...時(shí),y^(0)(k +1)為預(yù)測(cè)數(shù)據(jù)。根據(jù)公式(17),可以計(jì)算NGM3(1,1)模型的模擬值及模擬誤差,如表4所示。為了比較NGM3(1,1)模型
的模擬性能,表4中同時(shí)列出了序列Y(0)的GM(1,1)模型及DGM(1,1)模型的模擬值及模擬誤差。
表4 NGM3(1,1)模型、GM(1,1)模型及DGM(1,1)模型的模擬值及模擬誤差
為了直觀比較NGM3(1,1)模型、GM(1,1)模型及DGM(1,1)模型對(duì)三峽庫(kù)區(qū)農(nóng)村居民人均可支配收入的模擬性能,本文用MATLAB分別繪制上述三個(gè)模型的平均模擬相對(duì)差曲線圖,如圖1所示。
圖1 NGM3(1,1)、GM(1,1)及DGM(1,1)的平均相對(duì)模擬誤差對(duì)比圖
根據(jù)圖1不難發(fā)現(xiàn),GM(1,1)模型及DGM(1,1)模型的平均相對(duì)模擬誤差非常接近,前者略高于后者;而NGM3(1,1)模型的平均相對(duì)模擬誤差具有絕對(duì)優(yōu)勢(shì),遠(yuǎn)優(yōu)于其他兩個(gè)模型。研究結(jié)果表明本文所提出的灰色預(yù)測(cè)模型背景值構(gòu)造新方法是合理有效的。
根據(jù) 公式(17),當(dāng) k=9,10,11,12,13,14,15,16,17,可以對(duì)2017—2025年三峽庫(kù)區(qū)農(nóng)村居民人均可支配收入進(jìn)行預(yù)測(cè),結(jié)果如表5所示。
根據(jù)表5不難發(fā)現(xiàn),2025年三峽庫(kù)區(qū)農(nóng)村居民人均可支配收入預(yù)計(jì)將達(dá)到23614.18元,表明三峽庫(kù)區(qū)農(nóng)村居民人均可支配收入近些年來(lái)呈現(xiàn)快速增長(zhǎng)的趨勢(shì)。三峽庫(kù)區(qū)經(jīng)濟(jì)社會(huì)取得了長(zhǎng)足的發(fā)展,農(nóng)村居民純收入不斷提高,縮小了與全國(guó)平均水平的差距。
灰色預(yù)測(cè)模型背景值是影響灰色預(yù)測(cè)模型模擬及預(yù)測(cè)精度的重要參數(shù)。然而,現(xiàn)有灰色預(yù)測(cè)模型的構(gòu)造或優(yōu)化都是建立在參數(shù)x(1)(k -1)與x(1)(k)的基礎(chǔ)之上,這導(dǎo)致灰色預(yù)測(cè)模型背景值容易受到建模序列中極端數(shù)據(jù)的影響,從而影響灰色預(yù)測(cè)模型性能的穩(wěn)定性。為此,本文提出一種含三參數(shù)的灰色預(yù)測(cè)模型背景值構(gòu)造的新方法,該方法提高了灰色預(yù)測(cè)模型背景值的平滑效果,弱化了原始序列中的極端數(shù)據(jù)對(duì)灰色預(yù)測(cè)模型性能的影響。通過(guò)案例比較,驗(yàn)證了基于三參數(shù)背景值的新型NGM3(1,1)模型的模擬性能優(yōu)于傳統(tǒng)以x(1)(k -1)及x(1)(k)為背景值基礎(chǔ)的灰色預(yù)測(cè)模型。最后,將NGM3(1,1)模型應(yīng)用于三峽庫(kù)區(qū)農(nóng)村居民可支配收入的模擬,模擬精度高達(dá)99.72%,進(jìn)一步驗(yàn)證了三參數(shù)背景值構(gòu)造新方法的可靠性及有效性。如何對(duì)以三參數(shù)為背景值的NGM3(1,1)模型進(jìn)行進(jìn)一步優(yōu)化,是下一步的研究問(wèn)題。
表5 三峽庫(kù)區(qū)2017—2025年農(nóng)村居民人均可支配收入情況表 (單位:元)