劉 攀,馮長(zhǎng)煥
(西華師范大學(xué),四川 南充 637002)
EGM-BP網(wǎng)絡(luò)模型在單變量時(shí)間序列預(yù)測(cè)中的應(yīng)用
——以四川省GDP為例
劉 攀,馮長(zhǎng)煥
(西華師范大學(xué),四川 南充 637002)
利用GM(1,1)模型需要的數(shù)據(jù)少,而B(niǎo)P網(wǎng)絡(luò)模擬精度高且適合非線性系統(tǒng)的特點(diǎn),基于GM(1,1)模型的均值形式,以1980—2016年四川省GDP值作為原始序列,其累加序列、均值序列和前一歷史序列作為輸入向量,原始序列作為輸出向量,進(jìn)行BP網(wǎng)絡(luò)訓(xùn)練,建立EGM-BP網(wǎng)絡(luò)模型,提出了一種灰色神經(jīng)網(wǎng)絡(luò)的新方法。利用2014—2016年的GDP數(shù)據(jù)進(jìn)行驗(yàn)證,發(fā)現(xiàn)EGM-BP模型對(duì)于單變量時(shí)間序列預(yù)測(cè)的精度比傳統(tǒng)單一模型預(yù)測(cè)精度更高。
GM(1,1)模型;BP神經(jīng)網(wǎng)絡(luò);單變量時(shí)間序列;GDP預(yù)測(cè)
GDP(Gross Domestic Product)是指一個(gè)國(guó)家或地區(qū)所有常駐單位在一定時(shí)期內(nèi)生產(chǎn)活動(dòng)的最終市場(chǎng)價(jià)值。它反映了一個(gè)國(guó)家或地區(qū)一定時(shí)期內(nèi)的經(jīng)濟(jì)實(shí)力和市場(chǎng)規(guī)模狀況,是國(guó)民經(jīng)濟(jì)核算體系的核心指標(biāo)。精準(zhǔn)地預(yù)測(cè)GDP不僅能加強(qiáng)國(guó)家宏觀調(diào)控,而且能促進(jìn)企業(yè)經(jīng)營(yíng)管理,使得經(jīng)濟(jì)決策科學(xué)化。國(guó)內(nèi)學(xué)者對(duì)GDP數(shù)據(jù)預(yù)測(cè)的研究成果頗多,建立的數(shù)學(xué)模型主要有回歸模型、指數(shù)平滑模型、灰色GM(1,1)模型、ARIMA 模型、神經(jīng)網(wǎng)絡(luò)模型以及它們的組合模型[1-4]。
神經(jīng)網(wǎng)絡(luò)近年來(lái)在數(shù)學(xué)、物理、工程等領(lǐng)域的應(yīng)用十分廣泛,并涌現(xiàn)了大量的成果。BP網(wǎng)絡(luò)是使用最廣泛的一種神經(jīng)網(wǎng)絡(luò),它通過(guò)建立從輸入到輸出的映射關(guān)系,在自動(dòng)學(xué)習(xí)之后,能在一定條件下以任意精度實(shí)現(xiàn)任意的非線性映射。BP網(wǎng)絡(luò)需要一定數(shù)量的訓(xùn)練樣本才能作較好的預(yù)測(cè)?;疑獹M(1,1)模型對(duì)數(shù)據(jù)的要求較少,但不能直接用于非齊次指數(shù)序列和振蕩序列的建模。筆者把GM(1,1)模型和BP網(wǎng)絡(luò)結(jié)合,建立EGM-BP網(wǎng)絡(luò)模型,該模型同時(shí)具有GM(1,1)和BP網(wǎng)絡(luò)的特點(diǎn),能在較少信息量的情況下對(duì)未來(lái)時(shí)間序列作出較好的預(yù)測(cè)。
本文把1978—2016年四川省GDP值作為原始序列,利用灰色GM(1,1)模型中累加生成和均值生成的思想,生成與原始序列相關(guān)的3組序列,以此作為輸入向量。把原始GDP值作為輸出向量,構(gòu)建了結(jié)構(gòu)為3-6-12-1的BP網(wǎng)絡(luò)。利用2014—2016年的GDP數(shù)據(jù)進(jìn)行模型精度的比較,結(jié)果表明EGMBP網(wǎng)絡(luò)模型比傳統(tǒng)單一模型誤差更小,精度更高。
灰色系統(tǒng)理論由鄧聚龍教授在1982年創(chuàng)立,目前已被廣泛應(yīng)用于自然科學(xué)、社會(huì)科學(xué)、工程技術(shù)等各個(gè)領(lǐng)域。GM(1,1)模型是灰色系統(tǒng)理論的核心部分,它有4種基本形式:均值形式(EGM)、原始差分形式(ODGM)、均值差分形式(EDGM)和離散形式(DGM)。人們提到的 GM(1,1)模型通常是指EGM(1,1)[5]。EGM(1,1)通過(guò)建立關(guān)于原始序列的特殊差分方程和微分方程,在一定程度上模擬單變量時(shí)間序列,能對(duì)未來(lái)時(shí)間序列做出預(yù)測(cè)。
EGM(1,1)的建模步驟如下:
設(shè)原始序列 X ( 0) = (x (1),x (2),???,x (n )),x(0)(k)≥0,k=1,2,…,n。記 X(0)的累加序列為 X(1)=(x(1()1),x(1)(2),…,x(1)(n)),記X(1)的緊鄰均值序列為Z(1)=(z(1)(1),z(1)(2),…,
(1)建立白化微分方程:
其中a,b滿足差分方程:
稱 a 為發(fā)展系數(shù),b 為灰色作用量,z(1)(k)為灰色背景值。
(2)利用最小二乘法求參數(shù)向量 a^ = [a, b]=(BTB)-1BTY,其中 BT,Y 分別為:
得到白化微分方程的解(也叫EGM(1,1)模型的時(shí)間響應(yīng)式):
(3)求累減還原式,得到原始序列的模擬表達(dá)式:
BP網(wǎng)絡(luò)(Back-Propagation Network),即反向傳播網(wǎng)絡(luò),由Rumelhart等人在1986提出,是目前使用最廣泛的神經(jīng)網(wǎng)絡(luò)模型[6]。BP網(wǎng)絡(luò)在函數(shù)逼近、模式識(shí)別、數(shù)據(jù)的壓縮與分類等方面得到了大量的應(yīng)用。
其模型的思想為:建立一個(gè)三層或三層以上的神經(jīng)網(wǎng)絡(luò)(輸入層、隱層和輸出層),使數(shù)據(jù)從輸入層向隱層傳輸,隱層向輸出層傳輸。層與層之間由激勵(lì)函數(shù)和權(quán)值連接,在數(shù)據(jù)傳輸?shù)倪^(guò)程中,通過(guò)誤差的反饋,不斷地反向調(diào)整各層之間的連接權(quán)值,直至達(dá)到指定的精度或運(yùn)算次數(shù)。
MATLAB軟件構(gòu)建BP網(wǎng)絡(luò)的步驟[6,7]:
(1)網(wǎng)絡(luò)結(jié)構(gòu)的設(shè)置
BP網(wǎng)絡(luò)結(jié)構(gòu)由輸入層、隱層和輸出層構(gòu)成,隱層至少為一層。根據(jù)Kolmogorov定理,一個(gè)三層的前饋神經(jīng)網(wǎng)絡(luò)能以任意精度逼近任意連續(xù)的函數(shù)[7]。隨著網(wǎng)絡(luò)層數(shù)的增加,誤差進(jìn)一步降低。但這也會(huì)增加網(wǎng)絡(luò)的復(fù)雜性和學(xué)習(xí)時(shí)間。所以,一般不增加網(wǎng)絡(luò)的層數(shù),而是通過(guò)增加隱層神經(jīng)元的個(gè)數(shù)來(lái)嘗試降低誤差,提高精度。
(2)輸入層和輸出層的設(shè)置
輸入向量為影響待預(yù)測(cè)序列的主要因素序列,輸入層節(jié)點(diǎn)為主要因素的個(gè)數(shù)。輸出向量為需要預(yù)測(cè)的序列,其節(jié)點(diǎn)數(shù)為待預(yù)測(cè)序列的個(gè)數(shù)。為了消除量綱的影響以及提高網(wǎng)絡(luò)學(xué)習(xí)的收斂性,通常需要對(duì)數(shù)據(jù)作歸一化處理,把數(shù)據(jù)規(guī)范在[-1,1]或[0,1]區(qū)間內(nèi)。
(3)隱層節(jié)點(diǎn)的設(shè)置
目前,關(guān)于隱層節(jié)點(diǎn)的設(shè)置還沒(méi)有一個(gè)具體的公式來(lái)確定,一般使用試湊法及以下經(jīng)驗(yàn)公式[6]來(lái)確定:
3) N = l ogn ,其中n為輸入層節(jié)點(diǎn)數(shù)。
(4)網(wǎng)絡(luò)參數(shù)的設(shè)置
在MATLAB中,使用newff函數(shù)創(chuàng)建一個(gè)BP網(wǎng)絡(luò)。層與層之間的激勵(lì)函數(shù)主要有S型對(duì)數(shù)函數(shù)(logsig)、S型正切函數(shù)(tansig)和純線性函數(shù)(purelin)等。BP網(wǎng)絡(luò)訓(xùn)練函數(shù)默認(rèn)為L(zhǎng)-M算法訓(xùn)練函數(shù)(trainlm)。期望誤差的學(xué)習(xí)目標(biāo)默認(rèn)為0,可以根據(jù)需要設(shè)置學(xué)習(xí)目標(biāo)的精度。迭代次數(shù)一般不超過(guò)50000次。學(xué)習(xí)效率在0到1之間,并不是越大或越小越好,太大使系統(tǒng)不穩(wěn)定,太小會(huì)使訓(xùn)練時(shí)間過(guò)長(zhǎng)。
(5)網(wǎng)絡(luò)訓(xùn)練與檢驗(yàn)
(6)預(yù)測(cè)與誤差分析
(一)EGM-BP網(wǎng)絡(luò)模型的原理
(二)EGM-BP網(wǎng)絡(luò)模型主要步驟
(1)設(shè)原始序列 X(0)=(x(0)(1),x(0)(2),…,x(0)(n)),X(0)(k)≥0,k=1,2,…,n;
(2)計(jì)算X(0)的前一歷史序列X'(0)、累加序列 X(1)、以及 X(1)的緊鄰均值序列為 Z(1);
(3)把X'(0)、X(1)、Z(1)作為輸入向量,X(0)作為輸出向量,構(gòu)建BP網(wǎng)絡(luò);
(4)網(wǎng)絡(luò)訓(xùn)練與檢驗(yàn);
(5)預(yù)測(cè)與誤差分析。
本文選取1978—2016年四川省GDP數(shù)據(jù)為研究對(duì)象(單位為億元),數(shù)據(jù)來(lái)源于四川統(tǒng)計(jì)局。以2014—2016年的數(shù)據(jù)作為檢驗(yàn)數(shù)據(jù)。
記1980—2016年的原始GDP值為輸出向量T0=[t(1),t(2),…,t(37)]。分別記T0的累加序列、累加序列的均值序列、前一歷史序列為pi(i=1,2,3),記輸入向量 p0=[p1;p2;p3]。
(1)網(wǎng)絡(luò)結(jié)構(gòu)、輸入層和輸出層的設(shè)置
本文選擇建立四層BP網(wǎng)絡(luò),由T0和P0知,輸入和輸出層節(jié)點(diǎn)分別為3和1。由于S型激勵(lì)函數(shù)的輸出值只能無(wú)限接近0或者1,而不能達(dá)到0或者1,為了增強(qiáng)網(wǎng)絡(luò)的泛化能力,本文把數(shù)據(jù)規(guī)范在[0.1,0.9]區(qū)間內(nèi)。歸一化的方法是其中M和m分別為該序列的最大值和最小值。
(2)隱層節(jié)點(diǎn)的設(shè)置
本文采用試湊法,得出適合的兩個(gè)隱層節(jié)點(diǎn)數(shù)分別為6和12,相應(yīng)的BP網(wǎng)絡(luò)結(jié)構(gòu)為3-6-12-1。
(3)網(wǎng)絡(luò)參數(shù)的設(shè)置
通過(guò)反復(fù)試驗(yàn),得到適合的網(wǎng)絡(luò)參數(shù)見(jiàn)表1。其他參數(shù)選擇MATLAB默認(rèn)設(shè)置。
表1 EGM-BP網(wǎng)絡(luò)模型參數(shù)設(shè)置
(4)網(wǎng)絡(luò)訓(xùn)練
(5)網(wǎng)絡(luò)的檢驗(yàn)與預(yù)測(cè)
利用2014—2016年四川省GDP數(shù)據(jù)對(duì)模型進(jìn)行精度檢驗(yàn),結(jié)果見(jiàn)表2。結(jié)果顯示,預(yù)測(cè)值與實(shí)際值的相對(duì)誤差的絕對(duì)值都在0.3%以內(nèi),誤差較小。
2017年四川省GDP的前一歷史值為32680.5億元,累積值為284519.71億元,累加值的均值生成為268179.46億元。把這三個(gè)值作為輸入向量,得到2017年四川省GDP的預(yù)測(cè)值為35008.87億元。相對(duì)2016年的增速約為7.12%,與四川省2017年1季度GDP實(shí)際增長(zhǎng)接近。
表2 EGM-BP網(wǎng)絡(luò)模型檢驗(yàn)結(jié)果
記1980—2013年四川省GDP值為y,時(shí)間t=1,2,…,34。分別對(duì)y關(guān)于t作一次曲線、二次曲線、三次曲線擬合,結(jié)果顯示三次曲線的擬合度最高,為0.991。擬合曲線為:
由于1980—2013年四川省GDP呈近指數(shù)增長(zhǎng),分別對(duì)y關(guān)于t作S型曲線、生長(zhǎng)曲線擬合,生長(zhǎng)曲線的擬合度最高為0.995。擬合曲線為:
由于舊信息歷史久遠(yuǎn),與新信息的相關(guān)程度可能不高,新信息顯得更重要,因此建立灰色新陳代謝模型。分別建立4至10階GM(1,1)模型,結(jié)果表明,4階GM(1,1)模型的誤差最小,其結(jié)果見(jiàn)表3和表4。
針對(duì)1980—2013年四川省GDP數(shù)據(jù),把年份作為輸入向量,原始GDP作為輸出向量,建立BP網(wǎng)絡(luò),結(jié)果見(jiàn)表3和表4。
表3 傳統(tǒng)單一模型預(yù)測(cè)結(jié)果
表4 傳統(tǒng)單一模型預(yù)測(cè)相對(duì)誤差
四川省作為西部人口大省,科學(xué)地預(yù)測(cè)其GDP總量對(duì)于政府制定經(jīng)濟(jì)政策和企業(yè)規(guī)劃有重要的意義和價(jià)值。預(yù)測(cè)結(jié)果表明2017年四川省GDP總量將持續(xù)增加,增長(zhǎng)率將在7.12%左右?;贕M(1,1)模型的累加生成和均值生成的思想,結(jié)合BP網(wǎng)絡(luò),本文建立了EGM-BP網(wǎng)絡(luò)模型,實(shí)驗(yàn)結(jié)果表明,EGM-BP模型比傳統(tǒng)單一模型效果更好,精度更高。本文提出的EGM-BP模型還可用于其他單變量時(shí)間序列的預(yù)測(cè)。另外,人工神經(jīng)網(wǎng)絡(luò)中其他網(wǎng)絡(luò)也具有良好的預(yù)測(cè)功能,如RBF網(wǎng)絡(luò)、Elman網(wǎng)絡(luò)、小波神經(jīng)網(wǎng)絡(luò)等,后續(xù)研究可考慮將累加生成和均值生成的思想與這些網(wǎng)絡(luò)結(jié)合進(jìn)行科學(xué)預(yù)測(cè)。
[1]龍會(huì)典,嚴(yán)廣樂(lè).基于 SARIMA、GM(1,1)和 BP 神經(jīng)網(wǎng)絡(luò)集成模型的GDP時(shí)間序列預(yù)測(cè)研究[J].數(shù)理統(tǒng)計(jì)與管理,2013,32(5):814-822.
[2]許金煒.基于虛擬變量回歸與SARIMA組合模型的GDP預(yù)測(cè)[J].統(tǒng)計(jì)與決策,2016,(24):38-41.
[3]薛倩,牟鳳云,涂植鳳.組合預(yù)測(cè)方法在重慶市 GDP預(yù)測(cè)中的應(yīng)用 [J].重慶工商大學(xué)學(xué)報(bào) (自然科學(xué)版),2017,34(1):56-63.
[4]龍會(huì)典,嚴(yán)廣樂(lè).基于改進(jìn)的 GM(1,1)-Markov鏈組合模型廣東省單位GDP能耗預(yù)測(cè)[J].數(shù)理統(tǒng)計(jì)與管理,2017,36(2):200-207.
[5]劉思峰,謝乃明,等.灰色系統(tǒng)理論及其應(yīng)用(第六版)[M].北京:科學(xué)出版社,2013:97-121.
[6]飛思科技產(chǎn)品研發(fā)中心.神經(jīng)網(wǎng)絡(luò)理論與MATLAB7實(shí)現(xiàn)[M].北京:電子工業(yè)出版社,2005:99-107.
[7]施彥,韓力群,廉小親.神經(jīng)網(wǎng)絡(luò)設(shè)計(jì)方法與實(shí)例分析[M].北京:北京郵電大學(xué)出版社,2009:23-36.
EGM-BP Network Model in the Application of Single Variable Time Series Prediction——Taking Sichuan GDP as Example
LIU Pan,FENG Chang-huan
(China West Normal University,Nanchong 637002,China)
GM(1,1)model requires less data and BP network modeling is of high accuracy and suitable for the nonlinear systems.Thus,based on EGM(1,1)model,the GDP value of Sichuan Province from 1980 to 2016 was set as the original series,then its cumulative series,average series and the series of previous historical period was set as input vector,and the original series was set as the output vector to conduct the BP network training.EGM-BP network model was set up,proposed a new method for gray neural network.In the 2014-2016 GDP data verification,the results showed that EGM-BP model for single variable time series had higher precision than traditional single model.
GM(1,1);BP neural network;single variable time series;GDP forecast
F224
A
1674-3229(2017)03-0008-04
2017-06-03
西華師范大學(xué)基本科研項(xiàng)目(14C004);南充市社科規(guī)劃一般規(guī)劃項(xiàng)目(NC2013B027)
劉攀(1995-),男,西華師范大學(xué)碩士研究生,研究方向:應(yīng)用數(shù)理統(tǒng)計(jì);馮長(zhǎng)煥(1972-),女,碩士,西華師范大學(xué)數(shù)學(xué)與信息學(xué)院教授,研究方向:應(yīng)用數(shù)理統(tǒng)計(jì)。
廊坊師范學(xué)院學(xué)報(bào)(自然科學(xué)版)2017年3期