吳文青,夏 杰
(1. 西南科技大學 理學院,四川 綿陽 621010; 2. 電子科技大學 數(shù)學科學學院,四川 成都 611731)
隨著中國經(jīng)濟的發(fā)展、國民收入水平的提高,汽車產(chǎn)業(yè)蓬勃興起。2017年底我國汽車保有量已達2.17億輛,近20年間汽車保有量增長近18倍。汽車產(chǎn)業(yè)能夠帶動鋼鐵、橡膠、石油等相關產(chǎn)業(yè)的發(fā)展,推動國民經(jīng)濟的增長[1]。汽車保有量的快速增長也會帶來交通擁堵、環(huán)境污染、能源短缺等一系列問題。為此,科學、準確的對汽車保有量進行預測是制定科學決策和計劃的基礎[2,3],對道路交通和汽車產(chǎn)業(yè)的發(fā)展,以及環(huán)境污染治理措施和汽車產(chǎn)業(yè)相關政策的制定能提供理論支撐。
對汽車保有量的預測現(xiàn)已有大量研究。周騫等[4]建立了基于BP神經(jīng)網(wǎng)絡的多相關因素汽車保有量預測模型;夏鈺等[5]建立了出租車保有量神經(jīng)網(wǎng)絡預測模型,并驗證了該模型預測城市出租汽車保有量的可行性;王琦等[6]通過熵值法確定灰色系統(tǒng)、多元回歸、指數(shù)平滑、神經(jīng)網(wǎng)絡4種預測方法的加權系數(shù),建立了組合預測模型;孫璐等[7]提出了一種新的基于主成份分析和隱馬爾可夫模型的汽車保有量預測方法;王棟[8]運用灰色關聯(lián)和BP神經(jīng)網(wǎng)絡對汽車保有量進行了預測;王明銳等[9]應用計量經(jīng)濟學方法建立了汽車保有量預測模型;張?zhí)m怡等[10]基于PCA-Logistic回歸模型對福建省汽車保有量進行預測;羅志軍等[11]提出一種基于粒子群算法的汽車保有量預測方法,建立了一種多因素汽車保有量預測模型。
從上述研究文獻可知,汽車保有量預測模型主要包括時間序列模型、Logistic模型、Bass模型、灰色GM(1,1)模型、自回歸模型、人工神經(jīng)網(wǎng)絡模型、支持向量機及組合預測模型等。時間序列法和彈性系數(shù)法基于汽車保有量的歷史數(shù)據(jù)建立預測模型,該方法計算原理簡單但不能反映其內在因素的影響?;貧w分析法利用與汽車保有量相關的指標建立回歸分析模型,所需的數(shù)據(jù)量大且預測精度不高?;疑獹M(1,1)模型所需的樣本數(shù)據(jù)少,但要求汽車保有量具有指數(shù)增長的特點。Logistic模型對汽車保有量預測時,需要選取不同的參數(shù)得出不同的擬合效果,預測精度不高。人工神經(jīng)網(wǎng)絡對非線性數(shù)據(jù)具有較高的處理能力,但在訓練中容易陷入局部最優(yōu)解,達不到精度要求。組合預測模型如何確定各單項指標的權重研究尚未成熟,預測精度也有待進一步研究。為此,如何提高預測模型的預測精度是一個待解決的問題。
筆者結合灰色預測模型和人工神經(jīng)網(wǎng)絡進行優(yōu)化組合預測,充分利用汽車保有量預測因素,對汽車保有量進行預測研究。首先利用Simpson積分公式對梯形公式GM(1,1)的背景值進行改進,得出Simpson公式改進的GM(1,1)模型。然后利用相關性分析找出與汽車保有量相關性較高的因素,并把相關性因素作為神經(jīng)網(wǎng)絡的輸入,以建立BP神經(jīng)網(wǎng)絡模型。進一步根據(jù)灰色系統(tǒng)和BP神經(jīng)網(wǎng)絡預測誤差的大小確定組合模型的權重,使灰色系統(tǒng)和人工神經(jīng)網(wǎng)絡有效結合,建立灰色神經(jīng)網(wǎng)絡和Simpson公式的灰色神經(jīng)網(wǎng)絡。以2000—2010年汽車保有量的實際數(shù)據(jù)為建模數(shù)據(jù),2011—2016年的數(shù)據(jù)為檢驗數(shù)據(jù),對比分析GM(1,1)、Simpson公式改進的GM(1,1)、BP神經(jīng)網(wǎng)絡、灰色神經(jīng)網(wǎng)絡、Simpson公式的灰色神經(jīng)網(wǎng)絡模型的預測精度。
GM(1,1)灰色模型[12,13]建立如下:
設原始非負序列X(0)=(x(0)(1),x(0)(2),…,x(0)(n)),建立灰色微分方程為:
(1)
(2)
記Z1(1)為X(1)的緊鄰均值生成序列:Z1(1)=(z1(1)(2),z1(1)(3),…,z1(1)(n))。背景值z1(1)(k)可表示為:
z1(1)(k)=0.5(x(1)(k)+x(1)(k-1)),
k=2,3,…,n
(3)
為此,灰色微分方程式(1)轉化為:
k=2,3,…,n
(4)
若u1=[a1,b1]T為參數(shù)列,則式(4)的最小二乘估計參數(shù)列滿足:
(5)
且有:
為了方便計算,把矩陣B1表示為
B1=(-(z1)(n-1)×n,e(n-1)×1),
其中e(n-1)×1為(n-1)×1維的單位矩陣,B1可表示為:
GM(1,1)模型的時間序列為:
k=1,2,…,n
(6)
還原后x(0)的預測值為:
(7)
借助Simpson數(shù)值積分公式,考慮式(1)在[k-1,k+1]上的積分,有:
k=2,3,…,n-1
(8)
式(8)進一步可表示為:
k=2,3,…,n-1
(9)
利用Simpson積分公式,可得:
(10)
式(10)可轉化為:
4x(1)(k)+x(1)(k+1)]=2b2,
k=2,3,…,n-1
(11)
式(11)進一步可表示為:
(a2+3)x(1)(k+1)+4a2x(1)(k)+(a2-3)x(1)(k-1)-6b2=0,
k=2,3,…,n-1
(12)
(13)
設u2=[a2,b2]T為參數(shù)列,應用最小二乘法原理參數(shù)列滿足:
(14)
式中:
進一步把矩陣B2表示為B2=(-(z2)(n-1)×n,e(n-1)×1):
由式(7)可知,GM(1,1)模型的預測精度取決于參數(shù)a1,b1,然而模型的預測精度主要由背景值決定。對式(1)在[k-1,k]上的積分為:
k=1,3,…,n
進一步可化為:
則背景值可轉化為:
x(1)(k-1))
GM(1,1)背景值的幾何意義是積分曲線x(1)(t)在區(qū)間[k-1,k]上與t軸所圍成的曲邊梯形的面積,如圖1。然而Simpson公式的GM(1,1)模型中,其幾何意義是積分曲線在x(1)(t)在區(qū)間[k-1,k+1]上與t軸所圍成的曲邊梯形的面積,如圖2,其產(chǎn)生的誤差比梯形公式的GM(1,1)模型誤差小。
圖1 真實值與梯形公式背景值的比較Fig. 1 Comparison between real and background values of trapezoidal formula
圖2 真實值與Simpson公式背景值的比較Fig. 2 Comparison between real and background values of Simpson formula
1985年,美國加州大學的魯梅爾哈特和麥克萊蘭等人提出BP神經(jīng)網(wǎng)絡[14],神經(jīng)網(wǎng)絡已廣泛應用于圖像處理、模式識別、語言處理、預測分析等各個領域。從結構上看,該模型具有輸入層,隱含層和輸出層,是一種典型的多層前向型神經(jīng)網(wǎng)絡。
1.4.1 神經(jīng)元模型
一個基本的BP神經(jīng)元,具有R個輸入,每個輸入都通過一個對應的權值w和下一層相連,網(wǎng)絡輸出可表示為:
Y=f(wp+b)
(15)
式中:f為輸入與輸出的傳遞函數(shù);w代表權值;b為隱含層神經(jīng)元的偏置值。
1.4.2 激勵函數(shù)
神經(jīng)元的各種不同的數(shù)學模型的主要區(qū)別在于采用了不同的激勵函數(shù),常見的激勵函數(shù)有:閾值型、分段線性飽和型、S型、子閾累積型。筆者選取S型函數(shù),其表達式為:
(16)
1.4.3 BP神經(jīng)網(wǎng)絡的學習算法
設樣本X=[x1,x2,…xm]′,Y=[y1,y2,…ym]′,隱含層神經(jīng)元為O=[O1,O2,…Om]′。
則隱含層神經(jīng)元的輸出為:
j=1,2,…l
(17)
輸出層神經(jīng)元的輸出為:
k=1,2,…n
(18)
網(wǎng)絡輸出與期望輸出的誤差為:
(19)
(20)
式(20)中負號表明梯度下降,η∈(0,1)是常數(shù),反映了學習過程中的學習梯度。
組合預測模型[15,16]綜合考慮各項單項預測模型的預測結果,用恰當?shù)慕M合權重對其進行加權平均得到組合預測模型。組合預測模型的關鍵環(huán)節(jié)是合理的確定組合權系數(shù)。目前,研究學者主要以絕對誤差或相對誤差作為導出組合權系數(shù)的優(yōu)化準則。筆者采用灰色神經(jīng)網(wǎng)絡模型,將灰色模型和人工神經(jīng)網(wǎng)絡通過加權方式優(yōu)化組合,使2種預測方法優(yōu)勢互補,提高預測精確,其結構如圖3。
圖3 灰色神經(jīng)網(wǎng)絡結構Fig. 3 Gray neural network structure
設xt1,xt2分別表示人工神經(jīng)網(wǎng)絡預測模型和灰色預測模型在第t個時段得到的預測值,Yt表示第t個時段組合預測值,c1,c2分別表示兩種模型的權系數(shù),則可得到:
Yt=c1xt1+c2xt2,
t=1,2,…n
(21)
且c1+c2=1
設r1,r2,r分別為灰色預測模型、神經(jīng)網(wǎng)絡模型、組合預測模型的誤差,x(0)(t)為原始序列,則誤差可分別表示為:
(22)
為了提高預測精度,需要使模型的誤差平方和最小,即:
(23)
進一步,設取到每個預測值的概率均為P(每次取到的概率相等),組合預測Yt的誤差平方和最小,可轉化為求其方差最小,即:
(24)
為了找到組合預測Yt的最小值,對Var(r)關于c1求偏導數(shù),找到其最小值:
(25)
可得:
(26)
記Var(r1)=S11,Var(r2)=S22,Cov(r1,r2)=S12,因為灰色預測模型和神經(jīng)網(wǎng)絡模型互相獨立,因此S12=0,則可得:
(27)
最后,將計算所的c1,c2代入式(21)可得灰色神經(jīng)網(wǎng)絡的預測值。
為了檢驗各個模型的預測精度,采用預測值與真實值的相對誤差,相對標準偏差進行檢驗預測精確度。記δ為預測相對誤差,S為預測誤差的均方差,Yt為第t個時刻的預測值,x(0)(t)為第t個時刻實際值,則:
(28)
汽車保有量預測具有很大程度的不確定性,影響汽車保有量的因素較多,國民經(jīng)濟、人口總數(shù)、固定資產(chǎn)投資、進出口額,政府政策等都會影響汽車保有量的增長[17]。綜合考慮影響汽車保有量的各個因素和數(shù)據(jù)的可操作性,利用MATLAB軟件對汽車保有量有關的指標進行相關性分析,相關系數(shù)見表1。最終選取國民總收入、人均國內生產(chǎn)總值、總人口、固定資產(chǎn)投資、進出口總額、鋼材產(chǎn)量、社會消費品零售總額7個因素作為中國汽車保有量的主要影響因素。數(shù)據(jù)來源于中國統(tǒng)計局官網(wǎng)和《中國統(tǒng)計年鑒2017》[18]。
表1 汽車保有量相關系數(shù)Table 1 Correlation coefficient of car ownership
筆者利用MATLAB軟件編程,以2000—2010年共11年的中國民用汽車保有量歷史數(shù)據(jù)對2011—2016年共6年的汽車保有量進行預測。根據(jù)預測結果分別對梯形公式的GM(1,1)模型、Simpson公式的GM(1,1)模型、BP神經(jīng)網(wǎng)絡模型、灰色神經(jīng)網(wǎng)絡組合模型進行精度檢驗。
2.2.1 梯形公式的GM(1,1)模型
由1.1的計算表達式求得GM(1,1)預測模型的發(fā)展系數(shù)a1=-0.175 9,灰色作用量b1=1 116.09,GM(1,1)模型的時間序列為
k=1,2,…,n
(29)
求得的預測值與相對誤差見表2。
2.2.2 Simpson公式的GM(1,1)模型
由1.2的計算表達式,求得基于Simpson公式的GM(1,1)模型的發(fā)展系數(shù)a2=-0.175 4,灰色作用量b2=1 112.85,Simpson公式GM(1,1)模型的時間序列可表示為:
k=1,2,…,n-1
(30)
求得的預測值及誤差見表2。
2.2.3 BP神經(jīng)網(wǎng)絡模型
筆者用MATLAB進行神經(jīng)網(wǎng)絡訓練,其中模型的輸入層為影響汽車保有量的因素,輸出層為汽車保有量,具體設計如下:①輸入層:選取國民總收入、人均國內生產(chǎn)總值、總人口、固定資產(chǎn)投資、進出口總額、鋼材產(chǎn)量、社會消費品零售總額共7個指標作為輸入層;②輸出層:汽車保有量作為輸出層。
1)模型的結構設計
經(jīng)過多次訓練比較,得出誤差最小的3層BP神經(jīng)網(wǎng)絡的網(wǎng)絡結構為7×40×1。在訓練過程中,選取tansig函數(shù)為輸入層與隱含層的傳遞函數(shù),purelin為隱含層與輸出層的傳遞函數(shù),選取trainbr為訓練函數(shù),選取learngdm為網(wǎng)絡學習函數(shù)。
2)模型網(wǎng)絡參數(shù)的選取及參數(shù)設定
參數(shù)設置為:net.trainparam.epochs=10000為網(wǎng)絡訓練的最大次數(shù),net.trainparam.lr=0.01為學習效率,net.train- param.show=20為每20輪顯示一次,net.trainpara- m.goal=5×10-5為訓練誤差。
從而得到汽車保有量預測值見表2。
2.2.4 灰色神經(jīng)網(wǎng)絡組合模型
鑒于灰色模型和人工神經(jīng)網(wǎng)絡網(wǎng)絡單一使用時都有一定的局限性,采用將灰色模型和人工神經(jīng)網(wǎng)絡通過加權的方式優(yōu)化組合,通過加權操作簡單且能使兩種模型優(yōu)勢互補,提高預測精度。結合灰色預測模型與BP神經(jīng)網(wǎng)絡的預測值,計算相應誤差的方差,以式(27)求得組合權重系數(shù)。其中灰色GM(1,1)預測的權重c11=0.191 95,人工神經(jīng)網(wǎng)絡權重c12=0.808 05?;赟impson公式的GM(1,1)權重c21=0.206 46,人工神經(jīng)網(wǎng)絡權重c22=0.765 38。求得的組合灰色神經(jīng)網(wǎng)絡模型的預測值及其相對誤差見表2。
表2 基于不同模型的中國汽車擁有量預測值與實際值對比Table 2 Comparison table of predicted and actual value of china’s car ownership based on different models
由表2可得,采用灰色GM(1,1)模型、Simpson公式的GM(1,1)模型、BP神經(jīng)網(wǎng)絡、組合灰色神經(jīng)網(wǎng)絡、Simpson改進的灰色神經(jīng)網(wǎng)絡模型的預測結果與實際結果的相對誤差均在16%以內,其誤差的均方差為62.958 1, 60.381 6, 12.043 4, 3.506 9, 3.279 0。為更直觀的看出各個模型的預測精度,對各個預測模型的相對誤差繪制直方圖,見圖4。相比較而言,Simpson改進的GM(1,1)模型預測精度比GM(1,1)模型精度高。此外,組合Simpson改進的灰色神經(jīng)網(wǎng)絡模型的預測精度最高,預測效果優(yōu)于灰色神經(jīng)網(wǎng)絡模型、GM(1,1)模型、Simpson改進的GM(1,1)模型、BP神經(jīng)網(wǎng)絡模型。
圖3 基于不同模型的汽車保有量相對誤差對比Fig. 3 Relative error comparison of car ownership based on different models
筆者利用Simpson公式對灰色GM(1,1)模型進行改進,提出了基于Simpson公式的灰色GM(1,1)模型。根據(jù)灰色系統(tǒng)和BP神經(jīng)網(wǎng)絡預測誤差的大小確定組合模型的權重,構建灰色神經(jīng)網(wǎng)絡組合模型,并以中國汽車保有量為例進行預測分析。研究表明:筆者建立的模型預測值與實際值的相對誤差在16%以內,可得所建模型是有效可行的?;赟impson公式的改進GM(1,1)模型預測精度比梯形公式的GM(1,1)精確度高,Simpson公式的灰色神經(jīng)網(wǎng)絡預測精度最高,其相對誤差均在3%以內,標準方差為3.278 0,小于灰色神經(jīng)網(wǎng)絡模型、GM(1,1)模型、Simpson改進的GM(1,1)模型、BP神經(jīng)網(wǎng)絡模型。