■ 任倩 計(jì)春雷
1.上海海洋大學(xué)信息學(xué)院 上海 201306
2.上海電機(jī)學(xué)院大數(shù)據(jù)挖掘重點(diǎn)實(shí)驗(yàn)室 上海 201306
隨著我國(guó)的經(jīng)濟(jì)實(shí)力和綜合國(guó)力不斷提高,我國(guó)的宏觀經(jīng)濟(jì)數(shù)據(jù)備受關(guān)注,且工業(yè)作為國(guó)民經(jīng)濟(jì)中一個(gè)十分重要的物質(zhì)生產(chǎn)部門,占有國(guó)民生產(chǎn)總值的最大份額,在社會(huì)經(jīng)濟(jì)活動(dòng)中有著重要的地位。工業(yè)增加值意為企業(yè)在進(jìn)行工業(yè)生產(chǎn)中以貨幣形式新增加的價(jià)值,其可以衡量一個(gè)國(guó)家工業(yè)發(fā)展的速度,是判斷我們國(guó)家工業(yè)發(fā)展水平是否提高的重要指標(biāo)。工業(yè)增加值對(duì)企業(yè)實(shí)現(xiàn)經(jīng)濟(jì)增長(zhǎng)起到了決定性作用,對(duì)工業(yè)增加值進(jìn)行預(yù)測(cè)可以幫助其提高生產(chǎn)經(jīng)營(yíng)和管理能力,有利于企業(yè)對(duì)未來發(fā)展方向進(jìn)行判斷和規(guī)劃。政府部門和企業(yè)在制定工業(yè)發(fā)展政策時(shí),通常將其作為的重要標(biāo)準(zhǔn),對(duì)工業(yè)增加值的變化準(zhǔn)確預(yù)測(cè)對(duì)于政府部門和企業(yè)的發(fā)展具有重要意義。
在目前已有的工業(yè)增加值預(yù)測(cè)研究方法中,主要有傳統(tǒng)預(yù)測(cè)和機(jī)器學(xué)習(xí)兩類方法。傳統(tǒng)預(yù)測(cè)方法主要有線性回歸,灰色預(yù)測(cè)以及時(shí)間序列分析等。劉靜思等[1]采用線性回歸方程對(duì)單一模型進(jìn)行組合,并在中長(zhǎng)期工業(yè)增加值預(yù)測(cè)中取得了較好效果,然而此方法只考慮數(shù)據(jù)間存在的線性關(guān)系,忽略了數(shù)據(jù)間的非線性關(guān)系。何川[2]利用時(shí)間序列分析的理論預(yù)測(cè)我國(guó)工業(yè)增加值的歷史數(shù)據(jù),預(yù)測(cè)結(jié)果表明,時(shí)間序列方法是進(jìn)行模型模擬和短期預(yù)測(cè)有效的方法。 高宇等[3]結(jié)合ARMA 模型與博克斯詹金斯的“航空數(shù)據(jù)模型”對(duì)工業(yè)增加值進(jìn)行擬合,擬合后的殘差不存在相關(guān)性。由于時(shí)間序列分析法強(qiáng)調(diào)忽略外界因素影響,所以模型的預(yù)測(cè)誤差難以把控,當(dāng)外界產(chǎn)生較大改變時(shí),預(yù)測(cè)結(jié)果會(huì)出現(xiàn)較大偏差。機(jī)器學(xué)習(xí)方法主要包含支持向量機(jī),神經(jīng)網(wǎng)絡(luò)等。徐智勇等[4]利用支持向量機(jī)方法并結(jié)合微分進(jìn)化理論(Dif‐ference Evolution, DE)對(duì)工業(yè)增加值進(jìn)行預(yù)測(cè),該類方法能夠降低計(jì)算復(fù)雜性,但受參數(shù)和核函數(shù)的影響,只適用于小樣本訓(xùn)練集。上述方法為研究工業(yè)增加值奠定了基礎(chǔ),然而其存在應(yīng)用場(chǎng)景單一、遷移學(xué)習(xí)能力弱等缺點(diǎn),難以在企業(yè)工業(yè)增加值估計(jì)中得到廣泛應(yīng)用。
由于影響我國(guó)工業(yè)增加值變化的因素繁雜多樣,各個(gè)因素影響工業(yè)增加值變化的程度均不同,部分影響因素還存有灰色性,并且它們之間還具有復(fù)雜的非線性關(guān)系,而在處理不確定和非線性的問題上灰色模型和BP神經(jīng)網(wǎng)絡(luò)具有明顯的優(yōu)勢(shì)。綜上所述,本文結(jié)合灰色模型與BP 神經(jīng)網(wǎng)絡(luò)模型,發(fā)展了一種基于灰色BP 神經(jīng)網(wǎng)絡(luò)[5-10]的工業(yè)增加值預(yù)測(cè)方法。首先運(yùn)用灰色模型對(duì)工業(yè)增加值的數(shù)據(jù)序列進(jìn)行擬合,然后采用BP 神經(jīng)網(wǎng)絡(luò)對(duì)灰色模型實(shí)際值和預(yù)測(cè)值的殘差序列進(jìn)行修正;最后結(jié)合BP 神經(jīng)網(wǎng)絡(luò)修正的殘差值與灰色模型預(yù)測(cè)值得到最終的工業(yè)增加值預(yù)測(cè)結(jié)果。
由于我國(guó)工業(yè)增加值變化有很強(qiáng)的季節(jié)波動(dòng)性[11],其季節(jié)波動(dòng)兼有平滑轉(zhuǎn)換形式的結(jié)構(gòu)時(shí)變與非線性特征,僅采用灰色或者BP 神經(jīng)網(wǎng)絡(luò)單一模型不能得到很好的預(yù)測(cè)效果。所以本文發(fā)展了一種基于灰色BP 神經(jīng)網(wǎng)絡(luò)的工業(yè)增加值預(yù)測(cè)方法,其主要流程如圖1所示。
圖1 模型預(yù)測(cè)流程
首先將原始數(shù)據(jù)進(jìn)行預(yù)處理,考慮到工業(yè)增加值具有季節(jié)波動(dòng)性,將數(shù)據(jù)分為一、二、三、四個(gè)季度分別輸入到灰色模型中,運(yùn)用灰色模型對(duì)工業(yè)增加值數(shù)據(jù)序列進(jìn)行擬合,然后建立神經(jīng)網(wǎng)絡(luò)殘差修正模型,最后將殘差對(duì)灰色擬合值進(jìn)行修正,即將灰色模型的預(yù)測(cè)值與對(duì)應(yīng)的BP神經(jīng)網(wǎng)絡(luò)修正的殘差值疊加,輸出最終預(yù)測(cè)值。
GM(1,1)是根據(jù)灰色系統(tǒng)理論[12]建立的灰色模型。該模型不依賴大量樣本和典型分布,能夠根據(jù)少量不完整的信息建立數(shù)學(xué)模型,從而對(duì)未來的發(fā)展趨勢(shì)進(jìn)行預(yù)測(cè)。當(dāng)原始數(shù)據(jù)序列為高增長(zhǎng)序列或者序列數(shù)據(jù)變化較快時(shí),GM(1,1)模型則會(huì)出現(xiàn)預(yù)測(cè)精度偏低[13]的缺點(diǎn)。其建模步驟主要如下:
(1)原始數(shù)據(jù)序列為x(0),一階累加處理得到生成序列x(1),如公式1。
計(jì)算累加序列x(1)的均值生成數(shù)列z(1),如公式2。
(2)建立灰色微分方程,即:
其中,a為發(fā)展系數(shù),b為灰作用量。
(3)利用最小二乘法求解灰色微分方程的系數(shù)列:
其中,
求解灰色微分方程得:
則x(1)的灰色預(yù)測(cè)模型為:
(4)做一階累減得出原始數(shù)據(jù)的預(yù)測(cè)序列,得到原始數(shù)據(jù)序列的灰色模型為:
BP 神經(jīng)網(wǎng)絡(luò)是一種被廣泛應(yīng)用的采用誤差逆?zhèn)鞑ニ惴ㄓ?xùn)練得到的多層前饋網(wǎng)絡(luò)[14]。它由輸入層、隱含層和輸出層3個(gè)部分構(gòu)成。該網(wǎng)絡(luò)訓(xùn)練的實(shí)質(zhì)是利用誤差反向傳播算法對(duì)各個(gè)權(quán)值和偏置值進(jìn)行修正,從而使網(wǎng)絡(luò)達(dá)到收斂的狀態(tài)[15]。圖2 為BP 神經(jīng)網(wǎng)絡(luò)的拓?fù)浣Y(jié)構(gòu)圖。
圖2 BP神經(jīng)網(wǎng)絡(luò)的拓?fù)浣Y(jié)構(gòu)圖
如圖所示,xn為輸入值,ym是網(wǎng)絡(luò)輸出值,wij和wjk為網(wǎng)絡(luò)權(quán)值,從圖中可以看出,BP 神經(jīng)網(wǎng)絡(luò)反映了xn到y(tǒng)m的函數(shù)映射關(guān)系,是一個(gè)非線性函數(shù),而影響預(yù)測(cè)的因素眾多,工業(yè)增加值數(shù)據(jù)序列之間存在非線性關(guān)系,因此使用BP 神經(jīng)網(wǎng)絡(luò)來預(yù)測(cè)工業(yè)增加值具有很好的適用性。
BP神經(jīng)網(wǎng)絡(luò)訓(xùn)練過程如下:
(1)隱含層輸出計(jì)算,如公式10 所示。其中,f為隱含層傳遞函數(shù),a為隱含層閾值。
(2)將隱含層輸出H,連接權(quán)值wjk和輸出層閾值b代入公式11,得到預(yù)測(cè)輸出O:
(3)將預(yù)測(cè)輸出O和期望輸出Y作差,計(jì)算得到預(yù)測(cè)誤差e。
(4)利用誤差e 更新網(wǎng)絡(luò)連接權(quán)值wij,wjk。其中,η為學(xué)習(xí)速率。
(5)利用誤差e更新網(wǎng)絡(luò)節(jié)點(diǎn)閾值a,b。
灰色模型的優(yōu)點(diǎn)是根據(jù)少量的實(shí)測(cè)數(shù)據(jù)就可得出未來短期內(nèi)較為精確的預(yù)測(cè)數(shù)值,采用微分方程來挖掘系統(tǒng)的本質(zhì),可以將無規(guī)律的原始數(shù)據(jù)轉(zhuǎn)化為規(guī)律性較強(qiáng)的生成序列。但其相比BP 神經(jīng)網(wǎng)絡(luò)而言,明顯的缺點(diǎn)是在模型建立時(shí)預(yù)測(cè)誤差不可控制,若在進(jìn)行中長(zhǎng)期預(yù)測(cè)時(shí)精度較低。BP 神經(jīng)網(wǎng)絡(luò)具有自適應(yīng)學(xué)習(xí)能力強(qiáng)解決非線性問題靈敏的優(yōu)勢(shì),將兩種模型優(yōu)勢(shì)結(jié)合,就可以實(shí)現(xiàn)在實(shí)驗(yàn)數(shù)據(jù)樣本較小的情況下,預(yù)測(cè)結(jié)果可以保持較高的精度并且誤差也在可以控制在一定的范圍內(nèi)。
首先,設(shè)原始數(shù)據(jù)序列{x(0)(i)},i=1,2,...,n,用GM(1,1)模型對(duì)原始數(shù)據(jù)序列擬合得(i),i=1,2,...,n,時(shí)刻T的殘差記為e(0)(T),即
構(gòu)建殘差序列{e(0)(T)}的BP 神經(jīng)網(wǎng)絡(luò):設(shè)殘差序列e(0)(T),i=1,2,...,n,假設(shè)模型預(yù)測(cè)的階數(shù)為S,那么第i時(shí)刻的值就可以通過e(0)(i- 1),e(0)(i- 2),...,e(0)(i-S)來預(yù)測(cè),將其作為BP 神經(jīng)網(wǎng)絡(luò)訓(xùn)練的原始輸入,BP神經(jīng)網(wǎng)絡(luò)的期望輸出就是e(0)(i)。通過BP 神經(jīng)網(wǎng)絡(luò)訓(xùn)練殘差序列,得出輸入向量所對(duì)應(yīng)的值,整個(gè)過程中BP神經(jīng)網(wǎng)絡(luò)的權(quán)值和閾值就是其根據(jù)自適應(yīng)學(xué)習(xí)而確定的正確內(nèi)部的表示。
最后得出最終預(yù)測(cè)值(i,1):(i,1) =(i) +(i)。即(i)為灰色模型預(yù)測(cè)值,(i)為BP 神經(jīng)網(wǎng)絡(luò)修正的殘差,(i,1)為BP 神經(jīng)網(wǎng)絡(luò)對(duì)灰色模型預(yù)測(cè)殘差序列修正后的預(yù)測(cè)值。
數(shù)據(jù)來源于國(guó)家統(tǒng)計(jì)局(http://www.stats.gov.cn/),選取2008年1月至2017年12月工業(yè)增加值作為訓(xùn)練數(shù)據(jù)集A。按照季度進(jìn)行劃分,A=[a1,a2,a3,a4],其中a1、a2、a3、a4分別為訓(xùn)練集每年第一季度、第二季度、第三季度及第四季度的工業(yè)增加值;選取2018年1月至2019年12月工業(yè)增加值作為檢驗(yàn)數(shù)據(jù)集B,B=[b1,b2,b3,b4],其中b1、b2、b3、b4分別為測(cè)試集每年第一季度、第二季度、第三季度及第四季度的工業(yè)增加值。經(jīng)檢驗(yàn)數(shù)據(jù)無缺失,無異常值,由于神經(jīng)網(wǎng)絡(luò)是以概率計(jì)算和預(yù)測(cè)樣本的,并且sigmoid 函數(shù)在0 和1 之間取值,網(wǎng)絡(luò)最后的輸出也是如此,故要對(duì)實(shí)驗(yàn)數(shù)據(jù)采取歸一化處理,如公式18。其中,x、xmin、xmax分別為原始數(shù)據(jù)、原始數(shù)據(jù)中的最小值、原始數(shù)據(jù)中的最大值,為預(yù)處理后的數(shù)值。
為評(píng)價(jià)模型預(yù)測(cè)的性能是否合格,本文分別使用平均絕對(duì)誤差(MAE)、均方根誤差(RMSE)和平均絕對(duì)百分比誤差(MAPE)作為評(píng)價(jià)準(zhǔn)則,分別定義如公式19-21所示,其中為模型預(yù)測(cè)值,yi為實(shí)際值。顯然,3 個(gè)評(píng)價(jià)值越小,就表明模型預(yù)測(cè)精度越高。
采用上述灰色BP 神經(jīng)網(wǎng)絡(luò)組合模型對(duì)工業(yè)增加值進(jìn)行預(yù)測(cè),首先將2008~2017年工業(yè)增加值分組輸入灰色模型中,并預(yù)測(cè)未來兩年的工業(yè)增加值,通過灰色模型預(yù)測(cè)得到殘差序列并將其作為BP 神經(jīng)網(wǎng)絡(luò)的訓(xùn)練集。其中,BP 神經(jīng)網(wǎng)絡(luò)模型的參數(shù)設(shè)置為:訓(xùn)練函數(shù)為梯度下降的BP 訓(xùn)練函數(shù),訓(xùn)練周期為50,學(xué)習(xí)率為0.05,最大迭代次數(shù)為300,目標(biāo)誤差為0.001。隱含層節(jié)點(diǎn)數(shù)根據(jù)試算法確定,當(dāng)節(jié)點(diǎn)個(gè)數(shù)為7 時(shí),誤差較小,如表1所示。
表1 不同隱含層節(jié)點(diǎn)數(shù)預(yù)測(cè)效果
分別將3 種模型預(yù)測(cè)數(shù)據(jù)與實(shí)際數(shù)據(jù)進(jìn)行分析,見圖3、6。
圖3 灰色、BP神經(jīng)網(wǎng)絡(luò)、灰色BP神經(jīng)網(wǎng)絡(luò)模型第一季度工業(yè)增加值預(yù)測(cè)結(jié)果
從精度評(píng)價(jià)角度來看,如表2 所示,采用灰色模型預(yù)測(cè)的工業(yè)增加值的誤差范圍為0.16%~4.99%;BP 神經(jīng)網(wǎng)絡(luò)模型預(yù)測(cè)的誤差范圍在0.02%~0.11%;而灰色BP神經(jīng)網(wǎng)絡(luò)模型預(yù)測(cè)的誤差范圍則在0.01%~0.05%,灰色BP神經(jīng)網(wǎng)絡(luò)模型的預(yù)測(cè)誤差大部分都要小于單一模型的預(yù)測(cè)誤差,預(yù)測(cè)精度明顯提高。通過表2可知,由于受到季節(jié)波動(dòng)性的影響以及模型本身適用于數(shù)據(jù)的局限性,灰色模型工業(yè)增加值的預(yù)測(cè)誤差較大,特別是第一季度的相對(duì)誤差較大,灰色BP 神經(jīng)網(wǎng)絡(luò)模型優(yōu)化了這一點(diǎn),在運(yùn)用灰色模型的基礎(chǔ)上,加入了能夠很好解決非線性時(shí)間序列預(yù)測(cè)誤差較大的BP 神經(jīng)網(wǎng)絡(luò),組合模型預(yù)測(cè)精度得到了明顯的提升,相對(duì)于另外兩種模型擁有更好的預(yù)測(cè)效果,預(yù)測(cè)值和實(shí)際值十分接近。
表2 灰色、BP神經(jīng)網(wǎng)絡(luò)、灰色BP神經(jīng)網(wǎng)絡(luò)模型預(yù)測(cè)精度對(duì)比
從穩(wěn)定性評(píng)價(jià)角度來看,如表3所示,無論是從平均絕對(duì)誤差(MAE)、均方根誤差(RMSE)還是平均絕對(duì)百分比誤差(MAPE),灰色BP 神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)模型在穩(wěn)定性能上都要優(yōu)于灰色模型和BP 神經(jīng)網(wǎng)絡(luò)模型?;疑獴P神經(jīng)網(wǎng)絡(luò)的平均絕對(duì)百分比誤差在0.01%~0.03%,均小于灰色模型和BP 神經(jīng)網(wǎng)絡(luò)模型的平均絕對(duì)百分比誤差,灰色BP 神經(jīng)網(wǎng)絡(luò)組合模型綜合了灰色模型和BP 神網(wǎng)絡(luò)模型兩者的優(yōu)點(diǎn),其具備小樣本建模和非線性處理數(shù)據(jù)的能力,相比其他預(yù)測(cè)模型優(yōu)越性及預(yù)測(cè)精確度更佳。顯然灰色BP 神經(jīng)網(wǎng)絡(luò)模型在預(yù)測(cè)穩(wěn)定性能上大大提高,預(yù)測(cè)效果更佳穩(wěn)定。
圖4 灰色、BP神經(jīng)網(wǎng)絡(luò)、灰色BP神經(jīng)網(wǎng)絡(luò)模型第二季度工業(yè)增加值預(yù)測(cè)結(jié)果
圖5 灰色、BP神經(jīng)網(wǎng)絡(luò)、灰色BP神經(jīng)網(wǎng)絡(luò)模型第三季度工業(yè)增加值預(yù)測(cè)結(jié)果
圖6 灰色、BP神經(jīng)網(wǎng)絡(luò)、灰色BP神經(jīng)網(wǎng)絡(luò)模型第四季度工業(yè)增加值預(yù)測(cè)結(jié)果
表3 灰色、BP神經(jīng)網(wǎng)絡(luò)、灰色BP神經(jīng)網(wǎng)絡(luò)模型預(yù)測(cè)穩(wěn)定性對(duì)比
綜上,2018年工業(yè)增加值采用灰色BP 神經(jīng)網(wǎng)絡(luò)組合模型較灰色模型和BP 神經(jīng)網(wǎng)絡(luò)模型預(yù)測(cè)在精度上分別提升了1.28%~2.93%和0.01%-0.08%,穩(wěn)定性分別提升了1.43%和0.05%;2019年工業(yè)增加值采用灰色BP 神經(jīng)網(wǎng)絡(luò)組合模型較另外兩種模型預(yù)測(cè)在精度上分別提升了0.94%~4.98%和0.01%~0.04%,穩(wěn)定性分別提升了2.97%和0.03%。顯然,灰色BP 神經(jīng)網(wǎng)絡(luò)組合模型在預(yù)測(cè)精度和穩(wěn)定性上均高于單一灰色模型和BP 神經(jīng)網(wǎng)絡(luò)模型。上述結(jié)果表明,灰色BP 神經(jīng)網(wǎng)絡(luò)組合模型不僅能夠精確預(yù)測(cè)工業(yè)增加值,而且預(yù)測(cè)效果穩(wěn)定。
(1)運(yùn)用灰色模型擬合工業(yè)增加值數(shù)據(jù)序列時(shí),結(jié)果呈現(xiàn)季節(jié)性,第一季度擬合誤差較大,可能是因?yàn)橐欢路菸覈?guó)傳統(tǒng)節(jié)日春節(jié)來臨,工業(yè)增加值有所波動(dòng)。為了避免數(shù)據(jù)間非線性因素影響預(yù)測(cè)結(jié)果,運(yùn)用BP 神經(jīng)網(wǎng)絡(luò)來調(diào)整,使得對(duì)工業(yè)增加值的預(yù)測(cè)更加準(zhǔn)確。
(2)運(yùn)用灰色BP 神經(jīng)網(wǎng)絡(luò)模型對(duì)我國(guó)工業(yè)增加值進(jìn)行預(yù)測(cè),很好的解決了傳統(tǒng)預(yù)測(cè)模型在預(yù)測(cè)工業(yè)增加值時(shí)當(dāng)出現(xiàn)的特大環(huán)境改變(如:自然災(zāi)害,疫情,金融危機(jī)等)導(dǎo)致預(yù)測(cè)精度不準(zhǔn)確的缺陷,這為預(yù)測(cè)類似經(jīng)濟(jì)指標(biāo)提供了合理參考,為政府對(duì)宏觀經(jīng)濟(jì)進(jìn)行決策提供了依據(jù)。
(3)工業(yè)增加值在國(guó)民經(jīng)濟(jì)活動(dòng)中占有主導(dǎo)作用,對(duì)宏觀經(jīng)濟(jì)有很大影響,對(duì)它進(jìn)行精準(zhǔn)預(yù)測(cè)就更有必要。對(duì)工業(yè)增加值預(yù)測(cè)可以有利于企業(yè)對(duì)未來事務(wù)進(jìn)行決策和判斷,從而促進(jìn)工業(yè)高質(zhì)量發(fā)展,帶動(dòng)區(qū)域的經(jīng)濟(jì)增長(zhǎng),幫助政府等相關(guān)部門解決就業(yè)問題,同時(shí)建立高質(zhì)量的物質(zhì)技術(shù)基礎(chǔ),為我國(guó)宏觀經(jīng)濟(jì)的發(fā)展貢獻(xiàn)一份力量。
(4)綜上,本文針對(duì)工業(yè)增加值具有季節(jié)波動(dòng)性、周期性且不穩(wěn)定等特點(diǎn),結(jié)合灰色模型和BP 神經(jīng)網(wǎng)絡(luò)模型,發(fā)展了一種能夠精確預(yù)測(cè)工業(yè)增加值的灰色BP 神經(jīng)網(wǎng)絡(luò)模型。結(jié)果表明,2018~2019年工業(yè)增加值采用灰色BP 神經(jīng)網(wǎng)絡(luò)組合模型較灰色模型和BP 神經(jīng)網(wǎng)絡(luò)模型預(yù)測(cè)精度分別提升了0.94%~4.98% 和0.01%~0.08%,預(yù)測(cè)穩(wěn)定性分別提升了1.43%~2.97%和0.03%~0.05%。即本文提出的灰色BP 神經(jīng)網(wǎng)絡(luò)模型預(yù)測(cè)工業(yè)增加值精度較高,預(yù)測(cè)值和實(shí)際值基本擬合,并隨著預(yù)測(cè)時(shí)間增加,精度和平均絕對(duì)百分比誤差波動(dòng)范圍較小,預(yù)測(cè)結(jié)果更加穩(wěn)定,進(jìn)而對(duì)政府制定政策和工業(yè)企業(yè)生產(chǎn)具有重要的指導(dǎo)意義。