楊世娟,盧維學(xué),方輝平(黃山學(xué)院 數(shù)學(xué)與統(tǒng)計(jì)學(xué)院,安徽黃山245041)
灰色系統(tǒng)與BP神經(jīng)網(wǎng)絡(luò)組合模型及其應(yīng)用
楊世娟,盧維學(xué),方輝平
(黃山學(xué)院 數(shù)學(xué)與統(tǒng)計(jì)學(xué)院,安徽黃山245041)
影響財(cái)政收入的因素有很多,各因素之間信息重疊的現(xiàn)象較嚴(yán)重,文章通過(guò)逐步回歸選擇了影響財(cái)政收入的幾個(gè)顯著因素。又鑒于灰色系統(tǒng)對(duì)小樣本數(shù)據(jù)預(yù)測(cè)的優(yōu)良特性,對(duì)每個(gè)選定的影響因素建立灰色預(yù)測(cè)GM(1,1)模型,得到各因素2015年、2016年的預(yù)測(cè)值。運(yùn)用BP神經(jīng)網(wǎng)絡(luò)模型對(duì)1995—2014年數(shù)據(jù)進(jìn)行訓(xùn)練,將灰色預(yù)測(cè)得到的預(yù)測(cè)值代入訓(xùn)練好的網(wǎng)絡(luò)中,預(yù)測(cè)出2015年、2016年的安徽省的財(cái)政收入。
逐步回歸;灰色預(yù)測(cè)GM(1,1);BP神經(jīng)網(wǎng)絡(luò)模型
財(cái)政收入的有效預(yù)測(cè)是加強(qiáng)宏觀經(jīng)濟(jì)管理和提高決策水平的前提與基礎(chǔ)。且財(cái)政收入會(huì)受一般收入、政府性基金收入、經(jīng)濟(jì)發(fā)展?fàn)顩r、政府的相關(guān)政策以及征收管理等眾多因素的影響,因此要想科學(xué)有效地預(yù)測(cè)財(cái)政收入,就必須綜合考慮各種影響因素,建立科學(xué)的預(yù)測(cè)體系。
鑒于灰色模型在小樣本量數(shù)據(jù)預(yù)測(cè)中的優(yōu)勢(shì),本文采用灰色預(yù)測(cè)模型對(duì)樣本的數(shù)量進(jìn)行擴(kuò)張,再基于BP神經(jīng)網(wǎng)絡(luò)對(duì)數(shù)據(jù)進(jìn)行訓(xùn)練、測(cè)試,預(yù)測(cè)出2015年、2016年的安徽省的財(cái)政收入,以供相應(yīng)部門(mén)進(jìn)行分析、決策。
1.1 灰色GM(1,1)模型
GM(1,1)具體步驟如下:
(1)累加生成
將原始數(shù)據(jù)X(0)=(x(0)(1),x(0)(2),…,x(0)(n))通過(guò)一階累加生成得到新的序列:
X(1)=(x(1)(1),x(1)(2),…,x(1)(n)),其中,
(2)灰導(dǎo)數(shù)與近鄰均值生成序列
x(1)的灰導(dǎo)數(shù)為:
定義近鄰均值生成序列:
(3)建立灰微分方程
一階累加生成序列X(1)具有指數(shù)增長(zhǎng)規(guī)律,滿足微分方程:
其中,a與b為常數(shù)。
得到(2)式的解為:
(4)解白化微分方程
相對(duì)于灰微分方程,稱(chēng)(1)式為白化微分方程,其解得結(jié)構(gòu)如下:
還原后的序列值為:
1.2 BP神經(jīng)網(wǎng)絡(luò)模型
設(shè)BP網(wǎng)絡(luò)輸入層m個(gè)神經(jīng)元,輸出層n個(gè)神經(jīng)元,隱層有p個(gè)神經(jīng)元,輸入層節(jié)點(diǎn)記為d(i),i=1,2,…,m,隱層節(jié)點(diǎn)為d(j),j=1,2,…,p,輸出層節(jié)點(diǎn)為d(k),j=1,2,…,n。xi為d(i)的輸入值或輸出值,Hj、hj;Yk,yk分別為d(j)、d(k)的輸入或者輸出,y*k為d(k)的期望輸出。d(i),d(j)、d(j),d(k)之間的連接權(quán)分別記作ωij、ωjk。對(duì)于網(wǎng)絡(luò)隱層,有:
對(duì)于網(wǎng)絡(luò)輸出層,有
對(duì)此采用tan-sigmoid函數(shù)作為BP算法的的轉(zhuǎn)換函數(shù),其特點(diǎn)是將(-∞,+∞)的輸入分別映射到區(qū)間(-1, 1),其中的輸入與輸出的關(guān)系正好可以反映單個(gè)神經(jīng)元的響應(yīng)特性,可以有效減少隱層的節(jié)點(diǎn)數(shù)、加快收斂速度和提高收斂精度。
2.1 灰色預(yù)測(cè)模型
灰色預(yù)測(cè)模型精度的檢驗(yàn)一般有三種不同的方法,即殘差檢驗(yàn)、關(guān)聯(lián)度檢驗(yàn)和后驗(yàn)差檢驗(yàn),對(duì)此運(yùn)用殘差檢驗(yàn)。
計(jì)算原始數(shù)列 x(0)(k)與模型計(jì)算值 x^(0)(k)的殘差δ(0)(k)和相對(duì)誤差M(0)(k),殘差δ(0)(k)=x(0)(k)-x^(0)(k),相對(duì)誤差M(0)(k)=δ(0)(k)/x(0)(k),一般認(rèn)為M(0)(k)<0.2時(shí),模型殘差檢驗(yàn)是合格的。
2.2 BP神經(jīng)網(wǎng)絡(luò)模型
BP神經(jīng)網(wǎng)絡(luò)訓(xùn)練后的實(shí)際輸出值與期望值直接的誤差E定義如下:
從(10)式知,調(diào)整權(quán)值可以改變誤差E,調(diào)整權(quán)數(shù)的目的是使誤差不斷減小,則有:Δwjk=-η?E/?wjk,Δwij=-η?E/?wij其中η∈(0,1)為反映學(xué)習(xí)速率的常數(shù)。
3.1 數(shù)據(jù)與指標(biāo)選擇
從1994年開(kāi)始,我國(guó)的財(cái)政體制發(fā)生了重大改革,開(kāi)始實(shí)行分稅制財(cái)政體制,影響了財(cái)政收入數(shù)據(jù)的一致性,由此1994年前后的數(shù)據(jù)是有差異的,而且沒(méi)有找到合適的方法對(duì)前后數(shù)據(jù)進(jìn)行量度統(tǒng)一,對(duì)此選擇安徽省1995—2014年數(shù)據(jù)。
影響財(cái)政收入的因素有很多,在諸多學(xué)者研究的基礎(chǔ)上,初步選取以下變量為影響因素:稅收收入X1、非稅收收入X2、地區(qū)生產(chǎn)總值X3、第一產(chǎn)業(yè)生產(chǎn)總值X4、第二產(chǎn)業(yè)生產(chǎn)總值X5、第三產(chǎn)業(yè)生產(chǎn)總值X6、全社會(huì)固定資產(chǎn)投資X7、就業(yè)人數(shù)X8、居民消費(fèi)水平X9、城鎮(zhèn)居民人均可支配收入X10。
(1)相關(guān)分析
在定量數(shù)據(jù)預(yù)測(cè)過(guò)程中,相關(guān)系數(shù)可以用來(lái)描述變量之間的關(guān)系,可以初步判斷因變量與各個(gè)解釋變量之間的線性關(guān)系是否存在。如表1所示。
表1 財(cái)政收入及影響因子之間的相關(guān)系數(shù)
由表1發(fā)現(xiàn),各變量與財(cái)政收入線性關(guān)系顯著,且呈現(xiàn)高度正相關(guān)關(guān)系,即所有變量暫時(shí)保留。由于各個(gè)影響因素之間都是高度相關(guān),違背了回歸分析的基本假設(shè),會(huì)導(dǎo)致一系列的錯(cuò)誤,模型不通過(guò)。對(duì)此下面進(jìn)行逐步回歸進(jìn)行變量選擇。
(2)基于逐步回歸的變量選取
自變量的選擇涉及的計(jì)算量比較大,且過(guò)程繁瑣,利用逐步回歸法建立不同的模型,依據(jù)每個(gè)回歸系數(shù)的 p值,逐個(gè)剔除不顯著變量,直到模型中的指標(biāo)變量都是影響預(yù)測(cè)對(duì)象的顯著因素為止。經(jīng)過(guò)檢驗(yàn),通過(guò)檢驗(yàn)的模型結(jié)果如表2所示。
表2 財(cái)政收入與各個(gè)影響因素的逐步回歸結(jié)果
由表2的結(jié)論,在逐步回歸過(guò)程中,變量X2、X3、X6、X7、X8、X9、X10被剔除,綜上,預(yù)測(cè)模型的變量選擇為X1、X4、X5。
(3)灰色預(yù)測(cè)模型
基于灰色預(yù)測(cè)模型理論,分別構(gòu)建變量X1、X4、X5的預(yù)測(cè)模型。以X1為例,有:
利用該模型,可得出原序列擬合值,通過(guò)檢驗(yàn)發(fā)現(xiàn)它們的殘差值均比較小,說(shuō)明模型的精度較高。在此基礎(chǔ)上分別對(duì)2015年與2016年的變量X1、X4、X5進(jìn)行預(yù)測(cè),預(yù)測(cè)值與擬合圖如表3和圖1所示。
表3 各變量2015年與2016年預(yù)測(cè)值
圖1 X1、X4、X5預(yù)測(cè)值與真實(shí)值對(duì)比圖
3.2 BP神經(jīng)網(wǎng)絡(luò)模型
由于BP神經(jīng)網(wǎng)絡(luò)可以任意逼近非線性函數(shù)的特性,可以用來(lái)作經(jīng)濟(jì)預(yù)測(cè),下面就以財(cái)政收入作為研究數(shù)據(jù),預(yù)測(cè)2015年、2016年的值。
(1)網(wǎng)絡(luò)的拓?fù)浣Y(jié)構(gòu)
由于影響財(cái)政收入的指標(biāo)為X1、X4、X5三個(gè),預(yù)測(cè)指標(biāo)為財(cái)政收入一個(gè),故選擇輸入節(jié)點(diǎn)為3,輸出節(jié)點(diǎn)為1。節(jié)點(diǎn)的作用函數(shù)選取Sigmoid型函數(shù),模型采用三層網(wǎng)絡(luò)模型,其中隱層神經(jīng)元12個(gè),輸出神經(jīng)元4個(gè)。
(2)數(shù)據(jù)處理
將原序列數(shù)據(jù)分成兩組,前組數(shù)據(jù)用來(lái)訓(xùn)練,后組數(shù)據(jù)用來(lái)檢驗(yàn)。但是為了使網(wǎng)絡(luò)權(quán)值都在[-1,1]之間,首先,必須把輸入數(shù)據(jù)進(jìn)行規(guī)一化處理,歸一化公式為:其中xmax,xmin分別為原序列中的最大、最小值。
(3)網(wǎng)絡(luò)訓(xùn)練
通過(guò)計(jì)算機(jī)編程不斷的模擬,得出最佳的模型設(shè)置。選擇自適應(yīng)調(diào)整學(xué)習(xí)速率附加動(dòng)量因子梯度下降反向傳播算法訓(xùn)練函數(shù),設(shè)置最大訓(xùn)練步數(shù)1000步,訓(xùn)練目標(biāo)最小誤差為0.001,學(xué)習(xí)速率0.05,訓(xùn)練效果顯示:經(jīng)過(guò)1000步的訓(xùn)練,網(wǎng)絡(luò)的均方誤差MSE=0.00833341小于0.01,達(dá)到了網(wǎng)絡(luò)的訓(xùn)練要求。且網(wǎng)絡(luò)的收斂速度是先下降,后又開(kāi)始增加,之后一直速度平穩(wěn),這說(shuō)明BP神經(jīng)網(wǎng)絡(luò)的中間層的神經(jīng)數(shù)目選擇非常合適。下面就采用該種設(shè)置的模型作為預(yù)測(cè)的網(wǎng)絡(luò)模型,對(duì)此通過(guò)訓(xùn)練給出財(cái)政收入2008—2014的預(yù)測(cè)值,并與真實(shí)值進(jìn)行比較,如表4所示,并對(duì)其作圖(圖2)進(jìn)行比較。
表4 真實(shí)值與預(yù)測(cè)值比較
圖2財(cái)政收入真實(shí)值與預(yù)測(cè)值對(duì)比
由表4發(fā)現(xiàn),各年份真實(shí)值與擬合值之間的誤差都比較小,可以說(shuō)明模型精度較高,對(duì)此預(yù)測(cè)出2015年、2016年財(cái)政收入的值分別為32940164.15、37820068.38。
本文應(yīng)用了小樣本情景下預(yù)測(cè)效果優(yōu)良的灰色預(yù)測(cè)模型來(lái)擴(kuò)充樣本容量,再采用BP神經(jīng)網(wǎng)絡(luò)給出各年份的擬合值,發(fā)現(xiàn)擬合效果較好,并對(duì)2015年、2016年的財(cái)政收入進(jìn)行了預(yù)測(cè)。盡管上述模型對(duì)目標(biāo)值的預(yù)測(cè)效果不錯(cuò),也對(duì)每個(gè)影響指標(biāo)的預(yù)測(cè)值進(jìn)行了合理的檢驗(yàn),但是否符合今后財(cái)政收入的實(shí)際還有待于實(shí)踐的檢驗(yàn)。
[1]Liu S F,Forrest J.The Current Development Status on Grey System Theory[J].Journal of Grey System,2007,19(2).
[2]Guo B L,Guo L.A New APP Roaehto Visua lMotion Computation[J]. Joumal of Xidian University,1994,21(4).
[3]梅虎,朱金福,汪俠.基于灰色關(guān)聯(lián)分析的旅游景區(qū)顧客滿意度測(cè)評(píng)研究[J].旅游科學(xué),2005,19(5).
[4]陳秀蓮.泛珠三角國(guó)際旅游產(chǎn)業(yè)結(jié)構(gòu)實(shí)證分析——基于次區(qū)域理論和灰色關(guān)聯(lián)度的探討[J].國(guó)際經(jīng)貿(mào)探索,2007,23(7).
[5]洪涓,張楠.北京市旅游服務(wù)貿(mào)易發(fā)展影響因素灰色關(guān)聯(lián)分析[J].經(jīng)濟(jì)論壇,2008,(8).
[6]鄧聚龍.灰理論基礎(chǔ)[M].武漢:華中科技大學(xué)出版社,2002.
(責(zé)任編輯/易永生)
F222;C812
A
1002-6487(2016)24-0082-03
國(guó)家自然科學(xué)基金資助項(xiàng)目(11201088);安徽省高校優(yōu)秀青年人才重點(diǎn)項(xiàng)目(gxyqZD2016300);安徽省教育廳自然科學(xué)研究項(xiàng)目(KJHS2016B04);黃山學(xué)院自然科學(xué)研究項(xiàng)目(2015xkj004;2015xkj005)
楊世娟(1988—),女,安徽安慶人,助教,研究方向:應(yīng)用統(tǒng)計(jì)。
(通訊作者)盧維學(xué)(1989—),男,黑龍江依安人,助教,研究方向:數(shù)理統(tǒng)計(jì)。