齊興敏,徐海,段晨,樊銳
(1.湖北物資流通技術研究所,湖北 襄陽 441002;2.襄陽市交通物流發(fā)展服務中心,湖北 襄陽 441099)
現代物流業(yè)是支撐國民經濟發(fā)展的基礎性、戰(zhàn)略性、先導性產業(yè)。襄陽市作為湖北省的第二大城市和省域副中心城市,近年來現代物流業(yè)得到了快速發(fā)展,物流業(yè)增加值和社會物流總額不斷增長,物流總費用占GDP比重逐年下降,物流產業(yè)降本增效效果顯著。近幾年襄陽市又先后被確定為國家流通領域現代供應鏈體系建設試點城市、綠色貨運配送示范城市和生產服務型國家物流樞紐承載城市,物流業(yè)在推動襄陽市經濟、社會全面發(fā)展方面的作用越發(fā)突出。
襄陽市物流貨運量穩(wěn)步提升,據不完全統(tǒng)計,襄陽市2010-2019年十年間貨運量增長近3倍。據襄陽市社會物流統(tǒng)計分析發(fā)現,貨運量不僅受地方經濟發(fā)展指標GDP的影響較大,而且還與其他經濟指標密切相關。為此,本文做兩個方面的研究:第一,利用灰色關聯分析法,找出與貨運量變化關聯度比較大的經濟指標;第二,采用遺傳BP神經網絡,將這些指標作為神經網絡的輸入值,建立襄陽市物流貨運量的預測模型。期望通過模型預測襄陽市未來的貨運量,為襄陽市交通基礎設施建設、襄陽市中長期物流發(fā)展規(guī)劃等提供決策依據。
灰色關聯分析法是根據各因素之間發(fā)展趨勢的相似或相異程度(即灰色關聯度)來衡量因素之間關聯程度的一種方法,適合數據動態(tài)歷程的量化分析。而物流貨運量及其相關影響因素的研究剛好是對動態(tài)數據的變化歷程進行量化研究與分析,并找出這些動態(tài)數據變化之間的關聯性,所以本文選取灰色關聯分析法分析襄陽市物流貨運量變化的影響因素。灰色關聯分析步驟如下:
選取襄陽市物流貨運量(萬t)作為基準序列X0,選取經濟指標地區(qū)生產總值GDP(億元)(x1)、第一產業(yè)產值(億元)(x2)、第二產業(yè)產值(億元)(x3)、第三產業(yè)產值(億元)(x4)、全社會交通運輸行業(yè)固定資產投資(x5)、公路線路里程(km)(x6)、進出口總值(萬美元)(x7)、社會消費品零售總額(億元)(x8)、人均GDP(元)(x9)共九個因素作為比較因素序列。樣本數據見表1。
表1 樣本數據
選取常用的標準化處理方法、最大最小差值化處理方法、最大值處理方法、最小值處理方法、平均值處理方法、初值化處理方法六種無量綱化處理方法對步驟一中數據進行處理,以保證關聯度的可靠性。
(1)標準化處理方法
其中,i=0,1,2,...,n,j=1,2,...,m。n為比較序列中因素數目,本文中n=9;m為樣本數,本文中取襄陽市2006-2019年的樣本數據進行研究,所以m=9,下同。為樣本數據的平均值,σi為樣本數據的均方差。
(2)最大最小差值化處理方法
其中M和m分別為樣本值的最大值和最小值,下同。
(3)最大值處理方法
(4)最小值處理方法
(5)平均值處理方法
(6)初值化處理方法
由于篇幅有限,本文只給出了最小值無量綱化處理方法處理表1樣本數據后的結果,見表2。
表2 原始數據采用最小值無量綱化處理方法得到的結果
計算物流貨運量和地區(qū)生產總值GDP、第一產業(yè)產值、第二產業(yè)產值、第三產業(yè)產值、全社會交通運輸行業(yè)固定資產投資、公路線路里程、進出口總值、社會消費品零售總額和人均GDP九個關聯因素之間的關聯系數和關聯度。
關聯系數計算公式[1]如下:
其中ρ為分辨率,范圍在(0,1],本文取0.5[2]。
關聯度的計算公式如下:
利用關聯度計算公式計算出采用每一種無量綱化處理方法下得到的物流貨運量和九個關聯因素之間的關聯度,見表3。表中R1-R9依次表示物流貨運量與地區(qū)生產總值GDP、第一產業(yè)產值、第二產業(yè)產值、第三產業(yè)產值、全社會交通運輸行業(yè)固定資產投資、公路線路里程、進出口總值、社會消費品零售總額和人均GDP九個關聯因素之間的關聯度。表中的數值分別表示某一個影響因素采用某種無量綱化處理方法得到的與物流貨運量的關聯度,如第一個數字0.847 3,表示采用標準化無量綱化處理方法得到的貨運量與關聯因素地區(qū)生產總值的關聯度為0.847 3,依此類推。
將表3中各種無量綱化處理方法計算得到的關聯度進行排序,排序結果見表4。
表3 采用六種無量綱化處理方法計算得到的關聯度[3]
從表4可以看出,采用不同的數據無量綱化方法會導致關聯序的排序各不一樣。所以要找出一個最優(yōu)關聯序。
表4 六種無量綱化處理方法計算得到的關聯序
六種無量綱化處理方法的Δk和σk見表5。
依據滿足Δk和σk同時最大的原則,從表5可知最小值處理方法得到的關聯序滿足Δk和σk同時最大,故為最佳關聯序。至此得到襄陽市物流貨運量的最佳影響因素關聯序為:R8>R1>R9>R4>R7>R3>R5>R2>R6,具體關聯度值見表6。
表5 六種無量綱化處理方法的Δk和σk
從表6可以看出,地區(qū)生產總值、第三產業(yè)產值、進出口總額、社會消費品零售總額、人均GDP的關聯度均大于0.8,與物流貨運量的關聯度很好;第二產業(yè)產值和全社會交通運輸行業(yè)固定資產投資的關聯度在0.7-0.8之間,與物流貨運量的關聯度較好;第一產業(yè)產值和公路線路里程兩個因素與物流貨運量的關聯度<0.7,與物流貨運量的關聯度相對較差。所以去除第一產業(yè)產值和公路線路里程兩個關聯度較差的影響因素,將剩下的七個影響因素選做遺傳神經網絡模型的輸入神經元。
表6 襄陽市物流貨運量影響因素最佳關聯度
考慮到貨運量的影響因素復雜多樣,且具有不確定和非線性的特點,單一的BP神經網絡模型預測精度不高,所以本文選取BP神經網絡和遺傳算法兩種組合模型進行建模。BP神經網絡的一次學習過程由正向傳播和反向傳播兩個子過程組成。正向傳播時由輸入單元輸入學習樣本,經隱層單元處理、輸出單元處理后得到樣本的輸出值;誤差反向傳播時將樣本的輸出值與期望輸出值做比較,若輸出值達到期望的結果,則學習過程結束;否則進入反向傳播過程,把輸出值與期望輸出值的誤差由輸出單元向輸入單元反向傳播,在傳播過程中修改各層神經元的連接權值。
遺傳算法(GA)是模擬達爾文的遺傳選擇和自然淘汰的生物進化過程的計算模型。其思想源于生物遺傳學和適者生存的自然規(guī)律,是具有“生存+檢測”的迭代過程的搜索算法。遺傳算法首先對數據進行編碼,將它們轉換成遺傳的基因型表示,然后隨機挑選一組編碼作為進化的第一代群體,經過選擇、交叉和變異操作生成新一代種群,最后通過新老個體產生下一代群體,算法不斷重復,直到滿足結束條件后終止。相對BP算法而言,遺傳算法具有全局優(yōu)化搜索功能,能夠克服BP算法容易陷入局部最優(yōu)的缺點,所以兩算法結合,各取所長,在很多領域中廣泛應用。
遺傳神經網絡預測模型采用GA算法對BP神經網絡的初始化權值和閾值進行快速優(yōu)化,定出一個較好的解空間,然后將此空間作為神經網絡初始化權值和閾值,再利用BP神經網絡局部搜索能力強的優(yōu)點進行精確尋優(yōu),找出神經網絡權值和閾值的最優(yōu)解。
根據前述灰色關聯度計算結果,選取貨運量關聯度比較大的七個影響因素地區(qū)生產總值(GDP)、第二產業(yè)產值、第三產業(yè)產值、全社會交通運輸行業(yè)固定資產投資、進出口總值、社會消費品零售總額和人均GDP作為神經網絡的輸入層,輸出層為貨運量。
2.2.1 模型初始化參數的設定。本文基于MATLAB2014建立神經網絡。根據前面灰色關聯度的分析結果,選取關聯度較大的貨運量影響因素作為BP神經網絡的輸入層神經元,輸出層為貨運量。神經網絡的輸入層神經元個數為7,隱含層神經元個數通過試算法確定,最大為9個,輸出層神經元的個數為1。神經網絡訓練模型設置的最大迭代次數為5 000次,學習率為0.01,訓練精度為0.000 01。
2.2.2 遺傳神經網絡的實現步驟
(1)編碼與初始化種群的建立。編碼串由控制基因串和參數基因串兩部分組成??刂苹虼?和1組成,0表示無連接,1表示有連接。參數基因串表示神經網絡的權值和閾值。設置迭代次數為100次,種群規(guī)模為50,編碼規(guī)則為:s=in*hide+hide*0ut+hide+0ut,in為輸入層節(jié)點數,hide為隱含層節(jié)點數,0ut為輸出層節(jié)點數。
輸入層到隱含層的權值矩陣為:
-0.510 2 1.163 3-1.693 6-0.147 1-1.343 4-1.714 9-0.302 2 0.846 3-1.572 4 1.320 0 0.916 4 0.713 5-1.284 7-0.115 4-1.432 5 1.799 6 0.549 0 1.837 2 1.234 5-0.399 3-0.143 4-1.473 4-0.655 4 0.772 5-0.723 9 0.266 2-0.034 7 1.605 7-0.391 6 1.269 3 0.361 6 1.809 7-0.628 6-1.157 5-0.665 2 1.730 4 1.582 3-1.225 5-0.355 1-1.649 4-0.045 6 1.027 1-0.865 2-1.254 5-1.779 7-1.038 5-0.560 5-1.312 6 0.941 1-0.299 2-0.617 0 0.422 9 1.416 0 1.180 0
隱含層神經元閾值為:
?
隱含層到輸出層權值矩陣為:
?
輸出層神經元閾值:-0.403 8。
(3)選擇復制。保留適應度最高的個體復制下一代,其他個體采取輪盤賭選擇法進行選擇,參與交叉和變異。
(4)交叉和變異操作。交叉操作是產生新個體的主要操作過程,變異操作是對個體的基因值按某一較小的概率進行改變,從而產生新個體。
具體交叉過程是隨機選擇配對個體xi,xj,i,j=1,2,...,N。
其中x'i,x'j分別為xi,xj交叉生成的后代,β為[0,1]內的隨機交叉參數。
變異是在[0,1]區(qū)間內產生N個隨機數,若任一隨機數n<變異概率p,則對應的個體進行變異,構成新群體。本文選取交叉概率0.7,變異概率0.01。
(5)遺傳神經網絡運行流程如圖1所示。
圖1 遺傳神經網絡運行流程圖
選取襄陽市2006-2016年貨運量及其影響因素的歷史數據作為模型的訓練樣本對模型進行訓練,將2017-2019年的歷史數據作為模型的測試樣本,對模型進行檢驗。訓練到18次時,模型的精度達到最小。當訓練到接近100次時,訓練精度小于0.000 01,模型結構穩(wěn)定,訓練結束。此時模型的網絡結構如圖2所示,輸入層7個神經元,輸出層1個神經元,隱含層兩個,神經元個數分別是9和1。
圖2 基于灰色關聯分析與遺傳神經網絡的模型網絡結構
從表7可以看出,訓練樣本的輸出值和實際值點位基本吻合,相關性非常好,反映輸出值與真實值之間的差異非常小,該模型的預測精度比較高。運用模型預測2017-2019年的物流貨運量,效果見表8。
表7 2006-2016年訓練樣本輸出值和實際值的比較
表8 模型對2017-2019年樣本預測結果比較
從表8可以看出,預測模型的預測精度比較高,而且比較穩(wěn)定。
本文利用襄陽市2006-2019年的歷史數據,通過灰色關聯分析法針對地區(qū)生產總值GDP、第一產業(yè)產值、第二產業(yè)產值、第三產業(yè)產值、全社會交通運輸行業(yè)固定資產投資、公路線路里程、進出口總值、社會消費品零售總額、人均GDP九個經濟指標與物流貨運量進行關聯度分析,得到影響物流貨運量的最佳關聯度排序,最后確定選取地區(qū)生產總值(GDP)、第二產業(yè)產值、第三產業(yè)產值、全社會交通運輸行業(yè)固定資產投資、進出口總值、社會消費品零售總額和人均GDP七個與物流貨運量關聯度比較大的經濟指標作為遺傳神經網絡預測物流貨運量的輸入值,輸出值為物流貨運量。
通過實驗發(fā)現,先利用灰色關聯分析優(yōu)化樣本結構,提高樣本質量,再利用遺傳算法優(yōu)化BP神經網絡的權值和閾值,最后用BP神經網絡進行問題求解,克服了BP神經網絡容易陷入局部極小值的缺點,提高了遺傳算法在尋找最優(yōu)權值和閾值的收斂速度和搜索精度。預測結果分析可以看出本文建立的基于灰色關聯分析與遺傳神經網絡的物流貨運量預測模型預測準確度比較高,具有一定的實踐意義。由于數據收集有難度,本文未將此次模型應用到其他城市貨運量的預測中去檢驗,這是本文有待完善的地方。