王紅雙,張欣蕾,朱榮艷(北京化工大學(xué)北方學(xué)院 經(jīng)濟(jì)管理學(xué)院,北京 101601)
港口是社會(huì)和國(guó)民經(jīng)濟(jì)發(fā)展的基礎(chǔ)性設(shè)施,對(duì)國(guó)民經(jīng)濟(jì)發(fā)展具有不可代替的作用,是港口發(fā)展戰(zhàn)略研究的重要內(nèi)容。正確預(yù)測(cè)港口吞吐量,對(duì)于合理、科學(xué)的港口布局、基本設(shè)施投資、營(yíng)運(yùn)策略、發(fā)展戰(zhàn)略以及與集疏運(yùn)相關(guān)的綜合運(yùn)輸規(guī)劃是十分重要的,并且事關(guān)港口經(jīng)濟(jì)腹地經(jīng)濟(jì)的發(fā)展和我國(guó)在國(guó)際經(jīng)濟(jì)中的競(jìng)爭(zhēng)力。
港口吞吐量是一個(gè)復(fù)雜變量,受到多方面因素的影響。就這一作用系統(tǒng)而言,還存在著許多無法確知的內(nèi)容和關(guān)系,它符合BP神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)的特征。文中擬以防城港吞吐量為建模數(shù)據(jù),用BP神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)理論對(duì)其預(yù)測(cè)進(jìn)行探討。
1.1 BP神經(jīng)網(wǎng)絡(luò)的理論基礎(chǔ)。BP神經(jīng)網(wǎng)絡(luò)(Back-Propagation Network)包括以下四個(gè)單元:處理單元,即神經(jīng)網(wǎng)絡(luò)的神經(jīng)元,輸入層的處理單元將輸入值轉(zhuǎn)入相鄰的聯(lián)接權(quán)重,隱層和輸出層的處理單元將它們的輸入值進(jìn)行求和,并根據(jù)傳遞函數(shù)計(jì)算輸出值;聯(lián)接權(quán)重,它將神經(jīng)網(wǎng)絡(luò)的處理單元聯(lián)系起來,其值根據(jù)各處理單元的聯(lián)接程度確定;閾值,它使網(wǎng)絡(luò)更自由地獲取所要描述的函數(shù)關(guān)系;傳遞函數(shù),它將輸入數(shù)據(jù)轉(zhuǎn)化為輸出數(shù)據(jù),通常為非線性的logsig和tansig函數(shù),有的輸出也采用線性的purelin函數(shù)。
BP算法是由兩部分組成:信息的正向傳遞與誤差的反向傳播。在正向傳播過程中,輸入信息從輸入層經(jīng)隱層逐層計(jì)算傳向輸出層。如果在輸出層沒有得到期望輸出,則計(jì)算輸出層的誤差變化值,然后轉(zhuǎn)為反向傳播,通過網(wǎng)絡(luò)將誤差信號(hào)沿原來的連接通路反傳回來修改各神經(jīng)元的權(quán)值和閾值直至達(dá)到期望目標(biāo)。
1.2 BP神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)的特點(diǎn)。(1)BP神經(jīng)網(wǎng)絡(luò)能學(xué)習(xí)和存儲(chǔ)大量輸入輸出模式映射關(guān)系,而無需事先了解描述這種映射關(guān)系的數(shù)學(xué)方程,只要能提供足夠多的樣本模式對(duì)供BP網(wǎng)絡(luò)進(jìn)行學(xué)習(xí)訓(xùn)練,它便能完成由n維輸出空間的非線性映射。(2)神經(jīng)網(wǎng)絡(luò)訓(xùn)練完成后,可以利用該網(wǎng)絡(luò)對(duì)樣本區(qū)域內(nèi)的其它輸入量求解其輸出值,這種求值的方法稱為神經(jīng)網(wǎng)絡(luò)的仿真或泛化。神經(jīng)網(wǎng)絡(luò)是否成功不在于對(duì)樣本本身擬合誤差的大小,而關(guān)鍵在于其泛化效果。(3)前饋神經(jīng)網(wǎng)絡(luò)允許輸入樣本中帶有較大的誤差甚至個(gè)別錯(cuò)誤,因?yàn)閷?duì)權(quán)值的調(diào)整過程也是從大量的樣本中提取統(tǒng)計(jì)特征的過程,反映正確的規(guī)律來自全體樣本,個(gè)別樣本中的誤差不能對(duì)權(quán)值的調(diào)整帶來很大影響。
2.1 建模原理。一般而言,影響港口貨物吞吐量的因素可以分為可量化和不可量化因素。其中類似于港口所在地區(qū)的經(jīng)濟(jì)水平等指標(biāo)是可量化,但是其它的影響因素如政策因素、港口自然條件、世界經(jīng)濟(jì)形勢(shì)、管理因素、服務(wù)因素等指標(biāo)是不可量化的,一些因素是不確定的,還有一些因素會(huì)隨時(shí)間變化而變化的,此外,可能還存在一些沒有考慮到的因素。同時(shí),獲取充足的歷史數(shù)據(jù)相當(dāng)困難。因此,本文采用基于時(shí)間序列的BP神經(jīng)網(wǎng)絡(luò)對(duì)防城港貨物吞吐量進(jìn)行預(yù)測(cè)。
(1)首先將樣本序列分組,每m+1個(gè)值為一組,前m個(gè)值作為網(wǎng)絡(luò)的輸入,后一個(gè)值作為輸出結(jié)點(diǎn)的期望值。根據(jù)經(jīng)驗(yàn),本文對(duì)防城港貨物吞吐量劃分每4年數(shù)據(jù)作為一組,前3年的數(shù)據(jù)作為輸入,后一個(gè)數(shù)據(jù)作為輸出的期望值。輸入、輸出的數(shù)據(jù)劃分如表1所示。
表1 輸入、輸出數(shù)據(jù)劃分
這樣將26年的歷史數(shù)據(jù)劃分為23組,前22組作為訓(xùn)練,第23組作為檢驗(yàn)。
(2)為了加快網(wǎng)絡(luò)的收斂速度,需要對(duì)樣本做歸一化處理,即:。
其中xmin和xmax分別是觀測(cè)值中的最小值和最大值,當(dāng)?shù)玫筋A(yù)測(cè)結(jié)果時(shí),再對(duì)預(yù)測(cè)結(jié)果做反歸一化。
2.2 BP神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)實(shí)施。本文以防城港為例,介紹基于時(shí)間序列的BP神經(jīng)網(wǎng)絡(luò)方法在港口貨物吞吐量預(yù)測(cè)中的應(yīng)用。防城港1983~2008年貨物吞吐量的歷史數(shù)據(jù)見表2。
表2 防城港歷年貨物吞吐量 單位:萬噸
2.2.1 網(wǎng)絡(luò)設(shè)計(jì)?;谏鲜鼋T?,本文采用三層網(wǎng)絡(luò)結(jié)構(gòu),輸入層結(jié)點(diǎn)為3個(gè),輸出層為1個(gè)。訓(xùn)練樣本22組,檢驗(yàn)樣本1組。網(wǎng)絡(luò)隱層結(jié)點(diǎn)數(shù)的確定是一項(xiàng)又重要而又困難的問題,如果隱層結(jié)點(diǎn)數(shù)過少,網(wǎng)絡(luò)不具有必要的學(xué)習(xí)能力和信息處理能力。相反,如果隱層結(jié)點(diǎn)數(shù)過多,會(huì)增加網(wǎng)絡(luò)結(jié)構(gòu)的復(fù)雜性,會(huì)使網(wǎng)絡(luò)的學(xué)習(xí)速度變得很慢。通常要經(jīng)過反復(fù)試算決定,本文通過試算得出當(dāng)隱層結(jié)點(diǎn)數(shù)為7時(shí),網(wǎng)絡(luò)收斂較好。選擇的隱層傳遞函數(shù)為tansig,輸出層的傳遞函數(shù)為purelin,訓(xùn)練方法為trainlm,最大訓(xùn)練次數(shù)為1 000,訓(xùn)練目標(biāo)為10-6。
2.2.2 數(shù)據(jù)處理。為了便于神經(jīng)網(wǎng)絡(luò)的訓(xùn)練,將歷史數(shù)據(jù)進(jìn)行歸一化處理,輸入輸出數(shù)據(jù)經(jīng)過歸一化處理后的結(jié)果見表3。
表3 輸入輸出數(shù)據(jù)預(yù)處理結(jié)果
2.2.3 網(wǎng)絡(luò)的訓(xùn)練及檢驗(yàn)。通過對(duì)數(shù)據(jù)的預(yù)處理后,對(duì)前22組數(shù)據(jù)進(jìn)行訓(xùn)練,對(duì)網(wǎng)絡(luò)的輸入層與隱層、隱層與輸出層之間的連接權(quán)值以及各層神經(jīng)元的閾值進(jìn)行調(diào)整,最后得到比較合理的數(shù)值。訓(xùn)練的過程見圖2。
網(wǎng)絡(luò)對(duì)歷史數(shù)據(jù)的擬合情況見圖3。從圖中可以看出網(wǎng)絡(luò)對(duì)歷年的貨物吞吐量擬合較好,將預(yù)測(cè)的結(jié)果通過反歸一化處理后,計(jì)算預(yù)測(cè)的相對(duì)誤差見表4。
由上表看出,網(wǎng)絡(luò)擬合精度很高,將第23組數(shù)據(jù) [0.5403 0.6759 0.8186]輸入到網(wǎng)絡(luò)中,得到歸一化后的檢驗(yàn)值,將其還原后得到預(yù)測(cè)值為3 631.7萬噸,與實(shí)際值3 701萬噸相比,誤差為-1.8717%,屬于高精度預(yù)測(cè),表明該網(wǎng)絡(luò)可以用來預(yù)測(cè)。
2.2.4 預(yù)測(cè)。在此網(wǎng)絡(luò)基礎(chǔ)上對(duì)未來四年防城港貨物吞吐量進(jìn)行預(yù)測(cè),預(yù)測(cè)結(jié)果見表5。
2.3 預(yù)測(cè)結(jié)果分析。通過預(yù)測(cè),可以看出防城港在隨后的幾年里,貨物吞吐量會(huì)持續(xù)增長(zhǎng)。國(guó)民經(jīng)濟(jì)及對(duì)外貿(mào)易的發(fā)展與港口的發(fā)展息息相關(guān),近幾年我國(guó)國(guó)民經(jīng)濟(jì)的穩(wěn)定增長(zhǎng),隨著我國(guó)加入WTO后關(guān)稅的降低和貿(mào)易壁壘的逐步取消,我國(guó)海運(yùn)業(yè)快速發(fā)展。西部大開發(fā)進(jìn)一步實(shí)施和中國(guó)—東盟貿(mào)易區(qū)的建立,更加確定了防城港作為大西南便捷出口港的地位,防城港貨物吞吐量將穩(wěn)定增長(zhǎng)。2010年,港口吞吐量將突破5 000萬噸,到2012年,港口吞吐量又將突破6 000萬噸。
使用此模型進(jìn)行預(yù)測(cè)時(shí),應(yīng)該注意幾個(gè)問題:(1)采用BP神經(jīng)網(wǎng)絡(luò)進(jìn)行預(yù)測(cè),其精度受傳遞函數(shù)tansig和logsig的影響,會(huì)隨著時(shí)間推移而降低,故不宜做長(zhǎng)期預(yù)測(cè)。(2)BP神經(jīng)網(wǎng)絡(luò)存在著收斂速度慢、容易陷入局部極小值的缺點(diǎn)。由于初始權(quán)值和閾值的隨機(jī)性,在同一個(gè)樣本集下訓(xùn)練,每次訓(xùn)練的結(jié)果都不一樣。(3)隱層網(wǎng)絡(luò)結(jié)點(diǎn)數(shù)的確定非常重要,但是至今沒有任何理論上指導(dǎo),盡管有一些經(jīng)驗(yàn)公式,但僅供參考而已,所以通常要反復(fù)試算。所以,BP神經(jīng)網(wǎng)絡(luò)與其他預(yù)測(cè)方法比較,更加不易于實(shí)現(xiàn)。(4)雖然神經(jīng)可以避免一些數(shù)據(jù)的收集工作,但是在網(wǎng)絡(luò)進(jìn)行訓(xùn)練時(shí)仍需大量的歷史數(shù)據(jù),所以平時(shí)要注意一些可量化數(shù)據(jù)資料的收集與保存。
表4 1986~2005年的預(yù)測(cè)值及誤差 吞吐量:萬噸
表5 2009~2012年貨物吞吐量預(yù)測(cè)結(jié)果 單位:萬噸
[1]劉長(zhǎng)儉,張慶年.基于時(shí)間序列BP神經(jīng)網(wǎng)絡(luò)的集裝箱吞吐量動(dòng)態(tài)預(yù)測(cè)[J].水運(yùn)工程,2007(1):4-7.
[2]葛慧玲,高春雨,焦揚(yáng),等.于BP神經(jīng)網(wǎng)絡(luò)的中國(guó)大豆進(jìn)口量預(yù)測(cè)[J].東北農(nóng)業(yè)大學(xué)學(xué)報(bào),2007(2):65-67.
[3]徐杏,史喜軍.深圳港基于BP神經(jīng)網(wǎng)絡(luò)的集裝箱預(yù)測(cè)模型[J].河海大學(xué)學(xué)報(bào):自然科學(xué)版,2002(4):41-44.
[4]徐國(guó)志,李茂元.基于matlab神經(jīng)網(wǎng)絡(luò)工具箱進(jìn)行港口集裝箱運(yùn)量預(yù)測(cè)[J].港工技術(shù),2003(4):15-17.
[5]張慶年.前饋神經(jīng)網(wǎng)絡(luò)的特性分析與應(yīng)用[J].武漢交通科技大學(xué)學(xué)報(bào),1999(4):372-375.