范林勝,鄧建新,2,閔 浩,張 琦
(1.廣西大學(xué) 制造系統(tǒng)與先進(jìn)制造技術(shù)重點實驗室,廣西 南寧 530004;2.廣西大學(xué) 機(jī)械工程學(xué)院,廣西 南寧 530004)
基于TEI@I方法論的防城港港口吞吐量預(yù)測
范林勝1,鄧建新1,2,閔 浩1,張 琦1
(1.廣西大學(xué) 制造系統(tǒng)與先進(jìn)制造技術(shù)重點實驗室,廣西 南寧 530004;2.廣西大學(xué) 機(jī)械工程學(xué)院,廣西 南寧 530004)
針對防城港港口吞吐量的波動趨勢,基于TEI@I方法論,提出一種預(yù)測防城港港口吞吐量的框架。采用多元線性回歸擬合其線性特征,采用三層BP神經(jīng)網(wǎng)絡(luò)模型擬合其非線性特征,并將其結(jié)果集成相加得到防城港港口吞吐量的預(yù)測模型。實際預(yù)測結(jié)果表明,這種預(yù)測方法有較高預(yù)測精度,優(yōu)于單一的預(yù)測方法,平均絕對百分比誤差從9.33%下降到1.52%,該方法可為未來防城港的發(fā)展規(guī)劃提供數(shù)據(jù)支撐。
TEI@I方法論;多元線性回歸;BP神經(jīng)網(wǎng)絡(luò);防城港;港口吞吐量;預(yù)測
防城港位于廣西南部北部灣北岸,是全國19個樞紐港之一,地處中國—東盟自由貿(mào)易區(qū)、泛珠三角經(jīng)濟(jì)圈和廣西壯族自治區(qū)北部灣經(jīng)濟(jì)區(qū)的結(jié)合部,現(xiàn)與世界80個國家的220個港口通商通航。隨著北部灣經(jīng)濟(jì)地位的提升、中國—東盟自由貿(mào)易區(qū)的進(jìn)一步發(fā)展以及“一帶一路”的推進(jìn),防城港對于西南地區(qū)通往東盟和海外各國的大通道將發(fā)揮越來越重要的作用。當(dāng)前經(jīng)過防城港港口的經(jīng)濟(jì)貿(mào)易往來更加頻繁,在2014年,防城港港口的吞吐量為1.15萬t,同比增長8.9%。隨著該港口的物流吞吐量迅猛增長,運(yùn)輸能力不足、貨物壓港嚴(yán)重等問題日漸凸顯,同時,港口吞吐量對周邊地區(qū)的經(jīng)濟(jì)發(fā)展也十分重要,在很大程度上能影響一個地區(qū)的投資方向和經(jīng)濟(jì)走向。因此,急需科學(xué)有效地預(yù)測和分析其港口吞吐量,以實現(xiàn)優(yōu)化調(diào)度和資源配置、促進(jìn)運(yùn)輸系統(tǒng)的高效運(yùn)作,為港口規(guī)劃建設(shè)、確定港口投資規(guī)模提供重要決策信息,從而提高投資效益,促進(jìn)港口及其所在城市的發(fā)展和經(jīng)濟(jì)增長。
針對港口吞吐量的預(yù)測,國內(nèi)外學(xué)者開展了大量類似的研究,得到了豐富的研究成果,涉及港口吞吐量、集裝箱量、物流需求量等,提出了多種預(yù)測方法或模型,但還鮮見對防城港吞吐量的預(yù)測。王景敏等[1]采用三次指數(shù)平滑法預(yù)測了廣西北部灣港口物流需求;J.G.de Gooijer等[2]使用多變量時間序列模型預(yù)測了安特衛(wèi)普港的交通流量;Chien-Chang Chou[3]運(yùn)用修改的回歸模型預(yù)測了臺灣進(jìn)口的集裝箱量;C.H.Wei等[4]使用人工神經(jīng)網(wǎng)絡(luò)研究預(yù)測了高雄港的集裝箱量;M.T.Chou等[5]應(yīng)用SARIMA模型分析了高雄港的集裝箱量;C.I.Hsu等[6]應(yīng)用灰色模型預(yù)測了航空貨運(yùn)業(yè)務(wù)數(shù)量;Xiao Jin等[7]運(yùn)用粒子群算法預(yù)測了轉(zhuǎn)移集裝箱吞吐量;Shih-Huang Chen等[8]采用遺傳規(guī)劃預(yù)測了集裝箱吞吐量;侯寶燕[9]基于組合預(yù)測方法預(yù)測了營口物流需求量;黃俊聰[10]基于組合預(yù)測方法預(yù)測了福州港物流需求量;許利枝等[11]基于TEI@I方法論預(yù)測了青島港口的貨運(yùn)量;Huang Anqiang等[12]使用混合模型預(yù)測了青島港口集裝箱吞吐量;Gang Xie等[13]基于LSSVR的混合模型預(yù)測了集裝箱吞吐量。傳統(tǒng)的線性回歸和時間序列預(yù)測方法雖然易于操作而且簡單,但是預(yù)測精度很難達(dá)到要求,智能算法在一定程度上能達(dá)到預(yù)測的精度,但預(yù)測對參數(shù)十分敏感,很難就有穩(wěn)定性。TEI@I方法論在處理具有高度波動性和復(fù)雜系統(tǒng)的預(yù)測問題上(例如原油價格、匯率),取得了很好的預(yù)測效果。
港口吞吐量受港口所在區(qū)域的經(jīng)濟(jì)產(chǎn)業(yè)發(fā)展的多種因素的影響,具有高度的波動性、復(fù)雜性和不確定性,表現(xiàn)出很強(qiáng)的線性和非線性特征。圖1所示為防城港1990-2013的吞吐量數(shù)據(jù),在1990到2004年這段時間,吞吐量增長速率較穩(wěn)定,表現(xiàn)為一定的線性關(guān)系,從2005到2013年增長速率不穩(wěn)定,表現(xiàn)為非線性關(guān)系,單獨運(yùn)用線性和非線性模型進(jìn)行預(yù)測,誤差都較大,如對圖1中的數(shù)據(jù)應(yīng)用指數(shù)模型預(yù)測,平均相對誤差在9%左右。為了更準(zhǔn)確地預(yù)測其吞吐量,本文引入TEI@I框架,定量地分析港口吞吐量的線性和非線性部分,以提高對港口吞吐量的分析能力和預(yù)測能力。
圖1 防城港港口歷年吞吐量
TEI@I方法論是汪壽陽等[14]提出的一種針對具有突現(xiàn)性、不穩(wěn)定性、非線性和不確定性等特征的現(xiàn)實復(fù)雜系統(tǒng)進(jìn)行分析的全新研究方法論。該方法基于先分解后集成的思想。首先,用計量經(jīng)濟(jì)模型預(yù)測線性部分,其次,用人工智能方法,如BP神經(jīng)網(wǎng)絡(luò)擬合非線性部分;然后,利用專家預(yù)測系統(tǒng)來量化重要事件的影響結(jié)果;最后,集成三者的結(jié)果,得到一個綜合的預(yù)測數(shù)據(jù)。
然而,對于影響防城港港口吞吐量不規(guī)則的事件,如因北部灣經(jīng)濟(jì)區(qū)的批準(zhǔn)、政府加大投資等,處理難度較大,且不易量化,很難預(yù)測,因此,本文暫不考慮不規(guī)則事件對吞吐量的影響,即只基于防城港吞吐量線性和非線性部分進(jìn)行集成預(yù)測,得到一個綜合的預(yù)測數(shù)據(jù)。本文建立的基于TEI@I方法的防城港港口吞吐量集成預(yù)測框架如圖2所示。
圖2 防城港港口吞吐量集成預(yù)測框架
設(shè)防城港港口每年的吞吐量實際數(shù)據(jù)為{Yt,t=1,2,3,...}。綜合考慮數(shù)據(jù)的可得性和對防城港港口的實際考察,影響防城港港口吞吐量的可能因素有:防城港市的第一產(chǎn)業(yè)總值、第二產(chǎn)業(yè)總值、第三產(chǎn)業(yè)總值、全年固定資產(chǎn)投資、社會消費品零售總額、進(jìn)出口總額等。因此,首先用多元線性回歸來擬合防城港港口吞吐量的歷年數(shù)據(jù),產(chǎn)生一個新的預(yù)測序列,記為{}:
式(1)中,x1表示防城港市的第一產(chǎn)業(yè)總值,x2為第二產(chǎn)業(yè)總值,x3為第三產(chǎn)業(yè)總值,x4表示全年固定資產(chǎn)投資,x5表示社會消費品零售總額,x6表示進(jìn)出口總額,a和bi(i=1,2,…,6)是需要確定的預(yù)測參數(shù)。
通過分析{Yt}和{}序列,可以得到防城港港口吞吐量的誤差序列,記為{et}。
在此基礎(chǔ)上,應(yīng)用三層的BP神經(jīng)網(wǎng)絡(luò)來擬合得到的誤差序列,如圖3所示,即包含1個輸入層、1個隱含層和1個輸出層,每層都有若干個神經(jīng)元組成,神經(jīng)元的傳遞函數(shù)為S型函數(shù),輸出量是0到1之間的連續(xù)量,權(quán)值的調(diào)整采用反向傳播(Baekpropagation)學(xué)習(xí)算法,每個輸入都通過一個適當(dāng)?shù)臋?quán)值W與下一層相連,網(wǎng)絡(luò)輸出表示為a=f(WP+c)。其輸入層為式(2)得到的誤差序列,輸入層的節(jié)點個數(shù)N,需要根據(jù)誤差序列數(shù)量的多少來確定,一般不少于3個,如果序列數(shù)據(jù)量大,輸入為3個以上。輸出層為預(yù)測得到的吞吐量新誤差,該吞吐量新誤差仍然是一個時間序列,記為{}。
圖3 三層BP神經(jīng)網(wǎng)絡(luò)模型
用三層BP神經(jīng)網(wǎng)絡(luò)擬合得到的吞吐量誤差序列仍然是一個時間序列,記為{}。實際上{}是一個非線性函數(shù),根據(jù)圖3可以表示為:
其中 fi為第i層網(wǎng)絡(luò)的輸出值,Wi為第i層的權(quán)值矩陣,P為輸入變量矩陣,ci為閾值(i=1,2,3)。
根據(jù)式(4)確定隱含層數(shù)。
式(4)中,N為輸入層節(jié)點數(shù),L為隱含層節(jié)點數(shù),M為輸出層節(jié)點數(shù),a為0到10之間的常數(shù)。
為了評價預(yù)測的性能,本文使用平均絕對百分比誤差(MAPE)、均方根誤差(RMSE)作為評價準(zhǔn)則,定義為:
式中D為測試周期。
3.1 數(shù)據(jù)來源
綜合分析,影響防城港港口吞吐量的可能相關(guān)因素為防城港市的第一產(chǎn)業(yè)總值、第二產(chǎn)業(yè)總值、第三產(chǎn)業(yè)總值、全年固定資產(chǎn)投資等。根據(jù)廣西年鑒及廣西統(tǒng)計信息網(wǎng)(http://www.gxtj. gov.cn/tjsj/tjnj)的相關(guān)信息,統(tǒng)計得到防城港港口1990-2013年的吞吐量數(shù)據(jù)及影響吞吐量因素的相關(guān)數(shù)據(jù),見表1。
表1 影響防城港港口吞吐量的各項經(jīng)濟(jì)指標(biāo)
3.2 預(yù)測模型及預(yù)測分析
為了建立預(yù)測模型和進(jìn)行驗證,以下選取1990-2010年數(shù)據(jù)進(jìn)行模型建立,使用2011-2013年的數(shù)據(jù)為測試樣本數(shù)據(jù),用于檢測預(yù)測誤差和評估預(yù)測精度。同時,為了評估集成預(yù)測模型的性能,還將與二次曲線等獨立預(yù)測方法的預(yù)測結(jié)果進(jìn)行對比分析。
3.2.1 二次曲線預(yù)測。從圖1知,防城港港口1990-2013年吞吐量呈指數(shù)發(fā)展趨勢,可直接建立指數(shù)模型進(jìn)行預(yù)測。根據(jù)1990-2010年的數(shù)據(jù),利用Excel求解,可以得到對應(yīng)的指數(shù)擬合模型為
3.2.2 多元線性回歸模型。按照圖1所示的框架,首先使用多元回歸模型進(jìn)行防城港吞吐量的預(yù)測分析,處理其線性部分的特征。
使用SPSS20,輸入1990-2010年防城港市的第一產(chǎn)業(yè)總值(x1)、第二產(chǎn)業(yè)總值(x2)、第三產(chǎn)業(yè)總值(x3)、全年固定資產(chǎn)投資(x4)、社會消費品零售總額(x5)、進(jìn)出口總額(x6)的數(shù)據(jù),作為多元線性回歸的訓(xùn)練樣本,采用逐步進(jìn)入的方式,選入P≤0.05,剔除標(biāo)準(zhǔn)P≥0.10得到的進(jìn)入變量和對應(yīng)的系數(shù),求解結(jié)果見表2、表3。
表2 模型概要
表3 模型系數(shù)
從表2可以看出R2為0.990,擬合效果較好,從表3中得到對應(yīng)多元線性回歸模型為:
從模型可以看出,吞吐量主要與第三產(chǎn)業(yè)總值、全年固定資產(chǎn)投資直接相關(guān),這與陳濤燾等[15]得出的結(jié)論相一致。這是因為防城港及其周邊地區(qū)第一產(chǎn)業(yè)和第二產(chǎn)業(yè)一直薄弱,而且需求比較穩(wěn)定,在1990至2010年前沒有大量大型企業(yè)投產(chǎn),產(chǎn)生的需求不大。2012年后,防城港才開始了千億元產(chǎn)業(yè)園的建立,如防城港鋼鐵項目,但目前這些企業(yè)仍未投產(chǎn),因此對其吞吐量影響不夠明顯。
把2011-2013年防城港港口的吞吐量作為測試樣本,結(jié)果見表4。
表4 測試樣本的誤差值
根據(jù)式(1)得到誤差序列,將得到的預(yù)測誤差序列制作成散點圖,如圖4所示。
圖4 多元線性回歸預(yù)測誤差散點圖
從圖4中可以看出,得到的多元線性回歸預(yù)測誤差不穩(wěn)定、呈非線性特征。
3.3 BP神經(jīng)網(wǎng)絡(luò)
根據(jù)前面已建立好的三層BP神經(jīng)網(wǎng)絡(luò)模型,使用Matlab求解計算實現(xiàn)時,首先將得到得多元線性預(yù)測值標(biāo)準(zhǔn)化處理,其中e*t為標(biāo)準(zhǔn)化的多元線性回歸預(yù)測誤差值,et為多元線性回歸預(yù)測誤差值,h和g分別是多元線性回歸預(yù)測誤差值中的最大值和最小值,設(shè)置學(xué)習(xí)目標(biāo)誤差值為0.000 1,訓(xùn)練最大次數(shù)為2 000次。其它的網(wǎng)絡(luò)參數(shù)確定過程如下:
(1)輸入層節(jié)點數(shù)。由于數(shù)據(jù)的有限性,確定該實例中的輸入層節(jié)點為3個,即將相鄰三年誤差序列作為一組輸入數(shù)據(jù),如將1990、1991、1992年多元線性回歸預(yù)測模型的誤差序列為第一組輸入數(shù)據(jù),將1991、1992、1993作為第二組輸入等。
(2)隱含層節(jié)點數(shù)。參考式(4),用逐一試算法確定最佳的節(jié)點數(shù),經(jīng)過試算,該實例預(yù)測隱含層節(jié)點數(shù)為4。
(3)輸出層節(jié)點數(shù)。本文將擬合的誤差序列作為輸出值,即輸出節(jié)點數(shù)為1。
(4)轉(zhuǎn)換和學(xué)習(xí)函數(shù)。第一層的轉(zhuǎn)化函數(shù)選為logsig,第二層的轉(zhuǎn)化函數(shù)選為purelin,學(xué)習(xí)函數(shù)選為traimlm。
(5)訓(xùn)練樣本集。樣本集選為1990-2010年多元線性回歸預(yù)測模型的誤差序列。
(6)測試樣本集。測試樣本選為2011、2012和2013年多元線性回歸預(yù)測模型的誤差序列。
最后得到以下擬合曲線,如圖5所示,其中橫軸表示誤差序列組,縱軸表示標(biāo)準(zhǔn)化后的預(yù)測誤差值或者真實值。
從運(yùn)行結(jié)果可以得出,最后3個點的測試平均絕對百分比誤差分別為57.55%、24.69%、2.86%,隨著樣本量的提高,絕對誤差會逐漸降低。
圖5 BP神經(jīng)網(wǎng)絡(luò)擬合數(shù)值與真實值的比較
3.4 綜合集成與單一預(yù)測比較
將多元線性回歸擬合值E^t與BP神經(jīng)網(wǎng)絡(luò)值I^t求和,得到綜合預(yù)測結(jié)果Y^t,預(yù)測結(jié)果見表5。
從表5可以看出,指數(shù)回歸模型預(yù)測、單一多元線性回歸預(yù)測與集成模型預(yù)測的平均絕對百分比誤差分別為9.33%、6.78%和1.52%。它們的均方根誤差分別為1 058.997、290.35和239.60。無論是預(yù)測的準(zhǔn)確性還是穩(wěn)定性,綜合集成預(yù)測的結(jié)果都大大高于單一模型的預(yù)測。這也充分說明了集成預(yù)測適合防城港港口吞吐量預(yù)測。
防城港的吞吐量近年不斷增加,波動較大,有明顯的線性和非線性特征,本文基于TEI@I集成理論框架,提出防城港港口吞吐量的預(yù)測模型,模型將吞吐量的線性部分通過多元線性回歸進(jìn)行擬合,非線性部分轉(zhuǎn)化為線性部分的預(yù)測誤差,通過BP神經(jīng)網(wǎng)絡(luò)進(jìn)行建模預(yù)測,該模型框架操作簡單,不存在復(fù)雜的數(shù)據(jù)處理。由實際預(yù)測可知,目前防城港的吞吐量主要與第三產(chǎn)業(yè)總值、全年固定資產(chǎn)投資直接相關(guān),從預(yù)測的效果可以看出,所提出的模型可較好地用于防城港港口吞吐量的預(yù)測,在平均絕對誤差和平方誤差上都優(yōu)于單一的多元線性回歸模型和直接的非線性預(yù)測,能較好地適應(yīng)防城港吞吐量的波動趨勢,可為港口運(yùn)營管理和相關(guān)部門投資決策等提供更準(zhǔn)確的依據(jù)。
表5 指數(shù)回歸模型和多元線性回歸模型與集成模型的比較
[1]王景敏,朱芳陽,隋博文,等.廣西北部灣港口物流需求預(yù)測及發(fā)展模式研究[J].物流科技,2010,(12):26-28.
[2]Gooijer J G de,Klein A.Forecasting the Antwerp maritime steel traffic flow:A case study[J].Journal of Forecasting,1989,8(4):381-398.
[3]Chou C,C Chu,G Liang.A modified regression model for forecasting the volumes of Taiwan's import containers[J].Mathematical and Computer Modelling,2008,47(9-10):797-807.
[4]Wei C H,Yang Y C.A study on transit containers forecast in Kaohsiung port-applying artificial neural networks to evaluating input variables[J].Journal of the Chinese Institute of Transportation,1999,11(3): 1-20.
[5]Chou M T,Lee H S,Lin K.A study of forecasting the volume of trans and the harbor operation for port of Kaohsiung[J].Journal of Maritime Sciences,2003,12(1):235-250.
[6]Hsu C I,Wen Y H.Applying grey forecast models to predict international air travel demand for Taiwan area[J].Transportation Planning Journal,1997,6(3):525-555.
[7]Xiao Jin,Xiao Yi,Fu Ju Lei,et.al.A transfer forecasting model for container throughput guided by discrete pso[J].系統(tǒng)科學(xué)與復(fù)雜性(英文版),2014,27(1):181-192.
[8]Chen S,J Chen.Forecasting container throughputs at ports using genetic programming[J].Expert Systems with Applications,2010,37(3):2 054-2 058.
[9]侯寶燕.基于組合預(yù)測法的營口港物流需求預(yù)測研究[D].大連:大連交通大學(xué),2013.
[10]黃俊聰.基于組合方法的港口物流需求預(yù)測研究[D].福州:福建農(nóng)林大學(xué),2009.
[11]許利枝,汪壽陽.港口物流預(yù)測研究:基于TEI@I方法論[J].交通運(yùn)輸系統(tǒng)工程與信息,2012,(1):173-179.
[12]Anqiang Huang,Kinkeung Lai,Yinhua Li,Shouyang Wang.Forecastingcontainer throughput of Qingdao port with a hybrid model[J]. Journal of Systems Science and Complexity,2015,28(1):105-121.
[13]Xie Gang,Wang Shouyang,Zhao Yingxue,etal.Hybrid approaches based on LSSVR model for container throughput forecasting:A comparative study[J].Applied Soft Computing Journal,2013,13(5):2 232-2 241.
[14]Wang S Y,Yu L,Lai K K.Crude oil price forecasting with TEI@I methodology[J].Journal of Systems Science and Complexity,2005,18 (2):145-166.
[15]陳濤燾,高琴.港口集裝箱吞吐量影響因素研究[J].武漢理工大學(xué)學(xué)報(信息與管理工程版),2008,(6):991-994,1 003.
Throughput Forecasting of Fangcheng Port Based on TEI@I Methodology
Fan Linsheng1,Deng Jianxin1,2,Min Hao1,Zhang Qi1
(1.Guangxi Key Laboratory of Manufacturing System&Advanced Manufacturing Technology,Guangxi University,Nanning 530004; 2.School of Mechanical Engineering,Guangxi University,Nanning 530004,China)
In this paper,in view of the fluctuation of the throughput of the Fangcheng Port,and based on the TEI@I methodology,we proposed a framework for the forecasting of the throughput of the port,built the corresponding throughput forecasting model and through an empirical test,showed that the method could yield more accurate result and reduce the average absolute error from 9.33%to 1.52%.
TEI@I methodology;multiple linear regression;BP neural network;Fangcheng Port;port throughput;forecasting
U691.71;F224
A
1005-152X(2015)10-0075-05
2015-08-25
廣西自然科學(xué)基金項目“面向資源利用優(yōu)化的物流業(yè)務(wù)協(xié)同感知模型研究”(2014GXNSFBA118281)
范林勝(1989-),男,廣西桂林人,廣西大學(xué)機(jī)械工程學(xué)院碩士研究生,主要研究方向:物流工程;鄧建新(1979-),男,四川廣元人,博士,副教授,主要研究方向:制造系統(tǒng)及其信息學(xué)、物流信息學(xué);閔浩(1989-),男,湖北仙桃人,廣西大學(xué)機(jī)械工程學(xué)院碩士研究生,主要研究方向:物流作業(yè)流程管理和智能化決策系統(tǒng);張琦(1989-),男,河南信陽人,廣西大學(xué)機(jī)械工程學(xué)院碩士研究生,主要研究方向:物流信息化。
10.3969/j.issn.1005-152X.2015.10.022