滕 藤 曾慶成 陳文浩
(大連海事大學(xué)交通運(yùn)輸管理學(xué)院 大連 116026)
隨著港口之間的競(jìng)爭(zhēng)不斷加劇,為提高服務(wù)水平、提升自身競(jìng)爭(zhēng)力,集裝箱碼頭集卡入港模式正在由集中入港方式向隨機(jī)入港方式轉(zhuǎn)變.在隨機(jī)入港模式下,集卡到達(dá)時(shí)間不確定性更強(qiáng),給碼頭作業(yè)計(jì)劃的制定以及作業(yè)管理帶來(lái)了巨大的挑戰(zhàn).突出表現(xiàn)在:一方面,由于集卡到達(dá)時(shí)間的不確定性,影響堆存計(jì)劃的科學(xué)性,造成堆場(chǎng)翻箱量增加;另一方面,高峰期集卡大量到達(dá),易造成港口擁堵.準(zhǔn)確把握集卡到達(dá)規(guī)律對(duì)提高碼頭作業(yè)效率有重要意義,集卡到達(dá)時(shí)間預(yù)測(cè)是把握集卡到達(dá)規(guī)律的有效方式,因此準(zhǔn)確預(yù)測(cè)集卡到達(dá)時(shí)間成為集裝箱碼頭運(yùn)營(yíng)管理者關(guān)注的問題.
國(guó)內(nèi)外學(xué)者針對(duì)集卡到達(dá)問題開展了大量研究,Al-Deek[1],Klodzinski等[2-3]利用多層前饋人工神經(jīng)網(wǎng)絡(luò),預(yù)測(cè)了港口每天集卡到達(dá)量.Xie等[4]提出2種基于核的機(jī)器學(xué)習(xí)方法(高斯過程和ε-支持向量機(jī)),改善了神經(jīng)網(wǎng)絡(luò)耗時(shí)和過擬合的問題.Sideris等[5]基于經(jīng)驗(yàn)概率密度函數(shù)預(yù)測(cè)了每天集卡到達(dá)量.同時(shí),一些學(xué)者對(duì)集卡到達(dá)信息對(duì)碼頭作業(yè)的影響進(jìn)行研究,如Zhao和Goodchild[6],Jones和 Walton[7]研究表明集卡到達(dá)信息可以顯著減少碼頭堆場(chǎng)翻箱率.這些研究主要是通過構(gòu)建模型預(yù)測(cè)碼頭一段時(shí)間內(nèi)的集卡到達(dá)量,對(duì)于集卡微觀到達(dá)時(shí)間有待進(jìn)一步研究.另一方面,針對(duì)小汽車、公交等車輛到達(dá)時(shí)間預(yù)測(cè)問題,有大量的方法,如于濱等[8]建立的公交車運(yùn)行時(shí)間預(yù)測(cè)模型,Jula等[9]建立的車輛路段行駛時(shí)間的預(yù)測(cè)模型,陳旭梅等[10]提出的車輛運(yùn)行的動(dòng)態(tài)預(yù)測(cè)方法等.碼頭集卡到達(dá)不但受貨主所在地、道路交通條件的影響,還受碼頭作業(yè)情況和船期等因素影響,具有與一般道路車輛不同的時(shí)間特征.同時(shí),集裝箱運(yùn)輸具備以周為單位的波動(dòng)特征,直接影響集卡入港時(shí)間的選擇.本文構(gòu)建了基于支持向量機(jī)(SVM)和Kalman濾波的碼頭集卡到達(dá)時(shí)間動(dòng)態(tài)預(yù)測(cè)模型.以SVM模型刻畫碼頭集卡到達(dá)的影響因素,通過Kalman濾波,基于集卡實(shí)時(shí)數(shù)據(jù)進(jìn)行動(dòng)態(tài)更新,從而提高預(yù)測(cè)的精確性和魯棒性.
目前,外部集卡GPS的發(fā)展為集卡到達(dá)時(shí)間預(yù)測(cè)提供了良好的基礎(chǔ),在集卡運(yùn)營(yíng)過程中,可以根據(jù)集卡發(fā)送的GPS數(shù)據(jù)預(yù)測(cè)集卡到達(dá)碼頭閘口的行駛時(shí)間.由GPS設(shè)備在集卡行駛過程中發(fā)送行駛數(shù)據(jù)確定集卡當(dāng)前位置和時(shí)間,結(jié)合相應(yīng)的外部情況預(yù)測(cè)集卡到達(dá)時(shí)間,再使用實(shí)時(shí)信息動(dòng)態(tài)調(diào)整預(yù)測(cè)值提高模型的準(zhǔn)確性及穩(wěn)定性.
本文提出的基于SVM與Kalman濾波的集卡到達(dá)時(shí)間預(yù)測(cè)模型見圖1.首先,基于歷史數(shù)據(jù),通過樣本值訓(xùn)練出相應(yīng)SVM模型,向訓(xùn)練好的SVM模型輸入相應(yīng)的輸入變量值預(yù)測(cè)集卡的行駛路徑及路段行駛時(shí)間的初始值.在此基礎(chǔ)上,通過Kalman濾波,處理集卡運(yùn)行過程中受周圍環(huán)境影響容易造成GPS信號(hào)的反射及衰減,帶來(lái)隨機(jī)的噪聲問題,根據(jù)實(shí)時(shí)集卡信息動(dòng)態(tài)調(diào)整SVM模型的預(yù)測(cè)輸出,從而提高到達(dá)時(shí)間預(yù)測(cè)的精度和魯棒性.
圖1 集裝箱碼頭集卡到達(dá)時(shí)間預(yù)測(cè)方法框架圖
為構(gòu)建模型,定義參數(shù)及變量如下.
T為集卡總行駛時(shí)間,相對(duì)出發(fā)位置的集卡到達(dá)時(shí)間;U 為集卡已行駛路段集合{ui|??αi=1,i∈I};V為仍需行駛路段集合{vi|??βi(1-αi)=1,i∈I};tij為集卡到達(dá)路段i子路段j的末端節(jié)點(diǎn)時(shí)的GPS時(shí)間;Et為當(dāng)集卡位于路段i子路段j時(shí)的天氣情況,根據(jù)惡劣程度劃分等級(jí),1表示良好天氣,0表示完全無(wú)法通行的天氣,0≤Et≤1;Wt為當(dāng)集卡位于路段i子路段j時(shí)的星期數(shù),Wt∈ [1,2,3,4,5,6,7],表示星期一至星期天;Mt為當(dāng)集卡位于路段i子路段j時(shí)的日期數(shù),Mt∈ [1,2,3,…,31],表示1個(gè)月中的某天;Φ 為集裝箱類型,0表示空箱,1表示20ft重箱,2表示40ft重箱;aij為路段ai的子路段j,j=1,2,3,…,J;αij為0-1變量,若集卡已行駛過路段i子路段j則為1,否則為0;βij為0-1變量,若路段i子路段j包含于集卡行駛路徑中則為1,否則為0;為路段i子路段j行駛時(shí)間的SVM預(yù)測(cè)值;zij為路段i子路段j行駛時(shí)間的測(cè)量值(實(shí)際值)為最優(yōu)濾波估計(jì)值;Aij為狀態(tài)轉(zhuǎn)移量參數(shù);Hij為測(cè)量誤差參數(shù);wij為均值為0的高斯白噪聲,協(xié)方差為Q;rij為均值為0的高斯白噪聲,協(xié)方差為R;為xij的先驗(yàn)誤差的協(xié)方差;Pi,j為xij的后驗(yàn)誤差的協(xié)方差;Kij為卡爾曼增益矩陣.
支持向量機(jī)是通過從有限觀測(cè)數(shù)據(jù)中挖掘出無(wú)法通過原理分析得到的規(guī)律,從而對(duì)未知數(shù)據(jù)或無(wú)法觀測(cè)的新現(xiàn)象進(jìn)行預(yù)測(cè)和判斷的一種有效的預(yù)測(cè)方法.SVM是一個(gè)凸二次優(yōu)化問題,并且保證找到的極值就是全局最優(yōu).對(duì)于SVM的具體推導(dǎo)過程見文獻(xiàn)[11].
本文中設(shè)計(jì)的SVM預(yù)測(cè)流程見圖2,首先需要設(shè)定訓(xùn)練集,再使用網(wǎng)格搜索和交叉驗(yàn)證方法確定最優(yōu)的模型參數(shù)(C,v),然后再對(duì)核函數(shù)進(jìn)行選擇,再通過輸入?yún)?shù)及訓(xùn)練集訓(xùn)練SVM模型,再把輸入值輸入該訓(xùn)練好的SVM進(jìn)行預(yù)測(cè).本文中,設(shè)定的輸入變量為{U,t,Et,Wt,Mt,Φ},模型的輸出變量為{V,i∈I,j∈J}.
圖2 基于SVM的集卡到達(dá)時(shí)間預(yù)測(cè)流程圖
則在t時(shí)刻集卡到達(dá)時(shí)間預(yù)測(cè)值為:
式(1)中第一部分為已行駛的時(shí)間;第二部分為基于SVM預(yù)測(cè)的剩余行駛時(shí)間.其中:V和,i∈I,j∈J需要由SVM模型求得.
Kalman濾波算法采用線性隨機(jī)系統(tǒng)的狀態(tài)空間模型描述過濾器,并使用狀態(tài)的遞歸公式,以線性無(wú)偏最小均方誤差估計(jì)為標(biāo)準(zhǔn),求得系統(tǒng)狀態(tài)的最佳估計(jì),以過濾噪音.這里,根據(jù)車輛運(yùn)行實(shí)時(shí)信息并結(jié)合SVM預(yù)測(cè)結(jié)果,通過Kalman濾波迭代動(dòng)態(tài)更新路段行駛時(shí)間,提高預(yù)測(cè)準(zhǔn)確性.Kalman濾波模型的時(shí)間關(guān)系見圖3.其中到達(dá)時(shí)間分為兩部分:第一部分為已經(jīng)行駛過的路段以及正在行駛的路段中已行駛的子路段的行駛時(shí)間,第二部分為正在行駛路段中未行駛的子路段的Kalman濾波預(yù)測(cè)值以及未行駛路段的預(yù)測(cè)時(shí)間.
圖3 動(dòng)態(tài)預(yù)測(cè)時(shí)間關(guān)系示意圖
根據(jù)GPS測(cè)量得到的上一子路段的運(yùn)輸時(shí)間觀察值z(mì)ij,再根據(jù)SVM模型預(yù)測(cè)集卡的行駛路徑V及對(duì)應(yīng)路段行駛時(shí)間的預(yù)測(cè)值,利用Kalman濾波算法更新所有路段行駛時(shí)間預(yù)測(cè)值,通過不斷的更新迭代提高集卡到達(dá)時(shí)間T的預(yù)測(cè)精度.
構(gòu)建基于Kalman濾波的集卡到達(dá)時(shí)間動(dòng)態(tài)預(yù)測(cè)模型:
式(4)表示集卡完成行駛所需要的全部時(shí)間.其中正在行駛的路段中未行駛的子路段的初始值為最近行駛子路段的行駛時(shí)間.式(5)~(9)為Kalman濾波的遞推方程.
為驗(yàn)證本文提出方法的有效性,通過深圳集裝箱碼頭的集卡數(shù)據(jù)進(jìn)行實(shí)例分析,收集了共計(jì)4 387輛次集卡GPS數(shù)據(jù).在剔除不合理點(diǎn)后,根據(jù)卡定位誤差修正方法,對(duì)定位丟失點(diǎn)采用“插值法”補(bǔ)齊和對(duì)偏離點(diǎn)采用“垂直投影法”進(jìn)行處理.
根據(jù)每條GPS數(shù)據(jù)提供的信息,標(biāo)定出對(duì)應(yīng)輸入變量及輸出變量,并且將原始GPS數(shù)據(jù)按運(yùn)輸發(fā)生時(shí)間均分為兩部分,一部分構(gòu)成訓(xùn)練樣本,用于訓(xùn)練動(dòng)態(tài)預(yù)測(cè)模型中的支持向量機(jī),另一部分用于預(yù)測(cè)和檢驗(yàn)?zāi)P?
通過交叉驗(yàn)證和網(wǎng)格搜索的方法確定SVM中徑向基函數(shù)的參數(shù),最終的得到本例的C=523,ε=0.070 844,據(jù)此進(jìn)行SVM 預(yù)測(cè).對(duì)預(yù)測(cè)值進(jìn)行誤差分析檢驗(yàn)?zāi)P偷臏?zhǔn)確性.本文通過計(jì)算平均相對(duì)預(yù)測(cè)誤差MAPE對(duì)預(yù)測(cè)的準(zhǔn)確度進(jìn)行分析,并比較各個(gè)路段的預(yù)測(cè)誤差情況.
式中:n為經(jīng)過該路段的集卡數(shù)量;MAPE值則表示平均偏差占平均值的百分?jǐn)?shù),MAPE值越小,模型越精確,可靠性越強(qiáng).
圖4表示基于SVM預(yù)測(cè)的計(jì)算結(jié)果.經(jīng)試算,80.4%的路段誤差最大點(diǎn)處于預(yù)測(cè)結(jié)果的最大或最小值上,小于20%的情況發(fā)生在接近平均值的位置.此外,基于SVM模型的預(yù)測(cè)誤差隨路段長(zhǎng)度的增加而增加.且預(yù)測(cè)結(jié)果的上下界均偏離平均誤差范圍的程度較大,該方法的魯棒性不高,在預(yù)測(cè)個(gè)別集卡時(shí)存在較大偏差.同時(shí),預(yù)測(cè)誤差與路段長(zhǎng)度之間并非完全的線性關(guān)系,這是由于其不僅受路段長(zhǎng)度的影響,而且與天氣、交通狀況等有關(guān).
圖4 靜態(tài)預(yù)測(cè)誤差結(jié)果(基于SVM的方法)
基于SVM和Kalman濾波的動(dòng)態(tài)預(yù)測(cè)模型的預(yù)測(cè)結(jié)果及誤差分析見圖5.
圖5 動(dòng)態(tài)預(yù)測(cè)誤差
由圖4、圖5可見,動(dòng)態(tài)預(yù)測(cè)方法較靜態(tài)方法精度高.而且,與靜態(tài)方法相比,動(dòng)態(tài)預(yù)測(cè)的精度隨路段距離增加變化的幅度較小,結(jié)果的上下界范圍較小,具有良好的預(yù)測(cè)效果.隨著路段長(zhǎng)度增加,預(yù)測(cè)精度下降,這是由于長(zhǎng)距離路段交通狀況更復(fù)雜,受到隨機(jī)因素影響更大大,而且遇到突發(fā)事故的幾率也增大.因此,基于SVM和Kalman的動(dòng)態(tài)預(yù)測(cè)提高了預(yù)測(cè)精度和魯棒性,是預(yù)測(cè)集裝箱碼頭集卡到達(dá)時(shí)間的有效方法.
為進(jìn)一步分析各因素的重要性,進(jìn)行敏感性分析.采用蒙特卡洛法進(jìn)行仿真分析:在給定的集合中,隨機(jī)抽取一個(gè)個(gè)體,僅改變這個(gè)個(gè)體的一個(gè)影響因素的數(shù)值,然后使用動(dòng)態(tài)預(yù)測(cè)模型進(jìn)行預(yù)測(cè),比較新的預(yù)測(cè)結(jié)果與原有的差別.由于影響因素在歸一化后,范圍都在[0,1]之間,因此每次改變量為0.1,則有預(yù)測(cè)結(jié)果對(duì)某個(gè)影響因素的敏感度R.
令n=n+1,抽取新的個(gè)體,重復(fù)上述過程,直到R的變化小于0.001.依次對(duì)變量:時(shí)刻t、天氣情況Et、星期數(shù)Wt、日期數(shù)Mt和貨物類型Φ進(jìn)行敏感度分析,結(jié)果見表1.從結(jié)果可以看出,變量中影響最大的是時(shí)刻數(shù),其次是天氣情況;影響最小的是日期數(shù).
表1 敏感度分析結(jié)果
針對(duì)集裝箱碼頭外部集卡到達(dá)時(shí)間預(yù)測(cè)問題,采用SVM和Kalman濾波相結(jié)合的方法,以SVM支持向量機(jī)的預(yù)測(cè)結(jié)果為初始值,通過集卡車載GPS獲取實(shí)時(shí)數(shù)據(jù),使用Kalman濾波算法對(duì)結(jié)果進(jìn)行動(dòng)態(tài)更新.結(jié)果表明,基于SVM和Kalman濾波的動(dòng)態(tài)預(yù)測(cè)模型能提高集卡到達(dá)時(shí)間預(yù)測(cè)準(zhǔn)確性和魯棒性.
碼頭集卡到達(dá)時(shí)間預(yù)測(cè)影響因素復(fù)雜,進(jìn)一步研究可以考慮更多因素,如,紅綠燈數(shù)量、集裝箱貨物類型的影響,進(jìn)一步提高預(yù)測(cè)的效果.同時(shí),結(jié)合多種交通信息或數(shù)據(jù)進(jìn)行預(yù)測(cè)也是值得進(jìn)一步研究的方向.
[1]AL-DEEK H M,JOHNSON G,MOHAMED A,et al.Truck trip generation models for seaports with container and trailer operation[J].Transportation Research Record:Journal of the Transportation Research Board,2000,1719(1):1-9.
[2]KLODZINSKI J,AL-DEEK H M.Transferability of an intermodal freight transportation forecasting model to major Florida seaports[J].Transportation Research Record:Journal of the Transportation Research Board,2003,1820(1):36-45.
[3]KLODZINSKI J,AHMAD A D,GEORGIOPOULOS M,et al.Development of a java applet for generating truck trips from freight data[J].Transportation Research Record:Journal of the Transportation Research Board,2004,1870(1):10-17.
[4]XIE Y,HUYNH N.Kernel-based machine learning methods for modeling daily truck volume at seaport terminals[J]. Transportation Research Record:Journal of the Transportation Research Board,2009,1875(2):110-117.
[5]SIDERIS A,BOILéM P,SPASOVIC L N.Using on-line information to estimate container movements for day-to-day marine terminal operation[R].New Jersey:New Jersey Institute of Technology,2010.
[6]ZHAO W,GOODCHILD A V.The impact of truck arrival information on container terminal rehandling[J].Transportation Research Part E:Logistics and Transportation Review,2010,46(3):327-343.
[7]JONES E G,MICHAEL W C.Managing containers in a marine terminal:Assessing information needs[J].Transportation Research Record:Journal of the Transportation Research Board,2002(1):92-99.
[8]于 濱,楊忠振,林劍藝.應(yīng)用支持向量機(jī)預(yù)測(cè)公交車運(yùn)行時(shí)間[J].系統(tǒng)工程理論與實(shí)踐,2007(4):160-172.
[9]JULA H,DESSOUKY M,IOANNOU P A.Realtime estimation of travel times along the arcs and arrival times at the nodes of dynamic stochastic networks[J].Intelligent Transportation Systems,IEEE Transactions on,2008,9(1):97-110.
[10]陳旭梅,龔輝波,王景楠.基于SVM和Kalman濾波的BRT行程時(shí)間預(yù)測(cè)模型研究[J].交通運(yùn)輸系統(tǒng)工程與信息,2012,12(4):29-34.
[11]DONG B,CAL C,LEE S E.Applying support vector machines to predict building energy consumption in tropical region[J].Energy and Buildings,2005,7(5):545-553.