肖進麗 劉明俊 李曉磊
(武漢理工大學航運學院1) 武漢 430063) (湖北省內(nèi)河航運技術(shù)重點實驗室2) 武漢 430063)
基于集合經(jīng)驗模態(tài)分解和灰色神經(jīng)網(wǎng)絡的船舶交通流預測*
肖進麗1,2)劉明俊1,2)李曉磊1,2)
(武漢理工大學航運學院1)武漢 430063) (湖北省內(nèi)河航運技術(shù)重點實驗室2)武漢 430063)
為提高船舶交通流預測精度,更科學地為海事監(jiān)管、港口水域規(guī)劃布局提供參考,結(jié)合灰色神經(jīng)網(wǎng)絡模型(grey neural network, GNN)和集合經(jīng)驗模態(tài)分解(ensemble empirical mode decomposition, EEMD)對船舶交通流建立了EEMD-GNN組合預測模型,并基于Matlab軟件,以2007年1月—2015年12月荊州長江公路大橋斷面船舶交通流月流量統(tǒng)計數(shù)據(jù)為樣本進行了實例分析.首先對船舶月流量時間序列樣本數(shù)據(jù)進行EEMD分解以降低序列的非平穩(wěn)性,然后對EEMD分解后獲得的各分量建立GNN模型進行預測,并將各分量預測值進行疊加即得到EEMD-GNN模型的預測結(jié)果.最后,將EEMD-GNN模型預測結(jié)果與傳統(tǒng)GNN模型進行對比分析.對比分析結(jié)果表明,EEMD-GNN模型較傳統(tǒng)GNN模型的預測精度更高,能更好地反映船舶月交通流量的變化情況.
船舶交通流;集合經(jīng)驗模態(tài)分解;灰色神經(jīng)網(wǎng)絡;組合預測
近年來,隨著我國水上交通運輸業(yè)的快速發(fā)展,船舶交通流量日益增長,與通航安全、通航效率,以及通航資源之間的矛盾也日益突顯.為緩解這一矛盾,更好地保障水域通航安全、提高水域通航效率、科學合理規(guī)劃水域布局,有必要通過對船舶交通流進行預測和研究來把握其未來的發(fā)展趨勢,為海事監(jiān)管、港口規(guī)劃和設計等方面提供科學參考[1]
目前,國內(nèi)外有關(guān)船舶交通流預測的研究眾多,并且主要采用了基于模型的定量分析方法,如時間序列分析、小波分析、人工神經(jīng)網(wǎng)絡、支持向量機等,均取得了較好的預測效果[2-5].人工神經(jīng)網(wǎng)絡作為一種數(shù)據(jù)驅(qū)動算法,可以映射出時間序列間復雜的非線性關(guān)系,具有很強的非線性信息處理能力,在預測領域應用較為成熟.由于傳統(tǒng)人工神經(jīng)網(wǎng)絡采用梯度下降的學習方法,易陷入局部極小、引起振蕩以及收斂速度慢等固有缺陷,實用性不強[6].灰色神經(jīng)網(wǎng)絡兼具了灰色模型少數(shù)據(jù)建模和人工神經(jīng)網(wǎng)絡自學習、非線性映射的優(yōu)點,與傳統(tǒng)人工神經(jīng)網(wǎng)絡相比,其網(wǎng)絡的泛化能力和學習速度都有所提高,故近年來在預測領域逐漸得以應用[7].但是,船舶交通流序列是一種具有非線性和非平穩(wěn)性的特殊時間序列,灰色神經(jīng)網(wǎng)絡雖可以很好地擬合船舶交通流序列的非線性部分,但是其非平穩(wěn)的部分會對預測效果造成較大影響,因而降低船舶交通流序列的非平穩(wěn)性對于提高預測的精度十分重要.集合經(jīng)驗模態(tài)分解是一種改進的經(jīng)驗模態(tài)分解(empirical mode decomposition,EMD)方法,可以將一個復雜的非線性、非平穩(wěn)性時間序列自適應分解為一系列尺度不同的線性、平穩(wěn)信號,從而極大降低時間序列的非平穩(wěn)性[8].
針對船舶交通流序列的非線性和非平穩(wěn)性特性,文中提出一種將灰色神經(jīng)網(wǎng)絡模型和集合經(jīng)驗模態(tài)分解相結(jié)合的新型船舶交通流組合預測模型,并應用此模型對荊州長江公路大橋斷面船舶交通流進行了預測和對比分析,結(jié)果表明此模型能夠較好地提高預測的精度.
船舶交通流是一種典型的時間序列,具有很明顯的非線性和非平穩(wěn)的特征.以長江下游某航道斷面流量為例,2014年該斷面的船舶月日均流量與當年元月份日流量分布見圖1.
圖1 長江某航道斷面流量分布
圖1很直觀就反映出了船舶交通流的非線性特征,但其非平穩(wěn)性則需要采取一定的方法進行檢驗.ADF檢驗(augmented dickey-fuller test statistic)是一種常用的時間序列平穩(wěn)性檢驗方法,它通過檢驗序列中是否存在平方根來判斷序列是否平穩(wěn),如果不存在單位根則序列是平穩(wěn)的,如果存在單位根則序列是不平穩(wěn)的,因此,為分析以上這兩組數(shù)據(jù)(月日均流量和日流量)的非平穩(wěn)性,可基于EViews軟件對其進行ADF檢驗,檢驗結(jié)果見表1.
表1 船舶序列的ADF檢驗
由表1可知,兩組數(shù)據(jù)的t統(tǒng)計值的絕對值均大于其顯著性水平為1%,5%,10%的臨界值,接受存在一個單位根的假設,表明這兩組數(shù)據(jù)均為非平穩(wěn)時間序列.
GM(1,1) 首先對原始時間序列做一次累加,然后利用累加后的數(shù)據(jù)建立微分方程形式的動態(tài)模型.設原始時間序列為
x(0)={x(0)(1),x(0)(2),…,x(0)(n)}
(1)
對x(0)做一次累加生成序列
x(1)={x(1)(1),x(1)(2),…,x(1)(n)}
(2)
根據(jù)新時間序列x(1),建立微分方程為
(3)
該方程的解為
k=0,1,…,n
(4)
基于嵌入型結(jié)構(gòu),采用BP神經(jīng)網(wǎng)絡與灰色預測模型組合構(gòu)成嵌入型灰色神經(jīng)網(wǎng)絡預測模型[9],具體建模過程為:
1) 確定船舶交通流數(shù)據(jù)的時間序列長度N,生成初始時間序列x(0).
2) 將初始時間序列x(0)按式(2)進行一次累加生成新序列x(1).
3) 建立三層BP神經(jīng)網(wǎng)絡,包括輸入層、隱含層和輸出層.將序列x(1)作為BP神經(jīng)網(wǎng)絡的輸入向量,設置訓練參數(shù)對BP神經(jīng)網(wǎng)絡進行訓練,直至樣本集總誤差達到所要求精度為止,此時輸出向量數(shù)據(jù)為y(1).
4) 對輸出向量y(1)按式(3)做一次累減還原處理,最終得到船舶交通流預測值.
k=0,1,…,n
(5)
EEMD(ensemble empirical mode decomposition)為EMD的改進方法,EMD則是Sreedevi等[10]提出的一種有效處理非線性和非平穩(wěn)信號的自適應分解算法.EMD的基本思想是根據(jù)信號本身在時間尺度上的局部特性,通過篩分過程(shifting process)自適應地將信號分解為有限個反映時序信號內(nèi)在特征的“固有模態(tài)分量(intrinsic mode function, IMF)”,從而對信號完成平穩(wěn)化處理.但是應用研究又發(fā)現(xiàn),當待處理的信號中存在異常干擾信號時,EMD會存在模式混疊問題.針對這一問題,基于白噪聲中均勻分布的各種頻率成分能被規(guī)律性分離開來的現(xiàn)象,Wu等[11]提出一種在待分解待信號中加入白噪聲,使不同尺度的信號自動映射到合適的參考尺度上,從而克服EMD模態(tài)混疊缺陷、達到更好分解結(jié)果的方法,即為EEMD算法.EEMD分解主要步驟為:
1) 在待分解信號x(t)中加入白噪聲n(t)獲得加噪聲后的總體信號X(t):
X(t)=x(t)+n(t)
(6)
2) 對總體信號X(t)進行EMD分解,得到一組IMF分量cj(t)(j=1,2…m)和一個殘余分量rm(t):
(7)
3) 給待分解信號x(t)加入不同白噪聲信號ni(t)(i=1,2…N),重復以上兩步N次,分解后得到不同的IMF分量和殘余分量,即
(8)
4)為消除多次添加白噪聲信號對實際IMF的干擾,對各分量進行整體平均計算,獲得時序信號的EEMD分解結(jié)果為
(9)
根據(jù)以上EEMD和GNN模型,將船舶交通流在各個時間段上的觀測值作為一時間序列X(t),對序列X(t)進行EEMD分解,得到m個固有模態(tài)分量IMF和1個殘差項Rm,即
X(t)=IMF1+IMF2+…+IMFm+Rm(10)
針對各個IMF和R,分別建立各自的GNN預測模型進行預測,得到各分量的預測值YIMF1,YIMF2…YIMFn和YB,最后將各分量預測值進行疊加得到船舶交通流的預測結(jié)果為
Y=YIMF1+YIMF2+…+YIMFn+YRm
(11)
綜上所述,建立EEMD-GNN船舶交通流預測模型的步驟見圖2.
圖2 EEMD-GNN組合預測流程
為綜合評定預測結(jié)果的性能,文中以平均絕對誤差εm、均方根誤差RMS作為評判模型性能的指標,為
(12)
(13)
為驗證EEMD-GNN算法的有效性,文中以荊州長江公路大橋斷面2007年1月—2016年3月共111個月的船舶月流量統(tǒng)計數(shù)據(jù)(月均當量船舶艘次)為例進行實例分析,其統(tǒng)計數(shù)據(jù)時間序列見圖3.
圖3 某航道斷面月交通流時間序列
首先對船舶月流量序列進行EEMD分解,分解結(jié)果見圖4.
圖4 EEMD分解結(jié)果
由圖4可知,EEMD將船舶交通流時間序列分解為五個頻率逐級降低的IMF分量和一個殘差項.五個IMF分量反映出不同影響因素在不同尺度對船舶交通流時序數(shù)據(jù)的影響. 其中分量IMF1周期性波動特點不明顯,反映的是外部隨機因素對船舶交通流的影響;分量IMF2~IMF4的周期性波動特點較為明顯,但其波動周期不均勻,反映的是通航水位變化、氣候條件等外部非隨機因素對船舶交通流的共同作用.殘差項Rm則反映出船舶交通流時間序列長期的變化趨勢.
由于經(jīng)EEMD分解后的IMF和殘差分量的數(shù)據(jù)個數(shù)均為111個,選取前1~99個數(shù)據(jù)作為GNN的訓練樣本,剩余的12個數(shù)據(jù)(12個月)作為測試樣本.分別使用GNN對分解所得的各IMF分量和殘差進行訓練和預測, 并對各分量的預測結(jié)果疊加得到船舶交通流預測結(jié)果,并與基于GNN模型的船舶交通流預測結(jié)果和實際值進行對比,見圖5.
圖5 EEMD-GNN及GNN的船舶月交通流預測結(jié)果
表2為兩種模型基于平均絕對誤差εm和均方根誤差RMS的預測性能對比.
表2 EEMD-GNN及GNN預測模型精度對比
由圖5可知, EEMD-GNN組合預測模型可以有效地對船舶交通流進行跟蹤預測,有較高的跟蹤預測效果.而表2則進一步表明,EEMD-GNN模型的預測精度優(yōu)于傳統(tǒng)GNN模型,其預測結(jié)果比傳統(tǒng)GNN模型整體更接近于實際值.
對于船舶交通流預測,船舶交通流序列的非平穩(wěn)性和非線性加大了其難度.基于EEMD可以有效分析非平穩(wěn)序列的特性和GNN具有較好的非線性擬合能力,文中提出一種基于EEMD-GNN模型的船舶交通流組合預測方法.實例分析表明,與傳統(tǒng)GNN模型相比,EEMD-GNN模型在船舶交通流預測方面具有更高的精度,在船舶交通流預測領域具有一定的實用價值.但是,由于該模型在使用EEMD對船舶流進行分解時沒有考慮船舶流時間序列的端點效應問題,具有一定的局限性,需進一步研究.
[1] 金興賦,付玉慧,張連東.基于AIS數(shù)據(jù)的成山頭水域船舶交通流研究[J].大連海事大學學報,2012,38(1):33-36.
[2] ZENG D H, XU J M, GU J W, et al. Short term traffic flow prediction using hybrid ARIMA and ANN models[C]. Proceedings of the 2008 Workshop on Power Electronics and Intelligent Transportation System,2008.
[3] ANDRIUS D. Neural network approach to predict marine traffic[J]. Baltic J Modern Computing,2016(3):483-495.
[4] LIU C X, LU B C, WANG J F. Traffic flow prediction based on wavelet analysis, improved genetic algorithm, and bp neural network[C]. The 12thCOTA International Conference of Transportation Professionals, Beijing, China,2012.
[5] ZHANG H, XIAO Y J. GA-support vector regression based ship traffic flow prediction[J]. International Journal of Control and Automation,2016(2):219-228.
[6] LIU C X, SHUA T , CHEN S, et al. An improved grey neural network model for predicting transportation disruptions[J]. Expert Systems with Applications,2016(2):331-340.
[7] PAN Y Y, SHI Y D. Short-term traffic forecasting based on grey neural network with particle swarm optimization[C]. Proceedings of the World Congress on Engineering and Computer Science, San Francisco, USA,2016.
[8] 徐龍琴,李乾川,劉雙印,等.基于集合經(jīng)驗模態(tài)分解和人工蜂群算法的工廠化養(yǎng)殖pH值預測[J].農(nóng)業(yè)工程學報,2016,32(3):202-209.
[9] 陳淑燕,王煒.交通量的灰色神經(jīng)網(wǎng)絡預測方法[J].東南大學學報,2004,34(4):541-544.
[10] SREEDEVI G, SREENIVASULU R. Enhanced signal denoising performance by EMD-based techniques[J]. International Journal of Engineering Research and Applications,2012(6):1705-1711.
[11] WU Z H, HUANG N. Ensemble empirical mode decomposition: a noise-assisted data analysis method[J]. Advances in Adaptive Data Analysis,2009(1):36-41.
Vessel Traffic Flow Prediction Based on Ensemble Empirical Mode Decomposition and Grey Neural Network
XIAOJinli1,2)LIUMingjun1,2)LIXiaolei1,2)
(SchoolofNavigation,WuhanUniversityofTechnology,Wuhan430063,China)1)(HubeiKeyLaboratoryofInlandShippingTechnology,Wuhan430063,China)2)
To improve the predictive accuracy of vessel traffic flow and provide more reasonable decision-making basis for maritime management, port planning and development, the combination forecast model (EEMD-GNN) for vessel traffic flow is estimated based on Grey Neural Network (GNN) model and Ensemble Empirical Mode Decomposition (EEMD) method. With Matlab software, the example analysis is conducted based on the statistical data of the monthly flow of vessel traffic in Jingzhou Yangtze river highway bridge during January 2007-December 2015. Firstly, in order to reduce the non-stationary of vessel traffic flow time series, the sample data is decomposed by the EEMD method and a set of decomposed components are obtained to predict the results by GNN model. Afterwards, the predictive results of all components are added together to form the final results: the EEMD-GNN model. Finally, the prediction results of EEMD-GNN model are compared with those of the traditional GNN model. The results show that the EEMD-GNN model has higher prediction accuracy compared with traditional GNN model, which reflects the future trend of monthly vessel traffic flow more accurately.
vessel traffic flow; EEMD; GNN model; combination prediction
U491.2
10.3963/j.issn.2095-3844.2017.06.010
2017-10-19
肖進麗(1976—):女,博士,副教授,主要研究領域為交通信息處理及交通安全保障技術(shù)
*湖北省自然科學基金面上項目資助(2015CFB282)