劉 釗, 崔瓏獻(xiàn), 李 巖, 劉 文*, 1b, 劉敬賢, 1b
(1.武漢理工大學(xué) a.航運學(xué)院; b.內(nèi)河航運技術(shù)湖北省重點實驗室, 湖北 武漢 430063;2.國家水運安全工程技術(shù)研究中心, 湖北 武漢 430063)
船舶交通流預(yù)測在優(yōu)化船舶交通組織、緩解交通擁堵、提升通過能力和支撐水上交通基礎(chǔ)設(shè)施規(guī)劃建設(shè)等方面發(fā)揮著重要作用。但是,由于船舶交通流的影響因素的復(fù)雜性、變化性和不確定性,船舶交通流變化具有非線性和非平穩(wěn)性特點[1],給船舶交通流的有效預(yù)測帶來了很大的困難。
傳統(tǒng)的船舶交通流預(yù)測主要以年為尺度預(yù)測船舶交通流量的變化,以支撐港口規(guī)劃布局。常用的交通流預(yù)測方法主要包括回歸分析法、灰色分析法、馬爾科夫法、模糊預(yù)測法、神經(jīng)網(wǎng)絡(luò)法、基于誤差絕對值之加權(quán)和最小預(yù)測組合法等,但是單一的預(yù)測方法具有明顯缺陷[2]。為了解決單一模型預(yù)測精度不高和穩(wěn)定性較差的問題,劉敬賢等[3]綜合運用多元線性回歸和灰色系統(tǒng)預(yù)測方法建立了一種改進(jìn)的船舶交通流變權(quán)組合預(yù)測模型,白響恩等[4]通過篩選影響交通流量變化的關(guān)鍵影響因素,提出一種結(jié)合粗糙集和支持向量回歸智能算法的交通流量預(yù)測模型,組合預(yù)測模型較好地提升了以年度為單位的船舶交通流預(yù)測精度。
隨著船舶交通流數(shù)據(jù)的積累和影響因素復(fù)雜作用機(jī)理的揭示,越來越多的學(xué)者開始關(guān)注船舶交通流變化的周期性、非線性和非穩(wěn)定性特征。針對船舶交通流序列的非線性和非平穩(wěn)性特性,肖進(jìn)麗和Li等[5-6]建立了集成集合經(jīng)驗?zāi)B(tài)分解和神經(jīng)網(wǎng)絡(luò)的船舶交通流預(yù)測模型,基于歷史數(shù)據(jù)實現(xiàn)了船舶交通流的月度預(yù)測;針對船舶交通流的周期性變化規(guī)律,Liu等[7]提出先運用低秩稀疏分析方法將船舶交通流序列數(shù)據(jù)處理為年×月的數(shù)據(jù)矩陣,再通過神經(jīng)網(wǎng)絡(luò)對船舶交通流進(jìn)行預(yù)測。數(shù)據(jù)分解的方法體現(xiàn)了對影響因素作用機(jī)理的考量,提升了交通流預(yù)測的精度,并實現(xiàn)了船舶交通流的月度預(yù)測。
為了更好地支撐船舶交通組織和擁擠度預(yù)測,部分學(xué)者開始探索更精細(xì)化的船舶交通流預(yù)測?;葑觿偟萚8]提出了一種基于模糊C均值聚類自適應(yīng)神經(jīng)模糊推理系統(tǒng)的船舶海上交通流預(yù)測模型,實現(xiàn)了以天為單位的船舶交通流預(yù)測;吳康等[9]將單斷面船舶交通流預(yù)測方法向多斷面進(jìn)行改進(jìn)和推廣,提出了基于狀態(tài)空間和卡爾曼濾波的多斷面交通流預(yù)測模型,實現(xiàn)了以小時為單位的船舶交通流預(yù)測;王小華等[10]基于福姜沙水道船舶交通流觀測結(jié)果,探究船舶交通流與潮汐特征之間的關(guān)系,為福姜沙水道船舶航行安全保障及航道疏浚施工方案提供參考。
但是,由于船舶交通流的影響因素既包括具有穩(wěn)定性的航道、錨地、泊位等要素,又包括具有周期性的自然環(huán)境要素,還包括具有突發(fā)性的事故、施工等要素。因此,每個時間段之間船舶交通流量數(shù)據(jù)會有很強(qiáng)的時序相關(guān)性、周期性和不穩(wěn)定性?,F(xiàn)有的船舶交通流預(yù)測模型較少能夠綜合考慮這些要素的影響,存在預(yù)測精度較低的缺陷。并且,由于水路交通存在交通數(shù)據(jù)量較小、船舶行為活動自由空間大等特點,航道和水道的船舶調(diào)度及交通組織管理常以小時為單位進(jìn)行。因此,本文針對時段船舶交通流量提出一種基于二維經(jīng)驗?zāi)J椒纸?Bidimensional Empirical Mode Decomposition, BEMD)和時序正則化矩陣分解(Temporal regularized matrix factorization, TRMF)的交通流預(yù)測模型。在原始船舶交通流量矩陣化的基礎(chǔ)上,利用BEMD對交通流量數(shù)據(jù)矩陣分解,運用引入時序正則化矩陣的TRMF構(gòu)建船舶交通流組合預(yù)測模型框架,實現(xiàn)時段船舶交通流預(yù)測。
二維經(jīng)驗?zāi)J椒纸?BEMD)[11]是一種能有效處理非平穩(wěn)和非線性序列數(shù)據(jù)的時空分析方法,可以將船舶交通流時序矩陣分解為二維固有模態(tài)函數(shù)(Bidimensional Intrinsic Mode Function, BIMF)分量和殘差分量。BIMF為高頻矩陣,對應(yīng)突發(fā)性的要素引起的船舶交通流量的不穩(wěn)定變化;殘差分量為低頻矩陣,對應(yīng)穩(wěn)定性和周期性的要素引起的船舶交通流量的變化。BEMD算法對二維船舶交通流時序矩陣篩分BIMF分量過程如下。
2) 分別對局部極大值點集和局部極小值點集進(jìn)行包絡(luò)擬合,得到二維上包絡(luò)eμ(x,y)和下包絡(luò)eλ(x,y);
3) 基于二維矩陣上包絡(luò)eμ(x,y)和下包絡(luò)eλ(x,y)計算包絡(luò)均值em(x,y);
(1)
4) 從原始二維矩陣中減去包絡(luò)均值;
(2)
其中,篩分約束條件SD為:
(3)
6) 計算殘余量
(4)
如果R1(x,y)中含有不少于兩個極值點,將其作為新的輸入矩陣返回步驟(1)繼續(xù)進(jìn)行分解,直到最后分解出來的殘余分量RL(x,y)中沒有極值點時,BEMD分解結(jié)束,原始矩陣M(x,y)可以表示為:
(5)
式中:Bq(x,y)為第q個BIMF;RL(x,y)為殘余分量。
時序正則化矩陣分解(TRMF)預(yù)測模型,在矩陣分解(Matrix Factorization,MF)方法[12]的基礎(chǔ)上引入時序正則項,支持?jǐn)?shù)據(jù)驅(qū)動的時間依賴性學(xué)習(xí),TRMF繼承了MF方法的計算復(fù)雜度較低等特性,可以很容易地處理大規(guī)模時間序列數(shù)據(jù)。TRMF根據(jù)BEMD算法分解出的高頻矩陣及低頻矩陣學(xué)習(xí)交通流的變化規(guī)律,實現(xiàn)船舶交通流的預(yù)測,具體過程如圖1,預(yù)測步驟描述如下。
圖1 基于TRMF的船舶交通流預(yù)測示意圖
1) 交通流時序矩陣Y∈RN×T可由維度特性矩陣W=[…,wi,…]T∈RN×r與時間特性矩陣X=[…,xt,…]∈Rr×T表示為:
Y≈WX
(6)
時間特性矩陣X∈Rr×T中列的關(guān)系為:
(7)
式中:I為滯后集,用于存儲時間特性矩陣X中列與列之間的關(guān)聯(lián)距離;θl為xt-l的時序系數(shù)向量,所有θl組合為列之間的時序系數(shù)矩陣Θ。
3) TRMF求解方法是通過交叉迭代時序系數(shù)矩陣Θ、維度特性矩陣W以及時間特性矩陣X使得公式(9)最小化的過程。
BEMD算法可將船舶交通流數(shù)據(jù)分解為反映突變因素影響下船舶交通流量不穩(wěn)定變化的高頻矩陣以及刻畫周期性要素引起的船舶交通流量穩(wěn)定變化的低頻矩陣,有效降低了船舶交通流非線性和非平穩(wěn)性對預(yù)測精度的影響,同時TRMF預(yù)測方法通過自學(xué)習(xí)習(xí)得船舶交通流時序變化規(guī)律,進(jìn)一步提升了船舶交通流的預(yù)測精度。
BEMD-TRMF船舶交通流組合預(yù)測模型框架如圖2。具體步驟如下:
(8)
λxRAR(X|Ι,Θ,η)+λθRθ(Θ)
(9)
(10)
(11)
1) 數(shù)據(jù)預(yù)處理:采集整理歷史船舶交通流數(shù)據(jù),將歷史船舶交通流數(shù)據(jù)處理為二維時間序列矩陣M(x,y)。
2) 利用BEMD算法將M(x,y)分解成n個二維固有模態(tài)分量BIMF和一個二維殘余分量RL,即:
M(x,y)=BIMF1+BIMF2+…+BIMFn+RL(x,y)
(12)
3) 針對分解出的各個BIMF和殘余分量RL,分別建立TRMF預(yù)測模型進(jìn)行學(xué)習(xí)與預(yù)測,得到各二維固有模態(tài)分量和殘余分量的預(yù)測值。
4) 最后將各二維固有模態(tài)分量和殘余分量的預(yù)測值進(jìn)行疊加,得到船舶交通流預(yù)測結(jié)果矩陣,如公式(13)??筛鶕?jù)需要,將預(yù)測結(jié)果矩陣轉(zhuǎn)化為時間序列預(yù)測結(jié)果,也可直接調(diào)用矩陣中對應(yīng)的時段預(yù)測值用于船舶交通組織管理。
F(x,y)=FBIMF1+FBIMF2+…+FBIMFn+FRL(x,y)
(13)
采集武漢長江大橋附近水域(如圖3)2017年6月AIS數(shù)據(jù),分別統(tǒng)計上、下行船舶交通流量。統(tǒng)計過程中,將1 d 24 h分成12個時間段,每隔2 h計算一次上行及下行通過武漢長江大橋的船舶數(shù)量,得到船舶交通流時間序列數(shù)據(jù)(如圖4)共720個。
圖3 基于AIS數(shù)據(jù)統(tǒng)計的武漢長江大橋上下行船舶軌跡
a) 上行船舶交通流時間序列
b) 下行船舶交通流時間序列
另外,論文采用的訓(xùn)練數(shù)據(jù)為2019年6月1號~29號的船舶交通流數(shù)據(jù),測試數(shù)據(jù)為同年6月30號的船舶交通流數(shù)據(jù),采用的數(shù)據(jù)為同一研究對象的同一數(shù)據(jù)樣本,即訓(xùn)練和測試數(shù)據(jù)總是來源于同一個樣本集,能夠保證模型取得穩(wěn)定的預(yù)測結(jié)果。
為驗證實驗數(shù)據(jù)具有非平穩(wěn)性,利用ADF(Augmented Dickey-Fuller)對每一天的上、下行實驗數(shù)據(jù)分別做非平穩(wěn)性檢驗(如表1),檢驗結(jié)果表明,上、下行數(shù)據(jù)t統(tǒng)計值的絕對值均大于顯著性水平1%、5%、10%的試驗臨界值(Test Critical Value),即實驗數(shù)據(jù)具有非平穩(wěn)性;隨后并將其處理為二維(d×2 h)交通流時序矩陣,運用BEMD算法進(jìn)行分解得到高頻矩陣和低頻矩陣(如圖5)。
表1 原始船舶交通流時序數(shù)據(jù)ADF檢驗
a) 武漢長江大橋上行水域船舶交通流矩陣分解圖
為說明BEMD-TRMF組合預(yù)測模型的預(yù)測精度和適用性,將其預(yù)測結(jié)果與GM(1,1)、ARIMA、BPNN、WNN、LSTM及TRMF預(yù)測模型的預(yù)測結(jié)果進(jìn)行比較。實驗結(jié)果如圖6~7。
運用平均相對誤差(MRE)和相對誤差標(biāo)準(zhǔn)差(SDRE)、均方根誤差(RMSE)和平均絕對百分差(MAPE)對各預(yù)測模型的計算精度進(jìn)行綜合評價。各模型預(yù)測誤差及對比如圖8~9及表2。
表2 各模型預(yù)測結(jié)果評價表
(14)
(15)
(16)
(17)
由預(yù)測數(shù)據(jù)的誤差對比可知,GM(1,1)和ARIMA的預(yù)測精度較差,平均預(yù)測誤差在10%以上,BPNN、WNN、LSTM預(yù)測模型降低了船舶交通流非線性特征對預(yù)測結(jié)果的影響,預(yù)測精度較好,平均預(yù)測誤差在5%~9%以上;單一TRMF預(yù)測模型學(xué)習(xí)了船舶交通流間的時序特性,預(yù)測精度進(jìn)一步提高,平均預(yù)測誤差在4%~5%;而本文提出的BEMD-TRMF組合預(yù)測模型,在TRMF模型進(jìn)行預(yù)測前利用BEMD算法對二維船舶交通流時序矩陣進(jìn)行處理,降低了船舶交通流非線性和非平穩(wěn)性對預(yù)測精度的影響,有效提升了預(yù)測精度,平均預(yù)測誤差在3%左右。
船舶交通流數(shù)據(jù)受航道中突發(fā)的碰撞、失控、火災(zāi)等應(yīng)急事故影響會產(chǎn)生波動而加大預(yù)測難度,為進(jìn)一步驗證文章預(yù)測模型在非平穩(wěn)和非線性序列數(shù)據(jù)中的預(yù)測精度,在船舶交通流數(shù)據(jù)中加入噪聲產(chǎn)生波動(如圖10)以模擬航道中發(fā)生應(yīng)急突發(fā)事件后船舶交通流的變化特征,并對每一天的上、下行實驗數(shù)據(jù)進(jìn)行非平穩(wěn)性檢驗(如表3),檢驗結(jié)果表明,上、下行數(shù)據(jù)t統(tǒng)計值的絕對值均大于顯著性水平1%、5%、10%的臨界值,波動實驗數(shù)據(jù)具有非平穩(wěn)性。
表3 波動船舶交通流時序數(shù)據(jù)ADF檢驗
a) 上行船舶交通流時間序列
對上述加入噪聲后一維船舶交通流數(shù)據(jù)進(jìn)行處理得到二維船舶交通流時序矩陣,分別利用單一TRMF預(yù)測模型和BEMD-TRMF組合預(yù)測模型對船舶交通流進(jìn)行預(yù)測,其預(yù)測精度評價如表4,表5。
表4 基于TRMF的波動數(shù)據(jù)預(yù)測結(jié)果評價表
表5 基于BEMD-TRMF的波動數(shù)據(jù)預(yù)測結(jié)果評價表
由波動數(shù)據(jù)與原始數(shù)據(jù)的預(yù)測誤差對比來看,BEMD-TRMF預(yù)測模型使用波動數(shù)據(jù)的預(yù)測精度要比使用原始數(shù)據(jù)的預(yù)測精度稍低一些,絕大多數(shù)情況下預(yù)測精度相差在1%以下;在波動數(shù)據(jù)預(yù)測精度方面,文章采用的BEMD-TRMF組合預(yù)測模型仍比使用原始數(shù)據(jù)的單一TRMF預(yù)測模型效果要好,多數(shù)情況下預(yù)測精度相差約為2%,由此可以證明BEMD將二維船舶交通流時序矩陣分解為高頻矩陣和低頻矩陣在降低數(shù)據(jù)非線性和非平穩(wěn)性影響方面是有效的和必要的,BEMD-TRMF預(yù)測模型在使用波動數(shù)據(jù)進(jìn)行預(yù)測時仍具有適用性,且預(yù)測精度較高。
針對船舶交通流的非線性和不穩(wěn)定性造成的船舶交通流預(yù)測精度不高的問題,本文提出了一種適用于水道的融合BEMD-TRMF模型的船舶交通流組合預(yù)測方法。模型利用BEMD算法將二維船舶交通流時序矩陣分解成若干高頻矩陣和低頻矩陣,有效處理了船舶交通流時序矩陣的非線性和非平穩(wěn)性特征;運用TRMF預(yù)測模型對分解的高頻矩陣和低頻矩陣進(jìn)行學(xué)習(xí)和預(yù)測,考慮了船舶交通流數(shù)據(jù)中時序關(guān)聯(lián)性。實驗表明,BEMD-TRMF預(yù)測模型在預(yù)測精度和穩(wěn)定性上要優(yōu)于GM(1,1)、ARIMA、BPNN、WNN、LSTM及TRMF預(yù)測模型,在因發(fā)生應(yīng)急突發(fā)事故而引起的波動船舶交通流數(shù)據(jù)預(yù)測方面也達(dá)到了較好的預(yù)測精度,能夠為緩解水道船舶擁擠度和優(yōu)化船舶交通組織等提供基礎(chǔ)支撐。