劉姍姍,馬社祥,孟 鑫,張啟超
(天津理工大學(xué) 電氣電子工程學(xué)院,天津 300384)
隨著海運和客運業(yè)的不斷發(fā)展,加強船舶安全管理和重點目標(biāo)監(jiān)測更加迫切。在交通密集、狀況復(fù)雜的很多沿海和港口的水域,海上交通事故預(yù)警的精確性和有效性也尤為重要。提前掌握船舶的走向信息能有效地減少船舶觸礁和碰撞等海上交通事故的發(fā)生。船舶航行軌跡分析可以獲得海上航道的有用信息和船舶的行為模式。該技術(shù)還可為海上交通管制、目標(biāo)監(jiān)測和海上安全預(yù)警提供新的理論依據(jù)。文獻[1]根據(jù)建立的系統(tǒng)方程和測量方程,運用卡爾曼濾波算法估計船舶的未來航行軌跡。文獻[2]針對欠驅(qū)動水面艦艇,利用無味卡爾曼濾波器(UKF)預(yù)測動態(tài)目標(biāo)軌跡位置。文獻[3]將擴展卡爾曼濾波算法和競爭神經(jīng)網(wǎng)絡(luò)相結(jié)合,利用EKF估計船舶航行的狀態(tài),再運用NN預(yù)測船舶的航行狀態(tài)。文獻[4]在交互式多模型算法的解算過程中,引用期望最大值算法來估計船舶分別在勻速運動和勻轉(zhuǎn)彎運動時的位置。文獻[5]根據(jù)船舶的位置信息,利用多項式卡爾曼算法預(yù)測船舶的未來走向。文獻[6]運用貝葉斯網(wǎng)絡(luò)通過概率推理來預(yù)測船舶行為。文獻[7]利用高斯過程(gaussian process regression,GPR)對船舶航行軌跡進行回歸預(yù)測。上述預(yù)測方法均為需要構(gòu)建船舶運動數(shù)學(xué)方程的線性預(yù)測方法。因為有很多外界環(huán)境(例如天氣、風(fēng)速等因素)對船舶運動有較大的影響,隨機和多樣的干擾使得實時準(zhǔn)確的運動數(shù)學(xué)方程很難構(gòu)建,大多只適用于理想狀態(tài)。并且船舶自動識別系統(tǒng)提供的船舶軌跡信息一般是非線性的。文獻[8]利用BP(back propagation)神經(jīng)網(wǎng)絡(luò)對船舶航跡進行預(yù)測,根據(jù)船舶的方向和行駛速度特征來預(yù)測船舶的經(jīng)度差和緯度差,進而預(yù)測船舶航跡。文獻[9]設(shè)計基于AIS信息和三層BP神經(jīng)網(wǎng)絡(luò)模型來預(yù)測船舶航跡,根據(jù)船舶過去和當(dāng)前的航行狀態(tài)特征來預(yù)測船舶未來的航行狀態(tài)。上述均使用BP神經(jīng)網(wǎng)絡(luò)預(yù)測船舶航跡。雖然BP神經(jīng)網(wǎng)絡(luò)可以解決復(fù)雜的非線性問題,但是其學(xué)習(xí)采用梯度下降算法,存在梯度消失、收斂速度慢等問題。文獻[10]利用長短期記憶(long short term memory,LSTM)預(yù)測模型,輸入船舶的過去軌跡特征和當(dāng)前軌跡特征,輸出船舶的未來軌跡特征來訓(xùn)練網(wǎng)絡(luò)達到期望的輸入輸出擬合關(guān)系,實現(xiàn)船舶軌跡預(yù)測。對比BP神經(jīng)網(wǎng)絡(luò),LSTM網(wǎng)絡(luò)具有對過去信息保存記憶的能力,其船舶航行軌跡預(yù)測效果更好。
為了更加準(zhǔn)確有效地預(yù)測船舶的航行軌跡,本文提出了一種基于卷積神經(jīng)網(wǎng)絡(luò)(CNN)和雙向長短期記憶網(wǎng)絡(luò)(Bi-LSTM)的船舶航跡預(yù)測模型。模型的高性能表現(xiàn)在CNN能捕獲短期特征關(guān)系和LSTM能捕獲長期時間特征關(guān)系。首先利用CNN有效地提取數(shù)據(jù)之間的潛在關(guān)系并形成特征向量,以時序序列方式構(gòu)造特征向量作為輸入數(shù)據(jù),再利用Bi-LSTM網(wǎng)絡(luò)進行船舶航跡預(yù)測。與僅使用LSTM網(wǎng)絡(luò)相比,因為CNN-Bi-LSTM網(wǎng)絡(luò)中使用了CNN模型提取時序數(shù)據(jù)潛在特征,所以Bi-LSTM網(wǎng)絡(luò)輸入數(shù)據(jù)的有效性得到很大提高,并且前向和反向的2個長短時記憶網(wǎng)絡(luò)綜合考慮了過去信息和未來信息的影響,提高了網(wǎng)絡(luò)預(yù)測的準(zhǔn)確性。
船舶的航行狀態(tài)特征主要包括船舶的經(jīng)度、緯度、速度、航首向和對地航向等[11]。其中經(jīng)度和緯度體現(xiàn)了船舶的位置信息,速度體現(xiàn)了船舶航行的快慢程度,航首向和對地航向體現(xiàn)了船舶航行行為的方向特征。要區(qū)分目標(biāo)船舶和其他船舶,為保證預(yù)測數(shù)據(jù)的準(zhǔn)確性,因為每條船舶都有專屬的海上移動業(yè)務(wù)識別碼(maritime mobile service identity,MMSI),所以可以用MMSI來區(qū)分不同船舶[12]。因此,船舶的航行行為模型可以表示為:
式中:λ和φ分別代表船舶的經(jīng)度、緯度;V代表船舶的航行速度;C1和C2分別代表船舶的航首向、對地航向。
本文采用的MMSI為414228000的船舶,表1是船舶AIS信息的部分?jǐn)?shù)據(jù)。
卷積神經(jīng)網(wǎng)絡(luò)(CNN)是前饋神經(jīng)網(wǎng)絡(luò)的一種變體,具備精準(zhǔn)有效的識別能力,CNN主要包括特征提取和分類2個部分。一個或多個卷積層和池化層組成特征提取部分,通過卷積層中卷積核的卷積計算和池化層的降采樣處理來提取數(shù)據(jù)的潛在特征。CNN還具有權(quán)值共享和局部連接的特征,可以通過卷積層和池化層的交替使用從原始數(shù)據(jù)中得到有效表征,自動提取數(shù)據(jù)的局部特征[13]。本文利用CNN的特點來提取時序數(shù)據(jù)的潛在特征,提高輸入數(shù)據(jù)的有效性。
2.1.1 卷積層
卷積層通過卷積核(convolutional kernel,CK)卷積處理輸入數(shù)據(jù),輸出卷積后提取的數(shù)據(jù)特征。因為同一卷積核操作中的局部連接、空間安排和參數(shù)共享特性,在參數(shù)較少情況下卷積層可以提取較豐富的特征[14]。
卷積操作的公式為:
式中:i表示第i個卷積核;g(i)表示第i個特征圖;a表示輸入數(shù)據(jù);b表示卷積核的偏置;x、y、z表示輸入數(shù)據(jù)的維度。
卷積操作后的非線性變換通過激活函數(shù)來實現(xiàn),本文采用修正線性單元(rectified linear unit,ReLU)作為激活函數(shù)。
本文使用一維卷積神經(jīng)網(wǎng)絡(luò)(1-D CNN)來提取數(shù)據(jù)特征。1-D CNN是一種特殊的CNN,常應(yīng)用于處理一維數(shù)據(jù)[15]。其卷積計算公式為:
因為卷積層的隱藏單元僅與輸入層的一部分連接,圖1顯示了一維卷積處理的示例,其中c1~c4是特征向量,x1~x6是輸入。一維卷積的單個隱藏單元僅連接到輸入層的3個輸入。這種連接大大減少了參數(shù)的數(shù)量,并加速了神經(jīng)網(wǎng)絡(luò)的訓(xùn)練過程。
在圖1中,c1~c4是通過卷積計算的,其中c1是通過與x1、x2和x3卷積計算的,并且c1與x1、x2、x3之間的連接都具有不同的權(quán)重。在計算c2時,這3個權(quán)重分別對應(yīng)于x2、x3和x4。
卷積層的參數(shù)主要包括卷積核的大小、步幅和填充,它們確定輸出特征向量的大小。卷積核的大小是用于卷積計算的變量數(shù)。在圖1中,c1是通過x1、x2和x3進行卷積計算得到的,因此在上述一維卷積中卷積核的大小為3。步幅是卷積核在進行卷積計算時需要移動的距離。在圖1中,c1由x1、x2和x3計算。當(dāng)卷積核移動一步時,將通過x2、x3和x4計算c2。填充用于抵消由卷積計算導(dǎo)致的特征向量大小的減小。如圖1所示,輸入層有6個變量,因此計算出的特征向量的大小為4。如果將輸入添加到輸入層的每一側(cè),則特征向量的大小將為6。輸出特征向量的計算公式為:
式中:wout是輸出特征向量的大??;win是輸入特征向量的大?。籶adding是輸入兩端填充的元素數(shù);F是卷積核的大小。
1-D CNN卷積輸出為一維向量,當(dāng)與全連接層連接時將各個卷積核的輸出拼接成一個完整的一維向量,直接與全連接層連接。
2.1.2 池化層
雖然卷積層縮小了數(shù)據(jù)矩陣的規(guī)模,但在從輸入層提取附加空間信息時,卷積層的輸出矩陣大小沒有明顯下降。為了進一步減小數(shù)據(jù)矩陣大小,CNN網(wǎng)絡(luò)在卷積層之后添加池化層,以優(yōu)化網(wǎng)絡(luò)結(jié)構(gòu)。池化層利用池化核對輸入的特征向量進行降采樣(down sampling),同時也更加突出了提取的特征。最大池化處理方式、平均池化處理方式分別表示為:
式中:al(i,t)表示第l層中第i個特征圖的第t個神經(jīng)元;w表示卷積核的寬度;j表示第j個池化核。
參數(shù)共享可以大大減少參數(shù)數(shù)量。在同一過濾器中,所有特征向量的計算,共享相同的權(quán)重集合,n個過濾器有n組權(quán)重。參數(shù)共享和稀疏連接大大減少了自由變量的數(shù)量,從而使卷積神經(jīng)網(wǎng)絡(luò)能夠以較少的計算資源提取特征。由一維卷積層計算出的特征向量在一維池化層中被下采樣。池化層選擇并過濾卷積層輸出的特征圖。廣泛采用的池化方法是“最大池化”和“平均池化”,池化方法的參數(shù)是池大小、步幅和填充。池大小是用于池計算的數(shù)據(jù)數(shù)量,池層中的步幅和填充與卷積層相同。圖2顯示了一維池化過程的示例。在該圖中,特征向量由包括c1~c4和2個pd共6個元素組成,并且一維合并p1、p2和p3的元素是由這6個元素計算的。
在圖2中,c1、c2、c3和c4是上層計算的特征向量,pd是填充元素,p1、p2和p3是池化層的輸出,其中步幅為2。在圖2中,p1由池化pd和c1計算得出。最大池或平均池可以用作池化方法。最大池化方法是從pd和c1中選擇最大的一個作為p1的值。平均池化方法是將pd和c1的平均值作為p1的值,并且p2和p3值的計算方法相同。通過池化方法,池化層獲得其輸出p1、p2、p3,經(jīng)過一維卷積層和一維池化層后,要素將輸入到雙向LSTM神經(jīng)網(wǎng)絡(luò)中以進一步提取。
循環(huán)神經(jīng)網(wǎng)絡(luò)(recurrent neural network,RNN)是一種輸入為序列數(shù)據(jù),在序列傳播方向進行遞歸且所有節(jié)點按鏈?zhǔn)竭B接的遞歸神經(jīng)網(wǎng)絡(luò)(recursive neural network)。RNN具有記憶性和參數(shù)共享的特點,因此能以很高的效率對序列的非線性特征進行學(xué)習(xí)。
雖然RNN能有效地處理非線性時間序列問題,但是它也存在一些問題[16]:對于延遲過長的時間序列,RNN存在梯度爆炸和消失的問題;需提前明確延時窗口的長度進而實現(xiàn)RNN模型訓(xùn)練,但是獲取此參數(shù)的最優(yōu)值在實際應(yīng)用中很難實現(xiàn)。LSTM是一種傳統(tǒng)循環(huán)神經(jīng)網(wǎng)絡(luò)的進化網(wǎng)絡(luò),可以改善因回歸神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)過程中反向船舶誤差導(dǎo)致的長時間滯后引起的梯度爆炸和消失問題,捕獲長距離依賴性并從不同長度的序列中有效地學(xué)習(xí)。LSTM模型中LSTM存儲器單元是傳統(tǒng)RNN中隱藏層的循環(huán)神經(jīng)元的進化,單元可以指示網(wǎng)絡(luò)何時忘記歷史信息以及何時通過新的輸入信息更新存儲單元[17]。每個LSTM單元都配有3個控制信息流的門,每個門均包含一個Sigmoid層和一個逐點乘法運算,并可以控制LSTM信息流以避免梯度爆炸和消失,控制信息流的門為:遺忘門決定應(yīng)該記住或遺忘哪些信息;輸入門決定哪些信息比較重要以便記憶;輸出門決定將要傳遞的信息。3個門的值設(shè)置在0和1之間。LSTM模型的細胞結(jié)構(gòu)如圖3所示,其中z為輸入模塊。前向計算公式為:
式中:i、f、c、o分別表示輸入門、遺忘門、細胞狀態(tài)、輸出門;b表示對應(yīng)的偏置項;W表示層與各個門之間的權(quán)值矩陣;σ為sigmoid激活函數(shù);tanh為雙曲正切激活函數(shù)。
因為單向LSTM下一刻預(yù)測輸出是根據(jù)前面多個時刻的輸入來共同影響的,并且在提取數(shù)據(jù)特征時可能導(dǎo)致丟失有用信息。而很多情況下預(yù)測同時受前面和后面多個時刻輸入的共同影響,這樣會獲得更加精確的預(yù)測結(jié)果。本文研究使用Bi-LSTM捕獲2個方向之間的數(shù)據(jù)特征[18]。因為需要能關(guān)聯(lián)未來的數(shù)據(jù),而單向循環(huán)神經(jīng)網(wǎng)絡(luò)屬于關(guān)聯(lián)歷史數(shù)據(jù),所以對未來數(shù)據(jù)提出了反向循環(huán)神經(jīng)網(wǎng)絡(luò),2個方向的網(wǎng)絡(luò)結(jié)合到一起就能關(guān)聯(lián)歷史和未來。2個網(wǎng)絡(luò),前向網(wǎng)絡(luò)正向計算隱向量,后向網(wǎng)絡(luò)反向計算隱向量[19],本文將2個隱向量按式(12)進行結(jié)合。圖3描述了一個展開的雙向LSTM,圖4為Bi-LSTM模型。在前向網(wǎng)絡(luò)層中隨順序時刻從前往后計算一遍,得到向前隱藏層在每個時刻的輸出值。在后向網(wǎng)絡(luò)層中隨倒序時刻從后往前計算一遍,得到向后隱藏層在每個時刻的輸出值。最后輸出前向網(wǎng)絡(luò)層和后向網(wǎng)絡(luò)層在每個時刻的綜合輸出。
CNN有助于學(xué)習(xí)如何從數(shù)據(jù)中提取特征。但是它需要多卷積層來捕獲長期依賴關(guān)系,隨著神經(jīng)網(wǎng)絡(luò)中長度輸入序列的增加,捕獲依賴關(guān)系會變差。而Bi-LSTM模型能夠捕獲序列之間的長期依賴性,因此CNN與Bi-LSTM模型可以互補,使預(yù)測效果更好。CNN-Bi-LSTM的船舶航跡預(yù)測方法是由CNN和Bi-LSTM的串聯(lián)連接組成。CNNBi-LSTM可以提取用于船舶航跡預(yù)測的多個船舶航行的復(fù)雜特征,并可以存儲復(fù)雜的不規(guī)則趨勢。首先CNN-Bi-LSTM的底層是由CNN組成,CNN層可以接收表征船舶航行軌跡的各種變量,例如經(jīng)度、緯度、速度、航向。CNN包含一個接受變量作為輸入的輸入層,一個將特征提取到Bi-LSTM的輸出層以及卷積層,ReLU層和池化功能。卷積層將卷積運算應(yīng)用于傳入的序列,并將結(jié)果傳遞給下一層。卷積操作模擬單個神經(jīng)元對視覺刺激的響應(yīng)。每個卷積神經(jīng)元僅處理感受野(receptive field)的數(shù)據(jù),卷積運算可以減少參數(shù)數(shù)量。Bi-LSTM是CNN-Bi-LSTM的頂層,存儲有關(guān)通過CNN提取的表征船舶航行狀態(tài)的重要特征信息。Bi-LSTM通過合并可更新先前隱藏狀態(tài)的內(nèi)存單元來保留數(shù)據(jù)間的長期依賴關(guān)系。
CNN-Bi-LSTM回歸問題是船舶航跡預(yù)測的實質(zhì)。因為一般船舶在一段時間內(nèi)的航行狀態(tài)是規(guī)律的,過去時刻和當(dāng)前時刻的航行狀態(tài)對下一時刻的航行狀態(tài)有很大的影響,所以輸入船舶的過去時刻和當(dāng)前時刻的船舶航行信息,輸出未來軌跡數(shù)據(jù)中的經(jīng)度和緯度,通過船舶的真實航行軌跡樣本訓(xùn)練網(wǎng)絡(luò),以此使預(yù)測模型的輸入輸出形成相應(yīng)的映射關(guān)系,進而實現(xiàn)對船舶未來軌跡的預(yù)測。對于單艘船舶,其在t時刻的行為G(t)可表示為:
式中,λt、φt、vt、c1t、c2t分別表示船舶的經(jīng)度,緯度,速度,航首向和對地航向等5個行為特征。
本文輸入G(t-2),G(t-1)和G(t),輸出G(t+1)中的經(jīng)度和緯度來訓(xùn)練混合網(wǎng)絡(luò)。由此,船舶航跡預(yù)測模型的表達式為:
式中,函數(shù)f為激活函數(shù)。
在CNN-Bi-LSTM網(wǎng)絡(luò)中,采用修正線性單元(rectified linear unit,ReLU)作為神經(jīng)元的激活函數(shù)。函數(shù)表達式為:
從式(16)中可以看出,Relu函數(shù)抑制了非正區(qū)域那一側(cè),這一特征會使預(yù)測模型具備稀疏激活能力,使訓(xùn)練樣本的擬合度更高。對于非線性函數(shù),因為Relu在非負區(qū)域的斜率是固定不變的,所以避免了出現(xiàn)梯度消失問題,也使得模型具有較為穩(wěn)定的收斂速度。
未經(jīng)任何處理的原始數(shù)據(jù)之間的數(shù)量級一般是不相同的,而數(shù)量級相差太大的數(shù)據(jù)會導(dǎo)致網(wǎng)絡(luò)預(yù)測誤差,因此歸一化處理輸入數(shù)據(jù),處理后的數(shù)據(jù)均限制在0到1之間[20]。本文采用離差標(biāo)準(zhǔn)化方法(minmax normalization)歸一化訓(xùn)練數(shù)據(jù),即:
式中:max代表訓(xùn)練樣本中的最大值;min代表訓(xùn)練樣本中的最小值;X代表原始數(shù)據(jù);X′代表歸一化后的數(shù)據(jù)。
船舶航跡預(yù)測的主要步驟如下:
步驟1歸一化處理初始數(shù)據(jù),得到相同數(shù)量級的輸入數(shù)據(jù);
步驟2將輸入數(shù)據(jù)輸入一維卷積神經(jīng)網(wǎng)絡(luò),經(jīng)過卷積層中卷積核的卷積計算獲得數(shù)據(jù)特征;
步驟3將卷積層輸出的特征數(shù)據(jù)輸入池化層并進行平均池化處理,縮小數(shù)據(jù)矩陣大小。
步驟4卷積神經(jīng)網(wǎng)絡(luò)的輸出作為Bi-LSTM的有效輸入數(shù)據(jù),通過的前向網(wǎng)絡(luò)和后向網(wǎng)絡(luò)訓(xùn)練有效樣本數(shù)據(jù),有效地擬合輸入輸出數(shù)據(jù),獲得在目標(biāo)誤差內(nèi)的預(yù)測輸出值。
步驟5依次經(jīng)過3個全連接層,綜合前面提取到的預(yù)測值特征作為最終輸出。
船舶航跡預(yù)測模型如圖5所示。
本文采用均方誤差(mean squared error,MSE)和平均絕對誤差(mean absolute error,MAE)來評估船舶航跡預(yù)測模型。均方誤差是指預(yù)測值(test)與真實值(real)之差的平方和的平均值,MSE的數(shù)學(xué)表達式如式(18)所示。平均絕對誤差是指預(yù)測值與真實值的絕對誤差的平均值,MAE的數(shù)學(xué)表達式如式(19)所示。2個誤差指標(biāo)本質(zhì)都是說明預(yù)測值與真實值的相差程度,所以它們的值越小,說明預(yù)測值越接近真實值,即預(yù)測效果就越好[21]。
式中,N表示樣本的數(shù)量。
實驗所采用的編程語言為Python3.5,實驗平臺配備雙路TITAN Xp GPU,Intel(R)Core(TM)i7-7800X CPU,3.5 GHz×12,32 GB內(nèi)存,Ubuntu16.04操作系統(tǒng)。本文實驗選取海上移動業(yè)務(wù)識別碼(MMSI)為414 228 000的船舶AIS信息作為樣本數(shù)據(jù),構(gòu)建CNN-Bi-LSTM模型,進行船舶航跡預(yù)測。隨機選取了該船舶連續(xù)的4 356組航行數(shù)據(jù),其中前2 955組數(shù)據(jù)用作網(wǎng)絡(luò)訓(xùn)練,后797組數(shù)據(jù)用作網(wǎng)絡(luò)測試。因為每條數(shù)據(jù)都有一個真實的標(biāo)簽,會得到相應(yīng)的預(yù)測結(jié)果,所以使用MAE和MSE進行性能評估。
歸一化處理訓(xùn)練數(shù)據(jù),輸入連續(xù)3個時刻的船舶數(shù)據(jù)G(t-2),G(t-1),G(t),輸出下一時刻的船舶數(shù)據(jù)中的經(jīng)度和緯度,以此來訓(xùn)練CNN-Bi-LSTM模型。其中1D CNN的卷積核設(shè)為2;卷積在數(shù)據(jù)每一維的步長設(shè)為1;采用相同填充的方法進行卷積,即超出邊界的部分使用補充0的方法來使得輸入輸出的尺寸相同;并且將矩陣區(qū)域的均值作為結(jié)果。Bi-LSTM中2個LSTM層的神經(jīng)元個數(shù)均為80;全連接層的神經(jīng)元個數(shù)分別設(shè)為100、50、10;采用relu激活函數(shù)。得到的預(yù)測軌跡和真實軌跡對比如圖6所示。
通過對比CNN-Bi-LSTM,LSTM和BP預(yù)測模型,來驗證所提混合模型的有效性。其中,LSTM模型中,輸入G(t-2),G(t-1),G(t),輸出G(t+1)中的經(jīng)度和緯度;LSTM層神經(jīng)元個數(shù)為80;全連接層神經(jīng)元個數(shù)分別設(shè)為100,50和10;采用Relu函數(shù)為激活函數(shù)。其中BP神經(jīng)網(wǎng)絡(luò)也是同理。為了對比效果,3個預(yù)測模型設(shè)置相同的超參數(shù),如表2所示。
表2 超參數(shù)
CNN-Bi-LSTM模型與LSTM模型軌跡預(yù)測如圖7所示;CNN-Bi-LSTM與LSTM經(jīng)度誤差曲線如圖8所示;CNN-Bi-LSTM與LSTM緯度誤差曲線如圖9所示;CNN-Bi-LSTM模型與BP軌跡預(yù)測曲線如圖10所示;CNN-Bi-LSTM與BP經(jīng)度預(yù)測誤差曲線如圖11所示;CNN-Bi-LSTM與BP緯度誤差曲線如圖12所示。均方誤差對比如表3所示。
表3 預(yù)測模型誤差分析結(jié)果
采用十折交叉驗證的方法對3種模型的性能進行評估。十折交叉驗證方法將數(shù)據(jù)集分為10份,并依次將其中的9份作為訓(xùn)練集、1份作為測試集進行10次實驗。各模型的十折交叉驗證準(zhǔn)確性平均值如表4所示。
表4 預(yù)測模型十折交叉驗證準(zhǔn)確性值
通過CNN-Bi-LSTM預(yù)測模型與LSTM模型和BP模型的船舶軌跡,經(jīng)緯度誤差曲線以及均方誤差平均絕對誤差曲線和預(yù)測模型十折交叉驗證準(zhǔn)確值均值曲線,可以看出CNN-Bi-LSTM模型的船舶航跡預(yù)測效果比LSTM和BP預(yù)測模型好。
通過深入研究船舶AIS數(shù)據(jù)反映出的船舶航行狀態(tài)特征,進而構(gòu)建船舶航行軌跡預(yù)測模型。結(jié)合CNN的局部特征學(xué)習(xí)能力和Bi-LSTM學(xué)習(xí)歷史和未來的上下文功能能力,提出利用CNN-Bi-LSTM網(wǎng)絡(luò)根據(jù)船舶AIS數(shù)據(jù)預(yù)測船舶航跡的方法。將目標(biāo)船舶的上千條航行數(shù)據(jù)作為訓(xùn)練樣本訓(xùn)練所提出的混合神經(jīng)網(wǎng)絡(luò),利用訓(xùn)練好的CNNBi-LSTM預(yù)測模型預(yù)測后面時刻的船舶軌跡。通過對比分析預(yù)測值與真實航行數(shù)據(jù)的誤差,可以證明CNN-Bi-LSTM模型對船舶軌跡的預(yù)測精度高于傳統(tǒng)的LSTM和BP預(yù)測模型。
在未來研究中應(yīng)該考慮在充足數(shù)據(jù)前提下不同時間間隔對船舶航行軌跡的影響。所提出的混合深度學(xué)習(xí)網(wǎng)絡(luò)的預(yù)測精確性還有待提高,接下來將利用一些優(yōu)化算法進一步優(yōu)化Bi-LSTM模型的參數(shù),以提高船舶航跡預(yù)測值的預(yù)測精度。