楊勝龍, 史慧敏, 張勝茂, 張 涵, 費(fèi)英杰, 王 斐, 金衛(wèi)國, 王國來, 樊 偉
基于BiLSTM模型的遠(yuǎn)洋漁船類型識別研究
楊勝龍1, 2, 史慧敏1, 3, 張勝茂1, 張 涵4, 費(fèi)英杰4, 王 斐1, 金衛(wèi)國5, 王國來5, 樊 偉1, 2
(1.中國水產(chǎn)科學(xué)研究院 東海水產(chǎn)研究所, 農(nóng)業(yè)農(nóng)村部遠(yuǎn)洋與極地漁業(yè)創(chuàng)新重點(diǎn)實(shí)驗(yàn)室, 上海 200090; 2.中國水產(chǎn)科學(xué)研究院 漁業(yè)資源與遙感信息技術(shù)重點(diǎn)開放實(shí)驗(yàn)室, 上海 200090; 3.上海海洋大學(xué) 信息學(xué)院, 上海 201306; 4.上海理工大學(xué) 理學(xué)院, 上海 200093; 5.上海開創(chuàng)遠(yuǎn)洋漁業(yè)有限公司, 上海 200082)
船舶自動識別系統(tǒng)(Automatic identification system, AIS)為漁業(yè)資源和漁船捕撈活動管理和研究提供了可能。明確船舶作業(yè)類型是開展AIS信息漁業(yè)研究應(yīng)用前提, 為漁業(yè)研究和管理提供漁船捕撈類型基礎(chǔ)數(shù)據(jù)支撐, 保障漁船作業(yè)安全和監(jiān)督非法捕撈漁業(yè)活動, 作者通過搜集整理3 000多艘已知類型船舶信息, 從空間、時間和行為等多方面挖掘17種船舶特征參數(shù), 采用三層雙向長短期記憶網(wǎng)絡(luò)(Bidirectional long short-term memory, BiLSTM)方法, 分別構(gòu)建漁船/非漁船類別識別模型和不同漁船類型識別模型。模型結(jié)果表明, 漁船/非漁船的BiLSTM模型的訓(xùn)練數(shù)據(jù)集分類平均準(zhǔn)確率為99.6%, 平均精確率為99.8%; 驗(yàn)證數(shù)據(jù)集分類平均準(zhǔn)確率為93.6%, 平均精確率為95.6%。漁船多分類模型訓(xùn)練數(shù)據(jù)集分類平均準(zhǔn)確率為99.0%, 平均精確率為99.3%; 驗(yàn)證數(shù)據(jù)集分類平均準(zhǔn)確率是97.0%, 平均精確率是97.6%。作者構(gòu)建的漁船/非漁船類別識別模型和漁船類別識別模型訓(xùn)練和驗(yàn)證精度都較高, 模型具有較好的泛化能力, 可用于主要捕撈類型漁船識別分類。
漁船類別識別; 船舶自動識別系統(tǒng); 雙向長短期記憶網(wǎng)絡(luò)
過度捕撈是漁業(yè)資源可持續(xù)利用的巨大挑戰(zhàn), 非法、不報告和不管制捕撈(Illegal, unreported and unregulated, IUU)被視為對海洋生態(tài)系統(tǒng)健康的主要威脅之一。IUU[1-3]每年造成的損失約為100億~235億美元, 相當(dāng)于1 100萬~2 600萬t漁獲損失, 但在浩瀚大海中監(jiān)督和制止這些非法活動非常困難。最近的研究表明, 船舶自動識別系統(tǒng)(Automatic identification system, AIS)信息可用于監(jiān)測漁船捕撈活動。AIS的初衷是保障船舶航行安全性[4], 但AIS提供漁船實(shí)時位置、航向和速度等信息, 為漁業(yè)資源研究提供了新的時空高精度數(shù)據(jù)[4-5], 并已成功地用于漁船捕撈活動的多尺度時空分析[5-10]。漁業(yè)資源分析一般依據(jù)某種捕撈類型或者魚種開展, 因此基于AIS的漁業(yè)分析也是依據(jù)具體的漁船捕撈作業(yè)類型開展。AIS數(shù)據(jù)不包含船舶類型信息, 現(xiàn)有文獻(xiàn)均按明確的漁具類型搜集AIS信息開展相關(guān)研究[8-10]。然在實(shí)踐中還有很多捕撈類型未知的漁船, 因此, 有必要建立基于AIS信息的船舶類型識別模型, 以識別未知捕撈類型的漁船, 可為漁業(yè)研究和管理提供基礎(chǔ)數(shù)據(jù)庫支撐。此外漁船需依據(jù)特定的捕撈許可證開展特定的捕撈作業(yè)活動, 識別特定的漁船軌跡信息(捕魚活動或漁具類型)對于監(jiān)視非法捕魚活動及漁業(yè)安全生產(chǎn)也很有幫助。
速度和航向是區(qū)別船舶行為的重要變量, 常被用于船舶分類。鄭巧玲等[11]基于速度和航向時間序列數(shù)據(jù), 采用BP方法構(gòu)建了中國近海3類小型漁船類型識別模型。PARK[12]對速度和航向時間序列進(jìn)行分組編碼, 采用圖像識別方法構(gòu)建了韓國半島海域6種近海漁船類別識別模型。速度和航向是描述漁船捕撈行為的重要特征參數(shù), 但漁船的空間地理信息也是漁船捕撈行為的重要特征。MARZUKI等[13]挖掘單元區(qū)域內(nèi)漁船航向、速度、位置和時間特征, 采用隨機(jī)森林和支持向量機(jī)算法對船舶進(jìn)行分類, 該算法可以有效識別4個類別的漁船, 但是對噪聲敏感, 容易產(chǎn)生過擬合的問題。HUANG等[14]按照不同的速度段提取了時間、空間位置和速度等23個特征參數(shù), 采用XGBoost方法建立了中國近海9種漁船類別識別模型。上述文獻(xiàn)僅對近海區(qū)域性漁船類型識別, 但在遠(yuǎn)洋中不能保證所有非漁船和漁船有相似時空特征。例如延繩釣為周期性作業(yè), 每條漁船每天下網(wǎng)的時間段并不相同, 而貨船和運(yùn)輸船在很長時間內(nèi)行為與其相似。KROODSMA等[6]基于AIS數(shù)據(jù)挖掘連續(xù)一段時間內(nèi)漁船空間行為的12種特征參數(shù), 對全球6類漁船和6類非漁船構(gòu)建了卷積神經(jīng)網(wǎng)絡(luò)深度學(xué)習(xí)算法, 證實(shí)了深度學(xué)習(xí)在船舶分類中有良好應(yīng)用。
船舶航跡具有明顯的時間平滑性, 下一時刻的位置狀態(tài)由歷史時刻的位置滑行而來[15]。船舶的位置、速度和航向等信息是連續(xù)的。船舶行為特征是通過一定時間內(nèi)船舶的位置、速度和航向等信息組成。遠(yuǎn)洋捕撈4種主要類型漁船, 魷魚釣船在晚上靠燈光吸引魷魚并釣獲, 漁船處于漂流狀態(tài); 拖網(wǎng)漁船放網(wǎng)后, 以2.5~5.5節(jié)航速航行拖動漁網(wǎng)捕獲, 作業(yè)一般持續(xù)2~3 h[9]; 延繩釣船快速航行布放釣鉤后再回收釣鉤捕獲金槍魚, 作業(yè)時間長、跨度大、空間軌跡變化大。金槍魚圍網(wǎng)船快速航行尋找魚群, 發(fā)現(xiàn)魚群快速下網(wǎng)包圍, 在原地進(jìn)行捕撈[9]。漁船的空間行為具有時間連續(xù)性, 因此有必要考慮時間維度。長短期記憶網(wǎng)絡(luò)(Long short-term memory, LSTM)和雙向長短期記憶網(wǎng)絡(luò)(Bidirectional long short-term memory, BiLSTM)作為一種經(jīng)典的深度學(xué)習(xí)算法, 能夠較好地刻畫船舶軌跡隨時間變化發(fā)展規(guī)律[16-17]。目前LSTM和BiLSTM已成功應(yīng)用于語音識別、翻譯、時間序列預(yù)測等領(lǐng)域[18-19]。船舶前后兩個軌跡點(diǎn)的信息是相互關(guān)聯(lián)的, BiLSTM 能考慮兩個方向的歷史信息[17], 因此本文提出采用BiLSTM方法構(gòu)建船舶分類模型。作者首先搜集有明確表示的船舶類型信息, 依據(jù)MMSI號提取漁船軌跡時間序列數(shù)據(jù); 隨后對漁船軌跡數(shù)據(jù)進(jìn)行預(yù)處理、數(shù)據(jù)特征挖掘和船舶類別標(biāo)識。漁業(yè)管理和漁業(yè)科研部門關(guān)注的是漁船, 本文首先構(gòu)建漁船/非漁船二分類BiLSTM模型, 再構(gòu)建漁船多分類BiLSTM模型, 最后對構(gòu)建的兩種模型進(jìn)行評價。
本文所指漁船是僅利用漁具開展捕撈活動的商業(yè)捕撈船舶, 根據(jù)該定義將遠(yuǎn)洋船舶分成漁船和非漁船。按捕撈方式和對象, 漁船大致可分為拖網(wǎng)、圍網(wǎng)、流刺網(wǎng)、魷釣、垂釣和延繩釣等類型[6]。對每種捕撈按作業(yè)方式又可細(xì)分, 如圍網(wǎng)有燈光圍網(wǎng)和金槍魚圍網(wǎng), 拖網(wǎng)有底拖和中層拖網(wǎng)等。本文參考文獻(xiàn)[6]標(biāo)記的船舶類型信息, 同時搜集國內(nèi)漁業(yè)企業(yè)船舶水上移動通信業(yè)務(wù)標(biāo)識碼(Maritime mobile service identify, MMSI)和類型標(biāo)識信息。絕大數(shù)漁船都是單一捕撈類型, 即只有一種作業(yè)方式, 只有少數(shù)漁船在不同季節(jié)會轉(zhuǎn)換捕撈作業(yè)方式。本文只考慮單一捕撈類型漁船, 剔除船舶數(shù)量太少和捕撈方式非常少見的類型, 最后提取了延繩釣、其他圍網(wǎng)、金槍魚圍網(wǎng)、拖網(wǎng)和魷魚釣等5種遠(yuǎn)洋主要捕撈漁船和拖船、油輪、貨船和專用運(yùn)輸船等4種主要非漁船。根據(jù)漁船行為相似性將漁船合并為4類, 非漁船合并為3類, 不同漁船和非漁船描述見表1。
依據(jù)船舶MMSI號, 從exactView衛(wèi)星傳輸?shù)腁IS數(shù)據(jù)中提取全球公海船舶軌跡數(shù)據(jù), 包括發(fā)送時間、經(jīng)緯度、航向、航速等。本實(shí)驗(yàn)AIS原始數(shù)據(jù)時間跨度為2017年7月—2019年12月。按MMSI號提取AIS時間序列數(shù)據(jù), 剔除時間重復(fù)和航速大于15節(jié)的船位點(diǎn)數(shù)據(jù)。剔除船位軌跡點(diǎn)個數(shù)小于1 000的MMSI號。
對每個MMSI時間序列數(shù)據(jù)計算前后兩個軌跡點(diǎn)的時間和距離, 將時間間隔超過24 h的船位軌跡點(diǎn)數(shù)據(jù)分開, 每個MMSI時間序列數(shù)據(jù)被分成若干時間序列數(shù)據(jù)段。刪除每個時間段內(nèi)船位軌跡點(diǎn)數(shù)據(jù)少于10個點(diǎn)的段, 這樣處理有利于排除不正確的軌跡點(diǎn)數(shù)據(jù)[6]。為減少數(shù)據(jù)分析量又不影響分析結(jié)果,對每個時間段里面的軌跡點(diǎn)數(shù)據(jù), 作者按每5 min挑選軌跡點(diǎn)數(shù)據(jù), 從處理后的每個MMSI號中, 隨機(jī)挑選時間連續(xù)的5 000個點(diǎn)的特征信息, 繪制上述選擇后每個MMSI連續(xù)5 000個點(diǎn)的速度空間軌跡圖(圖1)。
依據(jù)繪制的速度空間軌跡圖, 目視刪除船舶靜止不動或者軌跡明顯紊亂不符的MMSI, 最后選擇了3 067個MMSI號數(shù)據(jù)(表1)。
表1 船舶類型和數(shù)量
AIS數(shù)據(jù)包含經(jīng)緯度、瞬時船速和航向等有效信息, 其他參數(shù)(MMSI前后兩個船位點(diǎn)的航向差、時間、距離、平均速度、向前速度差、向后速度差、離岸距離等信息)都能表征船舶一般行為特征。根據(jù)參考文獻(xiàn)[20]和[21], 本文提取能表征船舶一般行為特征的17個特征參數(shù), 分別是時間、經(jīng)緯度、船速和航向、前后兩個船位點(diǎn)的航向差、時間、距離、平均速度、向前速度差、向后速度差、離岸距離等、距離[–90, 0], [0, 0], [90, 0], [180, 0]點(diǎn)距離等信息。[–90, 0], [0, 0], [90, 0], [180, 0]4個點(diǎn)將地球經(jīng)度劃4份, 4個距離等信息描述船舶在地球4個空間經(jīng)向變動。對預(yù)處理挑選的MMIS數(shù)據(jù), 按照每個時間段分別計算上述17個特征參數(shù)作為模型的輸入變量。每個特征參數(shù)的表達(dá)方式和說明見表2。
表2 輸入變量描述
船舶軌跡數(shù)據(jù)是時間連續(xù)的空間軌跡信息, 船舶前后兩個航跡點(diǎn)的信息相互關(guān)聯(lián)。在遞歸神經(jīng)網(wǎng)絡(luò)(Recursive neural network, RNN)中, 前一時刻的神經(jīng)元輸出可以傳輸?shù)疆?dāng)前時刻, 因此RNN在時間序列數(shù)據(jù)方面具有獨(dú)特的優(yōu)勢, 并已成功應(yīng)用于分類識別[22]。但如果學(xué)習(xí)序列較長, 傳統(tǒng)的RNN有時會消失或爆炸梯度。通過引入門機(jī)制[23], 設(shè)計了長短期記憶來解決該問題。LSTM利用具有各種門的存儲單元來保存有用的信息, 以長期保持依賴關(guān)系, 單層LSTM網(wǎng)絡(luò)的內(nèi)部結(jié)構(gòu)如圖2所示。
圖2 LSTM神經(jīng)元結(jié)構(gòu)
圖3 雙向LSTM結(jié)構(gòu)圖
本文構(gòu)建兩個BILSTM分類模型。第一個模型區(qū)分漁船和非漁船, 提供漁船信息; 第二個模型對4種主要的遠(yuǎn)洋捕撈漁船類別識別, 為漁業(yè)資源和管理研究提供信息。經(jīng)過多次對比實(shí)驗(yàn)發(fā)現(xiàn)多層模型比單層模型有更好的結(jié)果, 本文兩個BILSTM模型采用3個層數(shù), 第一、二和三層中間網(wǎng)絡(luò)單元數(shù)分別是70、50和25。網(wǎng)絡(luò)函數(shù)梯度訓(xùn)練和優(yōu)化采用“Adam”算法。maxEpochs為70, miniBatchSize為30, 學(xué)習(xí)率為0.001。對于每種類型的船只, 隨機(jī)選擇70%的數(shù)據(jù)作為訓(xùn)練數(shù)據(jù)集, 其余30%用作測試數(shù)據(jù)集。在MATLAB軟件平臺中構(gòu)造兩個BiLSTM, 采用深度學(xué)習(xí)功能包來完成模型的建立和培訓(xùn)。實(shí)驗(yàn)環(huán)境是一臺裝有Intel E3 1270 V5處理器, 32 GB內(nèi)存和NVIDIA Quadro P600顯卡的PC。
通過比較模型的預(yù)測分類結(jié)果和實(shí)際標(biāo)記結(jié)果, 評估兩個BiLSTM模型的性能[26]。對漁船/非漁船模型, 計算二分類混淆矩陣。對于漁船類別識別模型, 采用一對多的方法定義混淆矩陣, 表3列出了基于經(jīng)典矩陣進(jìn)行二進(jìn)制分類的“一對多”方法。
表3 第i類船舶混淆矩陣
TP是模型正確分類的第類正樣本;FN是模型錯誤分類的第一類正樣本;FP是模型錯誤分類的其他第類樣本;TN是模型正確分類的第類其他樣本。
計算平均準(zhǔn)確率、平均精確率、平均召回率、平均Kappa系數(shù)、1得分和曲線下面積(Area Under Curve, AUC)用于評估兩個BILSTM模型的分類性能[26], 計算公式如下:
平均準(zhǔn)確率
平均精確率
平均召回率
1分?jǐn)?shù)
平均準(zhǔn)確率可以測試分類器的平均每類有效性, 如果類別樣本量不平衡, 則此指標(biāo)不是很有效果。1分?jǐn)?shù)是精度和召回率的諧和平均值, 代表了分類器識別陽性分類的有效性。曲線下面積是平衡精度, 代表了分類器避免錯誤分類的能力。系數(shù)是用于一致性測試的指標(biāo), 也可以用于衡量分類的效果。在本文中不同類型船舶的樣本量差異很大, 因此1得分、曲線下面積和系數(shù)越高, 模型的性能越好。
漁船/非漁船模型的訓(xùn)練時間為40 min, 訓(xùn)練數(shù)據(jù)集模型結(jié)果表明有1 200條漁船和798條非漁船被正確識別(表4)。有2條漁船被錯誤地識別為非漁船, 6條非漁船被錯誤地識別為漁船。分類平均準(zhǔn)確率是99.6%, 平均精確率是99.8%, 平均召回率為99.5%, 平均算系數(shù)為0.992,1分?jǐn)?shù)為0.997, 曲線下面積為0.996。
表4 訓(xùn)練數(shù)據(jù)集混淆矩陣
驗(yàn)證數(shù)據(jù)集中有396條漁船和252條非漁船被正確識別(表5), 有18條漁船被錯誤的識別為非漁船, 26條非漁船被錯誤的識別為漁船。分類平均準(zhǔn)確率是93.6%, 平均精確率是95.6%, 平均靈敏度為93.8%, 平均算系數(shù)為0.867,1分?jǐn)?shù)為0.947, 曲線下面積為0.936。
表5 驗(yàn)證數(shù)據(jù)集混淆矩陣
所有數(shù)據(jù)的分類平均準(zhǔn)確率是98.1%, 平均精確率是98%, 平均召回率為98.8%, 平均系數(shù)為0.96,1分?jǐn)?shù)為0.984, 曲線下面積為0.979 (表6)。
表6 評價指標(biāo)結(jié)果
在漁船/非漁船二分類模型中, 所有數(shù)據(jù)中每種船舶模型錯誤分類統(tǒng)計個數(shù)見圖4。共有52艘漁船被模型錯誤分類, 其中有16艘拖網(wǎng)漁船被模型錯誤分類, 其次是貨物和油輪, 有11艘被模型錯誤分類, 最少的是魷魚釣漁船和拖船, 都只有2艘漁船被錯誤分類。
圖4 不同類型船舶錯誤分類數(shù)
模型2的訓(xùn)練時間為23 min, 訓(xùn)練數(shù)據(jù)混淆矩陣見表7。訓(xùn)練數(shù)據(jù)集模型結(jié)果表明有300條延繩釣漁船、127條金槍魚圍網(wǎng)/圍網(wǎng)漁船、702拖網(wǎng)和64條魷魚釣漁船被正確識別(表7)。漁船類別識別模型的訓(xùn)練數(shù)據(jù)集的結(jié)果顯示平均準(zhǔn)確率是99%, 平均精確率是99.3%, 平均召回率為99%, 平均系數(shù)為0.967,1分?jǐn)?shù)為0.991, 曲線下面積為0.98。7艘延繩釣漁船被錯誤地識別為拖網(wǎng)漁船和圍網(wǎng)漁船。
表7 訓(xùn)練數(shù)據(jù)集混淆矩陣
驗(yàn)證數(shù)據(jù)集中有126條延繩釣漁船、50條金槍魚圍網(wǎng)/圍網(wǎng)漁船、290拖網(wǎng)和25條魷魚釣漁船被正確識別(表8)。漁船類別識別模型的測試數(shù)據(jù)集的結(jié)果顯示, 平均準(zhǔn)確度為97%, 平均準(zhǔn)確度為97.6%, 平均召回率為97.4%, 平均系數(shù)為0.895,1得分為0.975, 曲線下面積為0.942。有10條延繩釣漁船被誤認(rèn)為是圍網(wǎng)和拖網(wǎng)漁船, 5艘圍網(wǎng)漁船被錯誤地識別為延繩釣和拖網(wǎng)漁船。模型錯誤地將14艘拖網(wǎng)漁船識別為延繩釣和圍網(wǎng)漁船。兩艘魷魚釣漁船被誤認(rèn)為是拖網(wǎng)漁船。
表8 驗(yàn)證數(shù)據(jù)集混淆矩陣
所有數(shù)據(jù)集的平均準(zhǔn)確度、平均準(zhǔn)確度、平均召回率、平均系數(shù)、1得分和曲線下面積分別為98.4%, 98.5%, 98.6%, 0.945、0.986和0.977(表9)。
表9 評價指標(biāo)結(jié)果
本文選擇了5種主要的遠(yuǎn)洋捕撈船舶和4種主要的遠(yuǎn)洋非捕撈船舶, 并將5類捕撈船舶合并為4類, 4類非捕撈合并為3類。公海中還有其他類型的漁船, 它們在數(shù)量上比本文選擇的類型少, 因此NIEBLAS等[20]將其他的桿釣、底拖網(wǎng)和定置網(wǎng)等漁船合并為其他類漁船, 不做單獨(dú)分類。本文沒有收集足夠的其他類型船舶數(shù)據(jù), 考慮到樣本量對模型訓(xùn)練的影響, 因此建模時沒有考慮。未來需要收集更多的漁船和非漁船數(shù)據(jù), 完善模型和數(shù)據(jù)庫。
文中選擇的是某一區(qū)域一個國家或地區(qū)的漁船[11-14], 本文挑選遠(yuǎn)洋漁船和非漁船數(shù)據(jù)包括3大洋公海和經(jīng)濟(jì)專屬區(qū), 來自不同國家。對特定區(qū)域的近海漁船, 由于特定的捕撈對象和地理環(huán)境, 船舶可能表現(xiàn)為某種的區(qū)域一致行為特性。而公海不同國家的漁船在大的相似性下可能存在不一致性, 因此本文的模型方法更具一般性。
模型輸入數(shù)據(jù)選擇時, 由于數(shù)據(jù)量大, 為方便數(shù)據(jù)整理和快速挑選數(shù)據(jù), 編寫代碼自動選擇了連續(xù)5 000點(diǎn)船舶軌跡數(shù)據(jù), 并繪制連續(xù)時間的空間軌跡圖, 人工目視挑選數(shù)據(jù)。對于連續(xù)軌跡點(diǎn)不足5 000點(diǎn)數(shù)據(jù)可以多時段合并、可以將不同時段的數(shù)據(jù)挖掘模型特征參數(shù)后人工合并, 剔除其中的時間間隔。
速度、航向是描述船舶瞬時空間行為的關(guān)鍵信息, 有大量文獻(xiàn)采用速度構(gòu)建了不同捕撈類型漁船的漁船作業(yè)狀態(tài)模型[9-11], 也常被用于漁船類型分類[8-10]。一定時間內(nèi)船舶在大海上的連續(xù)空間軌跡可以看成二維拓?fù)浣Y(jié)構(gòu)。每種船舶的拓?fù)浣Y(jié)構(gòu)具有自身特征, 因此可以基于漁船在連續(xù)時間下特有的空間拓?fù)浣Y(jié)構(gòu)開展分類和作業(yè)狀態(tài)識別[25]。因此本文參考已有文獻(xiàn)提取了位置、距離和速度等信息刻畫船舶在二維空間的軌跡變動。船舶航跡具有明顯的時間平滑性, 下一時刻的位置狀態(tài)由歷史時刻的位置滑行而來, 船舶前后兩個軌跡點(diǎn)的信息是相互關(guān)聯(lián)的。因此AIS數(shù)據(jù)蘊(yùn)含豐富的時間信息, 本文提取了前后兩個船位點(diǎn)的航向差、時間、距離、平均速度、向前速度差和向后速度差, 描述軌跡點(diǎn)隨時間的變化。
文中還提取了到最近港口距離和時間[6], 到最近錨地的距離和訪問的時間, 以及軌跡點(diǎn)1 km半徑內(nèi)船舶數(shù)據(jù)。作者暫無法獲取和計算上述數(shù)據(jù)而未考慮到模型中。到港口的距離和時間是貨船和運(yùn)輸船表現(xiàn)的明顯特征, 而1 km半徑內(nèi)船舶數(shù)量是漁船聚集作業(yè)的明顯特征。未來在獲得全球有效的港口數(shù)據(jù)可以計算每個軌跡點(diǎn)到最近港口距離和時間, 加入模型輸入變量。
漁業(yè)管理、監(jiān)督和分析中首先感興趣的是漁船信息, 然后是具體捕撈作業(yè)類型的漁船行為。因此本文構(gòu)建了漁船/非漁船二分類模型和漁船多分類模型。兩種模型訓(xùn)練數(shù)據(jù)的平均準(zhǔn)確率都達(dá)到99%, 驗(yàn)證數(shù)平均準(zhǔn)確率都在94%以上。漁船多分類模型在每種漁船類別識別準(zhǔn)確率在91%以上。構(gòu)建的漁船/非漁船類別識別模型和漁船類別識別模型訓(xùn)練和驗(yàn)證精度都較高, 說明模型具有較好的泛化能力。
SHENG[27]等采用logistic 回歸模型構(gòu)建了運(yùn)輸船和漁船二分類模型, 分類準(zhǔn)確率為92.3%。ZHANG等[28]采用集成學(xué)習(xí)方法構(gòu)建了漁船和游船二分類模型, 平均準(zhǔn)確率為76.7%。本文的漁船/非漁船二分類模型訓(xùn)練精度為99.6%, 驗(yàn)證精度為93.6%, 分類結(jié)果好于上述文獻(xiàn)。
只對漁船類別識別方面, PARK[12]基于速度和航向時間序列進(jìn)行分組編碼方法構(gòu)建了韓國半島海域6種近海漁船類別識別模型, 準(zhǔn)確率為76.2%。MARZUKI等[13]針對漁船軌跡數(shù)據(jù)的地理特征和行為特征對拖網(wǎng)、延繩釣、圍網(wǎng)和桿釣4種漁船構(gòu)建的模型訓(xùn)練精度都在95%以上。鄭巧玲等[11]采用BP方法構(gòu)建的中國近海3類小型漁船類別識別模型平均準(zhǔn)確率為91%以上。HUANG等[14]采用XGBoost方法建立的中國近海9種漁船類別識別模型平均準(zhǔn)確率在96.9%。本文模型訓(xùn)練精度為99%, 驗(yàn)證精度為97%, 均高于已有文獻(xiàn)分類結(jié)果。
KROODSMA等[6]構(gòu)建的卷積神經(jīng)網(wǎng)絡(luò)深度學(xué)習(xí)算法訓(xùn)練平均準(zhǔn)確率為95%。本文考慮所有7種類型船舶數(shù)據(jù), 構(gòu)建本文相似結(jié)構(gòu)的BiLSTM模型, 模型訓(xùn)練精度為99%, 驗(yàn)證精度為96%, 訓(xùn)練精度高于KROODSMA結(jié)果。不同的是本文只考慮了遠(yuǎn)洋5大類漁船和4種主要貨船, 而KROODSMA等[6]構(gòu)建的模型包含了桿釣、底拖網(wǎng)和定制網(wǎng)等漁船其他漁船以及客船等非漁船, 船舶種類比本文多。
本研究采用BiLSTM模型對5種主要遠(yuǎn)洋捕撈類型漁船和4種非捕撈船舶進(jìn)行分類分析, 模型訓(xùn)練和驗(yàn)證數(shù)據(jù)集計算的各項(xiàng)評價指標(biāo)都很好, BiLSTM系統(tǒng)能夠很好地描述漁船時間序列軌跡數(shù)據(jù)的內(nèi)部規(guī)律, 構(gòu)建的模型對遠(yuǎn)洋船舶類型分類精度很高, 且模型不具有區(qū)域性。未來研究中除主要作業(yè)類型, 還需要考慮更多的漁船作業(yè)類型, 通過收集更多的船舶樣本數(shù)據(jù)、到最近錨地的距離、到最近錨地訪問的時間以及半徑 1 km范圍內(nèi)的船舶數(shù)量信息不斷提升模型的分類能力, 建立更全面的漁船類別識別數(shù)據(jù)庫。
[1] DIRO G T, BLACK E, GRIMES D.Seasonal forecasting of Ethiopian spring rains[J].Meteorological Applications, 2010, 15(1): 73-83.
[2] KASSAWMAR T, ZELEKE G, BANTIDER A, et al.A synoptic land change assessment of Ethiopia’s rainfed agricultural area for evidence-based agricultural ecosystem management[J].Heliyon, 2018, 4(11): e00914.
[3] ROCKSTROM J, Barron J, FOX P.Rainwater management for increased productivity among small-holder farmers in drought prone environments[J].Physics & Chemistry of the Earth Parts A/b/c, 2002, 27(11/12): 949-959.
[4] MCCAULEY D J, WOODS P, SULLIVAN B, et al.En-ding hide and seek at sea[J].Science, 2016, 351(6278): 1148-1150.
[5] CIMINO M A, ANDERSON M, SCHRAMEK T, et al.Towards a fishing pressure prediction system for a western pacific EEZ[J].Science Reports, 2019, 9(461): 1-10.
[6] KROODSMA D A, MAYORAGA J, HOCHBERG T, et al.Tracking the global footprint of fisheries[J].Science, 2018, 359(6378): 904-908.
[7] SHELMERDINE R L.Teasing out the detail: How our understanding of marine AIS data can better inform industries, developments, and planning[J].Mar Policy, 2015, 54: 17-25.
[8] GUYADER L D, RAY C, BROSSET D.Defining high- resolution dredge fishing grounds with automatic identification system (AIS) data[J].Aquatic Living Resources, 2017, 30: 39-49.
[9] DE SOUZA E N, BOERDER K, MATWIN S, et al.Improving fishing pattern detection from satellite AIS using data mining and machine learning[J].PloS One, 2016, 11(7): e0158248.
[10] VESPE M, GIBIN M, ALESSANDRINI A, et al.Mapping EU fishing activities using ship tracking data (Article)[J].Journal of Maps, 2016, 12: 520-525.
[11] 鄭曉玲, 樊偉, 張勝茂, 等.基于神經(jīng)網(wǎng)絡(luò)和VMS的漁船捕撈類型辨別[J].南方水產(chǎn)科學(xué), 2016, 12(2): 81-87.
ZHENG Xiaoling, FAN Wei, ZHANG Shengmao, et al.Identification of fishing type from VMS data based on artificial neural network[J].South China Fisheries Science, 2016, 12(2): 81-87.
[12] PARK J W, LEE K M, KIM K I.Automatic identification system based fishing trajectory data preprocessing method using map reduce(Article)[J].International Journal of Recent Technology and Engineering, 2019, 8(2): 352-356.
[13] MARZUKI M I, GASPAR P, GARELLO R, et al.Fi-shing gear identification from vessel-monitoring-system- based fishing vessel trajectories[J].IEEE Journal of Oceanic Engineering, 2018, 43(3): 689-699.
[14] HUANG H G, HONG F, LIU J, et al.FVID: Fishing vessel type identification based on VMS trajectories[J].Journal of Ocean University of China, 2019, 18(2): 403-412.
[15] 王立林, 劉俊.基于多尺度卷積的船舶行為識別方法[J].計算機(jī)應(yīng)用.2019, 39(12): 3691-3696.
WANG Lilin, LIU Jun.Ship behavior recognition me-thod based on multi-scale convolution[J].Journal of Computer Applications, 2019, 39(12)3691-3969.
[16] ZHOU X Y, LIU Z J, WANG F W, et al.Using deep learning to forecast maritime vessel flows[J].Sensors, 2020, 20(6): 1761.
[17] TANG H, YIN Y, SHEN H L.A model for vessel trajectory prediction based on long short-term memory neural network[J].Journal of Marine Engineering & Techno-logy, 2019, 3: 1-10.
[18] 吳賽賽, 周愛蓮, 謝能付, 等.基于深度學(xué)習(xí)的作物病蟲害可視化知識圖譜構(gòu)建[J].農(nóng)業(yè)工程學(xué)報, 2020, 36(24): 177-185.
WU Saisai, ZHOU Ailian, XIE Nengfu, et al.Constru-c-tion of visualization domain-specific knowledge graph of crop diseases and pests based on deep learning[J].Transactions of the Chinese Society of Agricultural Engineering (Transactions of the CSAE), 2020, 36(24): 177-185.
[19] 解毅, 張永清, 荀蘭, 等.基于多源遙感數(shù)據(jù)融合和 LSTM算法的作物分類研究[J].農(nóng)業(yè)工程學(xué)報, 2019, 35(15): 129-137.
XIE Yi, ZHANG Yongqing, XUN Lan, et al.Crop classification based on multi-source remote sensing data fusion and LSTM algorithm[J].Transactions of the Chinese Society of Agricultural Engineering (Transactions of the CSAE), 2019, 35(15): 129-137.
[20] NIEBLAS A E, BARDE J, LOUYS J, et al.Global atlas of AIS-based fishing activity challenges and opportunities[R].Rome: FAO, 2019.
[21] BERTRAND S, DIAZ E, LENGAIGNE M.Patterns in the spatial distribution of Peruvian anchovy () revealed by spatially explicit fishing data[J].2008, 79(4): 379-389.
[22] ZONOOZI A, KIM J J, LI X L, et al.Periodic-CRN: A convolutional recurrent model for crowd density prediction with recurring periodic patterns[C]//In Proc 27th Int Conf Arti Inte, Stockholm: International Joint Conferen-ces on Artificial Intelligence, 2018: 3732-3738.
[23] HOCHREITER S, SCHMIDHUBER J.Long short-term memory[J].Neural Computation, 1997, 9(8): 1735-1780.
[24] MA J, JIA C F, YANG X, et al.A data-driven approach for collision risk early warning in vessel encounter situations using attention-BiLSTM[J].IEEE Access, 2020, 8: 188771-188783.
[25] GERS F A, SCHMIDHUBER J, CUMMINS F.Learning to forget: continual prediction with LSTM[J].Neural Computation, 2000, 12(10): 2451-2471.
[26] ZHOU Y, DAAMEN W, VELLINGA T, et al.Ship classification based on ship behavior clustering from AIS data[J].Ocean Engineering, 2019, 175: 176-187.
[27] SHENG K, LIU Z, ZHOU D C, et al.Research on ship clas-sification based on trajectory fea-tures[J].Journal of Navigation, 2018, 71(1): 100-106.
[28] ZHANG T, ZHAO S, CHEN J.Research on ship classification based on trajectory association[J].Knowledge Science, Engineering and Management, 2019, 11775: 327-340.
Pelagic fishing vessel classification using bidirectional long short-term memory networks
YANG Sheng-long1, 2, SHI Hui-min1, 3, ZHANG Sheng-mao1, ZHANG Han4, FEI Ying-jie4, WANG Fei1, JIN Wei-guo5, WANG Guo-lai5, FAN Wei1, 2
(1.Key Laboratory of East China Sea & Oceanic Fishery Resources Exploitation and Utilization, Ministry of Agriculture, Chinese Academy of Fishery Sciences, Shanghai 200090, China; 2.Key and Open Laboratory of Remote Sensing Information Technology in Fishing Resource, East China Sea Fisheries Research Institute, Chinese Academy of Fishery Sciences, Shanghai 200090, China; 3.College of Information, Shanghai Ocean University, Shanghai 201306, China; 4.College of Science, University of Shanghai for Science and Technology, Shanghai 200093, China; 5.Shanghai Kaichuang Deep Sea Fisheries Co., Ltd, Shanghai 200082, China)
fishingships classification; AIS data; BiLSTM
Automatic identification systems (AIS) information provides the possibility for the fine management and research of fishery resources and fishing activities.Existing fishery research mostly describes fishing activities of fishing vessels based on clear fishing gear AIS data.However, the fishing vessel types are often unknown in practice.Therefore, it is necessary to build a classification model of ship type to identify fishing vessels of unknown fishing type and provide data support for fishery research and management to protect the sustainable development of fishery resources.Fishing ships require a certain fishing license to operate with licensed fishing gear.Identifying specific fishing ship trajectory information such as fishing activity or gear type is also useful for monitoring illegal fishing activities.This article collected and sorted the information of 3067 known types of ships (including 4 types of fishing vessels, 1831 total; 3 types of nonfishing vessels, 1236 total).Seventeen characteristic parameters of each vessel were extracted based on the time, latitude and longitude, ship speed and heading course derive from AIS.Seventeen characteristic parameters wereused as model input variables, and a three-layer bidirectional long short-term memory BiLSTM, network was used to construct a fishing vessel/non-fishing vessel classification recognition model and recognition models for fishing vessels.The model results showed that the average accuracy rate of training data classification of the fishing /non-fishing vessel LSTM model was 99.6%, the average precision was 99.8%, the average recall was 99.5%, the average kappa coefficient was 0.992, the1score was 0.997, and the AUC was 0.996.The average accuracy, average precision, average recall, average kappa coefficient,1score and AUC for the testing data set were 93.6%, 95.6%, 93.8%, 0.867, 0.947 and 0.936, respectively.The results of the training data set of the fishing vessel classification model showed that the average accuracy was 99%, the average precision was 99.3%, the average recall was 99%, the average kappa coefficient was 0.967, the1score was 0.991, and the AUC was 0.98.The average accuracy rate of the validation data set classification was 97%, the average precision was 97.6%., the average recall was 97.4%, the average kappa coefficient was 0.895, the1score was 0.975, and the AUC was 0.942.Two models with high performance, could help to distinguish the fishing/non-fishing vessel, and detection the gear type of fishing vessel.Furthermore to supervise the fishing activity to protect fishery ecosystems.
Jul.8, 2021
[National Key R&D Program of China, Nos.2019YFD0901404, 2019YFD0901405; Special Funds of Basic Research of Central Public Welfare Institute, No.2019T09; Shanghai Science and Technology Innovation Action plan, No.19DZ1207504; Jimei University, Fujian Provincial Key Laboratory of Marine Fishery Resources and Eco-environment Funding, No.fjmfre2019003]
楊勝龍(1982—), 男, 博士, 副研究員, 主要從事海洋生態(tài)學(xué)研究, E-mail: ysl6782195@126.com; 樊偉(1971—), 通信作者, E-mail: fanwee@126.com
S973.1+9
A
1000-3096(2022)03-0025-11
10.11759/hykx20210708001
2021-07-08;
2021-11-02
國家重點(diǎn)研發(fā)計劃項(xiàng)目(2019YFD0901404, 2019YFD0901405); 中央級公益性科研院所基本科研業(yè)務(wù)費(fèi)項(xiàng)目(2019T09); 上海市科技創(chuàng)新行動計劃項(xiàng)目(19DZ1207504); 福建省海洋漁業(yè)資源與生態(tài)環(huán)境重點(diǎn)實(shí)驗(yàn)室開放基金項(xiàng)目(fjmfre2019003)
(本文編輯: 譚雪靜)