陳 朋,昝 昊,趙冬冬*,郭新新
(1.浙江工業(yè)大學(xué)計算機科學(xué)與技術(shù)學(xué)院,浙江 杭州 310000;2.浙江工業(yè)大學(xué)信息工程學(xué)院,浙江 杭州 310000;3.中國科學(xué)院深??茖W(xué)與工程研究所,海南 三亞 572000)
側(cè)掃聲吶有著探測范圍大、成圖分辨率高、經(jīng)濟實惠、操作簡便等優(yōu)點,在海洋研究、海洋定位[1]、海下科考、海底測繪[2]等諸多領(lǐng)域被廣泛應(yīng)用。 拖曳式側(cè)掃聲吶在工作時,由一艘船拖曳著托魚,托魚左右兩側(cè)的換能器向垂直于前進方向發(fā)出聲波,掃描的海域呈狹長的扇形,聲波到達海底被反射后,換能器按照時間先后接收經(jīng)過海底反射的回波,形成一幀的回波數(shù)據(jù),回波數(shù)據(jù)按照時間推移,沿著垂直于掃描方向拼接進而形成側(cè)掃聲吶瀑布圖[3],如圖1(a)所示。
圖1 側(cè)掃聲吶工作原理
側(cè)掃聲吶主要是為了獲取海底的地形地貌,側(cè)掃聲吶圖像的質(zhì)量對于海洋研究至關(guān)重要,然而根據(jù)側(cè)掃聲吶的成像原理,在聲波到達海底前,由于在水中的傳播延遲,會在側(cè)掃聲吶瀑布圖中間形成一塊水柱區(qū);在到達海底后,反射回來的回波隨時間序列形成圖像區(qū)。 其中分割水柱區(qū)和圖像區(qū)的分界線即為海底線,海底線位置同時也表征了聲吶距離海底的高度,如圖1(b)所示。 斜距校正[4]就是利用海底線的位置,去除側(cè)掃聲吶圖像的水柱區(qū),在橫向上得到連續(xù)的聲吶圖像。 海底線檢測的精度,是斜距校正的關(guān)鍵。 雖然深度傳感器會記錄托魚到海底的距離,但是在實際應(yīng)用中,托魚的姿態(tài)會影響到深度傳感器的測量精度,導(dǎo)致記錄數(shù)據(jù)并不精確,從而影響斜距校正的效果。
國際著名的SSS 圖像處理軟件Triton 和Discovery主要采用了需要手動調(diào)整的閾值控制法[5],在測量復(fù)雜環(huán)境時,需要分段手動調(diào)整閾值,效率低下且精度不高。 張濟博等[6]提出了LOG 算子,提取圖像邊緣來獲取海底線,在水柱區(qū)噪聲或者水體中懸浮物較少的時候很好地完成了海底線的檢測,當(dāng)水柱區(qū)干擾較大時,該方法無法正確提取邊緣。 趙建虎等[7]提出了海底線綜合檢測和提取方法,該方法基于最后峰值法、對稱原則和海底連續(xù)變化原則在水柱區(qū)噪聲較大時對海底線進行精準提取,但是其檢測方法需設(shè)置灰度差變化閾值,需借助人工調(diào)參,并不能實時地提取海底線。 Ruiz 等[8]提出了基于卡爾曼濾波器的方法來提取海底線,其復(fù)雜的后處理操作十分耗時,導(dǎo)致無法實時提取海底線。 Shih等[9]提出了一種基于Canny 邊緣檢測方法的自適應(yīng)海底跟蹤算法,根據(jù)水柱區(qū)干擾程度不同,單張圖片處理時間約在0.2 s~1.2 s 范圍內(nèi),其實時性能差。
深度學(xué)習(xí)算法已經(jīng)被廣泛應(yīng)用于圖像領(lǐng)域,在目標檢測、目標識別[10]、圖像分割和圖像去噪等領(lǐng)域都取得很好的效果。 Yan 等[11]提出了1D-CNN網(wǎng)絡(luò)用于提取海底線,該方法使用1D-CNN 網(wǎng)絡(luò)對海底線區(qū)域和其他區(qū)域進行分類,用訓(xùn)練好的網(wǎng)絡(luò)模型對單幀(Ping)側(cè)掃聲吶回波數(shù)據(jù)采用滑動窗口遍歷,提取輸出概率最大的位置為海底線,該方法取得很好的提取精度,大部分Ping 的提取時間在150 ms左右,部分Ping 的提取時間較長,實時性能較差。 Yan 等[12]為解決1D-CNN 海底線提取算法實時性差的問題,進一步提出了1D-UNet 網(wǎng)絡(luò)對海底線位置進行分割,該方法對原始側(cè)掃聲吶回波數(shù)據(jù)預(yù)處理后送入1D-UNet 網(wǎng)絡(luò),并借助1D-UNet 網(wǎng)絡(luò)對每個位置進行預(yù)測,其中輸出概率最大值對應(yīng)的位置就是網(wǎng)絡(luò)給出的海底線位置。 該方法不需要滑動窗口操作去遍歷整個數(shù)據(jù),在實時性上顯著優(yōu)于1D-CNN 方法,但該方法魯棒性較差,在回波信號信噪比較差時無法正確提取海底線。 Qin 等[13]結(jié)合殘差塊和1D-UNet 網(wǎng)絡(luò),將1D-UNet 網(wǎng)絡(luò)中的雙卷積操作替換為ResNet 中的瓶頸塊,該方法加深了網(wǎng)絡(luò)結(jié)構(gòu),提高了海底線的檢測精度,但實時性相對較差。
綜上所述,當(dāng)側(cè)掃聲吶回波信號信噪比差時,現(xiàn)有的神經(jīng)網(wǎng)絡(luò)方法和傳統(tǒng)方法不能實時正確提取海底線。 本文提出了一種基于海底信息對稱模塊和多尺度特征融合模塊的快速分割卷積神經(jīng)網(wǎng)絡(luò)(Bottom Information Symmetry Module and Multi-scale Feature Fusion Module Fast-SCNN,BMM-Fast-SCNN)用于實時正確提取海底線。 該方法在Fast-SCNN-1D 基礎(chǔ)上,采用多尺度特征融合提取海底線細小特征,并結(jié)合海底信息對稱模塊增強網(wǎng)絡(luò)提取海底線的魯棒性。 最終在側(cè)掃聲吶數(shù)據(jù)集上表現(xiàn)良好的提取精度和實時性能。
理想條件下,水柱區(qū)第一個強回波是聲波第一次到達海底時的回波,如圖2(a)所示,方框處即為海底線位置,該方框往左為水柱區(qū),往右為圖像區(qū)。在水柱區(qū)沒有噪聲干擾,回波信號到達圖像區(qū)回波強度突然上升,其強度數(shù)倍于水柱區(qū),這種條件下海底線位置容易提??;然而在實際采樣過程中,諸多因素的影響,為海底線的提取帶來困難。 如圖2(b)所示,影響海底線提取的因素包括:
圖2 側(cè)掃聲吶回波信號
①聲吶自噪聲:在側(cè)掃聲吶工作時,換能器會最先記錄來自聲吶的自噪聲,在水柱區(qū)形成強回波。
②懸浮物:實際作業(yè)時,水體中會伴隨大量的懸浮物和一些水中生物,換能器發(fā)射出的聲波在到達海底前,遇到懸浮物會反射較強的回波,當(dāng)水柱區(qū)被大量懸浮物覆蓋時,將會影響海底線的檢測。
③海底目標:在聲波到達圖像區(qū)以后,遇到海底目標時反射的回波強度數(shù)倍于海底線處的強度,會削弱海底線處的特征,影響海底線的檢測。
針對上述海底線提取中的干擾問題,本文提出了基于BMM-Fast-SCNN 的海底線實時提取算法,圖3給出了本文的算法框架,該算法主要分為三個部分:①數(shù)據(jù)預(yù)處理部分,包括原始側(cè)掃聲吶數(shù)據(jù)的解析、一維采樣序列的生成以及標注序列的獲取。②利用BMM-Fast-SCNN 分割網(wǎng)絡(luò)預(yù)測側(cè)掃聲吶一維采樣序列海底線的分割結(jié)果部分。 ③海底線提取精度計算部分,包括遍歷分割序列、提取分割位置和計算分割精度。
圖3 算法總體流程
本文的原始側(cè)掃聲吶數(shù)據(jù)是以XTF(Extended Triton Format)格式記錄在文件中[14],本文按照其協(xié)議編寫了解析軟件并得到側(cè)掃聲吶回波數(shù)據(jù)。 由于整個Ping 數(shù)據(jù)很長,為了方便網(wǎng)絡(luò)訓(xùn)練,輸入尺寸需降采樣成1 024 的倍數(shù),同時回波數(shù)據(jù)需進行歸一化處理。 其計算公式如式(1)所示:
式中:Bmax代表當(dāng)前回波強度最大值,Bmin代表當(dāng)前回波強度最小值,B代表當(dāng)前采樣點的回波強度,BN代表歸一化后的強度值。
經(jīng)過降采樣、歸一化處理后得到一維采樣序列,同時采用人工監(jiān)督的方法,標記海底線位置,最終生成一維標注序列,如圖4 所示。
圖4 側(cè)掃聲吶數(shù)據(jù)預(yù)處理
語義分割網(wǎng)絡(luò)在圖像分割領(lǐng)域取得很好的效果,其中輕量級的語義分割網(wǎng)絡(luò)Fast-SCNN 具有優(yōu)異的實時性和較好的分割精度。 文獻[15]提出的Fast-SCNN 網(wǎng)絡(luò)模型是結(jié)合了當(dāng)前語義分割領(lǐng)域多分支結(jié)構(gòu)[16]和編碼-解碼結(jié)構(gòu)[17]的網(wǎng)絡(luò),其一維模型如圖5 所示。 其主要結(jié)構(gòu)如下:在學(xué)習(xí)下采樣部分(Learning to Down-sample),采用標準卷積和兩次深度可分離卷積(Depthwise Separable Convolution,DSConv)對輸入序列進行下采樣,分別得到1/2、1/4、1/8 尺寸的特征圖;全局特征提取部分(Global Feature Extrator),在深層特征的分支上經(jīng)過瓶頸塊(Bottleneck Block)和金字塔池化模塊[18](Pyramid Pooling Module,PPM),學(xué)習(xí)到深層特征信息,淺層特征分支的特征圖直接送入特征融合部分;在特征融合部分(Feature Fusion),將深層特征分支的特征圖經(jīng)過上采樣、深度卷積(Depthwise Convolution,DWConv)和標準卷積后的特征和淺層特征分支經(jīng)過標準卷積后的特征進行融合;最后,在分類器部分(Classifier),采用兩次深度可分離卷和一次卷積操作提高模型的準確率,并上采樣恢復(fù)到輸入序列尺寸,最終經(jīng)過Softmax 層最終獲得分割結(jié)果。
圖5 Fast-SCNN-1D 網(wǎng)絡(luò)結(jié)構(gòu)
Fast-SCNN-1D 具備優(yōu)異的實時性,但其追求實時性的同時不可避免地損失了一些精度,F(xiàn)ast-SCNN-1D 中多次卷積下采樣和金字塔池化操作獲得的特征缺失了海底線的細小特征,并不滿足海底線提取的精度要求,同時,在一維采樣序列一側(cè)的海底線特征被噪聲淹沒時,F(xiàn)ast-SCNN-1D 不能正確提取海底線位置。 針對這些不足,本文提出了BMMFast-SCNN 網(wǎng)絡(luò)模型。 該網(wǎng)絡(luò)的改進如下:
①在金字塔池化后,為了減少四倍上采樣帶來的誤差,深層特征經(jīng)過兩倍上采樣后再和淺層特征進行特征融合。
②在特征融合階段,采用多尺度的特征融合,減少網(wǎng)絡(luò)對淺層特征的丟失。
③在網(wǎng)絡(luò)輸入階段,設(shè)計了海底信息對稱模塊,解決在單側(cè)噪聲較大時,海底線無法正確提取的問題。 下文將對圖6 所示的BMM-Fast-SCNN 網(wǎng)絡(luò)進行詳細介紹。
圖6 BMM-Fast-SCNN 網(wǎng)絡(luò)結(jié)構(gòu)
2.3.1 海底信息對稱模塊(BISM)
如圖7 所示,當(dāng)海底線一側(cè)的水柱區(qū)被噪聲充滿或者水體中的懸浮物帶來噪聲距離海底線位置很近時,這種情況下海底線特征被水柱區(qū)的噪聲給淹沒。在人工判斷時,且需要參考另一側(cè)的海底線位置信息來提取海底線,然而現(xiàn)有的語義分割網(wǎng)絡(luò)在缺少先驗知識基礎(chǔ)上不能正確地識別海底線位置。
圖7 懸浮物噪聲示意圖
為了解決上述問題,借助海底線位置左右對稱的先驗知識,本文提出了海底信息對稱模塊(BISM)來提高分割網(wǎng)絡(luò)的魯棒性。
如圖8 所示,首先對輸入的一維采樣序列進行左右翻轉(zhuǎn),得到翻轉(zhuǎn)后的一維序列,然后對已有的兩條序列進行求和取平均,最終將三條回波信號序列進行拼接,向分割網(wǎng)絡(luò)輸入三通道的回波信號數(shù)據(jù)。
圖8 BISM 結(jié)構(gòu)圖
由卷積神經(jīng)網(wǎng)絡(luò)[19]的計算原理可知,通過卷積核可以將不同輸入通道的信息提取成相應(yīng)的特征信息。 在BISM 中,左右翻轉(zhuǎn)后的通道及第一通道為神經(jīng)網(wǎng)絡(luò)帶來海底線的對稱信息;由于僅在水柱區(qū)的一側(cè)出現(xiàn)大量噪聲,通過求和取均值后的通道在水柱區(qū)的噪聲得到削弱,且兩側(cè)圖片區(qū)的取值變化較小,該通道在兩側(cè)均有較好的信噪比,該通道為網(wǎng)絡(luò)提供較好的海底線位置特征。 結(jié)合三通道特征,網(wǎng)絡(luò)的泛化能力得到增強,在單側(cè)信噪比較差時,仍能提取海底線特征,提高海底線提取精度。
2.3.2 多尺度特征融合模塊(MFFM)
在實際的側(cè)掃聲吶回波信號中,當(dāng)遇到地形復(fù)雜時,回波信號中海底線的細節(jié)信息不易提取,從而造成海底線位置提取精度較差的問題。
本文借鑒U-Net 在不同特征尺寸下,對淺層特征和深層特征進行拼接的思想,在特征融合階段,采用不同尺寸的特征融合增強網(wǎng)絡(luò)對海底線細節(jié)信息的提取。 首先,在金字塔池化后,將上采樣倍數(shù)設(shè)置為2,減少4 倍上采樣丟失海底線的細節(jié)信息;然后,在學(xué)習(xí)下采樣階段分別向淺層分支輸出1/4、1/8、1/16 尺寸的特征圖,其深層分支分別和淺層特征進行融合。 最終經(jīng)過多尺度的特征融合,網(wǎng)絡(luò)具有更好地提取海底線細節(jié)的能力。
如圖9 所示的回波數(shù)據(jù),使用BMM-Fast-SCNN得到了海底線的分割結(jié)果。 為了評估海底線提取精度,本文對模型分割結(jié)果進行遍歷,分別從預(yù)測序列中間往左右兩側(cè)搜索第一個為0 的點,記錄為每個回波數(shù)據(jù)左右海底線的預(yù)測值。
圖9 回波數(shù)據(jù)及預(yù)測值
選取一個像素精度和兩個像素精度作為可接受誤差,計算預(yù)測值和真實值的差值是否在可接受范圍內(nèi),最終確定每個預(yù)測值的正確性,如式(2)所示:
式中:yi是預(yù)測值,yˉi是真實值,error 表示可接受誤差,其取值為1 或者2。 那么海底線提取精度就可以表示為式(3):
式中:acc 表示海底線提取精度,Nc表示正確預(yù)測個數(shù),Na表示預(yù)測的總個數(shù)。
為了驗證BMM-Fast-SCNN 網(wǎng)絡(luò)在實時提取海底線這項工作中的有效性和優(yōu)越性,本文使用在杭州千島湖實地采集的側(cè)掃聲吶回波數(shù)據(jù)進行實驗。
在千島湖,我們使用HMS-6x4 側(cè)掃聲吶進行測量,如圖10 所示,一共四個通道,分別記錄高、低頻下左右舷的側(cè)掃聲吶回波數(shù)據(jù),其工作頻率為高頻400 kHz,低頻100 kHz,最大采樣斜距為200 m,采樣間隔為1 s,側(cè)掃聲吶回波數(shù)據(jù)及輔助信息以XTF 格式記錄下來。
圖10 千島湖湖試實驗
原始的側(cè)掃聲吶數(shù)據(jù)以XTF 的格式記錄在文件中,使用C#語言,在Visual Studio 2017 平臺上對原始數(shù)據(jù)進行解析。 在64 位的Linux18.04 系統(tǒng)下,使用python3.6、cuda10.1 的編譯環(huán)境,GPU 型號是RTX 2080,并基于pytorch1.8 版本庫進行本次實驗。
BMM-Fast-SCNN 網(wǎng)絡(luò)訓(xùn)練需要大量的數(shù)據(jù),才能學(xué)習(xí)到海底線的特征并具有很好的魯棒性。 由于側(cè)掃聲吶數(shù)據(jù)沒有公開數(shù)據(jù)集,需要選取一條具有豐富特征的側(cè)掃聲吶測線,進行側(cè)掃聲吶數(shù)據(jù)集的制作。 本文選取采樣于千島湖地區(qū)的側(cè)掃聲吶測線數(shù)據(jù),該測線數(shù)據(jù)共17 920 個Ping,按照本文1.3 節(jié)的數(shù)據(jù)預(yù)處理的方法得到17 920 個樣本數(shù)據(jù)和對應(yīng)的標簽數(shù)據(jù)。 樣本數(shù)據(jù)按照6 ∶2 ∶2 比例劃分為訓(xùn)練集、驗證集和測試集。
為了檢驗不同方法分割海底線的效果,選取圖像分割領(lǐng)域中主流檢測指標對模型進行性能評估。本文采用Dice 系數(shù)(Dice Similariy Coefficient,Dice)以及交并比(Intersection over Union,IoU)作為分割精度的指標,另外選取模型執(zhí)行時間作為分割速度的指標。 其中Dice 系數(shù)表示兩個集合間相似度的度量,其取值范圍為[0,1],取值越大表示兩個集合樣本相似度越高,其計算式如式(4)所示;交并比為真實值集合與預(yù)測值集合的交集及其并集的比值,其取值范圍為[0,1],計算式如式(5)所示。
式中:TP 表示預(yù)測正確的水柱區(qū)采樣點的樣本個數(shù),F(xiàn)P 表示圖片區(qū)采樣點被誤檢為水柱區(qū)采樣點的樣本個數(shù),F(xiàn)N 表示水柱區(qū)采樣點被誤檢為圖片區(qū)采樣點的樣本個數(shù)。
實驗基于pytorch 的深度學(xué)習(xí)框架,本文研究的是海底線提取,屬于二分類問題,輸出層經(jīng)過Softmax 后,選擇交叉熵函數(shù)作為訓(xùn)練時的損失函數(shù),其公式如式(6)所示:
式中:N表示預(yù)測序列和目標序列的長度,pi表示目標序列中第i個采樣點概率,yi表示第i個采樣點處標簽值的類別,正類為1,負類為0。 本文選用Adam優(yōu)化器方法[20]作為參數(shù)優(yōu)化器,學(xué)習(xí)率設(shè)置為0.001,batch size 設(shè)置為64,訓(xùn)練一共迭代40 輪。
3.4.1 模型的消融實驗
為了驗證本文算法的有效性及各個模塊對Fast-SCNN-1D 網(wǎng)絡(luò)的性能提升,本文在4 種不同F(xiàn)ast-SCNN-1D 網(wǎng)絡(luò)上進行了消融實驗。 選用本文3.1 節(jié)獲得的側(cè)掃聲吶數(shù)據(jù)集進行訓(xùn)練,得到測試結(jié)果如表1 所示。
表1 各模型的分割性能指標表
Fast-SCNN-1D 的Dice 系數(shù)和IoU 分別為99.78%和99.57%,在分別添加BISM 和MFFM 模塊后,模型的Dice 系數(shù)和IoU 都得到了一定的提升。 使用全部模塊搭建的BMM-Fast-SCNN 模型在分割精度指標上表現(xiàn)最好,其Dice 系數(shù)和IoU 指標分別為99.90%和99.84%,相較于Fast-SCNN-1D 網(wǎng)絡(luò)分別提升了0.12%和0.27%,同時在模型執(zhí)行時間上保持著良好的性能,這充分體現(xiàn)本文提出的模塊能有效提高海底線的分割精度,并保持良好的執(zhí)行時間。
3.4.2 與其他方法對比
為了驗證本文提出方法在實時正確提取海底線時的優(yōu)越性,本文選取了Yan 等[12]的1D-UNet 網(wǎng)絡(luò)、Qin 等[13]的U-Net-1D6網(wǎng)絡(luò)和本文算法進行分割精度和實時性的比較。 表2 為各算法分割性能指標表。由實驗結(jié)果可知Yan 等[12]提出的方法在實時性上表現(xiàn)更好,但分割精度指標較本文算法偏低。 本文算法經(jīng)過加入BISM 和MFFM 模塊,網(wǎng)絡(luò)層數(shù)進一步加深,分割精度較之其他方法有明顯的提升,其中在Dice 系數(shù)和IoU 指標上分別至少提高了0.26%和0.49%。
表2 各算法的分割性能指標表
為了驗證本文算法在水柱區(qū)存在大量噪聲時提取海底線的能力,選取由HMS-6x4 側(cè)掃聲吶在千島湖地區(qū)采取的兩條測線進行海底線提取實驗,并選取Yan 等[12]的1D-UNet 網(wǎng)絡(luò)、Fast-SCNN-1D 網(wǎng)絡(luò)、Yan 等[11]的1D-CNN 網(wǎng)絡(luò)、Qin 等[13]的U-Net-1D6網(wǎng)絡(luò)以及本文算法進行海底線提取精度對比實驗。 五種算法的海底線提取效果如圖11 所示,其中a 是側(cè)掃聲吶瀑布圖,b 是海底線標注圖,c 是Yan等[12]1D-UNet 網(wǎng)絡(luò)提取結(jié)果圖,d 是Fast-SCNN-1D網(wǎng)絡(luò)提取結(jié)果圖,e 是Yan 等[11]1D-CNN 網(wǎng)絡(luò)提取結(jié)果圖,f 是Qin 等[13]U-Net-1D6網(wǎng)絡(luò)提取圖,g 是本文算法提取結(jié)果圖。 如圖11(a1)所示,測線1 的瀑布圖在水柱區(qū)具有較強的干擾,水柱區(qū)的懸浮物距離海底線較近,且在一部分探測區(qū)域,左側(cè)海底線的特征完全被噪聲淹沒。 從圖中得知,在水柱區(qū)干擾較大時,1D-UNet、Fast-SCNN-1D 和1D-CNN 網(wǎng)絡(luò)均不能很好地跟蹤海底線,預(yù)測的海底線會出現(xiàn)大量的突變點,海底線提取并不連續(xù),U-Net-1D6網(wǎng)絡(luò)相較于前三種網(wǎng)絡(luò),能較好地提取海底線,提取精度表現(xiàn)較好;而本文算法在加入BISM 和MFFM 模塊后,學(xué)習(xí)到海底線的對稱特征,并能很好地提取海底線的細小特征,其提取結(jié)果和標注的海底線位置最接近,魯棒性更好。 如圖11(a2)所示,測線2 的瀑布圖在水柱區(qū)的噪聲相對較少,但在方框處出現(xiàn)未知增益突變,且采樣中心具有較強的聲吶自噪聲。 從圖中可知,1D-UNet、Fast-SCNN-1D、四種網(wǎng)絡(luò)均保持較好的提取效果,僅存在少量突變點,提取效果較好,本文算法在整個測線區(qū)間保持很好的提取效果,未出現(xiàn)突變點,海底線提取精度最好。
圖11 海底線提取效果圖
表3 給出了Yan 等[12]的1D-UNet、Fast-SCNN-1D、Yan 等[11]的1D-CNN、Qin 等的U-Net-1D6和本文算法在上述兩條測線下的海底線跟蹤精度。
表3 海底線提取精度對比表
在測線1 中,Yan 等[12]的1D-UNet、Fast-SCNN-1D 和Yan 等[11]的1D-CNN 跟蹤精度表現(xiàn)較差。Qin 等[13]的U-Net-1D6跟蹤精度表現(xiàn)較好。 本文算法表現(xiàn)最優(yōu)異,在兩種跟蹤精度上,相較于Yan等[12]的1D-UNet 分別提高了28.1%和39.26%,相較于Fast-SCNN-1D 分別提高了10.23%和19.09%,相較于Yan 等[11]的1D-CNN 分別提高了31.17%和28.54%,相較于Qin 等[13]的U-Net-1D6分別提高了1.41%和9.07%。 在測線2 中,五種算法的海底線提取精度均表現(xiàn)優(yōu)異,在兩種跟蹤精度上,本文算法相較于Yan 等[12]的1D-UNet 分別提高了3.62%和1.07%,相較于Fast-SCNN-1D 分別提高了1.56%和0.48%,相較于Yan 等[11]的1D-CNN 分別提高了0.74%和2.81%,相較于Qin 等[13]的U-Net-1D6分別提高了4.95%和1.92%。 在不同測線環(huán)境下,本文算法相較于其他方法均取得較好跟蹤精度。
通過使用從杭州千島湖采集的數(shù)據(jù)進行實驗,驗證了本文方法的有效性,本文算法借助海底線對稱性的先驗知識,增強了網(wǎng)絡(luò)的魯棒性,能夠在單側(cè)噪聲較強時有效提取海底線。 然而本文方法在水柱區(qū)左右兩側(cè)均存在噪聲干擾時,無法正確分割海底線位置。 如圖12 所示,噪聲幾乎充滿了整個水柱區(qū)域,兩側(cè)海底線的位置均不明顯,這種情況下,本文提出的BISM 模塊不能有效降低水柱區(qū)噪聲的干擾,無法向網(wǎng)絡(luò)提供有效的特征信息,導(dǎo)致算法無法提取到海底線位置。
圖12 水柱區(qū)充滿噪聲的回波信號
本文提出了BMM-Fast-SCNN 網(wǎng)絡(luò)用于提取海底線位置。 采用BISM 使得網(wǎng)絡(luò)學(xué)習(xí)到海底線的對稱特征,通過MFFM 模塊提高網(wǎng)絡(luò)提取海底線細小特征的能力。 經(jīng)實驗證明,本文算法相較于現(xiàn)有的實時提取海底線的算法,在噪聲干擾較大時,可以有效提高提取海底線的精度,并保持良好的實時性能。
本文算法也存在一定的局限性:本文算法在噪聲較大時提取精度仍然有限,且當(dāng)水柱區(qū)左右兩側(cè)均存在較多的噪聲干擾時,本文算法將失效,海底線無法正確提取。 下一步工作是進一步提高網(wǎng)絡(luò)在噪聲干擾下的海底線提取精度。