亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于聲吶圖像的水下目標識別研究綜述

        2022-11-21 08:35:48檀盼龍吳小兵張曉宇
        數(shù)字海洋與水下攻防 2022年4期
        關(guān)鍵詞:方法模型

        檀盼龍,吳小兵,張曉宇

        (1. 南開大學(xué) 人工智能學(xué)院,天津 300350;2. 海軍研究院,北京 100161)

        0 引言

        隨著水下探測需求的日益增長,水下目標識別成為近年來非?;钴S的研究領(lǐng)域之一,其在水環(huán)境測深與建模[1]、海床建模與繪圖[2]、海底管道探測[3]、海底目標定位與識別[4]以及水雷、潛艇等水下目標物的探測[5]等領(lǐng)域得到了廣泛的應(yīng)用。無線電信號和視覺信號在水介質(zhì)中的衰減較快,而聲波在水中可以傳播得更遠,因此聲探測是感知水下目標的有效方法[6],近年來,聲吶設(shè)備的使用也呈爆發(fā)式增長。與陸地和空中的圖像獲取方法相比,水下圖像的獲取更加困難,而且存在成本高、質(zhì)量差等缺點,可用于分析和研究的聲吶數(shù)據(jù)往往數(shù)量和質(zhì)量均有不足,這給水下目標的探測與識別帶來諸多挑戰(zhàn)。如何提高目標識別的準確率和快速性、降低計算和通信成本以及減小識別算法的復(fù)雜度,都是水下目標識別中面臨的關(guān)鍵問題。

        水下目標的識別主要依靠聲吶設(shè)備,包括前視聲吶[7]、側(cè)掃聲吶[8]和合成孔徑聲吶[9]等,一般通過在航行中不斷發(fā)射和接收聲吶信號實現(xiàn)目標探測。探測聲吶基于目標物對入射聲波的反向散射原理探測水下目標形態(tài),能夠直觀地提供水下目標物形態(tài)的聲成像[10]。隨著聲吶技術(shù)的發(fā)展,合成孔徑聲吶等新型聲吶設(shè)備可以得到更高的方位方向分辨力[11],且這種分辨力與水下探測距離無關(guān),距離越大,合成孔徑長度越長,合成陣的角分辨率越高,從而抵消了距離的影響,保持分辨力不變。

        水下目標識別過程一般包括特征提取和目標分類等[12],經(jīng)過多年的發(fā)展,已經(jīng)提出了多種基于聲吶圖像的水下目標識別算法。傳統(tǒng)的信號處理方法,如短時傅里葉變換(Short Time Fourier Transform,STFT)、希爾伯特–黃變換[13]、小波變換[14]等,都可以用來提取水下聲信號的特征。此外,常用的目標檢測算法有基于恒虛警率(Constant False Alarm Rate,CFAR)檢測算法[15]、單元平均恒虛警率(Cell Averaging-Constant False Alarm Rate,CA-CFAR)算法[16]和累積單元平均恒虛警率(Accumulated Cell Averaging-Constant False Alarm Rate,ACA-CFAR)算法[17]等,此類算法通過將設(shè)定閾值與聲吶圖像的像素灰度進行比較以實現(xiàn)水下目標的檢測與識別。然而,這些算法未能充分考慮結(jié)構(gòu)特征,導(dǎo)致了如魯棒性差和識別率低等問題[18]。在選擇特征時,使用傳統(tǒng)的信號處理方法比較方便,但需要專家監(jiān)督來保證特征選擇的有效性。聲吶系統(tǒng)和聲吶技術(shù)的發(fā)展為水下目標的探測識別提供了更加豐富的細節(jié)信息,尤其為對水雷等幾何外形較小的目標探測提供了可能,但傳統(tǒng)的信號處理算法和機器學(xué)習(xí)算法對這類非顯著目標存在較高的漏檢可能,而深度學(xué)習(xí)算法可以通過深度神經(jīng)網(wǎng)絡(luò)實現(xiàn)更高的識別率。因此,研究人員正試圖用神經(jīng)網(wǎng)絡(luò)和深度學(xué)習(xí)算法等智能系統(tǒng)取代人工特征提取或傳統(tǒng)的信號處理方法,以跟蹤、檢測和分類水下聲學(xué)信號。

        針對聲吶圖像識別的相關(guān)問題和進展,本文給出了聲吶圖像預(yù)處理、聲吶圖像分割以及聲吶圖像智能識別方面的最新研究進展,總結(jié)了相關(guān)方向亟待解決的科學(xué)問題及未來發(fā)展趨勢。

        1 水下目標識別預(yù)處理

        水下目標識別預(yù)處理過程主要是指聲吶圖像去噪,目的是通過減弱或者消除干擾信號得到更清晰、質(zhì)量更好的圖像。通過提高聲吶圖像的信噪比提高目標識別精度,是整個圖像處理過程中非常重要的一步。聲吶圖像去噪可以分為空間域方法和變換域方法2類,其中空間域方法直接通過對聲吶圖像本身的像素點灰度值進行處理實現(xiàn)降噪,而變換域方法則將聲吶圖像通過域轉(zhuǎn)換方式在新空間中對其特征進行分析。

        1.1 空間域聲吶圖像去噪方法

        空間域去噪方法實現(xiàn)過程相對簡單,主要包括中值濾波和均值濾波等[19-21]。均值濾波是典型的線性濾波算法,通過對像素點鄰域的數(shù)值進行平均,再將均值賦予當(dāng)前像素實現(xiàn)去噪。均值濾波雖然實現(xiàn)簡單,但會使局部特征變模糊,不利于后續(xù)處理。相對而言,中值濾波是一種非線性濾波算法,實現(xiàn)方式是將像素點鄰域中各點值的中值代替該點的值,從而消除孤立的噪聲點。中值濾波可以較好保留聲吶圖像的邊緣信息,但也很容易產(chǎn)生邊緣抖動,因此進一步的研究轉(zhuǎn)向了自適應(yīng)中值濾波、多級中值濾波等方法。在文獻[22]中,研究人員提出了基于極值等方法的中值濾波改進算法,對具有先驗知識的聲吶圖像噪聲進行濾波。然而,水下環(huán)境中存在的噪聲復(fù)雜多變,噪聲信息的模型很難獲取,導(dǎo)致上述方法存在著去噪與保持圖像細節(jié)的矛盾。因此,如何針對不同特性的噪聲選擇有效的聲吶圖像去噪方法,既能去除噪聲又能完整地保持圖像的特征信息,是水下聲吶圖像去噪的一個難點問題。

        針對聲吶圖像去噪中的矛盾問題,目前最常用的解決思路是采樣基于偏微分方程(Partial Differential Equation,PDE)的方法,通過求解方程最優(yōu)解實現(xiàn)去噪。目前已提出的偏微分方程模型有:TV(Total Variation)模型、ROF(Rudin-Osher- Fatemi)模型、PM(Perona-Malik)模型以及高階變分模型等[23-26]。高階變分模型在消除聲吶圖像中的階梯效應(yīng)方面具有優(yōu)勢,如利用拉普拉斯算子構(gòu)造高階PDE模型實現(xiàn)濾波[27],但在實際應(yīng)用中不能保持清晰的邊界形態(tài)??傮w來說,空間域去噪方法具有較大的局限性,很難實現(xiàn)降噪性能的綜合提高。

        1.2 變換域聲吶圖像去噪方法

        變換域去噪方法是將聲吶圖像從空間域轉(zhuǎn)換到變換域,然后在變換域中對數(shù)據(jù)進行處理和分析,最后通過反變換回到空間域以實現(xiàn)去噪,盡可能多地保留了聲吶圖像在多尺度下的特征信息。經(jīng)典的變換方法有傅里葉變換、小波變換等[28-29]。目前變換域去噪方法應(yīng)用較多的是小波域HMT模型(Hidden Markov Tree Model),在去噪時,采用混合高斯模型刻畫各子帶系數(shù)的概率分布,并利用多個尺度之間的馬爾可夫依賴性描述小波系數(shù)隨尺度變化的持續(xù)性和尺度內(nèi)的聚集性,從而對小波系數(shù)之間的關(guān)系進行分析[30]。為突破一維小波的局限性,DACUNHA等[31]提出了Contourlet變換法對聲吶圖像中存在的高斯噪聲和普通加性噪聲進行處理,雖然達到了較好的去噪效果,但Contourlet變換不具備平移不變性,因此會引入偽吉布斯現(xiàn)象,導(dǎo)致觀察效果和識別率的降低。針對該問題,研究人員舍棄Contourlet變換中的下采樣環(huán)節(jié),通過非下采樣Contourlet變換實現(xiàn)了變換的平移不變性,與閾值法相結(jié)合有效抑制了聲吶圖像中的噪聲。文獻[32]更是通過將Contourlet變換與HMT模型相結(jié)合分析和描述聲吶圖像不同方向間系數(shù)相關(guān)性,同時再利用貝葉斯準則估計無噪聲吶圖像的Contourlet系數(shù),對于對比度差、特征信息弱的聲吶圖像處理效果更佳。

        2 圖像分割方法

        在成像聲吶的實際應(yīng)用中,聲吶圖像分割通常是一個基礎(chǔ)且重要的步驟。聲吶圖像分割的目的是將聲吶圖像劃分為不同的部分,從海底背景中提取目標和陰影并盡量保留圖像原始邊緣信息。相對于光學(xué)圖像,聲吶圖像具有低分辨率和高噪聲的特點,同時還受到海底混響的影響,導(dǎo)致聲吶圖像分割成為了該領(lǐng)域的難題,很多國家的研究人員都在聲吶圖像分割方法的研究方面做了大量工作。在聲吶圖像分割算法中,主要可以分為有監(jiān)督和無監(jiān)督2種。

        2.1 監(jiān)督分割算法

        聲吶圖像的監(jiān)督分割是基于實況分割訓(xùn)練集進行分類器訓(xùn)練的過程,常用方法是基于反向散射(Back Scatter,BS)強度模型進行分割。然而上述方法過于簡單,無法處理聲吶圖像中存在的紋理問題,而且反向散射的測量值與入射角和海底類型有關(guān),實際應(yīng)用效果不理想。針對入射角問題,研究人員提出了多種對聲吶圖像入射角變化進行建模的方法[33-34],但同樣因為不同海底類型的聲學(xué)特性差異而無法實現(xiàn)精確補償,而且大多只局限于一種海底背景類型。

        近些年,有學(xué)者提出利用海底紋理提高分割精度的方法,在應(yīng)用中考慮反向散射角度變化和紋理特征實現(xiàn)目標分割[35]。基于紋理的海底聲吶圖像分割通常依賴Haralick參數(shù)[36]和濾波器系數(shù)來建模紋理[37]。在紋理分析領(lǐng)域,作為局部濾波器響應(yīng)的統(tǒng)計數(shù)據(jù)計算特征可以用于描述和鑒別紋理模型[38-39]。在這些研究的基礎(chǔ)上,KAROUI[40]根據(jù)一組不同濾波器的紋理響應(yīng)對海底類型進行描述,在不同的聲吶紋理間引入相似性度量,并使用紋理特征作為過濾海底聲學(xué)影響的邊緣分布模型,以達到圖像分割的目的?;谪惾~斯框架的圖像分割方法是一種常用的監(jiān)督圖像分割方法,其中研究最多的是最大后驗概率法(Maximum Posteriori,MAP)[38]和最大邊際概率法(Maximum Marginal Probability,MMP)[39],而且已發(fā)表的文獻表明MMP比MAP更適合圖像分割[39]。與貝葉斯方案不同,另一種監(jiān)督圖像分割方法在區(qū)域?qū)用嫔媳硎緸榧s束能量準則的最小化[40],兩者都基于海底類型圖像之間的一種新的相似性度量,產(chǎn)生的加權(quán)因子一方面用于濾波器選擇,另一方面用于考慮海底紋理的入射角依賴性。目前對監(jiān)督分割算法的研究應(yīng)用較少,而對無監(jiān)督分割算法研究更加充分。

        2.2 無監(jiān)督分割算法

        無監(jiān)督分割算法計算復(fù)雜度低,而且模型簡單,因此應(yīng)用更廣泛,算法類型也更多。無監(jiān)督分割算法一般需要通過學(xué)習(xí)來實現(xiàn)自動分割,目前已有的聲吶圖像分割有基于模糊c-均值(Fuzzy C-means,F(xiàn)CM)聚類的聲吶圖像分割方法[41]、基于馬爾可夫隨機場(Markov Random Field,MRF)模型的分割方法[42-43]、基于Snake模型和水平集的分割方法[44-46]、基于譜聚類的方法[47-48]、基于期望最大化的方法[49-50]以及基于小波變換的方法等。

        在聲吶圖像分割方法中,基于小波分析實現(xiàn)的分割方法由于其良好的空間/頻率定位能力和多尺度(多分辨率)分析能力而適合于圖像分割[51-56]。GONZALEZ和WOODS認為基于小波的方法可以發(fā)現(xiàn)在一種分辨率下可能未被發(fā)現(xiàn)而在另一種分辨率下可能容易被發(fā)現(xiàn)的特征[57]。因此,基于小波的聲吶圖像分割方法對于解決聲吶目標識別問題具有突出優(yōu)勢。

        2.2.1 基于小波的聲吶圖像分割常用方法

        一個給定的圖像可以通過小波變換在不同的分辨率水平上進行分析。對于聲吶圖像,由于不同的紋理是以不同的分辨率記錄的,不同的紋理在不同的細節(jié)子帶有不同的能量值,因此可以通過不同子帶的小波系數(shù)對紋理進行分析和分類。JAVIDAN[58]提出了通過子帶中小波系數(shù)的振幅來描述能量的方法,在對各層的小波子圖像進行粗略分割后,將粗略分割結(jié)果融合為精細分割圖像,粗略的分割結(jié)果與模糊邊緣檢測器的分割結(jié)果混合,得到最終的分割圖像。WILLIAMS[59]根據(jù)海底的實際情況,選擇2 m×2 m的海底區(qū)域作為小波變換的數(shù)據(jù)源,同樣采用計算能量值的方法進行分析,聲吶圖像的紋理信息通過五層小波系數(shù)計算的特征向量得到了完整準確的描述。譜系聚類算法[60]同樣被用來根據(jù)聲吶圖像特征進行識別,該方法使用了K–均值聚類算法,但K–均值聚類算法有一個固有的缺點,即會陷入局部最優(yōu),因此效果過度依賴于聚類中心的選擇。WILLIAMS和GROEN對上述方法進行了改進[61],將 K–均值聚類算法用無監(jiān)督的變異貝葉斯高斯混合模型取代[62],實驗結(jié)果表明,改進后的方法達到了相對理想的分割結(jié)果。在COBB和PRINCIPE[63]的實驗中,同樣證明了小波系數(shù)在描述聲吶圖像的紋理信息方面的優(yōu)異性能。每種海床類型都有其獨特的紋理特征,WILLIAMS[64]提出了使用獨特的高斯混合模型來表達建立在小波系數(shù)上的海底紋理類型的方法,原始聲吶圖像被基于小波的特征矢量取代,并通過貝葉斯理論對海床進行分類,同樣也可以應(yīng)用于海底聲吶圖像的分割。

        BAUSSARD[65]提出了一種基于小波變換和貝葉斯框架的海底聲吶圖像分割方法,基于二維可轉(zhuǎn)向Riesz小波的方法對聲吶圖像進行變換,然后得到低頻近似子帶系數(shù)和高頻詳細子帶系數(shù),其中高頻子帶系數(shù)基于傳統(tǒng)的廣義高斯分布(Generalized Gaussian Distribution,GGD)建模[66],低頻子帶的系數(shù)則是基于高斯的有限混合模型來建模[67]。BAUSSARD保留了KARINE等人省略的低頻近似子帶[68],可以提高具有類似特征(如沙子和淤泥)的海床的分類精度。因此,海底聲吶圖像可以被更準確地分割。總的來說,WILLIAMS[69]和SONG[70]等的方法可以應(yīng)用于具有明顯紋理特征的海底聲吶圖像的分割。KARINE等[71]用滑動窗口將聲吶圖像進行劃分,然后對每個窗口進行小波變換,對小波子帶系數(shù)進行統(tǒng)計建模,用GGD和α-stable分布參數(shù)作為聲吶圖像的特征。

        小波變換有一些局限性,一個限制是對方向?qū)傩缘拿枋霾粔虺浞?,另一個限制是對小波參數(shù)敏感。鑒于此,夏平等[72]提出了雙樹復(fù)合小波變換(Dual-tree Complex Wavelet Transform,DTCWT),在一定程度上可以提高圖像分割的精度。吳濤[73]和夏平的方法可以充分利用聲吶圖像的先驗知識,達到了更準確的分割結(jié)果。然而,由于這些方法比較復(fù)雜,因此僅適用于低實時性要求的情況。在分割速度方面,KAROUI等[74]提出了一種基于紋理散射強度分割聲吶圖像的方法,利用多分辨率分析的優(yōu)勢,通過直接測量小波變換得到的信息量最大的相似性來區(qū)分紋理,并將不同尺度的分割結(jié)果融合在一起,從而得到最終的分割結(jié)果。CELIK和TJAHJADI利用小波變換分辨率之間的數(shù)據(jù)提取每個像素的特征向量[75],通過主成分分析(Principal Component Analysis,PCA)降低了特征向量的維度,并通過 K–均值聚類算法將特征向量分為不同類型,從而實現(xiàn)對側(cè)掃聲吶圖像的分割,而且具有較強的抗干擾能力。此外,PCA降維也將算法的速度提高到一個可接受的范圍,還可以很好地保留圖像細節(jié)。夏平等[76]在提出的分割方法中使用了多尺度統(tǒng)計信息的FCM聚類和小波域的MRF,在建立小波子帶 MRF之前使用 FCM聚類算法進行預(yù)分割,提高了后續(xù)小波子帶MRF的收斂率,實現(xiàn)聲吶圖像的穩(wěn)定和準確分割。

        2.2.2 基于超小波的聲吶圖像分割

        由于小波變換在一些方面比傅里葉變換更具有優(yōu)勢,因此被廣泛用于圖像處理的各個領(lǐng)域[77],但小波變換不是圖像表示的最佳工具,只能表達奇異點的位置和特征,不能完全表征圖像中多方向的邊緣和紋理等幾何特征。DO和VETTERLI[78]提出,一個優(yōu)秀的圖像表示工具應(yīng)該滿足多分辨率、具有方向性以及各向異性等特征,而小波轉(zhuǎn)換只符合上述的一些性質(zhì)。為了尋求更好的圖像表示工具,更有效地表示和處理圖像高維空間數(shù)據(jù),研究人員提出了超小波變換,并迅速成為研究熱點。超小波變換是幾個具有幾何特征的“小波變換”的聯(lián)合體,是小波變換的延伸,可以滿足上述所有的圖像表示性質(zhì),并在圖像處理中取得了巨大的成功。超小波變換包括 ridgelet,curvelet,bandelet,contourlet,beamlet,surfacelet等多種不同的變換算法,引起了圖像分割領(lǐng)域研究者的關(guān)注[77]。由于小波變換的一些優(yōu)良特性,小波變換非常適用于圖像處理,如去噪、壓縮和特征提取,超小波方法同樣在聲吶圖像分割中得到了應(yīng)用。在過去的幾年里,小曲線變換(Curvelet Transform,CVT)在應(yīng)用數(shù)學(xué)和信號處理界引起了越來越多的興趣[79]。小曲線變換是一種多尺度的方向性變換,可以對圖像邊緣進行幾乎最佳的非適應(yīng)性稀疏表示,因此可以比小波變換更有效地表示邊緣特征和曲線奇異性。YOON和KIM提出了一種基于CVT的有效的邊緣增強方法[80],用于聲吶圖像中的物體識別,在該方法中,最大值是由每個角線的系數(shù)計算出來的,該系數(shù)來自CVT的子步驟,在找到該值的方位角后,通過局部最大值選擇來確定真正的邊緣方向。

        非采樣小輪廓變換(Non-subsampled Contourlet Transfer,NSCT)可以實現(xiàn)多尺度、多方向和平移不變的靈活分解,具有更好的邊緣捕獲和表達能力[81]。王敏等[82]引用了基于 NSCT的光學(xué)圖像邊緣檢測的超小波模數(shù)最大值方法,以獲得各尺度方向子帶的模數(shù)最大值,在閾值處理之后,得到圖像在每個尺度方向子帶的邊緣圖像,最后將一個尺度內(nèi)和尺度間的邊緣融合,得到單像素寬的邊緣圖像。該方法得到的邊緣是相對完整的,偽邊緣點的數(shù)量較少,但比較復(fù)雜,適合于低實時性要求。LI等人將 NSCT與區(qū)域分割的思想相結(jié)合[83],使用K–均值聚類算法分割陰影區(qū)域,并搜索高頻中的模數(shù)最大位置,以更準確地確定圖像邊緣,然后在一個標度和標度之間將圖像邊緣融合,最后通過區(qū)域增長法對圖像進行分割。HUO等人將NSCT與灰度共現(xiàn)矩陣(Gray-level Co-occurrence Matrix,GLCM)結(jié)合[76],在NSCT領(lǐng)域提取圖像特征,以彌補在提取 GLCM紋理特征時細節(jié)紋理表達不足的缺陷。將這2種紋理特征結(jié)合生成每個像素的多維特征向量,可以提高圖像分割的準確性。總的來說,基于超小波變換的聲吶圖像分割方法計算量大,適合于低實時性和高精度的分割要求。

        3 基于深度學(xué)習(xí)的聲吶目標識別

        聲吶目標識別是指從聲吶圖像中提取水下目標特性并對目標進行分類識別,主要過程為特征提取和目標分類。然而海水介質(zhì)的非均勻性會造成聲信號的衰減和畸變,同時各種漂浮物和顆粒都會增大聲波傳輸過程中的多路徑效應(yīng),使得傳統(tǒng)的聲吶目標識別方法很難取得較好的識別效果[84-86]。深度學(xué)習(xí)以人工神經(jīng)網(wǎng)絡(luò)為基礎(chǔ),由多個處理層組成計算模型研究具有不同抽象級別的數(shù)據(jù)。深度學(xué)習(xí)結(jié)構(gòu)可以處理非結(jié)構(gòu)化和結(jié)構(gòu)化數(shù)據(jù),并且無需手動操作即可執(zhí)行自動特征提取,極大地提升了包括自動聲吶目標識別在內(nèi)的不同領(lǐng)域的最新技術(shù)[87-88]。

        深度學(xué)習(xí)算法可以分為有監(jiān)督、半監(jiān)督和無監(jiān)督等多種形式。有監(jiān)督學(xué)習(xí)方法是建立在使用正確分類的數(shù)據(jù)或標簽訓(xùn)練模型的基礎(chǔ)上的,當(dāng)新數(shù)據(jù)輸入到體系結(jié)構(gòu)時,訓(xùn)練過的深度學(xué)習(xí)模型可以準確地估計輸出。無監(jiān)督學(xué)習(xí)功能用于無監(jiān)督數(shù)據(jù)集,可以在不提供損失信號的情況下研究和建立信息映射,評估可能的解決方案[89]。半監(jiān)督學(xué)習(xí)方法僅使用一小部分標記數(shù)據(jù)[90],使用有監(jiān)督學(xué)習(xí)方法對未標記數(shù)據(jù)進行最佳預(yù)測,通過使用反向傳播算法查找和學(xué)習(xí)輸入中的模式,克服了無監(jiān)督和有監(jiān)督方法的局限性。另外一種廣泛采用的深度學(xué)習(xí)技術(shù)是遷移學(xué)習(xí),即除了標準的訓(xùn)練數(shù)據(jù)外,還有 1個來自一個或多個相關(guān)任務(wù)知識的補充信息源。當(dāng)數(shù)據(jù)量巨大時,深度學(xué)習(xí)方法能夠有效地實現(xiàn)目標識別,然而在現(xiàn)實世界中,大量有效聲吶圖像數(shù)據(jù)是不易獲得的,遷移學(xué)習(xí)則解決了訓(xùn)練數(shù)據(jù)不足的問題[91]。

        深度學(xué)習(xí)技術(shù)的上述優(yōu)點吸引了研究人員在諸多領(lǐng)域廣泛使用該算法,包括圖像、語音和文本識別、目標檢測、模式識別、故障和異常診斷等。在基于聲吶圖像的目標識別應(yīng)用中,深度學(xué)習(xí)模型顯示了其優(yōu)越性,具有較高的精度和可靠性。接下來將對常用的深度學(xué)習(xí)模型及其在聲吶圖像識別中的應(yīng)用進行介紹。

        3.1 卷積神經(jīng)網(wǎng)絡(luò)模型

        LECUNN首先提出了用于圖像處理的卷積神經(jīng)網(wǎng)絡(luò)(Convolutional Neural Networks,CNN)[92],隨著GPU和制造業(yè)的興起,卷積神經(jīng)網(wǎng)絡(luò)極大地促進了計算機視覺、自然語言處理、文本和語音識別、目標檢測、醫(yī)療預(yù)測等領(lǐng)域的發(fā)展。其中,CNN在計算機視覺中得到了廣泛應(yīng)用,在AlexNet之后,深度卷積神經(jīng)網(wǎng)絡(luò)的發(fā)展階段在短時間內(nèi)迅速取代了傳統(tǒng)的圖像分類和識別方法[93]。CNN的多層結(jié)構(gòu)可以自動提取多個層次特征,通過卷積和池化操作以及參數(shù)共享使深度學(xué)習(xí)結(jié)構(gòu)能在各種設(shè)備中運行,在圖像處理中提供了穩(wěn)健而高效的性能,因此得到了廣泛應(yīng)用[94]。文獻[95]提出了一種基于深度學(xué)習(xí)的目標和非目標合成聲吶孔徑圖像分類方法,融合異常檢測器用于縮小合成聲吶孔徑圖像中的像素范圍并提取目標大小的圖像塊。檢測器根據(jù)其周圍的鄰域計算所有像素的目標概率值后,生成與原始圖像大小相同的置信圖,置信圖僅允許相鄰的感興趣區(qū)域(Region of Interests,ROI)作為分類器要考慮的最期望像素。為了解決水下數(shù)據(jù)匱乏的問題,文獻[96]提出了一種在訓(xùn)練圖像準備階段的端到端傳輸圖像合成生成方法,從UWSim中的模擬深度相機中為合成訓(xùn)練數(shù)據(jù)集捕獲一幅基礎(chǔ)圖像,采用StyleBankNet對水下環(huán)境中采集的聲吶圖像進行噪聲特性綜合,生成用于訓(xùn)練的數(shù)據(jù)集。在文獻[97]中,作者提出了一種有效的卷積網(wǎng)絡(luò)(ECNet)用于側(cè)掃聲吶圖像的語義分割。該網(wǎng)絡(luò)架構(gòu)包括用于捕獲上下文的編碼器網(wǎng)絡(luò)和用于像素級特征映射的解碼器網(wǎng)絡(luò),以增強邊緣分類效果。結(jié)果表明,與其他模型相比,該方法速度快、參數(shù)少,實現(xiàn)了效果與效率的最佳折衷。

        在文獻[98]中,CNN在前視聲吶圖像的目標檢測中得到了應(yīng)用。通過從實驗水箱捕獲不同形狀物體的前視聲吶圖像,使用 96×96大小的圖像作為CNN模型的輸入,所提的模型優(yōu)于模板匹配方法,準確率達到99.2%,而且模型參數(shù)更少,速度提高了40%,更具有實時應(yīng)用價值。在進一步工作中,Valdenegro[99]提出了用于在前視聲吶圖像中檢測和識別對象的模型,所提方法還可以用于任何聲吶圖像檢測未標記和未訓(xùn)練的目標,具有良好的泛化性能。文獻[100]對三維點云激光雷達數(shù)據(jù)和水下聲吶圖像應(yīng)用了2種聚類程序,在2個數(shù)據(jù)集上使用 CNN和完全卷積網(wǎng)絡(luò)(Fully Convolutional Networks,F(xiàn)CN)產(chǎn)生的輸出均采用K–均值聚類和基于密度的空間聚類(Density-based Spatial Clustering of Applications with Noise,DBSCAN)方法進行處理,消除了異常值,并對有意義的數(shù)據(jù)進行了識別和分組,改進了多目標檢測的結(jié)果。在該研究中,F(xiàn)CN用于訓(xùn)練和測試水下聲吶圖像數(shù)據(jù)集,然后將該數(shù)據(jù)集轉(zhuǎn)換為像素數(shù)據(jù)矩陣,最高可獲得100%的準確度。

        3.2 深層信念網(wǎng)絡(luò)模型

        深度信念網(wǎng)絡(luò)(Deep Belief Networks,DBN)是由受限玻爾茲曼機器(Restricted Boltzmann Machine,RBM)的幾個中間層組成的網(wǎng)絡(luò)模型,其中所有RBM層與前一層和后一層連接,層之間沒有連接,且最后一層用于分類。與其他體系結(jié)構(gòu)不同,DBN的所有層都學(xué)習(xí)整個輸入,更深層次的信念網(wǎng)絡(luò)通過分層表示輸入模式的幾個特征來解決這個問題。此外,DBN在學(xué)習(xí)中還優(yōu)化了所有層中的權(quán)重,按順序在所有層中做出最優(yōu)決策,最終獲得全局最優(yōu)解[88]。除了第一層和最后一層之外,DBN的所有層都具有雙重角色,包括作為前面節(jié)點的隱藏層和下一個節(jié)點的可見層或輸入層。這種結(jié)構(gòu)可以稱為由單層網(wǎng)絡(luò)構(gòu)成的體系結(jié)構(gòu),它能夠解決深度學(xué)習(xí)中的過擬合現(xiàn)象等問題,成功應(yīng)用于聲吶目標識別系統(tǒng)的檢測和分類[101]。

        文獻[102]提出了一種基于多角度傳感、分數(shù)傅里葉變換特征和3層隱藏DBN的聲吶目標分類算法,利用具有三維高光分布的目標原型,基于光線跟蹤法合成了主動目標回波。特征提取過程產(chǎn)生了基于100階分數(shù)傅里葉變換的特征,這些特征充分表示形狀變化并具有識別能力。DBN的平均準確率為91.40%,而100–24–4結(jié)構(gòu)BPNN模型的準確率為87.57%。與之類似,KE[103]提出了基于深度競爭信念網(wǎng)絡(luò)的算法,通過從標記和未標記對象中學(xué)習(xí)具有附加鑒別信息的特征來解決水聲目標檢測的小樣本維數(shù)問題。結(jié)果表明,該系統(tǒng)實現(xiàn)了90.89%的分類準確率。

        3.3 生成對抗網(wǎng)絡(luò)模型

        生成對抗網(wǎng)絡(luò)(Generative Adversarial Networks,GAN)是由 2 個網(wǎng)絡(luò)組成的深度神經(jīng)網(wǎng)絡(luò)體系結(jié)構(gòu),在使用任意輸入時,GAN會在輸出上創(chuàng)建對應(yīng)的信息[104]。GOODFELLOW等在文獻[105]中首先介紹了GAN網(wǎng)絡(luò),該網(wǎng)絡(luò)由鑒別器D和生成器G組成,生成器用于生成具有等效概率分布的樣本作為實際訓(xùn)練數(shù)據(jù)集,鑒別器負責(zé)識別輸入是來自實際數(shù)據(jù)集還是生成器,并引導(dǎo)生成器通過反向傳播梯度創(chuàng)建更真實的樣本數(shù)據(jù)。鑒別器擅長最大化或優(yōu)化類之間的距離,并區(qū)分來自訓(xùn)練數(shù)據(jù)集的真實圖像和生成器的再現(xiàn)樣本,生成器應(yīng)使生成的概率分布和真實數(shù)據(jù)分布盡可能接近,以使鑒別器無法在真實樣本和假樣本之間進行選擇。在這個對抗過程中,生成器改進了自身以學(xué)習(xí)真實的數(shù)據(jù)分布,鑒別器也提高了其特征學(xué)習(xí)能力。最后,訓(xùn)練達到納什均衡,此時鑒別器不能分離 2個分布。使用 GAN的大量工作可用于各種水下聲吶目標的檢測和分類。

        文獻[106]提出了一種基于條件生成對抗網(wǎng)絡(luò)(Conditional Generative Adversarial Network,CGAN)的真實感知圖像生成系統(tǒng),其中模型學(xué)習(xí)光學(xué)圖像和聲吶圖像之間的圖像到圖像轉(zhuǎn)換關(guān)系。作者用人工噪聲穩(wěn)定地使拍攝的相機圖像變暗,并將合成圖像和聲吶圖像作為輸入,從而生成夜間圖像,然后對模型進行訓(xùn)練,根據(jù)輸入生成真實的日間圖像。SUNG等[107]提出了一種生成真實聲吶片段或圖像的算法,以更好地使用聲吶信號。該方法包括聲吶圖像模擬和基于GAN的圖像變換2個步驟。首先,通過計算聲波的透射和反射,采用基于射線跟蹤技術(shù)的聲吶圖像模擬器,模擬器通過簡單的計算模擬包含語義信息(如高亮顯示和陰影)的圖像。然后,基于GAN的風(fēng)格轉(zhuǎn)換方法通過加上噪聲或通過去噪和分割將實際聲吶圖像轉(zhuǎn)換為簡單圖像,再將這些簡單圖像轉(zhuǎn)換為真實聲吶圖像。類似地,文獻[108]提出了一種生成全長任務(wù)真實側(cè)掃聲吶圖像的算法,稱為馬爾可夫條件 pix2pix(Markov Conditional pix2pix,MC-pix2pix),合成數(shù)據(jù)的生成速度比實際采集速度快18倍。對于專家來說,合成數(shù)據(jù)幾乎無法與實際數(shù)據(jù)區(qū)分開來。

        為了提高聲吶目標識別程序在新環(huán)境中的可用性和適應(yīng)性,文獻[109]中提出了一種基于GAN的方法,該方法用于將模擬接觸增強為實際聲吶圖像,合成觸點是在射線追蹤三維CAD模型上創(chuàng)建的,位于實際側(cè)掃海底的特定位置。通過計算海底的高程圖創(chuàng)建了真實的陰影。通過識別耦合陰影和高光(即連接到相鄰陰影的高程)來計算高程。然后,使用CycleGAN對合成接觸外觀進行細化。

        3.4 遞歸神經(jīng)網(wǎng)絡(luò)和長–短期記憶網(wǎng)絡(luò)模型

        遞歸神經(jīng)網(wǎng)絡(luò)(Recurrent Neural Networks,RNN)是一種允許以前的輸出作為輸入操作的神經(jīng)網(wǎng)絡(luò)。這些網(wǎng)絡(luò)可以記憶以前的狀態(tài),傾向于從早期階段學(xué)習(xí)。長–短期記憶(Long Short-Term Memory,LSTM)可以從早期和當(dāng)前階段獲取輸入,引入長短時記憶網(wǎng)絡(luò)可以有效解決RNN引起的梯度爆炸或消失問題。RNN廣泛應(yīng)用于語音和文本識別、自然語言處理和聲吶識別系統(tǒng)[110]。

        PERRY和GUAN提出了一種在中段掃描聲吶圖像中識別微小人造物體的算法,該圖像由安裝在船舶下方的聲吶結(jié)構(gòu)采樣而成[111],在距離移動船只200 m處進行目標檢測。作者首先在海底跟蹤物體的基礎(chǔ)上,對船只的運動進行了近似計算。在得到的圖像順序中,海底目標的外觀得到改善,雜波噪聲最小化。探測器的工作分2步進行,第1步,預(yù)先確定可能感興趣的對象;第2步,跟蹤第1步中識別的對象,并將特征向量序列提供給分類器,其中RNN為最終的檢測分類器。對使用RNN和使用非RNN得到的結(jié)果進行比較,可以看出所提出的方法實現(xiàn)了檢測成功率的提高。

        3.5 基于遷移學(xué)習(xí)的聲吶自動目標識別方法

        如前所述,基于深度學(xué)習(xí)的體系結(jié)構(gòu)能夠熟練地處理大量數(shù)據(jù)。然而,在現(xiàn)實世界中,獲取大量數(shù)據(jù)并不總是可行的,遷移學(xué)習(xí)方法則是為了解決這一數(shù)據(jù)不足的問題而提出的,是解決機器學(xué)習(xí)中訓(xùn)練數(shù)據(jù)不足的一種基本且被廣泛接受的方法[112],深度遷移學(xué)習(xí)方法也得到了廣泛的應(yīng)用[113]。在文獻[114]中,研究人員開發(fā)了一個用于在散射和極化等噪聲中對多波束聲吶圖像進行分類的模型,用于檢測潛水員等人形目標。DYLAN EINSI在其論文文獻[115]中提出了一種基于深度學(xué)習(xí)的遷移學(xué)習(xí)方法,用于側(cè)掃聲吶圖像的目標檢測。在這項研究中,使用一個系統(tǒng)的遷移學(xué)習(xí)方法來檢測目標或異常聲吶圖像,利用預(yù)先訓(xùn)練好的網(wǎng)絡(luò)學(xué)習(xí)聲吶圖像中基于像素強度的海底異常特征。使用基于遷移學(xué)習(xí)方法,作者可以通過一個小的訓(xùn)練數(shù)據(jù)集訓(xùn)練新生成的“You Only Look Once”(YOLO)模型,測試結(jié)果顯示識別結(jié)果的成功率提高到了95%。因此,通過遷移學(xué)習(xí)的方法來將可見光領(lǐng)域的檢測算法應(yīng)用于聲吶圖像處理是一個高效有用的技術(shù)途徑。

        4 結(jié)束語

        隨著科學(xué)技術(shù)的進步,聲吶自動目標識別在短時間內(nèi)得到了快速發(fā)展。然而,這些方法有許多需要克服的缺點。由于水下的數(shù)據(jù)采集或處理程序比在陸地上更加困難,實際應(yīng)用中也存在更多的挑戰(zhàn),因此將傳統(tǒng)的研究方法與深度學(xué)習(xí)方法相結(jié)合逐漸成為一種趨勢。水下目標的檢測與識別受到國內(nèi)外越來越多學(xué)者的關(guān)注,取得了很多研究成果,但也存在一些亟待解決的問題。下面對該領(lǐng)域的關(guān)鍵問題及其發(fā)展趨勢加以展望。

        1)水下環(huán)境復(fù)雜多變,在利用目標物的回波進行檢測時,增強回波強度、提高回波檢測算法的性能十分重要,需要進一步提高聲吶技術(shù)和硬件水平,尤其對于水下小目標,如何在復(fù)雜環(huán)境中獲得有效聲吶回波信號是極具挑戰(zhàn)性的課題。

        2)聲吶圖像包含斑點噪聲,對其進行分割和目標識別是一個抗斑點噪聲的問題。去噪是小波變換的優(yōu)勢,利用小波變換,可以將聲噪圖像的去噪和分割融合在一起,更有利于識別。因此,需要研究利用小波變換得到具有自適應(yīng)能力的抗斑點噪聲方法。

        3)水環(huán)境中的弱紋理目標特征提取一直是水下目標識別的難點問題,為了提高識別精度,可以考慮將更多基于深度學(xué)習(xí)的光學(xué)圖像識別技術(shù)引入到水下目標分類識別算法中,通過監(jiān)督數(shù)據(jù)的遷移提高分類能力和復(fù)雜環(huán)境適應(yīng)能力。

        猜你喜歡
        方法模型
        一半模型
        重要模型『一線三等角』
        重尾非線性自回歸模型自加權(quán)M-估計的漸近分布
        學(xué)習(xí)方法
        可能是方法不對
        3D打印中的模型分割與打包
        用對方法才能瘦
        Coco薇(2016年2期)2016-03-22 02:42:52
        FLUKA幾何模型到CAD幾何模型轉(zhuǎn)換方法初步研究
        四大方法 教你不再“坐以待病”!
        Coco薇(2015年1期)2015-08-13 02:47:34
        賺錢方法
        精品日韩一区二区三区av| 国产精品-区区久久久狼| 无码不卡一区二区三区在线观看| 色综久久综合桃花网国产精品| 国产成人高清在线观看视频| 国产精品中文久久久久久久| 精品国产一区二区三区久久久狼| 国产亚洲美女精品久久久2020| 国产午夜精品视频在线观看| 国产国语亲子伦亲子| 99re热这里只有精品最新 | 亚洲中文字幕精品一区二区| 午夜免费观看日韩一级片| 乱子伦一区二区三区| 国产一区二区三区四区五区vm| 国产免费午夜福利蜜芽无码| 亚洲sm另类一区二区三区| 女的扒开尿口让男人桶30分钟 | 国产午夜视频免费观看| 久久国产精品亚洲我射av大全| 国产毛多水多高潮高清| 蜜桃臀无码内射一区二区三区| 久久久久亚洲AV无码专区一区| 性色av色香蕉一区二区蜜桃| 色欲色欲天天天www亚洲伊| 亚洲精品视频久久| 大岛优香中文av在线字幕| 久久综合九色欧美综合狠狠| 又湿又黄裸乳漫画无遮挡网站| 国产精品久久婷婷婷婷| 日本视频一区二区三区在线| 亚洲国产精品无码专区| 欧美人妻日韩精品| 亚洲av自偷自拍亚洲一区| 亚洲熟女精品中文字幕| 亚洲av中文无码字幕色三| 狠狠亚洲婷婷综合久久久| 日本高清一区二区三区在线观看| 欧美内射深喉中文字幕| 亚洲专区路线一路线二天美 | 无码 免费 国产在线观看91|