李忠智,尹 航,2,左劍凱,孫一凡
(1.沈陽(yáng)航空航天大學(xué) 計(jì)算機(jī)學(xué)院,沈陽(yáng) 110136;2.仲愷農(nóng)業(yè)工程學(xué)院 信息技術(shù)學(xué)院,廣東 廣州 510230;3.同濟(jì)大學(xué) 計(jì)算機(jī)科學(xué)與技術(shù)系,上海 201804;4.沈陽(yáng)航空航天大學(xué) 理學(xué)院,沈陽(yáng) 110136)
海上運(yùn)輸業(yè)發(fā)展迅速,但隨著船舶數(shù)量和運(yùn)輸量的快速增長(zhǎng),海上違法行為如非法貨物運(yùn)輸?shù)葦?shù)量也不斷增加[1]。船舶檢測(cè)與識(shí)別技術(shù)不斷得到發(fā)展[2-4],目前可以通過(guò)自動(dòng)化的船舶檢測(cè)獲得船舶的分布信息,這類信息能夠幫助控制非法捕魚(yú)和貨物運(yùn)輸?shù)然顒?dòng)[5]。精細(xì)的海上監(jiān)視服務(wù)有助于預(yù)測(cè)威脅事件的發(fā)生并提高海上作業(yè)的工作效率,在海上交通監(jiān)視工作中起重要作用。根據(jù)所使用的特征提取方法不同,本文將衛(wèi)星遙感圖像中船舶檢測(cè)方法分為傳統(tǒng)方法和深度學(xué)習(xí)方法2 類。
在傳統(tǒng)方法中,文獻(xiàn)[6]使用統(tǒng)計(jì)學(xué)方法,根據(jù)海洋聚類直方圖構(gòu)建了異常檢測(cè)模型,并通過(guò)標(biāo)識(shí)候選區(qū)域,從候選區(qū)域中刪除非船舶對(duì)象。該方法僅在只有一個(gè)光譜波段的海域衛(wèi)星圖像中表現(xiàn)良好,而在港口區(qū)域中的表現(xiàn)欠佳。文獻(xiàn)[7]提出一種基于統(tǒng)計(jì)分析和形狀識(shí)別的模型,對(duì)海域內(nèi)的船舶分布進(jìn)行統(tǒng)計(jì)分析,并將近似的船舶目標(biāo)與海、陸、島或波浪區(qū)分,使用縱橫比、圓度等形狀特征來(lái)檢測(cè)船舶。在提取圖像特征中,通常使用Radon 變換、小波變換、霍夫變換等變換方式。例如文獻(xiàn)[8]提出使用小波分解來(lái)獲得圖像的高頻和低頻特征,并通過(guò)歸一化和相加來(lái)組合特征,生成特征圖。文獻(xiàn)[9]提出一種在單通道SAR 圖像中基于復(fù)雜信號(hào)峰度(Complex Signal Kurtosis,CSK)的船舶檢測(cè)新方法,該方法包括區(qū)域提取和目標(biāo)識(shí)別2 個(gè)主要部分,首先根據(jù)區(qū)域提取檢測(cè)船舶的大致位置,然后在提取的區(qū)域內(nèi)識(shí)別船舶。
近年來(lái),研究人員提出了諸多基于深度學(xué)習(xí)的遙感圖像船舶檢測(cè)方法。根據(jù)所使用標(biāo)記方法的不同,深度學(xué)習(xí)方法可以分為2 類。第1 類方法在像素級(jí)別上對(duì)船舶目標(biāo)進(jìn)行標(biāo)記[10-11],如文獻(xiàn)[10]提出一種基于全卷積神經(jīng)網(wǎng)絡(luò)的邊緣檢測(cè)網(wǎng)絡(luò),完成了對(duì)船舶目標(biāo)的像素級(jí)檢測(cè),并取得了良好的檢測(cè)結(jié)果。第2 類方法使用邊界框來(lái)標(biāo)記船舶,如文獻(xiàn)[12]提出一種基于Faster RCNN 的密集連接多尺度神經(jīng)網(wǎng)絡(luò),用于多尺度和多場(chǎng)景SAR 船舶檢測(cè)。文獻(xiàn)[13]在提取網(wǎng)絡(luò)中提出一個(gè)分層的選擇性過(guò)濾層,將不同尺度的特征映射到同一尺度空間,從而有效檢測(cè)不同比例的船舶。
上述文獻(xiàn)對(duì)遙感圖像目標(biāo)檢測(cè)領(lǐng)域進(jìn)行了研究,但該領(lǐng)域仍存在帶標(biāo)簽樣本不足和復(fù)雜場(chǎng)景下的先驗(yàn)信息不足兩大問(wèn)題。由于對(duì)用于目標(biāo)檢測(cè)的大量數(shù)據(jù)進(jìn)行標(biāo)注的難度較大,衛(wèi)星圖像領(lǐng)域內(nèi)的帶標(biāo)注樣本缺乏,文獻(xiàn)[14]分別采用數(shù)據(jù)增強(qiáng)和遷移學(xué)習(xí)2 種策略,并應(yīng)用單發(fā)多框檢測(cè)(Single Shot MultiBox Detector,SSD)算法完成SAR 目標(biāo)檢測(cè)任務(wù),該方法可以獲得更好的檢測(cè)性能。文獻(xiàn)[15]提出一種基于視覺(jué)注意模型的目標(biāo)檢測(cè)方法用于解決復(fù)雜場(chǎng)景下的先驗(yàn)信息不足等問(wèn)題,實(shí)驗(yàn)結(jié)果表明,所提出的目標(biāo)檢測(cè)方法可以在高分辨率SAR 圖像中以高精度和快速度從復(fù)雜背景雜波中檢測(cè)目標(biāo)。但上述方法沒(méi)有考慮提取SAR 圖像中目標(biāo)的低階和高階信息,導(dǎo)致模型對(duì)目標(biāo)特征的表達(dá)能力受限。
文獻(xiàn)[16]提出一種有效結(jié)合圖像低級(jí)紋理與圖像深層特征的多尺度旋轉(zhuǎn)不變Haar-Like 特征集成卷積神經(jīng)網(wǎng)絡(luò)(Multi-Scale Rotation-Invariant Haar-Like feature integrated Convolutional Neural Network,MSRIHLCNN),并經(jīng)過(guò)最佳融合以表示船舶目標(biāo),在中國(guó)高分-3圖像數(shù)據(jù)集上驗(yàn)證了模型的優(yōu)越性。文獻(xiàn)[17]結(jié)合多尺度旋轉(zhuǎn)不變性特征,提出有效的船舶分類模型。該方法采用Gabor 濾波器獲取不同方向的特征,并應(yīng)用多尺度全局局部二進(jìn)模式(Multi-Scale Completed Local Binary Patterns,MS-CLBP)獲取船舶圖像的局部紋理、空間和輪廓信息,彌補(bǔ)了深度CNN 的不足。以上2 種方法雖然有效地提高了模型在復(fù)雜環(huán)境下對(duì)船舶目標(biāo)檢測(cè)與識(shí)別的準(zhǔn)確度,但兩種模型均采用并行計(jì)算的方式,增加了計(jì)算的復(fù)雜度。
本文針對(duì)遙感衛(wèi)星圖像背景復(fù)雜、船舶目標(biāo)變化尺度大等問(wèn)題,提出一種結(jié)合UNet++和多邊輸出融合(Multiple Side-Output Fusion,MSOF)策略的船舶檢測(cè)與識(shí)別模型。使用UNet++深度神經(jīng)網(wǎng)絡(luò)提取衛(wèi)星圖像特征,并結(jié)合圖像的淺層和深層信息輸出不同層級(jí)的圖像特征。在此基礎(chǔ)上,采用MSOF策略對(duì)來(lái)自不同語(yǔ)義層級(jí)的特征信息進(jìn)行融合,以提升模型檢測(cè)與識(shí)別的準(zhǔn)確度。
本文采用基于UNet++網(wǎng)絡(luò)和多邊輸出融合策略的模型,完成船舶目標(biāo)的檢測(cè)與識(shí)別。
UNet++網(wǎng)絡(luò)具有嵌套結(jié)構(gòu)和密集的跳過(guò)路徑,在從多級(jí)卷積路徑中提取多尺度特征圖方面具有很大的優(yōu)勢(shì)[18]。其由卷積單元、下采樣和上采樣模塊以及卷積單元之間的跳過(guò)連接組成,結(jié)構(gòu)如圖1 實(shí)線框部分所示。UNet++和UNet之間最大的區(qū)別是UNet++的結(jié)構(gòu)中具有重新設(shè)計(jì)的跳過(guò)路徑。以節(jié)點(diǎn)X0,4為例,在UNet 模型結(jié)構(gòu)中,節(jié)點(diǎn)X0,4僅與節(jié)點(diǎn)X0,0構(gòu)建了一個(gè)跳過(guò)連接,而在UNet++中,節(jié)點(diǎn)X0,4連接處于同一層的X0,0、X0,1、X0,2和X0,3這4個(gè)卷積單元的輸出。UNet++網(wǎng)絡(luò)的這種結(jié)構(gòu),能使編碼器內(nèi)特征圖的語(yǔ)義水平更接近對(duì)應(yīng)解碼器部分的語(yǔ)義水平。
圖1 融合MSOF 策略的UNet++目標(biāo)檢測(cè)框架Fig.1 UNet++target detection framework combined with MSOF strategy
假設(shè)xi,j代表節(jié)點(diǎn)Xi,j的輸出,其中i代表沿著編碼器方向的第i個(gè)下采樣層,j代表沿著跳過(guò)路徑的第j個(gè)卷積層,則xi,j的特征映射可以表示為:
其中:μ(·)表示卷積運(yùn)算,后面連接激活函數(shù),(·)表示上采樣層;[]表示級(jí)聯(lián)運(yùn)算。通常在j=0 層的節(jié)點(diǎn)僅從上層的下采樣層接收一個(gè)輸入,而j>0 的節(jié)點(diǎn)則從跳過(guò)路徑和上采樣層均接收上一級(jí)節(jié)點(diǎn)的輸入。
在網(wǎng)絡(luò)的卷積單元中,本文采用了殘差模塊,這有助于增強(qiáng)深度網(wǎng)絡(luò)的收斂能力,一個(gè)殘差模塊的結(jié)構(gòu)如圖2 所示。輸入圖像分別經(jīng)過(guò)一個(gè)2D 卷積層(2D Convolutional layer,Conv2D)、一個(gè)歸一化層(Batch Normalization layer,BN)、一個(gè)Conv2D 和BN層。接著,通過(guò)將第2 個(gè)BN 層和第1 個(gè)Conv2D 層的輸出相加得到輸出。本文模型采用縮放指數(shù)線性單 元(Scaling exponent Linear Units,SeLUs)代 替ReLU 作為激活函數(shù),其具有對(duì)抗擾動(dòng)的能力更強(qiáng)、學(xué)習(xí)速度更快的特點(diǎn)[19]。
圖2 殘差模塊結(jié)構(gòu)Fig.2 Residual block structure
UNet++網(wǎng)絡(luò)優(yōu)于UNet 網(wǎng)絡(luò)的另一個(gè)特點(diǎn)是多層特征圖生成策略。在UNet 結(jié)構(gòu)中,僅通過(guò)如式(2)所示的路徑生成單層特征圖:
在UNet++結(jié)構(gòu)中,另外3 個(gè)特征圖還可以分別通過(guò)以下3 個(gè)路徑獲得:
因此,將4 個(gè)不同語(yǔ)義層級(jí)的特征圖進(jìn)行組合,可以提高模型的檢測(cè)和識(shí)別精確度,并提升模型的泛化性和穩(wěn)定性。
深度監(jiān)控一方面通過(guò)克服梯度消失問(wèn)題改善深層網(wǎng)絡(luò)訓(xùn)練過(guò)程;另一方面,可以學(xué)習(xí)從低語(yǔ)義到高語(yǔ)義的層次信息。文獻(xiàn)[20]中的深度監(jiān)控通過(guò)平均所有細(xì)分分支的輸出來(lái)實(shí)現(xiàn)。本文使用了一種MSOF 融合策略實(shí)現(xiàn)模型訓(xùn)練過(guò)程中的深度監(jiān)控,其類似文獻(xiàn)[21]中提出的策略。
如圖1 中虛線框部分所示,4 個(gè)輸出節(jié)點(diǎn){X0,1,X0,2,X0,3,X0,4}使用sigmoid 函數(shù)后得到輸出結(jié)果{Y0,1,Y0,2,Y0,3,Y0,4},再通過(guò)合并4 個(gè)節(jié) 點(diǎn)的輸出 結(jié)果來(lái)生成新的輸出節(jié)點(diǎn)X0,5,表達(dá)式如式(4)所示:
其中:⊕表示合并操作,通過(guò)sigmoid 層的X0,5可以輸出Y0,5。在本文的深度網(wǎng)絡(luò)中生成了{Y0,1,Y0,2,Y0,3,Y0,4,Y0,5}5 個(gè)不同語(yǔ)義層次的輸出,其中{Y0,1,Y0,2,Y0,3,Y0,4}是側(cè)面輸出層的輸出。通過(guò)MSOF 操作,將來(lái)自所有側(cè)面輸出層的多尺度特征信息融合到最終輸出Y0,5中,從而可以捕獲更精細(xì)的檢測(cè)與識(shí)別細(xì)節(jié)。
1.3.1 平衡二元交叉熵?fù)p失
對(duì)于空客船舶檢測(cè)挑戰(zhàn)數(shù)據(jù)集,數(shù)據(jù)集中有船舶的圖像僅占整個(gè)數(shù)據(jù)集的1/4 左右,這會(huì)導(dǎo)致在深度神經(jīng)網(wǎng)絡(luò)訓(xùn)練中出現(xiàn)嚴(yán)重的類別不平衡問(wèn)題。因此,必須引入權(quán)衡參數(shù)以進(jìn)行過(guò)采樣。在本文的端到端訓(xùn)練方式中,采用一種簡(jiǎn)單的自動(dòng)平衡策略,可以將類平衡的交叉熵?fù)p失函數(shù)定義為:
其 中:β=|Y-|/(|Y+|+|Y-|);1-β=|Y+|/(|Y+|+|Y-|);|Y+| 和|Y-|分別代表一次迭代中有船舶的圖像和無(wú)船舶的圖像數(shù)目;Pr(·)是圖像j處的sigmoid 輸出。
1.3.2 Dice 損失函數(shù)
為提高檢測(cè)性能、削弱類別不平衡問(wèn)題的影響,Dice 系數(shù)損失通常應(yīng)用于語(yǔ)義分割任務(wù)中。一般來(lái)說(shuō),2 個(gè)輪廓區(qū)域的相似性可以用Dice 系數(shù)來(lái)定義。此外,損失可定義為:
其中:Y和分別表示訓(xùn)練圖像的預(yù)測(cè)輸出和圖像對(duì)應(yīng)的標(biāo)簽。
1.3.3 改進(jìn)損失函數(shù)
本文所提模型通過(guò)sigmoid 層進(jìn)行分類后會(huì)生成5 個(gè)輸出結(jié)果。假設(shè)相應(yīng)的權(quán)重分別表示為ωi(i=1,2,3,4,5),則總的損失函數(shù)L可定義為:
本文所提模型由Keras 和TensorFlow 端到端開(kāi)源機(jī)器學(xué)習(xí)平臺(tái)實(shí)現(xiàn),由配備Intel i9-9900KF(3.6 GHz、8 核、32 GB RAM)和單個(gè)NVIDIA GTX 2080 Ti GPU 的工作站作為硬件平臺(tái)。實(shí)驗(yàn)過(guò)程中批處理量大小設(shè)置為4,迭代次數(shù)設(shè)置為40,使用學(xué)習(xí)率為1×10-4的Adam 優(yōu)化器對(duì)模型訓(xùn)練過(guò)程進(jìn)行優(yōu)化。模型中圖像數(shù)據(jù)的輸入尺寸為768×768×3 像素,數(shù)據(jù)的輸出尺寸為768×768×1 像素。對(duì)于經(jīng)過(guò)預(yù)處理后的任意大小的輸入圖像,均能以端到端的方式訓(xùn)練模型。
在實(shí)驗(yàn)部分,本文首先對(duì)損失函數(shù)中平衡因子的取值問(wèn)題進(jìn)行相關(guān)實(shí)驗(yàn),接著證明多邊輸出策略對(duì)于本文所探究問(wèn)題的有效性,最后通過(guò)與其他模型的對(duì)比,驗(yàn)證所提模型的優(yōu)越性。
實(shí)驗(yàn)中采用的數(shù)據(jù)集是空客船舶檢測(cè)挑戰(zhàn)比賽中提供的公共數(shù)據(jù)集[22],該數(shù)據(jù)集包含的衛(wèi)星圖像總大小超過(guò)30 GB,并且有近1/4 的圖像數(shù)據(jù)中有船舶目標(biāo)。另外,比賽提供了以CSV 文件格式存儲(chǔ)的圖像標(biāo)記信息,其中列出了所有圖像的ID 及其對(duì)應(yīng)的像素坐標(biāo)。這些坐標(biāo)表示標(biāo)記船舶的分割框,沒(méi)有像素坐標(biāo)意味著圖片中沒(méi)有任何船只。但由于計(jì)算資源的限制,本文從完整的數(shù)據(jù)集中隨機(jī)抽樣10 000 張圖像,并選擇其中的5 000 張圖像作為訓(xùn)練集,2 000 張圖像作為驗(yàn)證集,3 000 張圖像作為測(cè)試集。數(shù)據(jù)集中的部分船舶圖像與對(duì)應(yīng)標(biāo)簽可視化圖像如圖3 所示。
圖3 空客船舶數(shù)據(jù)集示例Fig.3 Examples of airbus ship data set
本文選擇圖像語(yǔ)義分割領(lǐng)域常用的Dice Coefficient和IOU評(píng)測(cè)指標(biāo)對(duì)所提模型進(jìn)行評(píng)估,2個(gè)指標(biāo)的含義如圖4所示。其中:Dice系數(shù)是一種集合相似度度量函數(shù),通常用于計(jì)算2個(gè)樣本的相似度。IOU相當(dāng)于2個(gè)區(qū)域重疊的部分除以2個(gè)區(qū)域的集合部分得出的結(jié)果。
圖4 模型評(píng)估指標(biāo)Fig.4 Model evaluation indexes
2.3.1 損失函數(shù)對(duì)比實(shí)驗(yàn)
損失函數(shù)在最終分割效果中起著重要作用。本文結(jié)合二元交叉熵?fù)p失函數(shù)和Dice 系數(shù)損失函數(shù)作為模型在訓(xùn)練過(guò)程中改進(jìn)的損失函數(shù),2 個(gè)函數(shù)的權(quán)重系數(shù)由平衡參數(shù)λ決定。將λ從0 變化到1,并對(duì)相應(yīng)的評(píng)測(cè)指標(biāo)變化進(jìn)行可視化,結(jié)果如圖5 所示。
圖5 平衡參數(shù)對(duì)比實(shí)驗(yàn)結(jié)果Fig.5 Comparison experimental results of balance parameter
從圖5中可以看出,當(dāng)λ設(shè)為0時(shí),只使用二元交叉熵?fù)p失函數(shù),此時(shí)Dice 和IOU 的得分較低。2 個(gè)評(píng)價(jià)指標(biāo)準(zhǔn)確度值隨著λ的增加而增加,驗(yàn)證了結(jié)合二元交叉熵?fù)p失函數(shù)和Dice 系數(shù)損失函數(shù)的有效性。然而,隨著λ的進(jìn)一步增加,2 個(gè)測(cè)評(píng)指標(biāo)的值呈震蕩下降趨勢(shì)。其中Dice 和IOU 在λ為0.5 時(shí)達(dá)到最大值,這意味著當(dāng)二元交叉熵?fù)p失函數(shù)和Dice 系數(shù)損失函數(shù)的權(quán)重系數(shù)相等且為0.5 時(shí),對(duì)模型的參數(shù)更新作用最好。因此,后序?qū)嶒?yàn)將平衡參數(shù)λ設(shè)置為0.5。
2.3.2 添加MSOF 的對(duì)比實(shí)驗(yàn)
為改善所提深層網(wǎng)絡(luò)的收斂性,并學(xué)習(xí)從低到高層次的多尺度特征信息,使用MSOF策略對(duì)UNet++網(wǎng)絡(luò)輸出的結(jié)果進(jìn)行融合,得到最終的船舶檢測(cè)分割圖。表1為以Dice和IOU作為評(píng)估指標(biāo),進(jìn)行5次重復(fù)實(shí)驗(yàn)的結(jié)果。由表1 中可知,使用邊輸出融合策略后,Dice和IOU 評(píng)估分?jǐn)?shù)分別增加了6.1、3.5個(gè)百分點(diǎn),驗(yàn)證了通過(guò)使用MSOF策略進(jìn)一步提高船舶檢測(cè)分割準(zhǔn)確度的可行性。
表1 多邊輸出融合策略對(duì)所提模型的DC和IOU的影響Table 1 The influence of multilateral output fusion strategy on the DC and IOU of the proposed model %
添加MSOF 策略后,模型對(duì)船舶目標(biāo)進(jìn)行檢測(cè)分割的結(jié)果如圖6 所示。
圖6 船舶目標(biāo)分割圖Fig.6 Segmentation maps of ship targets
從圖6 中可以看出,模型在背景干擾較少的情況下,具有較高的檢測(cè)與分割精度,隨著背景干擾物體的增加,可能會(huì)影響UNet++網(wǎng)絡(luò)提取正確的船舶目標(biāo)區(qū)域,得到錯(cuò)誤的目標(biāo)檢測(cè)結(jié)果。
2.3.3 模型的對(duì)比實(shí)驗(yàn)
為驗(yàn)證本文所提模型在船舶檢測(cè)分割任務(wù)上性能的優(yōu)越性,將所提模型與SCRDet[23]、VGG-16[24]、ResNet[25]、UNet[26]、Mask R-CNN[27]、Mask Scoring R-CNN[28]等先進(jìn)的深度學(xué)習(xí)模型進(jìn)行比較。
在SCRDet 網(wǎng)絡(luò)訓(xùn)練過(guò)程中將權(quán)重衰減系數(shù)設(shè)置為1×10-4,動(dòng)量參數(shù)設(shè)置為0.9,學(xué)習(xí)率設(shè)置為為1×10-6。VGG-16 模型包括13 層卷積層及3 層全連接層,通過(guò)卷積、池化操作進(jìn)行圖像特征提取,通過(guò)全連接層進(jìn)行分類。ResNet-34 模型包括34 層卷積層、1 層池化層、1 層層全連接層,批處理量大小設(shè)置為64,全連接層后的dropout 層的丟棄概率設(shè)置為0.5。Fine-tuning CNN 模型使用在ImageNet 數(shù)據(jù)集上預(yù)訓(xùn)練好的模型權(quán)重作為初始值開(kāi)始訓(xùn)練,使用RMSProp 算法作為優(yōu)化器函數(shù),并將學(xué)習(xí)率設(shè)置為1×10-3。Mask R-CNN 模型的權(quán)重衰減系數(shù)設(shè)置為1×10-4,學(xué)習(xí)率設(shè)置為1×10-3,模型的輸入圖像尺寸為768×768×3 像素。Mask ScoringR-CNN 的Maskiou分支的4 個(gè)卷積層的卷積核大小設(shè)為3,數(shù)量設(shè)為256,對(duì)于3 個(gè)全連接層,實(shí)驗(yàn)中將前2 層的神經(jīng)元設(shè)置為1 024,最后一層設(shè)置為2(真實(shí)的分類類別數(shù))。UNet 網(wǎng)絡(luò)中的卷積核大小設(shè)置為3,使用ReLU 和最大池化分別作為激活函數(shù)和池化函數(shù),模型的輸入圖像尺寸為768×768×3 像素。在UNet++網(wǎng)絡(luò)中,批處理量大小設(shè)置為8,卷積核大小設(shè)置為3,卷積步長(zhǎng)設(shè)置為2,且輸入圖像尺寸也為768×768×3 像素。將本文所提模型的學(xué)習(xí)率設(shè)置為1×10-4,使用Adam算法作為優(yōu)化器函數(shù),損失函數(shù)的平衡參數(shù)設(shè)置為0.5,dropout 層的丟棄概率設(shè)置為0.2,訓(xùn)練迭代次數(shù)與上述對(duì)比模型統(tǒng)一設(shè)置為40 次。不同模型的檢測(cè)和識(shí)別的準(zhǔn)確度結(jié)果如表2 所示。
表2 不同模型的準(zhǔn)確度對(duì)比Table 2 Comparison of different model’s accuracy %
分析表2 可知,VGG-16、Mask R-CNN 等傳統(tǒng)深度學(xué)習(xí)模型存在目標(biāo)區(qū)域提取偏差大、模型的計(jì)算冗余度高等問(wèn)題,導(dǎo)致模型的分割準(zhǔn)確度大幅降低。UNet 與UNet++網(wǎng)絡(luò)有效地結(jié)合低分辨率信息(提供物體類別識(shí)別依據(jù))和高分辨率信息(提供精準(zhǔn)分割定位依據(jù)),在一定程度上提高了目標(biāo)檢測(cè)分割準(zhǔn)確度。而本文所提UNet++with MSOF 模型,在UNet++網(wǎng)絡(luò)提取圖像特征的基礎(chǔ)上,采用MSOF 策略對(duì)模型的訓(xùn)練過(guò)程進(jìn)行深度監(jiān)控,并融合不同語(yǔ)義層次的圖像特征,進(jìn)一步提高了船舶目標(biāo)分割的精準(zhǔn)度。
圖7 所示為本文所提模型對(duì)船舶目標(biāo)檢測(cè)識(shí)別的結(jié)果(彩色效果見(jiàn)《計(jì)算機(jī)工程》官網(wǎng)HTML 版),其中標(biāo)記框和船舶分割結(jié)果是檢測(cè)實(shí)例圖像的真實(shí)船舶的ground truth 信息,而模型的預(yù)測(cè)結(jié)果由預(yù)測(cè)準(zhǔn)確率表征。
由圖7 可知,在不同尺度、不同環(huán)境下的船舶目標(biāo)均能被模型有效地識(shí)別并分類,表明通過(guò)與MSOF 策略的結(jié)合,UNet++網(wǎng)絡(luò)使用全局信息和細(xì)粒度信息生成具有高空間精度的特征圖,完成了對(duì)船舶目標(biāo)精準(zhǔn)的檢測(cè)識(shí)別。
為定量分析不同模型在訓(xùn)練過(guò)程中的收斂性和準(zhǔn)確性等指標(biāo)情況,對(duì)各個(gè)模型訓(xùn)練過(guò)程的準(zhǔn)確度變化作可視化分析,評(píng)測(cè)指標(biāo)IOU 的變化如圖8所示。
圖8 不同模型的準(zhǔn)確度對(duì)比Fig.8 Accuracy comparison of different models
分析圖8 可知,相比于其他模型,本文所提模型在迭代次數(shù)為10 次時(shí),準(zhǔn)確度已超過(guò)90%;在迭代次數(shù)達(dá)30 次后,模型訓(xùn)練的準(zhǔn)確度變化較小。趨于收斂,表明其具有良好的穩(wěn)定性和魯棒性。對(duì)比最終的船舶目標(biāo)檢測(cè)準(zhǔn)確度可知,本文所提模型具有更高的檢測(cè)準(zhǔn)確度。
本文提出一種新的船舶目標(biāo)檢測(cè)與識(shí)別模型,利用具有密集跳過(guò)連接結(jié)構(gòu)的UNet++網(wǎng)絡(luò)提取圖像的多尺度特征,采用殘差塊策略促進(jìn)深度神經(jīng)網(wǎng)絡(luò)的收斂并捕獲更詳細(xì)的圖像特征信息。使用MSOF 策略融合不同語(yǔ)義層次的多尺度圖像輸出特征,生成最終檢測(cè)和分割結(jié)果。為降低數(shù)據(jù)集中樣本不均衡對(duì)模型準(zhǔn)確度的影響,將二元交叉熵?fù)p失函數(shù)與Dice 系數(shù)損失函數(shù)結(jié)合使用。在空客船舶檢測(cè)挑戰(zhàn)數(shù)據(jù)集上的實(shí)驗(yàn)結(jié)果表明,該模型能夠?qū)b感衛(wèi)星圖像中的船舶目標(biāo)進(jìn)行準(zhǔn)確檢測(cè),測(cè)試的Dice 系數(shù)和IOU 系數(shù)分別達(dá)97.3% 和96.8%,與ResNet-34、UNet++等模型相比,船舶目標(biāo)檢測(cè)和分割的準(zhǔn)確度均有所提高。但目前仍存在衛(wèi)星圖像采集困難、標(biāo)簽制作難度大等問(wèn)題,下一步將通過(guò)利用弱監(jiān)督學(xué)習(xí)、樣本生成等技術(shù),提高對(duì)小樣本船舶數(shù)據(jù)集的檢測(cè)和分割精度。