李晨瑄, 錢 坤, 胥輝旗
(海軍航空大學岸防兵學院, 山東 煙臺 264001)
現(xiàn)代海戰(zhàn)中,高精度、全方位的態(tài)勢感知能力是精確制導武器的關鍵技術之一。反艦導彈導引頭對艦船要害部位的精確檢測能力、引信與戰(zhàn)斗部的精確打擊能力,是提升裝備作戰(zhàn)效能、建設海洋強國的重要保障。
反艦導彈毀傷效果受艦船姿態(tài)、命中點影響較大,傳統(tǒng)的導引策略無法應對瞬息萬變的戰(zhàn)場態(tài)勢。末制導段,導引頭捕獲的艦船目標輪廓細節(jié)逐漸放大,傳統(tǒng)基于角點[1]的檢測與跟蹤方法對特征利用不充分,易出現(xiàn)跟蹤目標漂移,檢測準確度不足;不同的攻擊進入角條件下,導引頭探測到的艦船投影一致性、規(guī)律性差,艦船要害部位易發(fā)生大尺度變化,基于局部特征提取、融合的檢測方法魯棒性不足;多角度、多尺度要害部位檢測精度有待提升。因此,亟需研究魯棒性較強的艦船要害部位精確檢測算法,在實現(xiàn)艦船要害部位關鍵點檢測的同時,配合引戰(zhàn)控制導彈命中姿態(tài)與戰(zhàn)斗部爆炸方向,可有效增強反艦導彈打擊效能。
深度學習以類人腦的分層機構模型為基礎,利用卷積神經(jīng)網(wǎng)絡從數(shù)據(jù)中抽取有效特征,并進行整合與學習,有效促進了艦船目標檢測[2-3]等任務的工程實現(xiàn)。文獻[4]基于分割算法,有效利用圖像中的連通區(qū)域,提取方向梯度直方圖(histogram of oriented gridients,HOG)特征訓練分類器,實現(xiàn)了艦船目標的離線分類與在線檢測;文獻[5]將Faster R-CNN算法與恒虛警率相結合,以算法生成的對象建議作為保護窗口,獲取小尺寸目標后,重新評估得分相對較低的預測框,改善了復雜背景下的艦船目標檢測效果;文獻[6]將注意力機制引入RetinaNet[7],利用Focal Loss改善樣本不均衡等問題,在多分辨率成像的艦船檢測實驗中,均達到了較高的檢測精度;文獻[8]將串行修正線性單元添加到SSD[9]的淺層網(wǎng)絡,提升特征傳遞效率,采用特征金字塔網(wǎng)絡逐級融合不同層次的多尺度特征圖,提升了艦船目標的定位與分類精度;文獻[10]基于SSD網(wǎng)絡融合高層與低層特征,利用特征圖關聯(lián)性提升噪聲影響下的小目標檢測準確性。以上算法均可實現(xiàn)不同任務下的艦船目標識別,但仍存在一定不足:一是無法實現(xiàn)艦船要害部位的精確檢測,預測框到艦船要害關鍵點信息的轉化耗時長,特征映射導致檢測坐標漂移誤差較大;二是提取目標特征時,對于艦船要害尺度、形態(tài)差異大等問題,已有算法尚未制定針對性的解決方案;三是算法參數(shù)與模型規(guī)模冗余,無法滿足彈載設備對檢測模型的輕量化要求。
基于關鍵點的人體姿態(tài)估計[11]算法通過給定圖像,確定圖像中人體各部位位置,推斷行為與動作。自頂向下的姿態(tài)估計方法首先檢測出圖像內所有目標,再分析目標框內特征信息輸出姿態(tài)關鍵點,精度較高但實時性有待提升,易受到目標檢測效果制約,主流自頂向下的檢測方法有G-RMI[12]、Mask R-CNN[13]及Simple Baselines[14]。自底向上的方法首先檢測圖像中所有關鍵點,再利用關聯(lián)與分組思想實現(xiàn)關鍵點聚類,精度略低于自頂向下算法,但時效性較好,自底向上的檢測算法如PAFs[15]、DeepCut[16]及Associate Embedding[17]等。
綜合分析精確制導反艦導彈作戰(zhàn)需求,受關鍵點檢測算法[18]啟發(fā),提出了一種端到端的艦船要害關鍵點檢測算法,無需繁重的預測框后處理,利用熱力圖回歸關鍵點特征,直接檢測艦船要害點??芍苯庸┙o彈載計算機解算當前命中點與任務打擊點的導引誤差,為精確制導武器的設計與改進提供了新思路。
本文主要研究了反艦導彈末制導段,導引頭對艦船要害關鍵點的精確檢測問題,旨在提升反艦導彈對敵艦毀傷概率,以最小的彈藥消耗,實現(xiàn)最大毀傷效能。構建了艦船要害部位關鍵點檢測數(shù)據(jù)集,針對傳統(tǒng)算法對特征質量要求高、受噪聲影響大等問題,提出了基于深度學習的艦船要害關鍵點檢測算法,設計了針對性的優(yōu)化方案。對用于抽取特征的殘差模塊進行輕量化改進,利用高效通道注意力(efficient channel attention,ECA)機制增強有效特征,抑制無效特征,提高精度的同時,有效降低參數(shù)冗余;針對艦船要害部位檢測數(shù)據(jù)尺度、角度變化劇烈等問題,增加多種不同尺度的感受野模塊(receptive field block,RFB)融合多尺度特征,改善算法對多尺度特征圖的回歸精度。實驗表明,算法可實現(xiàn)多角度、多尺度成像下艦船要害關鍵點檢測,魯棒性較好,并能夠有效降低參數(shù)冗余,兼具檢測精度與速度優(yōu)勢。
針對艦船要害關鍵點檢測任務,綜合分析彈載設備運算能力,提出了深淺層特征融合的艦船要害關鍵點檢測算法Warkp-DLA。深度卷積神經(jīng)網(wǎng)絡淺層特征語義信息少,定位信息豐富;深層特征語義信息豐富,對熱力圖中心點回歸效果好,但定位信息粗略,深淺層特征融合算法設計遵循的主要原則是在主干網(wǎng)絡中降低信息損失,充分融合深層語義信息與淺層定位信息,有效利用細粒度多尺度特征圖,提升檢測精度。Warkp-DLA算法主要結構如圖1所示。
Warkp-DLA算法使用DLA網(wǎng)絡作為基礎編碼-解碼結構,如圖1所示。在編碼階段,使用卷積與池化縮減特征空間維度,在解碼階段,利用反卷積及特征聚合恢復目標細節(jié)。艦船要害關鍵點檢測效果對解碼后生成的特征熱力圖要求較高,為更好實現(xiàn)多尺度、多角度以及目標不完整時的艦船要害關鍵點檢測,利用RFB融合多尺度特征,提升檢測魯棒性;部分艦船要害關鍵點特征相似性高,最大值池化易損失小尺度關鍵檢測信息,利用SoftPool可保留細粒度特征,改善小尺度目標漏檢現(xiàn)象;利用深度可分離卷積與ECA改進殘差結構,在保證檢測精度的同時精簡算法參數(shù);采用在線難例挖掘改善樣本不均衡,并使用梯度累加提升訓練效率與收斂效果。最后將生成的特征圖輸入檢測結構,獲取要害關鍵點與目標中心點坐標、相應偏移量以及預測框尺度,實現(xiàn)艦船要害關鍵點精確檢測。
圖1 Warkp-DLA算法結構圖
不同的攻擊進入角下,導引頭探測到的艦船投影一致性差,艦船要害部位易發(fā)生大尺度變化,單一尺度的卷積核無法適應變化劇烈的圖像數(shù)據(jù),為增強對多尺度要害部位的檢測敏感度,在高分辨率特征圖中引入RFB多尺度特征融合模塊,分別利用空洞率為1、3、5的空洞卷積,提取不同感受野的細粒度特征,再利用通道疊加操作與1×1的卷積核實現(xiàn)特征融合。RFB能夠較好融合不同感受野的特征信息,僅增加極少計算量,使算法具備多尺度的特征表達能力,RFB模塊原理如圖2所示。
圖2 多尺度特征融合模塊
常規(guī)卷積求取圖像相應位置像素的加權和,空洞卷積在相鄰采樣點間增加間隔,擴大感受野的同時,保持與常規(guī)卷積相同的計算量,適用于提取多尺度的特征信息??斩淳矸e的卷積核計算如下:
K=(rate-1)(k-1)+k
(1)
式中:K為空洞卷積的卷積核尺度;rate為空洞率,k為常規(guī)卷積核尺度。
距要害關鍵點越近的特征,蘊含的信息越具有區(qū)分性,應使用小尺度的卷積核;大尺度要害部位、距關鍵點較遠的采樣點,則需用空洞率較大的卷積核。RFB卷積結構如圖3所示,兩個連續(xù)的3×3卷積替代5×5的卷積,可降低參數(shù)并增強小目標的特征表達;1×1的卷積核用于跨通道的特征融合;深度可分離卷積可減少算法參數(shù)。RFB融合多尺度感受野特征,使特征圖獲取更精確的語義與定位信息,有效增強尺度、角度劇烈變化時的艦船關鍵點檢測魯棒性。
圖3 RFB結構
池化操作可用于特征降維,緩解過擬合風險,降低卷積層對檢測信息的過度敏感性。最大值池化保留池化內核中的局部最大值,用于突出特征圖中響應較為強烈的部分。對于像素特征差異小的要害關鍵點,利用最大值池化進行特征映射,易損失重要檢測信息,映射過程中的信息混疊致使目標誤檢。高質量的特征信息可提升相似關鍵部位的檢測敏感度,因此用SoftPool[23]改進最大值池化,保留更多細粒度特征信息。SoftPool以指數(shù)為基礎,結合softmax的加權方法,能夠保留特征圖的重要屬性,增強更大強度的特征激活。在池化內核中,SoftPool為每一個激活因子ai分配一個權重wi,權重wi與激活值ai一同完成非線性變換如下:
(2)
與最大值池化不同,SoftPool是一種可微的池化方式。每一次反向傳播的梯度均可得到更新,SoftPool可綜合利用池化內核所有的激活因子,僅增加極少內存占用,保留特征圖的細粒度信息。SoftPool前向與反向傳播過程如圖4所示。SoftPool替代最大值池化,有利于算法獲取細粒度的特征劃分,增大相近特征信息區(qū)分度的同時,保留了全局感受野的特征信息,可顯著提升艦船要害關鍵點的檢測精度。
圖4 SoftPool處理
增加卷積神經(jīng)網(wǎng)絡的寬度與深度,能夠提升算法特征提取能力,然而層數(shù)的加深容易導致反向傳播中的梯度彌散、梯度爆炸等問題,妨礙淺層網(wǎng)絡收斂。殘差網(wǎng)絡緩解了網(wǎng)絡加深引起的性能退化問題。為削減算法參數(shù)、降低模型規(guī)模,Warkp-DLA算法利用深度可分離卷積改進基本殘差塊。深度可分離卷積將常規(guī)卷積分解成兩部分,先后在空間與通道上實現(xiàn)卷積映射,可降低算法參數(shù)。設輸入特征圖尺寸為DF×DF×M1,輸出特征圖尺寸為DF×DF×M2,卷積核尺寸為DK×DK×M1,標準卷積參數(shù)量為(DF×DF×M1)×M2,深度可分離卷積[24]與標準卷積參數(shù)量比值如下所示:
(3)
由于數(shù)據(jù)集包含多角度艦船目標,部分關鍵點較集中,特征差異小,經(jīng)實驗測試,利用深度可分離卷積替換所有卷積核,引入了一定檢測誤差,因此僅替換第一層卷積,并引入ECA模塊實現(xiàn)空間注意力聚合,增強有效特征表達,抑制無效特征,1×1卷積用于實現(xiàn)跨通道信息整合。改進后的殘差模塊為Liblock,如圖5所示,能夠增強算法對細粒度特征的學習能力,有效融合深層語義信息與淺層定位信息,在降低運算成本的同時,提升檢測效果,利于導引頭的移動端部署。
圖5 改進后的Liblock
Warkp-DLA算法生成多分辨率特征圖的過程中,會產(chǎn)生對最終檢測結果有效的特征,與大量干擾檢測效果的特征。采用ECA[25]能夠抑制無效特征,增強有效參數(shù)。ECA首先進行特征整合,利用全局平均池化獲取每個特征圖的重要信息,輸出的特征維度為C×1×1,C為特征通道數(shù)。降維過程易損失較多特征信息,ECA直接利用卷積核為k的一維卷積處理特征圖,如下所示:
(4)
式中:C為特征通道數(shù);|*|odd表示最鄰近奇數(shù);γ=2;b=1。k由通道數(shù)自適應確定,無需交叉驗證;確定k后,ECA再利用Sigmoid激活函數(shù)輸出反應了不同通道的重要性與相互關聯(lián)度的權重參數(shù);最后,將新的權重參數(shù)與輸入特征圖進行乘積運算,重新分配不同通道特征權重,抑制無效特征,增強了有效特征的權重。
ECA模塊結構如圖6所示。
圖6 ECA結構
在線難例挖掘:在線難例挖掘(online hard example mining,OHEM[26])可用于解決數(shù)據(jù)難易樣本不均衡等問題。OHEM分析每個樣本當前損失,將樣本按照置信度誤差降序排列,選取誤差較大的作為訓練負樣本重新訓練。
在難易樣本比例適中的數(shù)據(jù)中,加入OHEM易強制性去除部分有利于訓練的樣本,影響損失函數(shù)的計算。受船體外部涂層影響,部分圖像不同關鍵點區(qū)分度低;不同角度拍攝的艦船,相同關鍵點特征差異性大。此外,艦船圖像占比小,同樣導致了難易樣本不均衡,損失函數(shù)與訓練效果部分退化。為提升算法精度,由OHEM與數(shù)據(jù)增強思想啟發(fā),設置負檢測樣本池,在訓練30輪后,將每批訓練量中檢測準確率小于0.5的訓練樣本置于負檢測樣本池,累積64個負樣本后,將其重新送入網(wǎng)絡訓練,改善算法對困難樣本的特征學習能力。
梯度累加:Warkp-DLA算法融合深層與淺層特征,深度學習的訓練效果與GPU顯存以及訓練批處理規(guī)模密切相關。較大的處理規(guī)模利于算法收斂。同時計算多個損失函數(shù)時,計算機需存儲多個計算圖,硬件內存要求高。利用梯度累加,能夠在保存較少計算圖的同時,實現(xiàn)多任務訓練,有效擴充顯存,使Warkp-DLA算法具備更好的收斂能力。
末端命中點打擊階段,輕型反艦導彈多以超低空掠海姿態(tài)飛行。執(zhí)行對敵艦精確打擊任務時,導引頭視角以側舷為主。當前用于艦船目標檢測數(shù)據(jù)多為點狀合成孔徑雷達(synthetic aperture radar,SAR)[27]圖像,SAR艦船數(shù)據(jù)多為俯視。紅外熱像儀獲取的灰度圖具備艦船輪廓信息、艦船蒙皮灰度值相近、近距導致灰度值飽和等,造成艦船紋理信息缺失,不適用于艦船要害部位關鍵點檢測任務;此外,由于拍攝角度受限,獲取艦船多角度圖像較為困難。
實際戰(zhàn)場環(huán)境采拍方法具有較大時間、空間上的局限性,文獻[28]論證了利用相似數(shù)據(jù)作為正樣本擴充軍艦數(shù)據(jù)集,經(jīng)遷移學習[29]與算法訓練[3]后,可輔助實現(xiàn)軍艦的準確檢測。實驗室利用高仿真度艦船模型實現(xiàn)海戰(zhàn)場戰(zhàn)法推演與模擬,結合任務需求,利用導引頭同型攝像設備獲取多尺度、多視角艦船目標圖像,如圖7所示。
圖7 數(shù)據(jù)集部分樣本
綜合分析反艦導彈突防與精確打擊任務需求,標注艦船要害部位關鍵點及可見性信息,建立艦船要害部位關鍵點檢測數(shù)據(jù)集。數(shù)據(jù)囊括多尺度、多角度艦船圖像。打擊雷達能夠遏制艦船對來襲目標探測能力;打擊駕駛艙可實現(xiàn)較大毀傷效能,癱瘓敵艦指揮作戰(zhàn)能力;打擊天線可阻礙信息傳輸,破壞敵方數(shù)據(jù)鏈;打擊水線能夠擊沉艦船,使其失去作戰(zhàn)能力。故以炮臺、天線架、重要火力設施、駕駛艙等作為要害檢測關鍵點標注,如圖8所示。數(shù)據(jù)集共計4 672張圖像,像素為1 024×768,COCO關鍵點標注格式,按照8∶1∶1劃分后,訓練集3 736張、測試集468張、驗證集468張。
圖8 艦船關鍵點
初始輸入圖像的降采樣率為R。R取值較小,保留的細粒度特征信息更多,但硬件運算負擔大;R取值較大計算量低,但會引入較大檢測誤差。為較好地平衡檢測效率與檢測精度,實驗設置R=4。使用Adam優(yōu)化器迭代訓練,輸入圖像統(tǒng)一縮放為512×512分辨率。訓練過程學習率逐步下降,初始學習率為5×10-4,在第37Epoch、第45Epoch與第70Epoch下降為先前的1/10,設置初始迭代次數(shù)為90,批處理規(guī)模為8。實驗環(huán)境如表1所示。
表1 實驗環(huán)境
熱力圖關鍵點預測分支:目標關鍵點中心點唯一,非目標位置易產(chǎn)生較多中心點,故使用改進的Focal Loss損失函數(shù),改善樣本不均衡等問題,關鍵點預測損失函數(shù)如下所示:
(5)
關鍵點偏移預測分支:將所得特征圖與原圖建立映射,在映射期間,關鍵點坐標不可避免會產(chǎn)生偏移。算法獲取熱力圖中關鍵點特征,引入偏移量將各關鍵點分配給最接近的特征實例。定義關鍵點偏移損失函數(shù)如下:
(6)
艦船尺度預測分支:與常規(guī)卷積相比,可變形卷積訓練初期易發(fā)散,因此結合艦船中心點與預測框尺度損失共同訓練,可提升艦船關鍵點檢測精度。利用關鍵點空間關系生成艦船目標預測框,通過回歸熱力圖與特征圖,首先計算艦船中心點預測損失,同式(5),再求得每個艦船目標的寬高,艦船尺度預測損失函數(shù)如下:
(7)
損失函數(shù)分別與不同權重相乘,即為Warkp-DLA算法的總體損失函數(shù)如下:
Ldet=Llocation(keypoint+boxcenter)+λoffLoff(keypoint+boxcenter)+λsizeLsize
(8)
由于檢測數(shù)據(jù)不影響預測分支懲罰函數(shù),參照原CenterNet算法,設置關鍵點預測分支邏輯回歸懲罰系數(shù)α=2,β=4,關鍵點與目標中心點偏移損失權重λoff=0.1,檢測尺度損失權重λsize=0.1。
采用目標關鍵點相似度(object keypoint similarity,OKS)作為分段標準,計算OKS分別取0.5,0.55,…,0.9,0.95時的檢測準確度,計算平均準確率的均值,OKS計算如下:
(9)
式中:q表示檢測類別;i表示關鍵點標識;dqi表示關鍵點真實值與預測值的歐式距離;Sq表示預測目標的尺度因子;σi表示第i個關鍵點的歸一化因子,對數(shù)據(jù)集中所有標簽真實值計算標準差得到;vqi表示關鍵點的標志位。各關鍵點檢測相似度取值介于[0,1]之間,檢測值越接近1,表征檢測效果越好。
平均準確率(average precision,AP)定義為給定閾值s,預測艦船關鍵點在整個測試集上的平均準確率。采用AP的均值(mean AP,mAP)評價算法檢測性能如下:
(10)
采用每秒處理幀數(shù)(frame per second,FPS)評價檢測速度。FPS、mAP值越大,表征算法檢測性能越好。
3.4.1 艦船關鍵點檢測數(shù)據(jù)集實驗結果
為更好評估Warkp-DLA算法檢測效果,分別使用Resnet18、Res-dcn18、DLA34、DLA-dcn、Hourglass網(wǎng)絡作為對比試驗,測試結果如表2所示。
表2 艦船關鍵點檢測結果
表2可知,Resnet18、Res-dcn18、DLA34、DLA-dcn、Hourglass網(wǎng)絡用于艦船要害關鍵點檢測時,相應mAP分別為81.3%、80.8%、82.8%,83.2%,86.0%。Hourglass雖檢測精度較高,檢測速度僅12 FPS,檢測速度無法滿足任務需求,故選擇DLA-dcn網(wǎng)絡作為主干特征提取結構。Warkp-DLA算法將深層網(wǎng)絡逐層反卷積,并聚合前層網(wǎng)絡有效特征,融合深層語義信息與淺層定位信息,改善深淺層特征映射造成的信息混疊,提升算法對多尺度艦船要害關鍵點的檢測魯棒性。Warkp-DLA算法準確率可達87.6%,相較于以上網(wǎng)絡分別提升6.3%,6.8%,4.8%,4.4%,1.6%,檢測精度較高,性能提升明顯。由于Warkp-DLA算法引入了注意力機制與多尺度特征融合模塊,以SoftPool池化保留了細粒度特征,檢測速度略有下降,為27 FPS,仍高于Resnet、DLA-dcn與Hourglass,具備實時性檢測優(yōu)勢。網(wǎng)絡訓練過程中的損失函數(shù)變化如圖9所示。
圖9 損失函數(shù)曲線
由于可變形卷積的比常規(guī)卷積更復雜,訓練初期Resdcn18特征學習能力較弱,因此損失函數(shù)值較大;Dla34、DLA-dcn首先對圖像下采樣,再利用反卷積逐步恢復高分辨特征圖信息,深淺層特征映射時易造成檢測精度誤差,故曲線波動較為明顯;Warkp-DLA算法收斂性與擬合效果更好,損失函數(shù)值更低,證明了算法改進的有效性。對訓練后的模型進行測試,關鍵點檢測結果如圖10所示(為了明顯展示結果細節(jié),檢測效果圖經(jīng)過裁剪,為原圖的3/5區(qū)域)。實驗表明,多角度、多尺度艦船成像條件下,Warkp-DLA算法均可實現(xiàn)艦船要害關鍵點精確檢測。
圖10 檢測結果
由關鍵點熱力圖可知,算法能夠較好地檢測出具有相似特征的不同關鍵點,艦船外包輪廓利用關鍵點空間結構生成,定位精度較高。由艦船中心點熱力圖可知,視場占比大,距離近的艦船熱力圖中心點較大,距離遠的艦船熱力圖中心點較小。算法對多尺度、多角度艦船均可實現(xiàn)關鍵點精確檢測與中心點準確定位。Warkp-DLA算法不依賴整體艦船檢測圖,直接回歸關鍵點檢測結果,當艦船目標不完整或局部遮擋時,可實現(xiàn)要害關鍵點的精準分類與回歸,適用于復雜場景下的艦船要害關鍵點檢測。此外,要害關鍵點檢測結果可輔助導引頭實現(xiàn)艦船位姿估計等任務,算法功能有效擴展。
3.4.2 算法模型與參數(shù)分析
艦船要害關鍵點檢測模型需兼具檢測精度與檢測速度,較少的參數(shù)與模型規(guī)模更有利于導引頭移動端的部署,實驗對比分析了不同網(wǎng)絡的參數(shù)與模型規(guī)模,如表3所示。
表3 模型參數(shù)
表3可知,Resnet18網(wǎng)絡結構較簡單,算法參數(shù)較少;DLA網(wǎng)絡在編碼-解碼過程中,聚合了多分辨率的特征圖,不同分支具備不同的上采樣倍數(shù),復雜的深淺層特征聚合導致參數(shù)增加;DLA-dcn網(wǎng)絡引入了可變形卷積,為標準卷積核的規(guī)格采樣點增添了偏移變量,對不同尺度或形變目標具有更優(yōu)的檢測魯棒性,精度得到提升,DLA-dcn網(wǎng)絡參數(shù)更多,模型規(guī)模更大;Hourglass為多層級聯(lián)的沙漏結構,在旁路添加了跳躍連接,降低編碼-解碼過程中造成的精度損失,并引入中級監(jiān)督增強網(wǎng)絡學習能力,參數(shù)量高達191.25 M,模型為779.88 M,對硬件配置要求高;Warkp-DLA算法改進DLA-dcn結構,利用深度可分離卷積替換部分標準卷積層,削減了算法參數(shù),訓練后的模型為73.4 M,在保證檢測精度與速度的同時,參數(shù)更少,模型規(guī)模更小,可較好適應導引頭移動端的部署。
分析不同模塊改進后的參數(shù)與模型規(guī)模,由表4可知,利用深度可分離卷積替換殘差連接中的部分卷積,相較于原始網(wǎng)絡,參數(shù)減少11.55%,模型規(guī)??s減19.64%,可實現(xiàn)模型的輕量化改進;SoftPool池化替代最大值池化幾乎不增加參數(shù)量;增添RFB提升了算法對多尺度艦船要害的檢測能力,ECA增強了有效的特征表達,算法對高質量特征的提取與表達能力得到提升,造成參數(shù)少量增長,模型規(guī)模增大2.43%;SoftPool池化以指數(shù)為基礎,結合softmax思想,保留較多用于細粒度檢測的特征信息,有效改善了具有相似特征的艦船要害關鍵點區(qū)分度,特征信息更多,規(guī)模更大。與原DLA-dcn相比,Warkp-DLA算法模型規(guī)模更小,參數(shù)更少。
表4 改進后模型參數(shù)
3.4.3 消融實驗
設計消融實驗評估Warkp-DLA算法中,不同模塊改進對艦船要害關鍵點的檢測效果,消融實驗損失曲線如圖11所示,實驗結果如表5所示。
圖11 消融實驗損失曲線
表5 消融實驗結果
表5與圖11可知,SoftPool池化保留的細粒度特征更多,利于算法區(qū)分具有相似特征的不同關鍵點,mAP提升1.8%,檢測速度由26 FPS提升至28 FPS,證明SoftPool池化用于多尺度、多角度艦船要害關鍵點檢測的有效性;殘差結構可使深層特征迅速獲取淺層的反饋信息,深度可分離卷積替代部分常規(guī)卷積,能夠在降低算法參數(shù)的同時,小幅度提升檢測速度。針對艦船要害部位尺度變化劇烈的問題,RFB利用空洞卷積實現(xiàn)多尺度特征融合,較好地擴展了網(wǎng)絡寬度,提升算法對多尺度、多角度下的艦船要害關鍵點檢測敏感度,RFB與ECA能夠降低不同分辨率特征圖中的關鍵點映射損失,提升關鍵點偏移量的檢測準確度,較好改善算法對多尺度目標的特征提取能力,mAP提升3.6%。
Warkp-DLA算法有效融合深層語義信息與淺層定位信息,在迭代聚合的過程中不斷增強有效的特征信息,充分利用細粒度高質量的特征圖,mAP提升4.4%,訓練損失更低,收斂速度更快,滿足實時檢測需求。
改進后測試結果如圖12所示,圖12(a)~圖12(e)上層為原算法檢測效果,下層為Warkp-DLA算法檢測效果,與真實坐標對比可知,原算法檢測結果誤差較大,Warkp-DLA算法關鍵點熱力圖高斯分布更集中,檢測效果更清晰、準確,可使導引頭獲取更精準的艦船要害關鍵點檢測信息,滿足多尺度、多角度的艦船要害關鍵點檢測任務需求。由圖12(d)與圖12(e)可知,Warkp-DLA算法不依賴整體艦船檢測結果,在艦船目標不完整的情況下,可直接定位要害關鍵點,算法魯棒性更強;當視場中有多個艦船時,可分別準確地檢測出不同艦船要害關鍵點,艦船中心點回歸準確,利用關鍵點檢測結果表征的艦船輪廓準確清晰,可為艦船航向及姿態(tài)的評估提供有力技術支撐。
圖12 檢測結果對比
(1)針對現(xiàn)有算法無法實現(xiàn)艦船要害部位檢測,關鍵點檢測過于依賴整體目標信息,算法參數(shù)冗余等問題,提出了一種基于深淺層特征融合的艦船要害關鍵點檢測算法,可實現(xiàn)多尺度、多角度下艦船要害關鍵點檢測,檢測精度高,算法魯棒性強;分析了算法參數(shù)與模型規(guī)模,并結合消融實驗論證了算法改進的有效性。
(2)針對末制導段艦船圖像尺度、角度變化劇烈,導致要害關鍵點檢測精度不足的問題,RFB與ECA可融合多尺度艦船高分辨特征,增強特征圖關鍵信息表達能力,mAP提升3.6%。
(3)針對最大值池化進行下采樣導致信息損失,具有相似特征的關鍵點難以區(qū)分的問題,利用SoftPool改進最大值池化,保留細粒度特征信息,改善相似特征關鍵點的區(qū)分度,mAP提升1.8%。
(4)針對算法參數(shù)冗余、模型規(guī)模大的問題,采用深度可分離卷積改進殘差結構,可顯著降低算法參數(shù),壓縮模型,引入注意力機制可增強有效特征表達,檢測精度高、可移植性好。
(5)針對數(shù)據(jù)集樣本的不均衡現(xiàn)象,在線難例挖掘可增強算法對困難樣本的特征學習能力,梯度累加可改善訓練過程硬件內存不足,提升算法特征提取能力與收斂速度。
下一步工作擬測試可見光與紅外圖像的模態(tài)融合檢測效果,并利用遷移學習實現(xiàn)復雜場景下的艦船要害部位關鍵點檢測。