王 俊, 曾朝陽(yáng), 吳曉強(qiáng)
(陸軍工程大學(xué) 野戰(zhàn)工程學(xué)院, 江蘇 南京 210007)
近年來, 得益于大數(shù)據(jù)和計(jì)算機(jī)算力的巨大進(jìn)步和有力支撐, 深度學(xué)習(xí)的相關(guān)理論和實(shí)際應(yīng)用得到迅猛發(fā)展,并在目標(biāo)檢測(cè)領(lǐng)域大放異彩。而自動(dòng)目標(biāo)檢測(cè)技術(shù)發(fā)展至今,一直是國(guó)防和軍事領(lǐng)域的研究重點(diǎn)。相比于傳統(tǒng)目標(biāo)檢測(cè)模型, 基于深度學(xué)習(xí)的目標(biāo)檢測(cè)模型在檢測(cè)速率和檢測(cè)精度上具有極大優(yōu)勢(shì)。因此,作為智能化武器系統(tǒng)的重要環(huán)節(jié)之一,基于深度學(xué)習(xí)的目標(biāo)檢測(cè)技術(shù)在軍事領(lǐng)域的應(yīng)用和推廣一直備受世界各國(guó)的重視。
由于軍事目標(biāo)高度保密的特性, 目前并沒有公開的軍事目標(biāo)數(shù)據(jù)集。關(guān)于軍事目標(biāo)檢測(cè)的研究,學(xué)者們多是通過網(wǎng)絡(luò)收集或自行采集軍事目標(biāo)圖片制作數(shù)據(jù)集,存在樣本數(shù)量較少的問題。 復(fù)雜的戰(zhàn)場(chǎng)環(huán)境和多變的戰(zhàn)場(chǎng)態(tài)勢(shì)使得軍事目標(biāo)檢測(cè)面臨更嚴(yán)峻的考驗(yàn), 由于探測(cè)手段的限制, 敵我雙方想要采集對(duì)方的軍事目標(biāo)圖片作為訓(xùn)練數(shù)據(jù)十分困難, 且雙方在戰(zhàn)爭(zhēng)過程中會(huì)對(duì)己方目標(biāo)采取何種偽裝技術(shù)措施難以預(yù)估, 從而在根本上影響依賴于數(shù)據(jù)的基于深度學(xué)習(xí)的目標(biāo)檢測(cè)模型的檢測(cè)效能。而假目標(biāo)作為隱真示假的重要偽裝技術(shù)措施之一, 在現(xiàn)代戰(zhàn)爭(zhēng)中仍發(fā)揮著影響全局的作用, 因此面對(duì)基于機(jī)器視覺的目標(biāo)檢測(cè)系統(tǒng)的探測(cè), 基于人眼探測(cè)的假目標(biāo)偽裝措施會(huì)存在怎樣的暴露征候是需要我們亟需探究的問題。 本文通過改變假目標(biāo)的位置、背景及其顏色、大小、亮度等目標(biāo)特性, 探究小樣本條件下假目標(biāo)在基于機(jī)器視覺的目標(biāo)檢測(cè)下“以假亂真”的效果,為下步戰(zhàn)場(chǎng)假目標(biāo)應(yīng)用提供參考。
利用大疆無人機(jī)在野外條件和良好光照條件下,采集了367 張軍事車輛目標(biāo)圖片, 圖片尺寸為5472×3048。為貼近實(shí)際偵察效果,拍攝時(shí)選取不同高度,不同俯仰,不同角度等進(jìn)行拍攝。 圖片包含樹林、河流、土路、公路、居民建筑物等不同的特征背景。
通過翻轉(zhuǎn),旋轉(zhuǎn),裁剪,縮放,顏色增強(qiáng)等數(shù)據(jù)增強(qiáng)的方式將數(shù)據(jù)集擴(kuò)展至1780 張,并采用labelimg 標(biāo)注工具將其標(biāo)注制作成PASCAL VOC 格式數(shù)據(jù)集。 采集的圖像及圖像標(biāo)注如圖1 所示,圖1(c)、(d)分別為圖1(a)、(b)圖片標(biāo)注后所對(duì)應(yīng)的標(biāo)簽。
圖1 數(shù)據(jù)集標(biāo)注Fig.1 Dataset annotation
利用數(shù)據(jù)集進(jìn)行訓(xùn)練時(shí), 按照8:1:1 的比例隨機(jī)將擴(kuò)展后的軍事車輛目標(biāo)數(shù)據(jù)集分為訓(xùn)練集、 驗(yàn)證集和測(cè)試集。 考慮到假目標(biāo)相比于真目標(biāo)在光電特征上存在的差異,通過對(duì)真目標(biāo)進(jìn)行高斯模糊來模擬細(xì)節(jié)差異;通過疊加15%不透明度的軍綠色 (#0215E21) 來模擬顏色差異;將真目標(biāo)縮小為90%原面積大小以模擬大小差異。
在作戰(zhàn)區(qū)域內(nèi), 由于假目標(biāo)的配置須符合真目標(biāo)的戰(zhàn)場(chǎng)使用要求, 其配置區(qū)域無法預(yù)判且可能因作戰(zhàn)需求而發(fā)生變動(dòng)。故需引入假目標(biāo)位置和背景變化因素,在原背景中改變假目標(biāo)的位置,如圖2 所示。圖2(b)、(d)分別為圖2(a)、(c)進(jìn)行目標(biāo)位置變換后的圖像。 將假目標(biāo)按照相關(guān)配置要求置于包含其它地物特征的三個(gè)背景中,如圖3 所示。
圖2 不同位置測(cè)試集Fig.2 Different location testset
圖3 不同背景測(cè)試集Fig.3 Different background testset
在作戰(zhàn)過程中, 敵我雙方對(duì)軍事目標(biāo)采取的各種偽裝技術(shù)措施將導(dǎo)致目標(biāo)特性發(fā)生變化, 為探究假目標(biāo)顏色、大小、亮度等目標(biāo)特性的改變對(duì)檢測(cè)效果的影響,對(duì)假目標(biāo)分別疊加20%、40%、60%、80%不透明度的軍綠色(#0215E21)來改變顏色特性;通過在原基礎(chǔ)上分別調(diào)整-150、-100、-50、50、100、150 個(gè)亮度單位來改變亮度特性;將假目標(biāo)面積調(diào)整為原面積大小的0.5、0.75、1.25、1.5 倍來改變大小特性。
現(xiàn)今而言,目標(biāo)檢測(cè)算法大致可分為三類。
(1)二階段(two-stage)目標(biāo)檢測(cè)算法。 如R-CNN[1]、SPP-net[2]、Fast R-CNN[3]、Faster R-CNN[4]、FPN[5]、Mask RCNN[6]、Cascade R-CNN[7]和TridentNet[8]等。 該類算法先從輸入圖像中提取出可能包含目標(biāo)的候選區(qū)域, 然后對(duì)候選區(qū)域進(jìn)行分類, 通過邊界框回歸來調(diào)整邊界框的大小和位置,最后利用NMS(Non-Maximum Supression,非極大值抑制)方法清除冗余框。
(2)單階段(one-stage)目標(biāo)檢測(cè)算法。 如YOLO[9]、YOLO v2[10]、YOLO v3[11]、YOLO v4[12]、SSD[13]、DSSD[14]、FSSD[15]、RetianNet[16]等。該類算法則無需提取候選區(qū)域,而是將目標(biāo)檢測(cè)問題轉(zhuǎn)換為回歸問題, 直接對(duì)目標(biāo)分類和邊框預(yù)測(cè)進(jìn)行回歸分析,相對(duì)來說精度有所損失,但速度較two-stage 檢測(cè)算法更快。
(3)anchor-free 目標(biāo)檢測(cè)算法。 如CornerNet[17]、CenterNet[18]、FCOS[19]等。 該類算法不引入錨框機(jī)制,通過全卷機(jī)神經(jīng)網(wǎng)絡(luò)得出的熱點(diǎn)圖確定目標(biāo)中心點(diǎn), 進(jìn)而回歸得出目標(biāo)尺寸、3D 坐標(biāo)方向、姿態(tài)信息等。
本文采用檢測(cè)速率和檢測(cè)精度出色平衡的YOLO v4目標(biāo)檢測(cè)模型,在單個(gè)目標(biāo)小樣本的情況下進(jìn)行多次迭代訓(xùn)練, 選取最終迭代損失最小的權(quán)重值作為預(yù)測(cè)權(quán)重,分別對(duì)假目標(biāo)的位置、背景、顏色、大小和亮度等因素變化前后的測(cè)試集進(jìn)行檢測(cè),探究這些因素對(duì)檢測(cè)效果的影響。
實(shí)驗(yàn)條件:本實(shí)驗(yàn)采用基于Tensorflow 深度學(xué)習(xí)框架的YOLO v4 目標(biāo)檢測(cè)模型,CPU 為i9-10980XE,內(nèi)存為128GB,GPU 為NVIDIA TITAN V。
對(duì)YOLO v4 網(wǎng)絡(luò)模型進(jìn)行訓(xùn)練,訓(xùn)練階段初始學(xué)習(xí)率為0.001, 每次迭代訓(xùn)練100 輪, 前50 輪batchsize 為8,后50 輪batchsize 為2。 將前一次迭代得到的最低訓(xùn)練損失權(quán)重作為下一次迭代訓(xùn)練的預(yù)訓(xùn)練權(quán)重。
YOLO v4 目標(biāo)檢測(cè)網(wǎng)絡(luò)模型多次迭代訓(xùn)練的訓(xùn)練損失值逐步收斂穩(wěn)定在4 左右,選取最低訓(xùn)練損失值4.073所對(duì)應(yīng)的權(quán)重作為檢測(cè)模型的預(yù)測(cè)權(quán)重。 YOLO v4 目標(biāo)檢測(cè)網(wǎng)絡(luò)模型多次迭代訓(xùn)練的訓(xùn)練損失值收斂曲線見圖4。
圖4 YOLO v4 訓(xùn)練損失Fig.4 YOLO v4 Training loss
2.3.1 實(shí)驗(yàn)一
將隨機(jī)獲得的測(cè)試集輸入訓(xùn)練好的YOLO v4 目標(biāo)檢測(cè)模型中進(jìn)行預(yù)測(cè), 圖中軍事目標(biāo)標(biāo)注為Car 這一目標(biāo)類別,則模型在測(cè)試集上的平均精度均值(mean Average Precision,mAP)即為該類的平均精度(Average Precision,AP),由此來衡量模型訓(xùn)練的好壞。平均精度(AP)越高,即該檢測(cè)模型的性能越好。 平均精度(AP)從精確率(Precision)和召回率(Recall)兩個(gè)方面進(jìn)行衡量。
預(yù)測(cè)目標(biāo)時(shí)預(yù)測(cè)值與真實(shí)值相同,記為T(True),預(yù)測(cè)值與真實(shí)值相反,記為F(False);預(yù)測(cè)值為正例,記為P(Positive),預(yù)測(cè)值為反例,記為N(Negative)。 故TP 指真實(shí)值和預(yù)測(cè)值同為正樣本的樣本數(shù),TN 指真實(shí)值和預(yù)測(cè)值同為負(fù)樣本的樣本數(shù),F(xiàn)P 指真實(shí)值為負(fù)樣本但預(yù)測(cè)值為正樣本的樣本數(shù),F(xiàn)N指真實(shí)值為正樣本而預(yù)測(cè)值為負(fù)樣本的樣本數(shù),見圖5。
圖5 模型預(yù)測(cè)Fig.5 Model prediction
(1)Precision (精 確率)和Recall(召回率):精確率又稱為查準(zhǔn)率,是針對(duì)預(yù)測(cè)結(jié)果而言的,它表示預(yù)測(cè)結(jié)果為正樣本的樣本中真實(shí)值也為正樣本的樣本所占比例; 召回率又稱為查全率, 是針對(duì)測(cè)試樣本而言的, 它表示真實(shí)值為正樣本的樣本中預(yù)測(cè)值也為正樣本的樣本所占比例。 計(jì)算公式如下所示:
(2)AP(Average-Precision,平均精度)和mAP(mean Average Precision,平均精度均值):AP 指Precision-Recall曲線下面的面積。 mAP 是多個(gè)類別AP 的平均值。
YOLO v4 檢測(cè)模型在測(cè)試集上檢測(cè)結(jié)果如圖6 所示。
圖6 YOLO v4 的AP 曲線Fig.6 AP curve of YOLO v4
2.3.2 實(shí)驗(yàn)二
對(duì)假目標(biāo)位置和背景變化前后的測(cè)試集圖像進(jìn)行預(yù)測(cè),檢測(cè)結(jié)果見表1。
表1 位置和背景變化的檢測(cè)結(jié)果Tab.1 Test results of position and background change
從表格數(shù)據(jù)中可看出:
(1)位置和背景變化前,假目標(biāo)檢測(cè)平均精度高達(dá)98.67%,說明在相同背景和相同位置情況下,模型將假目標(biāo)識(shí)別為真目標(biāo)的概率很高,假目標(biāo)“以假亂真”的效果較好。
(2)位置變化使假目標(biāo)的檢測(cè)精度從98.67%下降至46.68%;背景變化使假目標(biāo)的檢測(cè)精度從98.67%分別下降為35.07%、53.27%和44.93%。
位置和背景變化后, 假目標(biāo)的檢測(cè)平均精度都有一定幅度的下降,但仍控制在一定程度,說明位置和背景的改變對(duì)目標(biāo)檢測(cè)效果有一定影響,但程度有限,模型對(duì)目標(biāo)的識(shí)別主要基于目標(biāo)本身特征的識(shí)別, 而不是目標(biāo)與位置和背景的空間關(guān)系。
2.3.3 實(shí)驗(yàn)三
在假目標(biāo)所處的位置和背景保持不變的情況下,對(duì)進(jìn)行目標(biāo)特性變化前后的假目標(biāo)測(cè)試集進(jìn)行模型預(yù)測(cè),檢測(cè)結(jié)果如表2~表4 所示。
表2 顏色變化的檢測(cè)結(jié)果Tab.2 Test results of color change
表3 亮度變化的檢測(cè)結(jié)果Tab.3 Test results of brightness change
表4 大小變化的檢測(cè)結(jié)果Tab.4 Test results of size change
從表格數(shù)據(jù)中可看出:
(1)隨著顏色變化程度的增大,假目標(biāo)的檢測(cè)平均精度從98.67%逐步下降至83.58%??芍诩倌繕?biāo)位置和背景保持不變的情況下,單種軍綠色(#0215E21)的疊加變化對(duì)檢測(cè)效果的影響十分有限。
(2)假目標(biāo)的檢測(cè)平均精度隨著亮度的增加由98.67%逐漸下降至72.5%, 隨亮度的減少先上升后下降并穩(wěn)定在97.88%左右。 亮度增大使得目標(biāo)的部分特征丟失,導(dǎo)致檢測(cè)準(zhǔn)確度的下降但影響較為有限; 而亮度的降低反而能在一定程度上稍微提高檢測(cè)效果。
(3)假目標(biāo)的檢測(cè)平均精度隨大小的逐漸增大而逐步上升,但變化程度較為有限。目標(biāo)特性變化后,假目標(biāo)的檢測(cè)平均精度波動(dòng)范圍較小,與真目標(biāo)的檢測(cè)平均精度較為接近,說明檢測(cè)模型將假目標(biāo)誤判為真目標(biāo)的概率很大。
為探究假目標(biāo)對(duì)目標(biāo)檢測(cè)效果的影響, 本文基于YOLO v4 目標(biāo)檢測(cè)模型,對(duì)比分析了假目標(biāo)的位置、背景及其顏色、亮度、大小等特征變化前后的檢測(cè)平均精度。結(jié)果表明,對(duì)經(jīng)過多次迭代、訓(xùn)練效果良好的檢測(cè)模型,假目標(biāo)的位置和背景變化會(huì)導(dǎo)致檢測(cè)平均精度有明顯的降低,而目標(biāo)特性的變化對(duì)檢測(cè)效果的影響卻較為有限。
當(dāng)然, 上述結(jié)論只能作為基于本次實(shí)驗(yàn)數(shù)據(jù)集的探究結(jié)果,不具備普適意義,且實(shí)驗(yàn)設(shè)置的前提條件是小樣本數(shù)據(jù)和未將假目標(biāo)作為訓(xùn)練數(shù)據(jù)進(jìn)行訓(xùn)練。 但實(shí)驗(yàn)結(jié)果也在一定程度上說明了目標(biāo)檢測(cè)模型對(duì)數(shù)據(jù)的依賴,在數(shù)據(jù)不足的情況下, 假目標(biāo)和目標(biāo)特性控制技術(shù)能對(duì)檢測(cè)效果產(chǎn)生重要影響。 這一結(jié)論對(duì)軍事目標(biāo)檢測(cè)和假目標(biāo)的配置使用有一定的參考意義。