施賽楠, 董澤遠(yuǎn), 楊 靜, 楊春嬌
(1. 南京信息工程大學(xué)電子與信息工程學(xué)院, 江蘇 南京 210044;2. 中國航空工業(yè)第一飛機(jī)設(shè)計(jì)研究院, 陜西 西安 710089)
隨著隱身技術(shù)和目標(biāo)小型化發(fā)展,高分辨對海雷達(dá)的主要任務(wù)是探測復(fù)雜環(huán)境下的海面小目標(biāo),如小船、快艇、潛艇、漂浮物等。通常,這些小目標(biāo)的回波淹沒在強(qiáng)時變海雜波背景下,處于臨界可觀測信雜比(signal-to-clutter ratio, SCR)條件下。相對于空中目標(biāo),低速運(yùn)動的海面目標(biāo)通常具有較弱的機(jī)動性,導(dǎo)致其頻譜容易落在海雜波主雜波區(qū),加大了檢測的難度。因此,高分辨海雜波背景下小目標(biāo)檢測一直是海內(nèi)外學(xué)者研究的熱點(diǎn)和難點(diǎn)[1-3]。
目前,針對海面小目標(biāo)具有低SCR的問題,長時累積增益是一種公認(rèn)的有效檢測途徑[4-5]。在長時觀測下,海雜波具有較強(qiáng)的空-時變特性。學(xué)者們將分形理論引入到海雜波回波建模中,發(fā)展了基于Hurst指數(shù)、多尺度分形、擴(kuò)展分形、頻域分形等多種方法[6-8],這些檢測器的觀測時間通常需要長達(dá)秒級以上。為了打破單一特征檢測的性能瓶頸,Shui提出了基于幅度和多普勒特性的三特征檢測框架[9-10],將檢測問題轉(zhuǎn)換到多維特征空間中。Xu提出將極化特征引入特征檢測框架[11]。多維特征提取主要依據(jù)目標(biāo)和雜波在時域、頻域、極化域等上的差異性[12-13],人為提取的特征往往是經(jīng)驗(yàn)的、定性的和不完備的。為此,學(xué)者們將深度學(xué)習(xí)方法引入海面目標(biāo)檢測中[14-17]。Machado提出采用神經(jīng)網(wǎng)絡(luò)估計(jì)海雜波的K分布模型參數(shù)[18]。Li在特征檢測框架下提出采用虛警可控的SVM獲取高維判決區(qū)域[19]。蘇寧遠(yuǎn)將卷積神經(jīng)網(wǎng)絡(luò)(convolutional neural network, CNN)方法引入到海面目標(biāo)檢測和分類中[20],但未進(jìn)行實(shí)測數(shù)據(jù)驗(yàn)證和算法虛警控制研究。
針對人工特征提取的局限性,本文引入遷移模型自主學(xué)習(xí)時頻圖特性。不同于傳統(tǒng)的CNN檢測方法,本文通過白化預(yù)處理,增大目標(biāo)和雜波的差異性;建立半仿真模型生成含目標(biāo)的回波數(shù)據(jù),解決兩類樣本非均衡問題;將概率作為統(tǒng)計(jì)量以獲得虛警可控的判決區(qū)域。實(shí)測數(shù)據(jù)驗(yàn)證提出算法在不同環(huán)境下具有穩(wěn)健的探測性能。
在高分辨海雜波背景下,對海雷達(dá)接收到N個連續(xù)的脈沖觀測回波z(n),n=1,2,…,N。檢測的本質(zhì)就是判別觀測回波是否含有目標(biāo)。因此,海面目標(biāo)檢測問題可歸為二元假設(shè)檢驗(yàn)[2-5],即
(1)
式中,c表示海雜波;s表示目標(biāo)回波;zk表示待檢測單元(cell under test, CUT)周圍第k個距離單元的觀測回波;K表示參考單元的數(shù)目。假設(shè)目標(biāo)不存在距離擴(kuò)展,則參考單元為純雜波數(shù)據(jù),為CUT提供雜波信息。
事實(shí)上,目標(biāo)檢測屬于單分類問題或兩分類問題。單分類器基于大量的海雜波數(shù)據(jù)進(jìn)行訓(xùn)練,但單分類器只學(xué)習(xí)了雜波特性而不涉及目標(biāo),具有冗雜性和局限性。因而,單分類器不是最佳選擇,設(shè)計(jì)兩分類器是性能提升的必然發(fā)展趨勢。但含目標(biāo)回波樣本是稀疏的、不完備的,并且人工提取的特征往往是經(jīng)驗(yàn)的、定性的。因此,必須發(fā)展非均衡樣本下深入自主特征挖掘的新方法。
目前,CNN已在語音、計(jì)算機(jī)視覺、圖像處理等領(lǐng)域具有廣泛的運(yùn)用,典型的網(wǎng)絡(luò)有早期網(wǎng)絡(luò)LeNet、經(jīng)典網(wǎng)絡(luò)AlexNet、系列深度網(wǎng)絡(luò)GoogLeNet以及殘差網(wǎng)絡(luò)ResNet等[21-24]。本文聯(lián)合GoogLeNet系列中的Inception V3深度網(wǎng)絡(luò)[25-26]和遷移學(xué)習(xí)[27-28]對時頻圖提取不同尺度的信息,深入挖掘數(shù)據(jù)的隱含特征。
通過稀疏的結(jié)構(gòu)替代網(wǎng)絡(luò)中的稠密全連接,Inception網(wǎng)絡(luò)提出深度網(wǎng)絡(luò)結(jié)構(gòu)化,具有“很窄很深”的結(jié)構(gòu)。深度網(wǎng)絡(luò)不再是CNN卷積層的簡單堆砌,而是具有精心設(shè)計(jì)的結(jié)構(gòu)組合。
圖1是Inception V3模型的架構(gòu)[26],包括多個卷積層、池化、3個模塊A、5個模塊B和2個模塊C。與傳統(tǒng)的CNN網(wǎng)絡(luò)不同,Inception V3模型具有以下3個顯著特點(diǎn):① 通過分解卷積,保持感受野范圍同時減少模型參數(shù)。② 引入1×1卷積核進(jìn)行降維,降低計(jì)算成本。③ 批標(biāo)準(zhǔn)化(batch normalization, BN)加快網(wǎng)絡(luò)的訓(xùn)練速度并提高分類準(zhǔn)確率。
圖1 Inception V3模型結(jié)構(gòu)
考慮到大部分的數(shù)據(jù)存在相關(guān)性,引入遷移學(xué)習(xí)[27]可加快并優(yōu)化模型的分類精度。Inception V3模型已在百萬張共千個類別的ImageNet圖像數(shù)據(jù)集進(jìn)行訓(xùn)練,特征層具有較好的泛化性能。因此,將Inception V3模型作為初始權(quán)重,根據(jù)當(dāng)前數(shù)據(jù)進(jìn)行權(quán)重調(diào)整,這比直接訓(xùn)練新的深度網(wǎng)絡(luò)更加簡單實(shí)用。
圖2是基于Inception V3的遷移學(xué)習(xí)模型結(jié)構(gòu)。根據(jù)海雜波和含目標(biāo)回波的時頻圖,遷移學(xué)習(xí)訓(xùn)練能夠提取兩類時頻圖的多尺度特征。通過微調(diào)訓(xùn)練調(diào)整Inception V3模型的權(quán)重,降低學(xué)習(xí)率。驗(yàn)證集來自訓(xùn)練數(shù)據(jù)中的一部分,用于進(jìn)一步調(diào)整權(quán)重。遷移學(xué)習(xí)在現(xiàn)有的深度網(wǎng)絡(luò)模型基礎(chǔ)上訓(xùn)練,訓(xùn)練成本降低,適合于小數(shù)據(jù)集。在數(shù)據(jù)量足夠且不計(jì)訓(xùn)練成本時,可選擇基于數(shù)據(jù)重新訓(xùn)練新的模型。
圖2 遷移學(xué)習(xí)模型結(jié)構(gòu)
在Q個類別分類問題中,模型通過softmax回歸模型輸出最后的類別標(biāo)簽。該模型將輸入特征xi與權(quán)重wij、偏差bj進(jìn)行線性疊加,即
zj=wijxi+bj,j=0,1,…,Q-1
(2)
則輸入特征值屬于第j類別的概率為
(3)
(4)
在兩分類問題中,最終輸出的標(biāo)簽為0或者1。
針對單分類器和特征提取的局限性,本文提出基于時頻圖自主學(xué)習(xí)(autonomic learning based on time-frequency graph, ALTFG)的兩分類檢測器。
與傳統(tǒng)的檢測方法不同,本文將檢測問題歸為兩分類問題,基于歸一化時頻圖實(shí)現(xiàn)含目標(biāo)回波和海雜波之間的有效分類。
圖3是ALTFG檢測器的流程圖,整個框架包括在線檢測分支和離線訓(xùn)練分支。在訓(xùn)練分支,遷移學(xué)習(xí)模型的訓(xùn)練數(shù)據(jù)來自兩類樣本和類別標(biāo)簽。純雜波數(shù)據(jù)直接來自雷達(dá)開機(jī)后收集的當(dāng)前海域數(shù)據(jù)。由于目標(biāo)的稀缺性,本文采用仿真目標(biāo)加入到純雜波中構(gòu)成含目標(biāo)回波,解決兩類樣本數(shù)量非均衡問題。訓(xùn)練分支為檢測分支提供訓(xùn)練模型和虛警可控的判決區(qū)域。在檢測分支,參考單元提供了雜波的時頻分布(time-frequency distribution, TFD)的均值和方差,用于CUT抑制雜波。白化預(yù)處理后的TFD通過已訓(xùn)練的深度網(wǎng)絡(luò),提取統(tǒng)計(jì)量,進(jìn)行類別判別。整個流程是一個開放式的框架,也可采用其他深度網(wǎng)絡(luò)進(jìn)行訓(xùn)練獲取統(tǒng)計(jì)量。
圖3 基于時頻圖自主學(xué)習(xí)的檢測流程圖
通常,雷達(dá)一旦開始工作,就可以獲得當(dāng)前環(huán)境下大量的海雜波數(shù)據(jù)。但含感興趣目標(biāo)回波具有很強(qiáng)的空時稀疏性,幾乎不可能獲得大量回波數(shù)據(jù)。含目標(biāo)回波和純雜波這兩類樣本處于非均衡的狀態(tài)。為了解決這個問題,提出半仿真含目標(biāo)回波的方法。
考慮到實(shí)際海面目標(biāo)運(yùn)動緩慢,在幾百毫秒的觀測時間下,目標(biāo)的瞬時頻率曲線建模為線性調(diào)頻(linear frequeny modulation, LFM)模型,即
(5)
式中,λ是雷達(dá)波長;v0和v1是目標(biāo)在觀測時間內(nèi)起始和末端的徑向速度;Tr是雷達(dá)的脈沖重復(fù)周期;φ0是初始相位。
假設(shè)目標(biāo)的初始和末端徑向速度在區(qū)間(-5,5)m/s內(nèi)均勻產(chǎn)生,將仿真目標(biāo)回波線性疊加到實(shí)測海雜波數(shù)據(jù)上,即
(6)
由此,得到含目標(biāo)回波的半仿真數(shù)據(jù),用于獲取含目標(biāo)回波的大量樣本,進(jìn)而構(gòu)建兩類樣本均衡條件下的分類模型。
相對于一維多普勒頻譜,二維圖像蘊(yùn)含著豐富的數(shù)據(jù)信息,更適合學(xué)習(xí)含目標(biāo)回波和海雜波之間的差異性。本文采用平滑偽魏格納-維爾分布(smoothed pseudo Wigner-Ville distribution, SPWVD)獲取觀測向量z=[z(1),z(2),…,z(N)]T的二維時頻圖。設(shè)置歸一化多普勒頻率的采樣間隔為Δfd,SPWVD的計(jì)算公式為
SPWVD(n,l|z)=
(7)
式中,n表示時間維;l表示頻率維,g(m)和h(k)分別是時間和頻率的平滑窗。
在長時間觀測下,海雜波具有非平穩(wěn)和非高斯性。在二維時頻平面上,海雜波的SPWVD可看成是一個隨機(jī)過程。那么,該隨機(jī)過程的低階統(tǒng)計(jì)特性可用均值函數(shù)μ(n,l)和標(biāo)準(zhǔn)差函數(shù)σ(n,l)表示。因此,接收向量z的歸一化TFD(normalized TFD, NTFD)定義為
(8)
當(dāng)雷達(dá)實(shí)際工作時,海雜波的均值函數(shù)μ(n,l)和標(biāo)準(zhǔn)差函數(shù)σ(n,l)是未知的,且具有時變和空變特性。因此,這些統(tǒng)計(jì)特性可從參考單元中獲取估計(jì)值
(9)
將式(9)代入式(8),CUT觀測向量的NTFD為
(10)
對于海雜波來說,歸一化過程使海雜波均勻分散在時頻平面上,即白化過程。相對于時頻圖和雜波圖,白化預(yù)處理增大了海雜波和含目標(biāo)回波兩類之間的差別,更加適合自主學(xué)習(xí)特征。
由于CNN分類最終判別取決于最大概率的輸出,無法控制虛警率。針對此問題,本文提出將softmax概率輸出作為檢測統(tǒng)計(jì)量,通過蒙特卡羅實(shí)驗(yàn)獲得虛警可控的判決區(qū)域。
在兩分類問題中,softmax輸出是兩個類別的概率。在H0假設(shè)下,海雜波樣本標(biāo)簽為“0”。圖4是10 210個海雜波樣本的統(tǒng)計(jì)量。一般分類網(wǎng)絡(luò)根據(jù)黑色直線判別,屬于0類別概率大于0.5的樣本,分類標(biāo)簽為“0”,否則為“1”。這里,按照給定虛警率Pfa=10-3,只有10個樣本是虛警。將黑色直線按照箭頭方向進(jìn)行平移,直到只有10個樣本在直線上方,即獲得判別門限。分類判別準(zhǔn)則如下:紅色線上方為含目標(biāo)回波所在區(qū)域,下方為雜波所在區(qū)域。因此,本文提出的檢測器具有可控虛警,這種恒虛警特性在實(shí)際雷達(dá)檢測中具有重要意義。
圖4 虛警可控判決區(qū)域
實(shí)測數(shù)據(jù)來自互聯(lián)網(wǎng)上公開的IPIX雷達(dá)于1993年采集的數(shù)據(jù)庫[29]。該數(shù)據(jù)庫是目前國際上公認(rèn)的小目標(biāo)實(shí)測數(shù)據(jù)。X波段雷達(dá)的脈沖重復(fù)頻率為1 000 Hz,距離分辨率為30 m,測試目標(biāo)為直徑1 m的小球。實(shí)驗(yàn)中采用HH極化下4組數(shù)據(jù),具體的參數(shù)如表1所示。
表1 實(shí)測數(shù)據(jù)特性
圖5是4組實(shí)測數(shù)據(jù)的功率圖和目標(biāo)單元TFD情況。從功率圖上來看,#311和#26的目標(biāo)回波能量較強(qiáng),#30和#310的目標(biāo)回波被淹沒在雜波中,加大了檢測的難度。從頻譜上來看,#310和#311的目標(biāo)瞬時頻率曲線偏離海雜波主雜波帶,而#26和#30的目標(biāo)瞬時頻率曲線落在主雜波帶內(nèi)。為了定量衡量上述的特性,引入平均SCR(average SCR, ASCR)和多普勒距離兩個指標(biāo)。
圖5 4組實(shí)測數(shù)據(jù)的功率圖和目標(biāo)單元時頻分布
(1) ASCR
ASCR定義為目標(biāo)回波的平均功率和雜波回波的功率之比[9-10]。根據(jù)雷達(dá)回波數(shù)據(jù),估計(jì)公式為
(11)
式中,z(i/H0)表示H0假設(shè)下的觀測回波數(shù)據(jù)。
(2) 多普勒距離
在TFD上,多普勒距離定義為海雜波頻譜和目標(biāo)頻譜的距離,衡量兩者的分離程度。當(dāng)海雜波的平均多普勒功率譜(average Doppler power spectrum, ADPS)為Pc(fd)和含目標(biāo)回波的ADPS為Ps+c(fd)時,目標(biāo)的ADPS為
Ps(fd)=max{Ps+c(fd)-Pc(fd),0}
(12)
多普勒距離ρ∈[0,1]的表達(dá)式為
(13)
多普勒距離越大,表明目標(biāo)回波和海雜波的ADPS越容易分離。
表1中記錄了4種數(shù)據(jù)的ASCR和多普勒距離。對于#26,目標(biāo)回波較強(qiáng),其頻譜在多普勒域落在海雜波主雜波帶內(nèi)。對于#30,目標(biāo)回波弱且頻譜落在主雜波帶內(nèi)。對于#310,目標(biāo)回波較弱,其頻譜落在主雜波帶外。對于#311,目標(biāo)回波強(qiáng),且其頻譜落在主雜波帶外。這4組數(shù)據(jù)代表著不同的海洋探測環(huán)境。
實(shí)驗(yàn)中,設(shè)定脈沖累積數(shù)目N=256,參考單元K=10,Pfa=10-3。由于樣本數(shù)目有限,數(shù)據(jù)進(jìn)行50%的重疊。遷移學(xué)習(xí)分類器使用Python 3.6, CUDA 10.0, CUDNN 7.6, Tensorflow-GPU 1.14的環(huán)境架構(gòu),計(jì)算機(jī)配置為Intel(R) Xeon(R) Silver 4210 CPU,NVIDIA GeForce RTX 2080 Ti顯卡,128GB內(nèi)存。根據(jù)訓(xùn)練過程中損失函數(shù)的收斂,設(shè)置10代訓(xùn)練,學(xué)習(xí)率0.000 1,采用交叉熵?fù)p失函數(shù)和Adagrad優(yōu)化器。
(1) 高SCR(#26和#311)
#26數(shù)據(jù)和#311數(shù)據(jù)的檢測結(jié)果如圖6和圖7所示。
從圖6和圖7可知,即使SCR高達(dá)12 dB,基于分形檢測器[6]性能最差,在0.25 s觀測時間下無法工作。這主要因?yàn)樵摍z測器性能依賴于雷達(dá)回波的不規(guī)則性、粗糙程度等特性,需要秒級以上的觀測時間才能獲得較為滿意的性能。不同于分形檢測器[6],三特征檢測器[9]性能與SCR密切相關(guān)。當(dāng)SCR達(dá)到12 dB以上時,該檢測器性能接近提出的檢測器。因?yàn)槿卣鳈z測器[9]主要依靠能量和多普勒譜幾何特性。提出的ALTG檢測器具有最優(yōu)性能。這表明ALTG檢測器在學(xué)習(xí)時頻圖時能挖掘能量、頻譜幾何以外更多的其他深層特性,這是人工特征提取無法獲得的優(yōu)勢。
(2) 低SCR(#30和#310)
#30數(shù)據(jù)和#310數(shù)據(jù)的檢測結(jié)果如圖8和圖9所示。
圖6 #26數(shù)據(jù)的檢測結(jié)果(N=256,Pfa=10-3)
圖7 #311數(shù)據(jù)的檢測結(jié)果(N=256,Pfa=10-3)
圖8 #30數(shù)據(jù)的檢測結(jié)果(N=256,Pfa=10-3)
圖9 #310數(shù)據(jù)的檢測結(jié)果(N=256,Pfa=10-3)
從圖8和圖9可知,在SCR比和秒級以內(nèi)觀測時間條件下,分形檢測器[6]性能損失嚴(yán)重,根本無法工作。對于三特征檢測器[9]來說,能量特征失去優(yōu)勢,主要依靠多普勒頻譜的幾何特征進(jìn)行工作。相對多普勒峰高是一個幾何特征,衡量的是目標(biāo)多普勒峰高相對于海雜波峰高的差距。在多普勒距離較大時,幾何特征能有效發(fā)揮優(yōu)勢。但是,受到能量特征差的影響,該檢測器檢測概率仍較低,不適合運(yùn)用于低SCR條件。
當(dāng)SCR低且多普勒距離較小時(#30),在歸一化時頻圖5(b)上,目標(biāo)回波完全被遮蔽在主雜波帶內(nèi)。提出的檢測器檢測概率只有0.14,但其他兩種檢測器檢測概率更低。圖5(c)當(dāng)SCR低且多普勒距離較大時(#310),在歸一化時頻圖圖5(c)上,目標(biāo)回波能量集中且海雜波擴(kuò)散在整個頻帶內(nèi),更容易學(xué)習(xí)兩個類別的內(nèi)在特性。相對于三特征檢測器[9],ALTG檢測器的檢測概率具有50%的提升。因此,提出的ALTG檢測器在SCR低且多普勒距離較大的情況下,能夠獲得顯著的性能提升。
圖10是不同探測環(huán)境下3種檢測器的接收機(jī)工作特性(receiver operating characteristic, ROC)曲線??紤]到樣本的數(shù)量,設(shè)置虛警率從0.001到0.1。ALTG檢測器具有最優(yōu)的性能曲線,特別是在多普勒距離較大時,對應(yīng)#310和#311,性能分別提升45%和15%。在圖10(d)中,ALTG檢測器和三特征檢測器[9]都具有較好的性能。當(dāng)高SCR和多普勒距離較大,且對性能要求不高時,可優(yōu)先選擇三特征檢測器。但對于低SCR條件,必須深入挖掘數(shù)據(jù)內(nèi)部的固有特性,選擇ALTG檢測器更為合適。
圖10 不同數(shù)據(jù)下3種檢測器的ROC曲線
最后,表2列出了3種深度網(wǎng)絡(luò)的檢測性能和時間代價(jià)的結(jié)果。文獻(xiàn)[20]給出了AlexNet檢測器,但時頻圖未進(jìn)行歸一化預(yù)處理且虛警率未控制。AlexNet+NTFD表示進(jìn)行歸一化預(yù)處理,與ALTG檢測器只有網(wǎng)絡(luò)的差別。
表2 不同檢測器的性能(N=256, Pfa=10-3)
從表2中可得到3個結(jié)論:① 歸一化預(yù)處理的確能增大海雜波和含目標(biāo)回波在時頻圖上的差異性,更適合用于網(wǎng)絡(luò)模型學(xué)習(xí)特征,從而獲得檢測性能提升;② 基于深度網(wǎng)絡(luò)的遷移學(xué)習(xí)網(wǎng)絡(luò)的分類性能優(yōu)于AlexNet網(wǎng)絡(luò),能更深入地挖掘歸一化時頻圖上隱層的特征;③ 遷移學(xué)習(xí)的訓(xùn)練時間和AlexNet網(wǎng)絡(luò)處于同一數(shù)量級,但測試時間減少6倍,這主要源于Inception V3具有批標(biāo)準(zhǔn)化加快處理速度。事實(shí)上,雷達(dá)實(shí)際工作時更關(guān)注的是在線檢測時間,即測試時間。模型訓(xùn)練過程可線下完成,不影響雷達(dá)實(shí)時探測環(huán)境。因此,ALTG檢測器滿足雷達(dá)實(shí)時性要求,適用于岸基、艦載等低速平臺下的雷達(dá)對海探測。此外,針對不同的海洋探測環(huán)境以及雷達(dá)系統(tǒng)性能的需求,雷達(dá)工作時可選擇合適的檢測算法。
本文主要解決海面小目標(biāo)檢測概率低的問題。針對人為提取特征的局限性和單分類檢測的性能瓶頸,本文將檢測問題轉(zhuǎn)換為兩分類問題,提出基于歸一化時頻圖自主學(xué)習(xí)的海面小目標(biāo)檢測方法,能實(shí)現(xiàn)大場景探測環(huán)境下的恒虛警探測。后續(xù)可進(jìn)一步優(yōu)化深度網(wǎng)絡(luò)模型,同時構(gòu)建殘差網(wǎng)絡(luò)加快訓(xùn)練速度,在低SCR和低多普勒距離條件下進(jìn)一步提升性能。