張力文 潘 劍 張右承 陳元培 馬 喆 黃旭輝 孫科武(航天科工集團智能科技研究院有限公司 北京 100144)(航天防務(wù)智能系統(tǒng)與技術(shù)科研重點實驗室 北京 100144)
作為廣泛應(yīng)用于社會科學發(fā)展和軍事國防等領(lǐng)域的探測設(shè)備,雷達具備極端天氣下的良好魯棒性[1],以及對光照不敏感等特點[2],具有重要的學術(shù)和實用價值[3]。經(jīng)典的雷達目標檢測方法遵循恒虛警檢測(Constant False Alarm Rate,CFAR)[4–6]原則。CFAR檢測隸屬于統(tǒng)計檢測理論,即一種利用信號和噪聲的統(tǒng)計特性,遵照檢測概率最大準則(Neyman-Pearson,N-P)來建立最佳判決的數(shù)學理論。其本質(zhì)上是一種在先驗概率和代價函數(shù)均未知的情況下,固定虛警概率,再去最小化漏檢概率或最大化檢出(召回)概率的檢測方法。
隨著大數(shù)據(jù)科學的發(fā)展,以數(shù)據(jù)為驅(qū)動的經(jīng)典機器學習和當下的深度學習技術(shù)也被廣泛應(yīng)用于雷達目標檢測與識別。從原理上來說,無論是經(jīng)典的機器學習還是深度學習方法(以下統(tǒng)稱機器學習方法),他們實現(xiàn)雷達目標檢測都是基于對數(shù)據(jù)的合理表示,其涉及模式識別中的特征工程和表示學習理論范疇。他們與經(jīng)典CFAR的檢測原理有著本質(zhì)的不同,機器學習更多地是在探討如何在一個更加抽象或高維的特征空間中對樣本進行表示,并利用此種表示來訓練分類器,最終實現(xiàn)對目標的檢測。這些特征表示可以通過利用基于統(tǒng)計建模的投影算子轉(zhuǎn)換而來[7,8],也可以通過學習的方式來獲得[9]。而在分類器的訓練方面,其可以是和特征學習部分相分離的方式來單獨進行,如經(jīng)典的支持向量機(Support Vector Machines,SVM)[10]與k近鄰(k-Nearest Neighbors,k-NN)[7,8];也可以是與特征學習部分耦合在一起的聯(lián)合學習方式[9]。
因此,可分析出數(shù)據(jù)驅(qū)動的機器學習方法與經(jīng)典CFAR的本質(zhì)區(qū)別:前者是在樣本空間中挖掘或者構(gòu)造出能有效表示每個樣本的方式,然后在這些表示所處的空間中以任務(wù)(例如分類)為驅(qū)動的方式去尋找一種能夠有效區(qū)分目標與雜波的超平面,其不需要顯式地獲得樣本的統(tǒng)計信息,也不需要對樣本的分布進行顯式的刻畫;而后者需要顯性地構(gòu)造出樣本在不同假設(shè)條件下的分布特性,從而在這些分布特性的明確定義下給出目標檢測的依據(jù)。而若要類比CFAR與機器學習方法的相似之處,那么筆者認為特征表示部分對應(yīng)了CFAR中對被檢單元和參考單元的采樣后的計算部分;而分類器則對應(yīng)于檢測閾值本身。
基于以上分析不難看出,由于缺乏對信號統(tǒng)計分布特性的顯式定義,機器學習方法雖無法嚴格保持CFAR性質(zhì),但仍然具備很多其他優(yōu)勢:自動化的學習機制可以在一定程度上擺脫對人工先驗設(shè)參的依賴程度;當具備新的可用數(shù)據(jù)時,模型可再次經(jīng)過微調(diào)以獲得更好的泛化能力(進化學習);靈活多樣的建模形式以適配多種雷達檢測識別任務(wù);以及復雜結(jié)構(gòu)帶來的更高容量的數(shù)據(jù)表示能力等等。這些優(yōu)勢也極大地促使研究者開展了眾多此方面的研究。
然而,考慮到雷達信號在數(shù)據(jù)形態(tài)上的多樣性遠超過其他形式的信號(如可見光圖像、文本類數(shù)據(jù)),加之不同的任務(wù)需求使得相應(yīng)的處理方法存在著很大的差異。因此,為便于歸納總結(jié),本文根據(jù)所面對任務(wù)的不同將近期主流的機器學習方法進行如下分類:
(1) 基于回波信號的目標-雜波檢測方法。此類方法是在探討如何在一維的回波信號上對某個距離單元上回波信號進行目標/雜波的辨識,是與經(jīng)典CFAR在任務(wù)形態(tài)上最為相似的一種方法。目前具有代表性的有基于線性SVM (Linear-SVM,L-SVM)[10],以及最近基于卷積神經(jīng)網(wǎng)絡(luò)(Convolutional Neural Networks,CNN)與注意力機制[11,12]的雷達目標檢測方法。以L-SVM為例,該方法借鑒CFAR的處理流程,將經(jīng)過脈沖壓縮和線性匹配濾波后的被檢單元與參考單元拼接成向量的形式訓練SVM分類器,相比于均值類CFAR方法,SVM能在較低信噪比(Signal-to-Noise Ratio,SNR)的情況下獲得穩(wěn)健的檢出效果。為了抑制k-NN算法對雜波的敏感程度,Coluccia等人[7,8]將參考單元的回波信號看作輔助數(shù)據(jù),并用其構(gòu)建出回波信號的正則化協(xié)方差矩陣,從而將原始回波投影為更加平滑的向量表示(雜波抑制),利用該種向量構(gòu)建出的訓練樣本集合可以獲得在不同信雜比(Signal-to-Clutter Ratio,SCR)情況下都更為魯棒的檢測模型。盡管這些方法無法嚴格保證CFAR的性質(zhì),然而在實際測得的虛警率上都取得了比CFAR更加穩(wěn)健的表現(xiàn)。
(2) 基于距離/多普勒/角度頻域變換的目標檢測-識別方法。此類方法綜合運用了當下視覺目標檢測[9,13]或語義分割[14–16]的原理,將經(jīng)典的雷達目標檢測任務(wù)推廣為一種雷達目標檢測-識別任務(wù)。相比于經(jīng)典的目標/雜波檢測機制,該種方法額外引入了對目標類型的識別。為了能在多種作用域上獲取目標的信息,通常都是利用級聯(lián)式的快速傅里葉變換(Fast Fourier Transform,FFT)將原始回波轉(zhuǎn)換為距離-多普勒(Range-Doppler,RD)、距離-方位角(Range-Angle,RA)或距離-方位角-多普勒(Range-Angle-Doppler,RAD)等聯(lián)合多域的頻譜表示作為模型的輸入,并在輸出中得到各域上的位置信息和目標類別語義信息。例如,文獻[17]利用CNN網(wǎng)絡(luò)作為檢測器,實現(xiàn)了在RD視角上的雷達目標檢測;文獻[18]在距離壓縮雷達數(shù)據(jù)的RA視角上,引入目標檢測網(wǎng)絡(luò)Fast-RCNN以提升雷達目標檢測性能。然而由于這是一種更為復雜的機器學習任務(wù),其對訓練數(shù)據(jù)和模型的規(guī)模要求都會更高。為了避免引入大量的人工標注成本,Wang等人[13]和Ouaknine等人[19]提出了一系列對RA及RD表示的自監(jiān)督標注方法。在模型方面,這些工作多以參數(shù)規(guī)模龐大的自編碼-解碼(Auto-Encoder-Decoder,AED)卷積網(wǎng)絡(luò)作為基礎(chǔ)框架,并在編碼部分強調(diào)多尺度空域信息[13–16]和時域信息學習[13,14,16]的重要性。這些方法都已經(jīng)完全脫離了經(jīng)典雷達目標檢測方法的框架,因此也無法直接套用經(jīng)典雷達目標檢測方法的評價指標對這些方法進行評估。
(3) 基于雷達成像數(shù)據(jù)的目標識別方法。此類方法通常是在高分辨的雷達成像數(shù)據(jù)上對目標的類型進行識別,通常不關(guān)心目標的空間位置信息。目前代表性的工作有基于(CNN)的合成孔徑雷達(Synthetic Aperture Radar,SAR)圖像目標識別[20],以及基于長短時記憶(Long Short-Term Memory,LSTM)的高分辨距離像(High Resolution Range Profile,HRRP)目標識別[21]等。此類方法雖不像檢測任務(wù)那樣關(guān)心目標的空間位置信息,但是利用深度學習模型的編碼能力來獲得有效的雷達信號表示的這一機理也對檢測類方法提供了可借鑒的經(jīng)驗。
目前,在以上這些方法中,研究熱度大都集中于第(2)和第(3)類方法,一方面是由于他們擁有公開可用的大規(guī)模訓練數(shù)據(jù),同時數(shù)據(jù)中目標信息量的充分程度也能夠給網(wǎng)絡(luò)的學習提供“燃料”;另一方面也是由于任務(wù)的定義也遵從了當下主流機器學習方法的定義,使得方法的引入更加自然。而對于與本文最為相關(guān)的第(1)類方法來說,樣本中可供模型挖掘的有效目標信息量非常稀少,往往很難充分發(fā)揮出復雜模型的樣本刻畫能力,同時也缺乏公開可用的大規(guī)模訓練數(shù)據(jù)集,因此現(xiàn)在此方面的研究還存在以下局限性:
(1) 所使用的模型較為簡單,通常是線性SVM和k-NN這種經(jīng)典模型,并且方法大都聚焦分類/判別器部分,而對回波特征表示學習方面的探討明顯存在不足。
(2) 實際情況下獲取到的回波數(shù)據(jù)中可用的目標信息是非常稀疏的,以本文的地面預(yù)警雷達實測回波數(shù)據(jù)為例,在一圈掃描后得到的43×6000個距離單元上,有時僅有1~2個單元上存在目標信息,這種目標/雜波極為不均衡的檢測任務(wù)也給當下主流的機器學習提出了巨大的挑戰(zhàn)。
(3) 所處理的數(shù)據(jù)大都是模擬仿真環(huán)境下生成的,缺乏更為極端條件下實測數(shù)據(jù)上的實驗驗證;同時目前的研究工作中也很少見到在統(tǒng)一實驗條件下對于經(jīng)典CFAR方法、經(jīng)典機器學習方法,以及深度學習方法的綜合性能評價。
針對以上現(xiàn)有研究的局限性,本文提出一系列適用于雷達回波的特征表示學習方法和針對目標-雜波樣本不均衡性的少數(shù)樣本數(shù)據(jù)生成方法,進而系統(tǒng)性地給出如圖1所示的基于雷達回波的目標檢測方法框架,最后使用以無人機為目標的地面預(yù)警雷達實測回波數(shù)據(jù)來對方法進行驗證。
圖1 回波時序關(guān)系依賴的時空域稀疏條件下雷達目標檢測框架Fig.1 Radar echo temporal relation learning-based spatial-temporal sparse target detection
針對雷達回波的表示學習問題,本文以雷達回波自身的時序性質(zhì)為約束,分別從無監(jiān)督學習和有監(jiān)督學習兩個方面給出了雷達回波特征的表示學習方法,并以目標檢測性能為衡量指標來對表示學習方法的有效性進行驗證;針對實際雷達探測中目標時空域范圍在雷達回波中展現(xiàn)出的稀疏性,本文將異常值檢測中的樣本均衡思想引入訓練樣本集構(gòu)建過程,提出一種目標-雜波樣本規(guī)模均衡化處理策略,緩解了基于機器學習的雷達目標探測任務(wù)中目標樣本驅(qū)動力不足的問題。最后,本文利用實測數(shù)據(jù)對所提出的完整檢測框架進行消融實驗分析,以驗證回波時序性特征表示學習及樣本均衡策略的有效性;并在盡可能模擬雷達實際工作的情況下與多種經(jīng)典CFAR算法進行對比實驗分析。本文所涉及的具體技術(shù)包含以下3個方面:
(1) 雷達目標回波增強。雷達在對目標進行探測時,不僅會接收到目標回波,同時也會接收到周圍環(huán)境反射的雜波信號,一般而言,雜波信號的回波功率會遠超目標回波,尤其是對于飛行高度低(≤500 m)、速度慢(6~200 m/s)、有效反射截面積(Radar Cross Section,RCS)遠低于1 m2的無人機目標,周圍雜波會更強,從而嚴重影響系統(tǒng)的目標檢測性能。而雷達目標檢測問題首先需要解決的是如何獲取足夠“純凈”的目標回波數(shù)據(jù),因此本文首先采用經(jīng)典的雷達信號處理手段對原始回波進行雜波抑制,從而提升回波的SCR。
(2) 時序關(guān)系依賴的雷達回波表示學習。在機器學習領(lǐng)域中,檢測問題本質(zhì)上是一種數(shù)據(jù)驅(qū)動的模式識別問題,其中對數(shù)據(jù)的有效特征表示至關(guān)重要。雷達回波作為一種時序性的信號,其中的動態(tài)時序信息是表示雷達回波的一種重要線索。而該種信息實際上可看作回波沿著距離(時間)方向的變化趨勢,該趨勢依賴于序列中各個元素之間的時序關(guān)系。為此,本文試圖以回波序列各距離單元間的時間依賴關(guān)系為約束,來分別從無監(jiān)督學習和有監(jiān)督學習兩種方式學習出可以代表輸入回波序列的時序性特征表示。
(3) 時空域稀疏條件下的雷達低慢小目標檢測。與常見的視覺目標檢測任務(wù)不同,可見光傳感器的感受野有限,通常都是針對近距離的感興趣目標,目標所占據(jù)的感受野區(qū)域相對更大,而雷達探測的范圍通常要更大,其所針對的通常也都是遠距離的目標,這就導致目標在雷達感受野范圍內(nèi)所占據(jù)的時空區(qū)域非常有限,若被檢目標自身RCS很小,那么其在感受野下將會呈現(xiàn)出極高的時空稀疏性。這一特點會導致訓練數(shù)據(jù)中目標與雜波的比例嚴重失衡,因此,本文試圖引入異常值檢測中的樣本平衡策略來構(gòu)建出目標-雜波樣本規(guī)模均衡的訓練數(shù)據(jù)集。
本文主要創(chuàng)新點如下:
(1) 系統(tǒng)性地提出了一種有效的基于雷達回波的目標/雜波檢測的機器學習方法框架,該方法框架不僅局限于檢測器的構(gòu)建,也對雷達回波的有效特征表示學習問題進行了探討;
(2) 著重研究了時序信息對于雷達回波表示的重要性,并給出了無監(jiān)督和有監(jiān)督兩種回波表示學習方法的具體實現(xiàn);
(3) 采用基于少數(shù)實測目標樣本鄰域內(nèi)擾動的樣本平衡策略解決了目標-雜波樣本不均衡的問題,并基于此方法構(gòu)建出目標-雜波樣本數(shù)均衡的數(shù)據(jù)集,以進行特征表示學習和檢測模型的訓練;
(4) 分別利用均衡策略構(gòu)建的數(shù)據(jù)集與實測序貫數(shù)據(jù)集設(shè)計實驗,對所提出的方法進行消融實驗以及與經(jīng)典CFAR方法的對比實驗。
如圖1所示,本文所提檢測方法的完整框架可大致分為4個部分:(1)原始回波預(yù)處理;(2)回波時序關(guān)系依賴的特征表示學習;(3)基于目標回波上采樣的訓練數(shù)據(jù)集構(gòu)建;(4)目標檢測器。本小節(jié)將逐一對這4個部分進行介紹。
雷達目標檢測問題首先需要解決的是如何獲取足夠“純凈”的目標回波數(shù)據(jù),為此,首先對原始回波進行異常點剔除、數(shù)字脈沖壓縮(Digital Pulse Compression,DPC)[22],以及有限沖擊響應(yīng)(Finite Impulse Response,FIR)濾波[22],從而獲得信雜比更高的回波信號。此外,綜合考慮回波時序上下文內(nèi)容與處理的時效性,還對濾波之后的回波進行滑動窗切分以得到之后時序建模和檢測的最短序列。以本文處理的回波數(shù)據(jù)為例,3個步驟的大致流程如下:
步驟1 DPC。由于目標的運動速度慢,其回波常常會與雜波交疊,甚至淹沒于后者之中。而DPC可以在不降低目標回波功率的同時,將較寬的回波進行壓縮,以提升距離分辨率。給定一個6通道的回波序列X∈CT×6(其中T為距離單元個數(shù)即快時間維度,6為多普勒通道個數(shù)即慢時間維)與參考發(fā)射波形S∈R2N(其中,N為發(fā)射波形長度,由于S包含發(fā)射波形的實部和虛部兩部分,因此維度為2N),首先對回波進行逐多普勒通道FFT,以得到每個脈沖的頻域響應(yīng)曲線∈CN(i=1,2,...,6);隨后將頻域響應(yīng)與經(jīng)過復數(shù)形式還原后的參考信號S?∈CN進行逐位相乘;最后對乘后的結(jié)果進行逐通道的傅里葉逆變換(Inversed FFT,IFFT),以得到最終壓縮后的回波序列Y∈CT×6。
步驟2 FIR濾波。由于目標飛行高度低,目標回波易被地物雜波所干擾,為此引入FIR濾波來對雜波進行抑制,從而提升目標回波信號的信雜比SCR。本文采用文獻[23]中所推薦的方式設(shè)計相應(yīng)的濾波器組,用設(shè)計好的6組FIR濾波器系數(shù)矩陣H∈C6×6對經(jīng)過DPC壓縮后的6通道回波序列Y∈CT×6進行逐時刻(距離單元)濾波處理,具體地,對于通道p的第n個距離單元的FIR濾波輸出可由式(1)得到:
最終得到6通道的濾波輸出Z∈C6×T。
步驟3 回波滑動窗切分。雷達回波與其他常見的序列數(shù)據(jù)如視頻和音頻不同,其中所蘊含的感興趣動態(tài)信息非常稀有。若直接對完整的一段回波序列進行時序建模,感興趣的目標動態(tài)信息將很有可能被淹沒于占絕大部分的雜波信息之中,隨著序列長度的增加,感興趣信息被淹沒的可能性也會更大。同時,以循環(huán)神經(jīng)網(wǎng)絡(luò)(Recurrent Neural Network,RNN)[24]和LSTM[25]為例,相關(guān)研究表明,隨著建模序列長度的增加,模型對于序列之中的時序依賴的刻畫能力也會有所下降,即歷史累積遺忘效應(yīng)[26]。因此,綜合考慮目標信息的時域稀疏性和序列建模方法的遺忘效應(yīng)問題,本文采用滑動窗機制對濾波后的回波序列進行切分,以得到多個更緊湊的回波子序列,該子序列將作為之后時序建模方法的輸入。滑動窗切分的具體方式如圖2所示,為了保留目標信息的時序上下文,系統(tǒng)待檢測的距離單元將會作為子序列的中心單元,并在其前后補充若干參考單元。如此,滑動窗的大小將取決于所用參考單元的個數(shù),若參考單元個數(shù)為L,則滑動窗大小為2L+1,此外,滑動窗移動的步長也是一個可以設(shè)置的參數(shù),在序貫驗證環(huán)節(jié)中,由于要遍歷完整序列,因此步長為1。這里值得注意的是,由于本文強調(diào)了序列的時序性,沒有像CFAR一樣設(shè)置保護單元以避免產(chǎn)生不連貫的子序列。
圖2 滑動窗切分回波示意圖Fig.2 The sliding-window-based echo splitting
本節(jié)將探討如何在雷達回波的時序依賴關(guān)系約束下,獲取雷達回波的有效特征表示。時序依賴關(guān)系約束下的回波特征表示學習問題從本質(zhì)上來說,是一種序列建模問題,建模方法需要將待檢中心單元與其前后若干參考單元一同構(gòu)成的序列轉(zhuǎn)換為維度固定的特征表示,而后檢測模型以該特征表示為依據(jù)判定待檢中心單元是否存在目標信息。
正如本文在引言部分所介紹的,檢測模型可以與特征表示模型分開單獨學習,也可以耦合在一起聯(lián)合優(yōu)化,若二者分離單獨優(yōu)化,則對應(yīng)于無監(jiān)督式的時序性特征表示學習,若聯(lián)合優(yōu)化則對應(yīng)于有監(jiān)督式的時序性特征表示學習。因此,為充分討論時序信息對于雷達回波表示的重要性,本文將以無監(jiān)督和有監(jiān)督的方式分別給出雷達回波時序性特征表示學習方法,并對二者的學習機理進行對比分析。
2.2.1 無監(jiān)督回波時序性表示學習
無監(jiān)督學習旨在僅利用輸入樣本自身信息來完成某一特定任務(wù),對于本文來說,輸入數(shù)據(jù)即為經(jīng)過預(yù)處理之后的回波子序列,任務(wù)即為回波時序關(guān)系。作為一種極端情況下的學習策略,無監(jiān)督學習方法需要盡可能利用數(shù)據(jù)自身的信息,而回波作為一種時序信號,其中各個單元間的時間順序信息就是一個重要的依據(jù),為此本文借鑒時序池化方法[27]中以序列時間先后順序為約束的序列回歸學習思想,提出一種適用于雷達回波的無監(jiān)督時序性特征學習方法—EchoDarwin1EchoDarwin旨在捕捉回波隨時間演進的變化趨勢,Echo取雷達回波之意,Darwin取隨時間演進而發(fā)生變化之意。。
鑒于雷達回波的特殊性以及機器學習方法的自身特點,在給出EchoDarwin定義之前,首先要對其輸入進行實數(shù)化和歸一化處理。給定由2.1節(jié)預(yù)處理環(huán)節(jié)獲得的某個回波子序列X=[x1,x2,...,xT]T2請注意本文中正體“T”表示轉(zhuǎn)置,斜體“T”表示序列長度,二者并非相同的符號。,其中xi∈CP,P為脈沖通道數(shù),T=2L+1為序列長度。出于不損失輸入序列信息量的考慮,首先將每個xi按照如式(2)方式進行復數(shù)-實數(shù)域轉(zhuǎn)換:
其中,Cmplx2Real(·): CP →R2P為轉(zhuǎn)換算子,real(·)和imag(·)分別表示按位取實部和虛部操作,(·)T表示矩陣轉(zhuǎn)置。在序列歸一化方面,一方面考慮到回波信號的幅值變化范圍很大,直接處理會使得模型難以收斂,需要壓縮其幅值變化范圍;另一方面考慮到信號的劇烈變化會加劇時序建模的難度,還需要進行時域上的平滑處理?;诖藘煞矫婵紤],對于經(jīng)過實數(shù)化處理的某一,本文進行如下歸一化處理:
圖3 Echo Darwin原理示意圖Fig.3 The schematic diagram of Echo Darwin
其中,∥·∥是某種范數(shù)算子。
然而,即使經(jīng)過歸一化平滑處理,回波序列自身仍然存在很大的抖動性,因此還需要對式(6)這種形式嚴格的回歸目標進行放松,同時對參數(shù)e進行正則化約束以提升回歸模型的泛化性。為此,進而引入回歸松弛量ε和e的正則約束項,如此可進一步將式(6)寫成:
其中,是L2正則項,ε與λ分別為回歸誤差項的松弛因子和懲罰因子,[·]≥0=max{·;0}表示誤差損失項僅關(guān)心超過誤差松弛邊界的回歸結(jié)果。如此,式(7)的形式正好滿足L2正則化約束的支持向量回歸(Support Vector Regression,SVR)[28]問題,其即為本文所提EchoDarwin的優(yōu)化目標。在具體求解過程中,本文采用牛頓信賴域法(Trust Region Newton,TRON)[29],其是一種用于求解無約束和帶有邊界約束可微問題的通用優(yōu)化方法。
至此,本文已對EchoDarwin的原理思想進行了分析,并基于此給出了其優(yōu)化目標函數(shù),然而其本身仍然是一種線性回歸模型,其對回波時序信息的編碼能力有限。為此,本文進而基于核函數(shù)的思想,通過引入一個形式確定的非線性特征映射(Non-Linear Feature Mapping,NFM)算子,來進一步提升EchoDarwin的時序編碼能力。已知利用一個形式確定的NFM操作來將處于原始空間的輸入特征映射至更高維的目標空間之中,等價于在原始低維空間中計算非線性核函數(shù)[30,31]。那么若選取合適的NFM,就可在不改變線性SVR問題求解形式的情況下,將其轉(zhuǎn)換為一個非線性的回歸模型,從而達到提升EchoDarwin時序編碼能力的目的。具體來說,對于某個作用于的NFM操作Ψ(·):R2P vt∈RD,其中D≥2P,其將非線性地映射至一個更高維的空間之中,并在此空間求解如下優(yōu)化問題:
2.2.2 有監(jiān)督回波時序性表示學習
正如引言所述,若直接求解式(10),則將退化為目前基于機器學習的回波目標檢測方法的形式,雖在分類器的選取上略有不同,但本質(zhì)上都是沒有特征表示學習的部分。而本文認為特征表示學習作為目前機器學習中的一個重要組成部分,是不應(yīng)該被忽略的,因此若將EchoDarwin引入式(10)中則可以得到如下既包含特征表示學習也包括檢測模型的優(yōu)化問題:
圖4 EchoDarwin無監(jiān)督回波時序性特征表示學習示意圖Fig.4 The diagram of EchoDarwin for unsupervised temporal feature learning of radar echo
從式(11)不難看出,其本質(zhì)上是將EchoDarwin看作檢測目標函數(shù)約束條件的聯(lián)合優(yōu)化問題,若要采用梯度下降算法進行優(yōu)化,則需要求解?L/?e,而根據(jù)鏈式求導法則,求解?L/?e涉及(?L?Φ())/(?Φ()?e)的計算。但由于式(7)中松弛化的誤差損失項[·]≥0并不是在各點均可導,無法保證正確的梯度優(yōu)化方向,進而無法保證模型收斂到最優(yōu)解。因此,需要引入另外一種時序編碼機制來實現(xiàn)時序性特征學習與檢測模型的聯(lián)合優(yōu)化,即有監(jiān)督的回波時序性特征表示學習。
為此,本文引入時序建模問題廣泛應(yīng)用的LSTM[25]及門控循環(huán)單元(Gated Recurrent Unit,GRU)[32]等來對回波中的時序關(guān)系進行捕捉,同時優(yōu)化目標檢測模型。LSTM與GRU都屬于RNN[24]的一種,基礎(chǔ)運算框架都是迭代式的序列到序列(Sequence-to-Sequence,Seq2Seq)的建模模型,LSTM可緩解常規(guī)RNN梯度消失和梯度爆炸問題,而GRU則在盡可能保留LSTM優(yōu)勢的同時,對其進行計算上的簡化。通常,這些循環(huán)式的網(wǎng)絡(luò)都是用于解決序列到序列的編碼轉(zhuǎn)錄或序列預(yù)測問題,例如機器翻譯、語音識別或天氣預(yù)測等。與這些問題不同,本文所關(guān)注的序列建模問題是一種形如EchoDarwin的序列到向量的編碼問題,即期望對一段序列的完整上下文進行編碼,同時保證編碼結(jié)果能保留序列之中的時序依賴關(guān)系。為便于理解,本文嘗試使用一個統(tǒng)一的形式來對循環(huán)式神經(jīng)網(wǎng)絡(luò)的回波序列建模進行闡釋。首先考慮某一參數(shù)為WS的單層循環(huán)網(wǎng)絡(luò)模型Seq2Seq(·;WS),其會將經(jīng)過實數(shù)化及歸一化處理后的某一回波子序列=其中,∈R2P,i=1,2,...,T,進行如下序列到序列的編碼:
其中,對于每一時刻的輸出vt,將由式(13)和式(14)計算得出:
其中,O(·;)與H(·,·;)分別為Seq2Seq模型的輸出函數(shù)與隱藏編碼函數(shù),ht為隱藏編碼函數(shù)的輸出,其與當前時刻的輸入和上一時刻隱藏編碼結(jié)果有關(guān),依次迭代式地使用此種編碼方式,最后一個時刻的輸出結(jié)果vT將會攜帶所有歷史時刻信息,從而實現(xiàn)時序關(guān)系的學習,最終vT也將作為的時序編碼結(jié)果參與到頂層檢測模型的訓練。
然而,與EchoDarwin不同之處在于,Seq2Seq這種前后時刻依賴的編碼機制之中并沒有嚴格地以顯性的方式體現(xiàn)出一維時間偏序關(guān)系的約束,其是將這種偏序關(guān)系隱式地用循環(huán)迭代的隱藏編碼函數(shù)H(·,·;)來體現(xiàn)。這也是目前大多數(shù)深度神經(jīng)網(wǎng)絡(luò)與經(jīng)典機器學習方法的一大不同之處,即將一些具有顯式化約束條件的優(yōu)化問題轉(zhuǎn)換為無約束或者弱約束的可以逐層梯度反傳的復雜模型,即弱化優(yōu)化問題自身的約束條件,而強調(diào)模型對輸入的非線性表達能力。
其中,L(,y;WS,θ)表示檢測任務(wù)的損失函數(shù),P(y′=y|vT;θ)為檢測模型打分函數(shù)輸出的關(guān)于vT屬于預(yù)測結(jié)果y的概率值。由于涉及時序編碼和檢測分類的模型均由具有閉式解的算子組成,因此可很方便地采用隨機梯度下降算法來實現(xiàn)時序編碼模型參數(shù)WS與檢測器模型參數(shù)θ的更新。圖5(a)以直觀的方式展示了有監(jiān)督回波時序關(guān)系建模的過程。
無論是RNN,LSTM,還是GRU,他們在時序編碼機制方面沒有本質(zhì)區(qū)別,唯一不同之處體現(xiàn)在Seq2Seq(·;WS)中的隱藏編碼函數(shù)H(·,·;),在RNN中H主要是分別對歷史時刻的隱藏編碼結(jié)果和當前輸入進行線性加權(quán)求和。而此種方式往往會使得歷史信息利用不充分,隨著輸入序列的長度增加,模型的建模能力逐漸退化。為此,LSTM引入“細胞(cell)狀態(tài)”來對流入網(wǎng)絡(luò)的信息進行保持,并且通過精心設(shè)計的輸入、輸出和遺忘等多種門的操作來控制信息的流入流出,進而提升模型的歷史信息利用能力。而在此基礎(chǔ)上,GRU通過將輸入和遺忘門簡化為一個單一的更新門,同時將顯式的細胞狀態(tài)隱式地融合進隱藏狀態(tài),從而在盡可能保留LSTM編碼能力的同時,達到精簡模型的目的,二者的區(qū)別詳見圖5(b)。
圖5 基于有監(jiān)督Seq2Seq模型的雷達回波時序性特征表示學習方法示意圖Fig.5 The illustration of supervised Seq2Seq-based radar echo temporal feature learning method
正如引言部分所分析的,對實際情況中的低慢小無人預(yù)警任務(wù)來說,多個方向上收到的回波中存在目標信息的距離單元是極為稀少的。以本文所處理的回波數(shù)據(jù)為例,在一個掃描周期所收到的回波中存在目標的距離單元與雜波距離單元的比例≤1:129,000。這種正負樣本極為不均衡的檢測任務(wù)對于目前的機器學習方法來說是極具挑戰(zhàn)性的,即正例樣本的驅(qū)動力嚴重不足。因此,不能以常規(guī)的處理方式來應(yīng)對此種極端情況下的檢測任務(wù)。粗略地以全局視角來看,低慢小目標檢測問題更像是在密集發(fā)生的不感興趣的事件之中尋找出極小概率發(fā)生的感興趣事件,這更像是一種異常事件檢測問題,此處的異常便對應(yīng)著發(fā)生概率或者次數(shù)極為稀少的含義,因此本文嘗試以異常檢測問題的解決思路來應(yīng)對低慢小目標檢測問題。
異常檢測最為關(guān)鍵的問題是數(shù)據(jù)的嚴重不平衡現(xiàn)象,即訓練數(shù)據(jù)中不同類別數(shù)據(jù)規(guī)模大小不一致,若直接采用不平衡的數(shù)據(jù)對檢測模型進行訓練,會使得模型的預(yù)測方向往樣本規(guī)模更大的那一類別傾斜,造成過擬合現(xiàn)象。因此,為避免數(shù)據(jù)不均衡,本文采用一種基于聚類的少數(shù)類別樣本生成算法SMOTE[33]來對存在樣本不平衡的數(shù)據(jù)進行均衡化處理。如圖6所示,均衡化處理的目的是對規(guī)模更小的目標數(shù)據(jù)進行生成(上采樣過程),同時按照與上采樣擴充后的目標樣本量,隨機性地選取相當數(shù)量的雜波樣本(下采樣過程),從而最終得到目標-雜波占比均衡的訓練/測試數(shù)據(jù)集。
圖6 目標-雜波樣本規(guī)模均衡化處理示意圖Fig.6 The illustration of target-clutter sample scale balance
均衡化處理策略的大致思想是利用少數(shù)類別樣本在數(shù)據(jù)空間中的近鄰,來生成新的屬于該類別的樣本,近鄰的尋找方法一般采用經(jīng)典的k-NN算法。給定具有M個目標回波子序列的集合,?tgt={X1,X2,...,XM},Xi∈CT×P,i=1,2,...,M,表1將會按照預(yù)先設(shè)置的合成倍數(shù)N,額外生成具有N ×M個生成目標樣本的集合。從表1中的式(16)可以看出,少數(shù)樣本生成的原理本質(zhì)上是在真實目標樣本的某個鄰域空間內(nèi)進行微小的擾動,從而達到豐富目標樣本在訓練集之中多樣性的目的,進而以一種合理的方式增加了目標樣本的規(guī)模。圖7以兩種降維方法主成分分析(Principal Component Analysis,PCA)與T分布隨機鄰域嵌入(T-distributed Stochastic Neighbor Embedding,T-SNE)可視化地展示了經(jīng)過均衡化處理前后,目標樣本規(guī)模的變化,可以看出,均衡化算法有效地平衡了目標-雜波樣本規(guī)模的比例。
圖7 目標樣本均衡化處理前后數(shù)據(jù)分布可視化對比Fig.7 The target sample scale visualization of target-clutter sample scale balancing
表1 目標-雜波樣本規(guī)模均衡化處理算法Tab.1 Target-Clutter sample scale balancing algorithm
此外,值得注意的是表1實際上類似于一種在深度學習方法中經(jīng)常使用的數(shù)據(jù)增廣方法mixup[34],其原理是對兩個隨機采樣出的不同真實樣本進行線性加權(quán)來豐富樣本的多樣性,被采樣的兩個樣本在統(tǒng)計上是獨立分布的,即該方法假設(shè)兩個被采樣本沒有統(tǒng)計上的依賴關(guān)系。而表1認為被采樣本之間應(yīng)該具備一定的關(guān)聯(lián),對隨機采樣進行了進一步的約束,即將其中一個樣本看作錨定樣本,并且在錨定樣本的鄰域內(nèi)進行隨機采樣,被選中的兩個樣本實際上是具有統(tǒng)計相關(guān)性的,此種方式會避免生成的樣本與原始樣本之間存在較大的差異性。
至此,本文已對所提完整的基于雷達回波目標檢測框架的各個重要環(huán)節(jié)分別進行了介紹,其中回波時序性表示學習與檢測器均是可學習的模型。圖8直觀地展示了這些模型的大致訓練過程,其中在無監(jiān)督時序關(guān)系學習的情況下,特征表示學習與檢測模型的訓練過程是分離的,并且每個樣本的特征學習過程都是獨立進行的,也無需樣本標簽參與學習過程;而在有監(jiān)督時序關(guān)系學習的情況下,時序性特征表示學習模型與檢測模型是在完整的訓練樣本集上端到端聯(lián)合優(yōu)化的。
圖8 回波時序關(guān)系依賴的雷達目標檢測框架訓練流程示意圖Fig.8 The illustration of training process for echo temporal relation-based radar target detection framework
本文使用地面情報雷達的實測數(shù)據(jù)來驗證所提方法,雷達采集對象為復雜氣象環(huán)境中濱海強雜波條件下的低空飛行慢速小目標,總共包括19個掃描周期共計814幀的回波數(shù)據(jù),掃描覆蓋60°到90°的空域范圍,每個方向上包含6個脈沖,每個脈沖的有效距離單元數(shù)均為6000,每幀數(shù)據(jù)相當于是一個6000×6的復數(shù)矩陣。在每個包含大約43幀數(shù)據(jù)的掃描周期內(nèi),僅有兩個距離單元上存在目標信息(43×6000個距離只有2個單元存在目標),正如2.3節(jié)中所討論的,這在機器學習領(lǐng)域中更像是異常檢測問題。
如引言所述,經(jīng)典的雷達目標檢測遵照統(tǒng)計檢測理論,其是通過對含有目標信息的信號或雜波信號的分布特性提出假設(shè),從而能夠給出輸入信號在不同假設(shè)條件下的概率密度函數(shù)的形式,因此其中所探討的檢測概率和虛警概率是一種概率值估計,即待檢信號服從某個分布的概率值。而數(shù)據(jù)驅(qū)動的機器學習方法直接對式(9)中所定義假設(shè)條件下的概率取值進行估計,不事先對信號的分布特性進行先驗性假設(shè)。其所估計的概率值并不直接用于評價模型算法的好壞,而是對量化后的概率估計值在測試樣本集中所占比例來對模型進行評估。
為盡可能科學嚴謹?shù)仳炞C本文所提方法,本文將設(shè)計兩種數(shù)據(jù)集來對方法進行實驗驗證:
3.1.1 實測-生成混檢數(shù)據(jù)集(Real Synthetic Hybrid Dataset,RSHD)設(shè)計
為充分對所提方法中各個環(huán)節(jié)的有效性進行驗證,采用經(jīng)典的K-折交叉檢驗法來構(gòu)建RSHD的訓練/測試集(K=4),訓練測試的樣本規(guī)模比例約為3:1。具體如下:
(1) 濾波預(yù)處理:對所有回波數(shù)據(jù)進行DPC和FIR濾波預(yù)處理;
最終,每一份訓練集與測試集的子序列個數(shù)分別為592和310。這里需要額外說明的是,在給子序列進行標注時,都是以中心距離單元的類別為準。同時確保有3個完整掃描周期的回波數(shù)據(jù)不會出現(xiàn)在每一份訓練集之中,從而保證后續(xù)實測序貫回放驗證集(Real Sequential Playback verification Dataset,RSPD)中不會存在所訓模型“見過”的樣本。
3.1.2 RSPD設(shè)計
RSPD僅作為驗證集使用。為還原真實的雷達目標檢測過程,將未出現(xiàn)于RSHD訓練集中的3個掃描周期的數(shù)據(jù)按照掃描周期數(shù)保存。在序貫驗證過程中,滑動窗切分算法將按照參考單元數(shù)L=10,滑動步長1對每幀回波序列進行切分,并且對序列的開頭與結(jié)尾處進行補0,以保證序貫實驗環(huán)節(jié)中,驗證集中每個距離單元都按照雷達實際掃描的順序被檢測模型處理。
本小節(jié)將首先介紹無監(jiān)督時序性回波表示學習方法EchoDarwin與基于深度循環(huán)網(wǎng)絡(luò)的有監(jiān)督時序性回波表示學習方法訓練過程中的模型超參設(shè)置。由于前者是一種與檢測模型相解耦的表示學習方法,因此還需要額外訓練檢測模型來對特征進行判別和區(qū)分,為此,本文采用基于卡方核函數(shù)(Chi-square kernel function,Chi-2)的支持向量機(SVM)[35]作為檢測模型。EchoDarwin相關(guān)參數(shù)設(shè)置如下:
(1) 時序性特征學習模型。若無特殊說明,NFM默認采用Hellinger核函數(shù)的簡化變種PosNeg[27],回歸的懲罰因子λ(見式(7))默認設(shè)置為1×10–5;
(2) 檢測模型。訓練過程中采用二階段的網(wǎng)格搜索法確定SVM懲罰因子,首先從取值范圍為[1,10000],且以幾何倍數(shù)為10增長的等比數(shù)列中確定性能表現(xiàn)較好的大致取值范圍,再等間隔均勻劃分縮小后的取值范圍,并最終選取性能最好的懲罰因子。
對于有監(jiān)督的方法而言,本文設(shè)計了4種基于LSTM和GRU的回波時序關(guān)系學習網(wǎng)絡(luò):(a)基于雙向(Bi-directional,Bi-LSTM)的網(wǎng)絡(luò):時序編碼部分由兩層Bi-LSTM構(gòu)成[36],相比常規(guī)LSTM,Bi-LSTM會額外對序列進行反向時序建模,以獲得更豐富的上下文依賴關(guān)系;(b)雙向GRU(Bi-directional GRU,Bi-GRU):時序編碼部分由兩層雙向GRU構(gòu)成[36],相比LSTM,GRU會以更為精簡的方式對序列進行建模;(c)MLP-LSTM:時序編碼部分由若干時序上不共享的作用于完整序列的多層感知機(Multi-Layer Perceptron,MLP)和一個Bi-LSTM層構(gòu)成,其中MLP由兩個全連接(Fully-Connected,FC)層和一個Leaky ReLU[37]激活層構(gòu)成;(d)基于卷積的LSTM(Convolutional LSTM,ConvLSTM):與MLP-LSTM不同之處在于,時序不共享的MLP部分由若干1×1共享卷積核代替。為保持實驗條件一致,所有網(wǎng)絡(luò)都采用相同的優(yōu)化算法及超參進行訓練,訓練配置與網(wǎng)絡(luò)具體結(jié)構(gòu)詳見表2。
表2 雷達回波時序關(guān)系學習網(wǎng)絡(luò)結(jié)構(gòu)及訓練配置Tab.2 Network structure and training configuration of radar echo temporal relationship learning
實驗部分將分別采用RSHD的測試集和RSPD進行模型的性能驗證,其中在RSHD部分評價皆采用相同的指標體系,具體為正確率(Accuracy)、虛警率(False Alarm Rate,FA)、檢測精度(Precision)、檢出率或召回率(Recall),以及F值(F Score)。其中,綜合評價指標F值的計算方式為
其中,系數(shù)β設(shè)為1。最終指標的結(jié)果為4份訓練/測試集所獲得結(jié)果的均值。在RSPD部分的評價指標則主要采用目標檢出率和虛警率來進行評價。對于RSHD的實驗部分,本文將考察時序性特征學習與樣本均衡策略對時空域目標稀疏的雷達回波檢測任務(wù)的有效性;對于RSPD實驗部分,本文將盡可能在模擬雷達實際工作的情況下,來驗證檢測模型的性能,并與多種經(jīng)典的CFAR算法進行對比分析。
3.3.1 時序性表示學習消融實驗
為考察時序性特征學習的有效性,基于RSHD分別設(shè)計兩組實驗:(a)無監(jiān)督EchoDarwin的消融實驗;(b)無監(jiān)督與有監(jiān)督時序性特征表示學習的對比實驗。在(a)組中,首先對EchoDarwin中的歸一化操作TVM和NFM進行消融實驗分析,而后在同等實驗條件下比較EchoDarwin與其他不經(jīng)過學習的序列表示方法之間的性能差異。
如表3所示,使用TVM歸一化平滑處理后的回波序列作為EchoDarwin的輸入,除了采用Chi-2核函數(shù)作為NFM操作的對照組之外,檢測模型能獲取到更好的綜合性能指標,尤其是在目標召回率方面,優(yōu)勢更為突出;而在Chi-2核函數(shù)的作用下,TVM的優(yōu)勢并沒有那么突出,這是由于Chi-2核函數(shù)自身可看作兩個輸入向量的內(nèi)積除以該兩個向量之和的L1范數(shù),從而也起到了一定的歸一化效果,因而在此種情況下二者相結(jié)合后的優(yōu)勢就不如其他情況那樣明顯。然而這一對比結(jié)果也說明了,歸一化平滑處理對于回波特征學習的有效性。而在NFM的對照實驗可以看出,無論使用哪種非線性核函數(shù),檢測模型的性能都在各個方面有了明顯的提升,這也充分地驗證了利用更為復雜的回歸模型來進行時序性特征表示學習的有效性,其中使用PosNeg核函數(shù)的EchoDarwin總能在綜合性能上超越其他對照組。
表3 EchoDarwin+SVM消融實驗結(jié)果Tab.3 Ablation experiment results of EchoDarwin
在(a)組的第2部分實驗中,本文進一步考察在時序關(guān)系依賴下學習得出的特征表示與未經(jīng)過學習的特征表示對于檢測性能的影響。這里選取3種非學習的回波表示方法:(1)Temp.Avg-Pooling:在時間維度(距離向)上將回波子序列求取平均的表示方法;(2)Temp.Max-Pooling:在時間維度上將回波子序列中最大值進行保留的表示方法;(3)Temp.Concatenation:不做任何處理,僅將回波子序列按照時間維進行拼接的表示方法(該種情況就近似退化成了文獻[7]中所提出的方法)。
從表4所示結(jié)果不難看出,經(jīng)過學習后的Echo-Darwin明顯可以取得更好的綜合檢測性能,雖在虛警率與檢測精度上比Temp.Concatenation要有所下降,但其能保持緊湊的特征維度,這都體現(xiàn)出了時序性學習機制對于回波特征表示的有效性。
表4 EchoDarwin與其他非學習序列表示的性能對比結(jié)果Tab.4 Performance comparison between EchoDarwin and other representations of non-learning sequence
在(b)組實驗中,本文考察無監(jiān)督時序性特征表示與有監(jiān)督時序性特征表示之間的性能差異,結(jié)果匯總于表5,其中與Bi-LSTM類似,Bi-EchoDarwin表示對回波序列在正向和反向上都進行時序建模,并將兩個方向上獲得的時序性特征進行拼接,因此特征維度相比EchoDarwin會提升2倍。
表5 無監(jiān)督與有監(jiān)督式回波表示學習方法檢測性能對比Tab.5 Comparison of detection performance between unsupervised and supervised echo representation learning methods
從實驗結(jié)果可以看出,無監(jiān)督和有監(jiān)督學習的模型都能以較高的準確率辨識出目標,這也說明時序關(guān)系的學習有助于獲取到有效的雷達回波特征表示;而相比于僅在前向進行時序關(guān)系提取的模型EchoDarwin、LSTM和GRU來說,其雙向?qū)φ战M模型Bi-EchoDarwin,Bi-LSTM,以及Bi-GRU可以在各個指標上都獲得性能更佳的檢測結(jié)果,這也說明了在正向反向上都進行學習可以提升特征表示的豐富度,從而提升檢測模型的性能。
進一步地,整體對比無監(jiān)督方法與有監(jiān)督方法的各項性能指標可看出,有監(jiān)督的深度學習方法明顯更具優(yōu)勢,這一方面是由于相比起淺層的機器學習方法,深度學習方法通常擁有更高的編碼容量,能輕松將數(shù)據(jù)從原始低維空間嵌入至表達能力更為豐富的高維空間之中;另一方面也是由于其在學習時序依賴關(guān)系的同時兼顧了目標回波與雜波之間的區(qū)分性,即以任務(wù)驅(qū)動的方式聯(lián)合學習時序性特征和檢測模型。而所有模型之中,Bi-LSTM和Bi-GRU能獲得最好的性能,其中前者在召回率(目標檢出率)上更具優(yōu)勢,而后者能有更高的檢測精度,相應(yīng)的虛警率也更低。
最后對比純Bi-LSTM網(wǎng)絡(luò)與混合式的MLP-LSTM和ConvLSTM,前者由于具有雙層循環(huán)結(jié)構(gòu),因而可以擁有更好的時序建模能力,進而取得更好的性能表現(xiàn)。
盡管無監(jiān)督的EchoDarwin在性能方面表現(xiàn)稍弱,然而由于其本質(zhì)上是一個淺層的線性回歸模型,相比起LSTM等深度神經(jīng)網(wǎng)絡(luò)來說,它是一種更為輕量化的模型,運算資源的耗費程度也更少,取得的特征也更為緊湊,在實時處理方面更具優(yōu)勢。而在特征學習方面,與帶標簽數(shù)據(jù)驅(qū)動的LSTM等模型不同,EchoDarwin是一種樣本依賴的方法,其在特征學習的過程中不需要遍歷整個訓練集,即是說其不依賴于樣本在數(shù)據(jù)空間中的統(tǒng)計分布信息,只利用了回波數(shù)據(jù)在時間維上的偏序關(guān)系這一先驗信息,這也使得該模型與數(shù)據(jù)本身的耦合程度更低,應(yīng)用更為靈活。綜合這些優(yōu)勢,EchoDarwin能更容易部署在各種移動計算設(shè)備上,具有一定的實用價值。
3.3.2 樣本均衡策略有效性實驗
在本組實驗中,本文固定檢測方法來考察樣本均衡策略對檢測性能的影響。為此,本文按照與RSHD相同的數(shù)據(jù)集設(shè)計方法生成不同目標樣本合成比例下的訓練集和測試集。目標樣本合成比例即為表1中的SyncRatio,比例的選取按照200%的遞增速度從0(不使用均衡策略)到1000%(本文推薦比例),如此便得到6組訓練/測試樣本集,表6記錄了6組數(shù)據(jù)集下Bi-EchoDarwin方法的檢測性能結(jié)果及訓練/測試樣本規(guī)模。
從表6所示結(jié)果不難看出,合成比例為0(即不采用均衡處理)的情況下,檢測模型雖在正確率和虛警率上取得了最優(yōu)的結(jié)果,但這是由于訓練/測試集中的真實目標樣本極為稀少,導致模型嚴重向雜波傾斜,將大多數(shù)目標樣本錯誤地辨識為雜波,從而產(chǎn)生了最低的目標召回率;而在引入均衡策略之后(SycRatio≥200%),目標的召回情況有了明顯的好轉(zhuǎn),模型的綜合性能指標F值也得到顯著的提升。為更加直觀展現(xiàn)這一趨勢,本文繪制了圖9以展現(xiàn)均衡化策略對于模型綜合性能的影響。其中,圖9(a)通過平行對比目標召回率和虛警率來顯示模型在不同生成比例下的綜合檢測性能,不難看出隨著生成比例的增加,召回率和虛警率之差呈現(xiàn)出逐漸增長的趨勢;而圖9(b)通過觀察F值的變化趨勢來綜合性地體現(xiàn)檢測模型性能的變化,可以看出模型的綜合性能會隨著生成比例的增加而呈現(xiàn)出明顯增長的趨勢,并在200%和800%處取得較大幅度的提升后,進入較為緩慢的增長狀態(tài)。
圖9 不同目標樣本均衡化處理程度對檢測性能的影響Fig.9 The target sample scale visualization of target-clutter sample scale balancing
表6 不同目標樣本生成比例下Bi-EchoDarwin的檢測性能結(jié)果Tab.6 Detection performance of Bi-EchoDarwin under different target sample generation ratio
3.3.3 實測序貫驗證實驗
在本組實驗中,本文利用RSPD驗證集來模擬實際情況下所提方法的有效性,同時選取4個常用的CFAR檢測算法:CA-CFAR,GOCA-CFAR,OSCFAR與SOCA-CFAR進行檢測效果的對比。為保持公平的原則,CFAR算法的參考單元數(shù)大小與本文所提方法一致,即左右各10個距離單元,保護單元左右各1個距離單元。同時,為盡可能發(fā)揮出各種CFAR算法的性能,虛警概率值Pfa的選取將秉持在有檢出的情況下,虛警預(yù)測結(jié)果最少的原則,Pfa的選取范圍為1e–3~1e–7。
圖10以極坐標的形式繪制了兩種基于回波時序性特征表示學習的檢測方法Bi-EchoDarwin和Bi-LSTM與4種CFAR算法在其中一個雷達掃描周期中的完整檢出結(jié)果。不難看出,在合適的虛警率取值下,各CFAR算法均能對目標進行檢出,并且OS-CFAR獲得了最少的虛警結(jié)果,然而這些方法都存在漏檢的情況。而對于Bi-EchoDarwin與Bi-LSTM來說,二者都取得了更全的目標檢出結(jié)果,同時直觀上看虛警結(jié)果的數(shù)量也處在一個可接受的范圍(相較于CFAR來說)。
圖10 實測序貫驗證條件下與多種CFAR方法的檢測結(jié)果對比示例圖(一次掃描周期)Fig.10 Example of detection results comparison with CFARs under sequential validation of real-measured data(in one radar scanning cycle)
為更加定量地對比這些方法的檢出情況,本文統(tǒng)計了RSPD完整3個周期的檢出情況,結(jié)果如表7所示。從對比結(jié)果可以看出,雖然本文所提出的方法不具備CFAR的恒虛警性質(zhì),然而在實際測試過程中,他們在檢后虛警統(tǒng)計值上與CFAR仍處在同一個量級,而且同時還能獲得更全的目標檢出效果。進一步結(jié)合之前的實驗結(jié)果可以看出,引入合適的表示學習機制和樣本均衡策略,數(shù)據(jù)驅(qū)動的方法可以在虛警數(shù)量可接受的范圍內(nèi)取得更好的檢出效果,這些實驗結(jié)果都體現(xiàn)出了本文所提檢測方法框架的有效性。
表7 所提方法與多種CFAR方法在RSPD下的檢出結(jié)果統(tǒng)計情況Tab.7 Statistical analysis of detection results of the proposed method and multiple CFAR methods under RSPD
針對時空域稀疏條件下的低慢小雷達目標檢測問題,本文系統(tǒng)性地提出了一種有效的面向回波的目標-雜波檢測方法框架。在經(jīng)典雷達雜波抑制方法的基礎(chǔ)之上,本文在方法框架中著重強調(diào)了回波表示學習和目標-雜波樣本均衡策略的重要性。在回波表示學習方面,通過充分利用回波自身的時序依賴關(guān)系約束,本文分別對無監(jiān)督式和有監(jiān)督式兩種回波時序性特征表示學習問題給出了相應(yīng)的定義和求解方法;在目標-雜波樣本均衡策略方面,通過將低慢小雷達目標檢測問題轉(zhuǎn)化為一種異常事件檢測問題,本文利用一種基于目標樣本鄰域內(nèi)擾動的上采樣生成方法克服了檢測模型的決策偏移問題。此外,為充分驗證所提方法的有效性,本文根據(jù)實測雷達回波數(shù)據(jù)分別設(shè)計了實測-生成混檢式的RSHD訓練/測試數(shù)據(jù)集和實測序貫回放驗證集RSPD。RSHD的實驗結(jié)果表明,相較于忽略表示學習的檢測方法來說,時序性表示學習方法能以更緊湊的回波表示讓檢測模型取得更好的綜合檢測性能;在不進行均衡處理的情況下,模型會嚴重向雜波樣本傾斜,而經(jīng)過樣本均衡處理后,模型的雜波樣本傾斜程度得到了有效的改善,并明顯取得了更高的目標召回率和F值?;赗SPD,本文模擬檢測模型的實際工作情況,對所提方法和多種CFAR檢測方法進行了統(tǒng)一的性能對比評價,實驗結(jié)果表明所提方法在與CFAR取得相當量級虛警率的同時,還能獲得更全的目標檢出效果。
然而,作為數(shù)據(jù)驅(qū)動的機器學習方法,本文所提完整的目標檢測框架仍然未擺脫對樣本標簽的依賴,這使得模型在真正應(yīng)用的過程中,需要提前收集和構(gòu)造攜帶目標標記的數(shù)據(jù)集,并且在此數(shù)據(jù)集上提前進行學習和優(yōu)化。從這一點出發(fā),EchoDarwin這種樣本級別的無監(jiān)督方法雖然在最終檢測性能上不如有監(jiān)督式的回波時序性特征表示學習方法,但由于其在特征表示學習方面無需樣本類別標簽進行監(jiān)督,因此在實際應(yīng)用方面具備更加靈活的特性。因此,未來也有必要在EchoDarwin的基礎(chǔ)上,進一步考慮如何將無監(jiān)督的思想也引入檢測模型,從而使完整的目標檢測框架擺脫對標簽數(shù)據(jù)的依賴。