張 巖,張曉東
(1.海軍裝備部駐揚(yáng)州地區(qū)軍代室,江蘇 揚(yáng)州 225001;2.中國(guó)船舶集團(tuán)有限公司第七二三研究所,江蘇 揚(yáng)州 225101)
雷達(dá)作為一種探測(cè)目標(biāo)的重要工具,在軍事和民用領(lǐng)域發(fā)揮著越來(lái)越重要的作用。雷達(dá)利用目標(biāo)的回波來(lái)獲得目標(biāo)的信息,從而發(fā)現(xiàn)和測(cè)定目標(biāo)。在雷達(dá)目標(biāo)環(huán)境中,目標(biāo)以外的其他散射體的回波會(huì)使雷達(dá)顯示器上的圖像變得雜亂,妨礙對(duì)目標(biāo)回波的檢測(cè),這類(lèi)回波被稱(chēng)為雷達(dá)雜波。雜波是雷達(dá)信號(hào)檢測(cè)和處理的固有環(huán)境,在雜波背景下進(jìn)行信息處理是雷達(dá)的基本任務(wù)之一[1-2]。作為雷達(dá)數(shù)據(jù)處理的一個(gè)重難點(diǎn)就是在目標(biāo)檢測(cè)后進(jìn)行雷達(dá)點(diǎn)跡真?zhèn)舞b別,區(qū)分出目標(biāo)點(diǎn)和雜波點(diǎn)。
針對(duì)雷達(dá)點(diǎn)跡真?zhèn)舞b別這一問(wèn)題,國(guó)內(nèi)外專(zhuān)家學(xué)者提出了很多不同的研究方法。文獻(xiàn)[3]利用SVM理論實(shí)現(xiàn)了對(duì)多雷達(dá)數(shù)據(jù)的自動(dòng)分類(lèi)處理。文獻(xiàn)[4]將支持向量機(jī)用作分類(lèi)器,通過(guò)訓(xùn)練大量樣本數(shù)據(jù)實(shí)現(xiàn)了對(duì)真實(shí)目標(biāo)與虛假目標(biāo)的分類(lèi),其核心思想是將航跡起始問(wèn)題轉(zhuǎn)化為機(jī)器學(xué)習(xí)中的真實(shí)航跡與虛假目標(biāo)分類(lèi)問(wèn)題來(lái)處理。文獻(xiàn)[5]提出了一種基于雙通道卷積神經(jīng)網(wǎng)絡(luò)的雷達(dá)海上目標(biāo)智能檢測(cè)方法,從特征提取分類(lèi)角度,通過(guò)深度學(xué)習(xí)分類(lèi)方法對(duì)目標(biāo)和雜波的雷達(dá)回波信號(hào)進(jìn)行二元分類(lèi),達(dá)到90.0%的準(zhǔn)確率。文獻(xiàn)[6]提出了一種基于反向傳播神經(jīng)網(wǎng)絡(luò)的雷達(dá)點(diǎn)跡分類(lèi)方法,利用雷達(dá)點(diǎn)跡數(shù)據(jù)包含的距離跨度、方位跨度、幅度、距離、方位和信噪比等多種特征信息,訓(xùn)練的反向傳播神經(jīng)網(wǎng)絡(luò)的分類(lèi)準(zhǔn)確率可達(dá)87.3%。
人工神經(jīng)網(wǎng)絡(luò)是一種運(yùn)算模型,通過(guò)大量的帶有數(shù)學(xué)意義的神經(jīng)元節(jié)點(diǎn)連接組成。每個(gè)節(jié)點(diǎn)都代表著一種規(guī)定的輸出函數(shù),又可以稱(chēng)為激活函數(shù)。節(jié)點(diǎn)之間的相互連接代表著信號(hào)連接的加權(quán)值,由于網(wǎng)絡(luò)連接方式、網(wǎng)絡(luò)的權(quán)重值以及激活函數(shù)的多樣性,神經(jīng)網(wǎng)絡(luò)的輸出值也各不相同。神經(jīng)網(wǎng)絡(luò)中最基礎(chǔ)的組成部分是神經(jīng)元,神經(jīng)元本質(zhì)上是受生物學(xué)神經(jīng)元的啟發(fā)而建立的一種包括輸入、輸出以及其它計(jì)算功能的一個(gè)數(shù)學(xué)模型,它接收已知的輸入向量x并結(jié)合相應(yīng)的權(quán)重值w以及偏移量b,然后將獲得的結(jié)果用非線性函數(shù)來(lái)處理,最終獲得結(jié)果的預(yù)測(cè)值輸出。一個(gè)網(wǎng)絡(luò)層一般由多個(gè)神經(jīng)元組成,而神經(jīng)網(wǎng)絡(luò)通常由多個(gè)網(wǎng)絡(luò)層組成。隨著計(jì)算能力的提升,計(jì)算機(jī)的計(jì)算能力己經(jīng)足夠支撐多層神經(jīng)網(wǎng)絡(luò)的計(jì)算。多層神經(jīng)網(wǎng)絡(luò)的非線性分界擬合能力隨著層數(shù)的增加不斷增加,具有更深入的表示特征和更強(qiáng)的函數(shù)模擬能力。
本文利用神經(jīng)網(wǎng)絡(luò)研究雷達(dá)點(diǎn)跡真?zhèn)舞b別問(wèn)題。即針對(duì)信號(hào)處理輸出的包含真實(shí)目標(biāo)和雜波的數(shù)據(jù),利用神經(jīng)網(wǎng)絡(luò)方法鑒別該數(shù)據(jù)是來(lái)自真實(shí)目標(biāo)回波還是雜波,鑒別結(jié)果可以為減少雜波環(huán)境下虛假航跡數(shù)目,提高機(jī)動(dòng)目標(biāo)跟蹤能力提供有力的技術(shù)支撐。
基于深度學(xué)習(xí)算法實(shí)現(xiàn)的全連接神經(jīng)網(wǎng)絡(luò)是一種非線性數(shù)據(jù)建模工具,常用來(lái)對(duì)輸入與輸出間復(fù)雜的關(guān)系進(jìn)行建模,具有獨(dú)特的分布并行處理、非線性映射和自適應(yīng)學(xué)習(xí)能力等特征[7]。該網(wǎng)絡(luò)結(jié)構(gòu)包含多個(gè)隱藏層,能以更少模型參數(shù)、更快收斂速度和更高擬合精度來(lái)逼近現(xiàn)實(shí)[8]。
在神經(jīng)網(wǎng)絡(luò)的實(shí)際訓(xùn)練過(guò)程中,需要通過(guò)輸入的訓(xùn)練數(shù)據(jù)集來(lái)求解出網(wǎng)絡(luò)模型中各層之間的權(quán)重參數(shù)矩陣w和偏置向量參數(shù)b,即反向傳播算法。當(dāng)訓(xùn)練好的神經(jīng)網(wǎng)絡(luò)輸入測(cè)試數(shù)據(jù)后,期望得到的輸出值和實(shí)際的數(shù)據(jù)值更加接近,所以需要訓(xùn)練出更加合適并且更優(yōu)的權(quán)重參數(shù)矩陣w和偏置向量參數(shù)b。在樣本數(shù)據(jù)訓(xùn)練的過(guò)程中,可以定義一個(gè)損失函數(shù)來(lái)近似表示實(shí)際樣本值和訓(xùn)練樣本值之間的誤差,在機(jī)器學(xué)習(xí)中常使用梯度下降法來(lái)求解損失函數(shù)的最小值,最終獲得相關(guān)神經(jīng)網(wǎng)絡(luò)模型的權(quán)值參數(shù)矩陣w和偏置向量參數(shù)b。反向傳播算法就是運(yùn)用梯度下降算法對(duì)損失函數(shù)迭代求解極值的一個(gè)過(guò)程,獲得深度神經(jīng)網(wǎng)絡(luò)模型的最佳相關(guān)參數(shù),從而完成深度神經(jīng)網(wǎng)絡(luò)模型的訓(xùn)練,繼而對(duì)樣本數(shù)據(jù)的測(cè)試集數(shù)據(jù)進(jìn)行測(cè)試。
利用神經(jīng)網(wǎng)絡(luò)研究分類(lèi)問(wèn)題通常按如下4個(gè)步驟進(jìn)行:
(1) 提取不同實(shí)體不同的特征向量作為神經(jīng)網(wǎng)絡(luò)的輸入。
(2) 定義神經(jīng)網(wǎng)絡(luò)如何從輸入得到輸出,即定義神經(jīng)網(wǎng)絡(luò)的前向傳播算法。
(3) 訓(xùn)練神經(jīng)網(wǎng)絡(luò),調(diào)整神經(jīng)網(wǎng)絡(luò)中各個(gè)參數(shù)的取值。
(4) 利用訓(xùn)練好的神經(jīng)網(wǎng)絡(luò)模型預(yù)測(cè)未知的數(shù)據(jù)。這個(gè)過(guò)程和步驟(2)中的前向傳播算法一致。
神經(jīng)網(wǎng)絡(luò)中的激活函數(shù),主要提供網(wǎng)絡(luò)的非線性建模的能力,激活函數(shù)通常是可微的、單調(diào)的,用以保證實(shí)現(xiàn)基于梯度的后向傳播算法。常用的激活函數(shù)有S曲線函數(shù)Sigmoid、雙曲函數(shù)tanh、ReLU等。其中ReLU函數(shù)的收斂速度比Sigmoid/tanh函數(shù)快得多,并且運(yùn)算十分簡(jiǎn)單,因此是當(dāng)前流行的神經(jīng)網(wǎng)絡(luò)模型中較為常用的激活函數(shù)。
通常利用損失函數(shù)優(yōu)化神經(jīng)網(wǎng)絡(luò)模型的訓(xùn)練效果,從所有樣本中找到一組平均損失“較小”的權(quán)重和偏差。損失是對(duì)糟糕預(yù)測(cè)的懲罰,通過(guò)一個(gè)數(shù)值來(lái)表示對(duì)于單個(gè)樣本而言模型預(yù)測(cè)的準(zhǔn)確程度,即如果模型的預(yù)測(cè)完全準(zhǔn)確,則損失為零,否則損失會(huì)較大。比較常見(jiàn)的損失函數(shù)有交叉熵?fù)p失函數(shù)、感知損失函數(shù)、平方損失函數(shù)、對(duì)數(shù)損失函數(shù)、Hinge損失函數(shù)、以及0-1損失函數(shù)。
本文采用的損失函數(shù)是交叉熵?fù)p失函數(shù),它是機(jī)器學(xué)習(xí)分類(lèi)問(wèn)題中使用非常廣泛的一種損失函數(shù)。假設(shè)給定p和q2個(gè)概率分布,利用q來(lái)表示p的交叉熵為:
H(p,q)=-∑p(x)lgq(x)
(1)
通過(guò)Softmax回歸將神經(jīng)網(wǎng)絡(luò)前向傳播得到的結(jié)果變成概率分布,這樣可以通過(guò)交叉熵來(lái)計(jì)算預(yù)測(cè)的概率分布和真實(shí)答案的概率分布之間的距離。假設(shè)原始的神經(jīng)網(wǎng)絡(luò)輸出為y1,y2,…,yn,那么經(jīng)過(guò)Softmax 回歸處理之后的輸出為:
(2)
針對(duì)雷達(dá)點(diǎn)跡數(shù)據(jù),本文利用如下特征信息,具體如表1所示。
表1 點(diǎn)跡特征信息
(1) 異常值剔除
本文采用雷達(dá)實(shí)測(cè)點(diǎn)跡數(shù)據(jù)進(jìn)行模型訓(xùn)練,錄取的雷達(dá)點(diǎn)跡數(shù)據(jù)中通常有很多異常值。為了降低模型算法計(jì)算量的同時(shí),提高雷達(dá)點(diǎn)跡真?zhèn)舞b別準(zhǔn)確率,在數(shù)據(jù)準(zhǔn)備初始對(duì)這些異常值進(jìn)行剔除。
(2) 產(chǎn)生訓(xùn)練數(shù)據(jù)
按照以下步驟產(chǎn)生訓(xùn)練數(shù)據(jù):
(a) 利用航跡處理程序?qū)γ恳唤M點(diǎn)跡數(shù)據(jù)進(jìn)行建航處理;
(b) 根據(jù)試驗(yàn)環(huán)境和劇情,人工剔除虛假航跡,保留真實(shí)航跡。
(c) 將真實(shí)航跡所對(duì)應(yīng)的點(diǎn)跡數(shù)據(jù)標(biāo)注為1(目標(biāo)),而將其他點(diǎn)跡標(biāo)注為0(雜波)。
(d) 將標(biāo)注好的點(diǎn)跡數(shù)據(jù)構(gòu)成的數(shù)據(jù)集分為兩部分,一部分作為訓(xùn)練集數(shù)據(jù),另一部分作為測(cè)試集數(shù)據(jù)。
(3) 數(shù)據(jù)預(yù)處理
雷達(dá)點(diǎn)跡數(shù)據(jù)包含的不同特征信息間值域差別較大,為避免具有不同量綱的輸入變量不能同等使用,需要對(duì)原始數(shù)據(jù)進(jìn)行預(yù)處理,以消除數(shù)據(jù)量綱影響。歸一化公式如下所示:
(3)
式中:p和Pnorm表示歸一化前后的值;pmax和pmin表示p的最大值和最小值。
本文模型效果評(píng)估指標(biāo)為準(zhǔn)確率、目標(biāo)損失率以及雜波濾除率[9]。下面對(duì)3個(gè)模型效果對(duì)比指標(biāo)進(jìn)行說(shuō)明。
準(zhǔn)確率是模型預(yù)測(cè)正確的結(jié)果所占的比例:
(4)
式中:Acc表示準(zhǔn)確率;TP為目標(biāo)被判為目標(biāo)的數(shù)目;TN為雜波被判為雜波的數(shù)目;FP為雜波被判為目標(biāo)的數(shù)目;FN為目標(biāo)被判為雜波的數(shù)目。
在本文雷達(dá)點(diǎn)跡數(shù)據(jù)真?zhèn)舞b別方法研究中,漏警造成的損失遠(yuǎn)高于將雜波判為目標(biāo)的損失。因此在評(píng)估模型效果時(shí),需要將目標(biāo)損失率rt作為一項(xiàng)重要指標(biāo),公式如下:
(5)
在降低目標(biāo)損失率的同時(shí),要盡可能多地濾掉雜波,雜波濾除率rc公式如下:
(6)
本文所用的神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)圖如圖1所示。
圖1 神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)
輸入層有8個(gè)神經(jīng)元,輸入雷達(dá)點(diǎn)跡有8種特征,共4層隱藏層,每個(gè)隱藏層分別包含64、128、64和32個(gè)神經(jīng)元,每一層神經(jīng)元的輸入為上一層神經(jīng)元的輸出,每層神經(jīng)元的輸出均乘以權(quán)重w,再加上偏置b,通過(guò)ReLU激活函數(shù)后作為下一層神經(jīng)元的輸入。最后的輸出層使用Softmax函數(shù)進(jìn)行分類(lèi),分別輸出各個(gè)類(lèi)別的可能性(0.0~1.0),最后選擇可能性得分最高的類(lèi)別作為預(yù)測(cè)的類(lèi)別。
本文用于神經(jīng)網(wǎng)絡(luò)訓(xùn)練的訓(xùn)練集數(shù)據(jù)為8 034個(gè),用于驗(yàn)證分類(lèi)效果的測(cè)試集數(shù)據(jù)為2 000個(gè)。訓(xùn)練次數(shù)初始化為0,將網(wǎng)絡(luò)的連接權(quán)值和偏置量均初始化為隨機(jī)值,初始學(xué)習(xí)速率設(shè)置為0.001,每訓(xùn)練10輪后學(xué)習(xí)率乘以衰減系數(shù)0.99。每次從訓(xùn)練數(shù)據(jù)集中隨機(jī)抽取512個(gè)特征數(shù)據(jù)輸入神經(jīng)網(wǎng)絡(luò)進(jìn)行迭代訓(xùn)練,逐層計(jì)算各層神經(jīng)網(wǎng)絡(luò)的輸出,獲得預(yù)測(cè)值。使用經(jīng)典的交叉熵?fù)p失函數(shù)為訓(xùn)練模型優(yōu)化目的時(shí),經(jīng)過(guò)多次迭代后目標(biāo)損失率只能達(dá)到0.11左右,準(zhǔn)確率為0.89。因?yàn)槁┚茨繕?biāo)判為雜波的損失要遠(yuǎn)高于將雜波判為目標(biāo)的損失,因此增加目標(biāo)被判為雜波的代價(jià)權(quán)重。優(yōu)化損失函數(shù)后目標(biāo)損失率下降到只有0.03左右,準(zhǔn)確率為0.85。
將分類(lèi)模型應(yīng)用于雷達(dá)實(shí)測(cè)數(shù)據(jù)進(jìn)行雜波點(diǎn)跡過(guò)濾,過(guò)濾前雷達(dá)原始點(diǎn)跡見(jiàn)圖2,是雷達(dá)20個(gè)掃描周期的累積點(diǎn)跡,點(diǎn)跡總數(shù)3 798個(gè),有一個(gè)目標(biāo)軌跡20個(gè)點(diǎn)跡,剩余3 778個(gè)點(diǎn)跡均是雜波。
圖2 原始點(diǎn)跡圖
過(guò)濾雜波后的雷達(dá)點(diǎn)跡如圖3所示,目標(biāo)點(diǎn)跡全部保留,雜波點(diǎn)跡減少到1 133個(gè)。雜波過(guò)濾效果對(duì)比如表2所示。
圖3 雜波過(guò)濾效果圖
表2 雜波過(guò)濾效果對(duì)比
本文利用神經(jīng)網(wǎng)絡(luò)研究雷達(dá)點(diǎn)跡真?zhèn)舞b別問(wèn)題,判斷該點(diǎn)數(shù)據(jù)是來(lái)自目標(biāo)還是雜波。根據(jù)工程中積累的經(jīng)驗(yàn),提煉出雷達(dá)點(diǎn)跡特征信息作為神經(jīng)網(wǎng)絡(luò)的輸入,通過(guò)分析具體應(yīng)用場(chǎng)景優(yōu)化損失函數(shù),使目標(biāo)損失率下降到可接受范圍。利用該分類(lèi)模型處理雷達(dá)實(shí)測(cè)數(shù)據(jù),給出雜波過(guò)濾效果。
當(dāng)有點(diǎn)跡數(shù)據(jù)時(shí),利用本文神經(jīng)網(wǎng)絡(luò)模型對(duì)點(diǎn)跡數(shù)據(jù)進(jìn)行真?zhèn)舞b別,鑒別結(jié)果可以為后續(xù)數(shù)據(jù)處理過(guò)程如航跡起始以及虛假航跡剔除等提供技術(shù)支撐,最終達(dá)到減少雜波環(huán)境下虛假航跡數(shù)量的目的。