田西蘭,郭法濱,趙洪立
(1.中國(guó)電子科技集團(tuán)公司第三十八研究所,安徽合肥230088;2.孔徑陣列與空間探測(cè)安徽省重點(diǎn)實(shí)驗(yàn)室,安徽合肥230088)
彈道導(dǎo)彈因射程長(zhǎng)、威力大、精度高和生存能力強(qiáng)等優(yōu)勢(shì)成為現(xiàn)代戰(zhàn)爭(zhēng)的一把利劍。對(duì)應(yīng)地,彈道導(dǎo)彈攻防之間的博弈便決定了導(dǎo)彈防御系統(tǒng)存在非合作性強(qiáng)、決策時(shí)間短、監(jiān)督式資源急缺等問題[1]。因助推段難以發(fā)現(xiàn)、再入段反應(yīng)時(shí)間短等問題,彈道導(dǎo)彈目標(biāo)識(shí)別問題往往集中在中段進(jìn)行[2]。作為典型的高超聲速目標(biāo),寬帶識(shí)別方法因運(yùn)動(dòng)補(bǔ)償困難、成像質(zhì)量不佳等挑戰(zhàn),現(xiàn)役裝備中應(yīng)用相對(duì)較少,因此,本文致力于解決窄帶中段彈道導(dǎo)彈反導(dǎo)識(shí)別問題,彈道目標(biāo)為非合作的敵對(duì)目標(biāo),識(shí)別對(duì)象的目標(biāo)特征數(shù)據(jù)事先很難被防御方獲取,因此利用傳統(tǒng)的監(jiān)督式設(shè)計(jì)方法很難達(dá)到滿意的識(shí)別結(jié)果。隨著機(jī)器學(xué)習(xí)在各領(lǐng)域的廣泛應(yīng)用,利用先進(jìn)的機(jī)器學(xué)習(xí)算法進(jìn)行目標(biāo)特征學(xué)習(xí)與分類識(shí)別器設(shè)計(jì)正成為雷達(dá)目標(biāo)識(shí)別領(lǐng)域的研究熱點(diǎn)。半監(jiān)督學(xué)習(xí)算法利用少量的標(biāo)定樣本與大量的未標(biāo)定樣本進(jìn)行樣本空間搜索,所獲取的半監(jiān)督分類器能夠?qū)崿F(xiàn)對(duì)大規(guī)模真值未知數(shù)據(jù)的合理利用,進(jìn)而在一定程度上縮減因非合作性強(qiáng)而導(dǎo)致的目標(biāo)識(shí)別系統(tǒng)長(zhǎng)研發(fā)周期[3]。本文針對(duì)反導(dǎo)目標(biāo)識(shí)別中非合作性強(qiáng)、先驗(yàn)數(shù)據(jù)分布知識(shí)急缺的問題,設(shè)計(jì)了一種自動(dòng)調(diào)整假設(shè)模型的半監(jiān)督分類器。數(shù)據(jù)分析結(jié)果表明,該分類算法能明顯縮減窄帶彈道目標(biāo)頭體分辨識(shí)別任務(wù)中所需的標(biāo)定樣本的規(guī)模。
在中段,助推火箭關(guān)機(jī),彈體分離,產(chǎn)生誘餌、碎片等伴飛物體,形成威脅目標(biāo)群(一般又稱頭群)。該目標(biāo)群在真空中按橢圓彈道慣性飛行至彈道最高點(diǎn)后朝地球下降;母艙、火箭助推器殘骸、各種爆炸螺栓部件、碎片等則形成體群。中段飛行由于不受大氣的阻力,頭群、體群中的目標(biāo)以近乎相同的方式飛行,但兩者在形狀及微運(yùn)動(dòng)特征上差異明顯。研究表明[4-5],RCS序列為一種有效的進(jìn)行窄帶彈道目標(biāo)分類識(shí)別的資源,圖1為利用電磁仿真軟件CST獲得的RCS仿真圖,其中,彈體由圓柱形剛體進(jìn)行模擬,彈頭由圓錐形剛體進(jìn)行模擬。由圖1可知,頭群中的彈頭目標(biāo)RCS變化比較平穩(wěn),不具備周期性;體群中的彈體RCS變化較為劇烈,表現(xiàn)為一定的周期性。其原因在于彈頭一般采取自旋等姿態(tài)控制措施,因此,相對(duì)入射電磁波的姿態(tài)變化范圍較小;體群目標(biāo)均不具姿態(tài)控制裝置,形狀相對(duì)較大,翻滾等運(yùn)動(dòng)會(huì)帶來周期性的RCS幅值變化。
作為典型的時(shí)變系統(tǒng),基于RCS序列的反導(dǎo)識(shí)別任務(wù)分段序貫完成。假設(shè){x k|1≤k≤N}表示長(zhǎng)度為N的目標(biāo)RCS序列,本文提取以下典型的統(tǒng)計(jì)特征:
1)均值
該特征描述了RCS序列的位置特征參數(shù),由于彈頭目標(biāo)尺寸較小且可能具有隱身特性,因此其RCS均值與彈體、末修艙等尺寸較大的目標(biāo)相比偏小。
2)方差
該特征反映了樣本的取值與其數(shù)學(xué)期望的偏離程度。由于彈頭目標(biāo)在飛行過程中可以進(jìn)行姿態(tài)控制,因此其RCS起伏比較穩(wěn)定,樣本方差值相對(duì)較小,而對(duì)于彈體、碎片等目標(biāo),在空間呈現(xiàn)自由翻滾,因此其樣本方差相對(duì)偏大。
圖1 彈頭、彈體RCS回波仿真圖
3)眾數(shù)
4)熵
對(duì)RCS序列進(jìn)行傅里葉變換,并進(jìn)行歸一化操作求取其熵:
該特征表征了目標(biāo)在能量譜上的分布情況。時(shí)域平穩(wěn)的信號(hào)能量譜也較為集中,熵值較小;時(shí)域變化劇烈的信號(hào)能量譜分布較散,熵值也大。
5)切尾平均
式中,m為序列兩端截去的數(shù)據(jù)個(gè)數(shù)。對(duì)于RCS時(shí)間序列而言,截去樣本兩端的值,可以獲得其在統(tǒng)計(jì)時(shí)間內(nèi)的穩(wěn)定的RCS,因此該特征反映了統(tǒng)計(jì)時(shí)間內(nèi)目標(biāo)RCS的穩(wěn)態(tài)均值。
目前多數(shù)的半監(jiān)督學(xué)習(xí)方法往往對(duì)有限的已知樣本和大量的未標(biāo)定數(shù)據(jù)進(jìn)行強(qiáng)的分布假設(shè)。最為常見的為“聚類假設(shè)”和“流形假設(shè)”兩種。其中,聚類假設(shè)假定落在同一樣本分布空間的兩個(gè)樣本也隸屬于同一類;流形假設(shè)假定基于圖表方法獲得的預(yù)測(cè)標(biāo)簽在流形上分布平穩(wěn)。針對(duì)“極小樣本空間”的彈道目標(biāo)識(shí)別任務(wù),任何一種單一的模型假設(shè)都難以準(zhǔn)確描述其樣本空間分布,因此,本文采用多核學(xué)習(xí)框架,將“流形”假設(shè)模型引入到基于“聚類”假設(shè)的TSVM(Transductive SVM)框架中,從而實(shí)現(xiàn)對(duì)兩個(gè)假設(shè)模型的統(tǒng)一處理。假定g(x)為決策函數(shù),其優(yōu)化問題表述如下:
式中,g(x)=f(x)+b,f為希爾伯特空間的函數(shù),b為實(shí)數(shù)標(biāo)量,l為標(biāo)定數(shù)據(jù)的規(guī)模,u為未標(biāo)定數(shù)據(jù)的規(guī)模,V與U為對(duì)應(yīng)的損失函數(shù),yu為未標(biāo)定樣本的預(yù)測(cè)標(biāo)簽。
“流形假設(shè)”由l+u維的拉普拉斯(Laplacian)核矩陣承載,定義為L(zhǎng)=D-W,對(duì)其進(jìn)行正則化處理可得L n=(I-D-1W)。式中,D為一對(duì)角矩陣并且滿足
為相鄰矩陣的權(quán)重。其構(gòu)造方法如圖2所示。
令決策函數(shù)g隸屬于由核函數(shù)k生成的希爾伯特空間H,已被證明,Laplacian SVM所涉及的流形正則化問題可通過一個(gè)基于“重組核”的經(jīng)典SVM問題解決,該“重組核”表示如下:
式中,k x=[k(x1,x),…,k(x l+u,x)]T。樣本點(diǎn)的正則化云矩陣為為一個(gè)整數(shù)。
圖2 拉普拉斯構(gòu)造方法
多核學(xué)習(xí)(Multi-Kernel Learning,M KL)是一種融合不同源信息的有效方法[6]?;谑?6),假定未標(biāo)定樣本中正負(fù)類的分布與已知樣本的分布狀況相同,獲得TSVM的多核學(xué)習(xí)框架TSVM-M KL[7]:
式中:m為核函數(shù)的個(gè)數(shù);d k為當(dāng)前核的權(quán)重,起到選擇因子的作用,其值越大,該核矩陣所起的作用越大,為1時(shí)決策函數(shù)僅依賴于當(dāng)前核,為0時(shí)不起作用;a k為正則因子;f k為第k個(gè)決策函數(shù)。此處約定t=0時(shí),t/0=0,否則,其值為 ∞。TSVM-M KL的決策函數(shù)定義如下:
在解決上述優(yōu)化問題時(shí),設(shè)置平衡因子以約束大量未知樣本中的正類、負(fù)類樣本的分布情況。假設(shè)未知樣本中,正類樣本的比例為r,即應(yīng)滿足下式:
損失函數(shù)V和U均基于傳統(tǒng)的鉸鏈損失(Hinge Loss,HL)函數(shù),其中,U(|z|)的一個(gè)可行性的定義可表示為
式中,R s(z)為鉸鏈損失函數(shù),即R s(z)=H1(z)-H s(z)。斜坡?lián)p失(Ramp Loss,RL)函數(shù)與截?cái)嚆q鏈損失(Clipped Hinge Loss,CHL)函數(shù)表征如圖3所示。將上述損失函數(shù)代入式(9):
該優(yōu)化問題啟用CCCP(Concave Convex Procedure)算法進(jìn)行求解。詳細(xì)算法表述如下:
TSVM-M KL二次規(guī)劃的迭代過程:
設(shè)置初始估計(jì)值:d0,b0,f0k,t=0
重復(fù)如下過程:
計(jì)算v i,i=l+1,…,l+2u
求解下式的解d t+1,b t+1,f t+1k,k=1,…,m
直到滿足收斂條件。
圖3 損失函數(shù)
本節(jié)以仿真數(shù)據(jù)為例,對(duì)所提算法進(jìn)行驗(yàn)證。彈道目標(biāo)識(shí)別的任務(wù)為區(qū)分彈頭群、彈體群。其中,彈頭群包括彈頭、誘餌、末修倉、頭體分離時(shí)的碎片等目標(biāo)。彈頭具有自旋穩(wěn)定機(jī)構(gòu),角度變化比較穩(wěn)定;彈體群目標(biāo)包括各子級(jí)彈體殘骸、級(jí)間分離時(shí)的碎片等目標(biāo)。彈體不具有穩(wěn)定機(jī)構(gòu),產(chǎn)生翻滾,角度變化劇烈。特征提取前對(duì)原始RCS序列進(jìn)行了野值剔除。
觀測(cè)數(shù)據(jù)中,頭目標(biāo)有60個(gè)樣本,體目標(biāo)有50個(gè)樣本。為檢驗(yàn)本文所提算法的有效性,實(shí)驗(yàn)分為兩組,第一組抽取其中的10個(gè)樣本作為標(biāo)注樣本(5個(gè)彈頭、5個(gè)彈體),其余樣本作為測(cè)試樣本;第二組抽取其中的16個(gè)樣本作為標(biāo)注樣本(8個(gè)彈頭、8個(gè)彈體),其余樣本作為測(cè)試樣本。TSVM-MKL的試驗(yàn)設(shè)置為:拉普拉斯圖譜的N取值為5;基本核函數(shù)均取為“Gaussian”型,核參數(shù)設(shè)置為0.25,0.5和1三個(gè)。與之對(duì)比的是基于常規(guī)SVM算法在上述數(shù)據(jù)上進(jìn)行試驗(yàn),采用5折交叉驗(yàn)證進(jìn)行參數(shù)尋優(yōu),核函數(shù)同樣設(shè)置為“Gaussian”型,核參數(shù)的搜索空間為logspace(-2,1,5),正則參數(shù)的搜索空間為logspace(-1,3,10),所得結(jié)果如表1所示。
表1 實(shí)測(cè)數(shù)據(jù)結(jié)果對(duì)比
由結(jié)果可知,SVM在如此小的標(biāo)定樣本下難以獲得有效分類,即與隨機(jī)分類器所得結(jié)果一致,而本節(jié)所提的TSVM-MKL在極小樣本下依然能夠獲得滿足工程需求的分類準(zhǔn)確率。
彈道導(dǎo)彈目標(biāo)識(shí)別技術(shù)面臨的一項(xiàng)重大挑戰(zhàn)是樣本數(shù)據(jù)難以標(biāo)定、樣本庫建立困難。針對(duì)該問題,本文設(shè)計(jì)了一種半監(jiān)督式分類器,一方面,可以綜合利用反導(dǎo)實(shí)戰(zhàn)中累積的未標(biāo)定數(shù)據(jù);另一方面,由于訓(xùn)練過程中擴(kuò)大了樣本的“探索”與“利用”范圍,從而使得在極小標(biāo)定樣本規(guī)模的情況下,仍能獲得較好的分類性能。實(shí)測(cè)數(shù)據(jù)驗(yàn)證表明,該算法適合于工程應(yīng)用。
[1]李陸軍,丁建江,呂金建,等.彈道導(dǎo)彈目標(biāo)特性研究[J].飛航導(dǎo)彈,2015(6):34-39.
[2]張平定,孫佳佳,童創(chuàng)明,等.彈道中段目標(biāo)雷達(dá)綜合識(shí)別研究[J].微波學(xué)報(bào),2015,31(2):20-23.
[3]吳劍旗,田西蘭.一種基于半監(jiān)督學(xué)習(xí)的窄帶雷達(dá)目標(biāo)識(shí)別系統(tǒng)[J].中國(guó)電子科學(xué)研究院學(xué)報(bào),2015,10(1):49-53.
[4]魏文博,蔡紅軍.基于支持向量機(jī)的窄帶雷達(dá)彈道導(dǎo)彈目標(biāo)識(shí)別技術(shù)[J].電子科技,2016,29(6):75-78.
[5]崔雄文,田西蘭.一種融合聚類和自相關(guān)的RCS周期估計(jì)算法[J].雷達(dá)科學(xué)與技術(shù),2016,14(6):614-618.
[6]RAKOTOMAMONJY A,BACH F R,CANU S,et al.Simple MKL[J].Journal of Machine Learning Research,2008,9(3):2491-2521.
[7]TIAN X,GASSO G,CANU S.A Multiple Kernel Framework for Inductive Semi-Supervised SVM Learning[J].Neurocomputing,2012,90(8):46-58.