張 露,蘇 雨*,張 科,郭正玉
(1. 西北工業(yè)大學(xué) 航天學(xué)院,西安 710072; 2. 中國(guó)空空導(dǎo)彈研究院,河南 洛陽 471009;3. 航空制導(dǎo)武器航空科技重點(diǎn)實(shí)驗(yàn)室,河南 洛陽 471009)
近年來,隨著科學(xué)技術(shù)的迅猛發(fā)展,現(xiàn)代戰(zhàn)場(chǎng)上的戰(zhàn)爭(zhēng)已經(jīng)變?yōu)楦咝录夹g(shù)的戰(zhàn)爭(zhēng),戰(zhàn)爭(zhēng)模式從原來以地面機(jī)械化戰(zhàn)爭(zhēng)為主的模式轉(zhuǎn)變成由高新技術(shù)支持的空戰(zhàn)為主。巡航導(dǎo)彈因?yàn)轶w積小、重量輕、便于隱蔽和發(fā)射等特點(diǎn)在戰(zhàn)場(chǎng)上得到廣泛應(yīng)用,其大部分飛行時(shí)間處于巡航狀態(tài),靠發(fā)動(dòng)機(jī)克服前進(jìn)阻力在大氣層內(nèi)飛行,具有突防能力強(qiáng)、機(jī)動(dòng)性能好、命中精度高、摧毀力強(qiáng)等優(yōu)點(diǎn),能夠有效地對(duì)敵方目標(biāo)進(jìn)行打擊。但隨著各類反導(dǎo)系統(tǒng)的發(fā)展,巡航導(dǎo)彈的生存能力受到了極大的威脅,導(dǎo)彈的突防打擊能力面臨嚴(yán)峻的考驗(yàn),傳統(tǒng)的導(dǎo)彈進(jìn)攻方式難以實(shí)現(xiàn)現(xiàn)代化戰(zhàn)爭(zhēng)中的打擊目的。因此,針對(duì)導(dǎo)彈突防工作進(jìn)行研究已經(jīng)成為當(dāng)前戰(zhàn)場(chǎng)上迫切需要解決的問題。
在導(dǎo)彈突防工作研究中,第一步就是對(duì)于攔截彈攔截點(diǎn)的預(yù)測(cè),預(yù)測(cè)攔截點(diǎn)(Predicted Interception Point,PIP) 對(duì)于巡航導(dǎo)彈有效躲避攔截彈攻擊、成功攻擊目標(biāo)地點(diǎn)有著重要意義,而只有準(zhǔn)確預(yù)測(cè)了敵方的攔截點(diǎn),才能確定我方利用什么方法,在何時(shí)何地進(jìn)行突防并將其摧毀。
因此,國(guó)內(nèi)外研究人員針對(duì)導(dǎo)彈攔截點(diǎn)預(yù)測(cè)問題開展了研究工作。目前,攔截點(diǎn)預(yù)測(cè)方法主要有基于彈目運(yùn)動(dòng)方程建立攔截幾何的數(shù)值模型求解、加入導(dǎo)引方法利用迭代方式進(jìn)行求解等。田憲科等以在空空導(dǎo)彈中廣泛使用的破片式戰(zhàn)斗部為例,建立了彈目相對(duì)運(yùn)動(dòng)模型求解攔截點(diǎn),通過控制變量法,利用MATLAB進(jìn)行仿真,分析了導(dǎo)彈攔截點(diǎn)的影響因素。Zarchan對(duì)于采用脈沖機(jī)動(dòng)方式的導(dǎo)彈提出基于Lambert問題求解預(yù)測(cè)攔截點(diǎn)的方法。謝經(jīng)緯等基于跨大氣層反導(dǎo)攔截的背景,建立了某種攔截彈的動(dòng)力學(xué)模型,對(duì)于給出的“脈沖”攔截彈模型,利用Lambert問題數(shù)值求解來獲得預(yù)測(cè)攔截點(diǎn),并利用攔截彈射表不斷更新預(yù)測(cè)攔截點(diǎn)。Song等設(shè)計(jì)了一種類似于用于根部定位的Newton-Raphson方法,通過簡(jiǎn)單的迭代來實(shí)現(xiàn)攔截點(diǎn)的預(yù)測(cè)。Ann等通過軌跡優(yōu)化技術(shù)獲得了可實(shí)現(xiàn)的預(yù)測(cè)攔截點(diǎn)范圍,并提出適當(dāng)?shù)腜IP選擇方案以攔截目標(biāo)。但上述對(duì)于PIP的研究工作存在作戰(zhàn)假設(shè)場(chǎng)景過多、適用性不強(qiáng)、魯棒性較差、攔截點(diǎn)預(yù)測(cè)精度較低等問題。
深度學(xué)習(xí)最早可以追溯到1958年Rosenblatt提出的感知機(jī)。近些年由于計(jì)算機(jī)性能的大幅度提升,深度學(xué)習(xí)更是迎來了蓬勃的發(fā)展。深度學(xué)習(xí)具有自適應(yīng)性強(qiáng)、魯棒性好、容錯(cuò)性高、適用于非線性問題以及訓(xùn)練后的網(wǎng)絡(luò)有毫秒級(jí)響應(yīng)等特點(diǎn)。其在導(dǎo)彈作戰(zhàn)領(lǐng)域,包括導(dǎo)彈參數(shù)預(yù)測(cè)、導(dǎo)彈發(fā)射條件優(yōu)化、導(dǎo)彈軌跡預(yù)測(cè)等方向都有很多應(yīng)用。相對(duì)于傳統(tǒng)預(yù)測(cè)方法,基于深度學(xué)習(xí)的PIP方法更適用于現(xiàn)代戰(zhàn)場(chǎng)高動(dòng)態(tài)、強(qiáng)干擾的環(huán)境對(duì)導(dǎo)彈突防帶來的挑戰(zhàn)。因此,國(guó)內(nèi)外學(xué)者開展了基于深度學(xué)習(xí)方法的導(dǎo)彈突防方法研究。南英等利用深度強(qiáng)化學(xué)習(xí),提出一種彈道導(dǎo)彈突防控制方法,訓(xùn)練結(jié)果表明此方法能夠有效地對(duì)彈道導(dǎo)彈終端最優(yōu)突防模型進(jìn)行逼近。楊子成等利用DNN網(wǎng)絡(luò),以攔截彈主動(dòng)段關(guān)機(jī)時(shí)參數(shù)作為輸入,建立預(yù)測(cè)模型,實(shí)現(xiàn)對(duì)攔截點(diǎn)和攔截時(shí)間的預(yù)測(cè)。Lee等以神經(jīng)網(wǎng)絡(luò)為基礎(chǔ),提出一種高速計(jì)算反彈道導(dǎo)彈系統(tǒng)的預(yù)測(cè)攔截點(diǎn)算法,大大減少了目標(biāo)軌跡實(shí)時(shí)預(yù)測(cè)所需要的計(jì)算時(shí)間。Wang等建立了兩層的深度神經(jīng)網(wǎng)絡(luò),用于預(yù)測(cè)導(dǎo)彈飛行軌跡。上述基于深度學(xué)習(xí)的方法要比傳統(tǒng)方法魯棒性更強(qiáng),限制條件較少。但從實(shí)驗(yàn)結(jié)果可以看出,使用簡(jiǎn)單DNN網(wǎng)絡(luò)在面對(duì)復(fù)雜的導(dǎo)彈飛行時(shí)序數(shù)據(jù)時(shí),效果并不是特別理想,且可能出現(xiàn)梯度爆炸或梯度消失等問題。
為了克服上述問題,本文提出了一種基于長(zhǎng)短時(shí)記憶 (Long Short-Term Memory, LSTM)神經(jīng)網(wǎng)絡(luò)的導(dǎo)彈攔截點(diǎn)預(yù)測(cè)方法。在對(duì)導(dǎo)彈機(jī)動(dòng)軌跡關(guān)鍵參數(shù)進(jìn)行遍歷的基礎(chǔ)上,利用LSTM網(wǎng)絡(luò)研究導(dǎo)彈機(jī)動(dòng)軌跡數(shù)據(jù)中的規(guī)律性變化特點(diǎn)。隨后,基于LSTM神經(jīng)網(wǎng)絡(luò)強(qiáng)大的時(shí)間序列分類與預(yù)測(cè)能力,設(shè)計(jì)智能化的方法實(shí)現(xiàn)對(duì)軌跡簇的分類,其更適用于時(shí)序軌跡序列,并且解決了DNN和RNN中存在的梯度爆炸問題; 利用神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)方法實(shí)現(xiàn)對(duì)特定飛行軌跡的預(yù)測(cè)與評(píng)估,從而實(shí)現(xiàn)提前掌握空戰(zhàn)戰(zhàn)場(chǎng)態(tài)勢(shì)變化,根據(jù)攔截彈的前一段時(shí)間運(yùn)動(dòng)狀態(tài)來求解攔截點(diǎn)時(shí)刻以及攔截點(diǎn)位置,獲得攻擊主動(dòng)權(quán)。
本文采用比例導(dǎo)引法來描述導(dǎo)彈-目標(biāo)相對(duì)運(yùn)動(dòng)。比例導(dǎo)引法是指導(dǎo)導(dǎo)彈飛行速度矢量轉(zhuǎn)動(dòng)角速度和目標(biāo)視線角變化率成比例的導(dǎo)引方法。其結(jié)合了追蹤法和平行接近法的優(yōu)點(diǎn),也消除了這兩種方法原有的一些缺點(diǎn),是自動(dòng)制導(dǎo)中目前最常用的方法。相比于其他導(dǎo)引方法,比例導(dǎo)引法可以得到較為平滑的彈道,并且導(dǎo)彈擁有足夠的機(jī)動(dòng)能力。只要參數(shù)調(diào)節(jié)合適,就可以實(shí)現(xiàn)對(duì)目標(biāo)的準(zhǔn)確打擊。因此,使用比例導(dǎo)引法生成神經(jīng)網(wǎng)絡(luò)所需要的彈道庫。
彈目相對(duì)運(yùn)動(dòng)關(guān)系示意圖如圖1所示。
圖1 彈目相對(duì)運(yùn)動(dòng)關(guān)系Fig.1 Missile-target relative motion relationship
導(dǎo)彈-目標(biāo)的相對(duì)運(yùn)動(dòng)關(guān)系如下:
(1)
式中:為導(dǎo)彈速度矢量;為目標(biāo)的速度矢量;為彈目相對(duì)距離;為視線角;為比例系數(shù),又稱導(dǎo)航比;和分別為導(dǎo)彈速度向量、目標(biāo)速度向量與目標(biāo)線之間的夾角,亦稱為前置角;和分別為導(dǎo)彈速度向量、目標(biāo)速度向量與基準(zhǔn)線之間的夾角。
研究中,定義攔截朝向目標(biāo)方向運(yùn)動(dòng)為“正方向”,巡航彈飛行方向運(yùn)動(dòng)為“負(fù)方向”。
攔截彈的運(yùn)動(dòng)學(xué)模型如下:
(2)
式中:為重力加速度;,,為攔截彈的三維空間位置;為彈道傾角;為彈道偏角;和分別為導(dǎo)彈縱向和側(cè)向平面的過載,根據(jù)式(2)可以獲得攔截巡航彈的彈道。
在有監(jiān)督深度學(xué)習(xí)中,最重要的部分就是數(shù)據(jù)集。因?yàn)槟壳皩?duì)于導(dǎo)彈攻防對(duì)抗系統(tǒng)還沒有公開的數(shù)據(jù)集,所以通過仿真計(jì)算多種攔截彈彈道數(shù)據(jù),并將其作為數(shù)據(jù)集用以訓(xùn)練神經(jīng)網(wǎng)絡(luò)模型。
以某型號(hào)巡航導(dǎo)彈作為進(jìn)攻彈,某型號(hào)防空導(dǎo)彈作為攔截彈,攔截彈發(fā)射點(diǎn)為原點(diǎn)固定點(diǎn),并隨機(jī)生成服從均勻分布的不同彈道傾角(∈(40°,51°))和不同發(fā)射速度下的攔截彈道。巡航導(dǎo)彈沿預(yù)設(shè)彈道勻速直線飛行。攔截彈每一組不同的傾角和速度初始設(shè)定值作為初始發(fā)射條件,對(duì)每條彈道分別進(jìn)行攻防仿真,一共生成960條標(biāo)準(zhǔn)彈道。
攔截彈在不同速度、不同傾角情況下發(fā)射時(shí)所生成的彈道如圖2所示。數(shù)據(jù)集中的全部彈道如圖3所示。
圖2 不同初始條件下的彈道圖Fig.2 Ballistic diagram under different initial conditions
圖3 基礎(chǔ)數(shù)據(jù)集Fig.3 Basic data set
在敵我對(duì)抗雙方作戰(zhàn)流程中,攔截彈需要在導(dǎo)引頭給出的引導(dǎo)信息下對(duì)姿態(tài)和發(fā)動(dòng)機(jī)進(jìn)行控制,從而實(shí)現(xiàn)對(duì)來襲導(dǎo)彈的精準(zhǔn)打擊。對(duì)于進(jìn)攻彈來說,只要在對(duì)方攔截彈的末制導(dǎo)階段,準(zhǔn)確預(yù)測(cè)其攔截點(diǎn)和攔截時(shí)刻,就能提前對(duì)導(dǎo)彈未來彈道進(jìn)行規(guī)劃,從而躲避攔截彈的探測(cè)范圍或機(jī)動(dòng)打擊范圍,實(shí)現(xiàn)突防。
為了準(zhǔn)確預(yù)測(cè)攔截彈的攔截時(shí)間和攔截點(diǎn)信息,需要進(jìn)攻方探測(cè)設(shè)備對(duì)攔截彈進(jìn)行準(zhǔn)確的探測(cè)跟蹤,獲取攔截彈的位置、速度等信息。目前常用的導(dǎo)彈導(dǎo)引頭能夠獲取敵方導(dǎo)彈的視線角、視線角速度、彈目相對(duì)距離、彈目相對(duì)速度信息,通過這些信息就可以計(jì)算出敵我對(duì)抗雙方的相對(duì)位置等信息。本文利用LSTM神經(jīng)網(wǎng)絡(luò)對(duì)導(dǎo)彈攔截點(diǎn)進(jìn)行預(yù)測(cè)。
LSTM神經(jīng)網(wǎng)絡(luò)是一種改進(jìn)的循環(huán)神經(jīng)網(wǎng)絡(luò)(Recurrent Neural Network,RNN),最初由Hochreiter和Schemidhuber于1997年提出,主要是為了解決RNN對(duì)長(zhǎng)序列樣本訓(xùn)練過程中的梯度消失和梯度爆炸問題。LSTM模型是RNN模型的一個(gè)變種,主要用于解決RNN對(duì)長(zhǎng)期依賴信息學(xué)習(xí)能力缺乏的問題。與RNN不同,LSTM在每個(gè)神經(jīng)元中引入了3個(gè)“門”結(jié)構(gòu):輸入門、遺忘門和輸出門,通過對(duì)3個(gè)門的控制來實(shí)現(xiàn)對(duì)歷史信息的記錄,從而在更長(zhǎng)的序列中有更好的表現(xiàn)。圖4所示為L(zhǎng)STM模型的結(jié)構(gòu)示意圖,其中:-1和分別代表-1時(shí)刻和時(shí)刻的細(xì)胞狀態(tài);-1和分別代表-1時(shí)刻和時(shí)刻的隱藏層狀態(tài)。
圖4 LSTM模型結(jié)構(gòu)示意圖Fig.4 LSTM model structure diagram
LSTM的關(guān)鍵是Cell的狀態(tài)。在整個(gè)網(wǎng)絡(luò)中,各Cell之間只存在少量的線性交互過程,時(shí)序序列的歷史信息在整個(gè)網(wǎng)絡(luò)結(jié)構(gòu)中傳遞時(shí)很容易被保存。
所提出的攔截點(diǎn)預(yù)測(cè)模型如前文所述。模型輸入為攔截彈3個(gè)位置參數(shù),,的時(shí)序序列,模型的輸出值為攔截點(diǎn)的類型,通過此輸出得到攔截點(diǎn)的坐標(biāo)(,,)和攔截時(shí)刻。設(shè)計(jì)的網(wǎng)絡(luò)輸入層節(jié)點(diǎn)為3,輸出層節(jié)點(diǎn)為1,表示輸出此時(shí)軌跡的類別。攔截點(diǎn)預(yù)測(cè)模型示意圖如圖5所示。
圖5 攔截點(diǎn)預(yù)測(cè)模型示意圖Fig.5 Schematic diagram of interception point prediction model
此外,為了提高網(wǎng)絡(luò)對(duì)非線性時(shí)序序列預(yù)測(cè)問題的擬合能力,在各隱藏層后加入了激活函數(shù),以解決線性模型中表達(dá)能力不足的問題。
常用的激活函數(shù)有sigmoid函數(shù)、線性整流函數(shù) (Rectified Linear Unit,ReLU)、雙曲正切函數(shù)(tanh) 等。相比于其他兩種函數(shù),線性整流函數(shù)更符合本文所提神經(jīng)網(wǎng)絡(luò)的需求,能夠更加有效地解決梯度下降和反向傳播問題,同時(shí)也避免了梯度爆炸和梯度消失問題。
本文提出了一個(gè)兩層LSTM模型,網(wǎng)絡(luò)結(jié)構(gòu)如圖6所示,具體參數(shù)如表1所示。
表1 攔截點(diǎn)預(yù)測(cè)網(wǎng)絡(luò)結(jié)構(gòu)
圖6 攔截點(diǎn)預(yù)測(cè)網(wǎng)絡(luò)結(jié)構(gòu)Fig.6 Interception point prediction network structure
在網(wǎng)絡(luò)結(jié)構(gòu)都確定之后,需要選擇恰當(dāng)?shù)膿p失函數(shù)和優(yōu)化器對(duì)網(wǎng)絡(luò)進(jìn)行訓(xùn)練。損失函數(shù)表示預(yù)測(cè)值和標(biāo)簽值之間的誤差大小,優(yōu)化器是用于加速神經(jīng)網(wǎng)絡(luò)訓(xùn)練的加速方法。
(1) 損失函數(shù)的選擇
采用交叉熵(Cross Entropy)函數(shù)作為損失函數(shù),用來判斷預(yù)測(cè)值與真實(shí)值之間的誤差:
(3)
式中:()為真實(shí)分布;()為非真實(shí)分布。
(2) 優(yōu)化器的選擇
神經(jīng)網(wǎng)絡(luò)的基本訓(xùn)練方法是梯度下降法,即讓損失函數(shù)按梯度搜索方法找到最小值。目前常用的方法有SGD,Adagrad,RMSProp和Adam等。本文選擇SGD作為優(yōu)化器,相對(duì)于其他的優(yōu)化方法,該方法更適用于大數(shù)據(jù)集的訓(xùn)練。
根據(jù)前文所得到的彈道數(shù)據(jù)集,記錄每條彈道軌跡的數(shù)據(jù)點(diǎn),共960條彈道。在彈目相對(duì)運(yùn)動(dòng)剛開始時(shí),敵我雙方距離過遠(yuǎn),我方探測(cè)器很難探測(cè)到敵方攔截彈。因此,取攔截彈的軌跡坐標(biāo)從第900個(gè)點(diǎn)開始,第1 600個(gè)點(diǎn)作為結(jié)束。將軌跡的前900~1 600個(gè)點(diǎn)作為神經(jīng)網(wǎng)絡(luò)模型的時(shí)序輸入,將攔截點(diǎn)坐標(biāo)分為8類。對(duì)得到的樣本數(shù)據(jù)進(jìn)行預(yù)處理,用其中720條彈道,占總數(shù)75%的數(shù)據(jù)作為神經(jīng)網(wǎng)絡(luò)的訓(xùn)練集,另外240條彈道,占總數(shù)25%的數(shù)據(jù)作為測(cè)試集。
數(shù)據(jù)的預(yù)處理首先是野值剔除,即在實(shí)驗(yàn)之前剔除樣本中某些測(cè)量的異常數(shù)據(jù)值,以減少實(shí)驗(yàn)成本。第二步是數(shù)據(jù)的歸一化處理。本文數(shù)據(jù)集中的數(shù)據(jù)值往往都比較大,這會(huì)給計(jì)算造成較大的負(fù)擔(dān),因此,需要對(duì)目標(biāo)的位置信息進(jìn)行歸一化處理,通過恰當(dāng)?shù)淖兓沟蒙窠?jīng)網(wǎng)絡(luò)的輸入、輸出限制在[-1,1]之間,從而減少數(shù)據(jù)中極大值和極小值對(duì)神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)的影響,同時(shí)還能夠提高神經(jīng)網(wǎng)絡(luò)的運(yùn)算速度。
彈道數(shù)據(jù)歸一化的數(shù)學(xué)描述如下:
(4)
式中:為樣本值;為樣本值最小值;為樣本值最大值;為歸一化之后的樣本值。
網(wǎng)絡(luò)結(jié)構(gòu)、訓(xùn)練數(shù)據(jù)、損失函數(shù)都已經(jīng)設(shè)定,接下來要開始對(duì)網(wǎng)絡(luò)進(jìn)行訓(xùn)練。針對(duì)所提出的網(wǎng)絡(luò),采用以下設(shè)置進(jìn)行訓(xùn)練:訓(xùn)練次數(shù)為400輪,每一輪訓(xùn)練迭代1次,初始學(xué)習(xí)率設(shè)置為0.1,在100輪訓(xùn)練之后變?yōu)?.01,最小批次為128,在單CPU上進(jìn)行訓(xùn)練。
整個(gè)預(yù)測(cè)網(wǎng)絡(luò)訓(xùn)練流程圖如圖7所示。
圖7 訓(xùn)練流程示意圖Fig.7 Training process diagram
將神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)輸出與原測(cè)試數(shù)據(jù)集的標(biāo)簽進(jìn)行對(duì)比,可得到攔截時(shí)間與攔截點(diǎn)的誤差,如表2~3所示。
表2 測(cè)試集上攔截時(shí)間誤差
表3 測(cè)試集上攔截點(diǎn)距離誤差
圖8~9分別為測(cè)試集中攔截時(shí)間誤差分布概率和時(shí)間誤差分布。從圖中可以看出,測(cè)試集的時(shí)間誤差分布在0.1~0.5 s,均值為0.3 s。
圖8 測(cè)試集時(shí)間誤差分布概率Fig.8 Distribution probability of time errors in test set
圖10~11分別為測(cè)試集中攔截點(diǎn)距離誤差分布概率和距離誤差分布。從圖中可以看出,攔截點(diǎn)距離誤差分布在20~180 m,均值為102 m,距離誤差在合理范圍內(nèi)。從結(jié)果分析可知,數(shù)據(jù)集上攔截點(diǎn)預(yù)測(cè)誤差與攔截時(shí)間誤差分布比較均勻,而且相對(duì)于彈目距離來說較小,對(duì)于后續(xù)的突防工作幾乎沒有影響,在精度上符合預(yù)期。
圖9 測(cè)試集時(shí)間誤差具體分布Fig.9 Specific distribution of time errors in test set
圖10 測(cè)試集距離誤差分布概率Fig.10 Distribution probability of distance errors in test set
圖11 測(cè)試集距離誤差具體分布Fig 11 Specific distribution of distance errors in test set
將所提出的基于LSTM的攔截彈預(yù)測(cè)模型與其他方法進(jìn)行對(duì)比,結(jié)果如表4所示。圖12為3個(gè)不同網(wǎng)絡(luò)訓(xùn)練過程中測(cè)試集loss的變化曲線; 圖13為3個(gè)網(wǎng)絡(luò)訓(xùn)練過程中測(cè)試集準(zhǔn)確率變化曲線。從圖中可以看出,DNN網(wǎng)絡(luò)和RNN網(wǎng)絡(luò)對(duì)本文的數(shù)據(jù)集訓(xùn)練結(jié)果并不理想,分類精度不夠高,訓(xùn)練過程中l(wèi)oss變化趨勢(shì)也比較亂,甚至出現(xiàn)梯度消失或梯度爆炸問題。與之相反,本文所提出的LSTM網(wǎng)絡(luò)在處理導(dǎo)彈軌跡時(shí)序數(shù)據(jù)時(shí)效果很好,能夠在極少的迭代次數(shù)下收斂,并且準(zhǔn)確率和loss的變化趨勢(shì)要更加理想。從測(cè)試集的結(jié)果可以看出,本文提出的網(wǎng)絡(luò)結(jié)構(gòu)預(yù)測(cè)精度要高,對(duì)時(shí)序序列處理效果更好。這是因?yàn)橄啾扔贒NN和RNN,LSTM有3個(gè)門(輸入門、遺忘門、輸出門)結(jié)構(gòu),其中遺忘門能夠?qū)v史信息進(jìn)行處理、保存或者丟棄,從而能夠找到數(shù)據(jù)中的時(shí)序相關(guān)信息并避免可能出現(xiàn)的梯度消失和梯度爆炸的問題。
表4 實(shí)驗(yàn)結(jié)果對(duì)比
圖12 測(cè)試集loss變化對(duì)比Fig.12 Comparison of loss accuracy changes in test set
圖13 測(cè)試集準(zhǔn)確率變化對(duì)比Fig.13 Comparison of accuracy changes in test set
為進(jìn)一步分析所設(shè)計(jì)的網(wǎng)絡(luò)模型的適用性,增加了樣本集以外的文本數(shù)據(jù)集進(jìn)行分析。在此,使用了IMDB數(shù)據(jù)集。此數(shù)據(jù)集包含50 000條偏向明顯的影評(píng),其中25 000條作為訓(xùn)練集,25 000條作為測(cè)試集,標(biāo)簽為積極(pos)和消極(neg)兩種。使用LSTM模型與兩種對(duì)比算法對(duì)此數(shù)據(jù)集進(jìn)行分類。
對(duì)IMDB數(shù)據(jù)集測(cè)試集分類結(jié)果如表 5所示。圖14為3個(gè)不同網(wǎng)絡(luò)訓(xùn)練過程中訓(xùn)練集準(zhǔn)確率變化曲線; 圖15為3個(gè)網(wǎng)絡(luò)訓(xùn)練過程中訓(xùn)練集loss的變化曲線; 圖16為3個(gè)不同網(wǎng)絡(luò)測(cè)試集準(zhǔn)確率變化曲線; 圖17為3個(gè)網(wǎng)絡(luò)測(cè)試集loss的變化曲線。從實(shí)驗(yàn)可以看出,DNN網(wǎng)絡(luò)在訓(xùn)練時(shí)正確率和loss的變化相比于本文方法都十分理想,收斂也很快。但是在測(cè)試集上的準(zhǔn)確率比本文模型低了近20%。很容易就能看出,DNN在處理復(fù)雜文本數(shù)據(jù)時(shí)出現(xiàn)了嚴(yán)重的過擬合現(xiàn)象,而LSTM則沒有。RNN網(wǎng)絡(luò)沒有明顯的過擬合現(xiàn)象,但觀察訓(xùn)練過程,其效果沒有LSTM好,而且分類精度也沒有LSTM高。這是因?yàn)镈NN中不存在對(duì)時(shí)序信息處理的結(jié)構(gòu),因而其效果最差。而RNN可以存儲(chǔ)時(shí)序序列歷史信息,能在一定程度上改善時(shí)序序列處理效果,但對(duì)于長(zhǎng)時(shí)間依賴序列,其仍存在一定缺陷。LSTM提出的網(wǎng)絡(luò)使用了LSTM網(wǎng)絡(luò)結(jié)構(gòu),其門結(jié)構(gòu)能夠選擇性地對(duì)數(shù)據(jù)進(jìn)行處理,所以更適用于存在時(shí)間依賴性數(shù)據(jù)的處理任務(wù)。從上述分析可知,本文模型相比于其他兩個(gè)網(wǎng)絡(luò),在文本分類數(shù)據(jù)集上也能有一定的應(yīng)用。
圖17 測(cè)試集loss變化對(duì)比Fig.17 Comparison of loss changes in test set
表5 測(cè)試集分類精度對(duì)比
圖14 訓(xùn)練集準(zhǔn)確率變化對(duì)比Fig.14 Comparison of accuracy changes in train set
圖15 訓(xùn)練集loss變化對(duì)比Fig.15 Comparison of loss changes in train set
圖16 測(cè)試集準(zhǔn)確率變化對(duì)比Fig.16 Comparison of accuracy changes in test set
本文主要研究了巡航導(dǎo)彈突防過程中針對(duì)攔截彈的攔截時(shí)間和攔截點(diǎn)預(yù)測(cè)問題。相比于傳統(tǒng)的建模方法,神經(jīng)網(wǎng)絡(luò)具有自學(xué)習(xí)與自適應(yīng)性強(qiáng)、魯棒性強(qiáng)和容錯(cuò)率高、適用于非線性問題等特點(diǎn),而其中LSTM網(wǎng)絡(luò)又能很好地解決神經(jīng)網(wǎng)絡(luò)中對(duì)于長(zhǎng)時(shí)間依賴序列容易出現(xiàn)的梯度消失或梯度爆炸問題。因此,本文采用基于LSTM網(wǎng)絡(luò)的有監(jiān)督學(xué)習(xí)方法,實(shí)現(xiàn)對(duì)于攔截彈攔截點(diǎn)和攔截時(shí)間的預(yù)測(cè)。將本文方法與現(xiàn)有方法對(duì)比可以看出,本文方法更加適用于長(zhǎng)時(shí)序序列的預(yù)測(cè)問題,且能夠在更少的迭代次數(shù)下得到較高的預(yù)測(cè)精度。
從實(shí)驗(yàn)結(jié)果可以看出,本文所提出的攔截點(diǎn)預(yù)測(cè)模型,無論是從預(yù)測(cè)精度還是適用性都要優(yōu)于已有的模型,能夠更好地實(shí)現(xiàn)對(duì)攔截點(diǎn)和攔截時(shí)間的預(yù)測(cè)。這為后續(xù)的導(dǎo)彈突防工作提供了良好的理論和技術(shù)基礎(chǔ)。