張 磊,吳 昊,趙 強,王 幸,任新見,王繼民,孔德鋒
(1.軍事科學院國防工程研究院工程防護研究所,河南 洛陽 471023;2.軍事科學院,北京100071;3.河海大學計算機與信息學院,江蘇 南京211100)
武器毀傷效應是攻防雙方都十分關注的基礎性和共性的問題,對武器的研制、目標的防護設計、易損性研究和毀傷評估都具有舉足輕重的作用,是承接“進攻-防守-評估”作戰(zhàn)要素的核心環(huán)節(jié)。武器毀傷效應的主要研究手段包括實驗研究、理論分析和數(shù)值模擬[1],其中解析法一般需對毀傷過程做一定的簡化假定,只能適用于簡單條件;數(shù)值模擬則過度依賴于算法和模型,參數(shù)多且計算速度慢,無法滿足實戰(zhàn)要求;實驗研究是最可靠、最常用的手段。盡管隨著國防事業(yè)的發(fā)展,我國科研人員已經(jīng)積累了一定數(shù)量的實驗數(shù)據(jù)(包括訓練、演習和實戰(zhàn)等數(shù)據(jù))、經(jīng)驗算法和毀傷判據(jù)等效應數(shù)據(jù),但現(xiàn)有數(shù)據(jù)仍存在離散性大、數(shù)據(jù)缺失、數(shù)量少、噪聲大、分布不均勻、不連續(xù)、分布范圍窄等缺點,無法支撐毀傷效應計算和評估所需,其需要建立足夠精度、寬域分布且連續(xù)的毀傷譜。數(shù)據(jù)挖掘技術的出現(xiàn)為此類問題的解決提供了可行途徑,數(shù)據(jù)挖掘通常又稱“數(shù)據(jù)中的知識發(fā)現(xiàn)”,是從大量的、有噪聲的、不完全的、不連續(xù)的、模糊的、隨機的實測數(shù)據(jù)中提取有效的、新穎的、潛在有用的信息的過程,是將數(shù)據(jù)變成有價值信息的過程[2]。近年來數(shù)據(jù)挖掘技術已經(jīng)在工業(yè)意外爆炸、高速穿甲、裝甲防護等領域中得到應用。He等[3]首次將過程挖掘技術應用于煤礦瓦斯爆炸事故的緊急救援領域,將2006年至2014年下半年期間我國煤礦發(fā)生的50起重大瓦斯爆炸事故作為日志數(shù)據(jù),利用過程挖掘技術提取應急救援模型并在緊急事故救援中得到成功應用。Ryan 等[4]開發(fā)了一種多層感知器體系結構人工神經(jīng)網(wǎng)絡模型用于預測鋁質(zhì)彈丸超高速撞擊Whipple防護盾的貫穿極限,利用769次沖擊試驗數(shù)據(jù)訓練神經(jīng)網(wǎng)絡模型,預測精度達92%,高于經(jīng)驗方法的71%準確率。Ryan 等[5]還分析了超高速撞擊Whipple防護盾的研究中,傳統(tǒng)人工神經(jīng)網(wǎng)絡在類似高維空間問題研究中的不足(特別是當試驗樣本不足、分布范圍窄且分布不均勻時,人工神經(jīng)網(wǎng)絡預測精度會大大降低),并提出一種通過最少量額外實驗數(shù)據(jù)來補救采樣不良的參數(shù)空間影響的算法。李建光等[6]利用RBF神經(jīng)網(wǎng)絡模型對混凝土侵徹深度進行預測。金勝兵等[7]利用數(shù)據(jù)挖掘技術進行了混凝土靶標侵徹深度的預測,綜合了k-近鄰(k-nearest neighbor,KNN)算法與BP神經(jīng)網(wǎng)絡模型,提高了現(xiàn)有神經(jīng)網(wǎng)絡模型的預測精度。
在現(xiàn)代戰(zhàn)爭中,大量具有戰(zhàn)略價值的目標被移入地下,依靠高抗力地下防護結構抵御來襲武器毀傷。為提高對地下目標的毀傷能力,鉆地武器研發(fā)和應用發(fā)展迅速。鉆地武器依靠動能來穿透防護層、鉆入工程內(nèi)部或侵徹到地下一定深度后爆炸,從而對目標產(chǎn)生毀傷,近年來在實際戰(zhàn)場中得到多次應用。因此,常規(guī)鉆地武器對地下目標的毀傷效應和毀傷評估一直是研究熱點。楊秀敏等[8]曾對鉆地武器破壞效應的研究現(xiàn)狀和發(fā)展進行了系統(tǒng)的論述,指出常規(guī)鉆地彈毀傷效應包括侵徹效應和爆炸效應,其中爆炸效應包括巖土介質(zhì)中的沖擊波(即地沖擊)和空氣沖擊波帶來的兩方面效應,研究結果表明:由于鉆地武器對地下目標毀傷效應的復雜性,以實驗數(shù)據(jù)為基礎的經(jīng)驗統(tǒng)計方法具有重要作用。張國星等[9]就鉆地彈侵徹地下工程目標研究現(xiàn)狀進行了綜述,分析了實驗研究、解析方法和數(shù)值模擬的優(yōu)缺點,并指出實驗方法是其中最為成熟的方法,同時也指出數(shù)值模擬方法也是重要的技術手段之一,但計算速度仍限制了其應用。此外,文獻[10-11]利用數(shù)值模擬進行了鉆地武器對地下工程目標的毀傷效應分析和評估,討論了影響毀傷效應的主要戰(zhàn)斗部參數(shù)和目標參數(shù)。綜上所述,在鉆地武器對地下目標毀傷的研究中,特別是在實戰(zhàn)條件下需要對戰(zhàn)場目標的毀傷進行快速評估的情形,實驗研究以及以此為基礎的經(jīng)驗方法是一種重要的技術途徑。
目前通過數(shù)據(jù)挖掘進行毀傷效應分析,主要是基于實驗數(shù)據(jù)建立各種淺層或深層網(wǎng)絡預測模型,但是現(xiàn)有實驗數(shù)據(jù)存在離散性大、缺失明顯、數(shù)量少、數(shù)據(jù)噪聲大、樣本分布不均勻、不連續(xù)、分布范圍窄等缺點,以至于訓練出來的模型無法滿足參數(shù)域的需要。本文針對鉆地武器對地下工程目標的毀傷,構建基于效應試驗和經(jīng)驗算法融合的數(shù)據(jù)挖掘毀傷效應算法:以效應源數(shù)據(jù)為基礎,通過數(shù)據(jù)異常分析算法剔除數(shù)據(jù)異常點,建立毀傷源數(shù)據(jù)庫;針對經(jīng)驗算法適用范圍有限、計算精度不統(tǒng)一等局限性,建立經(jīng)驗算法評價方法,分析不同參數(shù)域內(nèi)最適用的經(jīng)驗算法;利用實驗數(shù)據(jù)建立神經(jīng)網(wǎng)絡預測模型;在此基礎上建立基于k-近鄰算法、經(jīng)驗算法和BP神經(jīng)網(wǎng)絡模型的毀傷效應“三階段”算法進行鉆地武器對地下工程目標毀傷效應計算。
源數(shù)據(jù)蘊涵分析對象運行的客觀規(guī)律,其完整性和可靠性是確保數(shù)據(jù)挖掘能否進行以及挖掘結果能否正確的前提,因此,源數(shù)據(jù)是數(shù)據(jù)挖掘的基礎和核心。以鉆地武器對地下工程目標毀傷效果評價為例,分析過程中所需源數(shù)據(jù)包括圖1所示的數(shù)據(jù)種類。
圖1 地下工程目標毀傷評估源數(shù)據(jù)結構Fig.1 Structure of source data for underground engineering target damage assessment
在源數(shù)據(jù)中,由于實驗條件的差別、量測技術和標準的差異、實驗誤差、人為因素以及記錄和數(shù)據(jù)錄入失誤等不可避免的因素,會導致一些樣本不符合數(shù)據(jù)模型的一般規(guī)則,或者與其他樣本存在較大的偏差,這樣的樣本即為“數(shù)據(jù)異常點”。異常數(shù)據(jù)會降低一些數(shù)據(jù)挖掘算法的效率,可能會在數(shù)據(jù)模型中引入非正態(tài)分布或其他的數(shù)據(jù)復雜性,從而很難以可行的計算方式找到準確的數(shù)學模型。因此,必須對進入數(shù)據(jù)庫的源數(shù)據(jù)進行數(shù)據(jù)異常點的檢測和清除。考慮到毀傷源數(shù)據(jù)維度高、各維度量綱和尺度不一致,且各個維度變量存在相互關聯(lián)性等特征,選用馬氏距離(Mahalanobis distance,記為di)作為數(shù)據(jù)異常性判斷參數(shù),計算各數(shù)據(jù)與數(shù)據(jù)集均值的距離,距離均值超過± 3σ的數(shù)據(jù)點認為是異常數(shù)據(jù)。
式中:μ為均值向量,S 為協(xié)方差矩陣。圖2為數(shù)據(jù)庫中456個混凝土侵徹深度試驗數(shù)據(jù)樣本在剔除異常點前后馬氏距離分布頻率對比,在剔除16個與平均值相差超過± 3σ數(shù)據(jù)點后,保留下的440個數(shù)據(jù)樣本離散性明顯減小,其分布也更為吻合正態(tài)分布特征,選取這些數(shù)據(jù)樣本能有效消除偶然因素引起的數(shù)據(jù)異常,提高預測精度。
圖2 數(shù)據(jù)樣本頻率分布圖Fig.2 Frequency distribution of data sample
實驗研究盡管存在成本高、數(shù)據(jù)不連續(xù)以及適用范圍有限等缺點,但以此為基礎所建立的經(jīng)驗公式,往往在實驗數(shù)據(jù)范圍內(nèi)具有較高的預測精度,且其形式簡單,可根據(jù)幾個有限的控制參數(shù)快速給出能滿足實際工程精度需求的預測結果。但經(jīng)驗算法也存在明顯的不足,經(jīng)驗算法是根據(jù)大量現(xiàn)場或?qū)嶒灉y試數(shù)據(jù),借助回歸、擬合等統(tǒng)計分析方法建立,由于現(xiàn)場或?qū)嶒灉y試數(shù)據(jù)都是在某些環(huán)境因素下得到的,因而具有一定的適用范圍或應用條件。如何評價這些算法在不同參數(shù)范圍內(nèi)的優(yōu)劣,是得到相對準確預測結果的前提。
本文采用如圖3所示的算法流程進行經(jīng)驗算法適用性判別。首先計算經(jīng)驗算法與實驗數(shù)據(jù)樣本的平均相對偏差,以與實驗樣本偏差小的算法作為最優(yōu)算法;如果實驗數(shù)據(jù)樣本不足,再利用多個經(jīng)驗算法生成“偽效應試驗數(shù)據(jù)”,計算不同經(jīng)驗算法之間的相對偏差,以相對偏差小的算法作為最佳算法;如果通過以上兩個流程仍無法確定最佳算法時,則利用專業(yè)知識進行判斷,分別從理論分析和使用者評價兩個角度去判斷算法優(yōu)劣。
圖3 經(jīng)驗算法評價流程Fig.3 Evaluation process of empirical algorithms
BP神經(jīng)網(wǎng)絡是應用最廣泛的神經(jīng)網(wǎng)絡模型之一,其模型結構簡單且具有強大的非線性映射能力,幾乎可逼近所有非線性系統(tǒng)。它包括一個輸入層、若干個隱藏層和一個輸出層,輸入層和輸出層的節(jié)點數(shù)可以根據(jù)數(shù)據(jù)集的輸入輸出進行調(diào)整,隱藏層的層數(shù)和節(jié)點數(shù)可以根據(jù)訓練的需要進行調(diào)整,同一層上節(jié)點不相互連接,層與層之間的神經(jīng)元相互連接,網(wǎng)絡中每一個節(jié)點都是一個獨立的神經(jīng)元。
BP神經(jīng)網(wǎng)絡的訓練過程是一個全局優(yōu)化的問題,通過最小化損失函數(shù),可以得到最優(yōu)的網(wǎng)絡參數(shù),它的訓練過程由信號的正向傳播與反向誤差傳播兩個部分組成。
式中:pi為預測的效應值,ti為樣本效應值,n為樣本數(shù)。
(2)在誤差反向傳播階段,誤差從輸出層輸入,然后沿著梯度下降的方向向隱藏層和輸入層逐層返回,并修改每一層神經(jīng)元的權值和偏置項。當誤差減少到可以接受的程度或訓練達到指定的次數(shù)時,則模型訓練停止[13]。
鉆地武器對地下工程毀的傷過程涉及侵徹貫穿、空氣沖擊波、爆炸震動和爆炸震塌等不同的毀傷效應,需對每個毀傷效應分別設計神經(jīng)網(wǎng)絡模型。為消除不同特征單位差異對模型的影響,對各效應的主要控制參數(shù)進行無量綱化:
式中: x1,x2,···,xn和Y 為無量綱化量。無量綱化可以消除各變量之間的相關關系,同時減少模型輸入變量,降低維度。
(1)模型輸入層
模型輸入為無量綱化產(chǎn)生的控制參數(shù)向量( x1,x2,···,xn)。
(2)模型隱藏層
Fletcher 等[14]的研究表明:一般三層的神經(jīng)網(wǎng)絡就可以逼近任意的函數(shù),而增加隱藏層的數(shù)量可以顯著提高模型的預測精度,但同時也會使得模型計算更加復雜,模型訓練需要更多的時間,一般可采用經(jīng)驗公式計算隱藏層的數(shù)量。本文利用下式確定隱藏層的層數(shù):
式中:N 為輸入層節(jié)點數(shù)量。在確定隱藏層的數(shù)量之后,對于每層的神經(jīng)元節(jié)點數(shù)目的確定目前沒有較好的公式或方法可以參考,實際研究中一般使用人工試錯法和經(jīng)驗法進行結合來確定。
(3)模型輸出層
輸出層神經(jīng)元個數(shù)為1,表示輸出的效應量,即式(3)中的Y。
模型激活函數(shù)選用Relu 矯正線性單元激活函數(shù),結合數(shù)值試驗調(diào)整學習速率為0.05,既能保證訓練的速度,又能保證模型的穩(wěn)定性和精確度。
(1)實驗方法
(2)實驗數(shù)據(jù)
從源數(shù)據(jù)庫中抽取實驗數(shù)據(jù)837條,并通過異常分析剔除異常數(shù)據(jù),最后用于建模的數(shù)據(jù)為815條,其中570條作為訓練集,245條作為驗證集。
(3)實驗結果及分析
BP 神經(jīng)網(wǎng)絡和BRL、Young、NDRC和Forrestal經(jīng)驗算法[15-18]計算后的在驗證集上的MAPE 指標見表1。由于所選取的測試集為隨機從效應數(shù)據(jù)庫中抽取,樣本分布比較離散,部分區(qū)間樣本點會超出經(jīng)驗公式適用范圍,從而導致經(jīng)驗算法整體預測效果不佳,而BP神經(jīng)網(wǎng)絡在測試集上的MAPE明顯比其他四個經(jīng)驗公式要低,其預測的總體效果要略優(yōu)于其他四個經(jīng)驗公式。
表1 經(jīng)驗算法和BP 神經(jīng)網(wǎng)絡模型MAPE值Table 1 MAPE valuesof empirical algorithms and BP neural network model
“三階段”數(shù)據(jù)挖掘算法充分利用了源數(shù)據(jù)、經(jīng)驗算法以及BP神經(jīng)網(wǎng)絡模型的各自優(yōu)點計算毀傷效應,可提高不同參數(shù)區(qū)間的效應預測準確率。“三階段”法的基本思想為:如果輸入?yún)?shù)與源數(shù)據(jù)(實驗數(shù)據(jù))中的樣本接近,則認為通過實驗結果即可給出可靠的效應預測;如果輸入?yún)?shù)在經(jīng)驗算法的適用范圍,則利用經(jīng)驗算法可得比較準確的計算結果;否則,利用實驗數(shù)據(jù)組成訓練樣本,通過BP神經(jīng)網(wǎng)絡充分挖掘數(shù)據(jù)中的規(guī)律,利用神經(jīng)網(wǎng)絡模型給出預測結果?!叭A段”法的具體步驟為:首先采用k-近鄰算法從源數(shù)據(jù)中檢索與輸入?yún)?shù)相似的效應過程,結合專業(yè)知識判斷效應結果的合理性;若計算結果不滿足要求,則從該參數(shù)區(qū)間中選擇最優(yōu)經(jīng)驗算法進行效應計算;若上述兩種方法都無法給出合理結果,采用BP神經(jīng)網(wǎng)絡進行效應預測。流程如圖4所示。
圖4 “三階段”法毀傷效應數(shù)據(jù)挖掘流程Fig.4 Flow of damageeffect data mining based on “three steps”
相近的輸入?yún)?shù),其對應的效應預測輸出結果應該是相似的,因此采用k-近鄰算法[19]從源數(shù)據(jù)中檢索與輸入?yún)?shù)相似的k 個記錄,并按照與輸入?yún)?shù)距離的遠近排列輸出,供用戶判斷。
(1)毀傷效應主要控制參數(shù)
毀傷效應影響因素繁多,直接采用所有影響因素進行k-近鄰檢索會由于“維度災難”導致檢索效率低下以及結果不準確,因此需要對參與計算的數(shù)據(jù)進行降維。常用的數(shù)據(jù)降維方法有特征選擇和特征提取,其中特征選擇也稱特征子集選擇或?qū)傩赃x擇,是指從已有的M 個特征中選擇N 個特征使得特定指標最優(yōu)化,是從原始特征中選擇出一些最有效特征以降低數(shù)據(jù)集維度的過程;而特征提取是指利用已有的M 個特征計算出一個抽象程度更高的包含M 個新特征的特征集,并從中選擇N 個重要的子特征,最終被選中的每個特征都是原始M 個特征的線性或非線性組合。本文采用特征選擇進行數(shù)據(jù)降維。由于源數(shù)據(jù)實際采集的數(shù)據(jù)特征有限,而且一般常用經(jīng)驗算法已經(jīng)比較全面地考慮了不同控制參數(shù)對效應的影響,因此,本文根據(jù)專業(yè)知識以及常用經(jīng)驗算法的控制變量來進行人工特征選擇,確定毀傷效應的主要控制參數(shù)以達到數(shù)據(jù)降維的目的。以混凝土侵徹深度為例,通過人工選擇,確定主要控制參數(shù)包括彈體質(zhì)量、彈體直徑、靶標強度、靶標密度和著靶速度等。
(2)相似度量函數(shù)
圖5 基于KNN 的相似檢索流程圖Fig.5 Flow chart of similar searching based on KNN
如果輸入?yún)?shù)在實驗數(shù)據(jù)附近,那么直接通過檢索到的實驗數(shù)據(jù)就可以給出比較準確的效應計算結果;如果輸入?yún)?shù)距離實驗數(shù)據(jù)較遠,即使檢索到輸入?yún)?shù)的k-近鄰算法也無法得到準確的效率計算結果。為此,就需轉(zhuǎn)入第2步:基于經(jīng)驗算法的毀傷效應計算。
利用輸入?yún)?shù)所在參數(shù)區(qū)間的最優(yōu)經(jīng)驗算法進行效應計算,并人工進行結果的有效性判斷。如現(xiàn)有經(jīng)驗算法無法適用或計算精度較低,則轉(zhuǎn)入第3步:基于BP神經(jīng)網(wǎng)絡模型的毀傷效應計算。
根據(jù)鉆地武器對地下坑道工程目標毀傷過程,模型所涉及的毀傷效應算法主要包括:巖石靶標侵徹深度算法、混凝土靶標侵徹深度算法、土靶標侵徹深度算法、分層巖土介質(zhì)靶標侵徹深度算法、坑道內(nèi)空氣沖擊波效應算法、爆炸震塌效應算法和爆炸震動效應算法。對每一類算法,通過圖3所示的算法評價流程,給出參數(shù)區(qū)間最優(yōu)算法作為模型算法。
由于實驗數(shù)據(jù)分布范圍有限,經(jīng)驗算法的適用范圍、計算精度有限,以及復雜效應經(jīng)驗算法尚有明顯缺失。因此,在前兩者都無法給出合理結果的情況下,利用BP神經(jīng)網(wǎng)絡模型進行計算,給出毀傷效應計算結果。具體建模過程已在第3節(jié)進行介紹。
鉆地戰(zhàn)斗部對地下工程目標毀傷是由侵徹和貫穿、爆炸震動和爆炸震塌、空氣沖擊波等多個有著前后順序的過程組成,每個獨立的過程對應一種毀傷元的毀傷效應。對每個過程都采用“三階段”法進行計算,并根據(jù)上一過程的計算結果確定下一個過程的初始條件,所需主要參數(shù)和毀傷計算流程見圖6。根據(jù)以上計算流程,開發(fā)計算軟件。
經(jīng)人工特征選擇后確定的主要輸入?yún)?shù)如表2所示,主要包括彈體參數(shù)、著靶參數(shù)、坑道結構以及圍巖和襯砌材料特性等參數(shù),其中彈體參數(shù)可根據(jù)戰(zhàn)斗部型號由計算軟件從底層數(shù)據(jù)庫中自動讀入,坑道類型、圍巖材料種類和襯砌材料種類根據(jù)模型所提供的參數(shù)選擇。
計算軟件采用圖6中的計算流程,首先根據(jù)彈體參數(shù)、著靶參數(shù)和圍巖及襯砌材料等參數(shù),計算彈體侵徹深度。通過“三階段”算法,模型調(diào)用經(jīng)驗算法計算侵徹深度,計算結果為1.99 m。根據(jù)侵徹深度計算結果、彈著點坐標、防護層厚度等參數(shù),判斷爆心位置為“坑道頂部防護層內(nèi)爆炸”。根據(jù)圖6的計算流程,需要計算防護層爆炸震塌以及爆炸震動毀傷,爆炸震塌采用“三階段”算法選用經(jīng)驗算法,計算結果表明不會產(chǎn)生爆炸震塌;爆炸震動毀傷由于無相臨近實驗數(shù)據(jù),無法采用k-近鄰算法,同時現(xiàn)有工程算法在適用范圍上無法滿足需求,因此模型會調(diào)用爆炸震動神經(jīng)網(wǎng)絡模型進行計算。
圖6 地下工程毀傷效應計算流程圖Fig.6 Calculation flow chart of damageeffect to underground engineering
表2 地下工程毀傷計算所需主要控制參數(shù)Table2 Main control parametersrequired for damage calculation of underground engineering
本文以毀傷效應試驗數(shù)據(jù)庫為基礎,采用數(shù)據(jù)挖掘技術,實現(xiàn)了鉆地武器對地下坑道工程目標毀傷效應的快速計算。取得的主要研究成果如下:
(1)針對常規(guī)武器對地下工程目標毀傷實驗數(shù)據(jù)的特點,建立了基于馬氏距離的數(shù)據(jù)異常檢測算法,實現(xiàn)了對源數(shù)據(jù)的甄別、分析和清洗,提高了數(shù)據(jù)挖掘計算結果的可靠性;
(2)針對毀傷效應控制因素多、精確匹配檢索數(shù)據(jù)困難的情況,采用相似搜索技術檢索高維空間中與預測輸入向量相似的實驗源數(shù)據(jù),提高了實驗數(shù)據(jù)匹配率,保證了充分優(yōu)先利用大量的真實實驗數(shù)據(jù),提高預測精度;
(3)建立了地下工程目標毀傷效應分析的“三階段”算法,利用實驗數(shù)據(jù)、工程算法和神經(jīng)網(wǎng)絡模型進行毀傷效應計算,特別是在缺少工程算法的情況下,“三階段”算法可利用現(xiàn)有實驗數(shù)據(jù)建立神經(jīng)網(wǎng)絡模型進行計算,從而實現(xiàn)基于實驗數(shù)據(jù)驅(qū)動的毀傷效應分析。