劉顯光,張曉豐,苗青林,高楊軍,秦丕勝
(空軍工程大學裝備管理與無人機工程學院,西安,710051)
隨著世界武器裝備的不斷發(fā)展和各國軍事戰(zhàn)略的調整,航空制導彈藥成為實現作戰(zhàn)目標的重要武器。航空制導彈藥相對于其他彈藥而言具有造價高、數量少和保障要求高等特點,因此對于航空制導彈藥實施精細化保障日益成為軍方關注的焦點。航空制導彈藥使用消耗預測是通過對過往航空制導彈藥在日常戰(zhàn)備值班中的使用壽命消耗數據進行分析,對未來航空制導彈藥使用消耗趨勢展開預測,從而為部隊提前籌劃航空制導彈藥使用計劃提供一定的數據支撐。
對航空制導彈藥使用消耗進行預測通??梢圆扇递斎腩A測和時間序列預測兩種方式。其中,參數輸入預測通過分析航空制導彈藥使用消耗的影響因素,輸入未來時間段內的影響因素參數來預測航空制導彈藥的使用消耗。田德紅等人將訓練次數、訓練天數、出動飛機架次、參與訓練人數以及彈藥儲備量當作輸入參數,分別構建了基于鄰域粗糙集與支持向量機的航空彈藥消耗預測模型[1]和基于變異粒子群優(yōu)化與深度神經網絡的航空彈藥消耗預測模型[2]。愈杰等人利用反向傳播網絡(back propagation, BP)對彈藥需求與打擊目標和毀傷程度等相關因素之間的內在聯系進行仿真分析,揭示了彈藥需求與外部因素的非線性關系[3]。而時間序列預測主要是通過分析航空制導彈藥使用消耗時間序列數據的特征分布,映射出消耗量在時間先后順序上的相關性,并借此預測其未來的發(fā)展趨勢。目前,常用的時間序列預測方法有自回歸移動平滑法(auto-regressive moving average model, ARMA)[4]、灰色理論[5]和神經網絡[6]等。周浩結合GM(1,1) 模型和灰色馬爾可夫模型對航空器材消耗這類隨機時間序列展開預測[7];周一鳴等人根據2007-2016年某型航空彈藥保障裝備器材消耗量的實際數據,建立了航空彈藥保障裝備器材消耗量的二次指數平滑模型[8]。
以上對航空彈藥及保障器材的消耗預測均屬于確定性預測,即通過給出一條確定的點預測曲線來刻畫預測情況。而對航空制導彈藥使用消耗開展預測,必須考慮到其實際條件:一是航空制導彈藥造價高,必須充分利用每枚彈藥的使用壽命,對預測的精度要求更高;二是航空制導彈藥數量少,其使用消耗主要是指在日常戰(zhàn)備值班中等級起飛以及地面檢測中造成的使用壽命消耗,其數據量也相對較少;三是航空制導彈藥的使用消耗受地區(qū)形勢影響強,數據隨機性高。因此,對于航空制導彈藥的使用消耗預測考慮到其數據特點和預測要求,僅給出一條確定性的點預測曲線來準確反映航空制導彈藥使用壽命消耗規(guī)律難以實現[9]。
置信區(qū)間估計是一種常用的不確定性處理手段,它用概率區(qū)間來描述預測值的不確定性,使用置信度來評估預測的可靠性[10]。通過置信區(qū)間估計能更好地涵蓋航空制導彈藥使用消耗預測過程中的不確定性,提升預測結果可信性。本文結合點預測誤差數據對航空制導彈藥的使用消耗進行置信區(qū)間估計,為航空制導彈藥使用消耗提供了一種切實可行的預測方法。
由于支持向量回歸(support vector regression, SVR)模型在非線性、小樣本和隨機性強的數據預測方面表現較好[11],故考慮采用SVR方法對航空制導彈藥的使用消耗情況進行點預測。同時由于SVR模型的參數直接影響預測結果的好壞,利用粒子群優(yōu)化(particle swarm optimization, PSO)算法對SVR模型參數進行尋優(yōu),提高模型的預測性能。
SVR常用來解決小樣本、非線性回歸問題,它在支持向量機(support vector machine, SVM)的基礎上引入松弛變量的方式,按照結構風險最小化原則對數據進行精確擬合。
對于給定的航空制導彈藥歷史使用消耗數據{(x1,y1),(x2,y2),…,(xn,yn)};其中,xi表示第i個時間序列,yi表示第i個時間序列的航空制導彈藥使用消耗情況,則SVR回歸函數為:
y=w·φ(x)+b
(1)
式中:w為權重向量;φ(x)為某一固定的非線性映射;b為偏置量。
按照結構風險最小化原則,則SVR優(yōu)化問題可以轉化為最小化線性風險泛函問題:
yi-wTφ(xi)-b≤ε+ξ
yi-wTφ(xi)-b≤ε+ξ
(2)
式中:wTw表示樣本的復雜程度;c為懲罰系數;ξ和ξ*為松弛因子;ε為不敏感損失系數。利用拉格朗日乘子法,上述問題可以演變?yōu)椋?/p>
(3)
(4)
在SVR預測問題中,需要引入懲罰系數c和核函數參數σ,這些參數的取值對預測結果有很大影響,必須選擇合適的參數來對航空制導彈藥的使用消耗進行預測。
PSO算法思想來源于對鳥類捕食行為的模仿。假設每個個體具有初始的位置x0和速度v0,算法通過跟蹤每個個體與自身最優(yōu)解p和群體最優(yōu)解pg的位置關系來迭代尋優(yōu),粒子迭代過程如下:
(5)
用PSO算法對SVR進行參數尋優(yōu),步驟如下。
Step1初始化粒子群,確定位置參數、粒子速度以及懲罰系數和核函數參數的取值范圍,并設定慣性因子和最大迭代次數。
Step2計算每一個粒子適應度值。由于是對懲罰系數c和核函數參數σ尋優(yōu),所以適應度函數可以選取:
(6)
Step3更新自身最優(yōu)解pi和群體最優(yōu)解pg。利用式(5)和(6)更新粒子的位置、速度和適應度值,將每一個粒子更新后的適應度值與其經過的最好位置pi和所有粒子經過的最好位置pg進行比較,如果優(yōu)于pi和pg,則用該粒子位置代替。
Step4判斷是否達到終止條件。若達到,則輸出全局最優(yōu)解的位置即最優(yōu)懲罰系數c和核函數參數σ;若未達到,則轉至Step 3繼續(xù)迭代。
由于SVR模型的預測精度和航空制導彈藥使用過程中的各種不確定因素,預測結果和實際結果之間往往存在一定誤差,而誤差的累計會對后續(xù)航空制導彈藥的使用決策造成影響。為了規(guī)避不確定因素(航空制導彈藥在使用保障環(huán)節(jié)中的不確定性、日常戰(zhàn)備起飛的消耗時間不確定性和預測模型不確定性等)和累計誤差帶來的影響,全面描述航空制導彈藥使用消耗方面的不確定性,在點預測基礎上利用誤差不確定信息,采取置信區(qū)間估計預測,使未來實際使用消耗值落入某一置信度下的預測區(qū)間內,為后續(xù)彈藥使用決策提供更充足的信息。
航空制導彈藥壽命通常包括日歷壽命和使用壽命。日歷壽命是指航空制導彈藥的儲存年限,隨日歷時間而均勻消耗;使用壽命通常包括通電時間和起落次數,主要是在航空制導彈藥擔負日常戰(zhàn)備值班任務中由于等級起飛和地面檢測產生相應消耗。
由于日常戰(zhàn)備值班任務中等級起飛事件發(fā)生的不確定性,為了客觀描述航空制導彈藥的日常使用消耗情況,以季度為單位統(tǒng)計航空制導彈藥使用壽命消耗數據,在數據整理過程中剔除輪戰(zhàn)消耗、履歷文件缺失和大規(guī)模地面檢測等特殊情形。
以某區(qū)域某時間段航空制導彈藥使用消耗的季度通電時間數據為參考(共收集整理出60個樣本數據,其中選取前50個作為訓練集,后10個作為測試集),對相關數據進行脫密處理后,構建航空制導彈藥使用消耗數據樣本。
采用第1節(jié)中SVR模型和SVR-PSO模型分別對訓練集進行預測,可以得到航空制導彈藥使用消耗預測值與其真實值的預測誤差情況,如圖1所示。
圖1 航空制導彈藥使用消耗點預測誤差對比情況
從圖1中可以看出,PSO算法尋優(yōu)后的SVR模型對真實值擬合效果更好,更能準確反映航空制導彈藥使用壽命消耗情況。
(7)
為了方便對誤差進行統(tǒng)計分析,本文用相對誤差來描述航空制導彈藥使用消耗預測誤差的統(tǒng)計特性,對誤差進行歸一化處理:
(8)
式中:e′為測試集中任意航空制導彈藥使用消耗預測值與其真實值的相對誤差;emin和emax分別為訓練集中所有時間節(jié)點內航空制導彈藥使用消耗預測誤差中最小值與最大值。
使用SVR-PSO模型預測航空制導彈藥使用消耗的誤差分布及相對誤差情況如圖2所示。
(a)誤差分布直方圖
從圖2可知,在某些時間節(jié)點上,點預測誤差波動較大,分析發(fā)現該類時間節(jié)點的誤差波動是由于上級機關安排及地區(qū)形勢變化所引起。該類樣本點雖然會影響點預測模型的預測性能,但其可以進一步說明預測過程中的不確定性,為后續(xù)區(qū)間預測提供更多的不確定預測誤差邊界信息。
一般來說,預測誤差服從一定的數學分布規(guī)律,真實值往往在預測值周圍分布。而要計算航空制導彈藥使用消耗預測的誤差概率分布,第一步往往是確定其誤差概率密度曲線[12]。
求解概率密度曲線的方法可以分為參數估計和非參數估計[13]。其中,參數估計需先假定航空制導彈藥使用消耗預測誤差服從某一特定數學模型,再用已知樣本估計參數,常用的數學模型包括正態(tài)分布、β分布和極值分布等。非參數估計不需要事先假定模型,而是直接根據已知樣本信息估計航空制導彈藥的使用消耗預測誤差的概率密度,因而非參數方法比參數法更能反映樣本的真實情況,常用的非參數估計有最近鄰函數法、核密度估計法和樣條函數法等。
分別使用參數估計法和非參數估計法對航空制導彈藥使用消耗預測誤差數據進行概率密度曲線擬合,誤差擬合結果見圖3。
圖3 不同估計方法概率密度估計曲線
由圖3可知,由于航空制導彈藥預測誤差數據兩端存在一定的波峰分布(點預測過程中預測誤差波動較大的時間節(jié)點),與參數估計中事先假定的數學分布存在較大偏差,非參數估計法對上述航空制導彈藥預測誤差數據的擬合程度優(yōu)于其他參數估計法,能更好的反映航空制導彈藥使用消耗預測誤差數據的概率密度分布情況。核密度估計法(kernel density estimation, KDE)是一種利用核函數基于有限數據元來評估總體數據分布的非參數估計法,其基于誤差的核密度估計表達式為:
(9)
式中:h為帶寬;N為樣本數;ei為航空制導彈藥使用預測誤差樣本;K(·)為指定核函數,主要有高斯核函數、三角核函數和Box核函數等。
對核密度估計法而言,性能的好壞主要是由選取的核函數類型和帶寬取值決定的。當數據樣本量足夠大時,核函數類型選取對估計結果影響不大。而對于帶寬取值而言,必須綜合考慮擬合度和光滑性,帶寬過大或過小都會影響最終結果的估計精度[14]。從期望積分平方誤差(mean intergrated squared error, MISE)最小的角度可以求得最佳帶寬h:
(10)
(11)
(12)
當核函數和樣本數量確定之后,就可以得到最佳帶寬h。
使用核密度估計法進行誤差區(qū)間預測時,一般根據核密度概率函數,給定置信度1-η來求解置信區(qū)間。具體求解過程可參考文獻[15],最終得到預測置信區(qū)間:
(13)
式中:el和eu分別表示置信度為1-η時的誤差下限和上限:
(14)
式中:F-1(·)為累計概率分布函數的反函數,即對于F-1(λ)有P{x≤F-1(λ)}=λ。
對于核密度估計法而言,第2.3節(jié)中選擇置信區(qū)間通常采用對稱概率區(qū)間,即α1=η/2、α2=1-η/2。但實際上α1和α2的取值并不唯一,給定任一置信度對應著無數個置信區(qū)間選擇。當預測概率密度曲線不是對稱或單峰時,對稱概率區(qū)間往往不是最合適的置信區(qū)間,尤其在現代許多時間序列預測模型中,時間序列呈現非線性或非正態(tài)分布,此時,預測概率密度通常也是非對稱或多模態(tài)的。在這種情形下,使用最高密度域法(highest-density regions, HDRs)可以得到更為合適的預測區(qū)間[16]。
由2.3節(jié)中核密度估計法對航空制導彈藥使用消耗預測誤差進行估計,可以得到其概率密度曲線圖4(核函數為高斯核函數,帶寬h=4.579 1),可以看出其分布不是對稱或單峰分布,此時適合采用HDRs來選擇置信區(qū)間。
圖4 航空制導彈藥使用消耗預測概率密度曲線
最高密度域是指給定置信度下所占據密度最高的區(qū)域[17],通常滿足:①在給定置信度的置信區(qū)間內,HDRs占據樣本空間最??;②HDRs內點的函數值不小于該區(qū)域外點的函數值。由此可得在置信度為1-η時,其最高密度域選取置信區(qū)間為:
Rη={x:fX(x)≥fη}
(15)
式中:fη為滿足P{X∈Rη}≥1-η的最大值。
由于HDRs占據樣本空間最小,當給定置信度1-η時,只要計算出fη,就可以得出最高密度域的范圍[17]。根據HDRs占據最小樣本空間和密度最高的特點,利用HDRs選擇置信區(qū)間可以為航空制導彈藥使用消耗預測提供更為精確具體的預測區(qū)間。
以第2.1節(jié)中航空制導彈藥使用消耗數據為研究對象,采用MATLAB R2019a對數據進行實驗分析。
考慮不確定因素的航空制導彈藥使用消耗預測最終是要為決策者提供未來一段時間內航空制導彈藥的使用消耗可能情況,即航空制導彈藥使用消耗預測的悲觀值(置信區(qū)間上限)、理想值(點預測值)和樂觀值(置信區(qū)間下限)。因此,對于預測效果的評價應分別考慮理想值預測(點預測)和區(qū)間預測結果的好壞,采用以下3個指標來對航空制導彈藥使用消耗預測進行評價。
1)均方誤差(mean squred error, MSE。式中簡記EMSE)。表示預測值與真實值之間的差異程度,其值越小,表明點預測模型預測精度越高:
(16)
2)決定系數(R-Square)。 用來判斷點預測模型對數據的擬合效果,其值越大,表明其擬合效果越好:
(17)
3)單位區(qū)間覆蓋率(coverage per unit interval, CPUI)。表示給定置信度下置信區(qū)間對真實值的覆蓋情況與區(qū)間寬度的比值,其值越大,說明區(qū)間預測模型的單位區(qū)間覆蓋率越高:
(18)
為了驗證SVR模型對航空制導彈藥歷史使用消耗數據的預測效果,將其與BP神經網絡[18]和ARMA模型[17]進行對比實驗。其中,BP神經網絡和ARMA模型參數設置見表1。
表1 模型參數設置
ARMA模型中p、q參數的確定是基于BIC(式中簡記為CBIC)準則(Bayesian information criterion, BIC)確定:
CBIC=lnn-2lnm
(19)
式中:n為模型中參數的個數;m為模型的極大似然函數值。
利用這3類模型在測試集中對航空制導彈藥使用消耗情況的預測結果來比較模型預測效果,預測結果如圖5所示。
圖5 測試集模型預測性能對比情況
從圖5可以看出,BP神經網絡和SVR-PSO擬合效果相較于ARMA模型預測效果較好,這說明對于非線性,小樣本和隨機性強的數據而言,ARMA表現欠缺,進一步比較預測性能指標MSE和R2的結果見表2。
表2 點預測評價結果
從這兩個性能指標數值來看,SVR-PSO模型對于航空制導彈藥使用消耗數據而言,預測精度優(yōu)于其他兩種模型。因此,在SVR-PSO模型的基礎上對航空制導彈藥使用消耗開展不確定性預測可以得到更為合適的理想區(qū)間。
按照2節(jié)中所述方法對航空制導彈藥使用消耗進行區(qū)間預測。
給定置信度1-η=75%時,對SVR模型分別選取概率對稱區(qū)間和最高密度域,將得到的置信區(qū)間同BP神經網絡以及ARMA模型結合最高密度域得到的置信區(qū)間進行區(qū)間預測效果對比,預測結果如圖6、表3所示。
(a)SVR置信度75%對稱概率預測區(qū)間
表3 區(qū)間預測評價結果
從圖6和表3中可以看出通過最高密度域選取的置信區(qū)間與對稱概率區(qū)間相比,在保證預測覆蓋率的前提下盡可能減少了區(qū)間的寬度,從而縮小了航空制導彈藥使用消耗區(qū)間預測的不確定性;同時,由單位區(qū)間覆蓋率可以看出,SVR-HDRs在航空制導彈藥使用消耗數據預測方面相較其他模型性能更好。
近年來,由于缺少對航空制導彈藥的使用壽命消耗預測研究,隨著戰(zhàn)備強度的不斷提升,航空制導彈藥使用消耗需求日益增大,航空制導彈藥在使用安排上矛盾問題突出,造成航空制導彈藥實際使用壽命浪費。本文結合航空制導彈藥歷史使用消耗數據特點開展預測,提供了一種科學合理的航空制導彈藥使用消耗預測方法,為后續(xù)航空制導彈藥使用安排提供了理論借鑒,主要結論如下:
1)SVR-PSO對于小樣本、非線性和隨機性強的航空制導彈藥使用消耗數據而言,相較其他時間序列預測模型預測性能更好;
2)在點預測的基礎上,從誤差不確定性的角度出發(fā),給出了能夠反映未來航空制導彈藥使用消耗的概率性預測區(qū)間,為后續(xù)制定彈藥使用計劃提供了理論參考;
3)依據HDRs理論對核密度估計中的區(qū)間選擇進行優(yōu)化。結果表明HDRs選擇的置信區(qū)間,在指定置信度下可以得出更小的區(qū)間寬度并同時擁有相對更好的區(qū)間覆蓋率。
本文給出了航空制導彈藥使用消耗的點預測模型以及利用誤差數據的區(qū)間預測模型,但在航空制導彈藥使用消耗預測過程中,僅考慮誤差不確定性不足以反映航空制導彈藥使用消耗預測過程中的不確定性,后續(xù)應當考慮更多因素,優(yōu)化預測模型,提供更為科學合理的預測結果。