孫繩山,徐常凱,何亞群
(1.空軍勤務(wù)學(xué)院研究生大隊(duì),徐州 221000;2.空軍勤務(wù)學(xué)院航材四站系,徐州 221000)
航材消耗預(yù)測,作為航材保障工作中的重要一環(huán),是根據(jù)航材歷史保障數(shù)據(jù),預(yù)估和推測航材供應(yīng)未來的消耗量和變化趨勢[1]。近年,臺(tái)海、南海、中印等國際周邊局勢不確定性增強(qiáng),飛機(jī)飛行訓(xùn)練、演習(xí)演練頻次增加,空軍航空兵部隊(duì)保障壓力增大,這就對航材消耗預(yù)測工作提出了新的、更高的要求。航材庫存儲(chǔ)備數(shù)量過多,占用航材保障經(jīng)費(fèi),造成庫存積壓;反之,航材庫存儲(chǔ)備數(shù)量過低,易導(dǎo)致飛機(jī)缺材停飛,后果不堪設(shè)想。準(zhǔn)確把握航材消耗數(shù)量,能夠更好地服務(wù)于飛機(jī)的飛行訓(xùn)練,提升航材保障的軍事效益和經(jīng)濟(jì)效益。
當(dāng)前,航材庫存結(jié)構(gòu)的不合理導(dǎo)致大量航材經(jīng)費(fèi)積壓,嚴(yán)重影響航材保障任務(wù)的深入開展,結(jié)合航材保障歷史數(shù)據(jù),合理預(yù)測航材消耗數(shù)量一直以來備受關(guān)注。
有關(guān)航材消耗預(yù)測問題,許多學(xué)者從不同角度進(jìn)行了深入研究。有的學(xué)者從航材消耗數(shù)據(jù)本身出發(fā)展開研究。左山等[2]通過簡單的移動(dòng)平均法預(yù)測了航材需求,易于操作,便于實(shí)現(xiàn)。賈治宇等[3]運(yùn)用差分自回歸移動(dòng)平均模型(Autoregressive integrated moving average model,ARIMA)差分處理航材消耗率,預(yù)測結(jié)果與移動(dòng)平均法相比較證明了模型的有效性和可行性。劉信斌等[4]進(jìn)一步研究具有周期性特點(diǎn)的航材消耗數(shù)據(jù),對原始消耗數(shù)據(jù)常規(guī)差分處理和季節(jié)差分處理轉(zhuǎn)化為平穩(wěn)序列,借助SPSS軟件實(shí)現(xiàn)了航材需求預(yù)測。畢釗等[5]通過貝葉斯和模糊軟集合確定ARIMA和支持向量機(jī)(Support vector machine,SVM)的組合預(yù)測權(quán)重,實(shí)例分析表明,組合權(quán)重的方法能夠降低單一航材消耗預(yù)測的誤差。郭峰等[6]選取了10項(xiàng)航材6年內(nèi)的消耗數(shù)據(jù),采用1次指數(shù)平滑、2次指數(shù)平滑、3次指數(shù)平滑三種方法預(yù)測航材消耗。實(shí)例分析表明,3種分析方法綜合運(yùn)用效果優(yōu)于任何一種單一方法預(yù)測。史永勝等[7]構(gòu)建了3次指數(shù)平滑法的航材需求預(yù)測模型,借助粒子群算法(Particle swarm optimization,PSO)在空間內(nèi)尋優(yōu),提高預(yù)測精度。
有的學(xué)者從影響航材消耗的因素出發(fā),通過分析航材消耗的影響因素與其內(nèi)在的關(guān)聯(lián),分析預(yù)測航材消耗。李文強(qiáng)等[8]提出運(yùn)用偏最小二乘法解決小樣本、多變量的無人機(jī)航材需求問題,文中介紹了建模的原理、步驟,實(shí)例分析結(jié)果表明,該法可以應(yīng)用于新機(jī)航材庫存預(yù)警,針對新機(jī)樣本數(shù)量少的特點(diǎn),指導(dǎo)新機(jī)航材庫存管理工作。張揚(yáng)等[9]通過粗糙集(Rough set,RS)和層次分析法計(jì)算各個(gè)影響因素的權(quán)重,用以改進(jìn)灰色模型預(yù)測航材消耗,提高了航材預(yù)測精度。魏崇輝等[10]率先使用RS屬性約簡的方法約簡影響航材消耗的冗余因素,并與神經(jīng)網(wǎng)絡(luò)相結(jié)合預(yù)測航材消耗。該法的好處在于RS可以約簡定性和定量影響因素,辨識(shí)其他算法難以讀出的信息。楊仕美等[11]運(yùn)用了SVM的一元預(yù)測和多元預(yù)測組合方法,通過信息熵來調(diào)節(jié)二者的權(quán)重,使二者預(yù)測值加和得到航材備件的需求數(shù)量,提高了航材備件數(shù)量的預(yù)測精度。尚琦坤等[12]從任務(wù)驅(qū)動(dòng)的視角出發(fā),利用決策試驗(yàn)與評(píng)價(jià)實(shí)驗(yàn)室方法選取關(guān)鍵因素,采用遺傳算法優(yōu)化灰色神經(jīng)網(wǎng)絡(luò)算法,預(yù)測航材需求數(shù)量。實(shí)例分析表明,該法優(yōu)于BP神經(jīng)網(wǎng)絡(luò)和灰色神經(jīng)網(wǎng)絡(luò)。陳博等[13]以某單位執(zhí)行航材保障任務(wù)數(shù)據(jù)為基礎(chǔ),通過MATLAB建模分析,利用灰色神經(jīng)網(wǎng)絡(luò),預(yù)測航材消耗,一定程度上促進(jìn)了航材轉(zhuǎn)場保障工作的開展。
綜上所述,學(xué)者們主要從航材歷史消耗數(shù)據(jù)本身和航材消耗數(shù)據(jù)的影響因素兩方面入手,從航材歷史消耗數(shù)據(jù)本身入手預(yù)測航材消耗,使用了時(shí)間序列法、指數(shù)平滑法等方法。這些方法適用于航材消耗規(guī)律容易把握,消耗平穩(wěn)的航材消耗預(yù)測。通常,基于航材歷史消耗數(shù)據(jù)本身預(yù)測航材消耗,要求掌握一定量的航材消耗數(shù)據(jù),這樣預(yù)測出來的航材消耗結(jié)果準(zhǔn)確度高,更有說服力;但面對小樣本數(shù)據(jù)的航材消耗預(yù)測,準(zhǔn)確度難以掌控。從航材消耗影響因素入手預(yù)測航材消耗,使用了BP(Back propagation)神經(jīng)網(wǎng)絡(luò)、最小二乘法、灰色預(yù)測等方法。類似的方法在預(yù)測樣本較小的數(shù)據(jù)上具有優(yōu)勢,但是均要求航材原始數(shù)據(jù)是完備的;在處理不完備信息系統(tǒng)下的航材消耗預(yù)測效果偏弱。
本文在前人研究的基礎(chǔ)上,創(chuàng)新性地提出一種新的航材消耗預(yù)測的組合算法,RS融合PSOSVM。既能滿足小樣本航材消耗預(yù)測的需求,又能夠處理不完備信息系統(tǒng)下的航材消耗預(yù)測。本文所采用的RS方法在處理定性問題和不完備信息系統(tǒng)問題有著獨(dú)特的優(yōu)勢,能夠客觀地分析原始數(shù)據(jù)。SVM[14]具有較好的學(xué)習(xí)性能,近年來被廣泛應(yīng)用。部分學(xué)者將RS與SVM融合,但是僅僅應(yīng)用在水質(zhì)預(yù)警[15]、震害預(yù)測[16]、泥石流預(yù)測[17]等少數(shù)領(lǐng)域。結(jié)合航材消耗的特點(diǎn),本文將其應(yīng)用到航材消耗預(yù)測領(lǐng)域。RS與SVM組合方法不僅可以刪除影響航材消耗的冗余因素,提高支持向量機(jī)的預(yù)測性能,還能解決航材消耗預(yù)測的非線性問題,對于指導(dǎo)航材庫存管理具有借鑒意義和參考價(jià)值。
定義1信息系統(tǒng)
定義2不完備信息系統(tǒng)
如果至少有一個(gè)屬性a∈A使得Va含有空值,則稱S是一個(gè)不完備的信息系統(tǒng),用“*”表示空值[19]。
PSO是模擬鳥類覓食的隨機(jī)搜索算法,簡單,易實(shí)現(xiàn),適合處理實(shí)優(yōu)化問題。PSO的基本公式為
(1)屬性約簡。利用不完備信息系統(tǒng)屬性依賴度函數(shù)計(jì)算各航材消耗影響因素屬性的重要性,約簡冗余因素。
定義3屬性依賴度函數(shù)
當(dāng)影響航材消耗的屬性均為數(shù)值型[24]時(shí),設(shè)航材消耗不完備決策系統(tǒng)S=(U,C∪D,V,f),B?C,航材消耗數(shù)量(決策屬性)D對影響因素(條件屬性)B的依賴度函數(shù)σB(D)為
式 中:RE(B)={(xi,xj)|d(xi)=d(xj)和[?a∈B,s.t.Ta(xi,xj)≥λ或f(xi,a)=*或f(xj,a)=*],i<j};RN(B)={(xi,xj)|d(xi)≠d(xj)和[?a∈B,s.t.Ta(xi,xj)<λ且f(xi,a)≠*和f(xj,a)≠*],i<j};(0≤λ≤1)Ta(xi,xj)表示xi,xj∈U關(guān)于條件屬性a的相似度,定義如下
式中:m0=max{f(xk,a)|xk∈U},n0=min{f(xk,a)|xk∈U},E(D)={(xi,xj)|d(xi)=d(xj),i<j};N(D)={(xi,xj)|d(xi)≠d(xj),i<j}。
(3)SVM參數(shù)尋優(yōu)。處理后的完備信息系統(tǒng)數(shù)據(jù),在Matlab軟件基礎(chǔ)上,借助航材消耗歷史數(shù)據(jù)建立PSO-SVM模型,參數(shù)(γ,σ2)迭代尋優(yōu)[25-26]。
(ak,yk)表示航材消耗相關(guān)數(shù)據(jù),ak∈Rn表示航材消耗的影響因素,y∈R表示航材消耗。SVM支持向量機(jī)旨在尋找非線性映射φ(?):Rn→Rnh將航材消耗樣本空間映射到高維空間,航材消耗預(yù)測問題就轉(zhuǎn)化為以下形式
式中:ω∈Rnh,誤差變量ξi∈R,b為偏差量,γ為可調(diào)參數(shù)。
用拉格朗日法求解該航材消耗預(yù)測模型
式中αi(i=1,2,…,l)為拉格朗日乘子。
式中K(x,xi)為滿足Mercer條件的對稱核函數(shù),常用的有線性核函數(shù)、多項(xiàng)式核函數(shù)、高斯徑向基核函數(shù)。本文選擇高斯徑向基核函數(shù)(Radial basis function,RBF),即
RBF的學(xué)習(xí)能力取決于正則化參數(shù)γ和核函數(shù)參數(shù)σ2的選取。由于粒子群算法計(jì)算簡便,所以本文采取PSO算法,尋找航材消耗預(yù)測模型的全局最優(yōu)參數(shù)組合(γ,σ2)。
(4)模型驗(yàn)證。根據(jù)得到最優(yōu)參數(shù)組合(γ,σ2)建立SVM模型,預(yù)測航材消耗,并結(jié)合真實(shí)數(shù)據(jù)檢驗(yàn)?zāi)P皖A(yù)測效果。
具體算法流程如圖1所示。
圖1 粗糙集融合支持向量機(jī)模型流程圖Fig.1 Flow chart of SVM integrated by RS
本文選取某場站航材股某航材2005—2014年消耗數(shù)據(jù),涉及年飛行日、年飛行小時(shí)、年起落架次等7個(gè)影響因素,即條件屬性C={a1,a2,…,a7},由于個(gè)別原因,表1缺失部分屬性值。航材的消耗按照數(shù)量可以劃分為低消耗[0,10)、中消耗[10,30)和高消耗[30,+∞)3種類型[27],即決策屬性D={3,2,1}。
表1 航材消耗初始數(shù)據(jù)Table1 Initial data of air material consumption
2.2.1 屬性約簡
取λ=0.9 ,由式(2~3)可知
由此可以計(jì)算出,各航材消耗影響因素的重要度σa1(D)=0.447 ,σa2(D)=0.501 ,σa3(D)=0.487 ,σa4(D)=0.603 ,σa5(D)=0.465 ,σa6(D)=0.613 ,σa7(D)=0.427 。根據(jù)各航材消耗影響因素的重要度大小,剔除冗余影響因素,得到各影響因素的相對約簡[15]{a2,a4,a6}。所以,該航材消耗量與飛機(jī)飛行小時(shí)、惡劣天氣占比、自然消耗量密切相關(guān)。
2.2.2 數(shù)據(jù)預(yù)處理
為了方便下一步預(yù)測,對于屬性缺失的數(shù)據(jù),本文采取平均值方法,即空值補(bǔ)充為同一屬性前后兩年數(shù)值的平均值。同時(shí),剔除冗余的航材消耗影響因素,得到數(shù)據(jù)如表2所示。
表2 航材消耗數(shù)據(jù)Table2 Air material consumption data
2.2.3 參數(shù)尋優(yōu)
設(shè)PSO算法的種群規(guī)模為30,進(jìn)化200次,以航材消耗數(shù)據(jù)擬合效果的均方差作為粒子群的適應(yīng)度函數(shù),進(jìn)化結(jié)果如圖2所示,從圖2中可以看出,進(jìn)化到20代左右已尋到了最優(yōu)參數(shù)組合(γ,σ2)=(396.28 ,0.01 )。
圖2 適應(yīng)度曲線Fig.2 Fitness curve
2.2.4 模型驗(yàn)證
結(jié)合正則化參數(shù)γ和核函數(shù)參數(shù)σ2的取值,建立RS-PSO-SVM航材消耗預(yù)測模型,對航材消耗數(shù)據(jù)的進(jìn)行回判檢驗(yàn)(圖3)。從擬合的效果來看,經(jīng)過粗糙集不完備決策系統(tǒng)的屬性重要性約簡,去除冗余信息后,抓住了該航材消耗決策系統(tǒng)的大部分信息,擬合效果的相對誤差較小,很好地反映該航材的消耗趨勢。
圖3 數(shù)據(jù)回判檢驗(yàn)Fig.3 Data callback test
在航材消耗不完備決策系統(tǒng)中,RS-PSO-SVM航材消耗預(yù)測模型可以剔除冗余因素,提高了單純PSO-SVM模型的運(yùn)算效率,且預(yù)測準(zhǔn)確度高于PSO-SVM模型?;诖植诩膶傩约s簡,本文提出的模型預(yù)測準(zhǔn)確度也優(yōu)于RS-BP模型,比較結(jié)果如圖4和表3所示。結(jié)果顯示,通過RS-BP模型預(yù)測該航材消耗量準(zhǔn)確度不高,預(yù)測效果較差。3種方法中,RS-PSO-SVM航材消耗預(yù)測模型效果最佳,不僅降低了模型復(fù)雜度,還提高了航材消耗預(yù)測的精度,對于指導(dǎo)不完備多因素航材消耗決策系統(tǒng)決策具有一定的參考價(jià)值,同時(shí),為應(yīng)對不確定性條件下航材保障工作打下了基礎(chǔ),推動(dòng)了減輕現(xiàn)存航材庫存積壓、改善航材庫存結(jié)構(gòu)的工作進(jìn)程。
圖4 航材消耗預(yù)測結(jié)果Fig.4 Forecast results of air material consumption
處理信息缺失的航材消耗決策系統(tǒng),粗糙集在約簡屬性有著內(nèi)在優(yōu)勢,針對小樣本數(shù)據(jù)量的航材消耗數(shù)據(jù),支持向量機(jī)又較為適合,不會(huì)出現(xiàn)類似于神經(jīng)網(wǎng)絡(luò)算法過擬合的現(xiàn)象。PSO算法收斂速度較快,尋優(yōu)得到的最優(yōu)參數(shù)組合(γ,σ2)=(396.28 ,0.01 ),優(yōu)化了SVM的預(yù)測性能和效果。從實(shí)例分析結(jié)果來看,RS-PSO-SVM算法預(yù)測效果明顯優(yōu)于RS-BP和PSO-SVM。RS-PSO-SVM算法解決了航材消耗不完備決策系統(tǒng)的屬性約簡,保留了系統(tǒng)的核心知識(shí),解決屬性值殘缺的航材消耗信息系統(tǒng)問題效果良好,提高了算法的運(yùn)行效率。面對航材數(shù)據(jù)缺失的預(yù)測和屬性約簡問題,本文創(chuàng)新性地提出RS-PSO-SVM算法,填補(bǔ)了當(dāng)前航材消耗不完備決策系統(tǒng)的空白。RS-PSO-SVM算法預(yù)測準(zhǔn)確率較高,對于指導(dǎo)航材訂貨工作具有重要實(shí)際意義。
本文在缺失值處理上選擇了常用的相鄰數(shù)據(jù)取平均值的方法。缺失值的處理方法很多,在日后的研究中,可以深入探討航材消耗決策系統(tǒng)屬性缺失值的處理方法,比較不同缺失值處理方法下的航材消耗預(yù)測結(jié)果,進(jìn)一步提高航材消耗預(yù)測精度,更好地服務(wù)于基層一線航材保障工作,加速空軍航空兵部隊(duì)?wèi)?zhàn)斗力的提升。