孫臣良,鄭偉,趙濤,陳洪光
(1.海軍航空工程學(xué)院a.兵器科學(xué)與技術(shù)系;b.科研部,山東煙臺264001;2.91557部隊,浙江舟山316000;3.91440部隊,河南洛陽471000)
基于數(shù)據(jù)挖掘和小波神經(jīng)網(wǎng)絡(luò)的航材消耗預(yù)測方法
孫臣良1a,鄭偉1b,趙濤2,陳洪光3
(1.海軍航空工程學(xué)院a.兵器科學(xué)與技術(shù)系;b.科研部,山東煙臺264001;2.91557部隊,浙江舟山316000;3.91440部隊,河南洛陽471000)
運用數(shù)據(jù)挖掘技術(shù)對航材消耗的歷史數(shù)據(jù)進行關(guān)聯(lián)分析,篩選出對保障飛機飛行有重要作用的航材消耗數(shù)據(jù),大大縮減了需要預(yù)測的航材數(shù)量,同時對消耗航材之間的內(nèi)在影響關(guān)系進行量化。在分析人工魚群算法原理的基礎(chǔ)上,對算法中步長參數(shù)和視野范圍參數(shù)的設(shè)置方法進行了改進。實例結(jié)果表明,運用小波神經(jīng)網(wǎng)絡(luò)預(yù)測航材消耗的方法大大降低了預(yù)測誤差,說明了該方法的有效性、可行性和實用性。
數(shù)據(jù)挖掘;小波神經(jīng)網(wǎng)絡(luò);消耗預(yù)測
航材管理作為飛行勤務(wù)保障的重要組成部分,其科學(xué)管理水平將對飛機戰(zhàn)斗力的發(fā)揮產(chǎn)生直接的影響[1]。當代航空技術(shù)突飛猛進,航空裝備不斷朝著集成化、精細化、自動化、模塊化方向發(fā)展,飛機也越來越現(xiàn)代化、復(fù)雜化。飛機巨大戰(zhàn)斗力的發(fā)揮依賴于航材及時而又準確的供應(yīng),因而對航材保障提出了更新、更高的要求[2]。假如某一零部件發(fā)生故障,就可能導(dǎo)致飛機無法起飛,為避免因航材短缺而造成的飛機停飛現(xiàn)象,必須保證足夠、及時的航材供應(yīng)[3]。為此,必須儲備一定數(shù)量的航材,而航材保障的經(jīng)費以及航材倉庫的容積都是有限的。因此,只能以有限的保障經(jīng)費、有限的庫容,采購有限的航材。如果儲備量過大,一方面,將增加航材庫存保管費和保管場所維護費用,降低經(jīng)濟效益;另一方面,過量庫存降低了航材的質(zhì)量,使航材陳舊、損壞,甚至因發(fā)霉、生銹而變質(zhì),這會致使保障成本增加,保障效益降低[4]。反之,航材儲備過少會造成維修停工、飛機停飛,降低軍事效益,并且因缺貨往往造成臨時訂貨,更增加了附加的人力和費用,造成更大的損失。因此,在有限的經(jīng)費和現(xiàn)有的保障條件下,如何做到精確航材保障,提高航材保障良好率,仍是急需研究的重要課題。以往航材消耗量的預(yù)測往往存在2個方面的問題:一方面,是航材種類繁多、數(shù)量龐大,每一項航材都進行消耗量的預(yù)測工作量巨大;另一方面,選取的預(yù)測方法不合適會導(dǎo)致預(yù)測結(jié)果不準確。本文擬通過采用數(shù)據(jù)挖掘算法篩選待預(yù)測航材種類和名稱,再利用小波神經(jīng)網(wǎng)絡(luò)(Wavelet Neural Networks,WNN)進行消耗量的預(yù)測。
數(shù)據(jù)挖掘(Data Mining)又稱為數(shù)據(jù)庫中的知識發(fā)現(xiàn)(Knowledge Discovery in Database),簡稱知識發(fā)現(xiàn)(KDD)。就是從海量的、不完全的、模糊的、隨機的原始數(shù)據(jù)中,提取隱含在其中的、人們事先不知道的、但又是潛在有用、可信、新穎的信息和知識的過程[5-8]。
數(shù)據(jù)挖掘是指一個完整的過程,包括數(shù)據(jù)準備、數(shù)據(jù)挖掘以及結(jié)果的解釋和評估3個部分[9-10],目的是從大型數(shù)據(jù)庫中挖掘出先前未知的、有效的、實用的信息,并使用這些信息做出決策或豐富知識。
數(shù)據(jù)準備包括了數(shù)據(jù)抽取,數(shù)據(jù)預(yù)處理和數(shù)據(jù)變換;數(shù)據(jù)挖掘階段首先要明確挖掘的任務(wù)或目的,如數(shù)據(jù)總結(jié)、分類等。確定了挖掘任務(wù)后,就要決定使用什么樣的算法,同樣的任務(wù)可以用不同的算法來實現(xiàn);數(shù)據(jù)挖掘階段發(fā)現(xiàn)出來的模式,經(jīng)過用戶或機器的評估,可能存在冗余或無關(guān)的模式,就需要將其剔除或返回初始階段重新選擇數(shù)據(jù)及數(shù)據(jù)變換方法。
在進行數(shù)據(jù)挖掘時,選擇合適的挖掘算法,其余的工作都可以自行完成。本文為了確定消耗航材之間的關(guān)聯(lián),應(yīng)用數(shù)據(jù)挖掘工具SAS中的Enterprise Miner模塊進行關(guān)聯(lián)規(guī)則挖掘,對某機型航材消耗數(shù)據(jù)進行分析。處理后的原始數(shù)據(jù)表結(jié)構(gòu)見表1,主要存儲內(nèi)容有單位、消耗航材。
表1 原始數(shù)據(jù)存儲表Tab.1 Table of initial data store
由于航材種類繁多,如果把所有原始數(shù)據(jù)表中列出的航材作為屬性進行關(guān)聯(lián)規(guī)則分析,一些不重要的、個例的屬性就會影響最終的分析結(jié)果,而且會影響分析的效率。通過數(shù)據(jù)清理(填寫空缺值、平滑噪聲數(shù)據(jù)、識別、刪除孤立點、解決不一致性),數(shù)據(jù)變換(規(guī)范化,即消除冗余屬性和數(shù)據(jù)匯總),對原始數(shù)據(jù)進行預(yù)處理,最終存入數(shù)據(jù)庫中準備進行實驗的部分數(shù)據(jù)見表2、表3。
表2 數(shù)據(jù)庫數(shù)據(jù)存儲表Tab.2 Table of database data store
表3 最大頻繁項目集表Tab.3 Table of maximum frequent itemsets
表2、3中,每一條數(shù)據(jù)對應(yīng)一架飛機,“編號”列對應(yīng)與該條數(shù)據(jù)的序號,“數(shù)據(jù)項”列存儲的是這架飛機存在的故障,每個英文字母對應(yīng)一類故障,如:P為分電器夾子;Q為前起上位鎖;R為放油開關(guān);S為火線;T為通風(fēng)導(dǎo)管等。
根據(jù)實際情況,支持度設(shè)為0.1,采用Apriori算法,產(chǎn)生的最大頻繁項目集如表3所示。由試驗結(jié)果可以看出:P、Q、R、S、T發(fā)生故障的概率比較高,在33組數(shù)據(jù)中,概率超過15%。
依據(jù)產(chǎn)生的頻繁項生成關(guān)聯(lián)規(guī)則,產(chǎn)生結(jié)果如表4。如果最小信任度設(shè)置為0.6,從表4可以看出,產(chǎn)生了3條關(guān)聯(lián)規(guī)則,分別是:P→S;P→T;S→T。對應(yīng)到飛機故障為:分電器夾子→火線;分電器夾子→通風(fēng)導(dǎo)管;火線→通風(fēng)導(dǎo)管。
表4 關(guān)聯(lián)規(guī)則表Tab.4 Table of association Rules
根據(jù)關(guān)聯(lián)規(guī)則挖掘得出的結(jié)論,在對飛機進行維修或保養(yǎng)時,要對可能引起其他零部件出現(xiàn)故障的零件進行重點檢測維修,從而減少航材消耗的誘因,對提高航材保障效率具有推進作用。
根據(jù)試驗結(jié)果,分電器夾子損壞會導(dǎo)致火線或者通風(fēng)導(dǎo)管損壞,火線損壞會導(dǎo)致通風(fēng)導(dǎo)管損壞,或者說分電器夾子和火線或者通風(fēng)導(dǎo)管同時損壞的概率較高。這一試驗結(jié)果為飛機的保養(yǎng)、維修和庫存的關(guān)聯(lián)提供了可靠依據(jù),但是這一結(jié)果仍需要更多的數(shù)據(jù)和實際應(yīng)用來驗證。從數(shù)據(jù)不難看出,從關(guān)聯(lián)規(guī)則上對航空器材消耗進行挖掘,對維護飛機的技戰(zhàn)術(shù)性能上有很大的幫助。
首先,需要考慮網(wǎng)絡(luò)參數(shù)初始化和確定網(wǎng)絡(luò)中的輸入層、隱層、輸出層節(jié)點個數(shù);之后,構(gòu)建小波神經(jīng)網(wǎng)絡(luò),從而使航材消耗數(shù)據(jù)在網(wǎng)絡(luò)上進行學(xué)習(xí)、訓(xùn)練。在利用小波神經(jīng)網(wǎng)絡(luò)模型解決航材消耗預(yù)測建模問題時,將參數(shù)初始化和網(wǎng)絡(luò)結(jié)構(gòu)問題統(tǒng)稱為優(yōu)化的WNN預(yù)測模型建立問題[11-12]。
人工魚群算法(Artificial Fish Swarm Algorithm, AFSA)是一種模擬魚群覓食行為的新型高效的群體智能優(yōu)化算法,是集群智能思想的一個具體應(yīng)用,它能很好地解決復(fù)雜非線性系統(tǒng)的優(yōu)化等問題。其基本原理是借鑒魚的覓食、聚群和追尾行為,從構(gòu)造單條人工魚底層行為做起,通過魚群中各個體局部尋優(yōu),達到全局最優(yōu)值在群體中突現(xiàn)出來的目的。
人工魚群算法具體包括以下步驟。
1)初始化魚群,在控制變量可行域內(nèi)隨機生成n條人工魚個體,形成初始魚群;包括人工魚群的個體數(shù)目,每條人工魚的初始位置,人工魚移動的最大步長Step,視野范圍Visual,重試次數(shù)try-number,擁擠度因子δ。
2)設(shè)置公告板,公告板用來記錄人工魚群尋到的最優(yōu)值及對應(yīng)的人工魚個體狀態(tài)。
3)對魚群中的每條人工魚個體所在位置的食物濃度進行評價。
4)每條人工魚個體分別模擬執(zhí)行追尾行為和聚群行為,選擇行動后食物濃度較大值的行為為實際執(zhí)行,缺省行為方式為覓食行為。
5)更新公告板,每條人工魚個體每行動一次后,檢驗自身的食物濃度值與公告板的食物濃度值。如果優(yōu)于公告板,則以自身取代之。
6)判斷是否迭代停止。若是,輸出結(jié)果;否則,轉(zhuǎn)向步驟3)。
人工魚在覓食行為中,其個體總是嘗試向更優(yōu)的方向前進,這奠定了算法收斂的基礎(chǔ)。人工魚隨機巡視其視野范圍中某點的狀態(tài)Xj,如果發(fā)現(xiàn)好于當前狀態(tài)Xi,則狀態(tài)Xi的方向前進一步到達狀態(tài)Xj;如果狀態(tài)Xj并不比狀態(tài)Xi好,則它繼續(xù)隨機巡視視野范圍內(nèi)的狀態(tài),如果巡視次數(shù)達到一定次數(shù)try-number仍未找到更優(yōu)狀態(tài),則做隨機游動。在上述過程中,步長參數(shù)Step與視野范圍Visual對魚群算法收斂的速度和精度影響很大。設(shè)置不當則會陷入局部極值或達不到精度。在覓食行為中,人工魚個體沒有找到較優(yōu)狀態(tài)時,會隨機選擇一個新狀態(tài),未充分利用已得到的信息,致使計算量增加和收斂速度較慢。
針對以上不足,Visual和Step可動態(tài)調(diào)整為:
式(1)中:t為當前迭代次數(shù);Tmax為最大迭代次數(shù);Visualmin=0.001;Stepmin=0.000 2;Step=Visual 8;s為函數(shù)a的變化速率,通常取值整數(shù)的范圍為[1,30]。
用改進人工魚群算法優(yōu)化WNN的目的是為了確定與給定任務(wù)最佳匹配的WNN參數(shù)初始值和網(wǎng)絡(luò)結(jié)構(gòu),優(yōu)化的目的是不僅要確保初始化參數(shù)、網(wǎng)絡(luò)結(jié)構(gòu)最優(yōu),還要減小WNN網(wǎng)絡(luò)的輸出誤差。適應(yīng)值函數(shù)定義為輸出的均方誤差函數(shù)MSE,人工魚群代表了不同結(jié)構(gòu)的WNN,不同人工魚對應(yīng)于含有不同網(wǎng)絡(luò)參數(shù)和隱節(jié)點數(shù)的WNN網(wǎng)絡(luò)結(jié)構(gòu)組成,且整個優(yōu)化過程不是基于一種固定的網(wǎng)絡(luò)結(jié)構(gòu)。
由改進人工魚群算法確定的WNN參數(shù)初始值和結(jié)構(gòu)模型建立方法如下:
1)初始化人工魚群的群體規(guī)模M、每條人工魚的初始位置、視野范圍Visual、步長Step、擁擠度因子δ和最大重復(fù)嘗試次數(shù)因子try-number、最大迭代次數(shù)number等參數(shù);
2)設(shè)置初始迭代次數(shù)num=0,在控制變量可行域內(nèi)隨機生成M個人工魚個體,形成初始魚群;
3)計算每條人工魚的適應(yīng)度,并與公告板的狀態(tài)比較,若較好,則將其賦給公告板;
4)按式(1)計算視野范圍Visual和步長Step;
5)每條人工魚通過覓食、聚群、追尾和隨機行為更新自己的位置;
6)判斷num是否已經(jīng)達到預(yù)置的最大迭代次數(shù)number,若滿足,算法終止,輸出計算結(jié)(即公告板的FC值)果;否則num+1,轉(zhuǎn)步驟3);
7)將改進人工魚群算法得到的最優(yōu)解,解碼為WNN參數(shù)的初始值和隱層節(jié)點數(shù),采用BP算法,對網(wǎng)絡(luò)參數(shù)進行梯度下降法訓(xùn)練。
選取研究對象為某型飛機的油箱安全活門,實驗所用的數(shù)據(jù)實測于其120個月該項器材的實際消耗量。
人工魚群算法中,WNN的初始參數(shù)(連接權(quán)值、平移因子和伸縮因子)為[-1,1]內(nèi)的隨機數(shù),隱層節(jié)點數(shù)取為[1,30]內(nèi)的整數(shù)。群體規(guī)模M=40,視野范圍Visual=1,步長Step=0.05,擁擠度因子δ=0.168,s=3,最大重復(fù)嘗試次數(shù)因子try-number=30,迭代次數(shù)number=100,采用梯度下降法訓(xùn)練WNN次數(shù)N=200,目標誤差MSN為0.000 1。本文設(shè)計了一種組合式的WNN優(yōu)化設(shè)計方法,以便于驗證本文優(yōu)化設(shè)計方法的有效性。即分別采用普通的BP算法和WNN算法來初始化參數(shù)和確定隱層節(jié)點個數(shù)。
表5列出了采用普通的BP算法和本文算法優(yōu)化設(shè)計后的WNN的性能指標對比,即50次實驗的平均值。
表5 不同優(yōu)化設(shè)計方法的WNN模型的性能對比Tab.5 Performance comparison of different optimization approach with WNN
從實驗結(jié)果可以看出,采用本文優(yōu)化設(shè)計的方法得到的WNN模型具有較強的預(yù)測能力,僅需訓(xùn)練87次,就可收斂目標精度,并且選取的隱層節(jié)點數(shù)也少于后者。另外,本文方法優(yōu)化過程中沒有出現(xiàn)局部最優(yōu)和不收斂現(xiàn)象,這也證明了本文方法的有效性。更為重要的是,該方法能夠?qū)崿F(xiàn)WNN參數(shù)初始值和隱層節(jié)點數(shù)的同步優(yōu)化,從而避免了WNN工程應(yīng)用出現(xiàn)的參數(shù)初始化和結(jié)構(gòu)設(shè)計的盲目性問題,具有較好的應(yīng)用前景。
本文運用數(shù)據(jù)挖掘技術(shù)對航材消耗的歷史數(shù)據(jù)進行關(guān)聯(lián)分析,篩選出對保障飛機飛行有重要作用的航材消耗數(shù)據(jù),大大縮減了需要預(yù)測的航材數(shù)量,同時對消耗航材之間的內(nèi)在影響關(guān)系進行量化。小波神經(jīng)網(wǎng)絡(luò)具有神經(jīng)網(wǎng)絡(luò)的非線性映射能力和小波分析的時頻分析特點,其應(yīng)用效果總體優(yōu)于單純使用神經(jīng)網(wǎng)絡(luò)或者小波分析。本文運用小波神經(jīng)網(wǎng)絡(luò)預(yù)測航材消耗量,實例結(jié)果表明該預(yù)測方法大大降低了預(yù)測誤差,說明了該方法的有效性、可行性和實用性。
[1]張作剛.海軍航材庫存管理[M].北京:海潮出版社,2008:1-1;13-14. ZHANG ZUOGANG.Navy air material inventory management[M].Beijing:Tides Press,2008:1-1;13-14.(in Chinese)
[2]劉臣宇.航材供應(yīng)[M].北京:國防工業(yè)出版社,2009:56-58. LIU CHENYU.Air material supply[M].Beijing:National Defense Industry Press,2009:56-58.(in Chinese)
[3]徐廷學(xué),芮國勝,鄭偉.航空裝備綜合保障[M].北京:兵器工業(yè)出版社,2004:12-14. XU TINGXUE,RUI GUOSHENG,ZHENG WEI.Integrated logistic support for aeronautic equipment[M].Beijing:Weapon Industry Press,2004:12-14.(in Chinese)
[4]陳云翔,楊新廣.航空裝備戰(zhàn)斗損傷概率預(yù)測模型研究[J].數(shù)學(xué)的實踐與認識,2011,41(18):118-122. CHEN YUNXIANG,YANG XINGUANG.Research on battle damage probability forecast model for aeronautic equipment[J].Mathematics in Practice and Theory,2011,41(18):118-122.(in Chinese)
[5]計希禹.數(shù)據(jù)挖掘技術(shù)應(yīng)用實例[M].北京:機械工業(yè)出版社,2009:23-26. JI XIYU.Data mining technology application[M].Beijing:China Machine Press,2009:23-26.(in Chinese)
[6]朱玉全,楊鶴標,孫蕾.數(shù)據(jù)挖掘技術(shù)[M].南京:東南大學(xué)出版社,2006:28-30. ZHU YUQUAN,YANG HEBIAO,SUN LEI.Data mining technology[M].Nanjing:Southeast University Press,2006:28-30.(in Chinese)
[7]邵峰晶,于忠清.數(shù)據(jù)挖掘原理與算法[M].北京:中國水利水電出版社,2003:12-16. SHAO FENGJING,YU ZHONGQING.The principle and algorithm of data mining[M].Beijing:China Water-Power Press,2003:12-16.(in Chinese)
[8]薛青,羅佳,鄭長偉,等.面向作戰(zhàn)仿真的數(shù)據(jù)挖掘[J].四川兵工學(xué)報,2013,34(8):93-95. XUE QING,LUO JIA,ZHENG CHANGWEI,et al. Study on data mining for combat simulation[J].Journal of Sichuan Ordnance,2013,34(8):93-95.(in Chinese)
[9]CHENG G,LIU X,WU J X.Interactive knowledge discovery through self-organising feature maps[C]//World Congress on Neural Networks.2004:430-434.
[10]ESTER M,KRIGEL H P,XU X.Knowledge discovery in large spatial databases,advances in knowledge discovery and data mining[M].MA:AAAI/MIT Press,2006:83-115.
[11]HSU K,GUPTA H V,SOROOSHIAN S.Artificial neural network modeling of the rainfall runoff process[J].Water Resources Research,2005,31(10):2517-2530.
[12]左廣東,周帥,張欣豫.小波神經(jīng)網(wǎng)絡(luò)研究[J].四川兵工學(xué)報,2012,33(4):115-117. ZUO GUANGDONG,ZHOU SHUAI,ZHANG XINYU. Research of wavelet neural network[J].Journal of Sichuan Ordnance,2012,33(4):115-117.(in Chinese)
V240.2
A
2014-01-23;
2014-03-31
國家部委技術(shù)基礎(chǔ)基金資助項目(1036221)
孫臣良(1963-),男,副教授,大學(xué)。
1673-1522(2014)03-0235-04
10.7682/j.issn.1673-1522.2014.03.008