宋傳洲 王瑞奇 劉天慶 劉克 殷文廣
摘 要:??? 為提高執(zhí)行任務(wù)時(shí)航材攜行數(shù)量保障的科學(xué)性,? 充分考慮任務(wù)中各類(lèi)影響因素,? 采取XGBoost算法對(duì)攜行航材需求進(jìn)行預(yù)測(cè)。首先,? 分析不同任務(wù)中影響航材消耗的各種因素,? 按照全面系統(tǒng)、 科學(xué)簡(jiǎn)明等原則建立預(yù)測(cè)特征體系;? 其次,? 采用GRA, XGBoost, DEMATEL對(duì)特征重要性和相關(guān)度進(jìn)行定性和定量分析并篩選,? 建立精簡(jiǎn)版特征集合;? 再次,? 用網(wǎng)格搜索法調(diào)參,? 提高模型預(yù)測(cè)的準(zhǔn)確率和運(yùn)行效率;? 最后,? 通過(guò)算例分析,? 并與GBDT, SVM算法對(duì)比分析,? 驗(yàn)證該方法在樣本數(shù)據(jù)有限、 影響因素多的情況下,? 可降低預(yù)測(cè)誤差,? 避免過(guò)擬合,? 有較好的實(shí)用性和高效性。
關(guān)鍵詞:?? XGBoost;? 面向任務(wù);? 攜行航材;? 消耗預(yù)測(cè);? GRA;? DEMATEL; 預(yù)測(cè)方法
中圖分類(lèi)號(hào):? TJ760.4?? 文獻(xiàn)標(biāo)識(shí)碼: A?? 文章編號(hào):? 1673-5048(2021)04-0088-09
0 引? 言
近年來(lái),? 隨著異地執(zhí)行飛行任務(wù)的增多,? 轉(zhuǎn)場(chǎng)攜行保障不可避免,? 特別是持續(xù)時(shí)間長(zhǎng)、 任務(wù)強(qiáng)度大的需異地執(zhí)行的專(zhuān)項(xiàng)任務(wù)以及隨艦護(hù)航保障任務(wù)、 重大演習(xí)任務(wù)等,? 都需要不斷提高航材攜行保障能力,? 主要是在有限的保障資源、 保障能力和空間的前提下,? 科學(xué)確定攜帶的航材品種和數(shù)量[1]。各類(lèi)任務(wù)復(fù)雜多變,? 對(duì)航材需求的影響因素以及各因素之間的影響程度都在發(fā)生變化,? 航材自身的可靠性是主要的影響因素,? 任務(wù)模式、 任務(wù)環(huán)境、 人員因素等都對(duì)航材的消耗產(chǎn)生影響,? 使航材消耗的不確定性增強(qiáng)。以往按照經(jīng)驗(yàn)攜帶航材,? 或?yàn)榱舜_保萬(wàn)無(wú)一失數(shù)倍攜帶,? 或考慮不周攜帶不足,? 一定程度上影響了任務(wù)完成的質(zhì)效, 且產(chǎn)生經(jīng)濟(jì)負(fù)擔(dān)。
隨著預(yù)測(cè)方法的發(fā)展,? 各類(lèi)算法在航材預(yù)測(cè)中都有很多嘗試,? 常見(jiàn)的有基于歷史數(shù)據(jù)統(tǒng)計(jì)值來(lái)研究航材時(shí)間發(fā)展趨勢(shì)的方法,? 如移動(dòng)平均預(yù)測(cè)法[2]、 指數(shù)平滑預(yù)測(cè)法[3]、 ARMA預(yù)測(cè)法[4]、 灰色系統(tǒng)預(yù)測(cè)法[5]、 Croston法[6]等及其改進(jìn)方法;? 有運(yùn)用統(tǒng)計(jì)學(xué)方法研究故障率、 可靠性和壽命擬合的曲線規(guī)律進(jìn)行預(yù)測(cè)[7];? 也有采用機(jī)器學(xué)習(xí)算法,? 如神經(jīng)網(wǎng)絡(luò)[8]、 支持向量機(jī)[9]等及其改進(jìn)或者組合算法預(yù)測(cè)。這些方法在考慮多維影響因素上有所欠缺,? 且在解決多影響因素非線性問(wèn)題時(shí)缺乏高效通用的方案。本文采用XGBoost 算法, 面向任務(wù)的多影響因素, 對(duì)航材消耗進(jìn)行預(yù)測(cè)。
XGBoost算法是以Boosting 的集成學(xué)習(xí)為基本思想提出的一種超級(jí)梯度提升樹(shù)算法,? 近年來(lái)在許多領(lǐng)域的應(yīng)用中都獲得良好成效[10]。當(dāng)前,? 國(guó)內(nèi)外將 XGBoost 算法應(yīng)用到航材領(lǐng)域的較少,? 尤其是在攜行航材消耗預(yù)測(cè)方面的應(yīng)用就更少。XGBoost 算法較傳統(tǒng)算法,? 先進(jìn)性表現(xiàn)在預(yù)測(cè)準(zhǔn)確度、 運(yùn)算效率、 算法修正的容錯(cuò)性等諸多方面,? 可根據(jù)實(shí)際情況給出的不同條件有針對(duì)性地進(jìn)行算法調(diào)優(yōu),? 特別是對(duì)其超參數(shù)的優(yōu)化。XGBoost模型可解釋性強(qiáng),? 對(duì)特征取值要求較低,? 因此可把任務(wù)中各種影響因素視為特征標(biāo)簽變量,? 突出攜行航材任務(wù)的消耗特點(diǎn)進(jìn)行預(yù)測(cè)。特征的數(shù)量對(duì)模型有很大影響,? 一定程度上減少非重要特征數(shù)量, 可以提高模型運(yùn)算效率和準(zhǔn)確率[11],? 因此綜合使用定量分析方法XGBoost和GRA [12] 定性分析方法DEMATEL[13]對(duì)特征重要性進(jìn)行排序,? 并綜合排名結(jié)合實(shí)際篩選簡(jiǎn)化特征集合[14],? 既可從定量分析中發(fā)現(xiàn)影響因素間的內(nèi)在客觀規(guī)律,? 又可發(fā)揮專(zhuān)家從實(shí)際研究中得到的寶貴經(jīng)驗(yàn),??? 有利于提高特征精簡(jiǎn)的科學(xué)性,? 最后將該模型與SVM, GBDT進(jìn)行對(duì)比實(shí)驗(yàn)以驗(yàn)證該模型的實(shí)用性和高效性。
1 基本理論
1.1 XGBoost的基本理論
XGBoost算法[15-16]通過(guò)對(duì)其損失函數(shù)進(jìn)行2階泰勒展開(kāi),? 同時(shí)保留1階導(dǎo)數(shù)和2階導(dǎo)數(shù)的綜合信息, ?使模型在訓(xùn)練集上的收斂時(shí)間縮減,? 此外,? 引入列抽樣和在損失函數(shù)中加入可優(yōu)化的正則項(xiàng),? 既能夠?qū)δP蛷?fù)雜度有效控制,? 又可避免出現(xiàn)過(guò)擬合。其原理如下:? 航空兵器 2021年第28卷第4期
宋傳洲, 等: 基于XGBoost- GRA- DEMATEL面向任務(wù)攜行航材消耗預(yù)測(cè)方法
設(shè)D={(xi, yi)}(|D|=n, xi∈Rd, yi∈R),? 其中n為航材樣本數(shù),? 每件航材包含特征數(shù)為d,? xi為第i個(gè)航材的消耗數(shù)。
y^i=φ(xi)=∑Kk=1fk(xi), fk∈FF=f(x)=ωq(x)(s: Rd→T, ω∈RT) (1)
式中: φ為樣本xi和預(yù)測(cè)值y^i的函數(shù)關(guān)系;? F為所有分類(lèi)樹(shù)的集合;? fk為第k棵樹(shù)的函數(shù)模型;? s為xi相應(yīng)葉節(jié)點(diǎn)序列所標(biāo)記的映射;? T為葉子節(jié)點(diǎn)的數(shù)目;? RT為葉子節(jié)點(diǎn)權(quán)重ω的空間;? 每一個(gè)獨(dú)立ωq(x)映射得到一個(gè)f(x)。在目標(biāo)函數(shù)中加入正則化后得到損失函數(shù):
L(φ)=∑il^(y^i, yi)+∑kΩ(fk)Ω(f)=γT+12λ‖ω‖2 (2)
式中: l為可微凸損失函數(shù),? 用以表示y^i和yi之間的差異;?? γ和λ分別為葉子數(shù)目和葉子權(quán)重的正則化參數(shù),? γ的取值限制節(jié)點(diǎn)繼續(xù)分裂,? 令Ω(f)成為懲罰項(xiàng), 控制模型復(fù)雜度,? 避免過(guò)擬合發(fā)生。通過(guò)加法運(yùn)算,? 將式(1)預(yù)測(cè)值y^i遞推展開(kāi),? 得到新的預(yù)測(cè)值,? 從而得到最小化損失函數(shù)L(t),? 一個(gè)新的第t棵樹(shù)的目標(biāo)函數(shù):
L(t)=∑ni=1l(yi, y^(t-1)i+ft(xi))+Ω(ft)(3)
式中: y^(t-1)i處用泰勒公式一階二階展開(kāi)得到
L(t)≈∑ni=1l(yi, y^(t-1)i)+gift(xi)+12hif2t(xi)+Ω(ft)(4)
式中: gi=l(yi, y^(t-1)i)y^(t-1)i;?? hi=2l(yi, y^(t-1)i)2y^(t-1)i。? 令I(lǐng)i=iq(xi)=k, 得到損失函數(shù):
L(t)=∑ni=1gift(xi)+12hif2t(xi)+γT+12λ∑Tj=1ω2k=∑Tk=1(∑i∈Ikgi)ωk+12(∑i∈Ikhi+λ)ω2k+γT(5)
由于q(x)固定,? 可以求得ωk,? 使用貪心算法進(jìn)行迭代,? 分裂葉節(jié)點(diǎn),? 進(jìn)而得到最優(yōu)目標(biāo)函數(shù)值。
1.2 GRA原理
GRA是灰色關(guān)聯(lián)度分析[12]的簡(jiǎn)稱(chēng),? 具體原理如下:
(1) 確定比較特征和參考變量。
影響攜行航材消耗需求的參考變量就是歷史任務(wù)消耗量,? 表示為x0=[x0(1), x0(2), …, x0(n)],? 比較特征表示為xi=[xi(1), xi(2), …, xi(n)]。 其中: i=0, 1, 2, …, 15, 表示特征表里的特征數(shù)n為樣本數(shù)。
(2) 計(jì)算x0與xi的關(guān)聯(lián)系數(shù),? 記作ξ0i。
ξ0i=
minminx0(k)-xi(k)+ρmaxmaxx0(k)-xi(k)x0(k)-xi(k)+ρmaxmaxx0(k)-xi(k)(6)
式中: ρ為分辨系數(shù),? ρ∈(0, 1)。
(3) 計(jì)算灰色關(guān)聯(lián)度并排序,? 記作γ0i,? 稱(chēng)作xi對(duì)x0的灰色關(guān)聯(lián)度。
γ0i=1n∑nk=1ξ0i(k)(7)
可以得到關(guān)聯(lián)度序列R=(γ01, γ02, γ03, …, γ0i),? 對(duì)序列值進(jìn)行排序,? 可清楚地看出各特征變量與消耗數(shù)量之間的關(guān)聯(lián)程度,? 直觀地對(duì)特征集合進(jìn)行分析和篩選。
1.3 DEMATEL分析法
DEMATEL[13]是決策實(shí)驗(yàn)室分析法的縮寫(xiě),? 該方法采用圖論和矩陣?yán)碚摚? 可充分發(fā)揮專(zhuān)家的知識(shí)和經(jīng)驗(yàn)對(duì)復(fù)雜系統(tǒng)進(jìn)行定性分析,? 從而為決策提供參考。其最終得到反映特征影響的重要程度的中心度,? 以及反映特征影響的因果方向的原因度,? 以此分析判斷各特征在系統(tǒng)中的重要程度。其具體原理如下:
(1) 建立矩陣Y表示影響特征量之間的直接影響,? aij表示特征i對(duì)特征j的影響程度,? 當(dāng)i=j時(shí),? aij=0。
Y=(aij)n×n=a11…a1nan1…ann(8)
(2) 對(duì)矩陣Y進(jìn)行標(biāo)準(zhǔn)化處理得到標(biāo)準(zhǔn)化影響矩陣X,? max∑nj=1aij為矩陣各行影響特征量之和的最大值。
X=(xij)n×n=Ymax∑nj=1aij(9)
(3) 矩陣變換后得到綜合影響矩陣T。
T=(tij)n×n=lim(X+X2+…+Xk)
T=(tij)n×n=X(I-X)-1(10)
式中:? I為單位矩陣。
(4) 分別求出單個(gè)特征的影響度ri、 被影響度ci、? 中心度βi,? 若αi>0,? 表示特征i為原因因素,? 反之表示特征i為結(jié)果因素。
ri=∑nj=1tij, ci=∑nj=1tij, i∈綆+
αi=ri-ci, βi=ri+ci(11)
2 建立XGBoost預(yù)測(cè)模型建模流程
(1)? 分析任務(wù)中影響攜行航材消耗的各類(lèi)因素,? 提取具有代表性的特征,? 建立特征指標(biāo)體系。
(2)? 統(tǒng)計(jì)收集處理與航材消耗相關(guān)的歷史數(shù)據(jù),? 對(duì)特征進(jìn)行賦值取值,? 并使用GRA, DEMATEL和XGBoost對(duì)特征集合進(jìn)行重要性綜合分析,? 篩選特征,? 構(gòu)建簡(jiǎn)化版特征集合。
(3) 將數(shù)據(jù)集分為訓(xùn)練集和測(cè)試集,? 構(gòu)建XGBoost預(yù)測(cè)模型。
(4) 采用網(wǎng)格搜索法優(yōu)化模型部分參數(shù),? 使用K折交叉法對(duì)XGBoost模型進(jìn)行訓(xùn)練。
(5) 使用測(cè)試集對(duì)調(diào)參后的XGBoost預(yù)測(cè)模型進(jìn)行測(cè)試并進(jìn)行評(píng)價(jià)。
(6) 將預(yù)測(cè)結(jié)果與SVM, GBDT等預(yù)測(cè)結(jié)果和真實(shí)消耗值對(duì)比,? 分析預(yù)測(cè)結(jié)果的特點(diǎn)及預(yù)測(cè)方法之間的差異。模型構(gòu)建流程如圖1所示。
3 攜行航材消耗預(yù)測(cè)特征集合和取值
3.1 建立特征體系
通過(guò)查詢(xún)飛行記錄、 維修記錄、 查閱文獻(xiàn)、 咨詢(xún)專(zhuān)家后,? 分析歸納出內(nèi)在因素、 環(huán)境因素、 任務(wù)因素、 人員因素、 經(jīng)濟(jì)因素、 其他因素等6個(gè)方面的影響因素,? 并按照全局系統(tǒng)、 鮮明穩(wěn)定、 科學(xué)簡(jiǎn)明、 操作靈活、 數(shù)據(jù)可靠等5個(gè)原則選取特征,? 如表1所示。
3.2 提取特征集合
結(jié)合實(shí)際數(shù)據(jù)情況和后續(xù)研究方便,? 對(duì)特征進(jìn)行分析后,? 將飛行員能力、 維修員能力、 管理員能力、 維修資源合并為人員因素一個(gè)特征,? 將可更換單元和通用性合并為可更換性一個(gè)特征。設(shè)有m個(gè)影響攜行數(shù)量的特征變量,? 特征值記作T{T1, T2, T3, …, Tm},? m取值為15,? 歷史消耗量記作Y。具體取值情況如表2所示。
3.3 數(shù)據(jù)來(lái)源
(1)? 分類(lèi)變量取值
T1, T6, T7, T8, T13, T15等均屬于分類(lèi)變量,? 通過(guò)10個(gè)專(zhuān)家和15名部隊(duì)保障人員問(wèn)卷取值。
(2) 飛機(jī)起落架次的取值
通常飛機(jī)起落架次是指離地起飛到落地成功算一次,? 但軍用飛機(jī)有著地沒(méi)有成功再次緊急起飛的特殊情況,? 較為常見(jiàn)的是航空母艦艦載機(jī)的著落,? 或者專(zhuān)門(mén)訓(xùn)練落地連續(xù)起飛的技能,? 每一次起飛都算一個(gè)起落架次,? 另外,? 還存在只啟動(dòng)飛機(jī)并沒(méi)有起飛的情況,? 此時(shí)應(yīng)統(tǒng)計(jì)在飛機(jī)啟動(dòng)次數(shù)中,? 所以飛機(jī)起落架次和啟動(dòng)次數(shù)是前者少于后者。本文為了后續(xù)研究方便將每次啟動(dòng)飛機(jī)都算作一次起落架次。
(3) 人員因素取值
人員因素中特別是飛行員能力對(duì)航材消耗影響較大,? 其他人員也對(duì)航材消耗產(chǎn)生不同程度的影響。由于能夠?qū)嶋H獲得的任務(wù)次數(shù)有限,? 樣本數(shù)據(jù)少,? 為了后續(xù)研究方便和提高模型學(xué)習(xí)的效率和準(zhǔn)確率,? 對(duì)人員相關(guān)特征進(jìn)行降維,? 整合飛行員能力、 管理員能力、 維修員能力、 維修資源四個(gè)維度,? 合成人員因素一個(gè)維度。 人員因素特征指標(biāo)體系如表3所示。 區(qū)分等級(jí):? 將A1、 A2、 A3區(qū)分 {一級(jí)、 二級(jí)、 三級(jí)},?? B1、 B2、 B3、 B7、 B8區(qū)分 {多、 中、 少},? B4區(qū)分{高級(jí)、 中級(jí)、 初級(jí)},? B5、 B6區(qū)分{優(yōu)、 良、 合格},? 將B9區(qū)分{高、 中、 低}。采取模糊層次分析評(píng)價(jià)法[10],? 獲得各次任務(wù)中人員因素綜合量化取值。
(4) 故障率取值
任務(wù)中航材的故障率可視為失效率,? 根據(jù)不同航材類(lèi)別分屬不同的分布函數(shù)[7]。? 可通過(guò)先統(tǒng)計(jì)任務(wù)中航材的MTBF和故障次數(shù),? 擬合分布曲線后,? 獲得參數(shù)帶入公式計(jì)算獲得航材的故障率。計(jì)算方法如表4所示。
(5) 地理環(huán)境取值
參見(jiàn)文獻(xiàn)[17]和相關(guān)記錄對(duì)不同屬性的攜行航材和地形、 地貌、 氣候等進(jìn)行分類(lèi),? 并依據(jù)其屬性采用層次分析法對(duì)其量化,? 該特征體現(xiàn)環(huán)境因素中氣壓、 空氣密度、 光照強(qiáng)度、 天氣狀況、 溫度、 濕度等的綜合影響。具體如表5所示。
4 算例分析
4.1 樣本數(shù)據(jù)和處理
選取已確定的攜行航材中消耗數(shù)量較多的航材作為研究對(duì)象。收集2010~2019年203次任務(wù)的樣本數(shù)據(jù),? 以與起落架次緊密相關(guān)的電子元件J為例,? 部分?jǐn)?shù)據(jù)如表6所示。
4.2 特征重要性測(cè)試和特征篩選
4.2.1 GRA特征重要性排序
對(duì)航材消耗來(lái)講,? 本文所提取的特征已經(jīng)考慮了方便取值和根據(jù)綜合分析影響作用較大的特征,? 即便如此,? 影響因素復(fù)雜多變且相互作用,? 是信息不完全的典型的灰色系統(tǒng)。因此, 使用灰色關(guān)聯(lián)度分析法計(jì)算所提取的特征和航材消耗之間的關(guān)聯(lián)度,? 進(jìn)而對(duì)特征進(jìn)行分析和篩選,? 具體如表7所示。? 4.2.2 XGBoost特征重要性排序
使用XGBoost中g(shù)ain參數(shù)進(jìn)行特征重要性排序,? 其中橫坐標(biāo)為F-score評(píng)價(jià)值,? 縱坐標(biāo)是特征序號(hào)。gain排序表示增益值的排序,? 即模型進(jìn)行特征分裂時(shí)平均訓(xùn)練損失的減少量累加后取值得到的排序, 如圖2所示。
4.2.3 DEMATEL特征重要性排序
取值(0, 1, 2, 3)分別對(duì)應(yīng)(無(wú)影響、 弱影響、 中度影響、 強(qiáng)影響)表現(xiàn)因素之間的直接影響程度。邀請(qǐng)10名航材研究領(lǐng)域?qū)<遥? 15名勤務(wù)保障人員根據(jù)經(jīng)驗(yàn)打分,? 判斷各特征間的影響關(guān)系,? 得到直接影響矩陣,? 進(jìn)一步求得影響度r、 被影響度c、 原因度n、 中心度m,? 如表8所示。
4.2.4 特征重要性綜合分析和精簡(jiǎn)
對(duì)上述排序匯總四舍五入取平均值,? 如表9所示。對(duì)比排序結(jié)果結(jié)合實(shí)際情況進(jìn)行分析。
(1)? 三種方法重要性排序結(jié)果大部分特征總體相差不大,? XGBoost和GRA排序結(jié)果基本一致,? 三種方法T2,
T3, T4, T5, T14相差較大。T7,? GRA與DEMATEL排序相同。? T8,? XGBoost與DEMATEL相差不大。? T2、 T3和T14,? XGBoost與GRA排序相差不大。
(2) T2和T3兩個(gè)特征對(duì)航材消耗影響較大,? 即使是定性分析也應(yīng)該排序靠前,? 但DEMATEL排序靠后,? 這正顯示出該方法如果只參照中心度分析的弊端,? 因?yàn)檫@兩個(gè)因素均是影響因素,? 而且僅影響T4,? 稍微影響T6,? 不受其他因素影響,? 結(jié)果會(huì)排名靠后,? 因此需結(jié)合定量分析避免這種偏差。
(3)? T4主要表現(xiàn)航材內(nèi)部可靠性水平的影響因素,? T5幾乎對(duì)除去溫度一類(lèi)客觀因素之外其他特征都產(chǎn)生影響,? 在定性分析時(shí)都給予了足夠的重視,? T14是溫度、 濕度等綜合量化的特征,? 也是同樣的情況,? 數(shù)據(jù)分析時(shí),? 因?yàn)閷?shí)際任務(wù)執(zhí)行環(huán)境變化不大,? 數(shù)值變化較少,? 定量分析結(jié)果排序靠后。
(4) T7和T8在定量分析時(shí)因?yàn)槭欠诸?lèi)數(shù)值,?? T8由于是電子元件各類(lèi)任務(wù)中安裝時(shí)的壽命時(shí)期和可更換性相對(duì)一致,? 數(shù)值變化不大,? 這與電子元件壽命規(guī)律符合指數(shù)分布的實(shí)際相符,? 而T7排在最后是因?yàn)橐呀?jīng)確定攜帶的航材對(duì)可更換性能的高低被認(rèn)為并不重要,? 且電子元件體積較少,? 拆卸安裝攜帶都比較方便。
(5) 綜合排序,? 綜合定性分析和定量分析的結(jié)果,? 可得到新的排序。為提高模型預(yù)測(cè)效率,? 充分分析排序后,? 可去掉T6, T7, T8, T13, T15等5個(gè)特征,? 得到精簡(jiǎn)版特征:? T1, T2, T3, T4, T5, T9, T10, T11, T12, T14共10個(gè)。
4.3 XGBoost模型調(diào)參和訓(xùn)練
對(duì)XGBoost模型利用交叉驗(yàn)證法和網(wǎng)格搜索法對(duì)數(shù)據(jù)集訓(xùn)練和參數(shù)尋優(yōu),? XGBoost 模型參數(shù)取值情況如表10所示。調(diào)參后利用訓(xùn)練好的模型分別進(jìn)行了60個(gè)樣本、 40個(gè)樣本、 20個(gè)樣本的測(cè)試,? 得到對(duì)比圖和調(diào)參前后的預(yù)測(cè)圖,? 具體如圖3~8所示??梢灾庇^看到測(cè)試集數(shù)量越少,? 預(yù)測(cè)結(jié)果相對(duì)越好,? 參數(shù)調(diào)優(yōu)后,? 預(yù)測(cè)準(zhǔn)確率得到提高。
4.4 試驗(yàn)結(jié)果對(duì)比和分析
利用訓(xùn)練好的XGBoost模型與實(shí)際值以及GBDT, SVM等預(yù)測(cè)結(jié)果進(jìn)行實(shí)驗(yàn)對(duì)比。采用較常用的均方根差RMSR、 平均絕對(duì)誤差MAE、 均值百分比誤差MAPE,? 進(jìn)行對(duì)比。從表11、 圖9~10可以直觀看到三個(gè)指標(biāo)XGBoost模型都比其他兩種方法要好。
5 結(jié) 束 語(yǔ)
本文通過(guò)綜合考慮任務(wù)中對(duì)攜行航材消耗的各類(lèi)影響因素,? 提取特征后,? 采用XGBoost, GRA與DEMATEL等方法定性和定量相結(jié)合,? 對(duì)特征進(jìn)行重要性分析和篩選,? 精簡(jiǎn)特征集合,? 建立基于集成學(xué)習(xí)XGBoost算法的攜行航材消耗預(yù)測(cè)模型。一方面,? 該模型可綜合考慮多因素非線性影響問(wèn)題,? 在樣本數(shù)量不夠多的情況下,? 通過(guò)網(wǎng)格搜索法調(diào)參可有效避免過(guò)擬合且提升準(zhǔn)確率;? 另一方面,? 使用精簡(jiǎn)后的特征集合和調(diào)參后的XGBoost模型,? 其預(yù)測(cè)效果相比于GBDT和SVM模型,? 效率和精度都得到提升。但本文的數(shù)據(jù)集仍稍顯不足,? 在后續(xù)研究中,? 需加強(qiáng)數(shù)據(jù)的收集或結(jié)合相關(guān)算法科學(xué)擴(kuò)增數(shù)據(jù),? 這將進(jìn)一步提升預(yù)測(cè)的準(zhǔn)確性和可靠性;? 此外,? XGBoost模型參數(shù)優(yōu)化方法不限于網(wǎng)格搜索法,? 可在后續(xù)研究中進(jìn)行其他優(yōu)化方法的嘗試,? 可能取得更好的效果。
參考文獻(xiàn):
[1] 宋傳洲,? 王瑞奇,? 劉戰(zhàn). 面向任務(wù)攜行航材消耗影響因素研究[J]. 航空維修與工程,? 2020(8): 68-71.
Song Chuanzhou,? Wang Ruiqi,? Liu Zhan. Research on the Influencing Factors of Consumption for Mission-Oriented Carrying Aviation Materials[J]. Aviation Maintenance & Engineering,? 2020(8): 68-71.(in Chinese)
[2] 張金. 金匯直升機(jī)航材采購(gòu)管理研究[D].上海:東華大學(xué),? 2018.
Zhang Jin. The Research of Kingwing Aircraft Spares Purchasing Managment[D]. Shanghai: Donghua University,? 2018. (in Chinese)
[3] 郭峰,? 劉臣宇,? 李衛(wèi)靈. 基于指數(shù)平滑法的航材消耗定額預(yù)測(cè)研究[J]. 計(jì)算機(jī)與現(xiàn)代化,? 2012(9): 163-165.
Guo Feng,? Liu Chenyu,? Li Weiling. Research on Spares Consumption Quota Prediction Based on Exponential Smoothing Method[J]. Computer and Modernization,? 2012(9): 163-165.(in Chinese)
[4] 趙建忠,? 徐廷學(xué),? 葛先軍,? 等. 基于小波變換和GM-ARMA的導(dǎo)彈備件消耗預(yù)測(cè)[J]. 北京航空航天大學(xué)學(xué)報(bào),? 2013,? 39(4): 553-558.
Zhao Jianzhong,? Xu Tingxue,? Ge Xianjun,? et al. Consumption Forecasting of Missile Spare Parts Based on Wavelet Transform and Revised GM-ARMA Model[J]. Journal of Beijing University of Aeronautics and Astronautics,? 2013,? 39(4): 553-558.(in Chinese)
[5] 趙建忠,? 徐廷學(xué),? 尹延濤,? 等. 基于改進(jìn)GM(1,? 1)模型的導(dǎo)彈備件消耗預(yù)測(cè)[J]. 裝備環(huán)境工程,? 2012,? 9(3): 48-51.
Zhao Jianzhong,? Xu Tingxue,? Yin Yantao,? et al. Consumption Forecasting of Missile Spare Parts Based on Improved GM(1,? 1) Model[J]. Equipment Environmental Engineering,? 2012,? 9(3): 48-51. (in Chinese)
[6] 張永莉,? 梁京. 航材需求預(yù)測(cè)方法研究綜述及啟示[J]. 中國(guó)民航大學(xué)學(xué)報(bào),? 2014,? 32(1): 92-96.
Zhang Yongli,? Liang Jing. Overview and Enlightenment of Demand Forecasting Method Research about Aircraft Spare Parts[J]. Journal of Civil Aviation University of China,? 2014,? 32(1): 92-96.(in Chinese)
[7] 車(chē)飛,? 陳云翔,? 高山,? 等. 基于作戰(zhàn)任務(wù)的多機(jī)種故障備件需求模型[J]. 火力與指揮控制,? 2012,? 37(7): 80-83.
Che Fei,? Chen Yunxiang,? Gao Shan,? et al. Failure Spares Demand Model for Multi-Type Aircraft Based on Operational Mission[J]. Fire Control & Command Control,? 2012,? 37(7): 80-83.(in Chinese)
[8] 邵雨晗,? 辛后居,? 高輝,? 等. 基于灰色神經(jīng)網(wǎng)絡(luò)的航空裝備作戰(zhàn)攜行量預(yù)測(cè)[J]. 數(shù)學(xué)的實(shí)踐與認(rèn)識(shí),? 2016,? 46(20): 62-68.
Shao Yuhan,? Xin Houju,? Gao Hui,? et al. The Prediction of Aviation Equipment Carried Quantity in Wartime Based on Gery Neural Network[J]. Mathematics in Practice and Theory,? 2016,? 46(20): 62-68.(in Chinese)
[9] 王梓行,? 韓維,? 蘇析超. 多因素影響下艦載機(jī)備件需求的組合預(yù)測(cè)[J]. 海軍航空工程學(xué)院學(xué)報(bào),? 2016,? 31(4): 456-460.
Wang Zihang,? Han Wei,? Su Xichao. Combination Forecast of Spare Parts Demand for Carrier-Based Aircraft under Influence of Multiple Factors[J]. Journal of Naval Aeronautical and Astronautical University,? 2016,? 31(4): 456-460.(in Chinese)
[10] Parsa A B,? Movahedi A,? Taghipour H,? et al. Toward Safer Highways,? Application of XGBoost and SHAP for Real-Time Accident Detection and Feature Analysis[J]. Accident Analysis & Prevention,? 2020,? 136: 105405.
[11] 肖躍雷,? 張?jiān)茓? 基于特征選擇和超參數(shù)優(yōu)化的恐怖襲擊組織預(yù)測(cè)方法[J]. 計(jì)算機(jī)應(yīng)用,? 2020,? 40(8): 2262-2267.
Xiao Yuelei,? Zhang Yunjiao. Terrorist Attack Organization Prediction Method Based on Feature Selection and Hyperparameter Optimization[J]. Journal of Computer Applications,? 2020,? 40(8): 2262-2267. (in Chinese)
[12] Teng Y X,? Zhao H G,? Yang J,? et al. Water Traffic Safety Evaluation Based on the Grey Correlation Grade Analysis[J]. Applied Mechanics and Materials,? 2014,? 571/572: 295-298.
[13] Yazdi M,? Khan F,? Abbassi R,? et al. Improved DEMATEL Methodology for Effective Safety Management Decision-Making[J]. Safety Science,? 2020,? 127: 104705.
[14] 王名豪,? 梁雪春. 基于CPSO-XGboost的個(gè)人信用評(píng)估[J]. 計(jì)算機(jī)工程與設(shè)計(jì),? 2019,? 40(7): 1891-1895.
Wang Minghao,? Liang Xuechun. Personal Credit Evaluation Based on CPSO-XGboost[J]. Computer Engineering and Design,? 2019,? 40(7): 1891-1895.(in Chinese)
[15] Chen T Q,? Guestrin C. XGBoost: A Scalable Tree Boosting System[C]∥Proceedings of the 22nd ACM SIGKDD International Conference on Knowledge Discovery and Data Mining,? 2016: 785-794.
[16] Li C B,? Zheng X S,? Yang Z K,? et al. Predicting Short-Term Electricity Demand by Combining the Advantages of ARMA and XGBoost in Fog Computing Environment[J]. Wireless Communications and Mobile Computing,? 2018,? 2018: 1-18.
[17] 陳博,? 徐常凱,? 任佳成. 基于灰色神經(jīng)網(wǎng)絡(luò)的攜行航材消耗預(yù)測(cè)[J]. 指揮信息系統(tǒng)與技術(shù),? 2018,? 9(5): 86-90.
Chen Bo,? Xu Changkai,? Ren Jiacheng. Consumption Prediction of Carried Aviation Material Based on Grey Neural Network[J]. Command Information System and Technology,? 2018,? 9(5): 86-90.(in Chinese)
A Mission-Oriented Aircraft Spare Parts Carried Consumption
Prediction Method Based on XGBoost-GRA-DEMATEL
Song Chuanzhou1*,? Wang Ruiqi1,? Li Tianqing1,? Liu Ke1,? Yin Wenguang2
(1. Naval Aviation University,? Yantai? 264000,?? China;
2. Unit 91423 of PLA,?? Yantai 264000,?? China)
Abstract:? In order to improve the scientificity of the quantity guarantee of aircraft spare parts carried during the? mission and fully consider all kinds of influencing factors in the mission,?? the XGBoost algorithm is adopted to predict the demand of aircraft spare parts carried. Firstly,?? various factors affecting? aircraft spare parts consumption in different missions are analyzed,?? and a predictive feature system is established according to the principles of comprehensiveness, systematization, science and conciseness. Secondly,?? GRA, XGBoost, DEMATEL algorithm are used to analyze and screen the importance and relevance of features,?? and a simplified version of feature system is established. Thirdly,?? the grid search method is used to adjust parameters to improve the accuracy and efficiency of model prediction. Finally,?? through example analysis and comparative analysis with GBDT, SVM algorithms,?? it is verified that this method can reduce the prediction error and avoid over fitting in the case of limited sample data and many influencing factors,?? and has good practicability and efficiency.
Key words:?? XGBoost;? mission-oriented;? aircraft spare parts carried;?? consumption prediction;?? GRA;? DEMATEL; prediction method