亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于Adaptive Lasso與RF的航班運(yùn)行風(fēng)險(xiǎn)預(yù)測(cè)改進(jìn)研究

        2018-09-10 10:26:36王巖韜陳冠銘楊遠(yuǎn)浩
        關(guān)鍵詞:模型

        王巖韜,陳冠銘,劉 毓,楊遠(yuǎn)浩,趙 航

        (中國(guó)民航大學(xué)國(guó)家空管運(yùn)行安全技術(shù)重點(diǎn)實(shí)驗(yàn)室,天津300300)

        0 引言

        航班運(yùn)行是一個(gè)連續(xù)動(dòng)態(tài)過(guò)程,其影響因素種類(lèi)、形式、數(shù)目繁多,運(yùn)行風(fēng)險(xiǎn)隨條件不斷改變.面對(duì)此復(fù)雜系統(tǒng),構(gòu)建科學(xué)的評(píng)估和預(yù)測(cè)方法是提高安全水平的必要措施.歐美民航安全管理和風(fēng)險(xiǎn)定量研究在2000年后已有成果,但因國(guó)內(nèi)和歐美運(yùn)行環(huán)境相差巨大,導(dǎo)致模型無(wú)法移植使用[1-3].國(guó)內(nèi)民航對(duì)航班運(yùn)行安全的研究于2010年后起步,從孫瑞山教授開(kāi)始至王巖韜等,已完成從研究方向、預(yù)期目標(biāo)、解決方案等多方面完整探索[4-5].2015年下發(fā)的咨詢(xún)通告《航空承運(yùn)人運(yùn)行控制風(fēng)險(xiǎn)管控系統(tǒng)實(shí)施指南》作為研究成果的典型應(yīng)用,標(biāo)志著中國(guó)民航已建立了通用性、示范性的航班風(fēng)險(xiǎn)評(píng)估體系.截止2018年初,國(guó)內(nèi)52家運(yùn)輸航空公司以此前研究為基礎(chǔ)開(kāi)發(fā)了航班運(yùn)行風(fēng)險(xiǎn)控制系統(tǒng),使用核心算法包含模糊隸屬函數(shù)、風(fēng)險(xiǎn)矩陣、支持向量機(jī)和概率論等[6].上述方法存在部分缺陷,例如過(guò)度依賴(lài)專(zhuān)家主觀(guān)評(píng)價(jià)等已在文獻(xiàn)[7-8]中詳細(xì)論述.目前在一線(xiàn)應(yīng)用中亟待解決問(wèn)題還包括:第一,由于評(píng)估項(xiàng)目數(shù)量多、計(jì)算過(guò)于復(fù)雜,致使響應(yīng)速度慢,無(wú)法滿(mǎn)足使用需求;第二,在訓(xùn)練樣本得到較高精度的基礎(chǔ)上,測(cè)試和應(yīng)用精度有時(shí)反而降低,即出現(xiàn)了過(guò)擬合現(xiàn)象.目前實(shí)踐應(yīng)用中日運(yùn)行精度處于[0.782,0.875]之間,計(jì)算精度不高且穩(wěn)定性不足[7-8].

        基于上述情況,利用Adaptive Lasso擅長(zhǎng)處理高維變量及RF有效處理過(guò)度擬合的特點(diǎn)[9],建立Adaptive Lasso與RF的二階段混合預(yù)測(cè)模型,使用某航450組航班運(yùn)行數(shù)據(jù),驗(yàn)證模型可用性.通過(guò)與PCA、RBF神經(jīng)網(wǎng)絡(luò)、SVM進(jìn)行對(duì)比,驗(yàn)證方案有效性和可靠性,旨在為航班運(yùn)行風(fēng)險(xiǎn)管控工作探索有效、快捷、準(zhǔn)確、穩(wěn)定的預(yù)測(cè)技術(shù).

        1 樣本數(shù)據(jù)

        1.1 數(shù)據(jù)選取

        如文獻(xiàn)[6]中詳述,某航將運(yùn)行總風(fēng)險(xiǎn)分為機(jī)組方面、飛機(jī)方面、進(jìn)近著陸階段威脅3大類(lèi)共63項(xiàng)影響因素.精選該航2017年風(fēng)控系統(tǒng)歷史數(shù)據(jù)共450組,包含風(fēng)險(xiǎn)高、中、低3級(jí)各150組;由飛行、簽派、機(jī)務(wù)等專(zhuān)家逐一檢驗(yàn),發(fā)現(xiàn)其中18組存在偏差,經(jīng)專(zhuān)家組商議并修正結(jié)果后,該450組航班數(shù)據(jù)作為標(biāo)準(zhǔn)樣本集合,如表1所示.

        表1 航班運(yùn)行風(fēng)險(xiǎn)數(shù)據(jù)集合Table 1 Flight operations risk standard data set

        1.2 應(yīng)用分析

        在實(shí)踐應(yīng)用中,各因素需在數(shù)據(jù)接入層提取,先做單因素評(píng)判,再遞進(jìn)向上計(jì)算總風(fēng)險(xiǎn),具體如圖1所示.根據(jù)某航信息和運(yùn)控部門(mén)實(shí)測(cè),平均航班運(yùn)算結(jié)果更新耗時(shí)3.6 s,響應(yīng)速度不能滿(mǎn)足運(yùn)行人員使用需求;此外,現(xiàn)有系統(tǒng)預(yù)測(cè)結(jié)果穩(wěn)定性不足,部分時(shí)段其計(jì)算精度低于80%,而在亟需查找原因糾正錯(cuò)誤時(shí),評(píng)判因素越多,難度越大[5].綜上,下節(jié)采用Adaptive lasso算法進(jìn)行降維,以求精減評(píng)估指標(biāo)項(xiàng).

        2 指標(biāo)降維

        2.1 算法簡(jiǎn)介

        Adaptive Lasso是一種高維數(shù)據(jù)線(xiàn)性回歸方法,本質(zhì)是改進(jìn)的兩步法Lasso[10].定義β=(β1,β2,…,βm)T是回歸系數(shù);Aj=(a1j,a2j,…,anj)T是預(yù)測(cè)變量,其中j=1,2,…,m;Y=(y1,y2,…,yn)T是響應(yīng)變量.對(duì)所有的非負(fù)的常規(guī)參數(shù)λn,求解Adaptive Lasso問(wèn)題公式為,其中,;為普通最小二乘法所得系數(shù)估計(jì)值.

        圖1 風(fēng)險(xiǎn)管控系統(tǒng)業(yè)務(wù)和數(shù)據(jù)架構(gòu)Fig.1 Risk control system dynamic business and data architecture

        2.2 降維計(jì)算

        此處,利用RGui軟件對(duì)63個(gè)風(fēng)險(xiǎn)指標(biāo)進(jìn)行計(jì)算,得到性能價(jià)格比Cp值,如表2所示.Cp值用來(lái)衡量多重共線(xiàn)性,其值越小越好.

        表2 各指標(biāo)Cp值Table 2Cpvalue of indicators

        由表2可知,在R程序運(yùn)算過(guò)程中,Cp最小值為12.869,此時(shí)總風(fēng)險(xiǎn)有效影響因素共有15個(gè),分別為機(jī)組配合程度X1、機(jī)長(zhǎng)經(jīng)驗(yàn)?zāi)芰2、副駕駛經(jīng)驗(yàn)?zāi)芰3、機(jī)組疲勞程度X4、機(jī)組壓力程度X5、機(jī)齡X6、MEL/CDL風(fēng)險(xiǎn)X7、起飛機(jī)場(chǎng)天氣風(fēng)險(xiǎn)X8、起飛機(jī)場(chǎng)條件風(fēng)險(xiǎn)X9、著陸機(jī)場(chǎng)天氣風(fēng)險(xiǎn)X10、著陸機(jī)場(chǎng)條件風(fēng)險(xiǎn)X11、航路風(fēng)險(xiǎn)X12、航路備降機(jī)場(chǎng)天氣風(fēng)險(xiǎn)X13、航路備降機(jī)場(chǎng)條件風(fēng)險(xiǎn)X14和特殊運(yùn)行種類(lèi)(二放、極地、延程運(yùn)行等)X15.

        3 精度分析

        以X1~X15為指標(biāo)體系,使用支持向量機(jī)算法,取400組航班標(biāo)準(zhǔn)數(shù)據(jù)作為訓(xùn)練集,剩余50組作為測(cè)試集.使用Matlab中LibSVM函數(shù),參數(shù)優(yōu)選使用SVMcgForClass,最優(yōu)懲罰因子e和核參數(shù)g通過(guò)交叉驗(yàn)證法確定,具體計(jì)算過(guò)程如文獻(xiàn)[5],得到樣本訓(xùn)練分類(lèi)正確率為85.6%,同時(shí)確定e=3.042 1,g=0.562 43.

        更新模型參數(shù)為最優(yōu)e和g后,如圖2和圖3所示,測(cè)試結(jié)果正確率僅為84%,與文獻(xiàn)[5]中情況類(lèi)似,訓(xùn)練優(yōu)化后得到測(cè)試精度無(wú)實(shí)質(zhì)提升.進(jìn)一步分析發(fā)現(xiàn),上述指標(biāo)中存在部分交叉關(guān)系,例如X15是綜合了X10~X14限制條件下制定所得的飛行方案,而X4與X5也可能存在相互轉(zhuǎn)化現(xiàn)象.因此推斷模型過(guò)度訓(xùn)練和學(xué)習(xí)了數(shù)據(jù)中噪音,產(chǎn)生了過(guò)擬合運(yùn)算現(xiàn)象.下節(jié)采用RF方法防止過(guò)擬合,使用RF處理前后的計(jì)算結(jié)果進(jìn)行驗(yàn)證分析.

        圖2 參數(shù)優(yōu)選結(jié)果(3D視圖)Fig.2 Parameter optimization results(3D view)

        4 防過(guò)擬合

        4.1 變量重要性計(jì)算

        RF可較好地處理異常值和噪聲,對(duì)樣本依賴(lài)小,能較好地解決多級(jí)分類(lèi)問(wèn)題,且不容易出現(xiàn)過(guò)擬合[11].

        航班風(fēng)險(xiǎn)變量重要性的衡量標(biāo)尺是各變量Xi導(dǎo)致結(jié)果的不純度.不純度計(jì)算公式為其中Q代表目標(biāo)變量的類(lèi)別總數(shù),P(k/t)代表在節(jié)點(diǎn)t中第k類(lèi)目標(biāo)變量的條件概率.計(jì)算每棵樹(shù)中以Xi為分裂變量節(jié)點(diǎn)的不純度下降值,再將所有樹(shù)的結(jié)果進(jìn)行平均,從而得到Xi不純度的平均下降值,下降越多則表示該變量越重要.通過(guò)SPSS Modeler評(píng)分系統(tǒng)對(duì)重要度進(jìn)行打分,結(jié)果如表3所示.

        圖3 風(fēng)險(xiǎn)等級(jí)分類(lèi)圖Fig.3 Parameter optimization results(3D view)

        表3 指標(biāo)重要度分值及排序Table 3 Index importance score and ranking

        由表3分析可見(jiàn),運(yùn)行環(huán)境方面包括X8~X14,重要度總分值達(dá)到37.17,對(duì)總風(fēng)險(xiǎn)影響最大,其中著陸機(jī)場(chǎng)天氣風(fēng)險(xiǎn)X11最為顯著;飛行機(jī)組相關(guān)包括X1~X5,重要度分值達(dá)到 34.65,機(jī)長(zhǎng)經(jīng)驗(yàn)X2和機(jī)組疲勞X4影響最為明顯.

        4.2 誤差計(jì)算

        在處理航班運(yùn)行風(fēng)險(xiǎn)模型過(guò)擬合問(wèn)題時(shí),在篩選變量過(guò)程中依次剔除表3中重要度分值最低的變量,再將剩余數(shù)據(jù)代入SPSS Modeler;同理計(jì)算14次后,可得到變量數(shù)為4~15的均方根誤差和相對(duì)誤差,如表4所示.可見(jiàn)當(dāng)變量數(shù)為12時(shí),預(yù)測(cè)結(jié)果的均方根誤差和相對(duì)誤差最小,穩(wěn)定性最佳.故在Adaptive Lasso算法篩選結(jié)果后,再剔除航路備降機(jī)場(chǎng)天氣風(fēng)險(xiǎn)X13、航路備降機(jī)場(chǎng)條件風(fēng)險(xiǎn)X14和特殊運(yùn)行X15,保留有效變量12項(xiàng).

        表4 各變量數(shù)的誤差值Table 4 Error value of variable number

        4.3 混合預(yù)測(cè)模型

        RF作為一種機(jī)器學(xué)習(xí)方法,自身具有評(píng)估和預(yù)測(cè)計(jì)算能力.為達(dá)到降維和防止過(guò)擬合的雙重目的,此處使用bootstrap抽樣技術(shù),從Adaptive Lasso篩選后樣本抽取訓(xùn)練子集,對(duì)每一子集進(jìn)行決策樹(shù)建模,最后再組合所有決策樹(shù)的預(yù)測(cè)結(jié)果.根據(jù)少數(shù)服從多數(shù)的原則,投票得出最終航班運(yùn)行風(fēng)險(xiǎn)預(yù)測(cè)結(jié)論.

        5 對(duì)比算法

        5.1 PCA模型

        在以往航班風(fēng)險(xiǎn)研究中,為了全面系統(tǒng)地分析問(wèn)題,盡可能完整地搜集信息,每個(gè)觀(guān)測(cè)對(duì)象往往包括多指標(biāo)和變量,之間存在相關(guān)性,因此統(tǒng)計(jì)數(shù)據(jù)反映出的信息是有部分重疊的.PCA是將相關(guān)的指標(biāo)轉(zhuǎn)化成不相關(guān)的指標(biāo),避免信息重疊,達(dá)到利用較少新變量代替較多舊變量的降維目的[12].

        主成分?jǐn)?shù)學(xué)模型為

        求得相關(guān)系數(shù)矩陣的特征值及主成分貢獻(xiàn)率,如表5所示,以方差累計(jì)貢獻(xiàn)率大于99%為主成分提取標(biāo)準(zhǔn),選取前4個(gè)主成分.

        表5 RF處理前后的主成分Table 5 Principal component before and after RF

        RF防過(guò)擬合處理前,主成分1包含X1~X3、X7~X11、X13;主成分2 包含X3~X6、X8;主成分 3包含X10、X12、X15;主成分4包含X1、X13、X14.根據(jù)特征根及對(duì)應(yīng)特征向量可計(jì)算得到主成分載荷,構(gòu)建主成分與風(fēng)險(xiǎn)各因素的線(xiàn)性關(guān)系式如下.

        5.2 RBF模型

        徑向基函數(shù)(Radial Basis Function,RBF)神經(jīng)網(wǎng)絡(luò)由3層組成,包括輸入層、隱含層和輸出層.隱含層的神經(jīng)元數(shù)目由具體問(wèn)題而定,輸入層節(jié)點(diǎn)只傳遞輸入信號(hào)到隱含層,隱含層節(jié)點(diǎn)由高斯函數(shù)構(gòu)成,輸出層節(jié)點(diǎn)通常是簡(jiǎn)單的線(xiàn)性函數(shù)[13].

        本處RBF使用newrb和newgrnn兩種進(jìn)行計(jì)算.newrb函數(shù)調(diào)用式為net=newrb(P,T,goal,spread,MN,DF),其中P為輸入向量,T為輸出向量,goal為均方誤差的目標(biāo),spread為徑向基的擴(kuò)展速度,MN為最大的神經(jīng)元個(gè)數(shù),DF是每次加進(jìn)的網(wǎng)絡(luò)參數(shù).返回值是不斷嘗試得到的,創(chuàng)建網(wǎng)絡(luò)后不斷增加中間層數(shù)量和神經(jīng)元數(shù)目,直到輸出誤差可接受為止.Newgrnn具有很強(qiáng)的非線(xiàn)性映射能力和學(xué)習(xí)速度,函數(shù)調(diào)用式為net=newrb(P,T,spread),網(wǎng)絡(luò)最后普遍收斂于樣本量集聚較多的回歸.

        使用Matlab反復(fù)訓(xùn)練得到,在隱含層神經(jīng)元個(gè)數(shù)等于7時(shí),網(wǎng)絡(luò)輸出結(jié)果的均方誤差僅為0.009 432 9,此時(shí)精度最高,即得到7-30-1結(jié)構(gòu)的最優(yōu)RBF網(wǎng)絡(luò)模型.

        6 結(jié)果分析

        在 Adaptive Lasso 降維所得指標(biāo)X1~X15基礎(chǔ)上,根據(jù)表1標(biāo)準(zhǔn)航班數(shù)據(jù)集合,對(duì)RF處理前后兩類(lèi)情況分別使用混合算法、主成分分析、RBF兩種方法、支持向量機(jī)進(jìn)行仿真計(jì)算,將預(yù)測(cè)結(jié)果與實(shí)際值的相對(duì)誤差進(jìn)行對(duì)比,如表6、圖4和圖5所示.

        為保證驗(yàn)證準(zhǔn)確性和合理性,引入K折交叉驗(yàn)證(K-fold Cross Validation,K-CV)評(píng)估模型預(yù)測(cè)精度.K-CV可以有效地避免過(guò)學(xué)習(xí)及欠學(xué)習(xí),此處使用十折交叉驗(yàn)證,即將初始采樣分割成K=10個(gè)子樣本,每個(gè)子樣本都作為一次驗(yàn)證數(shù)據(jù),其他9個(gè)樣本用來(lái)訓(xùn)練.交叉驗(yàn)證重復(fù)10次,最終取平均結(jié)果得到估測(cè)值.

        圖4 RF處理前各種方法預(yù)測(cè)值相對(duì)誤差Fig.4 Relative errors of various methods predicted values before RF

        圖5 RF處理后各種方法預(yù)測(cè)值相對(duì)誤差Fig.5 Relative errors of various methods predicted values after RF

        表6 RF處理前后各種方法結(jié)果匯總對(duì)比Table 6 Summary comparison of various methods predicted values after RF

        由表6可知,使用Adaptive Lasso篩選掉48項(xiàng)指標(biāo)后的平均精度高于90%,預(yù)測(cè)精度不降反升,說(shuō)明Adaptive Lasso對(duì)航班風(fēng)險(xiǎn)預(yù)測(cè)問(wèn)題可有效降維;經(jīng)RF處理后,經(jīng)RF處理后,5種方法所得精度有明顯增長(zhǎng),均優(yōu)于當(dāng)前87.5%的日運(yùn)行精度,尤其對(duì)于支持向量機(jī)方法,精度相比文獻(xiàn)[5]有了大幅提升,說(shuō)明隨機(jī)森林方法可有效防止模型過(guò)度擬合,對(duì)處理航班風(fēng)險(xiǎn)預(yù)測(cè)問(wèn)題有較強(qiáng)適應(yīng)性;Adaptive Lasso-RF混合算法的預(yù)測(cè)精度可高達(dá)95.91%,優(yōu)于主成分分析和RBF神經(jīng)網(wǎng)絡(luò),也優(yōu)于目前風(fēng)控工作普遍使用的風(fēng)險(xiǎn)矩陣和支持向量機(jī)方法;同時(shí),混合模型的CV值僅為1.45,是各類(lèi)方法測(cè)得結(jié)果的最低值,說(shuō)明其預(yù)測(cè)穩(wěn)定性也為最優(yōu).

        7 結(jié)論

        (1)航班風(fēng)險(xiǎn)與運(yùn)行環(huán)境的相關(guān)性最為顯著,其中著陸機(jī)場(chǎng)天氣對(duì)風(fēng)險(xiǎn)影響最大;航班風(fēng)險(xiǎn)與飛行機(jī)組的相關(guān)性排名次之,機(jī)長(zhǎng)經(jīng)驗(yàn)與機(jī)組疲勞是導(dǎo)致風(fēng)險(xiǎn)變大的重要因素.

        (2)Adaptive Lasso算法可以將航班運(yùn)行風(fēng)險(xiǎn)指標(biāo)從63項(xiàng)有效降維至15項(xiàng),且不影響預(yù)測(cè)結(jié)果精度.

        (3)隨機(jī)森林方法對(duì)處理航班風(fēng)險(xiǎn)預(yù)測(cè)問(wèn)題有較強(qiáng)適應(yīng)性,可以有效防止模型過(guò)度擬合,提高結(jié)果精度.

        (4)Adaptive Lasso-RF混合算法在預(yù)測(cè)精度上明顯優(yōu)于主成分分析、RBF網(wǎng)絡(luò)、風(fēng)險(xiǎn)矩陣和支持向量機(jī)等方法,且預(yù)測(cè)穩(wěn)定性最佳.

        猜你喜歡
        模型
        一半模型
        一種去中心化的域名服務(wù)本地化模型
        適用于BDS-3 PPP的隨機(jī)模型
        提煉模型 突破難點(diǎn)
        函數(shù)模型及應(yīng)用
        p150Glued在帕金森病模型中的表達(dá)及分布
        函數(shù)模型及應(yīng)用
        重要模型『一線(xiàn)三等角』
        重尾非線(xiàn)性自回歸模型自加權(quán)M-估計(jì)的漸近分布
        3D打印中的模型分割與打包
        成人国产一区二区三区| 久久色悠悠亚洲综合网| av网站免费观看入口| 久久久久久自慰出白浆| 日韩精品一区二区三区免费视频| 无码久久流水呻吟| 亚洲综合色视频在线免费观看| 亚洲精品国产av成人精品| 日韩欧美人妻一区二区三区| 亚洲区小说区图片区| 一区二区三区精品偷拍av| 久久国产精品亚洲va麻豆| 亚洲日韩av无码| 天天综合久久| 中文字幕日韩一区二区不卡| 国产在线观看免费视频软件| 国内精品自在自线视频| 亚洲人成人一区二区三区| 亚洲精品久久麻豆蜜桃| 国产69精品久久久久9999apgf| 国产在线精品一区二区| 国产精品日日摸夜夜添夜夜添| 狼人精品剧情av在线观看| 国产精品精品自在线拍| 亚洲AV无码一区二区三区日日强 | 天天澡天天揉揉AV无码人妻斩| 精品极品视频在线观看| 黄桃av无码免费一区二区三区| 97精品伊人久久大香线蕉app| 蜜桃视频免费在线视频| 国产精品国产三级国产av18| 国产色无码精品视频国产| 国产午夜精品福利久久| 精品久久中文字幕一区| 无码人妻aⅴ一区二区三区| 亚洲AV成人无码久久精品老人| 日本在线播放不卡免费一区二区| 日日噜噜夜夜狠狠视频| 亚洲欧美日韩国产精品专区| 亚洲人成绝费网站色www| 久久女人精品天堂av影院麻|