張啟凡 王永忠 王圣堂 裴柯欣
(中國(guó)民用航空飛行學(xué)院空中交通管理學(xué)院 廣漢 618300)
受到管制、天氣等因素的影響,航班延誤的情況時(shí)有發(fā)生。由于造成航班延誤有很多潛在且不確定的因素,所以目前還未有有效的方法可以避免航班的大面積延誤。因此,對(duì)于航班延誤時(shí)長(zhǎng)的預(yù)測(cè)可以為管制放行的決策提供指導(dǎo)。國(guó)內(nèi)外學(xué)者根據(jù)航班延誤中的不確定因素,建立了諸多模型[1~7]并對(duì)其進(jìn)行大量的預(yù)測(cè)研究。
研究表明航班延誤中天氣因素大約占到65%,本文基于前人的研究,主要基于氣象數(shù)據(jù)并考慮包括氣候、季節(jié)、交通需求在內(nèi)的周期性因素對(duì)航班延誤時(shí)長(zhǎng)的影響[8],通過(guò)對(duì)歷史數(shù)據(jù)的分析,建立考慮周期性波動(dòng)因素的神經(jīng)網(wǎng)絡(luò)模型,用于未來(lái)時(shí)間內(nèi)航班延誤時(shí)長(zhǎng)的預(yù)測(cè)。
本文所選取的氣象數(shù)據(jù)采集于航空例行天氣報(bào)告(METAR),報(bào)文來(lái)源于 INPE's BDM website。依據(jù)METAR報(bào)文中各氣象要素的編碼格式和氣象電報(bào)術(shù)語(yǔ)對(duì)報(bào)文進(jìn)行解析。
1)利用正則表達(dá)式按各氣象要素的編碼格式從METAR中提?。簳r(shí)間、地面風(fēng)向、風(fēng)速、云底高、云量、修正海壓、溫度、露點(diǎn)溫度、能見度信息;
2)風(fēng)向?yàn)椤?~“360”,將報(bào)文中顯示風(fēng)向多變的數(shù)據(jù)標(biāo)注為“720”;能見度顯示“9999”或缺失均標(biāo)注為“9999”。
本文根據(jù)巴西國(guó)家民航局(ANAC)提供的數(shù)據(jù)選取2018年巴西圣保羅瓜魯柳斯國(guó)際機(jī)場(chǎng)的離港航班數(shù)據(jù)5560條。由于本文主考周期性因素以及氣象因素對(duì)單航班延誤時(shí)長(zhǎng)的影響,因此選取航司ID、航班號(hào)、航班離港日期、航班離港時(shí)間,作為數(shù)據(jù)集的描述性變量特征;選取航班出發(fā)的月份數(shù)據(jù),對(duì)其依據(jù)四個(gè)季度進(jìn)行虛擬變量的建立,將其從事件類型變量轉(zhuǎn)換為定量變量;選取單航班離港延誤時(shí)長(zhǎng)作為目標(biāo)變量特征。
本文基于機(jī)場(chǎng)單航班離港延誤數(shù)據(jù)進(jìn)行預(yù)測(cè),依據(jù)航班離港日期和時(shí)間對(duì)航班運(yùn)行數(shù)據(jù)和氣象數(shù)據(jù)進(jìn)行融合,得到單航班延誤時(shí)長(zhǎng)的數(shù)據(jù)集。對(duì)數(shù)據(jù)中含有空缺值的數(shù)據(jù)進(jìn)行刪除。本文主要對(duì)延航班誤特性進(jìn)行分析研究,因此選取延誤數(shù)據(jù)與正常運(yùn)行數(shù)據(jù)組合訓(xùn)練數(shù)據(jù)集并剔除其他不相關(guān)數(shù)據(jù)。
RBF神經(jīng)網(wǎng)絡(luò)是兩層前饋網(wǎng)絡(luò),其隱藏層不是傳統(tǒng)的神經(jīng)網(wǎng)絡(luò)層,隱層的功能是將輸入向量的非線性可分離集轉(zhuǎn)換為線性可分離集[9]。隱藏層的每一個(gè)神經(jīng)元需計(jì)算輸入數(shù)據(jù)到代表神經(jīng)元聚類中心的距離,找到RBF作為激勵(lì)函數(shù)的輸入與聚類中心的距離r。第二層是一個(gè)簡(jiǎn)單的前饋層,網(wǎng)絡(luò)輸出由隱含層的輸出結(jié)果經(jīng)感知神經(jīng)元或ADA?LINE線性加權(quán)輸出[10]。最常用的徑向基函數(shù)是高斯核函數(shù),形式為
其中xc為核函數(shù)中心,σ為函數(shù)的寬度參數(shù),控制了函數(shù)的徑向作用范圍。
xk為第k個(gè)輸入樣本,cj為第j個(gè)中心點(diǎn),m為隱含層的結(jié)點(diǎn)數(shù),n是輸出的樣本數(shù)[11]。可得到網(wǎng)絡(luò)的輸出為
Poggio和Girosi已經(jīng)證明,RBFNN是連續(xù)函數(shù)的最佳逼近,而非BPNN。
為證明周期波動(dòng)因素影響的存在,圖1為四個(gè)季度單航班平均延誤時(shí)長(zhǎng)。可以看出四個(gè)季度的航班延誤時(shí)長(zhǎng)分布并非呈現(xiàn)平滑趨勢(shì),而呈明顯波動(dòng)趨勢(shì)。所以考慮周期性變量對(duì)預(yù)測(cè)結(jié)果有重要的影響。
圖1 航班平均延誤時(shí)長(zhǎng)周期分布
考慮周期性因素的模型中RBF輸入神經(jīng)元節(jié)點(diǎn)數(shù)為數(shù)據(jù)集中的定量變量與虛擬變量個(gè)數(shù)共13個(gè)變量分別為一季度、二季度、三季度、四季度、第一層云類型、風(fēng)向、風(fēng)速、云底高、云量、QNH溫度、露點(diǎn)溫度、能見度,未考周期性因素的模型中則只輸入定量變量即輸入層神經(jīng)元節(jié)點(diǎn)數(shù)為9;隱單元神經(jīng)元節(jié)點(diǎn)數(shù)設(shè)置為50;選擇高斯核函數(shù)作為激勵(lì)函數(shù);輸出神經(jīng)元節(jié)點(diǎn)數(shù)為1,對(duì)應(yīng)變量為離港航班延誤時(shí)長(zhǎng)。
模型經(jīng)運(yùn)行后得到仿真結(jié)果如圖2~3所示,圖2為未考慮周期性波動(dòng)因素的仿真結(jié)果,圖3為考慮周期性因素后的仿真結(jié)果。
圖2 RBFNN仿真結(jié)果
圖3 RBFNN考慮周期性因素仿真結(jié)果
為驗(yàn)證模型延誤時(shí)長(zhǎng)預(yù)測(cè)的準(zhǔn)確度,用延誤時(shí)長(zhǎng)容差準(zhǔn)確性來(lái)評(píng)價(jià)模型的準(zhǔn)確度得到結(jié)果如表1所示。
表1 RBFNN仿真結(jié)果評(píng)價(jià)
改進(jìn)后的模型在三個(gè)容差范圍內(nèi)均有較高的準(zhǔn)確性,說(shuō)明航班的延誤時(shí)長(zhǎng)是會(huì)受到包括氣候、季節(jié)、交通需求等因素在內(nèi)的周期性波動(dòng)影響。
本文在研究過(guò)程中同時(shí)還采用了BP神經(jīng)網(wǎng)絡(luò)和小波神經(jīng)網(wǎng)絡(luò)進(jìn)行了仿真實(shí)驗(yàn),用以進(jìn)行模型準(zhǔn)確度的對(duì)比和最優(yōu)模型的驗(yàn)證。
小波神經(jīng)網(wǎng)絡(luò)的結(jié)果基于小波理論,其因隱藏層激勵(lì)函數(shù)采用小波函數(shù),所以其學(xué)習(xí)能力和精確度較高,選用Morlet作為激勵(lì)函數(shù),若輸入層、隱含層、輸出層節(jié)點(diǎn)數(shù)為h、k、n,輸入和輸出集分別為x=[x1,x2,…,xk]T、y(x)=[y1,y2,…,ym]T,得到小波神經(jīng)網(wǎng)絡(luò)的隱單元表達(dá)式為
式中,aj、bj分別表示小波神經(jīng)網(wǎng)絡(luò)的伸縮和平移參數(shù),wi,j、wj,h分別表示輸入單元到隱單元的權(quán)重值、隱單元到輸出的權(quán)重值。
小波神經(jīng)網(wǎng)絡(luò)輸出層表達(dá)式為
BP神經(jīng)網(wǎng)絡(luò)在預(yù)測(cè)時(shí)為三層網(wǎng)絡(luò),其中輸入層節(jié)點(diǎn)個(gè)數(shù)為自變量個(gè)數(shù),隱單元節(jié)點(diǎn)數(shù)為60,隱含層函數(shù)tansig[12],輸出層函數(shù) purelin[13],學(xué)習(xí)率設(shè)置為0.001,gaol為0.0001,最大迭代次數(shù)1000次。小波神經(jīng)網(wǎng)絡(luò)在預(yù)測(cè)時(shí)隱單元節(jié)點(diǎn)數(shù)為30,隱單元為Morlet核函數(shù),學(xué)習(xí)率[14]設(shè)置為0.001,最大迭代次數(shù)1000。
模型經(jīng)運(yùn)行后得到仿真結(jié)果如圖4~5所示,圖4為BPNN未考慮周期性波動(dòng)因素的仿真結(jié)果,圖5為考慮周期性因素后的仿真結(jié)果。
圖4 BPNN仿真結(jié)果
圖5 BPNN考慮周期性因素仿真結(jié)果
圖6為WNN未考慮周期性波動(dòng)因素的仿真結(jié)果,圖7為考慮周期性因素后的仿真結(jié)果。
圖6 WNN仿真結(jié)果
圖7 WNN考慮周期性因素仿真結(jié)果
同樣,用延誤時(shí)長(zhǎng)容差準(zhǔn)確性來(lái)評(píng)價(jià)模型的準(zhǔn)確度得到結(jié)果如表2所示。
表2 BPNN及WNN仿真結(jié)果評(píng)價(jià)
從上表可以看出小波神經(jīng)網(wǎng)絡(luò)的精確度高于BP神經(jīng)網(wǎng)絡(luò),且采用考慮周期因素后的模型的準(zhǔn)確度均有提升。RBF神經(jīng)網(wǎng)絡(luò)的預(yù)測(cè)精確度最高,同時(shí)本文還將改進(jìn)后RBF的神經(jīng)網(wǎng)絡(luò)模型的仿真結(jié)果與文獻(xiàn)[7]中彈性神經(jīng)網(wǎng)絡(luò)的仿真結(jié)果進(jìn)行了對(duì)比,本文模型在容差(±3min)內(nèi)的準(zhǔn)確率為91%高于文獻(xiàn)[7]仿真結(jié)果83.954%。
本文通過(guò)繪制延誤時(shí)長(zhǎng)周期分布圖,發(fā)現(xiàn)延誤時(shí)長(zhǎng)并非呈平滑趨勢(shì)而會(huì)受到包括交通需求、氣候、季節(jié)在內(nèi)的周期性因素波動(dòng)的影響。利用RBF神經(jīng)網(wǎng)絡(luò)建立仿真模型,輸入經(jīng)篩選后的定量變量與周期虛擬變量共13個(gè)。運(yùn)行得到仿真結(jié)果,±10min、±5min、±3min容差內(nèi)延誤時(shí)長(zhǎng)預(yù)測(cè)準(zhǔn)確率分別為98%、94%、91%,相較于未考慮周期性波動(dòng)因素模型表現(xiàn)出較高的準(zhǔn)確性。小波神經(jīng)網(wǎng)絡(luò)和BP神經(jīng)網(wǎng)絡(luò)在考慮周期性波動(dòng)因素后準(zhǔn)確度也得到提升,但模型預(yù)測(cè)準(zhǔn)確度遠(yuǎn)不及RBF神經(jīng)網(wǎng)絡(luò)。此外,因數(shù)據(jù)樣本的關(guān)系,本文未過(guò)多考慮管制因素的影響,后續(xù)的研究中可以進(jìn)一步地挖掘相關(guān)因素從而再次提升模型預(yù)測(cè)的準(zhǔn)確度。