李 楠,焦慶宇,張連東,樊 瑞
(1. 中國民航大學 空中交通管理學院,天津 300300; 2. 南京航空航天大學 民航學院,江蘇 南京 211106)
機場運行效率對于整個空中交通系統(tǒng)至關(guān)重要。大型機場的場面運行錯綜復雜,地面交通流量大、密度高、協(xié)調(diào)難度大導致出現(xiàn)運行保障壓力大的情況時有發(fā)生。航空器滑行時間預測的準確性對于優(yōu)化航班推出時刻、提高機場地面運行效率及離場時隙的使用效率、減少空中交通網(wǎng)絡延誤的傳播具有重要作用。在此驅(qū)動下,準確的預測航空器的離場滑行時間從而計算出合理的撤輪檔時間,成為離場管理系統(tǒng)(DMAN)和機場協(xié)同決策系統(tǒng)(A-CDM)中離場時隙有效利用的重要前提。同時可以為航空公司準確計算油量、航空器減少地面排放提供理論參考。
國外學者對于滑行時間預測開展了廣泛的研究。H. IDRIS等[1]基于多元線性回歸算法對波士頓機場的航空器滑出時間進行預測,提出了場面航空器數(shù)量與航班滑行時間的關(guān)系;R. A. SHUMSKY[2]探討了航空公司運行對滑行時間預測的影響;R. R. CLEWLOW等[3]繼續(xù)細化了場面滑行航空器數(shù)量與滑行時間的關(guān)系,重點研究了進場滑行航空器數(shù)量與離場航班滑出時間的關(guān)系;S.RAVIZZA等[4]將滑行距離分為推出路段、轉(zhuǎn)彎路段以及直線滑行路段,并對航空器經(jīng)過這3個路段時的滑行轉(zhuǎn)角、速度進行研究,運用多元線性回歸算法建立預測模型;F. HERREMA等[5]運用多元線性回歸、支持向量機、TSK模糊模型3種方法對滑行時間預測結(jié)果進行對比研究;H. LEE等[6]運用LINOS仿真軟件對機坪推出時間及滑行時間進行仿真,并運用機器學習中的隨機森林算法對計算機模擬的滑行時間與軟件仿真的滑行時間準確率進行對比分析;A. E. I. BROWNLEE等[7]運用模糊系統(tǒng)算法和時間窗算法將確定性情況下滑行時間預測與滑行路徑規(guī)劃結(jié)合。
國內(nèi)研究主要通過將滑行時間預測與滑行路徑規(guī)劃結(jié)合進行研究,而針對滑行時間的單獨研究則較少。劉繼新等[8]運用支持向量機-BP神經(jīng)網(wǎng)絡結(jié)合方法對滑行路徑進行預測,在離場滑行時間的預測下對航班滑行路徑進行優(yōu)化研究;姚夢飛[9]運用長短期記憶模型和循環(huán)神經(jīng)網(wǎng)絡算法對航空器滑行路徑進行預測,通過研究航空器以往的滑行軌跡坐標與速度從而預測未來的航空器位置;馮霞等[10]通過研究場面航空器數(shù)量來衡量場面擁擠情況,并基于此建立航空器滑出時間模型。
以上研究并未考慮跑道運行模式以及機場運行高峰與低谷時間對滑行時間的影響,造成跑道運行模式及時間段的變化下預測準確度降低的情況出現(xiàn)。筆者將跑道起降組合模式、高峰低谷時段運行加入到分析因素中,運用多元回歸方法對滑行時間進行預測,得出最優(yōu)的滑行時間預測模型。
筆者對首都機場2019年3月及2019年6—7月共計90 d的進離港航班進行統(tǒng)計分析,數(shù)據(jù)覆蓋一周中的所有天及節(jié)假日。其中總數(shù)據(jù)為46 935條,由于7月2日及7月6日天氣影響造成數(shù)據(jù)誤差較大,這兩天數(shù)據(jù)并未作為研究樣本。原始數(shù)據(jù)信息由航班號、停機位、上輪檔時刻、撤輪檔時刻、起飛時刻、降落時刻組成。航空器樣本數(shù)據(jù)集如表1。
表1 首都機場航空器樣本數(shù)據(jù)
對獲取的數(shù)據(jù)進行去噪聲處理后得到樣本總體滑行時間最大值、最小值、平均數(shù)、中位數(shù)、標準差如表2。
表2 航空器滑行時間統(tǒng)計分析
圖1為北京機場航空器離場滑行時間頻率分布。由圖1可知,北京首都機場離場航空器滑行時間呈現(xiàn)右偏態(tài)分布,其偏度和峰度分別為1.26、2.74,進場航空器偏度和峰度分別為1.1、1.3。同時表2中的第25百分位數(shù)及第75百分位數(shù)表明,首都機場滑出時間集中在13~24 min,滑入時間集中在9~18 min,航空器滑出時間分布更集中,表明進場航空器滑行效率較離場航空器滑行效率更高。
圖1 首都機場離場航空器滑行時間分布
1.2.1 滑行時間
筆者參照中國民用航空局機場協(xié)同決策(A-CDM)系統(tǒng)中對航空器滑行時間的定義進行計算。
離場航空器滑行時間(Ttaxi-out)指航空器從撤輪擋時刻(Tblock-out)開始到起飛離地時刻(Tdeparture)為止的時間。離場滑行時間包括停機坪推出時間、滑行道滑行時間及跑道前等待時間,如式(1):
Ttaxi-out=Tdeparture-Tblock-out
(1)
進場航空器滑行時間(Ttaxi-in)指航空器從落地(Tarrive)開始到滑入停機位停妥上輪擋時刻(Tblock-in)為止的時間,如式(2):
Ttaxi-in=Tarrive-Tblock-in
(2)
1.2.2 滑行距離
首都機場為3條跑道及3個航站樓共同運行模式,進離場航空器共用滑行道及跑道,機場場面交通流復雜。實際運行中航空器滑行路徑的選擇并不是基于最短路徑,與場面的滑行規(guī)則、停機位和使用跑道等相關(guān)。筆者引用了文獻[11]中主流滑行路徑的定義及機場航行資料(AIP)的滑行規(guī)則,將停機位與起飛跑道之間使用頻率最多的滑行路徑作為該機位主流滑行路徑。通過統(tǒng)計一周的場面監(jiān)視數(shù)據(jù)得出不同停機位與起飛跑道對應的主流滑行路徑,計算主流滑行路徑的距離,用其來作為航空器的滑行距離。
1.2.3 場面運動航空器數(shù)量
筆者引用R. R. CLEWLOW等[3]對離場的航空器數(shù)量的定義并進行研究,如式(3):
(3)
同理,給出進場航空器數(shù)量的定義及解釋,如式(4):
(4)
針對于離場航空器i,如果航空器j的落地時間早于航空器i撤輪擋時間,同時航空器j的上輪擋時間晚于航空器i的撤輪擋時間,那么航空器j屬于對航空器i滑行時間有影響的場面離場運動航空器,所有滿足此條件的航空器數(shù)目表示為D1(i);針對于離場航空器i,如果航空器j的撤輪擋時間要晚于航空器i撤輪擋時間,且早于航空器i起飛離地時間,那么航空器j屬于對航空器i滑行時間有影響的場面離場運動航空器,所有滿足此條件的航空器數(shù)目表示為D2(i);定義D3(i)為D1(i)、D2(i)航空器數(shù)量的集合。
對于進場運動的航空器,針對于離場航空器i,如果航空器j在航空器i撤輪擋前已經(jīng)落地且航空器j上輪擋時間在航空器i撤輪擋時間之后,那么航空器j屬于對航空器i滑行時間有影響的場面進場運動航空器,所有滿足此條件的航空器數(shù)目表示為A1(i);針對于離場航空器i,如果航空器j在航空器i撤輪擋后落地且航空器j落地時間在航空器i離場時間之前,那么航空器j屬于對航空器i滑行時間有影響的場面進場運動航空器,所有滿足此條件的航空器數(shù)目表示為A2(i);定義A3(i)為A1(i)、A2(i)定義航空器數(shù)量的集合;針對于離場航空器i,如果航空器j在航空器i撤輪擋后落地且在航空器i起飛前上輪擋的,那么航空器j屬于對航空器i滑行時間有影響的場面進場運動航空器,所有滿足此條件的航空器數(shù)目表示為A4(i)。
筆者對上述定義解釋度進行對比分析,得出擬合程度最高的定義結(jié)果。
表3 進、離場滑行航空器定義R2值
通過對表3的結(jié)果研究,筆者選取定義D2(i)(離場)與定義A2(i)(進場)作為模型輸入變量。
1.2.4 跑道運行模式
跑道運行模式的改變分為跑道運行方向改變和多跑道組合起降方式的改變。不同跑道運行模式下,其進離場航空器交通流相互作用的范圍不同,造成航空器滑行時間的差異。跑道運行模式通常以“A1,A2 |D1,D2”的形式來描述,其中A1和A2是降落跑道,D1和D2為起飛跑道。例如“36R,01|36L,36R”代表機場在該時段下跑道36R,01跑道作為降落跑道,而36L,36R跑道作為起飛跑道。理論上,若該機場有n條跑道,每條跑道兩個方向,其跑道運行模式會有6n種可能,因為每條跑道分為進場、離場、或進離場混合運行3種模式。但在實際運行中,由于機場盛行風向及交通流量變化的原因,機場通常使用3~5種跑道運行模式,不同跑道運行模式下的航空器滑行時間不同。筆者運用啞變量對跑道運行模式進行描述,若該航空器使用此跑道運行模式,則設為1,否則為0。首都機場不同跑道運行模式使用的頻率見表4。
表4 跑道運行模式及運行時段使用頻率
1.2.5 機場運行時段分類
在不同時間段下,機場流量也各不相同,從而導致滑行時間的差異。高峰時段的進離場航空器數(shù)量多,機場場面運行負荷大,航空器滑行時間要大于非高峰運行時段。為提高預測準確度,對首都機場的進離場航空器數(shù)量進行分段分析,運用DBSCAN聚類算法按照每小時場面運動的航空器數(shù)量為依據(jù)進行劃分,若航空器在場面上為跨小時運行的,則這兩個時段都將該航空器計入統(tǒng)計。 DBSCAN算法結(jié)果顯示,按照機場每小時進離場航空器數(shù)量將24 h劃分為4類,如表5。
表5 基于DBSCAN算法的運行時間段分類
通過DBSCAN算法結(jié)果可知,00:00—05:59時間段平均每小時航班數(shù)量約為12架次。06:00—8:59、23:00—23:59兩個時間段由于其每小時的場面航空器數(shù)量平均為33.6架次,所以被整合為同一個時間分類。9:00—10:59、13:00—22:59兩個時間段內(nèi)其每小時場面航空器數(shù)量平均為52.96架次,所以將這兩個時間段劃分為一個時間段。最后將11:00—12:59劃分為一個時間段,這個時間段內(nèi),平均每小時場面航空器數(shù)量達到最多,為68.8架次。
滑行時間預測模型中所有變量統(tǒng)計分析信息見表4和表6。
表6 首都機場滑行時間預測模型變量統(tǒng)計分析信息
對滑行距離(x1)、進場航空器數(shù)量(x2)、離場航空器數(shù)量(x3)、跑道運行模式(x4)4個變量建立多元線性回歸模型及機器學習模型,分別對不同時間分類下航空器滑行時間進行建模。
機器學習中多元線性回歸模型與傳統(tǒng)統(tǒng)計學多元線性回歸模型的區(qū)別在于統(tǒng)計學方法得出的結(jié)果是最小化數(shù)據(jù)點之間的平方誤差,無區(qū)分訓練集與測試集,主要評估變量與結(jié)果之間的重要性與穩(wěn)健性。而機器學習是將數(shù)據(jù)隨機區(qū)分為訓練集與測試集,在訓練集上對數(shù)據(jù)進行擬合,將所得的結(jié)果在測試集中進行測試,找出誤差較大的數(shù)據(jù),并利用損失函數(shù)對模型不斷進行修正與測試,最終得出較為精準的預測模型。
Lasso回歸在線性回歸優(yōu)化函數(shù)的基礎上增加了L1范數(shù)正則項以防止模型出現(xiàn)多重共線性及過擬合情況。其優(yōu)化函數(shù)如式(5):
(5)
筆者以11:00—13:00時段為例,對該時段影響離場航空器滑行時間做逐步多元回歸擬合,得出的結(jié)果如表7及圖2。
表7 11:00—13:00時段機器學習回歸模型預測評價指標
圖2 11:00—13:00預測模型學習曲線
表8為在機器學習預測模型中加入DBSCAN算法對運行時段分類后,不同時間分類下的機器學習Lasso回歸模型預測結(jié)果評價。
表8 基于機器學習模型預測評價指標
從表8中可知,在進行不同時間段分類后的模型擬合效果均優(yōu)于未進行分類的模型總體擬合效果,表明運用DBSCAN算法進行機場運行時間分類可進一步提高模型的準確率。
機器學習Lasso回歸中有兩個參數(shù)需要進行調(diào)整,一個是訓練集與數(shù)據(jù)集的比例,另一個是隨機種子的選取。這兩個參數(shù)共同作用于模型的穩(wěn)健性與可預測性,通過對數(shù)據(jù)集按不同比例的劃分,其最終模型的R2與MSE也不相同。一個好的模型需要高R2值與低MSE值,所以筆者將以R2與MSE的差來計算:
P=R2-MSE
(6)
式中:R2與MSE均已進行無量綱化處理,得到結(jié)果如圖3。
圖3 Lasso回歸調(diào)參圖
由圖3可知,在預測集與訓練集為0.75∶0.25的比例分開,且隨機種子選取為0時,模型擬合效果最好。
基于傳統(tǒng)統(tǒng)計學的回歸模型[式(7)]對滑行距離(x1)、進場航空器數(shù)量(x2)、離場航空器數(shù)量(x3)、跑道運行模式(x4)4個變量建立多元線性回歸模型:
Y=βixi+ε(i=1,2,…,n)
(7)
利用SPSS進行運算,模型全部通過了T檢驗及顯著性檢驗。筆者以I類系數(shù)分析為例進行展示,結(jié)果如表9。
表9 Ⅰ類系數(shù)分析
預測值與實際值的誤差如圖4。共提取100個預測值與實際值數(shù)據(jù)進行繪圖。由圖4可以看出,預測值與實際值的大致走向趨于一致,說明模型的擬合程度較好。通過對結(jié)果的比較來看,機器學習方法對首都機場全天離場滑行預測結(jié)果與實際結(jié)果在±3 min的準確性平均達到69.3%,±5 min的準確性達到87%。
圖4 機器學習與統(tǒng)計學預測準確率對比
筆者以誤差圖與±1、±3、±5 min準確率對比這3個指標對模型的準確性進行評價。準確率為模型預測時間與實際滑行時間的差值在某一設定范圍內(nèi)的數(shù)量與總預測樣本數(shù)之比。例如±3 min準確率為實際值與模型預測值相差3 min以內(nèi)的樣本數(shù)量占所有預測樣本數(shù)的百分比。離場滑行時間預測值與準確值誤差如表10。
表10 模型預測準確率對比
同時,將筆者的模型結(jié)果與現(xiàn)有其他學者的研究成果進行對比發(fā)現(xiàn),在運用DBSCAN算法進行機場運行時段分類后的模型擬合效果(R2=0.78)高于未進行運行時段分類的模型[11](R2=0.70),也高于使用計量經(jīng)濟學回歸方法[8]的效果(R2=0.74)。由此表明,在利用DBSCAN算法及引用跑道運行模式的航空器滑行時間預測模型擬合效果更好。
對首都機場航班運行數(shù)據(jù)進行分析,最終得出影響滑行時間的因素為滑行距離、進場航空器數(shù)量、離場航空器數(shù)量、跑道運行模式和時間段。
通過分析發(fā)現(xiàn):
1)滑行距離與進、離場航空器數(shù)量這3個變量對模型的預測貢獻程度較大。
2)跑道運行模式的變化會引起滑行時間的波動,所以跑道運行模式這一變量的引用可以進一步提高預測的精確度。
3)不同時間段內(nèi)的航班數(shù)量不同。為提升模型的準確性,筆者運用DBSCAN算法按每小時航班流量對機場運行時段進行分類建模。
4)運用機器學習與傳統(tǒng)統(tǒng)計學兩種方法建立多元回歸模型對離場滑行時間進行預測。結(jié)果顯示,機器學習交叉訓練集下多元回歸模型的預測準確度較高,預測與實際誤差值在5 min內(nèi)的占87%,可用于大型機場實際運行航班滑行時間預測。