李楠, 傅饒
(中國民航大學民航航班廣域監(jiān)視與安全管控技術重點實驗室, 天津 300300)
跑道吞吐量對于空域資源的利用至關重要。由于大型機場的跑道容量有限,經(jīng)常出現(xiàn)空域資源緊張、協(xié)調(diào)及運行保障壓力大的現(xiàn)象[1]。跑道占用時間的預測可以提高跑道使用效率,為管制員提供高效、準確的決策信息,實現(xiàn)航空器行為及時、合理的調(diào)整,從而保航空器運行的安全性。在此驅(qū)動下,準確的預測進場航空器的跑道占用時間,計算進場航空器之間合理的時間間隔,是進場管理系統(tǒng)(arrival management,AMAN)和機場協(xié)同決策系統(tǒng)(airport collaborative decision making system,ACDM)中有效利用進場時隙的重要前提。同時可以為機場運行效率的研究提供理論參考。
國外學者對于跑道占用時間的預測展開了廣泛的研究。Spencer等[2]基于貝葉斯算法對美國27個機場的進、離場航空器跑道占用時間及滑行距離進行預測,提出了不同航空器降落和起飛性能中存在巨大差異;Meijers等[3]運用數(shù)據(jù)驅(qū)動的方法來探究跑道占用時間的影響因素,并重點研究了不同因素對跑道占用時間預測的影響;Meijers等[4]使用遞歸神經(jīng)網(wǎng)絡模型預測每個可用跑道出口的使用概率和航空器使用該出口離開跑道時的跑道占用時間(runway occupancy time, ROT),并使用該模型確定可以最大降低ROT的跑道出口位置;Nguyen等[5]運用決策樹、隨機森林和梯度提升模型3種方法對跑道占用時間預測結(jié)果進行對比研究; Mirmohammadsadeghi等[6]通過蒙特卡洛方法對每架飛機著陸的關鍵參數(shù)進行仿真,并采用了數(shù)據(jù)驅(qū)動方法建立預測模型;Stempfel等[7]根據(jù)蘇黎世機場收集的3年數(shù)據(jù),基于梯度增強回歸模型,對跑道占用時間預測的準確率進行分析,以此增加跑道容量;Friso等[8]結(jié)合神經(jīng)網(wǎng)絡、多層感知器(multilayer perceptron,MLP)、Lasso和回歸樹模型,建立了進場航空器跑道占用時間 (arrival runway occupancy time,AROT)的預測模型,并使用戴高樂機場和維也納機場的數(shù)據(jù)預測了異常的跑道占用時間。
國內(nèi)研究主要通過將跑道占用時間預測與跑道占用時間間隔相結(jié)合進行研究,而針對跑道占用時間的單獨研究則較少。張定鵬[9]結(jié)合單跑道運行方式中航空器跑道占用時間間隔規(guī)定的特點,構建配對進近模式下航空器跑道占用時間間隔模型;金京等[10]采用函數(shù)擬合的方法,在特定氣象條件下對跑道占用時間進行預測并由此推定起飛間隔標準;張兆寧等[11]建立航空器脫離跑道時間優(yōu)化模型,得到航空器脫離跑道的最短時間和到達跑道穿越點的最早時刻,并進一步建立航空器滑行路徑優(yōu)化模型,提高跑道使用效率;劉濤[12]利用前饋型神經(jīng)網(wǎng)絡模型對跑道占用時間進行預測,基于跑道占用時間構建跑道容量模型,模擬評估不同飛機類型到達組合的跑道容量。
在上述研究中,沒有考慮跑道入口端速度、跑道出口端速度對跑道占用時間的影響,導致預測精度降低。因此,現(xiàn)增加跑道入口端速度和跑道出口端速度的分析,分析這些因素的作用,并使用改進的GWO-RF方法預測跑道占用時間,得到一個最佳的跑道占用時間預測模型。
對2020年12月美國紐瓦克自由國際機場的進離場航班進行了統(tǒng)計分析,時間為30 d,涵蓋了12月的所有工作日及節(jié)假日。這些數(shù)據(jù)的總數(shù)為343 110條,原始數(shù)據(jù)信息包括時間戳、航班號、機型、經(jīng)度、緯度、高度、地速和航向。航空器樣本數(shù)據(jù)集如表1所示。
表1 原始數(shù)據(jù)
美國聯(lián)邦航空管理局[13]將跑道占用時間定義為:航空器從跑道入口到脫離跑道所用時間;歐洲航空安全組織[14]將跑道占用時間定義為:航空器接地點到脫離跑道所用時間; 中國民用航空局[15]將跑道占用時間定義為:航空器占用跑道,包括航空器起飛和著陸占用地面保護區(qū)的總時間。本文研究采用的數(shù)據(jù)是美國紐瓦克自由國際機場的數(shù)據(jù),為了更加符合實際運行,現(xiàn)采用美國聯(lián)邦航空管理局對跑道占用時間的定義。計算公式為
ROT=tend-t0
(1)
式(1)中:ROT為進場航空器跑道占用時間;t0為航空器飛至跑道入口端的時刻;tend為航空器落地后滑行脫離跑道的時刻。
首先,進行數(shù)據(jù)整理?;诤娇掌骶幋a,識別出第一組獨立的飛行軌跡。然后通過識別此組飛行軌跡中時間間隔超過10 min的連續(xù)數(shù)據(jù)點,創(chuàng)建新的精細飛行軌跡。使得具有相同航空器編碼的航班能夠被分開,飛行軌跡被細分。
其次,運用數(shù)據(jù)識別將進場航空器的飛行軌跡與離場航空器的軌跡分離。通過反復實驗,選擇出兩個合適的閾值將軌跡可視化。本文研究選擇的閾值為當航空器到達跑道入口端的速度大于100 kt、航空器脫離跑道時的速度低于20 kt時,此飛行航跡被識別為著陸飛行。
再次,對識別出的進場航空器軌跡以每秒為單位進行線性插值,補全航空器每秒的經(jīng)度坐標、緯度坐標、速度、航向和高度信息。
最后,根據(jù)跑道占用時間的定義,提取兩個時間戳來計算跑道占用時間。這兩個時間戳分別對應于航空器飛越跑道入口端的時間和其尾部脫離跑道的時間。第一個時間戳t0的提取根據(jù)飛行軌跡插值后到達跑道入口端的最近點確定,第二個時間戳tend的提取根據(jù)航空器脫離跑道后距離跑道的最小垂直距離確定。因為記錄航空器位置的GPS天線通常位于航空器的中心附近,因此當航空器的中心距離跑道邊界的垂直距離D大于航空器垂直于跑道軸上的投影長度一半時,航空器被認定為脫離跑道??墒褂檬?2)計算垂直距離D,計算示意圖如圖1所示。
(2)
式(2)中:α為跑道出口的角度;L為飛機的總長度;D為提取出的航空器離開跑道后距離跑道邊界的最小垂直距離。
此時對應的軌跡點被識別,tend被提取。最后通過計算tend和t0之間的差值來計算跑道占用時間。跑道占用時間小于20 s的值通常對應于質(zhì)量較差的飛行軌跡,其位置、速度和高度值不可靠,因此被忽略。總共從343 110條軌跡中提取出2 069架次進場航班的跑道占用時間測量值。
對獲取的數(shù)據(jù)進行去噪聲處理后得到樣本總體最大值、最小值、平均值、中位數(shù)和標準差,如表2所示。表2中的第25百分位數(shù)及第75百分位數(shù)表明,紐瓦克機場進場航空器的跑道占用時間集中在44~63 s。
表2 航空器跑道占用時間統(tǒng)計分析
圖2為紐瓦克機場進場航空器跑道占用時間頻率分布。由圖2可知,紐瓦克機場進場航空器跑道占用時間呈現(xiàn)右偏態(tài)分布,其偏度和峰度分別位3.16、0.90。通過表2和圖2可知,提取出的跑道占用時間準確性較高,符合美國聯(lián)邦航空管理局的規(guī)定和實際運行情況。
圖2 紐瓦克機場進場航空器跑道占用時間分布
1.3.1 機型性能
圖3顯示了每個尾流類別(一般中型、超中型、一般重型和超重型)航空器ROT的累積分布。由圖3可知,不同尾流類別的航空器跑道占用時間分布不同,并且屬于最大起飛重量(maximum takeoff weigh,MTOW)較高類別的航空器平均跑道占用時間較高。
圖3 不同尾流類別的ROT累積分布
即使在每個尾流類別中,不同的航空器也具有不同的ROT分布。大型飛機不僅具有較大的最大起飛重量,而且因為其尾流間隔的要求具有較高的進近速度,這些因素均導致航空器的動量增大,從而得到較高的ROT。如圖4所示,圖4顯示了屬于“中型”類別的4種常見航空器的ROT累積分布。在B737和A320系列中,最大機型(B738和A321)的跑道占用時間更高。
圖4 4種常見“中型”航空器的ROT累積分布
由于ROT與飛機類型的依賴性,可以通過查看特定的飛機類型來分析其他因素對ROT的影響。因此對影響因素的研究均采用A320飛機進行重點分析。
1.3.2 航空公司
由于不同的航空公司擁有不同的機隊,并且不同航空公司工作的飛行員接受不同的飛行員培訓,遵循不同的操作程序,如使用不同的自動剎車設置等。因此,飛行員駕駛航空器著陸的方式有所不同。圖5為美國3家廣泛使用A320航空器航空公司的ROT分布。從圖5可知ROT分布有明顯差異。
圖5 不同航空公司的A320 ROT累積分布
1.3.3 跑道出口選擇與跑道出口角度
跑道的關鍵參數(shù)包括跑道出口距跑道入口端的距離以及跑道出口與跑道軸線的夾角。其中跑道出口角度是滑行道中心線與跑道中心線組成的夾角,夾角范圍為0°~180°。如圖6所示,最常用的出口角度為90°(即直角出口)和30°(即快速脫離出口)。航空器在進入跑道出口安全轉(zhuǎn)彎時,需要降低速度,隨著出口角度的增大,速度降低率需增加。因而與直角出口相比,快速脫離道口可以使航空器以更高的速度離開跑道,減少跑道上的制動距離,降低跑道占用時間并增加跑道容量。圖7顯示了高速30°出口和60°出口之間的ROT累積分布差異。基于這一邏輯,在影響跑道占用時間的因素時引入跑道出口角度這一變量。
圖7 不同出口角度的ROT累積分布
跑道出口的選擇影響航空器從跑道入口沿跑道中心線到開始轉(zhuǎn)彎從特定跑道出口滑出的直線距離。這個距離是航空器著陸前大幅度減速的距離,一般來說,跑道出口位置離跑道入口端距離越短跑道占用時間越短。如圖8所示,ROT隨著跑道出口距跑道入口距離的增加而增加,增加約0.24 s/m。因此航空器每次著陸選擇的出口位置將對跑道占用時間產(chǎn)生很大影響,需要在跑道占用時間模型中引入跑道出口的選擇。
圖8 跑道出口位置對ROT的影響
1.3.4 飛越跑道入口端及脫離跑道的速度
對于進近的航空器,較高的進近速度通常會導致較高的著陸速度,并縮短從跑道入口到跑道出口端所需的時間。如圖9(a)所示,當航空器從同一跑道出口離開跑道時,跑道入口端速度每增加一節(jié),跑道占用時間就會降低0.19 s。但在航空器著陸過程中,同時需要考慮到更高的進近速度會迫使航空器不能較快減速而選擇更遠的跑道出口,從而增加跑道占用時間。如圖9(b)所示,當航空器從不同出口離開跑道時,跑道入口端的速度每增加一節(jié),就會產(chǎn)生0.12 s的額外跑道占用時間。因此,如果具有不同進近速度的航空器是在同一出口離開跑道,則進近速度對ROT的影響成正比,反之則成反比。
圖9 跑道入口端速度對跑道占用時間的影響
1.3.5 氣象條件
著陸期間的風向、風速可能會影響進場航空器的進近速度。例如,一般情況下,逆風增加航空器升力,航空器與氣流的相對速度增大,跑道占用時間縮短。通過美國國家海洋和大氣管理局(National Oceanic and Atmospheric Administration, NOAA),獲取到紐瓦克機場每小時的天氣數(shù)據(jù)(溫度、風、能見度、晝夜指示器、氣壓高度、降水類型和數(shù)量),并與tend和t0相關聯(lián)。
灰狼算法是由 Mirjalili等[16]提出的一種智能優(yōu)化算法?;依撬惴ㄓ衫侨旱纳鐣燃墎斫?分別為α、λ、δ和ω4種,層次結(jié)構如圖10所示。
圖10 灰狼等級制度
灰狼捕獲獵物的過程可以用式(3)和式(4)表示。
D=|CPp(t)-P(t)|
(3)
P(t+1)=Pp(t)-AD
(4)
式中:D為灰狼與獵物之間的距離;t為當前進化代數(shù);A和C為系數(shù)向量;Pp為獵物所處的位置向量;P為灰狼的位置向量。A和C的計算公式為
A=2an1-a
(5)
C=2n2
(6)
式中:n1、n2為[0,1]的隨機向量;a為收斂因子。
灰狼逐漸接近獵物并更新其位置,ω狼更新位置和最終位置為
(7)
(8)
式中:Dα、Dλ、Dδ為α、λ、δ狼與獵物的距離;A1、A2、A3為α、λ、δ的系數(shù)向量;P1、P2、P3為對應狼群的位置向量;Xα、Xλ、Xδ為對應獵物的位置向量;P(t+1)為t+1時刻ω狼的位置向量。
隨機森林模型是一個組合分類模型,由多個決策樹集成,具體構建過程如下。
(1)使用Bootstrap抽樣從樣本數(shù)量為N的原始數(shù)據(jù)集中有放回的隨機抽取N個,作為決策樹數(shù)據(jù)來訓練模型。
(2)重復步驟(1)m次,得到m個新的訓練集,每個訓練集的大小為N。
(3)構建CART決策樹,根據(jù)基尼系數(shù)Gini選擇節(jié)點特征。選擇基尼系數(shù)最低的閾值作為最佳分割閾值,構建決策樹h(X)。
(4)訓練m個樣本數(shù)據(jù)集獲得m棵決策樹,令決策樹分類序列為{h1(X),h2(X),…,hm(X)}。
(5)將每棵樹對該樣本的預測結(jié)果進行統(tǒng)計,使用投票法選出最終結(jié)果,公式為
(9)
(1)設置狼群數(shù)量、最大迭代次數(shù)、樹的個數(shù)(記為n)及最小葉子節(jié)點(記為l)取值范圍。
(2) 建立隨機灰狼種群,每個灰狼都有一個由n和l組成的個體位置向量。
(3) 給定初始參數(shù)n和l,使用隨機森林訓練樣本數(shù)據(jù),并將個體的適應度表示為訓練集的識別準確率。
(4) 計算每只灰狼的適應度值,根據(jù)適應度值將灰狼分為α、β、δ和ω4個等級,并更新每個個體在灰狼群體中的位置。
(5) 若迭代次數(shù)超出最大迭代次數(shù),尋優(yōu)結(jié)束,得到最優(yōu)參數(shù)n和l;否則跳轉(zhuǎn)至(4)繼續(xù)進行參數(shù)尋優(yōu),得到最優(yōu)的隨機森林分類模型。
算法流程圖如圖11所示。
圖11 GWO-RF模型流程圖
對跑道出口選擇、跑道出口角度、氣象條件、跑道入口端速度、跑道出口端的速度、機型、航空公司7個變量建立機器學習模型,對進場航空器跑道占用時間進行建模。
2.4.1 尋優(yōu)過程分析
在提取跑道占用時間后,使用GWO尋找RF最佳參數(shù)。GWO的初始化設置和RF參數(shù)取值范圍如表3所示。
表3 航空器跑道占用時間統(tǒng)計分析
RF參數(shù)尋優(yōu)適應度曲線如圖12所示,可以看出:經(jīng)過3次迭代后,適應度函數(shù)大幅度下降保持在0.195;經(jīng)過8次迭代后,最佳適應度保持在0.194。相比人工隨機選擇參數(shù)相比, GWO可以增加尋優(yōu)的效率和準確率。經(jīng)過尋優(yōu),得到最佳樹的個數(shù)取值為49、最小葉子節(jié)點取值為2。
圖12 GWO-RF參數(shù)尋優(yōu)適應度曲線
利用上述隨機森林模型研究ROT,該過程類似于數(shù)據(jù)分析中的曲線擬合過程,為了論證預測結(jié)果的準確性,選擇平均絕對誤差(mean absolute error,MAE)、均方根誤差(root mean squared errors,RMSE)作為評價指標,其中MAE為4.020 7、RMSE為4.443 7。并使用回歸分析來估計模型的魯棒性,選擇R2參數(shù)進行真實值和預測值之間的回歸分析。圖13顯示了優(yōu)化后的RF模型ROT預測回歸圖,對實際值和預測值進行回歸分析,可以看出隨機森林模型完成了預測分析,且沒有出現(xiàn)過擬合情況。
圖13 跑道占用時間真實值預測值回歸圖
2.4.2 影響跑道占用時間的因素分析
通過隨機森林回歸算法確定影響跑道占用時間的因素。通過查看每個樹的每個節(jié)點對降低數(shù)據(jù)集總方差的貢獻程度,可以確定每個因素在ROT估計中的重要性排名,并對影響因素進行了排序。
圖14給出了影響跑道占用時間因素的排名。在該排名中可以看出,航空器用于滑出跑道的出口選擇占主導地位,占變化量的25.95%;跑道出口端速度和跑道入口端速度對跑道占用時間均有顯著影響,占變化量的17.28%和16.39%;天氣因素、機型、跑道入口角度對跑道占用時間的影響接近,占變化量的12.61%、9.96%和9.35%;最后,航空公司因素對跑道占用時間的影響較小,占變化量的8.46%。
圖14 ROT影響因素重要性排名
2.4.3 模型準確度對比
提取得到的100個預測值與實際值進行了比較,圖15顯示了與實際值相比預測值的準確性。由圖15可知,預測值和實際值基本重合,表明模型的擬合效果很好。
圖15 不同模型預測準確率對比
模型的準確性可以用±5 s、±7 s和±10 s這3個指標及誤差圖來評價。準確率定義為在一定范圍內(nèi)的模型預測時間與實際跑道占用時間的差值數(shù)量與總樣本數(shù)量之比。例如,±5 s的準確率是指實際時間與模型預測時間不超過5 s的樣本數(shù)占實際樣本總數(shù)的百分比。表4顯示了預測值和準確值之間的誤差,對比結(jié)果顯示優(yōu)化后的隨機森林模型對紐瓦克機場進場航空器跑道占用時間的預測結(jié)果與實際結(jié)果在±7 s的準確性平均達到88.08%,已經(jīng)超過現(xiàn)有研究的準確性。44~63 s為航空器跑道占用時間的第25百分位數(shù)至第75百分位數(shù),但還存在航空器在進場時受空中交通管制、極端惡劣天氣影響、機場擁堵等不常見原因?qū)е屡艿勒加脮r間過長或過短的現(xiàn)象,總體跑道占用時間為20~145 s,在此情況下再引入±10 s作為評價指標,10 s的誤差占比不大符合實際運行效果,模型±10 s的準確性達到93.59%。這表明使用GWO-RF算法的進場航空器跑道占用時間預測模型更合適。
表4 模型預測準確率對比
(1)通過對跑道占用時間的分析,可以發(fā)現(xiàn)跑道出口的選擇對ROT的影響最大,跑道出口端速度、跑道入口端的速度、氣象情況、機型、跑道出口角度、航空公司等因素也對跑道占用時間具有不同程度的影響。
(2)通過GWO實現(xiàn)了隨機森林參數(shù)的高效尋優(yōu),提升了隨機森林參數(shù)的優(yōu)化效率,使得 ROT預測模型具有良好的準確性和魯棒性。
(3)在未來跑道占用時間的預測工作中,可以考慮將跑道因素、特殊天氣因素引入進行建模,以進一步提高跑道占用時間的準確性,為管制員提供更加高效、準確的決策信息。