李 雪,何元清,胡 耀
(中國民用航空飛行學院計算機學院,廣漢 618300)
隨著我國航空運輸業(yè)的高速發(fā)展,我國航空公司飛機起降架次在2019年達496.62萬架次,旅客運輸量為65993.42萬人次。相當于每天有180.8萬人乘坐飛機出行,大型機場越加繁忙。機場向多跑道、多航站樓、多滑行道的趨勢發(fā)展,機場運行安全逐漸成為隱患。我國民航業(yè)在2006—2011年,僅五年的時間發(fā)生了91起跑道入侵不安全時間,其中構成事故征候8起。2016年上海虹橋機場發(fā)生跑道入侵事件,僅相差3秒就造成兩輛載客量共為550人的客機相撞事件,對機場和乘客造成了嚴重的安全隱患。盡管機場規(guī)模日益增大,但運行效率卻有所降低。場面滑行時間長,場面滑行沖突造成的等待次數(shù)多和人工語音指揮效率低制約了機場的高速發(fā)展。在2006—2015年,隨著飛機起降架次的增多,航班正常率基本呈現(xiàn)逐年遞減,2016年全國航班正常率僅為76.76%。不能對機場場面航空器準確的預測其所處的位置和時間,是導致機場頻繁發(fā)生碰撞危險的原因。研究軌跡的預測是安全高效控制場面滑行的重要基礎,對路由規(guī)劃,包括對風險預警,航班次序,重要節(jié)點的時間安排等都能起到重要作用。從而減少航班延誤、增加旅客滿意度、提高機場服務質量。對場面的軌跡預測有助于減少飛機在場面的等待時間和沖突發(fā)生概率。
目前我國大多數(shù)機場只具備監(jiān)視和控制的功能服務。即使實現(xiàn)了路由引導的機場,如大興,其智能化程度也不高,主要是基于預定義的標準滑行路線實現(xiàn)了燈光引導,這是制約其發(fā)展的關鍵原因之一,也是由于難以實現(xiàn)準確的場面航空器航跡預測,缺乏動態(tài)路由規(guī)劃的基礎。
Laura Hernando Guada?o研究考察了將飛機用作終端區(qū)域中的風傳感器以進行實時風估計,以改善飛機軌跡預測的情況。不僅描述了飛機系統(tǒng)中提供風速推導所需變量的不同來源,而且還描述了能夠為空中交通管理應用提供此信息的功能。Wang Yuhao使用貝葉斯熵信息融合方法,將仿真模型中的數(shù)據與實時交通數(shù)據流和可用的物理約束集成在一起。該預先警告將使飛行員/管制員能夠采取措施減輕國家空域系統(tǒng)中的不良事件。但是基于動力學模型在實際運行過程中航空器的諸多動力學參數(shù)并不易獲得,如氣象預報、管制員意圖、飛行員操作意圖等。在基于歷史數(shù)據的彈道預測研究中,張尚健等人利用多項式擬合法對目標位置的歷史數(shù)據序列進行處理,計算出目標的未來位置,并隨著時間的推移不斷更新目標數(shù)據。Gong C根據中國航空器滑行技術路線中特定目標區(qū)域的真實信息數(shù)據的研究(比如一個直道、轉彎處的滑行速度發(fā)展和加速度),描述了航空器在機場場面以及運動的軌跡分析模型。上述軌跡預測模型都是在理想的歷史軌跡數(shù)據下得到的,沒有考慮不完整或不連續(xù)的歷史數(shù)據,基于預測的精度還有待驗證。Atkins S等探討4D概念的場面交通管理的作用以及需要解決的問題。未來基于軌跡的研究將是交通管理的主題。
深度學習通過輸入層與輸出層的復雜關聯(lián),對歷史數(shù)據進行分析、學習,不依賴運動學模型,目前部分學者嘗試運用深度學習方法解決交通流預測問題。
循環(huán)神經(RNN)網絡的基本結構,如圖1所示。
圖1 循環(huán)神經網絡基本結構
由圖1可見,x表示為輸入層,t表示為時刻,o表示為輸出層,s表示為隱藏層,矩陣W為隱藏層上一時刻的值作為下一時刻輸入的權重。輸出層o和隱藏層s的計算方法如式(1)、(2)所示。RNN是一個自我不斷循環(huán)的結構。將上一時刻的輸出狀態(tài)作為下一時刻的輸入進行訓練與學習。直到輸入或訓練結束,得到最終的輸出結果。
LSTM循環(huán)結構中增加了輸入門、輸出門、遺忘門和記憶單元?!伴T”的設置使得信息選擇式通過,可以避免學習長期依賴信息。LSTM解決了RNN存在的梯度消失和梯度爆炸的問題。LSTM網絡基本結構如圖2所示。
圖2 LSTM網絡基本結構
(1)輸入門。通過設置閾值決定當前時刻輸入數(shù)據有多少需要傳遞到單元狀態(tài)。閾值為1表示輸入數(shù)據完全保留,閾值為0表示輸入數(shù)據完全舍棄,將上一時刻的輸出數(shù)據與當前時刻的輸入數(shù)據通過輸入門得到i如式(3),以及通過單元狀態(tài)得到當前時刻暫時狀態(tài)Cˇ如式(4)所示。
(2)遺忘門。決定上一時刻的單元狀態(tài)丟棄多少。應用上一個時刻的輸出h和當前的數(shù)據輸入x,通過遺忘門得到f如式(5)所示。
(3)輸出門??刂飘斍皢卧獱顟B(tài)有多少需要輸出到當前的輸出值。應用上一個時刻的輸出h和當前的數(shù)據輸入x,通過輸出門得到o如式(6),以及結合當前細胞的單元狀態(tài)C和o得到最終的輸出h如式(7)所示。
(4)記憶單元更新公式如式(8)所示。
文中研究所用的數(shù)據來自于中國民用航空局第二研究所,通過機場場面監(jiān)視雷達得到的航空器歷史軌跡數(shù)據。數(shù)據表1所示。
表1 歷史軌跡數(shù)據表
該數(shù)據是北京首都機場2020年6月5日某時段的歷史數(shù)據,共計594559條數(shù)據。民航二所提供的大量機場航空器實時數(shù)據,滿足了數(shù)據的可靠性與數(shù)據量的要求,對后續(xù)的模型訓練建立了基礎。數(shù)據為xml格式的文件,數(shù)據文件中有各種標簽信息,使用xml解析技術Element-Tree提取出所需標簽的text或者屬性值,經度、緯度、時間、航空器型號、速度以及高度特征。經過一階差分、數(shù)據歸一化等處理后,再將數(shù)據以航空器型號分組,將每組數(shù)據整理為時間序列數(shù)據,再將時間序列問題轉換為監(jiān)督學習問題。數(shù)據為航空器從停機坪推出到起飛整個軌跡,由于只對航空器場面進行軌跡預測,即將高度特征中數(shù)值為0的數(shù)據刪去。
雷達采集的數(shù)據中存在數(shù)據缺失問題,數(shù)據缺失是一個十分復雜的問題,大量有用數(shù)據的缺失,使得預測的不確定性顯著增加。缺失數(shù)據處理方式的好壞,直接影響軌跡預測準確率。因此,缺省值需要通過專門的方法進行推導、填充等。通過檢查數(shù)據發(fā)現(xiàn)包含缺失值,對于非數(shù)值類的缺失值,采用刪除元組的方式。對于數(shù)值類的缺失值,采用數(shù)據補齊方式中的平均值填充方法。
開發(fā)中使用Pycharm編譯工具、Python語言對數(shù)據進行處理,調用pandas和numpy庫中已封裝好的函數(shù),實現(xiàn)對數(shù)據的快速處理。使用Pycharm編譯工具提高了開發(fā)效率,比如代碼跳轉,項目管理,智能提示。
2.2.1 單維單步
LSTM對不同的框架采用不同的數(shù)據輸入形式,處理數(shù)據時令input_size=3,seq_len=7,batch=1。input_size為單行輸入數(shù)據特征個數(shù),seq_len為輸入數(shù)據總計行數(shù)。batch表示內部模型每次處理的樣本個數(shù)。例如數(shù)據[1,2,3,4,5,6,7,8,9],將數(shù)據輸入LSTM模型,處理后的數(shù)據如表2所示。
表2 單維單步數(shù)據表
2.2.2 多維多步
比如一組數(shù)據為:[[10,21],[20,22],[30,23],[40,24],[50,25],[60,26],[70,27],[80,28],[90,29],[100,30]]。此數(shù)據為時間序列數(shù)據包含兩個特征,確定訓練集的窗口長度,即用t-2,t-1,t時刻的數(shù)據對模型進行訓練,t+1時刻的數(shù)據對結果進行驗證。此例對數(shù)據進行兩步預測。處理后的數(shù)據如表3所示。
表3 多維多步數(shù)據表
其中seq_len=6,batch=3,input_size=2。搭建模型的部分與單維單步分析相同,output的形狀與target一樣為(6,2,2),而輸入的形狀為(6,3,2),則需要一個全連接層使其輸入為(6,3,2)輸出為(6,2,2)。實驗中采用多維多步對航空器數(shù)據進行預處理。核心代碼如下:
對LSTM模型參數(shù)進行設置,核心代碼如下。
實驗中對航空器的經度緯度進行多步預測,即采用多維多步方式,將時間序列數(shù)據轉換為監(jiān)督數(shù)據。選擇其中一個航空器的一組飛行高度為0的數(shù)據,保證航空器在機場場面活動,對機場場面滑行軌跡中部分軌跡進行預測,其中藍色為飛機行駛軌跡原始數(shù)據,紅色圓點表示測試集預測的下一時刻的位置,綠色圓點表示訓練集預測下一時刻的位置。如圖3所示。
圖3 下一時刻軌跡位置
將處理后的數(shù)據樣本劃分為70%為訓練樣本集,30%劃分為測試樣本集。使用構建的模型對樣本集進行訓練,對測試集進行預測得到航空器下一時刻的位置。根據網絡的輸入,網絡的層數(shù)等得出訓練所使用的參數(shù)個數(shù)為175563,LSTM網絡得出準確率約為97.91%,如表4所示。
表4 預測結果
目前基于動力學模型在實際運行過程中航空器的諸多動力學參數(shù)并不易獲得,如氣象預報、管制員意圖、飛行員操作意圖等。而深度學習神經網絡對歷史數(shù)據進行訓練,不依賴航空器的特性,在預測精度和預測時間上有更好的效果。
文中首先對循環(huán)神經網絡進行介紹,由于循環(huán)神經網絡存在梯度消失和梯度爆炸的問題,引申出長短期記憶網絡。其次分析歷史數(shù)據,建立軌跡預測模型。但目前僅實現(xiàn)了對單個航空器的軌跡預測,如何實現(xiàn)對多個航空器同時進行場面軌跡預測與實現(xiàn)長期預測是下一步要解決的難題。