石慶研 張澤中 韓 萍
(中國(guó)民航大學(xué)天津市智能信號(hào)與圖像處理重點(diǎn)實(shí)驗(yàn)室,天津 300300)
近年來隨著民航業(yè)的快速發(fā)展,空中交通流量急劇加大,給空中交通管理(Air Traffic Management,ATM)系統(tǒng)帶來了巨大的負(fù)擔(dān)。鑒于此,國(guó)際民航組織提出基于航跡運(yùn)行(Trajectory Based Operations,TBO)的空中交通管理模式,該模式以精準(zhǔn)的4D 航跡預(yù)測(cè)為基礎(chǔ),在空管單位、航空公司等相關(guān)方共享航跡動(dòng)態(tài)信息,通過協(xié)同決策實(shí)現(xiàn)航班精細(xì)化運(yùn)行[1]。其中,4D 航跡預(yù)測(cè)指對(duì)飛機(jī)在未來一段時(shí)間內(nèi)航跡數(shù)據(jù)變量進(jìn)行預(yù)測(cè),包括航跡點(diǎn)的三維坐標(biāo)(經(jīng)度、緯度和高度)及過該航跡點(diǎn)時(shí)間。精確的航跡預(yù)測(cè)有助于管制員預(yù)先獲取航班飛行態(tài)勢(shì),減小未知飛行條件帶來的工作負(fù)荷。航跡預(yù)測(cè)還為其他決策系統(tǒng)提供了必要的信息輸入,如出發(fā)和到達(dá)管理、航空器異常行為監(jiān)測(cè)、短期沖突告警(Short-term Conflict Alert,STCA)等等。例如,提高大約4~8 min 視野范圍內(nèi)的航跡預(yù)測(cè)精度,有助于減少STCA 的錯(cuò)誤告警,從而提高系統(tǒng)的整體效率[2]。
目前,人們已經(jīng)在航跡預(yù)測(cè)算法上進(jìn)行了大量研究,這些算法可以分為基于質(zhì)點(diǎn)運(yùn)動(dòng)、基于狀態(tài)估計(jì)和基于機(jī)器學(xué)習(xí)三類?;谫|(zhì)點(diǎn)運(yùn)動(dòng)的預(yù)測(cè)方法,將航空器看作一個(gè)質(zhì)點(diǎn),基于動(dòng)力學(xué)、運(yùn)動(dòng)學(xué),利用飛機(jī)性能參數(shù)建立約束關(guān)系推測(cè)出航空器航跡[3-5]。狀態(tài)估計(jì)方法是根據(jù)航空器的位置、速度、加速度等屬性來建立一個(gè)狀態(tài)轉(zhuǎn)移模型進(jìn)行航跡預(yù)測(cè)。謝麗等基于混雜系統(tǒng)理論,針對(duì)航空器的不同模式提出了基于交互多模型(Interacting Multiple Model,IMM)的航跡預(yù)測(cè)算法[6]。湯新民等利用IMM 讓不同的飛行模式匹配相應(yīng)的運(yùn)動(dòng)狀態(tài),實(shí)現(xiàn)動(dòng)態(tài)校正初始預(yù)測(cè)值的航跡預(yù)測(cè)[7]。戴定成等提出了一種改進(jìn)的馬爾可夫參數(shù)自適應(yīng)IMM 算法,通過自適應(yīng)調(diào)整模型切換矩陣,從而提高了對(duì)目標(biāo)跟蹤的精度[8]?;谫|(zhì)點(diǎn)運(yùn)動(dòng)的航跡預(yù)測(cè),需要依賴大量先驗(yàn)條件。而基于狀態(tài)估計(jì)的方法,所構(gòu)建的模型往往難以充分捕捉航跡信息中復(fù)雜的非線性關(guān)系,在特征提取方面存在較大局限性。
機(jī)器學(xué)習(xí)算法的快速發(fā)展,為航跡預(yù)測(cè)提供了新的方法。這種方法是將航跡預(yù)測(cè)轉(zhuǎn)化為多維時(shí)間序列預(yù)測(cè)問題,通過挖掘航空器的航跡特征隨時(shí)間變化的關(guān)系進(jìn)行航跡預(yù)測(cè),具有從大量數(shù)據(jù)中學(xué)習(xí)復(fù)雜模式和捕捉非線性關(guān)系的能力,已經(jīng)成為航跡預(yù)測(cè)的研究熱點(diǎn)。Wu 等人為解決傳統(tǒng)航跡預(yù)測(cè)方法不能滿足多維度和實(shí)時(shí)性的問題,提出了基于誤差反向傳播(Back Propagation,BP)神經(jīng)網(wǎng)絡(luò)的4D 航跡預(yù)測(cè)方法[9]。Shi 等提出了一種基于長(zhǎng)短期記憶(Long Short-Term Memory,LSTM)網(wǎng)絡(luò)的航跡預(yù)測(cè)模型,利用LSTM 捕捉航跡的時(shí)間依賴關(guān)系[10]。石慶研等考慮飛機(jī)過程中不確定因素對(duì)預(yù)測(cè)航跡的影響,設(shè)計(jì)了基于在線更新的LSTM 模型,有效提升預(yù)測(cè)精度[11]。針對(duì)輸入信息有限的問題,TRAN等引入豐富的飛機(jī)意圖數(shù)據(jù),使用CNN 和GRU 實(shí)現(xiàn)了低方差的航跡預(yù)測(cè)[2]。Zeng等設(shè)計(jì)了序列到序列的深度長(zhǎng)短期記憶網(wǎng)絡(luò)(Sequence-to-Sequence Deep Long Short-Term Memory Network,SS-DLSTM),來提取航跡之間的長(zhǎng)、短時(shí)間依賴性和重復(fù)性[12]。為了捕捉航跡復(fù)雜的時(shí)空關(guān)系,Ma 等人使用1D-CNN 對(duì)原始航跡數(shù)據(jù)進(jìn)行卷積,融合了卷積核內(nèi)多個(gè)變量的空間信息,再用LSTM 挖掘航跡時(shí)間維度的信息[13]。Jia 等人使用LSTM 對(duì)航跡進(jìn)行隱藏特征提取,引用注意力機(jī)制對(duì)LSTM 輸出的隱藏狀態(tài)向量的每個(gè)特征維度進(jìn)行打分,增強(qiáng)關(guān)鍵特征維度影響[14]。文獻(xiàn)[13]和文獻(xiàn)[14]在循環(huán)神經(jīng)網(wǎng)絡(luò)LSTM 的基礎(chǔ)上,分別使用CNN 捕獲航跡數(shù)據(jù)空間特征和引入注意力機(jī)制提高了航跡預(yù)測(cè)精度。本研究同時(shí)將CNN 和注意力機(jī)制融合到GRU 模型上,設(shè)計(jì)了時(shí)間特征通道和空間特征通道,進(jìn)一步改善航跡預(yù)測(cè)的性能。
本文為探尋航跡變量的時(shí)空特征,實(shí)現(xiàn)多步高精度的航跡預(yù)測(cè),提出了融合時(shí)空特征的Encoder-Decoder 短期4D 航跡預(yù)測(cè)模型。Encoder 含有時(shí)間特征通道和空間特征通道,時(shí)間特征通道使用GRU獲取某個(gè)變量的時(shí)序模式,空間特征通道先使用級(jí)聯(lián)GRU-CNN 網(wǎng)絡(luò)對(duì)航跡多變量進(jìn)行高級(jí)特征提取并實(shí)現(xiàn)信息交互,再通過注意力機(jī)制對(duì)高級(jí)特征進(jìn)行加權(quán)分配,以增強(qiáng)關(guān)鍵特征的影響。在Decoder中,對(duì)Encoder 所產(chǎn)生的時(shí)空信息進(jìn)行拼接融合,使用GRU實(shí)現(xiàn)多步航跡預(yù)測(cè)。
本文研究的多步4D航跡預(yù)測(cè),可以看作是一個(gè)序列到序列的任務(wù),根據(jù)歷史和當(dāng)前航跡信息來預(yù)測(cè)未來一段時(shí)間內(nèi)的航跡信息。定義飛機(jī)在第i時(shí)刻的4D 航跡信息為,其中分別代表飛機(jī)在第i時(shí)刻航跡點(diǎn)的經(jīng)度、緯度、高度和時(shí)間。輸入窗長(zhǎng)為W的4D航跡信息P=[pt-W+1,pt-W+2,pt-W+3,…,pt]?∈RW×4,預(yù)測(cè)未來Q步的4D航跡信息。根據(jù)模型輸入是否需要更新,將多步預(yù)測(cè)方式分為兩類:迭代多步預(yù)測(cè)方法和直接多步預(yù)測(cè)方法。迭代多步預(yù)測(cè)方法通常采用遞歸方式進(jìn)行預(yù)測(cè),該方法以單步預(yù)測(cè)為基礎(chǔ),將預(yù)測(cè)的一個(gè)航跡點(diǎn)與歷史航跡點(diǎn)拼接,通過滑動(dòng)窗口更新模型的輸入,以此迭代多次實(shí)現(xiàn)多步航跡預(yù)測(cè)。直接多步預(yù)測(cè)模型可以直接從輸入序列中預(yù)測(cè)多個(gè)未來時(shí)間點(diǎn)的輸出結(jié)果,無須進(jìn)行多次迭代。
選擇哪種多步預(yù)測(cè)方式的主要考慮因素是在實(shí)際航跡預(yù)測(cè)應(yīng)用時(shí)有較高預(yù)測(cè)精度。由于預(yù)測(cè)階段,輸出的第q個(gè)航跡點(diǎn)與第q-1 個(gè)航跡點(diǎn)具有依賴關(guān)系,因此可以傳遞預(yù)測(cè)航跡點(diǎn)的狀態(tài)到下一個(gè)航跡點(diǎn),以便更好的來進(jìn)行預(yù)測(cè)。而Encoder-Decoder 結(jié)構(gòu)可在預(yù)測(cè)輸出時(shí)實(shí)現(xiàn)狀態(tài)傳遞,該結(jié)構(gòu)由Cho 等人提出,應(yīng)用于自然語(yǔ)言處理(Natural Language Processing,NLP)領(lǐng)域的機(jī)器翻譯任務(wù)[15]。在多維時(shí)間序列預(yù)測(cè)任務(wù)中,該結(jié)構(gòu)有助于緩解預(yù)測(cè)誤差隨視野增加而急劇增加的問題[16]。Encoder按順序讀取輸入序列并編碼為固定長(zhǎng)度的語(yǔ)義向量C,Decoder 則對(duì)語(yǔ)義向量C解碼并遞歸輸出,Encoder-Decoder結(jié)構(gòu)如圖1所示。
圖1 Encoder-Decoder結(jié)構(gòu)Fig.1 Encoder-decoder structure
航跡預(yù)測(cè)是一個(gè)多變量預(yù)測(cè)任務(wù),模型訓(xùn)練過程中以經(jīng)度、緯度、高度和時(shí)間的整體預(yù)測(cè)誤差加權(quán)求和最小化為目標(biāo),預(yù)測(cè)時(shí)可能會(huì)帶來局部變量預(yù)測(cè)精度損失的問題。實(shí)際應(yīng)用中,經(jīng)度和緯度的預(yù)測(cè)準(zhǔn)確性對(duì)預(yù)測(cè)點(diǎn)與真實(shí)點(diǎn)之間的距離影響更大,高度的影響較小,若經(jīng)度、緯度的預(yù)測(cè)精度得不到保障,會(huì)使預(yù)測(cè)航跡和真實(shí)航跡偏差較大。為避免局部變量預(yù)測(cè)精度損失,使用了四個(gè)多輸入單輸出的STED 模型進(jìn)行4D 航跡預(yù)測(cè),為經(jīng)度、緯度、高度和時(shí)間建立單獨(dú)的預(yù)測(cè)模型,每個(gè)STED 模型所預(yù)測(cè)的航跡變量定義為目標(biāo)變量v(經(jīng)度、緯度、高度或時(shí)間)。每個(gè)模型訓(xùn)練時(shí)優(yōu)化單個(gè)航跡特征,預(yù)測(cè)輸出為目標(biāo)變量v的數(shù)值p(v)(其中v∈{lon,lat,alt,time}),從而提高整體的預(yù)測(cè)性能。四個(gè)Encoder接收航跡信息P,為每個(gè)目標(biāo)變量v捕獲了各自的時(shí)空特征作為語(yǔ)義向量C。四個(gè)Decoder 接收對(duì)應(yīng)Encoder 輸出的語(yǔ)義向量C并遞歸輸出目標(biāo)變量v,同時(shí)刻輸出組成一個(gè)4D 航跡預(yù)測(cè)點(diǎn),基于STED 模型的航跡預(yù)測(cè)結(jié)構(gòu)如圖2所示。
圖2 基于STED的4D航跡預(yù)測(cè)結(jié)構(gòu)Fig.2 4D trajectory prediction structure based on STED
在每個(gè)STED 模型中,既要提取目標(biāo)變量v在時(shí)間窗口內(nèi)的時(shí)序模式,又要充分提取目標(biāo)變量v和所有變量依賴的空間信息。時(shí)序模式是指目標(biāo)變量v隨時(shí)間的變化規(guī)律,包括長(zhǎng)期趨勢(shì)性和短期波動(dòng)性。長(zhǎng)期趨勢(shì)性反映了目標(biāo)變量v在較長(zhǎng)時(shí)間尺度內(nèi)的整體變化趨勢(shì),比如飛機(jī)由航路點(diǎn)A 飛往航路點(diǎn)B中,數(shù)據(jù)整體走向反映了長(zhǎng)期變化趨勢(shì);而短期波動(dòng)性則反映了目標(biāo)變量v在較短時(shí)間尺度內(nèi)的波動(dòng),在實(shí)現(xiàn)飛往航路點(diǎn)B過程中,受其他不確定因素影響,會(huì)有波動(dòng)性??臻g信息是指目標(biāo)變量v與全部航跡變量之間的依賴關(guān)系,它反映了全部變量對(duì)目標(biāo)變量v的影響程度。在航跡數(shù)據(jù)中,不同變量之間的依賴關(guān)系也是不同的。例如飛機(jī)在巡航階段,某個(gè)輸入時(shí)間窗口內(nèi)經(jīng)度的變化對(duì)未來時(shí)間段的高度影響不大,但對(duì)經(jīng)度本身的變化趨勢(shì)影響較大,因此獲取各變量的依賴關(guān)系有助于提升航跡預(yù)測(cè)精度。
根據(jù)這個(gè)建模策略,窗長(zhǎng)為W的4D 航跡數(shù)據(jù)P作為STED 模型的輸入,Encoder 中使用時(shí)間特征通道學(xué)習(xí)目標(biāo)變量v在時(shí)間窗口內(nèi)的時(shí)序模式,使用空間特征通道學(xué)習(xí)目標(biāo)變量v和所有變量高階依賴關(guān)系,Decoder 輸出目標(biāo)變量v的Q步預(yù)測(cè)。STED 模型結(jié)構(gòu)如圖3 所示,圖中GRU 神經(jīng)網(wǎng)絡(luò)為按時(shí)間展開后的結(jié)構(gòu),設(shè)置GRU 隱藏層神經(jīng)元個(gè)數(shù)為m,CNN 卷積核個(gè)數(shù)為K。預(yù)測(cè)過程具體步驟如下。第一步,在4D 航跡數(shù)據(jù)P中,復(fù)制目標(biāo)變量v隨時(shí)間變化的序列并將其取出記為Pv=,將Pv作為時(shí)間特征通道的輸入,對(duì)目標(biāo)變量v進(jìn)行單序列時(shí)間建模。第二步,將4D 航跡數(shù)據(jù)P送入到由GRU、CNN 和Attention 構(gòu)成的空間特征通道進(jìn)行建模,做Attention 時(shí)查詢向量為時(shí)間特征通道的輸出,以確定哪些特征對(duì)目標(biāo)變量v影響更大,此時(shí)空間特征通道輸出為目標(biāo)變量v和所有變量高階交互的空間信息。最后,Decoder 對(duì)Encoder 所產(chǎn)生的語(yǔ)義向量(Encoder 中時(shí)間特征通道和空間特征通道的輸出)進(jìn)行拼接融合,使用GRU 遞歸輸出目標(biāo)變量v的Q步預(yù)測(cè)。
圖3 STED模型結(jié)構(gòu)Fig.3 STED model structure
2.3.1 時(shí)間特征通道
使用時(shí)間特征通道對(duì)歷史和當(dāng)前時(shí)間步的目標(biāo)變量v進(jìn)行建模,捕捉時(shí)序模式。循環(huán)神經(jīng)網(wǎng)絡(luò)(Recurrent Neural Network,RNN)是最早用來對(duì)時(shí)間序列進(jìn)行建模的深度學(xué)習(xí)網(wǎng)絡(luò),序列的長(zhǎng)期依賴性導(dǎo)致梯度消失和梯度爆炸的問題。LSTM 是RNN的一種變體,比RNN 多出了三個(gè)控制器,分別為輸入門、遺忘門、輸出門,可以緩解梯度消失和梯度爆炸問題,使其具有長(zhǎng)期記憶的能力[17]。隨著不斷地研究和演化,又出現(xiàn)了與LSTM 具有相近性能的GRU,GRU 將LSTM 中輸入門和遺忘門融合為單一的更新門,GRU 擁有更少的參數(shù),所以訓(xùn)練效率更高。其神經(jīng)單元結(jié)構(gòu)如圖4所示,其中zt為更新門,控制前一時(shí)間步狀態(tài)信息輸入當(dāng)前狀態(tài)的程度;rt為重置門,決定前一時(shí)間步狀態(tài)的哪些信息被傳遞到候選狀態(tài)上。式(1)至(4)為t時(shí)間步GRU神經(jīng)單元狀態(tài)ht更新的計(jì)算公式。兼容訓(xùn)練效率與航跡預(yù)測(cè)精度,本文使用GRU對(duì)航跡序列進(jìn)行隱藏特征提取。
圖4 GRU神經(jīng)元結(jié)構(gòu)Fig.4 GRU neural network structure
式中σ和tanh 分別為sigmoid 和tanh 激活函數(shù),Wz、Wr和Wh是可訓(xùn)練的權(quán)重矩陣。在訓(xùn)練過程中,模型會(huì)根據(jù)序列中的不同飛行階段自動(dòng)學(xué)習(xí)到適應(yīng)這些階段的權(quán)重矩陣,使得可訓(xùn)練的權(quán)重矩陣在不同飛行階段通用,來識(shí)別各個(gè)階段的航跡變化模式。
在時(shí)間特征通道,使用GRU 來學(xué)習(xí)目標(biāo)變量v的隱藏狀態(tài)。獲取每一個(gè)目標(biāo)變量v在窗口內(nèi)的數(shù)據(jù)p(v),送入到GRU 中取出最后時(shí)間步的隱藏狀態(tài)作為目標(biāo)變量v的隱藏狀態(tài),得到隱藏狀態(tài)向量,其中m是GRU 隱藏神經(jīng)元個(gè)數(shù)。隱藏狀態(tài)向量表達(dá)了目標(biāo)變量v在窗口內(nèi)的時(shí)序模式。獲取這一過程可表示為:
2.3.2 空間特征通道
航跡數(shù)據(jù)序列各變量之間存在潛在的依賴關(guān)系,使用級(jí)聯(lián)GRU-CNN 網(wǎng)絡(luò)對(duì)全部航跡變量進(jìn)行高級(jí)特征提取,使用注意力機(jī)制來獲取不同高級(jí)特征對(duì)目標(biāo)變量v的重要程度,實(shí)現(xiàn)目標(biāo)變量v和全部航跡變量的高階特征交互,提取變量之間依賴性的空間信息。空間特征通道共分為三個(gè)階段。
第一階段:
GRU 對(duì)窗長(zhǎng)為W的4D 航跡信息P進(jìn)行隱藏特征提取,輸出所有時(shí)間步的隱藏狀態(tài)向量并構(gòu)成隱藏特征矩陣H=[ht-W+1,ht-W+2,…,ht]∈Rm×W,隱藏特征矩陣是飛機(jī)的速度、加速度、時(shí)間和位置信息的高階表達(dá)。對(duì)于GRU 對(duì)航跡變化趨勢(shì)所提取的隱藏特征矩陣H而言,允許每一個(gè)維度具有相同的特征信息。每一行代表單個(gè)隱藏特征在各個(gè)時(shí)間步下的狀態(tài),每一列代表一個(gè)時(shí)間步中所有隱藏特征構(gòu)成的向量。
第二階段:
使用1D-CNN 對(duì)隱藏特征矩陣H進(jìn)行高級(jí)特征提取。1D-CNN 卷積核只在數(shù)據(jù)的某一個(gè)維度上進(jìn)行移動(dòng),主要應(yīng)用于對(duì)時(shí)間序列進(jìn)行高級(jí)特征提?。?8-20]。本文卷積核沿特征維度上進(jìn)行遍歷,這使得卷積核可以融合窗長(zhǎng)W內(nèi)單個(gè)隱藏特征隨時(shí)間變化的高級(jí)信息。使用K個(gè)卷積核Ci∈R1×W,有助于單個(gè)隱藏特征變化趨勢(shì)的多角度表達(dá)。最終生成高級(jí)特征矩陣E∈Rm×K。對(duì)于CNN 輸出矩陣E中,Ei,j代表第i行的隱藏特征Hi和第j個(gè)卷積核Cj卷積產(chǎn)生的結(jié)果,結(jié)果Ei,j可表如式(6)所示。
第三階段:
目標(biāo)變量v和高級(jí)特征之間存在相互依賴關(guān)系,獲取這種空間信息有助于提升模型的預(yù)測(cè)精度。在此階段引入注意力機(jī)制,根據(jù)不同高級(jí)特征對(duì)目標(biāo)變量v的影響程度來計(jì)算權(quán)重,以增強(qiáng)對(duì)關(guān)鍵特征的提取,減少對(duì)噪聲特征的注意。常用的注意力打分方式有兩種:加性注意力和點(diǎn)積注意力。前者較為經(jīng)典[21],它使用含有隱藏層的前饋神經(jīng)網(wǎng)絡(luò)來計(jì)算注意力打分。后者通過計(jì)算兩個(gè)向量的相似度進(jìn)行打分,更有效的實(shí)現(xiàn)特征提取[22],本文使用點(diǎn)積注意力機(jī)制打分。
使用注意力機(jī)制計(jì)算特征矩陣E中各行向量和隱藏狀態(tài)向量的相關(guān)情況,區(qū)分對(duì)目標(biāo)變量v的重要性,使用式(7)進(jìn)行打分,用式(8)獲得每一行的權(quán)重:
式中Ei代表CNN輸出的高級(jí)特征矩陣E的第i個(gè)行向量,Wa∈RK*m為可訓(xùn)練的權(quán)重矩陣。
對(duì)高級(jí)特征矩陣E的行向量進(jìn)行加權(quán)求和,得到含有空間信息的向量,提取出目標(biāo)變量v隱藏狀態(tài)向量影響大的關(guān)鍵信息。的第i維表示為:
Encoder 時(shí)間特征通道和空間特征通道的輸出作為Decoder 的輸入,對(duì)目標(biāo)變量v的時(shí)空特征進(jìn)行拼接融合,最終得到目標(biāo)變量v的時(shí)空特征向量:
在上述所提的STED 模型基礎(chǔ)上,結(jié)合數(shù)據(jù)處理、模型訓(xùn)練和應(yīng)用測(cè)試環(huán)節(jié),基于STED 模型的航跡預(yù)測(cè)完整流程,如圖5所示。
圖5 航跡預(yù)測(cè)流程圖Fig.5 Trajectory prediction process diagram
在模型訓(xùn)練之前需要構(gòu)造模型輸入數(shù)據(jù)和標(biāo)簽數(shù)據(jù)。在某航班歷史飛行次數(shù)為M的航跡集T={T1,T2,…,TM}中,使用滑動(dòng)窗口方法對(duì)每條航跡進(jìn)行分割。從第一個(gè)航跡點(diǎn)開始,按照時(shí)序順序選取W個(gè)航跡點(diǎn)作為模型的輸入數(shù)據(jù),再選取所要預(yù)測(cè)的Q個(gè)點(diǎn)作為標(biāo)簽數(shù)據(jù),生成第一個(gè)樣本。接著將窗口移動(dòng)到第二個(gè)航跡點(diǎn),以生成第二個(gè)樣本。重復(fù)這個(gè)過程,直至窗口覆蓋到全部航跡點(diǎn)。t時(shí)刻的樣本如圖6 所示,行表示航跡變量經(jīng)度、緯度、高度和時(shí)間,列表示時(shí)序關(guān)系。最后將M條航跡分割后的結(jié)果堆疊在一起,形成最終的數(shù)據(jù)集。
圖6 滑窗構(gòu)建樣本示意圖Fig.6 Illustration of sliding window for sample construction
航跡是由不同數(shù)據(jù)特征構(gòu)成的時(shí)間序列,不同特征量綱不同且取值范圍差異較大。為避免影響航跡預(yù)測(cè)結(jié)果,通過式(11)對(duì)航跡特征進(jìn)行歸一化。使用歸一化后的數(shù)據(jù),一方面可以提升航跡預(yù)測(cè)模型的收斂速度,另一方面可以降低預(yù)測(cè)誤差。輸入模型的數(shù)據(jù)大小控制在[0,1]。
訓(xùn)練目標(biāo)是最小化預(yù)測(cè)輸出與真實(shí)值之間的誤差。首先建立STED 航跡預(yù)測(cè)模型并初始化參數(shù)。在參數(shù)迭代優(yōu)化的正向傳播過程之中,以式(12)作為模型的損失函數(shù),誤差反向傳播時(shí)采用Adam 優(yōu)化器對(duì)GRU、CNN 和FC 的權(quán)重和偏置進(jìn)行迭代更新,同時(shí)計(jì)算驗(yàn)證集中預(yù)測(cè)值和標(biāo)簽值的loss,當(dāng)在驗(yàn)證集上loss 減少時(shí)保存STED 中各層網(wǎng)絡(luò)的模型參數(shù),直到迭代次數(shù)到達(dá)最大值。本文采用Keras 深度學(xué)習(xí)框架進(jìn)行模型訓(xùn)練和驗(yàn)證,并在硬件環(huán)境為Intel CPU i7-10700 2.9 GHz、16 GB內(nèi)存的計(jì)算機(jī)上進(jìn)行實(shí)驗(yàn)。
式中N為訓(xùn)練樣本數(shù)量,是第τ步的預(yù)測(cè)值和真實(shí)值。
為驗(yàn)證所提模型的性能,本文采用某航班從重慶機(jī)場(chǎng)到烏魯木齊機(jī)場(chǎng)的真實(shí)飛行歷史數(shù)據(jù)開展仿真實(shí)驗(yàn)和分析。該飛行數(shù)據(jù)是由一系列離散航跡點(diǎn)組成的時(shí)間序列,數(shù)據(jù)特征包括航班號(hào)、飛機(jī)ID、數(shù)據(jù)接收時(shí)間、經(jīng)度、緯度、高度、俯仰、航向、地速等信息,數(shù)據(jù)時(shí)間間隔約為60 s。本文采用均方根誤差(Root Mean Square Error,RMSE)和平均絕對(duì)誤差(Mean Absolute Error,MAE)來評(píng)價(jià)模型預(yù)測(cè)的第τ步航跡點(diǎn)準(zhǔn)確性,計(jì)算如下:
式中N表示測(cè)試樣本數(shù)量。MAE 和RMSE 越小,表示模型預(yù)測(cè)結(jié)果與實(shí)際觀測(cè)值之間的差異越小。
為了比較不同多步預(yù)測(cè)方式對(duì)4D航跡預(yù)測(cè)精度的影響,本文分別構(gòu)建了基于STED的迭代多步預(yù)測(cè)和直接多步預(yù)測(cè)方法,并分別記為“IT”、“DI”。在IT方法中,Decoder只輸出未來一步的航跡信息,將預(yù)測(cè)下一點(diǎn)的航跡信息與歷史航跡數(shù)據(jù)進(jìn)行拼接,通過滑動(dòng)窗口更新STED模型的輸入,如此迭代多次實(shí)現(xiàn)多步航跡預(yù)測(cè)。在DI方法中,Decoder中的GRU進(jìn)行循環(huán)輸出未來多步的航跡信息。本實(shí)驗(yàn)中輸入時(shí)間窗口長(zhǎng)度W為8,預(yù)測(cè)步長(zhǎng)Q為10。表1中展示了第1步、第5步和第10步的各個(gè)變量預(yù)測(cè)誤差。
表1 不同多步預(yù)測(cè)方式RMSE和MAE值比較Tab.1 Comparison of RMSE and MAE values for different multi-step prediction methods
在表1 中可以看出,IT 方法的預(yù)測(cè)誤差隨時(shí)間急劇增加,這種結(jié)果是因?yàn)镮T 方法以單步預(yù)測(cè)為基礎(chǔ)來輸出多個(gè)時(shí)間步長(zhǎng)的預(yù)測(cè)結(jié)果,IT 方法每一次預(yù)測(cè)的誤差都會(huì)被累加到后續(xù)的預(yù)測(cè)中,導(dǎo)致誤差急劇增加。相較于IT方法而言,DI方法在整體上具有更高預(yù)測(cè)精度,分析原因可能在預(yù)測(cè)時(shí),Decoder會(huì)逐步生成每個(gè)輸出元素,每次生成一個(gè)輸出元素時(shí),都會(huì)考慮之前生成的元素和Encoder 的輸出。在這個(gè)過程中,Decoder 的狀態(tài)會(huì)根據(jù)之前生成的元素而改變,因此考慮了預(yù)測(cè)點(diǎn)之間的狀態(tài)傳遞問題,預(yù)測(cè)精度相對(duì)較高,使用DI方法作為STED模型的多步航跡輸出策略。
合理的超參數(shù)設(shè)定是神經(jīng)網(wǎng)絡(luò)訓(xùn)練中至關(guān)重要的因素,對(duì)于模型的性能和泛化能力具有重要影響。在本研究中,將預(yù)測(cè)的航跡點(diǎn)數(shù)Q設(shè)置為10,Encoder 和Decoder 中GRU 神經(jīng)元個(gè)數(shù)m相同且隱藏層數(shù)L都為1,同時(shí)Encoder 的空間特征通道中CNN 卷積核個(gè)數(shù)K設(shè)置為64。將批尺寸B設(shè)置為64,學(xué)習(xí)率μ設(shè)置為0.001,以確保模型能夠在訓(xùn)練時(shí)有效的更新權(quán)重。為了進(jìn)一步優(yōu)化模型的性能,對(duì)模型關(guān)鍵超參數(shù)進(jìn)行尋優(yōu)。輸入不同窗長(zhǎng)的航跡點(diǎn)對(duì)航跡預(yù)測(cè)模型的性能產(chǎn)生不同影響。過短可能忽略關(guān)鍵時(shí)序信息,過長(zhǎng)可能會(huì)增加冗余信息。隱藏神經(jīng)元個(gè)數(shù)m決定了神經(jīng)網(wǎng)絡(luò)的擬合程度。對(duì)關(guān)鍵超參數(shù)W和m在取值上進(jìn)行網(wǎng)格化搜索,搜索范圍為W={5,6,7,8,9,10}、m={32,64,128,256},得到24 種超參數(shù)組合下模型的驗(yàn)證集loss。圖7為不同超參數(shù)下的實(shí)驗(yàn)結(jié)果,當(dāng)使用歷史航跡窗口長(zhǎng)度W=8,GRU 隱藏神經(jīng)元個(gè)數(shù)m=128時(shí),驗(yàn)證集loss取得最小值,模型預(yù)測(cè)效果較好。最終的模型參數(shù)如表2所示。
表2 模型超參數(shù)選擇Tab.2 Selection of model hyperparameters
圖7 不同超參數(shù)組合下的驗(yàn)證集lossFig.7 The validation set loss for different combinations of hyperparameters
本文所提STED 航跡預(yù)測(cè)模型與效果較為先進(jìn)的數(shù)據(jù)驅(qū)動(dòng)模型LSTM[10]、CNN-LSTM[13]、ATLSTM[14]進(jìn)行比較,以驗(yàn)證本文模型的有效性。為了保證對(duì)比的公平性,我們將這三種模型與STED模型采用相同的多步預(yù)測(cè)方式進(jìn)行比較。如圖8和圖9 所示,計(jì)算預(yù)測(cè)航跡點(diǎn)的經(jīng)度、緯度、高度和時(shí)間的RMSE 和MAE 隨預(yù)測(cè)視野增加的曲線,來更清楚說明本文模型與對(duì)比模型的預(yù)測(cè)誤差。在圖8和圖9 中可以看出,本文模型在測(cè)試集整體上都取得了最好的航跡預(yù)測(cè)結(jié)果。在預(yù)測(cè)第一個(gè)航跡點(diǎn)時(shí),STED 在各個(gè)維度上表現(xiàn)出色,達(dá)到了最佳的性能水平。相比之下,CNN-LSTM 和AT-LSTM 的性能相近,但都低于STED 模型,LSTM 所預(yù)測(cè)航跡點(diǎn)與真實(shí)航跡點(diǎn)存在著較大的偏差且性能最差。隨著預(yù)測(cè)視野的增加,四個(gè)模型的誤差都隨時(shí)間增加而增加,在整體數(shù)據(jù)上來看STED 波動(dòng)更小。在多步預(yù)測(cè)時(shí)預(yù)測(cè)誤差隨時(shí)間增加是不能完全避免的,STED模型避免了誤差隨時(shí)間的急劇增加并獲得了較高的精度。特別的是,在時(shí)間維度的線性預(yù)測(cè)任務(wù)上,STED取得了更顯著的優(yōu)勢(shì)。
圖8 不同時(shí)間步各個(gè)模型RMSE值比較Fig.8 Comparison of RMSE values for different models at different time steps
圖9 不同時(shí)間步各個(gè)模型MAE值比較Fig.9 Comparison of MAE values for different models at different time steps
此外,如圖10 所示,在測(cè)試結(jié)果中選擇了轉(zhuǎn)彎處各個(gè)模型一次性預(yù)測(cè)的航跡(未來10 min 航跡),圖中箭頭為飛機(jī)運(yùn)動(dòng)方向。從整體趨勢(shì)來看,STED模型所預(yù)測(cè)航跡和真實(shí)航跡誤差更小,CNN-LSTM模型和AT-LSTM 模型具有相近的性能,LSTM 模型預(yù)測(cè)的航跡遠(yuǎn)遠(yuǎn)偏離真實(shí)航跡。分析具體原因?yàn)樵陲w行器轉(zhuǎn)彎過程,相鄰航跡點(diǎn)之間的各個(gè)特征值變化較為顯著,由于STED 模型能夠深度分析每個(gè)預(yù)測(cè)變量的時(shí)序模式和空間信息,并且可以在預(yù)測(cè)輸出時(shí)進(jìn)行隱藏狀態(tài)傳遞,因此STED 模型在航跡變化顯著的轉(zhuǎn)彎處預(yù)測(cè)效果更為準(zhǔn)確。
圖10 轉(zhuǎn)彎預(yù)測(cè)對(duì)比Fig.10 Comparison of turn prediction
為了進(jìn)一步驗(yàn)證本文方法的性能,使用北京機(jī)場(chǎng)到西昌機(jī)場(chǎng)實(shí)際飛行數(shù)據(jù)來進(jìn)行4D 航跡預(yù)測(cè)實(shí)驗(yàn)。各個(gè)模型的預(yù)測(cè)誤差如表3所示。
表3 北京-西昌飛行數(shù)據(jù)進(jìn)行實(shí)驗(yàn)RMSE和MAE值比較Tab.3 Comparison of experimental RMSE and MAE values for Beijing-Xichang flight data
表3 可以看出,對(duì)于其他航班的實(shí)際飛行數(shù)據(jù),STED 模型預(yù)測(cè)精確度同樣優(yōu)于基線模型,表現(xiàn)出了較好的預(yù)測(cè)性能。由此得出,STED 模型網(wǎng)絡(luò)結(jié)構(gòu)較優(yōu),預(yù)測(cè)結(jié)果更加接近于真實(shí)飛行航跡。此外,預(yù)測(cè)一個(gè)航跡點(diǎn)的平均耗時(shí)為0.002 s,小于航跡間隔60 s,證明了STED 模型具有良好的實(shí)時(shí)性。
精準(zhǔn)的多步航跡預(yù)測(cè)是ATM 工具的基礎(chǔ)。基于NLP 中Encoder-Decoder 的結(jié)構(gòu)和分析單個(gè)預(yù)測(cè)變量的時(shí)空特征為建模思路,針對(duì)多步4D 航跡預(yù)測(cè)提出了一種融合時(shí)空特征的Encoder-Decoder 模型。隨后與LSTM、CNN-LSTM 和AT-LSTM 模型進(jìn)行對(duì)比,實(shí)驗(yàn)結(jié)果表明本文所提的STED 模型具有更好的預(yù)測(cè)性能,為ATM 提供更加可靠的預(yù)測(cè)信息。在以后的研究中,引入更豐富的特征信息,如速度、轉(zhuǎn)向、俯仰等。同時(shí)改進(jìn)深度學(xué)習(xí)模型的結(jié)構(gòu),考慮使用圖神經(jīng)網(wǎng)絡(luò)等進(jìn)行航跡序列的時(shí)空特征建模,提升模型預(yù)測(cè)精度。