朱國棟,孫建杰,劉曉明,梁 艷
(1.民航新疆空中交通管理局空管中心氣象中心,新疆 烏魯木齊 830016;2.民航新疆空中交通管理局氣象服務(wù)部,新疆 烏魯木齊 830016)
在機場運行中,機場能見度直接關(guān)系到航空器能否起飛和著陸,它是保障航空器安全飛行的重要氣象要素,尤其是大霧、沙塵等造成的低能見度天氣,會嚴重影響航班的正常運行。目前在機場低能見度天氣下,民航氣象服務(wù)機構(gòu)以主導(dǎo)能見度的預(yù)測服務(wù)為主,但是在機場啟用II類和III類運行的情況下,跑道視程(簡稱RVR)直接決定航空器是否能夠起飛和降落[1-2],雖然已有相關(guān)研究表明,主導(dǎo)能見度與跑道視程有一定的關(guān)系[3],但是在低能見度天氣下,跑道視程放行標準遠低于主導(dǎo)能見度,因此研究跑道視程的預(yù)測,改善現(xiàn)有的氣象服務(wù)產(chǎn)品的種類,對低能見度天氣下機場運行有著積極的作用[4-5]。隨著近些年數(shù)值預(yù)報技術(shù)和機器學(xué)習(xí)的發(fā)展,機場能見度方面的預(yù)測由原先的天氣形勢預(yù)測和要素外推[6-8],逐漸結(jié)合大數(shù)據(jù)分析、機器學(xué)習(xí)等方法,構(gòu)建歷史數(shù)據(jù)模型,輸出客觀的要素預(yù)報產(chǎn)品[9-13]。本文通過利用烏魯木齊機場自動觀測系統(tǒng)歷史數(shù)據(jù),使用自動機器學(xué)習(xí)工具Auto-Keras進行建模訓(xùn)練,為氣象服務(wù)人員提供客觀的跑道視程預(yù)測產(chǎn)品,豐富低能見度天氣下的氣象服務(wù)產(chǎn)品。
本文使用烏魯木齊機場2010年1月至2021年2月的機場自動觀測系統(tǒng)逐分鐘跑道視程觀測數(shù)據(jù),通過數(shù)據(jù)篩選和質(zhì)量控制,結(jié)合烏魯木齊機場低能見度氣候特征,篩選11月至次年3月的數(shù)據(jù),獲得247萬行歷史數(shù)據(jù)用于建模訓(xùn)練。其中165萬條記錄用于自動機器學(xué)習(xí)模型的訓(xùn)練,81萬條記錄用于檢驗?zāi)P偷念A(yù)測效果。
考慮逐分鐘歷史數(shù)據(jù)規(guī)模龐大,為提高建模效率,確保后續(xù)業(yè)務(wù)化的運行速度,本文僅將跑道視程作為因子,為盡可能包含過去跑道視程的演變過程,將預(yù)報時效之前2 h的逐分鐘跑道視程作為因子。
傳統(tǒng)的機器學(xué)習(xí)方法中,在給定的數(shù)據(jù)集中實現(xiàn)最佳的預(yù)測模型,通常需要進行數(shù)據(jù)預(yù)處理、特征選擇、模型構(gòu)建及參數(shù)尋優(yōu)等業(yè)務(wù)流程,這些處理通常非常復(fù)雜,需要具備機器學(xué)習(xí)背景知識的專家來完成,隨著近些年機器學(xué)習(xí)的不斷發(fā)展,越來越多的預(yù)測方法和模型被開發(fā)出來,選擇合適的模型變得越來越困難,并且參數(shù)調(diào)優(yōu)需要遍歷所有可能的值,這些都需要大量的人工操作,這些工作都會導(dǎo)致機器學(xué)習(xí)業(yè)務(wù)轉(zhuǎn)化困難,流程難于管理。為改善這些問題,自動機器學(xué)習(xí)方法就應(yīng)運而生,它能夠簡化機器學(xué)習(xí)業(yè)務(wù)流程,消除常規(guī)手動的模型選擇和參數(shù)尋優(yōu),幫助非機器學(xué)習(xí)專家能夠輕松處理相關(guān)任務(wù)。
Auto-Keras使用高效神經(jīng)架構(gòu)搜索(ENAS),對候選模型進行訓(xùn)練,通過參數(shù)共享提升訓(xùn)練速度,最終獲取最優(yōu)的模型參數(shù)。本文使用Nvidia P6000 GPU進行Auto-Keras的模型構(gòu)建和運算加速,解決神經(jīng)架構(gòu)搜索的計算耗時問題。結(jié)合整體計算資源和建模時效性,本文使用Auto-Keras工具包,設(shè)置迭代尋優(yōu)次數(shù)后進行模型訓(xùn)練,其中代碼主要部分如圖1所示。
圖1 Auto-Keras方法建模流程代碼
通過上述代碼,使用GPU進行加速運算,經(jīng)過近10 h的模型訓(xùn)練和參數(shù)尋優(yōu),Auto-Keras方式自動獲取最優(yōu)模型,具體模型參數(shù)見表1。
表1 Auto-Keras的最優(yōu)模型及參數(shù)
為了評定Auto-Keras工具建模的預(yù)測效果,本文利用平均絕對誤差來評估模型的預(yù)測效果,具體計算方法如下:
其中:Fj為預(yù)報值,Oj為觀測值。
本文根據(jù)機場運行需要,將跑道視程按照100 m量級進行分類檢驗,分別計算不同量級下,訓(xùn)練樣本和檢驗樣本的平均絕對誤差,評估模型在低能見度天氣下,尤其是跑道視程低于500 m情況下的預(yù)測能力。
從誤差統(tǒng)計表(表2)中可以看到,烏魯木齊機場跑道視程大于等于1 000 m的樣本總體較多,訓(xùn)練樣本占比達89.23%,檢驗樣本占比達93.92%,因此模型對該量級情況下的訓(xùn)練最為充分,得到的模擬效果最好,平均絕對誤差僅為4~6 m,但是考慮該量級下飛行活動不受影響,故此處不討論該量級下的預(yù)測效果。分析其余跑道視程量級的預(yù)測效果可以看到,跑道視程在[100,200)、[200,300)、[800,900)、[900,1000)范圍內(nèi)預(yù)測誤差相對較小,訓(xùn)練樣本和檢驗樣本的平均絕對誤差均維持在100 m以內(nèi),其中訓(xùn)練樣本跑道視程在[200,300)范圍內(nèi)平均絕對誤差最小,僅為70 m;檢驗樣本跑道視程在[100,200)范圍內(nèi)平均絕對誤差最小,為68 m。跑道視程在[0,100)、[300,400)、[400,500)、[500,600)、[600,700)、[700,800)范圍內(nèi)的誤差偏大,訓(xùn)練樣本和檢驗樣本的平均絕對誤差均超過100 m,其中訓(xùn)練樣本和檢驗樣本在[500,600)范圍內(nèi)最大,達到180 m以上。具體誤差統(tǒng)計見表2。
表2 不同區(qū)間范圍內(nèi)的跑道視程預(yù)測誤差分析
通過分析預(yù)測模型對不同量級下跑道視程的平均絕對誤差可以看到,Auto-Keras構(gòu)建的預(yù)測模型能夠較好地預(yù)測出跑道視程,在跑道視程小于1 000 m的時候,訓(xùn)練樣本和檢驗樣本的平均絕對誤差維持在70~180 m,考慮到訓(xùn)練樣本中不同量級的跑道視程數(shù)量差異,構(gòu)建模型對于不同量級的跑道視程預(yù)測能力也不同,在實際應(yīng)用過程中,需要結(jié)合誤差分析表,額外考慮不同量級跑道視程的預(yù)測能力,綜合分析獲得跑道視程的預(yù)測結(jié)果。
由于烏魯木齊機場冬季不同月份下低能見度天氣差異較大[14],因此需要單獨評估不同月份下,跑道視程預(yù)測的效果。通過表3可以看到,不同月份下各量級的跑道視程數(shù)量差異較大,其中11月、12月、1月出現(xiàn)的低跑道視程情況較多。
表3 跑道視程預(yù)測效果逐月變化分析
構(gòu)建的模型對跑道視程的預(yù)測在11月效果最好,訓(xùn)練樣本的平均絕對誤差在58~156 m之間,檢驗樣本的平均絕對誤差在42~167 m之間,其中訓(xùn)練樣本在[200,300)區(qū)間范圍內(nèi)預(yù)測效果最好,平均絕對誤差約為58 m,檢驗樣本在[100,200)范圍內(nèi)平均絕對誤差約為43 m;另外,考慮跑道視程1 000 m下對飛行活動沒有影響,該情況不單獨進行分析。12月、1月、2月整體誤差較為穩(wěn)定,訓(xùn)練樣本的平均絕對誤差在66~197 m之間,最低出現(xiàn)在2月跑道視程區(qū)間[900,1000),檢驗樣本的平均絕對誤差在56~290 m之間,最低出現(xiàn)在12月跑道視程區(qū)間[100,200)。3月份部分量級下的跑道視程樣本數(shù)量較少,整體誤差偏大,訓(xùn)練樣本的平均絕對誤差在65~172 m之間,檢驗樣本則在45~192 m之間,部分量級下跑道視程預(yù)測誤差較大。
為了評估模型對逐分鐘的跑道視程預(yù)測效果,以及模型對低能見度天氣的預(yù)測能力,本文挑選烏魯木齊機場的2次大霧天氣,分析大霧天氣下跑道視程的演變以及模型預(yù)測效果。
2017年11月10日烏魯木齊機場跑道視程00:22至05:30(UTC,下同)持續(xù)低于800 m,期間跑道視程最低150 m,通過分析模型預(yù)測的跑道視程可以看到,實況00:22之前跑道視程大于等于1 000 m,之后突然降低,并長時間維持在200 m左右,05:30之后跑道視程逐漸好轉(zhuǎn)至1 000 m以上。通過分析模型輸出的跑道視程實況與預(yù)測結(jié)果對比圖(圖2)可以看到,模型預(yù)測的跑道視程整體趨勢與跑道視程實況演變較為一致,跑道視程預(yù)測值轉(zhuǎn)差的時刻在00:27附近,轉(zhuǎn)好的時刻在05:30附近,能夠較好地預(yù)測出能見度轉(zhuǎn)差、轉(zhuǎn)好的時間段,同時也預(yù)測出跑道視程長時間持續(xù)維持在200 m的區(qū)間,此次跑道視程預(yù)測效果能夠為預(yù)報人員提供較為客觀的預(yù)測支持。
圖2 烏魯木齊機場2017年11月10日逐分鐘跑道視程預(yù)測結(jié)果
雖然模型能夠較好地預(yù)測出持續(xù)長時間的低能見度情況,但是還需要評估跑道視程大范圍波動變化的情況,通過篩選判斷(圖3),可以看到2021年2月14日至15日,烏魯木齊機場出現(xiàn)大霧天氣,跑道視程出現(xiàn)較大范圍的波動變化和長時間低于運行標準的情況,模型預(yù)測的跑道視程能夠描述出此次天氣過程中跑道視程的整體變化趨勢,包括跑道視程在14日23:58逐漸轉(zhuǎn)差,15日02:00附近的短時好轉(zhuǎn)以及15日03:15的逐漸好轉(zhuǎn),說明模型具備對復(fù)雜變化的跑道視程預(yù)測的能力。
圖3 烏魯木齊機場2021年2月14日至15日逐分鐘跑道視程預(yù)測結(jié)果
通過分析2次不同特征的天氣個例預(yù)測效果可以看到,模型預(yù)測的跑道視程能夠描述出跑道視程的變化趨勢,并對跑道視程持續(xù)偏低的情況有較好的預(yù)測能力。但是,通過對比分析,也能夠發(fā)現(xiàn)模型的一些問題,在跑道視程轉(zhuǎn)差、轉(zhuǎn)好的時間點預(yù)測方面,模型預(yù)測的跑道視程與實況存在一定的時間滯后性,大致在5~10 min,且跑道視程的預(yù)測值還存在100~200 m的誤差,這些需要在使用過程中進行綜合分析和判斷。
(1)通過采用自動機器學(xué)習(xí)工具Auto-Keras構(gòu)建烏魯木齊機場跑道視程預(yù)測模型,簡化了常規(guī)機器學(xué)習(xí)中的特征篩選、參數(shù)尋優(yōu)和模型驗證等流程,降低了機器學(xué)習(xí)在氣象領(lǐng)域的應(yīng)用難度。
(2)將烏魯木齊機場自動觀測系統(tǒng)的歷史數(shù)據(jù)作為訓(xùn)練樣本,并對跑道視程進行預(yù)測,通過對跑道視程預(yù)測結(jié)果的分析可以看到,模型預(yù)測的跑道視程效果較好,能夠反映出跑道視程的變化趨勢,可以作為預(yù)報人員用于預(yù)測跑道視程的業(yè)務(wù)參考。
雖然自動機器學(xué)習(xí)構(gòu)建的模型能夠較好地用于預(yù)測跑道視程,但是局限于計算資源,本文僅選取跑道視程歷史演變作為因子進行建模訓(xùn)練,實際上跑道視程的變化還與機場風(fēng)速、溫度、濕度和背景光強度等要素有關(guān),在后續(xù)的研究中,應(yīng)該增加上述要素作為因子進行訓(xùn)練,充分考慮其他要素的演變對跑道視程變化,對比分析不同要素作為因子對整體模型預(yù)測準確性的影響,改善模型預(yù)測的準確性。同時,本文預(yù)測的跑道視程雖然趨勢預(yù)測比較準確,但是在開始、結(jié)束時間上仍然有一定的滯后性,后續(xù)研究同樣需要調(diào)整因子數(shù)量,改善預(yù)測效果滯后的問題。