翟文鵬, 陳梵驛, 金嗣博
(中國民航大學(xué) 空中交通管理研究基地, 天津 300300)
?
基于分位數(shù)回歸的機場容量評估
翟文鵬, 陳梵驛, 金嗣博
(中國民航大學(xué) 空中交通管理研究基地, 天津 300300)
對北京首都國際機場航班運行的歷史數(shù)據(jù)進(jìn)行了統(tǒng)計分析,建立了進(jìn)離場小時架次及時間的三維數(shù)據(jù)結(jié)構(gòu),并利用DBSCAN算法進(jìn)行聚類分析;在消除“噪點”的基礎(chǔ)上,利用改進(jìn)后的分位數(shù)回歸算法生成分時段的具有95%概率的機場小時運行能力包線。仿真結(jié)果表明,各個時段的機場進(jìn)離場架次具有一定的時間特性和差異:8點到10點處于離港早高峰,離港小時架次遠(yuǎn)大于進(jìn)港小時架次;10點到22點進(jìn)離港航班較為均衡,機場全負(fù)荷工作;其他時間段航班小時架次未達(dá)到最大容量值。
機場容量; 延誤; 分位數(shù)回歸; 聚類分析
當(dāng)前,國內(nèi)外空中交通流量需求旺盛,不少大型機場的容量已飽和,航班延誤問題較為突出,提升航班正點率是迫切需要解決的問題。而機場改擴建工程耗時長、投資大,因此對機場現(xiàn)有容量進(jìn)行科學(xué)合理的評估,提高機場容量利用率,有助于航班時刻資源優(yōu)化和機場延誤水平降低[1]。
常見的機場容量評估方法主要有仿真模型法、數(shù)學(xué)模型法和實證研究法。其中,仿真模型法能夠逼真地模擬機場的運行情況,主要用于跑道容量評估;但目前多集中在對跑道容量的評估問題中,同時需要豐富的空管專業(yè)知識,特別是場面運行專業(yè)知識。李雄等[2]應(yīng)用Simmod仿真軟件針對不同典型構(gòu)型平行跑道及常用跑道運行模式,分別對跑道極限容量和實際運行容量進(jìn)行了仿真研究。高偉等[3]通過建立雙跑道容量計算模型,并應(yīng)用Simmod軟件仿真兩種方式評估機場跑道容量極限。該方法與數(shù)據(jù)計算模型所得的容量差異率不超過2%。數(shù)學(xué)模型法得到的評估結(jié)果僅是理論計算值,是宏觀的容量評估,缺乏對細(xì)節(jié)的考慮,例如沒有考慮空域環(huán)境對機場容量的影響,通用性較差。張洪海等[4]建立了機場進(jìn)離場容量和時隙協(xié)同配置的多目標(biāo)優(yōu)化模型,考慮了機場容量的動態(tài)性和航班間的相互影響,可以動態(tài)充分利用進(jìn)離場容量。盧朝陽等[5]假設(shè)機場到達(dá)流特性符合正態(tài)分布或韋布爾分布,采用T系統(tǒng)推導(dǎo)跑道容量,論證得到的跑道容量符合現(xiàn)實情況。實證研究方法通過對機場日常運行情況的觀測,利用統(tǒng)計方法獲得機場跑道容量的統(tǒng)計規(guī)律,通過對機場進(jìn)離場航班運行態(tài)勢的統(tǒng)計分析得到機場容量的評估結(jié)果。王飛等[6]應(yīng)用k-means算法和SOM神經(jīng)網(wǎng)絡(luò)的混合聚類算法確定機場典型容量樣本,評估機場容量。國內(nèi)外關(guān)于分位數(shù)回歸的應(yīng)用主要集中在經(jīng)濟方面,鮮有用于交通領(lǐng)域。文獻(xiàn)[7]率先提出了將分位數(shù)回歸算法應(yīng)用到容量包線中,對機場群進(jìn)離場容量進(jìn)行了評估。
目前,國內(nèi)外基于歷史統(tǒng)計數(shù)據(jù)的機場容量評估方法,均未考慮大型樞紐機場由于不同時段的運行情況差異而導(dǎo)致的機場運行能力的變化,且未能對高峰小時進(jìn)離港架次進(jìn)行評估。本文構(gòu)建了具有時間維度的進(jìn)離場小時架次,采用聚類算法(Density-based Spatial Clustering of Applications with Noise,DBSCAN)[8-9]對進(jìn)離場態(tài)勢進(jìn)行了統(tǒng)計與分析。另外,本文將分位數(shù)回歸模型[10]改進(jìn)后應(yīng)用于機場容量評估問題中,發(fā)掘了分位數(shù)回歸在解決容量包線問題方面的優(yōu)越性,得出了具有一定概率分布的容量包線,使得最終得到的容量評估結(jié)果更加符合實際的運行情況。
傳統(tǒng)的聚類方法需要預(yù)先對簇的個數(shù)進(jìn)行預(yù)設(shè),不能保證精確度。本文選擇DBSCAN算法來處理所研究的數(shù)據(jù)集,能夠根據(jù)密度對數(shù)據(jù)進(jìn)行聚類,且對簇的個數(shù)和形狀沒有要求,而且能夠發(fā)現(xiàn)“噪點”(進(jìn)離場小時架次出現(xiàn)次數(shù)少的點)并將其分離,從而可以從大量的原始數(shù)據(jù)中獲得若干個時間段的容量簇,減少這些“噪點”對于容量評估的影響,提高容量評估的精確度和合理性[11-12]。此外,傳統(tǒng)的聚類方法只需沿著聚類分析點的外邊線進(jìn)行描繪就可獲得機場的極限容量評估值,以此作為機場容量標(biāo)準(zhǔn)并不準(zhǔn)確、科學(xué)。多個時段的實際容量低于極限容量評估值,同時沒有考慮不同時段進(jìn)離場航班需求。因此,需要將時間信息加入到待處理數(shù)據(jù)中,從而完成包含時間信息的三維數(shù)據(jù)聚類分析。采用DBSCAN聚類方法將進(jìn)離場航班進(jìn)行分析后,可獲得不同時間段進(jìn)離場航班各自的容量區(qū)間,但并不能獲得準(zhǔn)確時間區(qū)間的容量情況。因此,需要進(jìn)一步應(yīng)用分位數(shù)回歸對聚類分析獲得的幾個主要區(qū)間分別進(jìn)行分析,并以95%概率的容量而非極限容量進(jìn)行評估,可獲得滿足機場實際運行的容量,避免由于實際容量小于極限容量從而造成不正常航班。由于進(jìn)港航班架次是非負(fù)整數(shù)且為有限值,故容量包線的潛在分段點也是有限的,意味著容量包線線段覆蓋了所有進(jìn)港航班架次的極小值。因此,分位數(shù)容量包線可描述為:
(1)
對于給定的τ分位數(shù)分段系數(shù)(αk,βk)的評估過程,涉及到以下線性規(guī)劃問題,目標(biāo)函數(shù)為:
(2)
約束條件為:
(3)
(4)
式(3)定義了來自觀測值y的分位數(shù)函數(shù)的絕對偏差,式(4)保證了分段斜率的凹性。
利用傳統(tǒng)的基于歷史統(tǒng)計數(shù)據(jù)的容量評估方法得到的機場容量包線,僅為對機場運行能力上限值的評估。然而運行能力在滿足一切內(nèi)外條件下才能達(dá)到機場容量上限,出現(xiàn)的次數(shù)極少,不能作為容量評估值,否則在大部分時間段運行能力低于極限能力的情況下,將出現(xiàn)大量航班延誤。本文擬用基于DBSCAN聚類方法對首都機場實際運行中大量、長期的運行數(shù)據(jù)進(jìn)行分析,樣本來自首都機場2013年3月至10月的進(jìn)離港航班數(shù)據(jù)。采用本文所提出的DBSCAN聚類分析方法對其進(jìn)行聚類后,得到的結(jié)果如圖1所示。圖中未劃入各區(qū)域的點為噪點,即進(jìn)離場架次統(tǒng)計值出現(xiàn)次數(shù)較少的點,需要去除,為下一步基于分位數(shù)回歸提供有效數(shù)據(jù)。另外,高峰小時容量是制約機場運行能力的重要指標(biāo),對于航班時刻的分配和實際運行中航班調(diào)配都具有重要作用,關(guān)系到機場資源和航班時刻的利用效率。聚類分析得到的5個核心區(qū)域分別用數(shù)字區(qū)分,即進(jìn)離場航班運行在5個主要的區(qū)間內(nèi),從而獲得了不同時間段進(jìn)離場航班各自的容量區(qū)間,為下一步通過分位數(shù)回歸評估容量包線奠定了基礎(chǔ)。
圖1 進(jìn)離港小時架次聚類結(jié)果Fig.1 Clustering results of arrival and departure per hour
對上述5個時間段的起降架次范圍進(jìn)行分位數(shù)回歸,結(jié)果如圖2所示。
圖2(a)為0點到6點進(jìn)離港小時架次,對應(yīng)圖1中的區(qū)域1,該時段進(jìn)離港架次較少,共30架次;圖2(b)為6點到8點進(jìn)離港小時架次聚類的結(jié)果,對應(yīng)圖1中的區(qū)域2,該時段離場航班逐漸增多,共48架次;圖2(c)為8點到10點進(jìn)離港小時架次聚類的結(jié)果,對應(yīng)圖1中的區(qū)域3,該時段處于早高峰,大量航班離場,少量航班進(jìn)場,共82架次;圖2(d)為10點到22點進(jìn)離港小時架次聚類的結(jié)果,對應(yīng)圖1中區(qū)域4,該時段進(jìn)離場架次較為均衡,機場全負(fù)荷工作,共106架次;圖2(e)為22點到24點進(jìn)離港小時架次聚類的結(jié)果,對應(yīng)圖1中區(qū)域5,該時段大量航班進(jìn)港過夜,共66架次。
本文針對首都機場進(jìn)離港小時架次進(jìn)行統(tǒng)計數(shù)據(jù)分析,將歷史統(tǒng)計進(jìn)離港小時架次與時間結(jié)合構(gòu)成三維數(shù)據(jù)并進(jìn)行DBSCAN聚類分析。本文方法避免了數(shù)據(jù)噪聲點的干擾,充分發(fā)揮機場運行能力和降低航班延誤,使得容量評估更加合理。該算法為繁忙機場分時段小時容量評估提供了數(shù)據(jù)分析及容量評估手段,為航班時刻資源合理分配提供了依據(jù)。下一步將以航班延誤作為指標(biāo)之一對進(jìn)離港小時容量進(jìn)行評估。
[1]Barnhart C,Belobaba P,Odoni A R.Applications of operations research in the air transport industry[J].Transportation Science,2003,37(4):368-391.
[2]李雄,李冬賓,衛(wèi)東選.機場典型平行跑道容量仿真分析[J].計算機應(yīng)用,2012,32(9):2648-2651.
[3]高偉,傅煒.基于相關(guān)進(jìn)近模式的雙跑道容量計算及仿真[J].科學(xué)技術(shù)與工程,2014,14 (4):108-112.
[4]張洪海,胡明華.CDM ADGDP機場容量與時隙協(xié)同配置[J].系統(tǒng)工程理論與實踐,2010,30(10):1901-1908.
[5]盧朝陽,趙新燦.基于到達(dá)流特性的跑道容量分析[J].南京航空航天大學(xué)學(xué)報,2011,43(1):30-34.
[6]王飛,徐肖豪.隨機GHP模型中機場容量混合聚類算法[J].交通運輸工程學(xué)報,2011,11(1):64-68.
[7]Ramanujam V,Balakrishnan H.Estimation of arrival-departure capacity tradeoffs in multi-airport systems[C]//Proceedings of the 48th IEEE Conference on Decision and Control.Shanghai:IEEE,2009:2534-2540.
[8]劉大有,陳慧靈,齊紅,等.時空數(shù)據(jù)挖掘研究進(jìn)展[J].計算機研究與發(fā)展,2013,50(2):225-239.
[9]王駿,王士同,鄧趙紅.聚類分析研究中的若干問題[J].控制與決策,2012,27(3):321-328.
[10]Kim M O.Quantile regression with varying coefficients [J].The Annals of Statistics,2007,35(1):92-108.
[11]鄧敏,劉啟亮,王佳繆,等.時空聚類分析的普適性方法[J].中國科學(xué):信息科學(xué),2012,42(1):111-124.
[12]Wang M,Wang A P,Li A B.Mining spatial-temporal clusters from geo-database[C]//Li X,Za?ane O R,Li Z H.Advanced Data Mining and Applications:Vol 4093.Xi’an:Springer Berlin Heidelberg,2006:263-270.
(編輯:李怡)
Evaluation of the airport capacity based on quantile regression
ZHAI Wen-peng, CHEN Fan-yi, JIN Si-bo
(Research Base for Air Traffic Management, CAUC, Tianjin 300300, China)
3D data structure of the arrival-departure hour sorties and time were established based on the statistical analysis of the historical data of capital airport flight operation, and proceeded the cluster analysis with DBSCAN algorithm. The airport hour operation capacity envelope with 95% probability was generated by using quantile regression algorithm on the basis of eliminating "noise". Simulation results show that the arrival and departure sorties of the airport has certain amount of time characteristics and differences: at 8:00-10:00 am in the morning rush, departure hour sorties are far greater than arrival hour sorties; at 10:00 am-22: 00 pm, arrival and departure flights is relatively balanced and full load working at the airport; other times flight hour sorties reduced and have not reached maximum capacity.
airport capacity; flight delay; quantile regression; clustering analysis
2015-09-29;
2016-01-25; 網(wǎng)絡(luò)出版時間:2016-04-22 09:52
國家自然科學(xué)基金資助(41501430,71571182,U1333116);國家空管科研課題基金資助(GKG201405002);中央高?;究蒲薪?jīng)費資助 (ZXH2012M003);中國民航大學(xué)科研啟動基金資助(2012QD02X);大學(xué)生創(chuàng)新創(chuàng)業(yè)訓(xùn)練計劃基金資助 (201410059082);教育部人文社科青年基金資助(14YJC630185)
翟文鵬(1985-),男,天津人,講師,博士,研究方向為空中交通規(guī)劃與管理。
V355.1
A
1002-0853(2016)04-0086-04