亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于VMD-MD-Clustering方法的航班延誤等級分類*

        2022-07-20 01:46:26王興隆許晏豐紀君柔
        交通信息與安全 2022年3期
        關鍵詞:航班聚類分類

        王興隆 許晏豐 紀君柔

        (1.中國民航大學空中交通管理學院 天津 300300;2.中國東方航空股份有限公司 上海 200135)

        0 引 言

        隨著我國民航業(yè)的不斷發(fā)展,航班數量和客貨吞吐量逐年遞增[1],可用的空域資源日漸不足,航班延誤數量也日益增多。對航班延誤做出合理評價是分析航班延誤總體水平、降低延誤成本,以及制定相關處置預案的重要基礎,有著重要的現實運用價值。

        近年來,國內外學者對航班延誤有關問題進行了深入研究。在國外,Henriques 等[2]提出了空中交通網絡延誤過程的新變量,并在此基礎上對空中交通延誤模式進行了預測。Suvojit 等[3]采集6 個維度的延誤屬性有關數據,通過構建增強決策樹模型來分析航班延誤。Yi等[4]采用多元線性回歸的方法對進場航班的延誤情況進行了研究。Bin等[5]通過深度學習有關方法對航班延誤產生原因進行分析,并建立了延誤預測模型。Miticic 等[6]將混合密度網絡和隨機森林回歸2種概率預測算法應用于歐洲機場的航班延誤預測,較好地估計了到達和起飛航班延誤的等級,平均絕對誤差小15 min。Shi 等[7]在提取飛行操作的關鍵因素后,采用機器學習的方法,提出了1種新的航班延誤預測模型。

        國內方面,曹悅琪等[8]考慮到航班數量的實時性,給出了基于Logistic模型的延誤航班數量與航班累計延誤時間的預測方法,對航班延誤的后續(xù)發(fā)展做出準確的預測,從而減少損失。黃俊生等[9]對航班延誤、飛機置換和航班取消3 種類型的航班延誤和恢復過程建模分析,得出乘客導向的航班延誤預測。王語桐等[10]提出1 種支持向量回歸和多元線性回歸相結合的方法建立組合預測模型。丁建立等[11]提出1種基于輕量級梯度效應的多目標航班延誤預測模型,該模型結合了航班信息和氣象信息,提高了對航班延誤的預測準確度。姜雨等[12]提出通過時空圖卷積神經網絡實現對離港航班延誤狀況的預測。劉繼新等[13]采用KNN 算法建模,在結合了以往航班運行數據和氣象數據,預測了機場內短期航班延誤情況。朱代武等[14]采用深度置信網絡支持向量機回歸方法來挖掘航班延誤的內在模式,使其能在預測延誤的同時進行管理措施,從而減少整體延誤。

        綜上所述,對于航班延誤問題的研究存在以下不足:①將航班延誤視作相同樣本,并將樣本數據直接作為所構建模型的輸入端,僅使用數值屬性指標對所有航班延誤問題作出評價;②分析航班延誤只考慮數值屬性指標去評估延誤等級,尚未形成科學的延誤等級分類規(guī)則,無法直觀有效的判斷航班延誤程度。因此,在已有的研究基礎上,綜合考慮數值屬性及類屬性數據構建延誤指標,提出1 種基于變分模態(tài)分解(variational mode decomposition,VMD)、馬氏深度(Mahalanobis depth,MD)函數和數據聚類(K-means clustering)的VMC-MD-clustering方法(以下簡稱為V-M-C方法),研究大樣本下的機場終端區(qū)航班延誤情況,并以某大型樞紐機場的航班延誤數據進行實例驗證,本文所提方法有較好效果。

        1 航班延誤等級分類模型

        1.1 航班延誤指標選擇

        從時間、空間和效率3個維度,選擇航班延誤時間、航班飛行時間、延誤影響人數和航程4個數值屬性以及是否過站經停、執(zhí)機機型2 個類屬性指標對航班延誤等級進行評價。共6個航班延誤評價指標的具體說明及其影響介紹,見表1。

        1.2 航班延誤等級分類方法

        本文選取包含類屬性及數值屬性在內的6個指標衡量航班延誤情況,但是因為各國對于航班延誤的規(guī)定并不一致,航班延誤也是1 種發(fā)展變化的概念,所以航班延誤數據具有數據量巨大、特征復雜、具有高維特征等特點[15]。本文提出的V-M-C航班延誤等級分類方法的整體流程見圖1。

        圖1中的具體步驟如下。

        圖1 航班延誤等級分類流程圖Fig.1 Flow chart of flight delay classification

        步驟1。收集數據并整理,對某大型機場樞紐的實際運行數據進行分析,提取其中航班延誤數據。

        步驟2。選擇延誤有關評估指標,本文綜合考慮機場、航空公司、管制等運行需求提出6個航班延誤有關指標見表1。

        表1 航班延誤等級評價指標Tab.1 Evaluation index of flight delay level

        步驟3。選取延誤航班數據中的航班延誤時長,采用變分模態(tài)分解方法去除延誤時長維度中的噪聲因子,減少由于過長延誤時間對總體分布帶來的影響。

        步驟4。對延誤數據進行歸一化處理,通過深度函數計算樣本中每組延誤數據對于總體的離心程度,采用馬氏深度函數對樣本數據進行計算得到數據深度值。

        步驟5。對一維數據深度值進行聚類處理,確定聚類系數K,判斷航班延誤等級。

        步驟6。對得到的航班延誤等級分類結果進行準確度評估分析。

        2 V-M-C算法設計

        聚類分析是1種無監(jiān)督的學習[16],該方法在大規(guī)模的數據集分類時,具有一定的優(yōu)勢。其中由于K-means 有著簡單易用,對一維數據有較好的處理效果等特點,因此本文將通過K-means 算法對航班延誤等級進行聚類分類。但是該算法存在著如:K值不好選??;最終結果容易陷入局部最優(yōu);對方差不同的隱含類別聚類效果不佳;對非平穩(wěn)數據難收斂等缺點。故選擇在K-means算法之前先通過變分模態(tài)分解VMD和馬氏深度MD來對數據進行處理,從而實現K-means算法更加快速準確的進行聚類。

        VMD 是1 種自適應的時頻信號分析方法[17],對非平穩(wěn)信號有著較好的處理效果。通過對數據使用VMD 方法進行分解,獲得相對穩(wěn)定的數據集,便于后續(xù)使用K-means算法進行聚類。

        MD 是建立在馬氏距離基礎上的1 種數據深度函數,其復雜度不隨數據維數的增大而增大[18]。故本文選取MD 來處理較為復雜的航班延誤數據,在降低數據處理難度的同時進一步提高了數據穩(wěn)定性,提高了K-means算法的運行效率,有利于探索最優(yōu)解。

        2.1 變分模態(tài)分解

        利用VMD分解信號,計算分解后所有本征模態(tài)函數(intrinsic mode function,IMF)的總和,在IMF重構信號總和等于給定輸入信號條件下,分解出m個IMF函數um(t),并使得到的IMF的估計帶寬之和最小。

        對于每個um(t),對其進行希爾伯特變換得到其單邊頻率譜,見式(1)。

        由傅里葉變換性質,將式(1)得到的頻譜轉移至對應基帶,見式(2)。

        通過高斯平滑解調信號計算帶寬,求解式(2)的梯度平方范數[19],約束變分模型的表達式,見式(3)。

        采用拉格朗日乘子法將式(3)中的約束問題轉化為非約束的變分問題,見式(4)。

        2.2 數據深度

        式中:μS為航班延誤數據集的均值向量;σS為航班延誤數據集的協方差矩陣。

        MD(S;q)值越趨近于1 時,航班f距總體S越近;MD(S;q)越趨近于0,航班f距總體S中心越遠。

        2.3 數據聚類

        2.3.1 聚類數K的確定

        對聚類的有效性的評價標準分為外部和內部2種。聚類數K就是內部評價的重要指標,通常用來確定數據集的最佳聚類數。本文綜合1維數據深度序列的誤差平方和與輪廓系數值確定聚類數K值,來解決隨機性導致的K值選取穩(wěn)定性差的情況。

        手肘法是1種基于誤差平方和簇內誤方差(error sum of squares,SSE)的K值選擇算法,SSE會隨著K的增加,先大幅下降,后小幅下降,形成類似手肘的下降曲線而得名手肘法。SSE的計算見式(7)。

        輪廓系數法的核心指標是輪廓系數,而輪廓系數是對聚類效果優(yōu)劣的1 個重要評判方式,平均輪廓系數越大,聚類效果越好。某個延誤航班fdi輪廓系數定義,見式(8)。

        式中:a為fdi與同類中其他延誤航班的平均距離,km;b為fdi與最近類中所有延誤航班的平均距離,km。

        最近簇的定義,見式(9)。

        式中:fdk為某個類Ck中的1個延誤航班。

        2.3.2 數據深度值聚類流程

        數據深度值K-means聚類算法流程,見圖2。

        圖2 K-means算法流程圖Fig.2 Flow chart of K-means algorithm

        步驟1。確定最佳聚類數K,隨機初始化選取k個點作為聚類中心。

        步驟2。將數據深度值序列分配到距離中心樣本最近的類,每次分配后更新類的中心樣本。

        步驟3。把每個樣本分類為相應的類之后,然后重新計算中心樣本和原始樣本間距。若1個樣本比原有的核心樣本更靠近新的核心樣本,則將其分配到包含新中心樣本的簇中。將每個中心樣本分類為自己的類后,計算樣本與新中心樣本的間距。如果1個樣本比原始中心樣本更接近新中心樣本,將被重新分配至新中心樣本簇。

        步驟4。重復步驟3 的過程,直至算法收斂,聚類結束。

        2.4 支持向量機

        為確定分類結果的精確性,本文在航班延誤等級分類的基礎上進行了延誤等級檢測,采用帶懲罰權重的支持向量機(SVM)模型對基于V-M-C 方法的航班延誤等級分類情況進行預測。

        支持向量機是1種分類算法,它在處理小樣本、非線性和高維模式分類問題中顯示了很多獨特的優(yōu)點,本文選擇帶懲罰權重的支持向量機可以將問題轉化為如下的二次規(guī)劃模型,見式(10)。

        式中:P為懲罰參數,P越大代表SVM對錯誤分類的懲罰越大;ξi為松弛變量。

        采用支持向量機對航班延誤等級的分類結果進行分析,不僅可以確認結果的精確性,也在一定程度上提高V-M-C模型的普適性。

        3 實例驗證

        選取某大型樞紐機場1個月共計4 557條航班延誤數據作為樣本,通過所提V-M-C方法對樣本中的航班延誤等級分類,并在此基礎上,采用帶懲罰權重的支持向量機模型對航班延誤等級結果分析,實驗數據,見表2,其中“是否經?!表棧?為未經停,1為經停。

        表2 航班延誤實驗數據(局部)Tab.2 Flight delay experimental data(local)

        3.1 航班延誤等級分類

        由于不同部門對延誤時間的記錄存在一定差異且少部分長時間延誤航班對總體延誤分布產生較大影響,因此導致延誤時間數據存在一定的噪聲,為了增加結果的準確性,將延誤時間序列數據通過變分模態(tài)分解進行降噪重構。變分模態(tài)分解參數中對信號處理結果起到主要作用的參數分別是二次懲罰因子α及IMF 信號分量個數m。本文中,α取常用的默認值α=2 000[20],m的選取兼顧信號分解的個數與重構后信號的均方誤差,取m=10。延誤原始信號及重構后信號見圖3。由圖3可見:通過變分模態(tài)分解重構延誤時間序列后,較好的維持了總體延誤時間分布,減少了長時間延誤航班的延誤時長,使延誤時間數據更貼近實際研究需求。

        圖3 延誤時間序列重構對比圖Fig.3 Comparison chart of delay time series reconstruction

        將重構后的延誤時間序列及表1中的其他維度信息作為輸入,帶入式(6),得到航班延誤的數據深度值,航班延誤的數據深度分布見圖4。

        圖4 延誤航班數據深度值Fig.4 Flight delay data depth value

        對得到的數據深度值進行聚類,劃分出延誤過程中的航班等級。最佳聚類數的決定方法是利用式(7)~(8)中給出的評估指標,從而對不同聚類數下樣本的聚類效果加以評價。K=2~8時的誤差平方和及輪廓系數變化見圖5。

        圖5 聚類有關指標折線圖Fig.5 Line chart of clustering related indicators

        綜合誤差平方和與輪廓系數隨聚類數的變化趨勢,取k=2時聚類效果最佳。因此對航班延誤的數據深度值進行聚類,即可對航班延誤中的延誤等級分類。

        為揭示航班延誤運行模式及其產生的原因,對航班延誤等級的有關信息進行聚類,仍以式(7)和式(8)作為聚類數據類間分類標準,發(fā)現航班延誤等級數據在k=2時聚類效果最佳,即航班延誤等級可分為2個部分,記為延誤等級Ι 類與延誤等級Ⅱ類。

        將Ι 類、Ⅱ類延誤等級及其他航班延誤等級信息進行統(tǒng)計對比,根據不同維度繪制延誤雷達圖,見圖6。

        圖6 延誤信息雷達圖Fig.6 Radar chart of Delay information

        由圖6 可見:延誤等級Ι 類航班主要為遠程航班,該類航班多為大機型執(zhí)飛,影響顧客較多的國際航線。可以看到,該類延誤航班延誤時長略高于其他等級的延誤航班,在整體數據集中被分為Ι 類等級的主要原因是遠距離航程及較高的飛行時長降低了航班延誤時間維度的影響。因此在對延誤航班制定有關計劃時,應對遠程航線進行單獨考慮。

        航班延誤等級Ⅱ類的航班主要為有過站經停的航班,該類航班延誤平均時長明顯高于延誤等級Ι類及其他延誤等級航班,而在其他延誤有關維度與其他延誤數據相差不大。造成延誤時長較高的原因是由于在經停過站的過程中造成由于后續(xù)航段流量控制或過站地服準備措施不完備等造成的,因此對航班延誤等級Ⅱ類制定有關計劃時,可適當提高延誤時間容限,著重對過站保障過程進行關注。

        通過對航班延誤等級進行分析,發(fā)現遠程航線與經停過站航班是產生航班延誤等級差異的原因,且平均延誤時長較長。對于被分為其他延誤等級類型的航班,平均延誤時間為31.55 min,平均航程為2 165.47 km,平均飛行時長為216 min,主要由為中或大型機執(zhí)飛航班,平均延誤影響人數為213.5人。在對延誤航班進行分析時,可將其他延誤等級航班各維度指標的平均值作為參考。

        3.2 航班延誤等級準確度評估

        基于帶懲罰權重的支持向量機模型對航班延誤等級分類情況進行精確性評估,本文采用準確率Acc及召回率R來衡量該等級分類規(guī)則對預測精度進行判定,見式(11)~(12)。

        式中:L00為V-M-C 方法分類結果與預測結果均為其他延誤等級航班;L01為V-M-C 方法分類結果為其他延誤等級而SVM預測結果為Ι、Ⅱ類延誤等級航班;L11為通過V-M-C分類方法與svm預測結果均為Ι、Ⅱ類延誤等級航班;L10為分類成Ι、Ⅱ類延誤等級航班,但預測結果為其他延誤等級航班;Acc為從總體預測精度進行評價;R為對航班延誤等級預測精度進行評價。

        對數據集進行隨機分類,選取其中的70%作為訓練集,剩余的數據作為測試集,在rbf 核函數下,gamma=0.17,P=0.41 時模型有著較好的訓練效果,此時Acc=99.56% ,R=95.41% 。由該結果可知,基于V-M-C 方法對于航班延誤的分類精準度達到99.56%,對延誤等級的分類精度達到95.41%。

        3.3 算法對比

        V-M-C方法是基于數據聚類K-means算法融合的,因此本文選擇加權K-means 算法作為對比算法。對相應的評價指標設置不同的權重。結合實際情況,不同指標的權重值,見表3。

        表3 評價指標權重Tab.3 Evaluation index weight

        同樣取聚類數K=2 時,采用加權K-means算法得出結果,并采取等級判別率對航班延誤等級分類情況進行精確性評估。精確性評估公式,見式(13)。

        式中:N為總樣本航班量;GID為分類航班延誤等級與實際延誤等級有差異的航班數。

        對分類結果進行檢驗,加權K-means 的航班延誤等級分類精準度只有81.9%

        由以上對比實驗可見,V-M-C 方法對航班延誤等級分類精度比單一算法精度有較明顯提升,在rbf核函數的支持向量機模型下總體判別結果穩(wěn)定,能較為準確的分類航班延誤等級情況。

        4 結束語

        針對航班延誤分類問題,提出了6個指標,既包含了數值屬性,也囊括了類屬性。評估指標的選取較為全面,能較好的刻畫出航班延誤等級;同時提出基于多種方法的V-M-C 算法對航班延誤等級進行分類,通過建立帶懲罰權重的支持向量機模型對分類結果進行分析,實現了簡單準確的航班延誤等級判斷。

        今后可以在以下方面進行深入研究:①本文只研究單一機場的航班延誤分類,后續(xù)可研究適用全國機場的分類規(guī)則;②可以進一步思考航路點、扇區(qū)的航班延誤,考慮流量等指標的構建。

        猜你喜歡
        航班聚類分類
        全美航班短暫停飛
        山航紅色定制航班
        金橋(2021年10期)2021-11-05 07:23:10
        山航紅色定制航班
        金橋(2021年8期)2021-08-23 01:06:24
        山航紅色定制航班
        金橋(2021年7期)2021-07-22 01:55:10
        分類算一算
        分類討論求坐標
        數據分析中的分類討論
        基于DBSACN聚類算法的XML文檔聚類
        電子測試(2017年15期)2017-12-18 07:19:27
        教你一招:數的分類
        基于改進的遺傳算法的模糊聚類算法
        久久精品国产亚洲av麻豆会员| 免费二级毛片在线播放| 亚洲AV日韩AV高潮喷潮无码| av资源在线免费观看| 亚洲国产亚综合在线区| a级毛片100部免费看| 欧美成人www免费全部网站| 日本大片在线一区二区三区| 国产熟女一区二区三区不卡| 18禁无遮拦无码国产在线播放| 97se在线| 亚洲精品在线观看一区二区 | 人妻激情另类乱人伦人妻| 午夜性刺激免费视频| 色婷婷久久99综合精品jk白丝| 精品国产亚洲av高清大片| 久久精品黄aa片一区二区三区| 最新国产在线精品91尤物| 中文字幕你懂的一区二区| 精品人妖一区二区三区四区| 国产成人精品电影在线观看 | 国产乱子伦农村xxxx| 国产成人久久综合热| 国产亚洲激情av一区二区| 91久久精品色伊人6882| 国产丝袜在线精品丝袜| 综合91在线精品| 亚洲国产91精品一区二区| 内射口爆少妇麻豆| 99这里只有精品| 国产人成在线免费视频| 天堂网av一区二区三区在线观看 | av最新版天堂在资源在线| 国产毛片视频一区二区| 乌克兰粉嫩xxx极品hd| 免费观看久久精品日本视频| 白嫩少妇高潮喷水av| 国产亚洲精品精品精品| 99re这里只有热视频| 国产亚洲精品一区二区在线播放| 4455永久免费视频|