亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于機器學習的民航信息崗工作負荷預(yù)測研究

        2024-02-02 11:46:16李華鋒辜汝桐吳東岳
        民航管理 2024年1期
        關(guān)鍵詞:信息模型

        □ 李華鋒 辜汝桐 吳東岳/文

        一、引言

        民航的信息收集和分析工作是保障航空公司航班簽派放行和運行控制不可或缺的一部分,對民航信息崗位的有效管理是確保各類信息上傳下達的有力措施。航行情報工作的航行通告體現(xiàn)了民航信息工作的信息質(zhì)量要求——完整、及時、準確、一致與規(guī)范。隨著民用航空業(yè)的高速發(fā)展,通告量快速增長、通告類型與來源也不斷豐富,然而以航行通告崗為代表的民航信息部門所面臨的工作負荷也不斷加大。工作負荷的大小無疑直接影響著工作人員的工作狀態(tài),因此精確評價和預(yù)測民航信息崗工作負荷有助于提升服務(wù)品質(zhì)、保障飛行安全。

        對民航從業(yè)人員工作負荷的分析過去集中在主觀量表、工作時長以及生理指標等三個維度,國際民航組織(1984)1使用DORATASK 方法與MBB 方法,開創(chuàng)性地總結(jié)出一種ATC 扇區(qū)容量與工作負荷有效評估方法。隨著大數(shù)據(jù)時代的到來,當前已有不少學者使用機器學習等方法對工作負荷進行預(yù)測與評估,Chatterji 和Sridhar(1999)2通過神經(jīng)網(wǎng)絡(luò)模型對管制員的工作負荷進行評估與模擬,得到工作負荷的預(yù)測模型,可模擬各種情形下管制員的工作負荷。Agnetis 和Smriglio(2000)3提出一種隱枚舉算法,分析在m 個并行機上尋找n 個作業(yè)的可行調(diào)度模型,該算法能有效地求解簽派員的工作負載。吳丹和潘衛(wèi)軍(2015)4以扇區(qū)復(fù)雜性因素為評價指標,綜合考慮扇區(qū)交通態(tài)勢,借助ATWIT 技術(shù)進行測評,用BP 神經(jīng)網(wǎng)絡(luò)評估管制員工作負荷。溫瑞英和王紅勇(2015)5根據(jù)地空通信實測數(shù)據(jù),利用嶺跡圖篩選復(fù)雜度評價指標,建立嶺回歸BP 神經(jīng)網(wǎng)絡(luò)組合模型,對管制員的工作負荷進行預(yù)測。楊琪等(2021)6結(jié)合飛行員生理指標數(shù)據(jù)、NASATLX 量表主觀評價數(shù)據(jù)指標,建立基于粒子群算法優(yōu)化的支持向量機的飛行員工作負荷預(yù)測模型。綜上,可看出目前學界對于工作負荷的研究已經(jīng)逐漸從評估轉(zhuǎn)變?yōu)轭A(yù)測,而機器學習與深度學習等算法在其中發(fā)揮了極大的用處。

        本文以航行通告崗為例,提出基于相似日數(shù)據(jù)的AdaBoost 民航信息崗工作負荷預(yù)測模型,使用灰色關(guān)聯(lián)分析采集訓(xùn)練集中的相似日數(shù)據(jù),提高樣本的數(shù)據(jù)相關(guān)性,最后根據(jù)集成學習理念構(gòu)建特征機器學習預(yù)測模型,并將其運用于工作負荷預(yù)測之中。基于本文所提方法,航空公司在后續(xù)需要進行工作負荷預(yù)測時,可以實時根據(jù)系統(tǒng)后臺數(shù)據(jù)進行預(yù)測,有效縮短工作負荷評估周期,提高工作負荷預(yù)測的準確性。

        二、基于 GRA 和“近大遠小”時間原則的相似日選擇

        (一)相似日與相鄰日

        相似日是指預(yù)測日在訓(xùn)練集中信息類型和數(shù)量相似的歷史日(孟洋洋等,2010)7。相似日能夠反映特定類型與數(shù)量的信息收發(fā)情形下民航信息崗的工作負荷。然而,由于部分訓(xùn)練數(shù)據(jù)與預(yù)測日之間的時間跨度較長,外界的變化(如航季變化、大規(guī)模軍事演習、特殊地區(qū)的變化等)可能導(dǎo)致相似日數(shù)據(jù)與預(yù)測日的實際情況存在很大的不同。利用這些數(shù)據(jù)樣本對模型進行訓(xùn)練,預(yù)測結(jié)果與實際值可能存在較大誤差。

        相鄰日是指與預(yù)測日時間相近的歷史日。相鄰日與預(yù)測日之間,時間跨度短,除了信息類型與數(shù)量有所不同之外,其他情況大體上是一致的,這彌補了僅以信息類型與數(shù)量作為依據(jù)進行預(yù)測的不足。相似日和相鄰日的合理使用能夠起到取長補短、相得益彰的效果,因此在相似日選擇上采取“近大遠小”的時間原則(譚風雷等,2022)8。選擇相似日數(shù)據(jù)可以提高模型訓(xùn)練時輸入特征與目標輸出之間的相關(guān)性。由于相似日的航行通告數(shù)據(jù)在工作負荷和情境因素上與目標日更為接近,因此機器學習模型能夠更好地學習和預(yù)測工作負荷趨勢。

        航行通告崗的信息處理體現(xiàn)在航行通告的數(shù)量與類型,而航行通告的及時處理與通報是航行通告崗的基本工作要求,因此航行通告崗的整體工作負荷主要體現(xiàn)在單位時間內(nèi)是否及時處理收到的通告。本文以單位時間內(nèi)通告處理數(shù)量與通告接收數(shù)量之比作為航行通告崗工作負荷的評價指標。采用“近大遠小”時間原則篩選出相似日數(shù)據(jù),以工作負荷為特征的訓(xùn)練集更具有類似性和時間延續(xù)性。

        (二)基于 GRA 的相似日選擇(高揚和許星,2013)9

        不同類別的信息,影響其處理難度、工作量以及處理過程的靈活程度等,因此在分析航行通告崗的工作負荷時使用航行通告類型與收報情況作為評價航行通告復(fù)雜性的評價指標,所選指標具體如表1:

        表1:航行通告復(fù)雜性評價指標

        收報類型與數(shù)量的波動性和無規(guī)律性是影響工作負荷預(yù)測精度的重要原因,因此尋找預(yù)測日與歷史數(shù)據(jù)間的關(guān)系對于提升預(yù)測精度至關(guān)重要。本文選取灰色關(guān)聯(lián)分析作為數(shù)據(jù)樣本集的獲取方法?;疑P(guān)聯(lián)分析針對航行通告復(fù)雜性情況進行分析,以數(shù)據(jù)序列為基礎(chǔ),通過灰色關(guān)聯(lián)度反映影響因子間的相似程度。在序列中,令X0為被預(yù)測序列,Xi為對比序列,數(shù)據(jù)序列和對比序列之間的關(guān)聯(lián)度系數(shù)為:

        三、AdaBoost 工作負荷預(yù)測模型

        (一)CART 算法

        CART 決策樹又名分類回歸樹,是在ID3 決策樹的基礎(chǔ)上進行優(yōu)化的決策樹,主要有以下三個特點:CART 既能是分類樹,又能是回歸樹,這主要取決于輸出數(shù)據(jù)是離散還是連續(xù)的。CART 采用二值分割法對數(shù)據(jù)進行分割,形成二叉樹。當CART 是分類樹時,基尼指數(shù)被用作節(jié)點拆分的基礎(chǔ)?;嵯禂?shù)越小,該特征中包含的雜波就越低。當CART 是回歸樹時,以樣本的最小方差作為節(jié)點分割的依據(jù),它主要是對各種特征因子進行遞歸劃分,預(yù)測結(jié)果由最終的葉節(jié)點均值得到。

        (二)AdaBoost 算法

        通過CART 算法構(gòu)建初步模型,提出自適應(yīng)提升的工作負荷預(yù)測方法,利用 AdaBoost 的權(quán)重分配與重組,再次提高模型的預(yù)測精度。自適應(yīng)提升算法最早應(yīng)用于分類問題,隨著研究的深入,AdaBoost 算法現(xiàn)可通過改變樣本權(quán)值的分布應(yīng)用于回歸預(yù)測。

        AdaBoost 從初始訓(xùn)練集中訓(xùn)練CART 基學習器,在每次的迭代過程后根據(jù)基學習器的表現(xiàn)與誤差調(diào)整訓(xùn)練樣本分布與計算權(quán)重;與普通boosting 族算法不同,AdaBoost 會提高前一輪基學習器錯誤分類的樣本權(quán)值,同時降低正確分類的樣本的權(quán)值,不斷重復(fù),直到達到預(yù)先指定的基學習器數(shù)量。最后根據(jù)組合策略將所有基學習器組合起來,得到最終的強學習器。這個過程被稱為集成學習,其一般結(jié)構(gòu)如圖1所示。

        圖1:集成學習結(jié)構(gòu)

        構(gòu)造基于相似日的AdaBoost 民航信息崗工作負荷預(yù)測模型步驟為:

        1.利用 GRA 分析訓(xùn)練集數(shù)據(jù)與預(yù)測日間的關(guān)聯(lián)程度,采取“近大遠小”時間原則選擇相似日構(gòu)成訓(xùn)練集,并將數(shù)據(jù)進行歸一化處理。

        2.初始化CART 和訓(xùn)練樣本的權(quán)值分布D(1),在步驟1 的基礎(chǔ)上,得到?jīng)Q策樹的全局分裂最優(yōu)解,并將結(jié)果賦予CART 決策樹。

        式中,m為樣本容量,w1i表示訓(xùn)練初始基學習器時第i個樣本的權(quán)值;

        3.使用權(quán)重為Dk的樣本集訓(xùn)練數(shù)據(jù),即對T 個決策樹進行訓(xùn)練時,得到基學習器Gk(x)并計算誤差:

        4.根據(jù)預(yù)測誤差計算出第k個基學習器的回歸誤差率以及其權(quán)重系數(shù):

        5.根據(jù)權(quán)重Dk更新下一次樣本的權(quán)重分布(Zk是規(guī)范化因子):

        6.根據(jù)以上步驟訓(xùn)練到設(shè)定的基學習器數(shù)量與其對應(yīng)的權(quán)重系數(shù)ak,根據(jù)相應(yīng)的組合策略得到最終強學習器:

        f(x)=Gk*(x)

        其中,Gk*(x)是所有的中位數(shù)值乘以對應(yīng)序號k*對應(yīng)的弱學習器。

        基于相似日的AdaBoost 工作負荷預(yù)測模型流程如圖2,根據(jù)最終強學習器進行民航信息崗工作負荷預(yù)測并得到最終預(yù)測結(jié)果:

        圖2:基于相似日的GA-CART-AdaBoost工作負荷預(yù)測模型流程

        四、算例分析

        (一)數(shù)據(jù)來源

        以南方航空運指中心航行情報部航行通告室為研究對象,通過采集其2021 年第四季度的航行通告處理數(shù)據(jù)進行解析處理,內(nèi)容包括收發(fā)報數(shù)量,處理時間,通告類別等信息。

        (二)基于GRA 的相似日樣本集提取

        下面將歷史樣本中2021 年11 月26 日~2021 年12 月05 日作為待預(yù)測日,分析這10 個待預(yù)測日的相似日選擇結(jié)果。以2021 年11 月26 日為例,篩選出關(guān)聯(lián)度≥0.9 的相似日共9 日,分別為評價項10 月2 日、8 日、14 日、22 日、29 日,11 月4 日、5 日、8 日、9 日、10 日、15 日、21 日、22 日、30 日,12 月7 日、10 日、17 日。此時基于時間“近大遠小”原則,通過統(tǒng)計手段選擇時間跨度上最近的5 個相似日為11 月15 日、21 日、22 日、30 日與12 月7 日。同理可得2021 年11 月26 日~2021 年12 月05 日10 個待預(yù)測日的相似日選擇結(jié)果,結(jié)果如表2 所示。根據(jù)以上相似日選擇搭建訓(xùn)練集樣本,本文以1 小時為1 個時間片段,每個時間片段的計算結(jié)果作為1 個樣本,去除重復(fù)日數(shù)后有效樣本數(shù)共計840 個,其中訓(xùn)練集與測試集的占比為8 ∶2。

        表2:待預(yù)測日的相似日選擇結(jié)果

        從表2 可以看出,待預(yù)測日篩選出的相似日有的距離待預(yù)測日較遠,有的距離較近,這表明文中所采用的方法不僅考慮了時間因素,還充分考慮了航行通告當日的復(fù)雜性情況,這樣選擇的相似日具有較高的相似性。

        (三)模型精度評價指標

        選用均方根誤差(RMSE)、平均絕對相對誤差(MAPE)、決定系數(shù)R2這3 項性能指標對預(yù)測模型精度進行評價:

        1.均方根誤差(RMSE):均方誤差(MSE)是預(yù)測值與實際值之差平方的期望值,RMSE 為均方誤差(MSE)的平方根,取值越小,模型準確度越高。

        2.平均絕對相對誤差(MAPE):絕對誤差的平均值,是平均絕對誤差(MAE)的變形,它是一個百分比值。取值越小,模型準確度越高,越能反映預(yù)測值誤差的實際情況。

        3.決定系數(shù)R2:將預(yù)測值跟只使用均值的情況下相比,結(jié)果越靠近1 模型準確度越高。

        式中:yi表示第i個預(yù)測時間段真實的工作負荷值;表示使用預(yù)測模型預(yù)測的第i個工作負荷值; 表示真實工作負荷值的平均值。

        (四)模型預(yù)測結(jié)果及對比分析

        為驗證本文預(yù)測模型相比于其他預(yù)測模型在預(yù)測精度和預(yù)測效率上是否具有優(yōu)越性,本文對比分析3 種預(yù)測模型的預(yù)測性能。

        預(yù)測模型1:構(gòu)建單一CART 工作負荷預(yù)測模型。

        預(yù)測模型2:在模型1 的基礎(chǔ)上,經(jīng)過自適應(yīng)提升算法的權(quán)重自分配與重組,構(gòu)建 AdaBoost 工作負荷預(yù)測模型。

        預(yù)測模型3:在模型2 的基礎(chǔ)上,使用GRA 和“近大遠小”時間原則對訓(xùn)練集的相似日進行選擇,構(gòu)建基于相似日的AdaBoost 工作負荷預(yù)測模型。

        具體模型預(yù)測誤差評價指標對比如表3 所示。由表3 可知,相比于 CART、AdaBoost 預(yù)測模型,本文所使用方法的誤差評價指標RMSE 分別降低32.44%和10.19%,MAPE 分別降低78.13% 和66.11%, 相對系數(shù)分別提高10.10%和1.21%,基于相似日的AdaBoost 預(yù)測模型的各項預(yù)測誤差指標值均最小。因此,本文所提預(yù)測模型預(yù)測效率和預(yù)測性能優(yōu)于上述其他模型。

        表3:預(yù)測誤差指標對比

        五、應(yīng)用場景

        預(yù)測模型在工作負荷預(yù)測以及告警上表現(xiàn)優(yōu)異,能夠在席位資源編排、動態(tài)調(diào)整工作、人力成本分析等方面提供技術(shù)與數(shù)據(jù)支持。通過準確的工作負荷預(yù)測,為情報人員設(shè)定合理的負荷閾值。當預(yù)測的工作負荷超過閾值時,系統(tǒng)可以發(fā)出預(yù)警,提醒管理層及時采取措施進行干預(yù)。可以評估工作任務(wù)分配合理性,根據(jù)預(yù)測的工作負荷數(shù)據(jù),動態(tài)調(diào)整情報人員的工作任務(wù),對席位資源合理化管理,使得工作效率最大化。

        未來也可為相關(guān)工作任務(wù)與環(huán)境提供合理優(yōu)化參考指標,解決如何在日益增長的信息管理需要下確保信息及時上傳下達的難題,使用機器學習、運籌學等方法對信息處理策略進行優(yōu)化(胡海青等,2022)10。根據(jù)預(yù)測的工作負荷和緊急程度,合理安排信息處理順序,確保高優(yōu)先級的信息能夠得到及時處理,同時避免在低優(yōu)先級信息上浪費過多資源。

        通過準確的工作負荷預(yù)測,可以為控制情報人員的工作負荷處于合理水平提供有效的支持,能夠更好地平衡情報人員的工作負荷,提高工作效率和準確性,深入貫徹“數(shù)據(jù)驅(qū)動安全”的新發(fā)展理念。

        六、結(jié)語

        基于對民航信息崗工作負荷研究不夠深入、工作數(shù)據(jù)與評估預(yù)測模型結(jié)合較為局限的問題,本文提出基于相似日的AdaBoost 民航信息崗工作負荷預(yù)測模型,根據(jù)工作負荷預(yù)測精度與信息復(fù)雜性關(guān)聯(lián)性強的特點,以預(yù)測日的信息類別與數(shù)量為研究特征,利用時間“近大遠小”原則有針對性地選擇相似信息收發(fā)情況下的相似日作為訓(xùn)練數(shù)據(jù)集,提高模型回歸精度。同時將CART 決策樹進行集成學習,在基于GRA 尋找的相似日訓(xùn)練數(shù)據(jù)集基礎(chǔ)上,對比其他預(yù)測模型,具有較高的預(yù)測精度與預(yù)測穩(wěn)定性,并成功應(yīng)用于航空公司航行通告崗工作負荷的預(yù)測與評估工作中。本文所使用的研究方法為加快推動傳統(tǒng)評估方法和創(chuàng)新算法深度融合,促進傳統(tǒng)要素驅(qū)動向注重創(chuàng)新驅(qū)動轉(zhuǎn)變,提升行業(yè)系統(tǒng)化、協(xié)同化、智能化提供了全新視角。

        在工作過程中存在大量非結(jié)構(gòu)化動態(tài)的工作負荷數(shù)據(jù),如何在海量數(shù)據(jù)中獲得一種更為高效、準確、適用性強的工作負荷評價與預(yù)測的指標體系和方法,是未來繼續(xù)研究的方向。

        此外,在處理特征相關(guān)性強的數(shù)據(jù)時,決策樹的回歸結(jié)果表現(xiàn)一般,對于類別樣本數(shù)不一致的數(shù)據(jù),信息增益的結(jié)果將傾向于具有更多數(shù)字特征的數(shù)據(jù)。如何優(yōu)化模型的泛化能力也是未來研究的重點。(作者單位:中國南方航空股份有限公司)

        猜你喜歡
        信息模型
        一半模型
        重要模型『一線三等角』
        重尾非線性自回歸模型自加權(quán)M-估計的漸近分布
        訂閱信息
        中華手工(2017年2期)2017-06-06 23:00:31
        3D打印中的模型分割與打包
        FLUKA幾何模型到CAD幾何模型轉(zhuǎn)換方法初步研究
        展會信息
        中外會展(2014年4期)2014-11-27 07:46:46
        一個相似模型的應(yīng)用
        信息
        健康信息
        祝您健康(1987年3期)1987-12-30 09:52:32
        亚洲一区二区三区免费av在线| 吃奶摸下激烈床震视频试看| 国产午夜亚洲精品午夜鲁丝片| 永久无码在线观看| 亚洲视频一区二区三区免费| 亚洲一区二区三区地址| 亚洲欧美色一区二区三区| 亚洲成av人片在久久性色av| 91九色视频在线国产| 97人妻人人做人碰人人爽| 久久久久亚洲精品无码网址| 最新在线观看精品国产福利片 | 中国美女a级毛片| 日韩a毛片免费观看| 西西人体大胆视频无码| 国产在线一区二区三区四区乱码| 国产免码va在线观看免费| 理论片87福利理论电影| 国产午夜激无码AV毛片不卡| 日本妇女高清一区二区三区| 亚洲av无码码潮喷在线观看| 国产色诱视频在线观看| 久久久久无码中文字幕| 国产精品国产自产拍高清| 亚欧美日韩香蕉在线播放视频| 国产一级大片免费看| 手机在线观看亚洲av| 综合图区亚洲另类偷窥| 一二三四在线视频观看社区| 99久久99久久精品免观看| 蜜桃高清视频在线看免费1| 内射人妻少妇无码一本一道| 色综合自拍| 精品亚亚洲成av人片在线观看| 插上翅膀插上科学的翅膀飞| 国产特级毛片aaaaaa高清| 加勒比日本东京热1区| 久久久精品国产av麻豆樱花| 亚洲av一二三四区四色婷婷| 中文亚洲日韩欧美| 精品国产三级国产av|