亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于注意力機(jī)制的航班配餐備份數(shù)預(yù)測(cè)算法

        2023-04-07 22:46:29王俊吳子軒董杰蔡哲立張凱許喬若
        軟件工程 2023年4期
        關(guān)鍵詞:注意力機(jī)制深度學(xué)習(xí)

        王俊 吳子軒 董杰 蔡哲立 張凱 許喬若

        關(guān)鍵詞:航班配餐備份數(shù);編解碼器;注意力機(jī)制;殘差設(shè)計(jì);深度學(xué)習(xí)

        中圖分類號(hào):TP39 文獻(xiàn)標(biāo)識(shí)碼:A

        1 引言(Introduction)

        航班旅客配餐是民航領(lǐng)域的子業(yè)務(wù),是航空產(chǎn)業(yè)鏈的重要環(huán)節(jié)。配餐備份量受到航班運(yùn)行情況、旅客訂座情況、特殊日期等因素的影響,業(yè)內(nèi)使用人工經(jīng)驗(yàn)確定配餐備份量容易導(dǎo)致餐食浪費(fèi),從而增加企業(yè)的成本。因此,準(zhǔn)確預(yù)測(cè)航班配餐備份數(shù)有助于航空公司的配餐部門對(duì)餐食備份數(shù)量的決策提供支持,提升服務(wù)質(zhì)量。航班配餐備份數(shù)預(yù)測(cè),本質(zhì)上是一個(gè)時(shí)間序列預(yù)測(cè)問題,一直以來受到國內(nèi)外學(xué)者的廣泛研究[1],傳統(tǒng)數(shù)學(xué)統(tǒng)計(jì)學(xué)方法要求數(shù)據(jù)滿足某些假設(shè),故難以達(dá)到預(yù)期目標(biāo),傳統(tǒng)機(jī)器學(xué)習(xí)方法則需要做極其復(fù)雜的特征工程工作。近年,深度學(xué)習(xí)方法如循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)[2],采用編碼器-解碼器結(jié)構(gòu)的Seq2Seq模型[3]以及注意力機(jī)制[4]等應(yīng)用在時(shí)間序列預(yù)測(cè)問題上取得了很大的成功。本文提出了一種基于注意力機(jī)制,并融合編解碼器結(jié)構(gòu)和殘差設(shè)計(jì)的模型(ARSeq-Net),用于解決航班配餐備份數(shù)的預(yù)測(cè)問題。

        2 研究現(xiàn)狀及本文貢獻(xiàn)(Related work andcontribution)

        以民航為研究對(duì)象的文獻(xiàn),例如:林友芳等[6]使用時(shí)空長短期記憶網(wǎng)絡(luò)對(duì)出發(fā)地—目的地間的客運(yùn)需求進(jìn)行預(yù)測(cè)。鄧玉婧等[5]使用基于多粒度時(shí)間注意力機(jī)制的循環(huán)神經(jīng)網(wǎng)絡(luò)模型對(duì)未來航班的離港人數(shù)進(jìn)行預(yù)測(cè)。然而,這些研究中針對(duì)的具體問題與本文有較大區(qū)別,例如林友芳等[5]預(yù)測(cè)的是未來出發(fā)地—目的地間的客運(yùn)需求,鄧玉婧等[6]專注于用歷史起飛時(shí)刻的客座率預(yù)測(cè)航線未來的客座率,而本文則是采用航班起飛前的歷史訂座數(shù)據(jù)預(yù)測(cè)起飛時(shí)的客座人數(shù),即配餐備份數(shù)。在交通領(lǐng)域的其他時(shí)間序列預(yù)測(cè)問題的研究中,早期主要采用傳統(tǒng)數(shù)學(xué)統(tǒng)計(jì)學(xué)方法。STEPHANEDES[7]將歷史平均(Historic Average, HA)方法應(yīng)用于城市交通控制系統(tǒng)。陳楊等[8]將指數(shù)平滑(Exponential Smoothing, ES)法應(yīng)用于交通流數(shù)據(jù)預(yù)測(cè)。HAMED等[9]使用差分自回歸移動(dòng)平均(AutoRegressive Integrated Moving Average, ARIMA)模型對(duì)交通流量進(jìn)行預(yù)測(cè)。WILLIAMS等[10]使用季節(jié)性差分自回歸移動(dòng)平均(Seasonal AutoRegressive IntegratedMoving Average, SARIMA)模型通過差分將不平穩(wěn)時(shí)間序列轉(zhuǎn)變?yōu)槠椒€(wěn)時(shí)間序列進(jìn)行交通流量預(yù)測(cè)。ZIVOT等[11]考慮空間相關(guān)性對(duì)交通流量的影響,使用向量自回歸(VectorAutoRegression, VAR)模型在交通流量預(yù)測(cè)上取得了更好的預(yù)測(cè)精度。

        需要注意的是,由于實(shí)際中影響航班離港數(shù)量的外部條件和因素過于復(fù)雜,因此在本文研究的問題中,往往無法滿足此類傳統(tǒng)數(shù)學(xué)統(tǒng)計(jì)學(xué)方法的平穩(wěn)性假設(shè)限定,并且這些方法適用于相對(duì)較小的數(shù)據(jù)集,對(duì)于海量的航班數(shù)據(jù),無法達(dá)到預(yù)期的目標(biāo)。

        隨著人工智能的發(fā)展,傳統(tǒng)機(jī)器學(xué)習(xí)方法能夠更靈活地刻畫交通數(shù)據(jù)。ALAM等[12]使用線性回歸對(duì)交通流量進(jìn)行預(yù)測(cè)。姚智勝等[13]使用支持向量回歸方法對(duì)交通流量、占有率、平均速度等特征進(jìn)行訓(xùn)練,用于解決交通數(shù)據(jù)預(yù)測(cè)問題。DAVIS等[14]利用k近鄰模型解決交通數(shù)據(jù)的預(yù)測(cè)問題。HAMNER等[15]使用隨機(jī)森林訓(xùn)練移動(dòng)和停止的車輛數(shù)量、路段平均速度等特征對(duì)未來交通流量進(jìn)行預(yù)測(cè)。這些傳統(tǒng)機(jī)器學(xué)習(xí)方法雖然已經(jīng)能夠處理高維數(shù)據(jù),并能捕獲其復(fù)雜的非線性關(guān)系,但是仍然需要人工構(gòu)造復(fù)雜的特征工程,以提升模型的性能。

        近幾年,隨著深度學(xué)習(xí)的快速發(fā)展,深度學(xué)習(xí)被更多地應(yīng)用于時(shí)空交通數(shù)據(jù)的學(xué)習(xí)與預(yù)測(cè)任務(wù)中。例如,HUANG等[16]使用深度信念網(wǎng)絡(luò)(Deep Belief Networks, DBN)和YANG等[17]使用堆疊自編碼器(Stacked AutoEncoder, SAE)模型自動(dòng)學(xué)習(xí)交通數(shù)據(jù)的特征,不需要像機(jī)器學(xué)習(xí)模型那樣采用煩瑣的特征工程。MA等[18]和ZHAO等[19]使用長短期記憶網(wǎng)絡(luò)(Long Short-Term Memory, LSTM)預(yù)測(cè)短期的交通速度和流量。SHI等[20]針對(duì)時(shí)空數(shù)據(jù)預(yù)測(cè)問題,用卷積操作替換傳統(tǒng)LSTM模型中的線性變換操作,使得模型可以同時(shí)捕獲數(shù)據(jù)在時(shí)間和空間維度上的特征。ZHANG等[21]提出了ST-ResNet模型,通過卷積層和殘差結(jié)構(gòu)的組合,建模了城市范圍內(nèi)的人群流量的空間相關(guān)性。YU等[22]提出時(shí)空?qǐng)D卷積網(wǎng)絡(luò)(Spatio-Temporal Graph Convolutional Network,STGCN)模型,使用一維卷積刻畫了時(shí)間動(dòng)態(tài)相關(guān)性,使用圖卷積神經(jīng)網(wǎng)絡(luò)(GCN)獲取路網(wǎng)的局部空間相關(guān)性。

        Seq2Seq作為RNN的變種,包括編碼器(Encoder)和解碼器(Decoder)兩部分,在自然語言處理和時(shí)間序列任務(wù)中都取得了良好的效果。路寬等[23]使用多層Bi-GRU神經(jīng)元為基本單位構(gòu)建Seq2seq對(duì)短期電力負(fù)荷進(jìn)行預(yù)測(cè)。陶濤等[24]使用基于雙向LSTM的Seq2Seq模型對(duì)加油站時(shí)序數(shù)據(jù)進(jìn)行異常檢測(cè)。朱墨儒等[25]使用Seq2Seq模型對(duì)于云資源負(fù)載進(jìn)行預(yù)測(cè)。王濤等[26]使用Seq2Seq模型并融合外部特征對(duì)港口進(jìn)出口貨物量進(jìn)行預(yù)測(cè)。RNN采用類似遞歸的方式捕獲序列的信息,無法并行化處理信息,并且存在梯度爆炸和梯度消失的問題。VASWANI等[4]提出的Transformer模型采用注意力機(jī)制解決了該問題,該模型能夠更好地捕獲時(shí)間間隔較長的系列信息。ZHOU等[27]在Transformer模型的基礎(chǔ)上進(jìn)行了改進(jìn),提出了Informer,降低了注意力機(jī)制的計(jì)算復(fù)雜度,提升了在長序列時(shí)間預(yù)測(cè)問題上的預(yù)測(cè)效果,但此類方法的時(shí)間復(fù)雜度依然很高。

        對(duì)于航班配餐備份數(shù)預(yù)測(cè)問題,研究人員希望模型能夠自適應(yīng)學(xué)習(xí)航班歷史訂票人數(shù)對(duì)最終離港人數(shù)的影響程度,同時(shí)捕獲外部復(fù)雜因素與航班旅客訂票序列間的關(guān)系,因此本文提出了一種基于注意力機(jī)制和殘差設(shè)計(jì)的編解碼器深度模型用于解決這一問題。本文的創(chuàng)新點(diǎn)和具體貢獻(xiàn)總結(jié)如下。

        (1)通過注意力機(jī)制能有效捕獲航班歷史訂票人數(shù)對(duì)最終離港人數(shù)的影響程度,從而提高模型的預(yù)測(cè)精度。此外,本文僅在最后一步隱藏狀態(tài)以及歷史隱藏狀態(tài)應(yīng)用了注意力機(jī)制,其時(shí)間復(fù)雜度僅與序列長度呈線性關(guān)系,較Transformer和Informer相比,時(shí)間復(fù)雜度更低。

        (2)通過編解碼器結(jié)構(gòu)能有效捕獲外部復(fù)雜因素與航班旅客訂票序列間的關(guān)系。

        (3)在真實(shí)數(shù)據(jù)集上進(jìn)行了實(shí)驗(yàn),證明了方法的有效性和先進(jìn)性。

        3問題描述(Problem formulation)

        本節(jié)對(duì)航班配餐備份數(shù)預(yù)測(cè)問題進(jìn)行形式化描述和定義,并對(duì)相關(guān)數(shù)據(jù)特征進(jìn)行描述。某航班訂票人數(shù)的變化曲線如圖1所示,其中橫軸代表時(shí)間(STD代表起飛時(shí)刻,STD-3h則代表起飛前3 h),縱軸代表航班人數(shù)。航班訂票人數(shù)在時(shí)間軸上變化趨勢(shì)具有連續(xù)特性,是典型的時(shí)間序列,而航班配餐備份數(shù)的預(yù)測(cè)問題,本質(zhì)上是預(yù)測(cè)該航班實(shí)際離港人數(shù),所以本文研究的問題為典型的時(shí)間序列預(yù)測(cè)問題。

        (1)序列數(shù)據(jù)輸入:本文使用航班起飛前96 h到起飛前2 h的訂票人數(shù)作為序列輸入數(shù)據(jù) {Xt=96,95,…,2}。

        (2)外部復(fù)雜因素輸入:本文使用航班起飛及降落時(shí)間、起飛及降落機(jī)場(chǎng)、飛機(jī)型號(hào)、各艙型座位總數(shù),以及航班起飛當(dāng)日是周幾、是否處于法定節(jié)假日期間、是否為補(bǔ)班、是否處于春運(yùn)和暑運(yùn)期間拼接作為外部復(fù)雜因素輸入?Xother。

        本文的目標(biāo):將序列數(shù)據(jù)和外部復(fù)雜因素共同輸入模型,以預(yù)測(cè)離港人數(shù)F(X,Xother)→Y。

        4基于注意力機(jī)制和殘差的深度編解碼器網(wǎng)絡(luò)(Deep encoder-decoder network based onattention mechanism and residual)

        本節(jié)將詳細(xì)介紹基于注意力機(jī)制和殘差設(shè)計(jì)的編解碼器深度模型(ARSeq-Net)的結(jié)構(gòu)。該模型將注意力機(jī)制、殘差設(shè)計(jì)以及編解碼器結(jié)構(gòu)應(yīng)用于航班配餐備份數(shù)預(yù)測(cè)問題,旨在自適應(yīng)地提取序列中的隱藏信息以及外部因素的影響,通過神經(jīng)網(wǎng)絡(luò)的記憶能力、容錯(cuò)能力、自學(xué)習(xí)能力擬合預(yù)測(cè)函數(shù),從而進(jìn)行高效、準(zhǔn)確的預(yù)測(cè)。其中,注意力機(jī)制是一種對(duì)不同特征信息計(jì)算不同權(quán)重,并按權(quán)重值融合特征信息的方法,能夠有效捕獲到關(guān)鍵的信息;殘差設(shè)計(jì)能有效解決梯度爆炸和梯度消失問題,加速模型收斂;編解碼器結(jié)構(gòu)可以很有效地對(duì)輸入序列進(jìn)行特征表示,并捕獲到外部因素的影響。

        4.1編解碼器

        編解碼器(Encoder-Decoder)的提出基于Seq2Seq模型,是一種循環(huán)神經(jīng)網(wǎng)絡(luò)的變種,最早應(yīng)用于自然語言處理領(lǐng)域。編碼器部分的主要作用是將任意長度的序列信息編碼到傳遞向量中;解碼器的作用主要是將傳遞向量中所蘊(yùn)含的上下文信息進(jìn)行解碼,并輸出新的序列;其結(jié)構(gòu)圖如圖2所示。

        4.2注意力機(jī)制

        注意力機(jī)制能夠在大量的信息中有效地捕獲較為關(guān)鍵的信息,以此提高網(wǎng)絡(luò)的效率。具體來說,注意力機(jī)制就是要對(duì)特征信息計(jì)算權(quán)重,并對(duì)所有信息按權(quán)重進(jìn)行合并。注意力機(jī)制的計(jì)算過程分為兩步,第一步是計(jì)算歷史時(shí)間步輸出向量表示和最后一步隱藏狀態(tài)表示的注意力分布,第二步是根據(jù)注意力權(quán)重的分布情況計(jì)算歷史時(shí)間步向量表示的加權(quán)平均。本文中所用到的注意力機(jī)制是參考VASWANI等[4]設(shè)計(jì)的;具體公式如式(1)所示,具體結(jié)構(gòu)示意圖如圖3所示。

        本文中Q 編碼器最后一步的隱藏狀態(tài)的線性變換向量, K和V均是編碼器每一步輸出的線性變換向量。首先通過Q和K 的點(diǎn)乘,即可計(jì)算編碼器最后一步(即當(dāng)前步)的隱藏狀態(tài)與歷史時(shí)間步輸出的相似度。其次通過縮放和SoftMax操作,即可計(jì)算出注意力權(quán)重矩陣,即序列歷史時(shí)間步對(duì)當(dāng)前步的影響程度,此時(shí)各歷史時(shí)間步的影響程度數(shù)加和為1。最后將注意力權(quán)重與V 進(jìn)行點(diǎn)乘操作,所得輸出即為考慮了不同歷史時(shí)間步對(duì)當(dāng)前的不同影響后的融合信息表示。這樣就能通過模型自適應(yīng)地學(xué)習(xí)不同歷史時(shí)間對(duì)于當(dāng)前隱藏狀態(tài)的影響,提升模型的預(yù)測(cè)效果。

        4.3殘差設(shè)計(jì)

        殘差網(wǎng)絡(luò)(Residual Network, ResNet)是為了解決卷積神經(jīng)網(wǎng)絡(luò)隱藏層過多時(shí)的網(wǎng)絡(luò)退化問題而提出的,但是它并不局限于卷積神經(jīng)網(wǎng)絡(luò),其通過給非線性變換層增加直連邊提高信息的傳播效率,防止梯度爆炸和梯度消失,以及加快模型收斂速度。

        當(dāng)輸入為x時(shí),假設(shè)神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)到的特征為H(x),此時(shí)通過殘差單元學(xué)習(xí)的內(nèi)容可記作F(x) = H(x) ? x,可以使網(wǎng)絡(luò)更容易學(xué)習(xí)。

        本文將殘差設(shè)計(jì)引入編解碼器結(jié)構(gòu),旨在防止梯度爆炸,加快模型的收斂速度,提升模型預(yù)測(cè)的精度。

        相比其他模型,ARSeq-Net在捕獲歷史依賴關(guān)系的基礎(chǔ)上,通過注意力機(jī)制,能夠自適應(yīng)地學(xué)習(xí)歷史對(duì)當(dāng)前的不同影響程度,通過殘差設(shè)計(jì),有效提升了模型的收斂速度,并很好地解決了梯度爆炸等問題,使得預(yù)測(cè)結(jié)果更準(zhǔn)確。

        5實(shí)驗(yàn)結(jié)果與分析(Experimental results andanalysis)

        5.1數(shù)據(jù)集

        本文實(shí)驗(yàn)使用的數(shù)據(jù)集來自某航空公司提供的真實(shí)航班旅客訂座數(shù)據(jù)集,數(shù)據(jù)集中共計(jì)涉及的機(jī)場(chǎng)數(shù)量為105個(gè),其中同時(shí)作為起飛機(jī)場(chǎng)和降落機(jī)場(chǎng)的84 個(gè),僅作為起飛機(jī)場(chǎng)的10 個(gè),僅作為降落機(jī)場(chǎng)的11個(gè),共計(jì)存在的機(jī)場(chǎng)對(duì)為377個(gè),一共有5,021 個(gè)不同的航班;時(shí)間跨度從2018年3月16日到2020年12月31日,共計(jì)11,109,789 條訂座數(shù)據(jù)。

        5.2數(shù)據(jù)預(yù)處理

        (1)劃分訓(xùn)練集將原始數(shù)據(jù)處理為序列數(shù)據(jù)起飛前96 h到起飛前2 h的訂座人數(shù)為序列特征、起飛后的訂座人數(shù)為標(biāo)簽值,共得到序列數(shù)據(jù)432,029 條,按每條航班的7∶2∶1的比例劃分訓(xùn)練集、驗(yàn)證集、測(cè)試集,其中訓(xùn)練集包含85,786 條數(shù)據(jù),驗(yàn)證集包含24,739 條數(shù)據(jù),測(cè)試集包含13,482 條數(shù)據(jù)。

        (2)數(shù)據(jù)標(biāo)準(zhǔn)化。對(duì)航班訂座人數(shù)進(jìn)行z-score標(biāo)準(zhǔn)化,通過標(biāo)準(zhǔn)化可以加快模型收斂速度,提升模型精度。

        5.3 基準(zhǔn)方法與評(píng)價(jià)指標(biāo)

        經(jīng)過調(diào)研,目前與本文研究解決同一類問題的方法極少?;诖耍疚倪x定了時(shí)間序列預(yù)測(cè)的經(jīng)典方法以及近年來先進(jìn)的代表性方法,共計(jì)12 個(gè)基準(zhǔn)方法與ARSeq-Net進(jìn)行了實(shí)驗(yàn)和比較。

        HA:歷史平均值模型(Historical Average),是一種使用歷史平均值對(duì)未來進(jìn)行預(yù)測(cè)的統(tǒng)計(jì)學(xué)方法。

        ES:指數(shù)平滑預(yù)測(cè)法模型(Exponential Smoothing),是一種引入計(jì)算權(quán)重,并將計(jì)算權(quán)重由近到遠(yuǎn)按指數(shù)規(guī)律遞減的一種特殊的加權(quán)平均的統(tǒng)計(jì)學(xué)方法。

        LR:線性回歸模型(Linear Regression),是一種利用線性回歸方程的最小平方函數(shù)對(duì)多個(gè)自變量和因變量之間關(guān)系進(jìn)行建模和預(yù)測(cè)的機(jī)器學(xué)習(xí)方法。

        KNR:K近鄰回歸模型(K-Neighbors Regressor),是一種利用K 個(gè)最近訓(xùn)練樣本的目標(biāo)數(shù)值,對(duì)待測(cè)樣本的回歸值進(jìn)行決策的機(jī)器學(xué)習(xí)方法。

        DTR:決策樹回歸模型(Decision Tree Regressor),是一種以信息熵為度量構(gòu)造下降最快的樹的自頂向下的遞歸的機(jī)器學(xué)習(xí)方法。

        SVR:支持向量回歸模型(Support Vector Regression),是一種運(yùn)用支持向量機(jī)(SVM)擬合曲線并進(jìn)行回歸分析的機(jī)器學(xué)習(xí)方法。

        RFR:隨機(jī)森林回歸模型(Random Forest Regressor),是一種利用生成多決策樹的方式對(duì)樣本進(jìn)行訓(xùn)練并預(yù)測(cè)的機(jī)器學(xué)習(xí)方法。

        XGBoost:是一種利用多個(gè)梯度提升決策樹(GBDT)進(jìn)行訓(xùn)練并計(jì)算每個(gè)子樹的權(quán)重進(jìn)行累加的機(jī)器學(xué)習(xí)集成模型。

        LSTM:長短期記憶模型,是一種更適合處理長時(shí)間序列數(shù)據(jù)的循環(huán)神經(jīng)網(wǎng)絡(luò)模型。

        GRU:門控循環(huán)單元,是一種參數(shù)量較少,更容易收斂的循環(huán)神經(jīng)網(wǎng)絡(luò)模型。

        Transformer:是一種基于多頭注意力機(jī)制的編碼解碼長序列預(yù)測(cè)模型。

        Informer:是一種基于Transformer改進(jìn)得更為高效的長序列預(yù)測(cè)模型,專門適用于時(shí)間序列預(yù)測(cè)問題。

        本文采用平均絕對(duì)誤差(MAE)、均方根誤差(RMSE)和平均絕對(duì)百分比誤差(MAPE)作為評(píng)價(jià)指標(biāo),具體計(jì)算如式(2)至式(4)所示:

        5.4實(shí)驗(yàn)結(jié)果

        在真實(shí)航班旅客數(shù)據(jù)集上,驗(yàn)證了ARSeq-Net模型的預(yù)測(cè)效果。模型的超參設(shè)置如表1所示,預(yù)測(cè)結(jié)果如表2所示。

        表2顯示了不同模型在數(shù)據(jù)集上的預(yù)測(cè)結(jié)果,本文的ARSeq-Net模型的MAE、RMSE和MAPE都優(yōu)于其他模型。以MAPE為例,ARSeq-Net較傳統(tǒng)的統(tǒng)計(jì)學(xué)方法中最佳的ES,誤差降低了2.19%;較機(jī)器學(xué)習(xí)方法中最佳的XGBoost,誤差降低了0.42%;較深度學(xué)習(xí)方法中最佳的LSTM,誤差降低了3.02%。其中,HA和ES的效果較差,這是由于統(tǒng)計(jì)學(xué)方法并不能很好地建模序列預(yù)測(cè)問題;LR、KNR、DTR、SVR等模型的效果有所提升,但是它們不能很好地捕獲時(shí)間序列的特征;LSTM和GRU作為循環(huán)神經(jīng)網(wǎng)絡(luò)模型,雖然效果有所提升,但是對(duì)于長時(shí)間序列建模的效果不是很好;而Transformer和Informer雖然采用了注意力機(jī)制,但是此類方法在編碼器中采用自注意力機(jī)制進(jìn)行計(jì)算,再通過注意力機(jī)制與解碼器進(jìn)行連接,需要對(duì)兩兩時(shí)間步進(jìn)行注意力權(quán)重計(jì)算,時(shí)間復(fù)雜度較高,信息也容易出現(xiàn)的過度冗余,導(dǎo)致預(yù)測(cè)效果不佳。

        5.5消融實(shí)驗(yàn)

        為了進(jìn)一步驗(yàn)證模型中每個(gè)組件的有效性,研究人員對(duì)ARSeq-Net的三種變體進(jìn)行了實(shí)驗(yàn)。

        (1)GRU:不使用編解碼器結(jié)構(gòu)的模型。

        (2)Seq2Seq:僅使用編解碼器結(jié)構(gòu)的模型。

        (3)ASeq-Net:使用了編解碼器結(jié)構(gòu)和注意力機(jī)制的模型。

        實(shí)驗(yàn)結(jié)果如表3所示。

        從表3的實(shí)驗(yàn)結(jié)果可以看出,ARSeq-Net模型的三個(gè)評(píng)價(jià)指標(biāo)都是最好的,GRU模型的效果最差。實(shí)驗(yàn)結(jié)果可以證明,在加入了編解碼器結(jié)構(gòu)后,模型效果有了一定提升;加入注意力機(jī)制后,效果又有了進(jìn)一步提升;殘差的進(jìn)一步引入,使得模型效果達(dá)到最好,由此可以證明ARSeq-Net模型的有效性。

        6結(jié)論(Conclusion)

        本文提出了一種基于注意力機(jī)制和殘差設(shè)計(jì)的Seq2Seq深度網(wǎng)絡(luò)模型,用于解決航班配餐備份數(shù)預(yù)測(cè)問題,研究人員將本文提出的模型同處理時(shí)間序列預(yù)測(cè)的傳統(tǒng)數(shù)學(xué)統(tǒng)計(jì)學(xué)方法、經(jīng)典的機(jī)器學(xué)習(xí)方法以及經(jīng)典和先進(jìn)的深度學(xué)習(xí)方法在相同數(shù)據(jù)集上進(jìn)行了實(shí)驗(yàn),實(shí)驗(yàn)結(jié)果表明,本文提出的模型在預(yù)測(cè)效果上達(dá)到了最優(yōu),證明了本方法的有效性。但是,該方法還存在一些優(yōu)化空間,比如可以考慮其他外部因素如疫情等特殊時(shí)期的影響、天氣、經(jīng)濟(jì)形勢(shì)變化等對(duì)航班配餐備份數(shù)的影響,此部分因素難以合理量化,可作為未來模型優(yōu)化的方向。

        作者簡(jiǎn)介:

        王?。?988-),男,碩士,工程師.研究領(lǐng)域:信息技術(shù),企業(yè)數(shù)字化,軟件測(cè)試.

        吳子軒(1991-),男,博士,工程師.研究領(lǐng)域:數(shù)據(jù)科學(xué)與人工智能,企業(yè)數(shù)字化.本文通信作者.

        董杰(1996-),男,本科,工程師.研究領(lǐng)域:軟件開發(fā),產(chǎn)品管理.

        蔡哲立(1989-),男,本科,工程師.研究領(lǐng)域:軟件開發(fā),信息技術(shù),項(xiàng)目管理.

        張凱(1994-),男,本科,工程師.研究領(lǐng)域:軟件開發(fā),信息技術(shù).

        許喬若(1992-),男,碩士,高級(jí)工程師.研究領(lǐng)域:信息技術(shù),數(shù)據(jù)開發(fā),數(shù)據(jù)管理.

        猜你喜歡
        注意力機(jī)制深度學(xué)習(xí)
        面向短文本的網(wǎng)絡(luò)輿情話題
        基于自注意力與動(dòng)態(tài)路由的文本建模方法
        基于深度學(xué)習(xí)的問題回答技術(shù)研究
        基于LSTM?Attention神經(jīng)網(wǎng)絡(luò)的文本特征提取方法
        基于注意力機(jī)制的雙向LSTM模型在中文商品評(píng)論情感分類中的研究
        軟件工程(2017年11期)2018-01-05 08:06:09
        InsunKBQA:一個(gè)基于知識(shí)庫的問答系統(tǒng)
        有體驗(yàn)的學(xué)習(xí)才是有意義的學(xué)習(xí)
        電子商務(wù)中基于深度學(xué)習(xí)的虛假交易識(shí)別研究
        MOOC與翻轉(zhuǎn)課堂融合的深度學(xué)習(xí)場(chǎng)域建構(gòu)
        大數(shù)據(jù)技術(shù)在反恐怖主義中的應(yīng)用展望
        大陆啪啪福利视频| 欧洲美女黑人粗性暴交| 影音先锋每日av色资源站| 亚洲午夜福利精品久久| 日韩女同一区二区三区久久 | 爽爽影院免费观看| 亚洲成av人片一区二区| 亚洲国产麻豆综合一区| 日本免费a一区二区三区| 精品一区三区视频在线观看| 少妇性荡欲视频| 2021年国产精品每日更新| 人妻少妇偷人精品久久人妻| 天天综合天天爱天天做| 国产精品无码av一区二区三区| 无码日日模日日碰夜夜爽| 人妻少妇激情久久综合| 国产人妖乱国产精品人妖| aaa级久久久精品无码片| 日日爽日日操| 精品少妇一区二区三区入口| 免费乱理伦片在线观看| 成 人 网 站 免 费 av| 国产成人精品一区二免费网站| 在线观看国产视频午夜| 国精产品一区一区三区有限公司杨| 国产精美视频| 一本色道久久88综合| 欧美性猛交xxx嘿人猛交| 欧洲人妻丰满av无码久久不卡| 加勒比黑人在线| 国产在线一区二区三区四区乱码| 蜜桃一区二区三区| 激情五月婷婷综合| 日日麻批视频免费播放器| 久久亚洲精品国产亚洲老地址| 少妇饥渴xxhd麻豆xxhd骆驼 | 亚洲av噜噜狠狠蜜桃| 人成综合视频在线播放| 久久中文字幕无码专区| 欧美日一本|