亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于EMD-CNN-LSTM模型的鐵路客運量短期預測研究

        2023-12-27 05:51:36孟琪琳
        鐵道運輸與經(jīng)濟 2023年12期
        關鍵詞:客運量尺度分量

        孟琪琳,竇 燕

        (新疆財經(jīng)大學 統(tǒng)計與數(shù)據(jù)科學學院,新疆 烏魯木齊 830012)

        0 引言

        鐵路運輸在交通運輸業(yè)發(fā)展中起著重要作用,是國民經(jīng)濟發(fā)展的動力,隨著我國現(xiàn)代綜合交通運輸體系更加完善,鐵路成為旅客運輸?shù)妮^優(yōu)方式[1-2]。鐵路客運量預測作為鐵路項目經(jīng)濟效益以及修建可行性的關鍵,精準的預測有助于鐵路交通規(guī)劃設計、科學管理以及最優(yōu)資源配置[3-5]。鐵路客運受天氣、地域、環(huán)境等因素的影響是一個復雜的系統(tǒng),所統(tǒng)計的客運數(shù)據(jù)存在強波動性、非線性的特征,難以進行精準預測。因此,研究鐵路客運量預測時,首先需要將原始數(shù)據(jù)進行分解處理,有效降低數(shù)據(jù)的波動性,優(yōu)化其平穩(wěn)性;其次綜合利用不同神經(jīng)網(wǎng)絡模型的優(yōu)勢充分提取數(shù)據(jù)間的特征,有效挖掘非線性數(shù)據(jù)間的特征信息,準確把握鐵路客運歷史數(shù)據(jù)的變化規(guī)律,提高可預測性。

        小波分析法可以反映我國鐵路客運量在不同時間尺度的周期波動強弱,具有較強的時間頻率分析能力,其優(yōu)點在于簡單靈活,能夠獲取更多時間信息,在各個領域都有運用[6-7]。經(jīng)驗模態(tài)分解方法(EMD)是一種自適應性強的時間序列數(shù)據(jù)分析算法,不受分解層數(shù)以及小波基選擇影響,可以將一個復雜的非線性信號進行平穩(wěn)性處理,得到一系列光滑的分量,減少數(shù)據(jù)隨機性和波動性[8-9]。長短期神經(jīng)網(wǎng)絡(LSTM)適合處理預測間隔和延遲相對較長的時間序列,可以提取數(shù)據(jù)長期以來的特征,在捕捉時空關系方面具有優(yōu)越性能,常用于捕獲數(shù)據(jù)中的復雜非線性關系[10-11];該算法解決了循環(huán)神經(jīng)網(wǎng)絡(RNN)在訓練期間梯度消失的問題,對于長期規(guī)律學習效率較高,在許多復雜的非線性問題方面處理效果顯著[12-15]。

        研究通過組合模型集合各單項模型優(yōu)勢來提高預測精度[16-17],將原始數(shù)據(jù)通過EMD 算法對原始序列進行分解得到各內(nèi)涵模態(tài)分量(IMFs)及殘差分量(Res),并利用樣本熵值對分解所得分量進行重構;引入卷積神經(jīng)網(wǎng)絡(CNN)與LSTM相結合,實現(xiàn)網(wǎng)絡的并行學習,在特征提取與降維等方面具有優(yōu)勢,能夠更好地處理時間序列數(shù)據(jù),維持序列數(shù)據(jù)前后的相互關系。結果表明,使用EMD-CNN-LSTM組合預測模型預測我國鐵路客運量更加有效。

        1 方法與模型

        1.1 小波分析法

        小波分析又叫小波變換,是在Fourier 變換的基礎上發(fā)展而來的一種時頻局部化分析方法,可以對數(shù)據(jù)進行多時間尺度周期性分析。其中,小波實部系數(shù)圖可以反映鐵路客運量在不同時間尺度的周期變化和分布規(guī)律;小波系數(shù)可以反映鐵路客運量大小,小波系數(shù)為正,說明鐵路客運量偏大;小波系數(shù)為負,說明鐵路客運量偏??;小波方差圖則反映鐵路客運量在不同時間尺度的周期波動強弱。

        1.2 經(jīng)驗模態(tài)分解

        EMD 算法適用于非線性、非平穩(wěn)性數(shù)據(jù)的處理,并且可以有效減少模態(tài)混疊對序列分解的干擾性,實現(xiàn)序列的深層次平穩(wěn)化。該算法的本質是將信號中不同頻率的波動或趨勢項逐級分解,形成一系列具有平穩(wěn)性且相互影響甚微的數(shù)據(jù)序列[18]。為了使得到的各IMFs 分量有意義,需要滿足2 個條件。一是該分量的極值點與過零點的數(shù)目必須一致或相差必須少于1 個;二是對于每一個時間點,該分量的局部極大值和局部最小值構成的上下包絡線均值為零,即上下包路線關于時間軸逐步對稱。

        1.3 樣本熵

        熵是衡量系統(tǒng)復雜度的一種定量描述工具,樣本熵概念來自物理學意義上的近似熵概念,20世紀末由Pincus 和Richman 等[19-20]提出。樣本熵作為近似熵的一種改進算法,本身不依賴于數(shù)據(jù)長度,可以減少近似熵產(chǎn)生的誤差[21],有效反映時間序列中的復雜性。其熵值大小準確反映時間序列的情況,樣本熵值越小,序列的復雜性就越低;反之,序列的復雜性就越高。

        1.4 卷積神經(jīng)網(wǎng)

        CNN 是一種近年來在機器學習領域用途較廣的模型,由卷積層、池化層和全連接層構成。其中,卷積層在提取特征中依靠卷積核對數(shù)據(jù)特征進行提??;池化方式則采用ReLU 激活函數(shù),用來忽略部分特征;全連接層將池化之后的神經(jīng)元展開為向量形式。整體通過局部連接和共享權值的模式,交替運用卷積層、池化層和全連接層,最大程度地提取輸入數(shù)據(jù)中的局部特征,減少人為提取特征的誤差。CNN 在時間序列預測中學習數(shù)據(jù)關系能力較弱,因而將其與LSTM方法結合。

        1.5 長短期神經(jīng)網(wǎng)絡

        RNN在時間序列預測分析中得到廣泛使用,主要是由輸入層、隱含層以及輸出層3個層次所構成,與普通神經(jīng)網(wǎng)絡相比其優(yōu)點在于隱含層內(nèi)的神經(jīng)元之間相互連接,隱含層的每次計算結果都與當前輸入以及上一次的隱含層結果之間不是相互獨立的,RNN 網(wǎng)絡對之前的信息具有記憶能力并應用于當前輸出的計算中。LSTM是一種RNN的變體,基于RNN 增加了新的記憶單元與門控機制,可以有效地解決RNN 的梯度爆炸或者消失問題,處理數(shù)據(jù)長距離依賴問題。LSTM 模型在每個神經(jīng)元內(nèi)部增加了輸入門、遺忘門和輸出門3 類控制記憶單元狀態(tài)的門結構,這些結構都可以讓信息選擇性通過,對神經(jīng)網(wǎng)絡模型中各個時刻的數(shù)據(jù)狀態(tài)產(chǎn)生影響。

        1.6 研究步驟

        (1)時序數(shù)據(jù)分解。運用EMD 分解算法將原始序列分解得到各IMFs 分量與Res 分量,利用各分量波動的相似性和樣本熵值的相近程度對各分量進行重構處理得到新序列。

        (2)模型預測。將經(jīng)分解后重構的序列經(jīng)歸一化處理后分為訓練集、測試集,對訓練集數(shù)據(jù)進行模型訓練,使用CNN-LSTM 組合模型對重構序列的測試集數(shù)據(jù)進行預測,并將預測結果進行反歸一化處理,獲得各分量序列預測結果。

        (3)分量預測結果疊加。將各分量序列預測結果進行疊加獲得最終鐵路客運量的預測結果,并對預測結果與原始數(shù)據(jù)進行誤差分析。

        (4)模型效果評價。將EMD-CNN-LSTM 組合預測模型與其他模型的預測結果進行比較,根據(jù)評價指標衡量組合模型的有效性。

        2 鐵路客運量趨勢周期特征分析

        2.1 鐵路客運量趨勢特征分析

        我國鐵路客運量在月尺度上都具有上升趨勢,1990 年1 月—2020 年1 月全國鐵路月尺度客運量變化趨勢如圖1 所示。根據(jù)趨勢線可以看出,全國鐵路客運量近30 年呈上升趨勢,客運量不斷增加,其上升速率0. 0002/月,線性擬合R2=0.722,模型擬合較好。1990 年—2020 年我國鐵路客運量年平均增長率4.6%,“十三五(2016—2020 年)”以來隨著鐵路系統(tǒng)的完善,客運量的平均增長率達8.9%。從近期發(fā)展環(huán)境看,我國客運網(wǎng)絡仍在逐步完善,隨著人口的不斷遷移,鐵路客運量仍將繼續(xù)上升,維持穩(wěn)中有進的發(fā)展趨勢。

        圖1 1990年1月—2020年1月全國鐵路月尺度客運量變化趨勢Fig.1 Variation trend of monthly national railway passenger volume from January 1990 to January 2020

        2.2 鐵路客運量周期特征分析

        在周期分析階段,運用小波分析法,分析2015—2019年數(shù)據(jù)的周期特征。鐵路客運量月尺度小波分析如圖2所示。由圖2a可知,振蕩能量明顯的時間尺度有3~6 月、7~11 月、13~22 月、52~61 月。52~61 月特征尺度的振蕩能量強,變化周期明顯;13~22 月特征尺度的振蕩能量變?nèi)酰兓芷谧內(nèi)酰?~11 月尺度能量強度和周期分布表現(xiàn)次之;3~6 月特征尺度能量最弱,總體上變化周期穩(wěn)定。由圖2b可知,我國鐵路客運量在月尺度上存在4 個明顯峰值,分別對應5,9,18和56月尺度,其中第1峰值為56 月尺度,為第1 主周期;第2,3 峰值出現(xiàn)在18,9 月尺度,分別為第2,3 主周期;第4 峰值為5月尺度,振蕩最弱,為第4主周期。

        圖2 鐵路客運量月尺度小波分析Fig.2 Monthly wavelet analysis of railway passenger volume

        根據(jù)小波方差,繪制4 個主周期小波系數(shù)隨時間變化的過程,鐵路客運量月尺度主周期疊加趨勢如圖3 所示。在5 月特征尺度上,變化的平均周期為3個月左右,大約經(jīng)歷了20個變化周期;在9月特征尺度上,平均變化周期為6 個月左右,大約經(jīng)歷了10 個變化周期;在18 月特征尺度上,平均變化周期為12個月左右,大約經(jīng)歷了5個變化周期;在56月特征尺度上,經(jīng)歷周期變化較少,約2個變化周期,周期為30 個月左右。根據(jù)小波系數(shù)變化可以判別出在不同時段各尺度影響周期變化的強度,可以看出5 月尺度前期表現(xiàn)為較低能量平穩(wěn)振蕩,中期強度部分上升隨之下降,之后又上升維持穩(wěn)定的變化趨勢;9 月尺度、18 月尺度前期變化幅度較小,后期有加強的變化;56 月尺度則呈現(xiàn)下降趨勢??傮w上,疊加周期趨勢與實際變化基本符合,主周期以5,9,18 和56 月尺度為主。由于主要考慮主周期的小波系數(shù)疊加周期,但還會出現(xiàn)不同時期的其他周期,忽略了其他相對較小時間尺度的振蕩周期,因而周期實際振蕩出現(xiàn)部分偏差。綜上所述,我國客運量在月尺度上具有明顯的周期性。

        圖3 鐵路客運量月尺度主周期疊加趨勢Fig.3 Superposition trend of monthly main period of railway passenger volume

        3 實證分析

        根據(jù)對原始序列的趨勢分析,可以看出其整體的變化過程波動較大,非線性、非平穩(wěn)性和趨勢性顯著,需要對序列進行分解,得到波動性較小的分量序列進行預測。CNN-LSTM具有特征提取能力,可以挖掘特征向量,使用該模型可以較好地提取原始序列的趨勢、周期特征,從而提升預測性能。將該數(shù)據(jù)集的前80%劃分為訓練集,后20%劃分為預測集。在訓練過程中使得模型能夠更快地讓參數(shù)趨于收斂,提高預測精度,并對預測時所需的數(shù)據(jù)進行歸一化處理。為評估模型預測效果,采用均方根誤差(RMSE)、平均絕對百分比誤差(MAPE)和平均絕對值誤差(MAE)評價指標來衡量。

        3.1 鐵路客運量序列分解及重構

        由于數(shù)據(jù)隨機性較高,為提高預測精度,需要將全國鐵路客運量數(shù)據(jù)進行分解,采用EMD 分解算法對其進行進一步的平穩(wěn)化處理。EMD 分解余量信號圖如圖4所示。由圖4可知,利用EMD算法對原始序列進行分解,將其從高頻到低頻逐級分解為5個固有模態(tài)分量和1個殘差分量,各分量數(shù)據(jù)相較于最初數(shù)據(jù),其振動周期逐漸增加、波動趨勢逐漸平緩,平穩(wěn)性明顯優(yōu)化。5個固有模態(tài)分量分別反映不同影響因素在不同尺度下對波動量數(shù)據(jù)的影響,殘差分量則表示波動量序列的長期變化趨勢。

        圖4 EMD分解余量信號圖Fig.4 EMD margin signal

        為評估EMD 分解后的數(shù)據(jù)是否會造成原始序列信息的丟失,將原始序列與EMD 分解所得分量進行重構誤差分析,原始序列與EMD 分量重構誤差如圖5所示。由圖5可知,通過求解分解后各分量與余量的重構誤差,得到平均誤差為-2.102×10-15,分解損失量較小,EMD 算法在保留原始信息的情況下,降低了原始數(shù)據(jù)的復雜度。數(shù)據(jù)經(jīng)過EMD分解后得到5 個分量,對逐個分量進行預測,預測過程中每個分量都會產(chǎn)生預測誤差,分量越多會導致產(chǎn)生的誤差越大,最后在疊加預測結果時,所得累積的誤差就越大,對預測結果的精度產(chǎn)生影響。因此,為了更準確地對鐵路客運序列進行分析和預測,減少預測模型的計算規(guī)模,增強模型的預測性能,對分解得到的各分量依據(jù)樣本熵值進行重構處理。

        EMD分解所得各分量樣本熵值如表1所示。通過綜合比較各分量波動的相似性、樣本熵值的相近程度對各分量進行重構,使用預測模型對各重構分量進行預測,達到提升預測精度的效果。IMF1,IMF2,IMF3 和IMF4 分量樣本熵值較大,表明分量的隨機性較強,且隨時間的變化波動較大,反映了氣候等外界隨機因素對鐵路客運量的影響,因此將IMF1,IMF2,IMF3,IMF4 分量重構為高頻序列;IMF5和Res分量波動頻率依次減弱,表明分量受外界隨機影響較小,隨時間波動較為平緩,因而將IMF5 和Res 分量重構為低頻序列。各分量重構序列圖如圖6所示,數(shù)據(jù)的隨機性明顯降低。

        表1 EMD分解所得各分量樣本熵值Tab.1 Sample entropy of each component obtained by EMD

        3.2 LSTM和CNN網(wǎng)絡層數(shù)選取

        對于數(shù)據(jù)量不大的數(shù)據(jù)集,如果設計的網(wǎng)絡模型過于復雜容易導致過擬合現(xiàn)象。為驗證提出的EMD-CNN-LSTM組合模型對各分量的預測,對其重構分量進行仿真計算。分別對CNN和LSTM參數(shù)進行固定,之后將CNN 和LSTM 網(wǎng)絡層數(shù)的選取做出調整,通過計算RMSE 的大小評估預測效果,CNN-LSTM 層數(shù)選取結果如表2 所示。在CNN 和LSTM 層數(shù)取2 和1 時,預測效果MAE 和RMSE 達到最小且模型不存在過擬合現(xiàn)象。因此,將CNN層數(shù)定為2層、LSTM層數(shù)定為1層。

        表2 CNN-LSTM層數(shù)選取結果Tab.2 Selection results of CNN-LSTM layers

        3.3 基于組合模型的鐵路客運量預測研究

        應用CNN-LSTM 組合模型,預測分解重構所得的高頻序列及低頻序列。為驗證模型預測效果,選用測試集數(shù)據(jù)預測分析我國鐵路客運量,各分解重構序列預測結果如圖7 所示,各分解重構序列預測絕對誤差如表3所示。

        表3 各分解重構序列預測預測絕對誤差Tab.3 Absolute prediction errors of each decomposition and reconstruction sequence

        圖7 各分解重構序列預測結果Fig.7 Prediction results of each decomposition and reconstruction sequence

        由圖7 和表3 可知,各分量序列預測曲線與實際曲線擬合優(yōu)度較好,平均絕對誤差在0. 2045~0. 1869區(qū)間變化,維持在較低水平。最后,將各分量序列的預測結果進行疊加,得到最終鐵路客運量的預測結果。EMD-CNN-LSTM 模型預測結果如圖8所示。由圖8可知,最終預測值曲線與原始序列曲線較為接近。通過計算預測值與原始序列之間的絕對誤差與相對誤差可知,其絕對誤差在0. 0008~0. 6755 之間,平均絕對誤差為0. 2545,誤差較小,模型具有較高的可行性。

        圖8 EMD-CNN-LSTM模型預測結果Fig.8 Prediction results of EMD-CNN-LSTM model

        3.4 預測模型比較分析

        運用EMD-CNN-LSTM,CNN-LSTM,LSTM,隨機森林,GBDT,XGBoost 6 種模型預測我國鐵路客運量,得到預測結果。不同模型的預測結果比較如圖9 所示。并依據(jù)RMSE,MAE 以及MAPE 3 種評價指標,分析EMD-CNN-LSTM 組合模型的預測優(yōu)勢,各模型預測結果精度評價如表4所示。

        圖9 不同模型的預測結果比較Fig.9 Comparison of prediction results of different models

        由圖9 可知,與其他模型相比,EMD-CNNLSTM 組合模型所得的預測結果與原始序列更為接近,預測效果更好。由表4 可知,EMD-CNNLSTM 組合模型的精度優(yōu)于其他模型,通過比較EMD-CNN-LSTM和CNN-LSTM,RMSE下降24.3%,MAE下降7.4%,MAPE下降14.3%,由此可知序列的分解提高了預測結果的有效性;通過比較EMDCNN-LSTM,CNN-LSTM,LSTM,隨機森林,GBDT,XGBoost 模型,RMSE,MAE,MAPE 均有明顯下降,由此可知EMD-CNN-LSTM 模型所得到的預測結果有效性更好,在預測過程中,對數(shù)據(jù)進行分解實現(xiàn)數(shù)據(jù)的深度平穩(wěn)化是提高預測精度的關鍵因素之一。

        4 研究結論

        為了解決鐵路客運量數(shù)據(jù)強隨機性及不平穩(wěn)性對預測精度的影響問題,提出一種基于數(shù)據(jù)分解的鐵路客運量組合預測模型。基于EMD 分解方法,分解處理原始數(shù)據(jù)序列,得到弱波動、較平穩(wěn)的分量,并為減少預測誤差使用樣本熵對分量進行重構;針對各分量序列,采用CNN-LSTM 組合模型進行預測,并將各分量預測結果疊加得出最終預測結果。研究結論如下。

        (1)在分析我國月尺度鐵路客運量特征過程中,發(fā)現(xiàn)客運量具有明顯的趨勢性及周期性。根據(jù)對我國鐵路客運量的特征分析,考慮到時間序列的強隨機性,使用EMD 分解算法對原始數(shù)據(jù)序列進行分解,優(yōu)化數(shù)據(jù)的平穩(wěn)性,提高預測結果的準確性。

        (2)使用樣本熵對過多分量進行重新合并,減少多分量預測合并時的累計誤差,將分量傳送至CNN-LSTM 組合模型中,該模型可以較好地捕捉數(shù)據(jù)的長期特征,使得預測更為精準。結果表明,EMD-CNN-LSTM組合模型預測值與真實值的誤差較小,驗證了模型具有較高的可行性。

        (3) 比較EMD-CNN-LSTM, CNN-LSTM,LSTM,隨機森林,GBDT,XGBoost 模型預測結果,證實EMD-CNN-LSTM 組合模型的預測效果優(yōu)于其他模型。在預測過程中,對數(shù)據(jù)進行分解實現(xiàn)數(shù)據(jù)的深度平穩(wěn)化是提高預測精度的關鍵因素。

        (4)受客觀條件所限,一些與鐵路客運量相關的影響因素(如氣候、票價等)尚未考慮在內(nèi),也是影響鐵路客運量預測精度的因素之一,未來可以進行探究。

        猜你喜歡
        客運量尺度分量
        交通運輸部:3 月城市軌道交通客運量環(huán)比增長16.6%
        帽子的分量
        財產(chǎn)的五大尺度和五重應對
        2018年北京市城市公共交通運行特征分析
        交通工程(2020年5期)2020-10-21 08:45:44
        2018年北京市軌道交通運行特征分析
        交通工程(2020年2期)2020-06-03 01:10:58
        一物千斤
        智族GQ(2019年9期)2019-10-28 08:16:21
        論《哈姆雷特》中良心的分量
        分量
        宇宙的尺度
        太空探索(2016年5期)2016-07-12 15:17:55
        9
        亚洲av高清在线观看三区| 国产无遮挡又爽又刺激的视频老师 | 五月天综合在线| 国产男女做爰猛烈视频网站| av在线天堂国产一区| 亚洲乱亚洲乱妇无码麻豆| 四虎影视永久在线精品| 亚洲av中文无码乱人伦在线咪咕 | 国产亚洲AV片a区二区| 日韩中文字幕不卡在线| 国内女人喷潮完整视频| 久久精品岛国av一区二区无码 | 亚洲免费不卡| 午夜在线观看一区二区三区四区| 国产成人久久精品一区二区三区| 亚洲av无码一区二区三区观看| 樱花AV在线无码| 日本一区二区三区在线观看视频| 日韩在线 | 中文| 爱情岛永久地址www成人| 久久99久久99精品免观看女同 | 午夜福利麻豆国产精品| 天啦噜国产精品亚洲精品| 国产一区二区三区男人吃奶| 日韩av激情在线观看| 无限看片在线版免费视频大全 | 黄桃av无码免费一区二区三区| 国产免费久久精品国产传媒| 国产白浆精品一区二区三区| 久久精品国产亚洲av超清| 少妇无码一区二区三区免费 | 中文字幕 在线一区二区| 午夜天堂av天堂久久久| 99热久久这里只精品国产www| 免费大学生国产在线观看p| 91精品国自产拍老熟女露脸| 久久精品国产精品| 在线a亚洲视频播放在线观看| 国产精品美女主播在线| 国语自产偷拍在线观看| 久久精品re|