亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于ConvLSTM的南京地區(qū)共享單車需求預(yù)測研究

        2024-04-29 00:00:00王俊于愛榮
        軟件工程 2024年2期

        關(guān)鍵詞:共享單車;需求預(yù)測;深度學(xué)習(xí);ConvLSTM;交通

        0 引言(Introduction)

        隨著共享經(jīng)濟的發(fā)展,共享單車作為一種新型的出行方式,它的便捷性、環(huán)保性和經(jīng)濟性受到越來越多人的青睞。在國內(nèi),共享單車的運營模式主要有有樁共享單車(Station-BasedBike Sharing, SBBS)和無樁共享單車(Free-Floating BikeSharing, FFBS)[1-2]。當前,很多大型城市的交通節(jié)點和人口相對集中,如何根據(jù)不同城市或城市不同區(qū)域的差異化需求精準預(yù)測共享單車需求量,合理規(guī)劃布局共享單車的停放點和區(qū)域,是社會交通發(fā)展過程中面臨的棘手問題。國內(nèi)學(xué)者對共享單車需求預(yù)測和規(guī)劃的研究主要集中于用車頻率與周期特點分析、停放區(qū)域規(guī)劃、城市活力分析和交通樞紐影響力分析等不同角度,但是較少針對城市特點和區(qū)域特點開展共享單車需求測算的設(shè)計。常見的長短期記憶網(wǎng)絡(luò)(LSTM)、自動回歸移動平均(ARMA)等需求預(yù)測模型在分析城市人口布局和區(qū)域特征分布時存在提取特征能力不足的問題,導(dǎo)致其預(yù)測結(jié)果與實際相比有較大偏差。因此,采用新的模型或技術(shù)手段挖掘用戶使用共享單車的年度、季節(jié)性和周期性等方面的重要規(guī)律和特點,以此優(yōu)化單車投放數(shù)量計劃,并提升用戶對共享單車使用的滿意度,這成為當前的迫切需求[3-5]。

        1 時間序列預(yù)測與深度學(xué)習(xí)技術(shù)(Time seriesprediction and deep learning techniques)

        1.1 時間序列預(yù)測

        時間序列是按照時間先后順序?qū)﹄S機變量X1,X2,…,XT 進行排列的一種序列化表現(xiàn),記為{Xt,t∈T},并用x1,x2,…,xn 或者{xt,t∈1,2,…,N }表示該隨機序列的N 個有序觀測值。其中,對時間序列應(yīng)用最廣泛的就是預(yù)測,其核心思想是利用過往的歷史數(shù)據(jù)預(yù)知未來的走勢。與回歸或分類預(yù)測相比,時序預(yù)測的核心原理大相徑庭,雖然它們都需要使用數(shù)據(jù)進行預(yù)測,但是回歸或分類預(yù)測通常是使用其他數(shù)據(jù)點預(yù)測目標數(shù)據(jù)點,而時間序列預(yù)測則是利用歷史數(shù)據(jù)預(yù)測未來數(shù)據(jù)點。這種預(yù)測方式通?;跁r間序列的趨勢性、季節(jié)性、周期性等因素,并考慮其他因素,如天氣、假期等[6]。

        在時間序列分析中,通??梢詫r間序列數(shù)據(jù)分解為趨勢性、季節(jié)周期性和隨機誤差三大部分。趨勢性主要描述了時序數(shù)據(jù)在長周期中隱含的有規(guī)律性的單向升高或下降的變化特點,該部分通??梢酝ㄟ^線性或非線性回歸模型擬合。季節(jié)周期性描述了時序數(shù)據(jù)在一定時間周期內(nèi)出現(xiàn)的可復(fù)現(xiàn)的規(guī)律性波動,該部分可采用季節(jié)性分解方法分離出季節(jié)性成分。隨機誤差也稱為殘差,是在上述兩個特征之外出現(xiàn)的隨機性的不規(guī)則波動,隨機波動所導(dǎo)致的時間序列變化,可以通過殘差分析檢查模型的擬合程度。時間序列通常包含趨勢性、季節(jié)周期性和隨機誤差的特征,可以采用加法模型或乘法模型進行表達。加法模型將時間序列分解為趨勢性、季節(jié)性和殘差的加和,乘法模型將時間序列分解為趨勢性、季節(jié)性和殘差的乘積。加法模型如公式(1)所示,乘法模型如公式(2)所示。

        其中:趨勢性特征用mt 表征,季節(jié)周期性特征用st 表征,隨機誤差用et 表征。在時間序列分析中,需要選擇適當?shù)哪P兔枋鰯?shù)據(jù)中的趨勢性和季節(jié)性變化。如果趨勢性特征與季節(jié)周期性特征之間的關(guān)系相對獨立,加法模型可以很好地表達它們相互之間的影響。如果趨勢性特征的變化對季節(jié)周期性特征的效應(yīng)有明顯的影響,那么乘法模型將是更好的選擇。因此,在選擇模型時需要考慮數(shù)據(jù)中不同因素之間的相互關(guān)系,以便能夠更準確地描述數(shù)據(jù)的變化趨勢。

        針對時間序列數(shù)據(jù)的預(yù)測問題,目前主要有三種主流方法可供選擇。經(jīng)典的ARMA和ARIMA(自回歸綜合移動平均)模型是以往進行時序數(shù)據(jù)建模與處理的常用模型,該類模型能夠有效地處理特征平穩(wěn)的時序數(shù)據(jù),并且具備對單一變量數(shù)據(jù)序列的回歸能力,但其對復(fù)雜特征數(shù)據(jù)的處理能力較弱,效果不佳;經(jīng)典的機器學(xué)習(xí)模型往往將時序數(shù)據(jù)處理轉(zhuǎn)化為無監(jiān)督學(xué)習(xí)任務(wù),在進行有效的數(shù)據(jù)特征工程、預(yù)處理和模型訓(xùn)練后進行時序數(shù)據(jù)的未來預(yù)測,該方法能夠處理對復(fù)雜特征數(shù)據(jù)的分析與建模,并且能夠較好地解決時序數(shù)據(jù)中多變量特征的協(xié)同性回歸和非線性等問題,該類方法的典型模型有Lightgbm和Xgboost;深度學(xué)習(xí)模型是近年來比較流行的時序數(shù)據(jù)處理方法,該方法在神經(jīng)網(wǎng)絡(luò)的基礎(chǔ)上加入了大規(guī)模的隱藏層和感知單元,能有效地提取時序數(shù)據(jù)中的各類特征,該類模型主要包括CNN模型、GRU模型和LSTM 模型。具體來說,選擇合適的時間序列預(yù)測方法應(yīng)該考慮具體問題的復(fù)雜程度和數(shù)據(jù)量大小[7]。

        1.2 深度學(xué)習(xí)技術(shù)

        深度學(xué)習(xí)技術(shù)在時間序列預(yù)測中的應(yīng)用始于全連接神經(jīng)網(wǎng)絡(luò)(FCNN)。然而,F(xiàn)CNN存在過擬合和泛化能力不足等問題。隨著卷積神經(jīng)網(wǎng)絡(luò)(CNN)在圖像領(lǐng)域取得的新突破,CNN在特征提取中表現(xiàn)出的優(yōu)異性使其成為深度學(xué)習(xí)技術(shù)中的熱門模型,CNN通過不同的卷積核和卷積操作可有效地對高維度的數(shù)據(jù)進行特征提取。但是,CNN只能處理短期預(yù)測問題,對于處理長期預(yù)測問題表現(xiàn)不佳。在CNN之后出現(xiàn)的循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)可以通過內(nèi)部隱藏狀態(tài)很好地保留歷史信息,其采用方向傳播的參數(shù)訓(xùn)練模式,能高效推導(dǎo)網(wǎng)絡(luò)中的權(quán)重參數(shù),能自動高效地學(xué)習(xí)序列數(shù)據(jù)的特征。上述模型雖然能力突出,但是在訓(xùn)練過程中易出現(xiàn)梯度消失或爆照等問題,這些問題限制了其在長序列預(yù)測方面的應(yīng)用。為了解決這些問題,長短期記憶網(wǎng)絡(luò)(LSTM)被提出,它通過門控機制控制歷史信息的保留和遺忘,從而更好地處理長期依賴性問題。最近,變換器和深度強化學(xué)習(xí)(DRL)等技術(shù)也被應(yīng)用于時間序列預(yù)測中[8]。

        深度學(xué)習(xí)技術(shù)在時間序列預(yù)測中的應(yīng)用非常廣泛,包括股票價格預(yù)測、交通流預(yù)測、氣象預(yù)測、能源需求預(yù)測等。例如,在股票價格預(yù)測方面,深度學(xué)習(xí)技術(shù)可以通過學(xué)習(xí)股票價格歷史數(shù)據(jù)預(yù)測未來的股票價格走勢。在交通流預(yù)測方面,深度學(xué)習(xí)技術(shù)可以通過分析交通歷史數(shù)據(jù)預(yù)測未來的交通狀況,為交通管理和規(guī)劃提供支持。在氣象預(yù)測方面,深度學(xué)習(xí)技術(shù)可以通過學(xué)習(xí)天氣歷史數(shù)據(jù)預(yù)測未來的天氣情況,為氣象預(yù)警和防災(zāi)減災(zāi)提供支持。在能源需求預(yù)測方面,深度學(xué)習(xí)技術(shù)可以通過學(xué)習(xí)用電量歷史數(shù)據(jù)預(yù)測未來的能源需求量,為能源規(guī)劃和管理提供支持。

        1.3ConvLSTM

        LSTM 模型是由Hochreiter等人對RNN進行改進而提出的一種新型模型,其設(shè)計初衷是為了解決長期依賴性問題。21世紀,LSTM 被一代代學(xué)者逐漸完善,形成了較為系統(tǒng)的LSTM框架,在自然語言處理(NLP)、自動駕駛汽車等領(lǐng)域均有應(yīng)用。在LSTM 模型中,ConvLSTM (Convolutional LongShort Term Memory)是將CNN和LSTM 進行結(jié)合的一種特殊形態(tài),它繼承了CNN的卷積特點,能夠有效地提取高維數(shù)據(jù)信息的特征,同時又集合了LSTM 的記憶能力,能夠應(yīng)對較為復(fù)雜的時序數(shù)據(jù)。該模型對于語音、視頻等多特征的時序數(shù)據(jù)有很好的處理效果[9]。同時,ConvLSTM還被廣泛應(yīng)用于如天氣、股票、能量場等多尺度的數(shù)據(jù)預(yù)測。ConvLSTM 的網(wǎng)絡(luò)結(jié)構(gòu)圖如圖1所示。

        全連接的LSTM,其輸入和輸出狀態(tài)都是一維的張量,它主要的優(yōu)勢在于梯度會被保存在單元中,從而避免梯度消失的問題。LSTM單元結(jié)構(gòu)如圖2所示。

        其中:輸入門、遺忘門和輸出門分別用i、f 和o 表示,Wi、Wf 、Wo 是其對應(yīng)的權(quán)重,bi、bf 、bo 為遺忘門的偏置項,sigmod函數(shù)為σ,○為點積操作,Ct、Ct-1 分別為t 和t-1時刻的長期記憶,ot 為神經(jīng)元的中間記憶[10]。雖然全連接的LSTM 已經(jīng)可以用來解決時間關(guān)聯(lián)性問題,但是它無法捕捉空間特征。

        ConvLSTM由兩種組件組成,即卷積層和LSTM 層。其中,卷積層的作用在于以卷積方式對多維數(shù)據(jù)提取有效特征,LSTM層的作用在于通過門控機制將需要記憶的信息進行迭代保存,將需要遺忘的數(shù)據(jù)丟棄。ConvLSTM的各個時刻狀態(tài)計算方法如公式(8)至公式(12)所示:

        其中:*代表卷積,○代表哈達瑪積,Xt 代表輸入,Ct 代表單元輸出,Ht 代表隱狀態(tài),it 代表輸入門,ft 代表遺忘門,ot 代表輸出門。比較FC-LSTM和ConvLSTM的重要等式可以看出,ConvLSTM與FC-LSTM主體大致相同,僅提取特征的方式不同,ConvLSTM是將所有普通乘法改為卷積操作,卷積核越大,就越能夠提取到更快的動作,而卷積核越小,就越能夠提取到更慢的動作。

        2 數(shù)據(jù)集與特征分析(Dataset and feature analysis)

        收集南京地區(qū)兩個自然年度三類典型地區(qū)共享單車的使用需求數(shù)量信息作為數(shù)據(jù)集,數(shù)據(jù)集有24個數(shù)據(jù)采集點,每小時采集1次。數(shù)據(jù)集中記錄了與共享單車需求相關(guān)的區(qū)域、氣溫、天氣等影響因素,數(shù)據(jù)集特征描述如表1所示。

        為了有效地訓(xùn)練神經(jīng)網(wǎng)絡(luò)(如LSTM),需要注意樣本數(shù)據(jù)中數(shù)值較大的輸入可能會對學(xué)習(xí)和收斂速度造成負面影響,甚至影響神經(jīng)網(wǎng)絡(luò)的學(xué)習(xí)精度。因此在進行訓(xùn)練之前,需要對樣本數(shù)據(jù)進行預(yù)處理以達到更好的訓(xùn)練效果[11]。其中,標準化作為一種常用的數(shù)據(jù)預(yù)處理方式,可將數(shù)據(jù)值擬合為均值為0、方差為1的正態(tài)分布函數(shù)。需要注意的是,進行標準化操作之前需要對轉(zhuǎn)換數(shù)據(jù)進行分布情況的分析,如數(shù)據(jù)不符合高斯分布,其進行標準化后的可靠性將有較大程度地降低,標準化的轉(zhuǎn)換函數(shù)如公式(13)所示:

        標準化需計算樣本數(shù)據(jù)的均值u 和標準差σ,通??梢酝ㄟ^對訓(xùn)練數(shù)據(jù)進行估計得到。與歸一化方式相比,標準化方法的優(yōu)點在于其魯棒性更強、訓(xùn)練效果更為穩(wěn)定。對標準化后的特征通過相關(guān)性分析,使用斯皮爾曼秩相關(guān)系數(shù)衡量變量之間的線性相關(guān),去除冗余的特征,該系數(shù)計算如公式(14)所示:

        其中:ρ 為斯皮爾曼秩相關(guān)系數(shù);di 為對應(yīng)變量的秩之差,即Xi 和Yi 兩個變量分別排序后對應(yīng)成對的變量位置(等級)差,即Xi-Yi;n 為觀測對象的數(shù)量。斯皮爾曼秩相關(guān)系數(shù)在-1~1變化。當其絕對值接近1時,表明兩個變量的相關(guān)性更強,當系數(shù)值為0時,表明兩個變量完全不相關(guān)(一個變量的變化不受另一個變量變化的影響)[12]。一般而言,相關(guān)系數(shù)絕對值大于0.8的則判定兩個變量為強相關(guān),小于0.2的則判定兩個變量為弱相關(guān),在實際特征分析過程中絕對值大于0.6或小于0.4,即可判定為兩個變量有一定的強弱相關(guān)性。各變量的特征相關(guān)性圖如圖3所示。

        研究人員通過對三個區(qū)域內(nèi)的共享單車的全部需求數(shù)據(jù)進行相關(guān)性分析發(fā)現(xiàn),需求與氣溫和風(fēng)速有一定的關(guān)系,并且與時間和月份存在關(guān)聯(lián)性。通過對月度和小時的單車需求數(shù)量分析發(fā)現(xiàn),大多數(shù)月份的需求呈現(xiàn)雙峰分布,同時還發(fā)現(xiàn)工作時間段的需求呈現(xiàn)增加態(tài)勢,而下午非工作時間段的單車需求相對穩(wěn)定,月需求數(shù)量分布如圖4所示,小時需求數(shù)量分布如圖5所示。

        從圖4可以看出,南京地區(qū)的7~9月是共享單車需求量最高的月份,這與氣溫升高和暑假來臨有密切關(guān)系。對圖5中的每日數(shù)據(jù)進行對比分析發(fā)現(xiàn),8時、17時和18時存在用車高峰,這與上下班時間點重合,在季節(jié)影響方面可以看出春、夏、秋季的需求旺盛,冬季的需求量較為低迷。

        3 模型訓(xùn)練和評估(Model training and evaluation)

        對于多變量時間序列預(yù)測問題,ConvLSTM模型的輸入數(shù)據(jù)形態(tài)為具有步長的多維數(shù)據(jù),其表達方式為[samples,timesteps,rows,cols,channels],每一個時間步都包含有多個行列的數(shù)據(jù)。本文將ConvLSTM 模型的步長設(shè)定為14 d的周期,這樣便于拆解為兩個子序列進行卷積,實現(xiàn)特征提取。每個子序列中包含7 d的特征數(shù)據(jù),整個輸入數(shù)據(jù)形狀為[n,2,1,7,1]。為了驗證ConvLSTM 的訓(xùn)練和評估效果,研究人員將ConvLSTM 模型與LSTM、GRU和CNN模型進行了橫向?qū)Ρ取onvLSTM模型的參數(shù)信息如表2所示。

        ConvLSTM總計訓(xùn)練參數(shù)為49 291個,50次的迭代效果如圖6所示,CNN、LSTM、GRU的迭代效果如圖7至圖9所示,對比圖7至圖9可以看出,ConvLSTM在10次迭代后的殘差就已經(jīng)降至較為穩(wěn)定的狀態(tài),并且在驗證集上的應(yīng)用效果也較好。

        ConvLSTM 與LSTM、GRU、CNN 模型效果對比如表3所示。

        從表3可以看出,ConvLSTM 模型的解釋性變量分值最高,明顯優(yōu)于單一使用CNN或LSTM的模型,其在訓(xùn)練集和測試集上的MSE、RMSE 誤差有一定的提升,利用ConvLSTM進行預(yù)測的結(jié)果如圖10所示。

        從圖10可以看出,預(yù)測結(jié)果的趨勢吻合度較好,對于波動性變化的敏感度適應(yīng)能力較強。

        4 結(jié)論(Conclusion)

        本文對南京地區(qū)兩個自然年度三類典型地區(qū)共享單車的使用需求數(shù)量、天氣狀態(tài)、季節(jié)周期等多類信息進行分析和特征提取,并在此基礎(chǔ)上提出了一種同時考慮了時空序列的基于ConvLSTM的深度學(xué)習(xí)預(yù)測模型,該模型通過卷積操作提取數(shù)據(jù)中隱含的空間信息,設(shè)定序列長度周期為14 d時,模型擁有最優(yōu)的預(yù)測效果。通過與經(jīng)典的時序LSTM 網(wǎng)絡(luò)、卷積CNN 等模型進行相比,本文設(shè)計的模型其RMSE、MSE 和解釋性變量分值等指標顯示出更好的效果。在模型設(shè)計中,時間序列長度的設(shè)置至關(guān)重要,該參數(shù)設(shè)置過大,會導(dǎo)致短期需求預(yù)測準確度降低;該參數(shù)設(shè)置過小,會導(dǎo)致樣本與模型的網(wǎng)絡(luò)結(jié)構(gòu)不匹配而出現(xiàn)無法有效擬合的問題,因此后續(xù)研究將圍繞共享單車的數(shù)據(jù)特征工程展開,增加城市、地區(qū)、地形等方面特征的多模態(tài)數(shù)據(jù),提升模型的預(yù)測精準度。

        国产在线观看免费不卡视频| 精品国产v无码大片在线观看| 五月婷婷六月激情| 国产亚洲一区二区三区夜夜骚| 日本一区二区在线播放视频 | 亚洲精品午夜无码专区| 尤物99国产成人精品视频| 一区二区三区在线视频免费观看| 亚洲中文字幕第15页| 国产精品av在线| 亚洲狠狠婷婷综合久久| 国产9 9在线 | 免费| 国产精品成人一区二区在线不卡 | 人妻蜜桃日产一本久道综合在线| 国产精品日本一区二区在线播放| 无码人妻少妇色欲av一区二区| 亚洲黄色性生活一级片| 中文字幕人妻被公喝醉在线 | 亚洲av无码专区在线播放| 日本免费一区尤物| 精品一区二区三区女同免费| 亚洲亚色中文字幕剧情| 99精品人妻少妇一区二区| 亚洲最大成av人网站| 久久99久久久精品人妻一区二区| 友田真希中文字幕亚洲| 久久99热久久99精品| 一区二区三区放荡人妻| 国产av一区二区三区天美| 免费观看交性大片| 无码中文字幕色专区| 中文字幕成人乱码亚洲| 国产婷婷色一区二区三区深爱网| 无码ol丝袜高跟秘书在线观看| 国产V日韩V亚洲欧美久久| 久草视频在线播放免费| 国产精品视频永久免费播放| 成人无码一区二区三区网站| 久久精品国产亚洲AV高清y w| 成人午夜无人区一区二区| 人妻少妇中文字幕专区|