摘 要:目前,基于深度學(xué)習(xí)的交通流量預(yù)測方法存在不足。首先,基于圖卷積網(wǎng)絡(luò)的預(yù)測模型使用簡化的路網(wǎng)拓?fù)?,忽視了?shí)際交通組織信息,影響預(yù)測準(zhǔn)確性。其次,基于聚類的預(yù)測模型未考慮交通流的區(qū)域和時間相似性,未能有效利用時空模式,導(dǎo)致聚類結(jié)果對預(yù)測提升有限。此外,過大的訓(xùn)練樣本增加了訓(xùn)練和預(yù)測時間,影響實(shí)時性。為了解決上述問題,提出了基于深度聚類的城市卡口短時流量預(yù)測模型(deep temporal clustering traffic flow prediction,DTCTFP)。首先,構(gòu)建包含實(shí)際交通組織信息的路網(wǎng)拓?fù)?,利用圖卷積網(wǎng)絡(luò)挖掘卡口間的時空特性;其次,引入改進(jìn)的動態(tài)時間規(guī)整和最短路徑分析方法,將相似的交通流對象歸類到同一簇,使模型充分利用流量、時間、位置等特征信息,提升預(yù)測精度;最后利用基于簇的循環(huán)神經(jīng)網(wǎng)絡(luò)進(jìn)行預(yù)測,提高模型的實(shí)時性和計算效率?;谥貞c大渡口交通數(shù)據(jù)進(jìn)行了實(shí)驗(yàn)驗(yàn)證,結(jié)果顯示,相較于最新基準(zhǔn)模型,在MAE、RMSE、MAPE指標(biāo)上,平均降低了15.02%、10.72%、10.98%,并通過消融實(shí)驗(yàn)證實(shí)了所提出的聚類方法能夠提升14.5%的預(yù)測準(zhǔn)確性。
關(guān)鍵詞: 深度聚類; 交通流量預(yù)測; 循環(huán)神經(jīng)網(wǎng)絡(luò); 動態(tài)時間規(guī)整; 交通卡口
中圖分類號: TP391 文獻(xiàn)標(biāo)志碼: A 文章編號: 1001-3695(2025)02-007-0371-10
doi: 10.19734/j.issn.1001-3695.2024.07.0284
Short-term traffic flow prediction of city intersection
based on deep temporal clustering
Guo Jian1, Zheng Jiaoling1’, Qiao Shaojie1, Deng Hongyao2, Sun Jigang2, Li Xinjia2
(1. School of Software Engineering, Chengdu University of Information Technology, Chengdu 610225, China; 2. Sichuan Efang Intelligence Technology Co., Ltd., Chengdu 610000, China)
Abstract:Currently, deep learning-based traffic flow prediction methods have deficiencies. Firstly, the prediction model based on graph convolutional network uses a simplified road network topology, ignores the actual traffic organization information, and affects the prediction accuracy. Secondly, the clustering-based prediction model does not consider the regional and temporal similarity of traffic flow and fails to effectively utilize spatio-temporal patterns, resulting in limited enhancement of prediction by clustering results. In addition, overly large training samples increases the training and prediction time, affecting real-time performance. In order to solve the above problems, this paper proposed a deep temporal clustering traffic flow prediction (DTCTFP) model based on deep temporal clustering for short-term traffic flow prediction at urban chokepoints. Firstly, the method constructed the road network topology containing actual traffic organization information and used a graph convolutional network to mine the spatio-temporal characteristics between chokepoints. Secondly, it introduced improved dynamic temporal regularization and shortest path analysis methods to classify similar traffic flow objects into the same cluster, allowing the model to make full use of feature information such as flow rate, time, and location to improve prediction accuracy. Finally, it used a cluster-based recurrent neural network for prediction to enhance the real-time and computational efficiency of the model. Using Chongqing Dadukou traffic data, experiments show that the model reduces MAE, RMSE, and MAPE by 15.02%, 10.72%, and 10.98% on average compared to the latest benchmark. The ablation test also confirms a 14.5% improvement in prediction accuracy with the proposed clustering method.
Key words:deep clustering; traffic flow prediction; recurrent neural network; dynamic time warping; traffic intersection
0 引言
十字路口交通信號控制是調(diào)節(jié)交通流量、緩解交通擁堵的一種低成本手段。隨著數(shù)據(jù)采集技術(shù)的成熟,數(shù)據(jù)驅(qū)動的交通流量預(yù)測方法因其能夠識別隱藏在歷史數(shù)據(jù)中的交通流特征而日益成為主流交通量預(yù)測方法。
從時間關(guān)系的角度來看,交通流量數(shù)據(jù)由一組時間序列組成。雖然每個位置的交通狀況不斷變化,但每個時間片的交通狀態(tài)與其最近的過去狀態(tài)密切相關(guān)。為捕捉這種時間關(guān)系,研究者們采用了參數(shù)或非參數(shù)方法。Lyu等人[1]將自編碼器(autoencoder,AE)應(yīng)用于高速公路交通流預(yù)測。結(jié)果證實(shí),該方法從交通數(shù)據(jù)中識別出了潛在的交通流特征,如非線性時空相關(guān)性。Pang等人[2]應(yīng)用循環(huán)神經(jīng)網(wǎng)絡(luò)(recurrent neural network,RNN)提取時間維度的特征,用于公交出行時間和到達(dá)時間預(yù)測。結(jié)果表明,RNN的優(yōu)勢在于學(xué)習(xí)與時間序列相關(guān)的任務(wù)。然而,RNN存在梯度消失問題,為了解決這一問題,提出了長短期記憶網(wǎng)絡(luò)(long short-term memory,LSTM)[3]。Abduljabbar等人[4]應(yīng)用LSTM預(yù)測單條道路的交通速度和流量。研究結(jié)果表明,LSTM及其變體有效地捕獲了交通數(shù)據(jù)的短期變化。
從空間關(guān)系的角度來看,交通路網(wǎng)拓?fù)浣Y(jié)構(gòu)的不規(guī)則性使得人工構(gòu)建網(wǎng)絡(luò)級規(guī)則輸入變得非常困難。為了滿足這一要求,引入圖神經(jīng)網(wǎng)絡(luò)(graph neural network,GNN)[5]從基于圖的數(shù)據(jù)中預(yù)測交通流量和速度[6~8]。對于基于圖的數(shù)據(jù),每個檢測器的位置都被視為一個節(jié)點(diǎn),并捕獲相鄰節(jié)點(diǎn)之間的空間關(guān)系。圖卷積網(wǎng)絡(luò)(graph convolutional network,GCN)[9]可以使用譜圖理論將卷積操作擴(kuò)展到非歐幾里德域。然而,如果增加更多的GCN層,數(shù)據(jù)將會過度擬合。而且,GCN中每個節(jié)點(diǎn)的鄰居數(shù)量是固定的,不能反映實(shí)際的流量情況,提取網(wǎng)絡(luò)中所有探測器的交通流量變化仍然很困難。道路網(wǎng)絡(luò)的出行行為是復(fù)雜的、動態(tài)的,用一張圖很難捕捉到所有檢測器的所有特征。使用所有檢測器作為節(jié)點(diǎn)將導(dǎo)致一個非常大的圖。而且,學(xué)習(xí)如此龐大的圖也非常具有挑戰(zhàn)性,很容易過擬合。
除了從流量數(shù)據(jù)中提取時空相關(guān)性以進(jìn)行準(zhǔn)確預(yù)測外,研究人員還將重點(diǎn)放在了網(wǎng)絡(luò)級交通流量預(yù)測上。許多研究都集中在高速公路數(shù)據(jù)上,如Caltrans Performance Measurement System (PeMS)[10]提供的由加州運(yùn)輸公司在加州高速公路上實(shí)時采集的高速公路流量數(shù)據(jù)集。但由于交通信號控制而更加復(fù)雜的城市交通流量卻很少得到研究。Vlahogianni等人[11]報道,人口密集的城市道路網(wǎng)絡(luò)中的相互作用使得網(wǎng)絡(luò)級預(yù)測具有挑戰(zhàn)性。
目前大部分短時交通量預(yù)測方法局限于高速公路和城市主干道。然而,將這些方法推廣到涉及不同功能的多個路段、異構(gòu)道路網(wǎng)絡(luò)中是具有挑戰(zhàn)性的。
如圖1(a)所示,在重慶市大渡口某區(qū)域存在四個卡口,它們展示了交通流數(shù)據(jù)具有時間和空間屬性的特點(diǎn)。在早高峰時段(7:00~9:00),這四個卡口的流量變化趨勢如圖1(b)所示,并通過深度學(xué)習(xí)模型提取了特征,時間粒度為5 min,時間跨度為一周。觀察發(fā)現(xiàn),卡口1和3的流量變化更為相似,而卡口2和4的流量變化更為相似。圖中黑色虛線部分為周一早高峰的變化情況(見電子版),在這24個時間點(diǎn)中,可以觀察到四個不同的卡口在早高峰期間表現(xiàn)出不同的特征。其中卡口1和3呈現(xiàn)出相似的波動變化,具有明顯的周期性。與此不同,卡口2和4在早高峰期間車流量始終保持在較高位置,變化幅度大。這種現(xiàn)象可能有以下原因:卡口1和3位于立交橋的出口,而卡口2靠近醫(yī)院,卡口4則在學(xué)校附近。在早高峰時段,主要的車流是由南向北流動的。醫(yī)院和學(xué)校周圍的交通情況通常更為復(fù)雜,流量波動也更加顯著。
針對上述問題,本文提出了基于深度聚類的交通流時間序列預(yù)測框架DTCTFP,下文將具體進(jìn)行介紹。
1 問題定義
定義1 交通流序列。給定一個大規(guī)模路網(wǎng)Φ由Nsection(后續(xù)簡寫為Nsect)個卡口組成,Φ={x(i)}Nsect,卡口x(i)包含的路段集合為Li,其中x(i)=[x(i)1,x(i)2,…,x(i)Nhist]表示第i個卡口上的歷史交通流序列。
原始問題:流量預(yù)測。交通流量預(yù)測的目標(biāo)是構(gòu)建歷史流量值xNhist與未來流量值xNpred之間的映射函數(shù)f(·):
x(i)n+Npred=f(x(i)n-Nhist+1,x(i)n-Nhist+2,…,x(i)n)(1)
在交通流量預(yù)測中,傳統(tǒng)的方法通常是直接構(gòu)建歷史流量值與未來流量值之間的映射函數(shù),如式(1)。這種方法雖然可以在一定程度上捕捉交通流量的變化趨勢,但在處理大規(guī)模路網(wǎng)時可能存在一些局限性,直接對整個路網(wǎng)的所有卡口應(yīng)用單一模型,可能難以有效捕捉各個區(qū)域內(nèi)流量模式的差異,尤其是在路網(wǎng)規(guī)模龐大、卡口眾多的情況下。為了更精準(zhǔn)地預(yù)測各個區(qū)域的流量,本文提出了一種基于聚類的流量預(yù)測方法。
本文要解決的問題(基于聚類的流量預(yù)測):將大規(guī)模路網(wǎng)Φ劃分為k簇{C(1),C(2),…,C(k)}的過程稱為交通流序列聚類,C(k)表示第k簇,其中0lt;klt;lt;Nsect,x(i,k)表示第i個卡口聚集到第k簇C(k)中,x(k)trend表示每簇聚類中心。這種方法是基于某一相似性度量將特征相似的交通流序列分在同一簇。而在每個簇中,為所有卡口訓(xùn)練一個基于簇模型的預(yù)測模型,C(k)dynamic={x(i,k)Nhist}為由滑動窗口生成的每簇動態(tài)的訓(xùn)練樣本,C(k)pred={x(i,k)Npred}為每簇預(yù)測的流量值:
C(k)pred=f(k)(C(k)dynamic)(2)
當(dāng)前問題面臨的挑戰(zhàn)及解決方案:
現(xiàn)有基于聚類的交通流量預(yù)測模型通常以時間序列聚類為主,側(cè)重于通過時序相似性來挖掘交通流量的變化規(guī)律。這類方法假設(shè)相似的時間序列模式意味著相似的交通流狀況,因此常忽略交通流在時間和空間上的復(fù)雜特性。然而,交通流不僅在時間上表現(xiàn)出高峰期的錯位、波動等非線性特征,還在空間上受到交通組織措施的顯著影響。僅僅依賴時間序列的聚類分析,往往難以捕捉這些關(guān)鍵因素。因此,必須結(jié)合時間和空間兩個角度對交通流量進(jìn)行更深入地分析。
在時間維度上,交通流量表現(xiàn)出復(fù)雜的非線性特征,不同位置的高峰時段可能存在顯著的時間錯位;而在空間維度上,交通流量不僅僅受物理距離的影響,交通管制和組織措施對交通流量的分布和流動同樣起著至關(guān)重要的作用。這兩者都對現(xiàn)有基于時間序列聚類和圖卷積網(wǎng)絡(luò)的方法提出了挑戰(zhàn)。時間維度主要面臨挑戰(zhàn)1,而空間維度則主要體現(xiàn)為挑戰(zhàn)2。
a)挑戰(zhàn)1:現(xiàn)有基于聚類的交通流量預(yù)測模型中,時序聚類算法未能充分挖掘交通流的非線性特征。在圖1中,可以看到卡口2的早高峰時間明顯早于卡口4的早高峰時間,這表明交通流量在不同地點(diǎn)的時序差異。這種時間上的錯位不僅反映了交通流受時間和空間兩個維度的復(fù)雜影響,還會導(dǎo)致傳統(tǒng)的相似性度量方法如動態(tài)時間規(guī)整(dynamic time warping,DTW)[12]在對齊和捕捉這種時序延遲時出現(xiàn)問題。由于卡口2和4兩個交通流序列在趨勢形狀上基本一致但出現(xiàn)了平移、壓縮和拉伸現(xiàn)象,DTW錯誤地將交通流數(shù)據(jù)的不同部分進(jìn)行匹配,導(dǎo)致病態(tài)對齊現(xiàn)象。這種錯誤的對齊會使得DTW算法無法準(zhǔn)確反映實(shí)際的交通流時空特征,從而限制了基于DTW的聚類結(jié)果在預(yù)測中的有效性。
針對挑戰(zhàn)1,在圖2(a)交通流聚類模塊中,改進(jìn)后的梯度約束動態(tài)時間規(guī)整算法在原有基礎(chǔ)上進(jìn)行了重要優(yōu)化,不僅對早高峰期間交通流對齊路徑的斜率變化進(jìn)行了限制,還增強(qiáng)了對交通流序列中噪聲和突發(fā)事件的應(yīng)對能力。具體而言,該算法通過對齊路徑的斜率進(jìn)行梯度約束,避免了在交通流延遲現(xiàn)象下出現(xiàn)的病態(tài)對齊問題。這種改進(jìn)使得算法在處理實(shí)際交通數(shù)據(jù)時更為魯棒,特別是在早高峰等關(guān)鍵時段,能夠更準(zhǔn)確地匹配具有復(fù)雜時空特征的流量模式。
b)挑戰(zhàn)2:如圖1所示,卡口2實(shí)施了“禁止左轉(zhuǎn)”的交通管制措施,導(dǎo)致卡口1和2雖然在物理距離上很近,但早高峰的流量變化情況卻完全不同。這表明,交通組織信息(如“禁止左轉(zhuǎn)”)對交通流量的影響非常顯著,并直接影響交通流的分布和變化。然而,現(xiàn)有的基于圖卷積網(wǎng)絡(luò)的交通流量預(yù)測模型通常通過交通網(wǎng)絡(luò)的物理結(jié)構(gòu)來構(gòu)建節(jié)點(diǎn)關(guān)系,例如基于節(jié)點(diǎn)之間的地理距離。這些模型假設(shè)物理上相鄰或距離較近的交通節(jié)點(diǎn)之間存在較強(qiáng)的交通流依賴性,因此更有可能受到相似的交通流量變化影響。然而,這種基于物理結(jié)構(gòu)的方式雖然能夠捕捉一定程度上的交通關(guān)聯(lián)性,但與實(shí)際的交通流量動態(tài)變化并不完全貼切。交通流量不僅受到地理距離的影響,還受到諸如交通組織措施的顯著影響。這些措施能夠顯著改變流量的分布與流動方向,導(dǎo)致物理距離較近的節(jié)點(diǎn)在流量表現(xiàn)上可能截然不同。
針對挑戰(zhàn)2,在圖2(b)路網(wǎng)特征提取模塊中提出了一種改進(jìn)的路網(wǎng)建模方法,以路段而非單個卡口作為節(jié)點(diǎn),構(gòu)建更具代表性的路網(wǎng)拓?fù)浣Y(jié)構(gòu)。在這一拓?fù)浣Y(jié)構(gòu)中,實(shí)際的交通組織信息,如“禁止左轉(zhuǎn)”等交通管制措施,被充分考慮并納入模型。這種方法不僅反映了交通網(wǎng)絡(luò)的物理連接,還捕捉了更復(fù)雜的交通規(guī)則和管制信息的影響。在早高峰期間,某些路段的流量可能會受到前方路段的交通管制措施的影響,導(dǎo)致非線性的流量變化。GCN通過整合這些復(fù)雜的關(guān)系,能夠更精準(zhǔn)地捕捉不同路段之間的流量變化規(guī)律,從而提高交通流量預(yù)測的準(zhǔn)確性。早高峰時段,交通流量變化頻繁且復(fù)雜,傳統(tǒng)模型可能難以準(zhǔn)確預(yù)測此時的流量動態(tài)。而改進(jìn)后的模型通過綜合考慮物理結(jié)構(gòu)和交通組織信息,使得預(yù)測結(jié)果更貼近實(shí)際情況。
c)挑戰(zhàn)3:在交通流量預(yù)測中,實(shí)時性是一個至關(guān)重要的因素。準(zhǔn)確的流量預(yù)測需要模型能夠在短時間內(nèi)處理大量數(shù)據(jù)并生成結(jié)果。然而,當(dāng)訓(xùn)練樣本規(guī)模過大時,模型的訓(xùn)練和預(yù)測時間可能顯著延長,這直接影響到預(yù)測結(jié)果的實(shí)時性。交通流量數(shù)據(jù)通常是連續(xù)的,并且隨著時間推移不斷積累,這導(dǎo)致模型在面對龐大數(shù)據(jù)集時,計算負(fù)擔(dān)和資源消耗大幅增加。如果訓(xùn)練時間過長,模型的響應(yīng)速度會下降,無法滿足實(shí)際交通管理和調(diào)度的實(shí)時需求。
針對挑戰(zhàn)3,提出了基于模型共享的理念,如圖2(c)模型共享模塊,該模塊旨在提高交通流預(yù)測的實(shí)時性。這種方法通過對交通流模式進(jìn)行聚類,將具有相似交通特征的卡口分為同一簇,然后為每個簇構(gòu)建一個共享的預(yù)測模型。與傳統(tǒng)的獨(dú)立模型相比,這種基于簇的模型構(gòu)建方式顯著減少了需要訓(xùn)練的模型數(shù)量,從而有效降低了訓(xùn)練時間和計算資源的消耗。模型共享策略使得實(shí)時預(yù)測能力得到顯著提升,能夠及時響應(yīng)交通流量的動態(tài)變化,為交通管理提供更具時效性的支持。
2 模型框架
模型框架的體系結(jié)構(gòu)如圖2所示,其主要功能包括深度聚類和流量預(yù)測。該模型由交通流聚類、路網(wǎng)特征提取以及模型共享三個關(guān)鍵部分組成。圖2(a)交通流聚類模塊主要功能是將具有時間相似性和空間相關(guān)性的交通流對象聚合成一簇,以便更好地理解和分析交通流的模式和行為。模塊通過輸入卡口的歷史流量數(shù)據(jù),能夠輸出k簇交通流,以及相應(yīng)的k種流量模式。圖2(b)路網(wǎng)特征提取模塊的主要功能是從構(gòu)建的實(shí)際交通組織信息的路網(wǎng)中提取特征。它將同一卡口的多個路段特征進(jìn)行聚合,并將卡口級別的特征按簇分離,每個簇的數(shù)據(jù)包含空間信息的時序數(shù)據(jù)。模塊通過輸入k簇交通流、具有交通組織信息的路網(wǎng)拓?fù)?,能夠輸出k簇卡口級別的特征。圖2(c)模型共享模塊通過基于簇的模型,構(gòu)建了基于循環(huán)神經(jīng)網(wǎng)絡(luò)的交通流預(yù)測系統(tǒng),同時融合了對應(yīng)的流量模式。模塊通過將k種流量模式和k簇卡口級別的特征融合后作為輸入,輸出每個卡口的預(yù)測數(shù)據(jù)。
2.1 深度聚類
2.1.1 時間序列的時間相關(guān)性分析
交通流時間特征處理的目標(biāo)是從時間序列數(shù)據(jù)中提取有效的低維度表征,同時衡量這些表征之間的相似性。為了實(shí)現(xiàn)這一目標(biāo),本文采用深度自編碼器提取時間序列特征,并運(yùn)用改進(jìn)的動態(tài)時間規(guī)整方法確定它們之間的相似度。
1)時間特征提取
通過對交通流時間序列數(shù)據(jù)進(jìn)行特征提取,可以自動學(xué)習(xí)并保留數(shù)據(jù)中的短期波動特征、長期趨勢特征、周期性特征以及異常特征。這些特征反映了交通流量隨時間的變化模式,包括高峰時段的突增流量、隨時間推移的增長或減少、每周的周期性變化,以及由于事故或天氣變化引起的異常流量。
時序聚類中,有效的潛在特征對于處理動態(tài)和不確定的交通流至關(guān)重要。與靜態(tài)數(shù)據(jù)不同,交通流數(shù)據(jù)需要考慮時間上的變化。一種常見的方法是使用滑動窗口來處理這種動態(tài)性,通過選擇適當(dāng)大小的時間窗口,可以獲得近期歷史車流數(shù)據(jù),從而反映當(dāng)前交通流的狀態(tài)。
在得到最新的車流時序數(shù)據(jù)后,采用深度自編碼器(deep autoencoder)[13]來提取特征是一種有效的方法,提取過程如圖3所示。這個自編碼器的設(shè)計包括三個關(guān)鍵層次。首先,第一層采用了1D卷積神經(jīng)網(wǎng)絡(luò)(convolutional neural network,CNN)[14]。其主要作用是通過卷積操作降低時間序列數(shù)據(jù)的維度,同時捕捉時間序列中的非線性特征。通過這一層的處理,可以將原始數(shù)據(jù)轉(zhuǎn)換為更具有代表性的特征表示。其次,第二層采用最大池化(max pooling)操作。最大池化的主要目的是進(jìn)一步降低卷積結(jié)果的維度,從而減少模型的計算復(fù)雜度和參數(shù)數(shù)量。通過保留每個卷積核輸出中的最大值,最大池化能夠提取出最顯著的特征信息,使得后續(xù)處理更加高效。最后,第三層采用雙向長短期記憶網(wǎng)絡(luò)(bi-directional long short-term memory recurrent neural network,Bi-LSTM)[15]。Bi-LSTM具有記憶能力,能夠有效地捕捉時間序列數(shù)據(jù)中的長期依賴關(guān)系,并且通過雙向結(jié)構(gòu),可以同時提取出時間序列數(shù)據(jù)前向和反向兩個時間維度的特征信息。這種設(shè)計使得模型能夠更全面地理解時間序列數(shù)據(jù)中的時序特征。
在解碼器中,首先通過上采樣層對數(shù)據(jù)進(jìn)行初步重構(gòu),然后通過反卷積層對數(shù)據(jù)進(jìn)行進(jìn)一步重構(gòu),以得到解碼器的重構(gòu)數(shù)據(jù)。
損失函數(shù)采用均方誤差(mean squared error,MSE),用于衡量解碼器的重構(gòu)輸出數(shù)據(jù)與輸入編碼器的原始數(shù)據(jù)之間的差異。原始的車流時序數(shù)據(jù)為x(i)=[x(i)1,x(i)2,…,x(i)n],模型的編碼器輸出為y(i)=[y(i)1,y(i)2,…,y(i)m],其中mlt;lt;n,解碼器輸出為(i)=[(i)1,(i)2,…,(i)n],自編碼器的損失函數(shù)為
Lrecon=1N∑Nj=1((i)j-x(i)j)2(3)
基于交通流時間序列潛在特征提取如算法1所示。
算法1 交通流數(shù)據(jù)潛在特征提取算法
輸入:歷史交通流時間序列數(shù)據(jù)x(i)Nhist。
輸出:交通流的潛在特征y(i)。
a) 通過滑動窗口從歷史數(shù)據(jù)x(i)Nhist中獲取近期歷史車流數(shù)據(jù)x(i)
b) for i=1 to N do
c)
將時間序列數(shù)據(jù)x(i)輸入到encoder中得到特征向量y(i)
d)
將特征向量y(i)輸入到decoder中得到重構(gòu)數(shù)據(jù)(i)
e)
計算重構(gòu)損失Lrecon
f)
基于SGDM方法,反向傳播更新網(wǎng)絡(luò)模型
g) end for
h) return 潛在特征y(i)
2) GCDTW距離計算
動態(tài)時間規(guī)整(dynamic time warping,DTW)作為廣泛采用的彈性相似性度量之一,旨在通過更精準(zhǔn)地對齊扭曲時間軸來彌補(bǔ)歐氏距離等傳統(tǒng)距離度量方法的不足。然而,傳統(tǒng)的DTW方法在時間序列之間的局部相似性或相關(guān)性不夠清晰時會出現(xiàn)病態(tài)對齊的問題,這一問題并沒有得到很好的解決。在這種情況下,本文提出梯度約束DTW(gradient-constrained dynamic time warping,GCDTW)作為一種新的變體方法,引入了梯度約束,限制了對齊路徑的斜率變化,有效地解決了病態(tài)對齊問題。
給定任意兩個卡口的時間序列x(1)=[x(1)1,x(1)2,…,x(1)n]、x(2)=[x(2)1,x(2)2,…,x(2)n],它們所對應(yīng)的低緯度特征分別為y(1)=[y(1)1,y(1)2,…,y(1)m]、y(2)=[y(2)1,y(2)2,…,y(2)m],其中mlt;lt;n。為了計算兩個卡口時間序列所對應(yīng)的特征之間的距離,構(gòu)建并初始化距離矩陣,從距離矩陣的左上角開始,使用一種距離度量方法(如歐氏距離),計算到達(dá)每個單元格的最小累積距離,通過回溯從終點(diǎn)到起點(diǎn)的路徑,選擇累積距離最小的路徑。圖4(b)為GCDTW計算的原理圖,紅色部分為DTW對齊路徑(見電子版)。為了限制對齊路徑的斜率變化,引入梯度約束函數(shù)
g(i, j)=|(i-iprev)-(j-jprev)|(4)
其中:(iprev, jprev)是前一個對齊點(diǎn)的坐標(biāo)。GCDTW距離可表示為
D(y(1)i,y(2)j)=d(y(1)i,y(2)j)+
minD(y(1)i-1,y(2)j)+a·g(i-1, j),
D(y(1)i,y(2)j-1)+a·g(i, j-1),
D(y(1)i-1,y(2)j-1)+a·g(i-1, j-1)(5)
其中:a是梯度約束的權(quán)重參數(shù);累積距離D(y(1)i,y(2)j)為當(dāng)前格點(diǎn)距離d(y(1)i,y(2)j),也就是點(diǎn)y(1)i和y(2)j的歐氏距離與可以到達(dá)該點(diǎn)的最小鄰近元素的累積距離之和。
圖4(a)展示了兩個卡口在某天早高峰時段的流量變化情況,并通過GCDTW計算兩條序列之間的相似度。相比之下,歐氏距離只是簡單地考慮了數(shù)據(jù)點(diǎn)之間的距離,而忽略了時間上的結(jié)構(gòu),這可能導(dǎo)致其無法準(zhǔn)確捕捉到兩個時間序列在趨勢形狀上基本一致但出現(xiàn)了平移、壓縮和拉伸現(xiàn)象的相似度。由于城市路網(wǎng)的復(fù)雜性,卡口之間的交通流受時間和空間兩個維度的影響,出現(xiàn)延遲的現(xiàn)象時有發(fā)生,在圖4(a)中,可以觀察到兩個卡口的時間序列在7:05~7:30出現(xiàn)了平移現(xiàn)象,而在7:45~8:00出現(xiàn)了拉伸現(xiàn)象。
時間序列數(shù)據(jù)的降維處理雖然能夠提取出關(guān)鍵特征,但這些特征序列往往依舊保留著非線性的時間扭曲特性。此外,由于傳感器故障、數(shù)據(jù)采集誤差或偶發(fā)的交通事件,某些特征值可能會異常飆升,形成異常高峰。在這種情況下,傳統(tǒng)的歐氏距離度量方法會受到較大影響,因?yàn)樗鼰o法區(qū)分正常波動與異常峰值。
與此相對,GCDTW算法通過選擇性地繞過這些異常點(diǎn),能夠更有效地適應(yīng)數(shù)據(jù)中的噪聲和突發(fā)事件。GCDTW算法的核心優(yōu)勢在于其動態(tài)路徑選擇機(jī)制,它允許算法在比較兩個時間序列時,靈活地調(diào)整時間軸,從而最小化噪聲和突發(fā)事件的負(fù)面影響。這種獨(dú)特的動態(tài)調(diào)整能力使得GCDTW算法在處理含有噪聲和異常值的時間序列數(shù)據(jù)時,展現(xiàn)出更高的魯棒性和適應(yīng)性。因此,本文采用GCDTW計算相似度,以更好地反映交通流時間序列之間的真實(shí)相似程度。
2.1.2 時間序列的空間關(guān)聯(lián)性分析
本文的目標(biāo)是通過給定的路段卡口信息、路段長度和卡口“禁左”信息來提取卡口空間特征。為了實(shí)現(xiàn)這一目標(biāo),本文將路段作為節(jié)點(diǎn)對路網(wǎng)進(jìn)行建模,并運(yùn)用迪杰斯特拉算法計算真實(shí)場景下卡口間的最短路徑。
1)路網(wǎng)建模
建立以路段為節(jié)點(diǎn)的路網(wǎng)拓?fù)浣Y(jié)構(gòu)如圖5(c)所示,將其描述為一個帶有權(quán)重的有向圖結(jié)構(gòu)G=(V,E,W),其中V為節(jié)點(diǎn)集,每個節(jié)點(diǎn)代表一個路段;E為圖的邊集,每個邊表示節(jié)點(diǎn)之間的連接關(guān)系;W為邊的權(quán)重即距離。特別是對于卡口2,由于其東西方向?qū)嵤┝恕敖棺筠D(zhuǎn)”的交通管制措施,在有向圖中對1號節(jié)點(diǎn)和7號節(jié)點(diǎn)相連的邊賦予了一個非常大但有限的權(quán)重值(圖5(c)中的虛線部分)。這樣可以保留邊的物理存在,同時確保在正常的交通分析中這些邊不會被考慮。如果交通管制措施取消,該權(quán)重可以自動或手動調(diào)整到新的水平。通過這種方式,有向圖G不僅能夠反映路網(wǎng)的物理結(jié)構(gòu),還包含了交通規(guī)則,為時間序列的空間關(guān)聯(lián)性分析提供了更加全面的視角。
2)Dijkstra最短路徑計算
迪杰斯特拉(Dijkstra)[16]是一種經(jīng)典的最短路徑算法,用于計算一個節(jié)點(diǎn)到其他節(jié)點(diǎn)的最短路徑。其主要特點(diǎn)是以起始點(diǎn)為中心,逐層向外擴(kuò)展(類似廣度優(yōu)先遍歷),直到擴(kuò)展到終點(diǎn)為止。本文利用路段長度作為邊的權(quán)重,以在計算最短路徑時考慮道路的實(shí)際距離。如圖6所示,由于卡口2實(shí)施了“禁止左轉(zhuǎn)”的交通管制措施,導(dǎo)致卡口1和4之間的實(shí)際通行路徑存在差異:從卡口4到1的最短路徑為837 m,而從卡口1到4的最短路徑則為513 m。
2.1.3 特征矩陣加權(quán)融合
特征矩陣D1、D2分別為歸一化后的時序特征矩陣和卡口最短路徑矩陣的描述。設(shè)特征矩陣D1、D2對應(yīng)的權(quán)重分別為w1和w2,目標(biāo)是最大化輪廓系數(shù)S,最小化聚類的損失函數(shù)Lsc:
Lsc=-S(6)
該損失函數(shù)基于聚類質(zhì)量指標(biāo)輪廓系數(shù)的效果來評估,使用梯度下降法更新權(quán)重,更新規(guī)則如下所示。
w(t+1)1=w(t)1-a?Lsc?w1
w(t+1)2=w(t)2-a?Lsc?w2(7)
其中:a是學(xué)習(xí)率;t表示迭代次數(shù)。偏導(dǎo)數(shù)可以反映出微調(diào)權(quán)重w1和w2時,損失函數(shù)Lsc的變化情況。期望最小化損失函數(shù),即期望損失函數(shù)對權(quán)重的變化率為負(fù)數(shù)。如果增加w1或w2會使損失函數(shù)減少,那么就應(yīng)該增加它們的值,反之亦然。加權(quán)融合后得到特征矩陣D′:
D′=w1·D1+w2·D2(8)
2.1.4 K-means++聚類
在交通流時間序列聚類中,K-means++[17]展現(xiàn)了獨(dú)特的優(yōu)勢。相比其他聚類算法,K-means++在處理大規(guī)模交通流數(shù)據(jù)時具有更高的計算效率,尤其是在初始中心選擇方面,其改進(jìn)的機(jī)制可以更好地捕捉交通流模式,減少隨機(jī)初始化帶來的誤差。層次聚類雖然能夠捕捉交通流的層次結(jié)構(gòu),但計算復(fù)雜度較高且難以擴(kuò)展至大規(guī)模數(shù)據(jù)。相比之下,K-means++能夠在保持聚類質(zhì)量的同時,處理大量交通流時間序列數(shù)據(jù)。此外,盡管DBSCAN[18]能識別不同形狀的流量模式,并處理噪聲數(shù)據(jù),但其參數(shù)調(diào)整較為復(fù)雜,而K-means++則提供了更為直觀和穩(wěn)定的結(jié)果。在與高斯混合模型的比較中,盡管GMM[19]在處理不同流量形態(tài)時表現(xiàn)良好,但其計算復(fù)雜度較高,K-means++則在識別和分析交通流中的相似模式時更加高效和適用。因此,在交通流時間序列聚類中,K-means++是一種平衡效率和效果的理想選擇。
K-means++是傳統(tǒng)K-means聚類算法的改進(jìn)版本,其主要改進(jìn)之處在于初始化聚類中心的方式,將距離的平方作為概率分布選擇下一個聚類中心,從而提高了聚類結(jié)果的質(zhì)量并加速收斂速度。這個概率分布定義如下:
P(x(i))=D(x(i),C)2∑nj=1D(x(j),C)2(9)
其中:C為聚類中心集合;D(x(i),C)表示時間序列x(i)到聚類中心的最短距離;∑nj=1D(x(j),C)2是所有時間序列到最近聚類中心的距離平方和的總和。
在時序特征距離矩陣和卡口最短路徑距離矩陣進(jìn)行加權(quán)融合后,K-means++聚類算法步驟描述如下:
算法2 K-means++聚類算法
輸入:由滑動窗口生成的訓(xùn)練樣本x(i)、加權(quán)融合后的距離矩陣D′。
輸出:聚類標(biāo)簽,每簇質(zhì)心。
a) 初始化聚類中心
b) 隨機(jī)選擇一個時間序列x(i)作為第一個聚類中心
c) while 聚類中心lt;k do
d)
根據(jù)D′計算每個時間序列到最近的聚類中心C的距離
e)
根據(jù)式(8)計算概率分布P(x(i))選擇新的聚類中心
f) end while
g) 初始化聚類標(biāo)簽
h) while 不收斂 do
i)
for 每個時間序列 do
j) 分配每個時間序列到最近的聚類中心
k) end for
l)
for 每個聚類中心 do
m) 重新計算每個聚類中心
n) end for
o) end while
p) return聚類標(biāo)簽,每簇質(zhì)心x(k)trend
2.2 流量預(yù)測
為了同時捕捉交通流時間序列的時空依賴性,本文設(shè)計了一種如圖7所示的流量預(yù)測模型結(jié)構(gòu)。該模型首先通過圖卷積網(wǎng)絡(luò)提取每個路段的特征。隨后,根據(jù)卡口-路段的映射關(guān)系,將屬于同一卡口的多個路段的特征進(jìn)行聚合。接著,依據(jù)聚類結(jié)果將特征分離。最后,將包含空間信息的時序數(shù)據(jù)與每簇質(zhì)心融合,一并輸入到雙向門控循環(huán)單元中進(jìn)行處理,從而得到最終的預(yù)測結(jié)果。
2.2.1 路網(wǎng)特征提取
本文使用圖卷積網(wǎng)絡(luò)提取整個路網(wǎng)的全局空間特征:
Hglobal=GCN(G,X)(10)
其中:G表示有向圖結(jié)構(gòu);X表示特征矩陣。
根據(jù)卡口-路段的映射關(guān)系,將屬于同一個卡口的多個路段的特征進(jìn)行聚合。卡口集合為Φ={x(i)}Nsect,每個卡口x(i)包含的路段集合為Li:
HLi=aggregate (Hglobal[Li])(11)
其中:Hglobal[Li]表示從全局特征Hglobal中提取的屬于卡口x(i)的路段特征,aggregate 表示聚合操作。
最后,將卡口級別的特征按簇分離,每簇數(shù)據(jù)為包含空間信息的時序數(shù)據(jù)。
2.2.2 特征融合
為了有效地將不同的交通流量模式納入流量預(yù)測模型,本文采取了一種新的方法:將每個流量模式簇的質(zhì)心作為特征x(k)trend,并將其融合到相應(yīng)的流量預(yù)測模型中,與包含空間信息的時序數(shù)據(jù)進(jìn)行ADD加法操作,以生成更加豐富和高維的特征表示。
這一方法的核心思想是利用每個交通模式簇的質(zhì)心x(k)trend來代表該簇的整體特征,進(jìn)而提高了流量預(yù)測模型的準(zhǔn)確性和泛化能力。
2.2.3 模型共享
在對卡口進(jìn)行聚類后,每個簇都由具有相似特征的卡口組成。為了學(xué)習(xí)它們的共同特征并加快預(yù)測速度,可以應(yīng)用模型共享的思想。具體而言,使用雙向門控循環(huán)單元(bidirectional gated recurrent unit,BiGRU)模型來分析每個簇的歷史數(shù)據(jù)。BiGRU模型相比傳統(tǒng)的RNN更有效,因?yàn)樗肓穗p向性,能夠同時從過去和未來的上下文中學(xué)習(xí)信息。該模型由兩個門控循環(huán)單元(gated recurrent unit,GRU)[20]層組成,一個按正向順序處理輸入序列,另一個按逆向順序處理輸入序列。GRU單元通過更新門、重置門和隱藏狀態(tài)協(xié)同工作,捕獲序列中的依賴關(guān)系。
模型共享意味著每個簇使用相同的BiGRU模型,將同簇的卡口數(shù)據(jù)輸入到相應(yīng)的模型中進(jìn)行預(yù)測。這樣做的好處是,減少了輸入數(shù)據(jù)的維度,并且每個模型只需要處理特定簇的數(shù)據(jù),從而大大加快了預(yù)測速度。通過聚類降低了輸入數(shù)據(jù)的維度,并應(yīng)用模型共享的思想,既能加快BiGRU模型的預(yù)測速度,又能學(xué)習(xí)到同簇卡口的共同特征。深度聚類和流量預(yù)測整體算法如算法3所示。
算法3 DTCTFP算法
輸入:所有卡口連續(xù)5周歷史交通流時間序列數(shù)據(jù)x(i)Nhist。
輸出:所有卡口未來流量值x(i)Npred。
a) 執(zhí)行算法1獲得交通流低維度表示y(i)
b) 執(zhí)行GCDTW算法計算序列間的距離得到時序特征矩陣D1
c) 執(zhí)行Dijkstra算法構(gòu)建卡口最短路徑矩陣D2
d) 根據(jù)式(7)進(jìn)行矩陣加權(quán)融合得到D′
e) 執(zhí)行算法2得到聚類標(biāo)簽,每簇質(zhì)心x(k)trend
f) for 聚類標(biāo)簽=1 to k do
g)
根據(jù)聚類標(biāo)簽劃分每簇數(shù)據(jù)
h) end for
i) for i=1 to N do
j)
每簇模型訓(xùn)練,預(yù)測
k)
計算損失
l)
基于Adam方法,反向傳播更新網(wǎng)絡(luò)模型
m) end for
n) return x(i)Npred
3 實(shí)驗(yàn)
3.1 實(shí)驗(yàn)?zāi)康?/p>
本章圍繞以下問題進(jìn)行實(shí)驗(yàn)驗(yàn)證:
a)RQ1:針對挑戰(zhàn)1,3.3節(jié)的實(shí)驗(yàn)通過結(jié)合交通流數(shù)據(jù)和包含實(shí)際交通組織信息的路網(wǎng)拓?fù)浣Y(jié)構(gòu),利用深度聚類方法,區(qū)分出具有不同時空相關(guān)性的交通模式。驗(yàn)證了該方法能夠有效識別不同交通模式,并揭示了在不同時空條件下的交通流量變化規(guī)律。
b)RQ2:針對挑戰(zhàn)2,為了驗(yàn)證包含實(shí)際交通組織信息的路網(wǎng)拓?fù)鋵︻A(yù)測的影響,3.4節(jié)的實(shí)驗(yàn)對比了兩種統(tǒng)計模型、兩種僅考慮時間依賴關(guān)系的模型,以及四種使用簡化路網(wǎng)拓?fù)鋪聿蹲綍r空依賴關(guān)系的模型,驗(yàn)證了包含實(shí)際路網(wǎng)的方法具有最優(yōu)的預(yù)測效果。
c)RQ3:針對挑戰(zhàn)3,為了滿足交通預(yù)測的實(shí)時性需求,3.4.2節(jié)的實(shí)驗(yàn)比較了所有模型在每輪運(yùn)行中的耗時情況。驗(yàn)證了不同模型在處理交通流數(shù)據(jù)時的效率差異,最終確定最佳模型為DTCTFP。
d)RQ4:為了測試各個模塊的有效性,3.5節(jié)的實(shí)驗(yàn)設(shè)計了多種變體進(jìn)行消融實(shí)驗(yàn)。驗(yàn)證了各個模塊在整個系統(tǒng)中的貢獻(xiàn),特別是聚類結(jié)果對預(yù)測準(zhǔn)確性的顯著提升。
3.2 實(shí)驗(yàn)設(shè)計
1)交通流時間序列的獲取和設(shè)計
本文使用的交通數(shù)據(jù)集來自重慶市大渡口區(qū),其路網(wǎng)拓?fù)浜蚐UMO路網(wǎng)如圖8所示。該區(qū)域由203個交通卡口組成,卡口檢測器記錄2023年7月3日~2023年12月31日每天7:00~9:00的交通數(shù)據(jù),原始數(shù)據(jù)如表1所示,其中包含檢測器ID、車輛車牌號(已脫敏)、車輛通過時間。通過對卡口原始數(shù)據(jù)進(jìn)行預(yù)處理和結(jié)構(gòu)化,轉(zhuǎn)換成卡口流量數(shù)據(jù),具體操作如表2所示。處理后的流量數(shù)據(jù)包含檢測器ID、通過時間、交通流量三種屬性(表3)。最后通過檢測器-卡口對照表進(jìn)行匹配。
2)SUMO路網(wǎng)的獲取和設(shè)計
重慶市大渡口區(qū)SUMO路網(wǎng)如圖8所示,利用路網(wǎng)對應(yīng)的.xml文件,獲取卡口之間的空間關(guān)系,以便后續(xù)構(gòu)建有向圖和距離矩陣。
3)實(shí)驗(yàn)參數(shù)設(shè)計
歷史數(shù)據(jù)的完整程度對流量預(yù)測的準(zhǔn)確性至關(guān)重要??诟鶕?jù)交通狀況聚類成簇,因此缺失的數(shù)據(jù)會嚴(yán)重影響聚類結(jié)果。為了在實(shí)驗(yàn)中綜合考慮復(fù)雜性和數(shù)據(jù)完整性,選擇了缺失率低于10%的卡口進(jìn)行實(shí)驗(yàn),共計58個卡口符合條件。
在深度聚類模塊中,考慮到交通流的動態(tài)性和不確定性,本文滑動窗口的大小設(shè)置為1 008,即連續(xù)6周每天7:00~9:00時間粒度為5 min的流量數(shù)據(jù),將時間步設(shè)置為1周。CNN層的卷積核數(shù)量為50,每個卷積核大小為10;BiLSTM層的濾波器數(shù)量為50;deconvolution層的卷積核大小為10。自編碼器采用SGDM優(yōu)化器,momentum參數(shù)設(shè)置為0.9;學(xué)習(xí)率為0.01;batch_size大小為256;K-means++聚類方法由Python 3.9.18中的Scikit-learn包實(shí)現(xiàn);訓(xùn)練模型直到聚類變化小于0.1%或訓(xùn)練輪數(shù)超過50輪為止。
在流量預(yù)測模塊中,數(shù)據(jù)集為連續(xù)26周粒度為5 min的流量數(shù)據(jù),將數(shù)據(jù)集按照6∶2∶2的比例分為訓(xùn)練集、驗(yàn)證集、測試集,采用min-max歸一化將歷史交通流量的值縮放到[-1,1],以提高搜索最優(yōu)解的梯度下降速度。在測試階段將輸入數(shù)據(jù)歸一化,然后將輸出重新縮放到原始比例。batch_size大小為256;選擇LeakyReLU作為非線性激活函數(shù);優(yōu)化器是Adam算法;學(xué)習(xí)率設(shè)置為0.001。實(shí)驗(yàn)在PyTorch平臺上進(jìn)行,使用Intel? Xeon? Gold 5120, 2.20 GHz CPU, 128 GB RAM和GeForce RTX 3090 24 GB GPU。
4)評價指標(biāo)設(shè)計
為驗(yàn)證聚類的有效性,本文采用輪廓系數(shù)(silhouette coefficient,SC)[21]作為評價指標(biāo),對于每個樣本i,具體的計算公式為
S(i)=b(i)-a(i)max{a(i),b(i)}(12)
其中:a(i)代表樣本i與其所屬簇內(nèi)其他樣本的平均距離;b(i)代表樣本i與最近的一個簇中所有樣本的平均距離。
為驗(yàn)證提出預(yù)測模型的有效性,本文采用平均絕對誤差(mean absolute error,MAE)、均方根誤差(root mean square error, RMSE)和平均絕對百分比誤差(mean absolute percentage error, MAPE)作為評價指標(biāo), 具體的計算公式如下:
MAE(yi,i)=1N∑Ni=1|yi-i|(13)
RMSE(yi,i)=1N∑Ni=1(yi-i)2(14)
MAPE(yi,i)=1N∑Ni=1|yi-i|yi(15)
其中:N為樣本的數(shù)量;yi為真實(shí)值;i為預(yù)測值。
3.3 卡口聚類(RQ1)
首先,利用GCDTW算法計算了六周時間序列數(shù)據(jù)的對齊差異,作為相似性的衡量。接著,采用Dijkstra算法計算了已篩選卡口之間的最短路徑,并對得到的兩個特征矩陣進(jìn)行了歸一化處理。本文繪制了熱力圖,以直觀展示距離值的分布情況,在熱力圖中,距離值較小的區(qū)域呈現(xiàn)藍(lán)色,而距離值較大的區(qū)域呈現(xiàn)紅色(見電子版)。圖9顯示了58個卡口交通流對象的特征,熱力圖層次分明,揭示了交通流對象的一些特征之間的相關(guān)性,同時也顯示了其他特征之間顯著的差異。而圖10則顯示了卡口之間的最短路徑,結(jié)果顯示,這些卡口之間的距離大多臨近,一部分卡口之間的距離較遠(yuǎn)或者受到交通管制措施的影響。為確保時間相關(guān)性和空間相關(guān)性兩個維度的信息都得到充分考慮,本文將對兩個矩陣的初始權(quán)重均設(shè)置為0.5,并進(jìn)行加權(quán)平均融合,減輕單個特征矩陣可能帶來的誤差和噪聲,如圖11是融合后的矩陣。結(jié)果顯示,通過特征矩陣融合,潛在特征被增強(qiáng),而異常值則被平滑處理。通過加強(qiáng)潛在特征,模型能夠更好地捕捉數(shù)據(jù)中的細(xì)微變化,從而提高了對于復(fù)雜模式交通模式的識別能力。同時,對于異常值的平滑處理則有助于減少模型在噪聲或異常數(shù)據(jù)點(diǎn)上的過度擬合,使模型更加穩(wěn)健和可靠。
其次,使用K-means++算法結(jié)合加權(quán)融合后的距離矩陣,對58個卡口進(jìn)行聚類分析。通過輪廓系數(shù)法,計算聚類數(shù)為2~10的輪廓系數(shù),觀察到數(shù)值從聚類數(shù)為2時的0.63上升至聚類數(shù)為3時的0.77,然后持續(xù)下降,如圖12所示。
基于這一觀察,確定了最佳的聚類數(shù)為3,并繪制出每個簇的時間序列,使用黑色虛線來標(biāo)示每個類的質(zhì)心,如圖13所示。
根據(jù)圖13的聚類結(jié)果,對聚類進(jìn)行可視化呈現(xiàn)(圖14),結(jié)合對路網(wǎng)結(jié)構(gòu)的分析,可以得出以下結(jié)論:
cluster 1:如圖13(a)所示,早高峰時段流量波動顯著,容易出現(xiàn)高峰值。該類卡口位于車流量大且容易發(fā)生擁堵的區(qū)域,通常是住宅區(qū)、學(xué)校和醫(yī)院等人口密集的區(qū)域。
案例1:卡口24212位于雙城路與雙山路的交叉口。雙城路為南北方向雙向2車道,雙山路為東西方向雙向4車道。附近有3所學(xué)校和密集的住宅區(qū),早高峰時段車流量大且人員復(fù)雜,容易擁堵。
cluster 2:如圖13(b)所示,早高峰時段流量大但波動較小,流量變化較為平穩(wěn)。該類卡口的車流量大但變化規(guī)律性較強(qiáng),通常位于交通干道和公交線路多的區(qū)域。
案例2:卡口31874位于春暉路與翠華路的交叉口。春暉路為南北方向雙向6車道,翠華路為東西方向雙向2車道。附近有多條公交線路,且靠近青峰隧道,車流多數(shù)為東西方向,流量較為規(guī)律。
cluster 3:如圖13(c)所示,流量變化受到一定程度的波動影響,但總體相對穩(wěn)定。該類卡口車流方向單一,流量波動有限。
案例3:卡口25836位于翠園路與湖榕路交叉口,這是一個丁字形路口。翠園路為東西方向雙向4車道,湖榕路為雙向4車道但只有南段通車。盡管位于立交橋附近,但車流方向簡單,波動有限。
真實(shí)卡口如圖15所示。
3.4 短時交通流量預(yù)測網(wǎng)絡(luò)(RQ2、RQ3)
3.4.1 基準(zhǔn)模型
為了驗(yàn)證DTCTFP的有效性,本文將與以下交通流量預(yù)測方法進(jìn)行比較,其中,前四種為基準(zhǔn)模型,后四種為近年來學(xué)者根據(jù)交通流量預(yù)測需求改進(jìn)的圖卷積神經(jīng)網(wǎng)絡(luò)模型。
a)ARIMA[22]:自回歸綜合移動平均模型,利用歷史數(shù)據(jù)中的均值和趨勢來預(yù)測未來時間片的交通流量值。
b)SVR[23]:支持向量回歸模型,可以處理非線性關(guān)系,并在高維空間中構(gòu)建線性或非線性回歸模型。
c)GRU[24]:門控循環(huán)單元,是一種類似于LSTM的變體,與LSTM相比,GRU具有更簡單的結(jié)構(gòu),但通常能夠取得與LSTM相當(dāng)甚至更好的效果。
d)Transformer[25]:以自注意力機(jī)制為基礎(chǔ),能夠有效地建模序列數(shù)據(jù)中的長距離依賴關(guān)系。
e)DCRNN[26]:擴(kuò)散卷積遞歸神經(jīng)網(wǎng)絡(luò),通過圖卷積捕捉交通網(wǎng)絡(luò)中的空間依賴關(guān)系,利用遞歸神經(jīng)網(wǎng)絡(luò)處理時間依賴關(guān)系,該模型在同時涉及空間和時間關(guān)聯(lián)的交通流量預(yù)測中表現(xiàn)出色。
f)STGCN[8]:時空圖卷積網(wǎng)絡(luò),將GCN與時間卷積網(wǎng)絡(luò)結(jié)合起來,同時建模交通數(shù)據(jù)中的空間和時間依賴關(guān)系。這種雙重建模方法使得STGCN能夠更準(zhǔn)確地預(yù)測交通流量,充分考慮了空間和時間的動態(tài)變化。
g)ASTGCN[27]:基于注意力的時空圖卷積網(wǎng)絡(luò),在STGCN的基礎(chǔ)上引入了注意力機(jī)制。通過自適應(yīng)地分配不同節(jié)點(diǎn)和時間步的權(quán)重,ASTGCN能夠更精準(zhǔn)地捕捉重要的空間和時間特征,提升預(yù)測性能。
h)ASTGNN[28]:基于注意力的時空圖神經(jīng)網(wǎng)絡(luò),是一種綜合了注意力機(jī)制和圖神經(jīng)網(wǎng)絡(luò)的模型,通過動態(tài)調(diào)整不同時間步和空間節(jié)點(diǎn)的權(quán)重,實(shí)現(xiàn)對時空數(shù)據(jù)的高效建模和預(yù)測。
3.4.2 實(shí)驗(yàn)結(jié)果與分析
本文在重慶市大渡口數(shù)據(jù)集上驗(yàn)證了DTCTFP模型。表4顯示了本文模型與基線方法在真實(shí)數(shù)據(jù)集上對未來30 min、1 h和2 h的平均預(yù)測結(jié)果,圖16顯示了預(yù)測未來30 min時滑動窗口大?。J(rèn)為6周)對于預(yù)測結(jié)果的影響。結(jié)果表明,DTCTFP模型在所有實(shí)驗(yàn)中均勝過了基線模型。針對未來30 min交通流量的預(yù)測,該模型在MAE、RMSE和MAPE三個指標(biāo)上相較ASTGNN模型,分別提升了12.09%、11.98%和8.14%;對于未來1 h和2 h的交通流量預(yù)測,相比ASTGNN模型,性能提升分別達(dá)到了12.2%、9.81%、14.85%和14.82%、7.15%、6.3%。
表4的結(jié)果表明,傳統(tǒng)統(tǒng)計模型ARIMA、SVR可能難以捕捉交通流中復(fù)雜的非線性關(guān)系。相比之下,基于深度學(xué)習(xí)的方法在長期預(yù)測方面通常表現(xiàn)更優(yōu)。這是因?yàn)殡S著預(yù)測視野的增加,時間依賴性變得越來越非線性,而深度學(xué)習(xí)模型能夠更好地處理這種非線性關(guān)系?;赗NN變體的GRU以及利用encoder-decoder結(jié)構(gòu)的Transformer模型則具有不同的優(yōu)勢。前者適合處理交通流中的長期依賴關(guān)系,而后者能夠并行處理整個序列,從而在效率上有很大提升。以上四種模型僅僅考慮了交通流的時間依賴關(guān)系,而忽略了城市卡口之間的空間關(guān)系以及全局信息。在引入GCN以捕捉時間序列的空間依賴性后,預(yù)測性能相較于傳統(tǒng)的時間序列預(yù)測模型有了進(jìn)一步提升。然而,DCRNN、STGCN、ASTGCN 和ASTGNN這些模型在捕捉時間序列的空間關(guān)聯(lián)性時,都依賴于簡化的路網(wǎng)拓?fù)?。對于充滿交通標(biāo)志和交通管制措施的城市路網(wǎng)來說,這種圖結(jié)構(gòu)往往無法充分反映真實(shí)的路網(wǎng)情況。
在對比DTCTFP與其他模型預(yù)測未來2 h每輪耗時以及總耗時表現(xiàn)時,DTCTFP在復(fù)雜性與時間效率之間找到了理想的平衡點(diǎn)。與非圖結(jié)構(gòu)的深度學(xué)習(xí)模型(如Transformer)相比,DTCTFP提供了更優(yōu)的預(yù)測性能,同時在耗時方面也優(yōu)于更復(fù)雜的時空圖卷積模型(如ASTGCN和ASTGNN)。由于DTCTFP能夠顯著減少計算時間,它在實(shí)際應(yīng)用中更具可操作性,尤其是在實(shí)時性要求較高的交通流量預(yù)測中。無論是處理大規(guī)模數(shù)據(jù)集,還是應(yīng)對頻繁的模型更新需求,DTCTFP都展現(xiàn)了出色的適應(yīng)性。這種優(yōu)勢使其成為應(yīng)對突發(fā)交通狀況或進(jìn)行動態(tài)調(diào)度預(yù)測的理想工具。
本文介紹的DTCTFP模型利用具有交通組織信息的真實(shí)路網(wǎng),通過挖掘卡口間的時空相關(guān)性,提出模型共享的策略,針對各種交通模式建立了預(yù)測模型,在訓(xùn)練時間和預(yù)測精度方面都取得了良好的效果。
圖16中顯示了滑動窗口大小對于預(yù)測精度的影響。結(jié)果表明,隨著滑動窗口尺寸從4周增加到8周,模型對于卡口交通流時間依賴關(guān)系的捕捉能力逐漸增強(qiáng)。增大的滑動窗口使模型更容易發(fā)現(xiàn)交通流潛在的趨勢和周期性。然而,隨著滑動窗口進(jìn)一步增大,模型開始過度關(guān)注較遠(yuǎn)的歷史數(shù)據(jù),而忽略了更近期的信息。這種情況導(dǎo)致模型的響應(yīng)速度變慢,因?yàn)榇翱诟采w的歷史數(shù)據(jù)較長。當(dāng)數(shù)據(jù)發(fā)生突變或者趨勢發(fā)生變化時,模型需要更長的時間來反應(yīng)并進(jìn)行適應(yīng),從而導(dǎo)致預(yù)測結(jié)果的延遲。因此,在選擇滑動窗口大小時,需要權(quán)衡預(yù)測性能和模型響應(yīng)速度之間的關(guān)系,以獲得更準(zhǔn)確和穩(wěn)定的預(yù)測結(jié)果。
3.4.3 預(yù)測結(jié)果與可視化
為了更生動地展示模型的預(yù)測性能,本文從深度聚類得到的三簇中分別選取一個卡口,并通過可視化展示了未來2 h交通流量的預(yù)測結(jié)果(圖17)。結(jié)果顯示,DTCTFP在各個卡口中展現(xiàn)了出色的預(yù)測性能,驗(yàn)證了本文通過深度聚類挖掘城市卡口的時空相關(guān)性,結(jié)合模型共享策略進(jìn)行未來交通流量預(yù)測方法,可實(shí)現(xiàn)對復(fù)雜城市卡口的實(shí)時流量預(yù)測。
3.5 消融實(shí)驗(yàn)(RQ4)
為了更深入地驗(yàn)證DTCTFP模型中各個組成模塊的有效性,本文在重慶市大渡口區(qū)的數(shù)據(jù)集上進(jìn)行了消融實(shí)驗(yàn),結(jié)果如表5所示。
從消融實(shí)驗(yàn)結(jié)果可以看出,逐步引入模型中的各個模塊確實(shí)對預(yù)測性能有著積極的影響。首先,與傳統(tǒng)的單向GRU相比,使用BiGRU能夠在MAE和RMSE指標(biāo)上實(shí)現(xiàn)一定程度的降低,這表明雙向信息的引入有助于提高模型的預(yù)測準(zhǔn)確性。引入GCN后,預(yù)測性能進(jìn)一步提升,表明GCN對于提高模型的泛化能力和對交通流時間依賴、卡口空間信息的捕獲具有重要作用。而加入深度聚類DTC后,指標(biāo)再次有所下降,這進(jìn)一步驗(yàn)證了深度聚類在模型性能提升中的重要性,它使得模型能夠準(zhǔn)確識別和利用交通流的時空模式,聚類顯著提升了預(yù)測的準(zhǔn)確性。實(shí)驗(yàn)對不使用滑動窗口的DTCTFP進(jìn)行測試,結(jié)果顯示它的性能略低于使用滑動窗口的版本,這表明滑動窗口的引入對于提高模型的預(yù)測性能也是必要的,它能動態(tài)地捕捉交通流數(shù)據(jù)的變化,同時控制歷史數(shù)據(jù)的數(shù)量。最終,采用了DTCTFP模型后,預(yù)測性能得到了最大程度的提升,MAE、RMSE、MAPE指標(biāo)均有顯著降低,表明動態(tài)時空特征融合在模型中的應(yīng)用具有顯著的優(yōu)勢,有效提高了模型的預(yù)測準(zhǔn)確性。因此,通過這些實(shí)驗(yàn)結(jié)果,可以驗(yàn)證DTCTFP模型中各個模塊的有效性,以及它們相互融合后對模型性能的綜合提升。
4 結(jié)束語
城市卡口的多樣性和異質(zhì)性使得短時交通流量預(yù)測成為一個具有挑戰(zhàn)性和重要意義的問題,本文提出了一種用于大規(guī)模城市卡口短時交通流量預(yù)測的深度學(xué)習(xí)模型DTCTFP。該模型的關(guān)鍵在于深度時序聚類和流量預(yù)測的結(jié)合,以及模型共享策略。在重慶市大渡口區(qū)的真實(shí)卡口數(shù)據(jù)上對所提出的模型進(jìn)行了評估,DTCTFP優(yōu)于現(xiàn)有方法。在未來工作中,將進(jìn)一步探索卡口在路網(wǎng)中的局部特征以及它們與全局相關(guān)性之間的依賴關(guān)系,實(shí)現(xiàn)多視角下的城市卡口交通流量預(yù)測。
參考文獻(xiàn):
[1]Lyu Yisheng, Duan Yanjie, Kang Wenwen, et al. Traffic flow prediction with big data: a deep learning approach [J]. IEEE Trans on Intelligent Transportation Systems, 2015, 16(2): 865-873.
[2]Pang Junbiao, Huang Jing, Du Yong, et al. Learning to predict bus arrival time from heterogeneous measurements via recurrent neural network [J]. IEEE Trans on Intelligent Transportation Systems, 2019, 20(9): 3283-3293.
[3]杭菲璐, 郭威, 陳何雄, 等. 基于iForest和LOF的流量異常檢測 [J]. 計算機(jī)應(yīng)用研究, 2022, 39(10): 3119-3123. (Hang Feilu, Guo Wei, Chen Hexiong, et al. Network traffic anomaly detection based on iForest and LOF [J]. Application Research of Compu-ters, 2022,39(10): 3119-3123.)
[4]Abduljabbar R L, Dia H, Tsai T W. Unidirectional and bidirectional LSTM models for short-term traffic prediction [J]. Journal of Advanced Transportation, 2021, 2021: 1-16.
[5]Lesouple J, Baudoin C, Spigai M, et al. Generalized isolation forest for anomaly detection [J]. Pattern Recognition Letters, 2021, 149: 109-119.
[6]Diao Zulong, Wang Xin, Zhang Dafang, et al. Dynamic spatial-temporal graph convolutional neural networks for traffic forecasting [C]//Proc of AAAI Conference on Artificial Intelligence. 2019: 890-897.
[7]Fang Shen, Zhang Qi, Meng Gaofeng, et al. GSTNet-Global spatial-temporal network for traffic flow prediction [C]//Proc of International Joint Conference on Artificial Intelligence. San Francisco: Morgan Kaufmann, 2019: 2286-2293.
[8]Yu Bing, Yin Haoteng, Zhu Zhanxing. Spatio-temporal graph convolutional networks: a deep learning framework for traffic forecasting [C]//Proc of International Joint Conference on Artificial Intelligence. San Francisco: Morgan Kaufmann, 2018: 3634-3640.
[9]Defferrard M, Bresson X, Vandergheynst P. Convolutional neural networks on graphs with fast localized spectral filtering [C] //Proc of the 30th International Conference on Neural Information Processing Systems. Cambridge, CA: MIT Press, 2016: 3844-3852.
[10]Sun T Y. Research on urban traffic flow forecasting based on vector autoregression [M]. Beijing: Beijing Jiaotong University, 2022.
[11]Vlahogianni E I, Karlaftis M J, Golias J. Short-term traffic forecasting: where we are and where we’re going [J]. Transportation Research Part C: Emerging Technologies, 2014, 43: 3-19.
[12]Berndt D J, Clifford J. Using dynamic time warping to find patterns in time series [C]// Proc of the 3rd International Conference on Know-ledge Discovery and Data Mining. San Francisco: Morgan Kaufmann, 1994: 359-370.
[13]Kim J Y, Cho S B. Explainable prediction of electric energy demand using a deep autoencoder with interpretable latent space [J]. Expert Systems with Applications, 2021, 186: 115842.
[14]Mo Jiqian, Gong Zhiguo, Chen Junyang. Attentive differential convolutional neural networks for crowd flow prediction [J]. Knowledge-based systems, 2022, 258: 110006.
[15]Ma Changxi, Dai Guowen, Zhou Jibiao. Short-term traffic flow prediction for urban road sections based on time series analysis and LSTM_BILSTM method [J]. IEEE Trans on Intelligent Transportation Systems, 2022, 23(6): 5615-5624.
[16]Johnson D B. A note on Dijkstra’s shortest path algorithm [J]. Journal of the ACM, 1973, 20(3): 385-388.
[17]Arthur D, Vassilvitskii S. K-means++: the advantages of careful seeding [C]//Proc of ACM-SIAM Symposium on Discrete Algorithms. New York: ACM Press, 2007: 1027-1035.
[18]Schubert E, Sander J, Ester M, et al. DBSCAN revisited, revisited: why and how you should (still) use DBSCAN [J]. ACM Trans on Database Systems, 2017, 42(3): article No. 19.
[19]Chen Wenlong, Wang Xiaoling, Cai Zhijian, et al. DP-GMM clustering-based ensemble learning prediction methodology for dam deformation considering spatiotemporal differentiation [J]. Know-ledge-based systems, 2021, 222: 106964.
[20]Fu Rui, Zhang Zuo, Li Li. Using LSTM and GRU neural network methods for traffic flow prediction [C]//Proc of Youth Academic Annual Conference of Chinese Association of Automation. 2016: 324-328.
[21]Hidayati R, Zubair A, Pratama A H, et al. Analisis Silhouette coefficient pada 6 perhitungan Jarak K-means clustering [J]. IEEE Trans on Computers, 2021, 20(2): 186-197.
[22]Tedjopurnomo D A, Bao Zhifeng, Zheng Baihua, et al. A survey on modern deep neural network for traffic prediction: trends, methods and challenges [J]. IEEE Trans on Knowledge and Data Engineering, 2022, 34(4): 1544-1561.
[23]Xu Haibo, Jiang Chengshun. Deep belief network-based support vector regression method for traffic flow forecasting [J]. Neural Computing and Applications, 2019, 32(7): 2027-2036.
[24]Gao Shuai, Huang Yuefei, Zhang Shuo, et al. Short-term runoff prediction with GRU and LSTM networks without requiring time step optimization during sample generation [J]. Journal of Hydrology, 2020, 589:125188.
[25]周楚昊, 林培群. 基于多通道Transformer的交通量預(yù)測方法 [J]. 計算機(jī)應(yīng)用研究, 2023, 40(2): 435-439. (Zhou Chuhao, Lin Peiqun. Traffic flow prediction method based on multi-channel Transformer [J]. Application Research of Computers, 2023,40(2): 435-439.)
[26]Li Yaguang, Yu R, Shahabi C, et al. Diffusion convolutional recurrent neural network: data-driven traffic forecasting [EB/OL]. (2018-02-22). https://arxiv.org/abs/1707.01926.
[27]Guo Shengnan, Lin Youfang, Feng Ning, et al. Attention based spatial-temporal graph convolutional networks for traffic flow forecasting [C]//Proc of AAAI Conference on Artificial Intelligence. Palo Alto, CA: AAAI Press, 2019: 922-929.
[28]Guo Shengnan, Lin Youfang, Wan Huaiyu, et al. Learning dynamics and heterogeneity of spatial-temporal graph data for traffic forecasting [J]. IEEE Trans on Knowledge and Data Engineering, 2022, 34(11): 5415-5428.