劉小明,田玉林,唐少虎,尚春琳,魏 路
(1.北方工業(yè)大學(xué)城市道路交通智能控制技術(shù)北京市重點(diǎn)實(shí)驗(yàn)室,北京100043;2.北京聯(lián)合大學(xué)城市軌道交通與物流學(xué)院,北京100101)
近年來(lái),城市化進(jìn)程逐漸加快,交通需求快速增加,城市道路交通壓力不斷升高,交通信號(hào)主動(dòng)控制成為緩解城市交通問(wèn)題的重要手段之一,交通路網(wǎng)短時(shí)交通流預(yù)測(cè)是實(shí)現(xiàn)主動(dòng)優(yōu)化的關(guān)鍵.道路交通流預(yù)測(cè)是車輛路徑規(guī)劃的重要參考,可以幫助出行者做出更好的路徑選擇;對(duì)交通管理也起著較大作用,可以及時(shí)、主動(dòng)地將路網(wǎng)時(shí)間和空間資源進(jìn)行按需分配,提高交通出行效率及路網(wǎng)運(yùn)行的穩(wěn)定性.
交通流運(yùn)行具有明顯的復(fù)雜性和不確定性,獲取其準(zhǔn)確的預(yù)測(cè)結(jié)果有一定難度.國(guó)內(nèi)外學(xué)者對(duì)此進(jìn)行大量的研究和探索,取得一定的成果.廣泛使用的預(yù)測(cè)模型有:歷史平均模型、時(shí)間序列模型、狀態(tài)空間模型、神經(jīng)網(wǎng)絡(luò)模型、非參數(shù)回歸模型、支持向量機(jī)模型等[1],但多數(shù)模型是利用目標(biāo)路段的歷史交通流數(shù)據(jù),未能充分利用路網(wǎng)內(nèi)其他相關(guān)路段的交通流信息,對(duì)交通流傳輸特性參數(shù)提取不充分,會(huì)在一定程度上影響預(yù)測(cè)結(jié)果.
根據(jù)交通數(shù)據(jù)來(lái)源點(diǎn)位置不同,將交通流預(yù)測(cè)分為單斷面預(yù)測(cè)和多斷面預(yù)測(cè).單斷面交通流預(yù)測(cè)僅對(duì)本斷面的交通流特性進(jìn)行建模,忽略了路網(wǎng)中不同斷面之間的關(guān)聯(lián)信息,模型魯棒性通常較差,易受噪聲干擾.多斷面交通流預(yù)測(cè)利用干道流量關(guān)鍵點(diǎn)或路網(wǎng)相關(guān)聯(lián)斷面數(shù)據(jù),引入更加豐富的信息,有利于模型做出更加準(zhǔn)確的預(yù)測(cè).現(xiàn)有多斷面交通流預(yù)測(cè)方法基本是將表征路網(wǎng)結(jié)構(gòu)的空間信息和歷史時(shí)間信息作為網(wǎng)絡(luò)輸入,通過(guò)分析數(shù)據(jù)的時(shí)空特征,實(shí)現(xiàn)對(duì)不同斷面、不同時(shí)刻的數(shù)據(jù)融合,忽視了對(duì)不同斷面流量之間時(shí)延特性的建模.鄒東[2]利用交通流數(shù)據(jù)的時(shí)空相關(guān)性提出基于Elman神經(jīng)網(wǎng)絡(luò)算法.Wu[3]分別利用卷積神經(jīng)網(wǎng)絡(luò)和循環(huán)神經(jīng)網(wǎng)絡(luò)處理空間和時(shí)間信息.Lin[4]將大規(guī)模共享單車網(wǎng)絡(luò)建模成圖,利用圖卷積神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)節(jié)點(diǎn)需求.為加速神經(jīng)網(wǎng)絡(luò)的收斂速度并降低網(wǎng)絡(luò)學(xué)習(xí)難度,Dai[5]提出對(duì)數(shù)據(jù)進(jìn)行去趨勢(shì)的方法,將流量隨時(shí)間變化的趨勢(shì)及相對(duì)趨勢(shì)的變化進(jìn)行分離.
實(shí)際情況中,不同斷面之間往往相距一定距離,密切相關(guān)的斷面之間,流量特性在時(shí)間維度上存在很強(qiáng)的相似性,但也伴隨一定的時(shí)延,故忽視時(shí)延研究流量數(shù)據(jù)在時(shí)間和空間上的相似性是不完善的.對(duì)此,本文對(duì)不同斷面流量的時(shí)延特性進(jìn)行建模,在時(shí)間和空間維度上對(duì)數(shù)據(jù)段進(jìn)行相似性度量,對(duì)不同斷面數(shù)據(jù)進(jìn)行融合;挖掘不同斷面歷史數(shù)據(jù)中的有效信息,提升流量預(yù)測(cè)的精度.
交通流運(yùn)動(dòng)過(guò)程是包含隨機(jī)因素的復(fù)雜過(guò)程,增加了實(shí)現(xiàn)交通流實(shí)時(shí)預(yù)測(cè)的難度.時(shí)延特性針對(duì)目標(biāo)交通流經(jīng)過(guò)上下游多斷面的時(shí)間差展開(kāi),從微觀模型分析,車輛在路網(wǎng)中的運(yùn)動(dòng)形態(tài)分為連續(xù)交通流和非連續(xù)交通流.在路段中車輛以連續(xù)自由流的形式運(yùn)動(dòng),經(jīng)過(guò)有信號(hào)控制交叉口后,被分割成多股車流交替放行.如圖1路網(wǎng)所示,來(lái)自不同路段的車流經(jīng)過(guò)信號(hào)分隔以后,組成新的交通流進(jìn)行傳輸,多股交通流經(jīng)過(guò)上游斷面?zhèn)鬏數(shù)较掠螖嗝鏁r(shí),交通量的總量基本保持不變,即近似有QIN=QOUT,QIN表示上游三個(gè)斷面(斷面1、2、3)的流量和,QOUT表示下游斷面(斷面4)的流量和,而下游斷面的流量特性同上游多斷面間存在明顯時(shí)延.考慮到下游目標(biāo)斷面與上游多個(gè)斷面之間的流量關(guān)系可視為下游目標(biāo)斷面同上游各單斷面關(guān)系的疊加,為便于對(duì)上下游斷面的時(shí)延特性獲得直觀的感受,圖1路段中交通流傳輸示意圖簡(jiǎn)化分析上下游斷面間的流量關(guān)系,利用仿真數(shù)據(jù)通過(guò)曲線擬合建立流量隨時(shí)間變化情況.圖1中,t1,t2表示上游斷面主要交通流的經(jīng)過(guò)時(shí)刻,t3,t4表示對(duì)應(yīng)的交通流到達(dá)下游的時(shí)刻.
圖1 路段中交通流傳輸示意圖Fig.1 Diagram of traffic flow transmission
交通流在路段內(nèi)傳輸時(shí),車輛速度隨車流密度的增加而減小,引起傳輸時(shí)延的增加.由路段內(nèi)速度u(t)與密度k(t)隨時(shí)間t的變化關(guān)系及路段模擬數(shù)據(jù),采用曲線擬合的方式,擬合出目標(biāo)路段內(nèi)交通流傳輸時(shí)延與車輛密度的變化趨勢(shì)圖,如圖2所示,其中,df為自由流速度對(duì)應(yīng)的路段行駛時(shí)間.
式中:u(t),k(t)分別為路段速度、密度分布函數(shù);uf為自由流速度;kj為阻塞密度;li為路段i的長(zhǎng)度;ti,b,ti,e分別為車輛在路段i上進(jìn)入、駛出時(shí)刻;di為路段i上的時(shí)延.
圖2 路段中時(shí)延與密度變化趨勢(shì)圖Fig.2 Trend diagram of traffic flow transmission delay and vehicle density
從宏觀模型方面分析,交通流的傳播特性可以描述為包含交通流密度、速度、流量三者之間穩(wěn)態(tài)關(guān)系的交通流模型[6].對(duì)于路網(wǎng)而言,同質(zhì)性路網(wǎng)內(nèi)車輛密度(或路網(wǎng)內(nèi)車輛數(shù))和路網(wǎng)通行能力之間存在宏觀基本圖(Macroscopic Fundamental Diagram,MFD),如圖3 所示,其中,D(n)為路網(wǎng)內(nèi)車輛總傳輸時(shí)延隨密度變化的函數(shù),ncr為路網(wǎng)通行能力最大時(shí)對(duì)應(yīng)的路網(wǎng)內(nèi)車輛數(shù).n
式中:C(n)為路網(wǎng)通行能力;n為路網(wǎng)內(nèi)車輛數(shù);α、β、γ、η為模型待定系數(shù).
通過(guò)建立路網(wǎng)及相應(yīng)模擬數(shù)據(jù),采用曲線擬合的方式擬合出路網(wǎng)通行能力C(n)與路網(wǎng)總時(shí)延分布函數(shù)D(n)之間的變化趨勢(shì)關(guān)系,如圖3所示.
由上述分析可知,交通流傳輸時(shí)延與路段交通量密切相關(guān),僅考慮斷面距離、交通流排隊(duì)消散特性[7-9]等因素?zé)o法實(shí)現(xiàn)傳輸時(shí)延的精確描述.本文利用多斷面流量數(shù)據(jù),建立目標(biāo)交通流在運(yùn)動(dòng)過(guò)程中的動(dòng)態(tài)跟蹤模型,預(yù)測(cè)相近斷面間交通流傳輸?shù)淖罴褧r(shí)延,結(jié)合歷史數(shù)據(jù),對(duì)流量變化進(jìn)行學(xué)習(xí),改善交通流預(yù)測(cè)對(duì)數(shù)據(jù)本質(zhì)挖掘不足,引起動(dòng)態(tài)跟隨效果不理想的狀況,優(yōu)化基于時(shí)延特性的交通流預(yù)測(cè)效果.
圖3 路網(wǎng)中時(shí)延特性分布示意圖Fig.3 Distribution diagram of traffic flow transmission delay
不同斷面之間流量時(shí)延特性主要體現(xiàn)為流量在時(shí)間維度上的分布存在一定的延遲,即
式中:fa和fb分別表示斷面a和斷面b的流量隨時(shí)間的變化;d(t)表示兩斷面之間時(shí)延隨時(shí)間變化的函數(shù).
時(shí)延特性建模的相似性度量及流量初步預(yù)測(cè)過(guò)程如下:
首先,對(duì)輸入數(shù)據(jù)進(jìn)行切分和重組,捕捉目標(biāo)斷面流量和其他斷面流量之間潛在的時(shí)延特性.為描述各斷面某一時(shí)刻的短時(shí)流量,選取以當(dāng)前時(shí)刻為結(jié)束時(shí)刻,長(zhǎng)度為k的連續(xù)子序列作為此時(shí)該斷面的流量特征.子序列長(zhǎng)度選取需綜合考慮輸入數(shù)據(jù)的長(zhǎng)度及相似度比較的可靠性.對(duì)于確定長(zhǎng)度的輸入,選取較短的子序列能夠獲得對(duì)更長(zhǎng)時(shí)延范圍的建模,但會(huì)減弱相似性比較的魯棒性,使其易受到噪聲數(shù)據(jù)干擾.對(duì)于目標(biāo)斷面Si(i為該目標(biāo)斷面的序號(hào)),僅考慮其末尾時(shí)刻的流量特性,即
式中:fi(t)為斷面Si流量隨時(shí)間的函數(shù);T為輸入時(shí)間序列的末尾時(shí)刻.
對(duì)于其他斷面Sj(j為該斷面的序號(hào)),通過(guò)遍歷時(shí)延列表,對(duì)其數(shù)據(jù)進(jìn)行切分,得到不同時(shí)刻的短時(shí)流量特征為
然后,綜合余弦相似度和幅度相似度,建立目標(biāo)斷面末尾時(shí)刻與其他斷面各時(shí)刻短時(shí)流量描述之間的相似性度量矩陣S∈?()m-1×l,其中,m為斷面總數(shù),l為對(duì)每個(gè)斷面輸入進(jìn)行切分得到的子序列個(gè)數(shù).對(duì)任意的兩個(gè)短時(shí)流量特征a和b,定義他們之間的相似度為
對(duì)某一斷面不同時(shí)刻的流量數(shù)據(jù),選擇相似度最大的一個(gè)作為其同目標(biāo)斷面的最佳匹配,預(yù)測(cè)得到斷面Sj同目標(biāo)斷面Si流量數(shù)據(jù)的最佳時(shí)延為
為保證目標(biāo)斷面未來(lái)時(shí)刻流量預(yù)測(cè)在幅度上的合理性,對(duì)不同斷面的最佳匹配進(jìn)行能量歸一化,定義能量增益為
式中:E是集合中所有元素形成的列向量,代表各斷面與目標(biāo)斷面的最佳匹配子序列的能量,為斷面Sj在時(shí)刻的短時(shí)流量特征.通過(guò)能量增益對(duì)最佳相似度向量進(jìn)行能量歸一化,用于目標(biāo)斷面的流量預(yù)測(cè).能量歸一化后的最佳相似度向量為
對(duì)目標(biāo)斷面未來(lái)時(shí)刻的初步預(yù)測(cè)表示為
式中:Q為集合中所有元素構(gòu)成的列向量,表示不同斷面同目標(biāo)斷面最佳匹配時(shí)刻的下一時(shí)刻流量值表示斷面Sj在1 時(shí)刻的流量.
圖4 為本算法計(jì)算過(guò)程,斷面1 表示目標(biāo)斷面,斷面2 和3 為其臨近斷面.選擇子序列長(zhǎng)度為5,對(duì)斷面1的輸入數(shù)據(jù)進(jìn)行截取,將最后5個(gè)時(shí)刻作為目標(biāo)斷面的末尾時(shí)刻流量特性(斷面1中方框加粗的序列).將其他斷面的輸入數(shù)據(jù)以步長(zhǎng)為1,切分成長(zhǎng)度為5的子序列集,并與目標(biāo)斷面末尾流量序列進(jìn)行相似性度量.各斷面內(nèi)部選擇相似性最高的子序列(斷面2、3中方框加粗的序列),同時(shí)對(duì)各斷面的最大相似度進(jìn)行能量歸一化.利用歸一化后的相似度對(duì)各斷面最相似子序列的下一時(shí)刻流量(數(shù)字加粗的數(shù)據(jù))進(jìn)行加權(quán)求和,從而實(shí)現(xiàn)對(duì)目標(biāo)流量的初步預(yù)測(cè).
圖4 基于時(shí)延特性建模的相似性度量及流量初步預(yù)測(cè)示意圖Fig.4 Schematic diagram of similarity measurement and preliminary prediction
利用2.1 節(jié)中對(duì)目標(biāo)斷面流量的初步預(yù)測(cè)及原始數(shù)據(jù),構(gòu)建遞歸神經(jīng)網(wǎng)絡(luò)(RNN)模型獲得更加精確的預(yù)測(cè)值.在數(shù)據(jù)計(jì)算和學(xué)習(xí)過(guò)程中,由于交通流時(shí)延特性影響,序列的時(shí)間跨度使隱含層中記憶值較小,造成梯度消失問(wèn)題,本文將LSTM 單元引入RNN 鏈?zhǔn)浇Y(jié)構(gòu)中加強(qiáng)預(yù)測(cè)網(wǎng)絡(luò)的記憶能力.單層LSTM示意圖如圖5所示,其中,xt表示該層輸入的t時(shí)刻的數(shù)據(jù),ht表示該層輸入的t時(shí)刻的隱藏信息,σ和tanh 分別表示sigmoid 和tanh激活函數(shù).我們堆疊了3 層LSTM 網(wǎng)絡(luò).第1 層網(wǎng)絡(luò)的輸入為原始數(shù)據(jù)和初步預(yù)測(cè)值,其余各層網(wǎng)絡(luò)輸入為上一層的隱含層輸出.將初步預(yù)測(cè)得到的標(biāo)量直接串聯(lián)到原始數(shù)據(jù)的末尾,組合成新的數(shù)據(jù).為保持對(duì)比實(shí)驗(yàn)的公平性,對(duì)組合之后的數(shù)據(jù)裁剪掉其開(kāi)始時(shí)刻的流量值,使重構(gòu)后的數(shù)據(jù)與原始數(shù)據(jù)在長(zhǎng)度上保持一致,使兩者能夠共享一個(gè)結(jié)構(gòu)完全相同的神經(jīng)網(wǎng)絡(luò).將最后一層的最后一個(gè)LSTM單元的狀態(tài)輸出作為最終預(yù)測(cè)值.
圖5 單層LSTM 網(wǎng)絡(luò)示意圖Fig.5 Diagram of one-layer LSTM network
為驗(yàn)證所提方法的有效性,在公開(kāi)數(shù)據(jù)集PeMS(美國(guó)加利福尼亞運(yùn)輸部性能測(cè)量系統(tǒng))進(jìn)行實(shí)驗(yàn)驗(yàn)證,該數(shù)據(jù)集通過(guò)埋藏在道路中的線圈探測(cè)器獲取車輛信息,數(shù)據(jù)采集間隔設(shè)置為5 min.選擇2016年1~6月共計(jì)180 d 的車流數(shù)據(jù)作為研究對(duì)象,其中,4/5 的數(shù)據(jù)用作訓(xùn)練,1/5(約36 d)用作測(cè)試.
實(shí)驗(yàn)中,選擇城市干道主方向上連續(xù)的4個(gè)斷面作為實(shí)驗(yàn)對(duì)象,其上下游關(guān)系按照斷面標(biāo)號(hào)從上游到下游進(jìn)行排列,各斷面間相對(duì)距離在1.3~3.2 km,干道交通流為主要流量來(lái)源.將相鄰的20個(gè)時(shí)刻數(shù)據(jù)作為一個(gè)樣本,共得到51 820個(gè)數(shù)據(jù),其中,訓(xùn)練集樣本數(shù)為41 456,驗(yàn)證集樣本數(shù)為10 364.實(shí)驗(yàn)中使用的數(shù)據(jù)僅含斷面的流量特征.綜合實(shí)際輸入數(shù)據(jù)長(zhǎng)度及相似度比較的可靠性,將子序列長(zhǎng)度設(shè)置為10.僅使用LSTM 模型的預(yù)測(cè)結(jié)果與本實(shí)驗(yàn)結(jié)果進(jìn)行對(duì)比.為便于對(duì)比預(yù)測(cè)的細(xì)節(jié)效果,截取其中連續(xù)5 d的真實(shí)流量強(qiáng)度與預(yù)測(cè)值,對(duì)流量強(qiáng)度進(jìn)行歸一化處理.4 個(gè)斷面的實(shí)際預(yù)測(cè)效果如圖6~圖9 所示,其中,“LSTM”僅使用LSTM網(wǎng)絡(luò)進(jìn)行交通流預(yù)測(cè),“LSTM+Delay”在時(shí)延特性建模模塊初步預(yù)測(cè)的基礎(chǔ)上,使用LSTM進(jìn)行進(jìn)一步預(yù)測(cè).
使用均方根誤差(ERMSE)、平均絕對(duì)誤差(EMAE)和平均絕對(duì)百分比誤差(EMAPE)這3 種指標(biāo)對(duì)預(yù)測(cè)結(jié)果進(jìn)行量化分析.3種預(yù)測(cè)方法的誤差及對(duì)比如表1所示,其中,“Delay”僅使用時(shí)延特性建模模塊進(jìn)行初步預(yù)測(cè),Xp為編號(hào)為p的預(yù)測(cè)值誤差,Xˉ為預(yù)測(cè)平均誤差,z為預(yù)測(cè)值總數(shù).
圖6 斷面1 預(yù)測(cè)結(jié)果可視化Fig.6 Prediction results of traffic section 1
圖7 斷面2 預(yù)測(cè)結(jié)果可視化Fig.7 Prediction results of traffic section 2
圖8 斷面3 預(yù)測(cè)結(jié)果可視化Fig.8 Prediction results of traffic section 3
表1 預(yù)測(cè)結(jié)果對(duì)比Table 1 Prediction result
由實(shí)際預(yù)測(cè)數(shù)據(jù)的誤差統(tǒng)計(jì)結(jié)果可知,單依靠時(shí)延特性建模的交通流預(yù)測(cè)方法已能夠提升部分短時(shí)交通流預(yù)測(cè)性能,將時(shí)延特性與LSTM 網(wǎng)絡(luò)進(jìn)行組合預(yù)測(cè)時(shí),其預(yù)測(cè)誤差可以明顯改善,充分說(shuō)明時(shí)延特性對(duì)預(yù)測(cè)結(jié)果可靠性的影響,表明本文方法是一種有效的交通流預(yù)測(cè)方法.
圖9 斷面4 預(yù)測(cè)結(jié)果可視化Fig.9 Prediction results of traffic section 4
本文在考慮交通流時(shí)延特性的理論框架下,對(duì)路網(wǎng)中交通流密度與時(shí)延系數(shù)之間的存在性關(guān)系和變化趨勢(shì)進(jìn)行分析,同時(shí)結(jié)合實(shí)際流量數(shù)據(jù),建立了數(shù)據(jù)的相似性度量方法,實(shí)現(xiàn)了基于流量匹配的多斷面時(shí)延系數(shù)求解及斷面流量的初步預(yù)測(cè).最后通過(guò)搭建三層LSTM 網(wǎng)絡(luò)的多斷面交通流預(yù)測(cè)模型,實(shí)現(xiàn)了基于時(shí)延特性的短時(shí)交通流預(yù)測(cè),通過(guò)對(duì)比預(yù)測(cè)結(jié)果,證明了本方法的有效性.