王福建,俞佳浩,趙錦煥,梅振宇*
(1.浙江大學(xué),平衡建筑研究中心,杭州 310058;2.江蘇都市交通規(guī)劃設(shè)計研究院有限公司,南京 210009)
隨著全國各大城市積極響應(yīng)交通強(qiáng)國戰(zhàn)略,優(yōu)先發(fā)展公共交通,我國的城市公交發(fā)展規(guī)模日益擴(kuò)大。然而,在公交建設(shè)取得成績的同時,我國在地面公交發(fā)展還面臨著出行方式占比降低以及自身的公交管理控制問題,要進(jìn)一步提升公交出行服務(wù)水平,需要公交體系的有效運營與線路計劃的合理設(shè)計,這些措施皆基于對不同站點和線路客流量的精準(zhǔn)預(yù)測。
目前,公交站點客流存在較大的不確定性[1],諸多學(xué)者使用各類回歸、時間序列、卷積等算法,并將時間、空間、天氣等因素納入交通預(yù)測模型的計算范圍,使模型的可解釋性更強(qiáng)也更貼近現(xiàn)實情況。然而,目前的算法在進(jìn)行交通預(yù)測的同時也存在以下問題:回歸算法具有通用性強(qiáng)、可解釋的優(yōu)點,但將交通量時間分布圖作為函數(shù)進(jìn)行回歸,難以利用交通中的地理公交信息,例如,OKUTANI[2]的卡爾曼濾波,翁劍成等[3]的梯度推進(jìn)決策樹等;時間序列算法從時間維度跟蹤交通量的變化趨勢,但作為串行計算的算法,無法并行計算,也無法高效利用交通中的地理空間信息,例如,MA X.L.等[4]的LSTM模型等;通過多種算法組合的時間、空間算法雖然同時利用時空信息提取了交通模式信息,但計算量巨大,且算法的依次串聯(lián)無法實現(xiàn)并行計算,例如,MA X.等[5]的CapsNet 和NLSTM 的組合膠囊網(wǎng)絡(luò)及谷遠(yuǎn)利等[6]的組合深度學(xué)習(xí)模型。
2017年在自然語言處理領(lǐng)域興起的Transformer 網(wǎng)絡(luò)架構(gòu)[7]通過Attention 機(jī)制計算自然語言處理中每個詞向量之間的相關(guān)性,進(jìn)行完全的并行計算,立即取代了LSTM 等循環(huán)神經(jīng)網(wǎng)絡(luò),并延伸到交通領(lǐng)域的工作中,獲得了突出表現(xiàn)。CAI L.等[8]提出一種基于Attention 機(jī)制的Traffic Transformer深度學(xué)習(xí)架構(gòu),以捕獲交通時間序列的連續(xù)性和周期性并為空間依賴性建模;GUO S.等[9]提出一種基于Attention 機(jī)制的時空圖卷積網(wǎng)絡(luò)(ASTGCN)模型進(jìn)行交通預(yù)測。
本文通過分析大量公交站點的客流規(guī)律,提出站點實時關(guān)聯(lián)度的概念。由于受到路網(wǎng)結(jié)構(gòu)的連通性,公交線路的承接性以及客流OD的規(guī)律性影響,城市中一定區(qū)域范圍內(nèi)的公交站點之間,在客流量、行程時間等方面呈現(xiàn)出一定的相似性。這種相似性存在著一定的時差且不是固定的,隨著時間的推移,城市交通中存在著的高峰和非高峰、潮汐客流等現(xiàn)象,反映到公交站點層面即公交站點之間的相似性是實時變化的。
綜上所述,本文提出基于Attention的交通預(yù)測核心算法,結(jié)合對原始數(shù)據(jù)進(jìn)行預(yù)處理,并對站點信息進(jìn)行編碼后,完成了基于站點實時關(guān)聯(lián)度的短時公交客流預(yù)測方法。與交通領(lǐng)域中其他基于Attention機(jī)制的方法相比,提取了站點實時關(guān)聯(lián)度的TFMA對公交站點的屬性、客流變化率等信息利用更加全面細(xì)致,且實時預(yù)測功能使得其應(yīng)對潮汐客流也具備更精準(zhǔn)的預(yù)測能力。
本文使用的數(shù)據(jù)分別為蘇州市2019年12月31 d的公交進(jìn)出站數(shù)據(jù)和乘客刷卡數(shù)據(jù),為研究蘇州市中心城區(qū)最典型的公交客流情況,并提高算法效率,本文選擇蘇州市客流量最大的20 條公交線路進(jìn)行研究。
采用相關(guān)匹配算法將公交進(jìn)出站數(shù)據(jù)和乘客刷卡數(shù)據(jù)進(jìn)行匹配后,計算出各站點的刷卡人數(shù)(即站點客流量)。匹配算法流程如圖1所示。經(jīng)過匹配,可得到所有站點5:00-24:00 以15 min 為間隔的客流序列。
圖1 匹配算法流程Fig.1 Flow chart of matching algorithm
在得到公交站點客流隨時間的分布圖后,以9 路公交虹橋站和烽火路北站客流為示例驗證分析公交站點實時關(guān)聯(lián)度。兩者均位于蘇州市核心城區(qū),分別為9 路公交的第8、第13 站點,相距1600 m,在線路上具有承接關(guān)系。本文提取2019年12月6日(星期五)兩站點客流隨時間的分布如圖2所示。
圖2 2019年12月6日虹橋、烽火路北站客流分布Fig.2 Passenge rvolume distribution map of Hongqiao and Fenghuo Road North on Friday,December 6,2019
圖2標(biāo)明了對應(yīng)的客流高峰,對應(yīng)峰的出現(xiàn)意味著兩站點由于存在關(guān)聯(lián)性,在一段時間間隔內(nèi)出現(xiàn)了一組對應(yīng)的客流高峰,有著相似的客流變化率。圖2中有多組對應(yīng)峰,以標(biāo)出的4 組對應(yīng)峰為例可以發(fā)現(xiàn):實線高峰在上午出現(xiàn),且虹橋站的客流高峰比烽火路北站先出現(xiàn)約15 min;點劃線高峰在下午出現(xiàn),且烽火路北站的客流高峰比虹橋站先出現(xiàn)約15 min。
2019年12月6日6:00-12:00 早高峰時段的站點客流變化率如圖3所示。
圖3 2019年12月6日早高峰虹橋站、烽火路北站客流變化率Fig.3 Passenge rvolume change rate map of Hongqiao and Fenghuo Road North on morning rush of December 6,2019
2019年12月6日早高峰虹橋站客流變化率和烽火路北站整體提前15 min 后的客流變化率如圖4所示。
圖4 2019年12月6日早高峰虹橋站及烽火路北站提前客流變化率Fig.4 Passenge rvolume change rate map of Hongqiao and Fenghuo Road North advanced on morning rush of December 6,2019
剔除異常值后對兩組客流變化率數(shù)據(jù)計算相應(yīng)的平均絕對誤差指標(biāo)(MAE)和烽火路北站整體提前15 min 后的客流變化率與正常虹橋站客流變化率的平均絕對誤差指標(biāo),計算公式為
式中:ai為第i個時刻虹橋站的客流變化率;bi為第i個時刻烽火路北站的客流變化率;N為時間段的總數(shù)。正常客流變化率的平均絕對誤差EMAE1為131.0,烽火路北站整體提前15 min 后的平均絕對誤差EMAE2為95.4,表明兩者的客流變化率在消除時間間隔后較為相似。
結(jié)合大量樣本分析,歸納出以下現(xiàn)象特征:
(1)虹橋站與烽火路北站產(chǎn)生客流高峰的趨勢相同,通過對客流變化率的數(shù)據(jù)分析發(fā)現(xiàn),兩者的客流變化率關(guān)聯(lián)性存在一定的時間差。
(2)由于潮汐交通現(xiàn)象,客流方向早晚交替,虹橋站與烽火路北站之間的客流變化率關(guān)聯(lián)性并非一成不變的,隨著時間的推移,關(guān)聯(lián)關(guān)系也會隨之改變。例如,上午烽火路北站先出現(xiàn)客流高峰,下午虹橋站先出現(xiàn)高峰。
不同站點之間存在對應(yīng)峰以及關(guān)聯(lián)關(guān)系隨時間改變的現(xiàn)象表明,本文提出的站點實時關(guān)聯(lián)度有研究的必要。本文對公交站點進(jìn)行實時編碼,融合影響交通客流變化的因素,通過Attention機(jī)制計算公交站點之間的實時關(guān)聯(lián)度,探究站點實時關(guān)聯(lián)度與上述現(xiàn)象的關(guān)系,進(jìn)行更精確的客流預(yù)測。
為使模型能夠計算站點之間的實時關(guān)聯(lián)度且預(yù)測未來時刻的客流,需要使用一套編碼規(guī)則能夠完善地描述站點的特征,本文的站點編碼示例如圖5所示。
圖5 站點編碼示例Fig.5 Example of station coding
該編碼方式將站點通過長度為29的向量來表示,該向量中的每一位值均有其現(xiàn)實含義:第1 位為該站點所在的公交線路編號;第2位為該站點在線路中的順序號;第3 位為該站點的類型,通過kmeans 聚類算法得到;第4 位~第8 位為最近前5 個時段的編號,本文將5:00-24:00的19 h,以15 min為間隔按順序劃分為76個時段;第9位~第13位為時段所對應(yīng)的客流量;第14位~第17位為時段2、3、4、5對應(yīng)的客流變化率,以百分?jǐn)?shù)表示;第17位~第24位為當(dāng)天為星期幾;第21位為當(dāng)天是否為節(jié)假日,是為1,否為0;第26 位為剩余的休息天數(shù),若是星期一、星期二等工作日即為0,若是星期五、星期六即為2 或1,依此類推;第27 位為當(dāng)前時刻的溫度;第28位為當(dāng)天的天氣;第29位為當(dāng)天的風(fēng)力大小。
該站點信息編碼不僅包含了影響客流的眾多因素,且有利于后續(xù)算法中計算出站點之間的實時關(guān)聯(lián)度。
借鑒Attention 機(jī)制提出本文的公交客流預(yù)測算法TFMA,采用encoder-decoder 架構(gòu),encoder 端和decoder端分別使用6個編碼器和6個解碼器,算法框架如圖6所示。
圖6 TFMA算法框架Fig.6 TFMAalgorithm framework
Self-attention機(jī)制有3個步驟:
Step 1 在self-attention 中,每個經(jīng)過編碼的站點時段數(shù)據(jù)X輸入到算法后生成Query 向量Q、Key 向量K及Value 向量V,它們是通過3 個不同的權(quán)值矩陣W(Q)、W(K)、W(V)與輸入向量X相乘得到的,這3 個矩陣由隨機(jī)初始化得到,且矩陣尺寸相同,在后續(xù)模型訓(xùn)練的過程中,這些矩陣的權(quán)值會被不斷調(diào)整。權(quán)值矩陣和Q、K、V向量如圖7所示。
圖7 權(quán)值矩陣和Q、K 、V 向量Fig.7 Weight matrix and Q、K 、V vector
Step 2 在輸入的站點編碼數(shù)據(jù)生成Q、K、V向量后,算法將用當(dāng)前站點的Query向量與其他站點的Key 向量(包括自己)做點乘,計算self-attention的分?jǐn)?shù)值,把點乘得到的分?jǐn)?shù)值除以向量維度的1/2 次方,再進(jìn)行softmax 的計算,即可得到站點之間的關(guān)聯(lián)度R值,即Rij為站點i和j之間的關(guān)聯(lián)度。
Step 3 將所有站點Value向量和對應(yīng)的關(guān)聯(lián)度R值相乘,再相加,得到結(jié)果Zi,即是self-attetion在當(dāng)前站點i的特征表達(dá)。
綜上,用公式概括為
式中:S為輸入的站點編碼數(shù)量;i,j=1,2,…,S,含義為某個站點;dk為Q、K、V向量的維度。selfattention的計算方式如圖8所示。
圖8 self-attention的計算Fig.8 Calculation of self-attention
為使客流預(yù)測更精準(zhǔn),本模型中加入上周該站點同時段的編碼值和昨日該站點同時段的編碼值。
Multi-headed 機(jī)制即不僅僅只初始化一組Q、K、V矩陣,而是初始化多組。在后續(xù)的計算中,把多個矩陣在同一維度上連接,再通過一層全連接層將這個經(jīng)過連接的矩陣降維到矩陣連接前的尺寸,得到的最終的矩陣作為該站點的特征表達(dá),如圖9所示。
圖9 Multi-headed機(jī)制示意Fig.9 Schematic diagram of multi headed mechanism
Multi-headed機(jī)制的好處是允許模型在不同的表示子空間里學(xué)習(xí)到相關(guān)信息,從而得到不同時間尺度和空間尺度的特征向量表達(dá)。
提升網(wǎng)絡(luò)性能的方法很多,一般而言,提升網(wǎng)絡(luò)性能最直接的方法是增加網(wǎng)絡(luò)的深度和寬度。其中,網(wǎng)絡(luò)深度指的是網(wǎng)絡(luò)的層數(shù),寬度指的是每層的通道數(shù)。但是,這種方法會帶來過擬合和計算量加大的缺點。
本文通過增加通道和殘差連接提升網(wǎng)絡(luò)性能,網(wǎng)絡(luò)性能提升方法如圖10所示,圖中,短劃線為增加通道,點線為殘差連接。
圖10 網(wǎng)絡(luò)性能提升方法示意Fig.10 Schematic diagram of network performance improvement method
2.3.1 增加通道
圖10中,當(dāng)訓(xùn)練數(shù)據(jù)被模型接收后,將進(jìn)入兩個通道分支,左側(cè)通道為前文所述的self-attetion+multi-headed 功能通道,右側(cè)通道在對數(shù)據(jù)進(jìn)行同樣的操作之前通過全連接神經(jīng)網(wǎng)絡(luò)進(jìn)行降維,已有學(xué)者[10]的研究表明,空間聚合可以通過低維嵌入,不會導(dǎo)致神經(jīng)網(wǎng)絡(luò)表示能力的降低。同理,該模型中右側(cè)通道通過全連接神經(jīng)網(wǎng)絡(luò)降維壓縮輸入信息并加快學(xué)習(xí)速度,同時,全連接神經(jīng)網(wǎng)絡(luò)中包含的非線性激活函數(shù)可以增強(qiáng)網(wǎng)絡(luò)的擬合能力。
2.3.2 殘差連接
殘差連接的加入可以解決深度學(xué)習(xí)網(wǎng)絡(luò)退化的問題,其示意圖如圖11所示。
圖11 殘差連接示意Fig.11 Schematic diagram of residual connection
假設(shè)神經(jīng)網(wǎng)絡(luò)非線性單元的輸入和輸出維度一致,那么可以將神經(jīng)網(wǎng)絡(luò)單元要擬合的函數(shù)H(x)拆分成兩個部分,即
式中:x為殘差單元,上層輸入x的同等映射以跳層連接的形式實現(xiàn);F(x)為經(jīng)過神經(jīng)網(wǎng)絡(luò)非線性單元的輸出。兩者在進(jìn)入激活函數(shù)和后續(xù)神經(jīng)網(wǎng)絡(luò)之前進(jìn)行矩陣(張量)連接即可。
殘差網(wǎng)絡(luò)不僅未增加參數(shù)量也未增加計算量,在前向傳播時,輸入信號可以從任意低層直接傳播到高層,由于包含了一個天然的恒等映射,一定程度上可以解決網(wǎng)絡(luò)退化問題。圖10中點線部分即為殘差連接操作。
Decoder 結(jié)構(gòu)和encoder 大體相同,不同的是decoder 中使用的是soft-attention。self-attention 的Q、K、V矩陣來自同一個,而soft-attention每個解碼器的Q來自decoder,K和V來自encoder,表征的是encoder 的整體輸出對于decoder 的貢獻(xiàn)。Decoder 端輸入需要預(yù)測站點信息后,經(jīng)過多個解碼器的計算,使用全連接神經(jīng)網(wǎng)絡(luò)進(jìn)行最終求值,即可得到該站點在下個時刻的客流量。
在站點信息編碼的過程中,每個站點編碼均包含了前5個時間段的時間編號和對應(yīng)的客流信息,因此,每天每個站點能產(chǎn)生72 個可用的站點編碼信息,2019年12月的31 d 可產(chǎn)生2232 個站點編碼信息。本文所提取的公交客流量最大的20條線路的公交站點數(shù)量為804個,共產(chǎn)生179.45萬條站點編碼信息。在劃分訓(xùn)練集和測試集時,隨機(jī)抽取22 d的數(shù)據(jù)作為訓(xùn)練集,9 d的數(shù)據(jù)作為測試集,兩者比例近似為7∶3。
在實際訓(xùn)練過程中,選擇Smooth L1 作為損失函數(shù),以epoch(期)和batch(批)為單位進(jìn)行訓(xùn)練。訓(xùn)練集中每天為1個epoch,共22個epoch,當(dāng)epoch超過22時,即開始新一輪的訓(xùn)練。每個epoch中包含72個batch,在t時段產(chǎn)生的804個站點編碼信息即為1 個batch,以每條線路為1 個序列,將包含了該時段、該線路所有站點的編碼信息的序列依次輸入到encoder 端中進(jìn)行一系列計算,同時,在decoder端中輸入需要預(yù)測客流的目標(biāo)站點編碼信息,預(yù)測的未來時段公交站點客流和真實值y通過Adam優(yōu)化算法進(jìn)行反向傳播,不斷優(yōu)化模型內(nèi)部的權(quán)重參數(shù),即可得理想的公交客流預(yù)測模型。
公交站點的客流量可使用深度學(xué)習(xí)中的RNN、LSTM、GRU 等模型從時間序列角度進(jìn)行預(yù)測。公交站點客流由于受到人們通勤、日常作息、天氣等因素的影響,可將一系列客流值看作函數(shù),使用(多元)線性回歸、決策樹等回歸算法擬合。集成機(jī)器學(xué)習(xí)算法,例如,XGBoost、LightGBM 也是交通預(yù)測的有效工具。本節(jié)為驗證TFMA 算法的有效性,同時使用了多元線性回歸、GRU、LightGBM 作為對照,與TFMA 同時對蘇州市公交站點客流量進(jìn)行預(yù)測。
本文的訓(xùn)練集評價指標(biāo)選擇100%-MAPE,計算公式為
式中:S為站點的數(shù)目;yi為第i個樣本的真實值;為第i個樣本的預(yù)測值。各模型在訓(xùn)練集的準(zhǔn)確率隨epoch次數(shù)變化如圖12所示。
通過圖12可知:
圖12 訓(xùn)練集算法表現(xiàn)Fig.12 Performance chart of training set algorithm
(1)各算法在進(jìn)行公交站點客流預(yù)測時,表現(xiàn)最好的是TFMA,接下來依次是LightGBM、GRU、多元線性回歸。
(2)多元線性回歸在進(jìn)行公交站點客流量預(yù)測時,存在大幅震蕩,模型不穩(wěn)定的現(xiàn)象,可能是多元線性回歸建立自變量與應(yīng)變量之間的關(guān)系較為簡單,因此,在4種算法中表現(xiàn)并不理想。
(3)本文使用了2 次GRU 算法,GRU1 曲線使用的數(shù)據(jù)為訓(xùn)練集中所有站點的客流序列,由于GRU1只讀入客流序列信息而沒有線路信息、站點信息、天氣信息等數(shù)據(jù)的參與,導(dǎo)致GRU1 將所有站點認(rèn)為同一個站點,因此,擬合效果比多元線性回歸更差。為充分發(fā)揮GRU算法的能力,GRU2僅讀入了1 個站點的數(shù)據(jù)(本文選擇9 路公交線路的虹橋站)進(jìn)行訓(xùn)練,由圖12可見GRU2 的預(yù)測效果從41.4%大幅提升至66.9%。
(4)LightGBM在進(jìn)行公交站點客流預(yù)測時,充分利用了線路信息、站點信息、天氣信息等,預(yù)測效果進(jìn)一步提升至81.2%,同時,模型也相對穩(wěn)定。
(5)TFMA 算法通過self-attention 機(jī)制計算出站點之間的實時關(guān)聯(lián)度,考慮了關(guān)聯(lián)站點對目標(biāo)站點的影響,殘差連接和增加通道等措施也進(jìn)一步提升了網(wǎng)絡(luò)性能,預(yù)測效果達(dá)到89.5%。
本文將測試集的數(shù)據(jù)送入各算法中進(jìn)行進(jìn)一步的對比。測試集中使用的評估指標(biāo)除了MAPE外,還使用了平均絕對誤差MAE 和均方根誤差RMSE,計算公式分別為
各算法在測試集中的指標(biāo)如表1所示。
表1 各算法測試集表現(xiàn)統(tǒng)計表Table 1 Performance statistics of each algorithm test set
由表1可以看出,各算法在測試集中的表現(xiàn)和訓(xùn)練集類似,TFMA 算法仍為所有指標(biāo)下的最優(yōu)算法。
站點實時關(guān)聯(lián)度通過站點之間的Q和K向量做點乘,再除以向量維度的1/2 次方,進(jìn)行softmax歸一化計算后得到,因此,所有站點對目標(biāo)站點的實時關(guān)聯(lián)度累加之和應(yīng)等于1。
本文選取蘇州市最具代表性的9 路和38 路公交,提取相應(yīng)的站點關(guān)聯(lián)度進(jìn)行分析。兩者均橫跨蘇州市最繁忙的內(nèi)環(huán)城區(qū)且存在著較強(qiáng)的關(guān)聯(lián)性,具有較高的研究價值。
3.2.1 單個站點與同線路鄰近站點的關(guān)聯(lián)度分析
以9 路公交的虹橋公交站為對象研究該站點與其他站點的關(guān)聯(lián)度。該站點南面鄰接蘇州市人民政府,西北方和東北方分別鄰接深業(yè)姑蘇中心(商務(wù)寫字樓)和蘇州開放大學(xué),是具備多種社會價值和功能的重要公交站點。
圖13 蘇州市9路、38路公交區(qū)位Fig.13 Location map of No.9 and No.38 bus area in Suzhou
圖14 9路公交虹橋站區(qū)位Fig.14 Location map of No.9 bus Hongqiao Station
選擇的時間為2019年12月18日(星期三)9:00-9:15,站點編碼中包含的時段為從8:00-9:15 以15 min為間隔的5個時段及其對應(yīng)的客流,通過路網(wǎng)中以上時間的客流數(shù)據(jù)實時預(yù)測未來15 min 的站點客流??紤]到關(guān)聯(lián)性強(qiáng)的站點幾乎為同一線路的站點,因此,在分析和展示中只包含9 路公交的站點。可視化結(jié)果如圖15所示,圖中,實線為虹橋站與其他站點的實時關(guān)聯(lián)度,虛線為虹橋站與自身的關(guān)聯(lián)度。
圖15 虹橋站站點實時關(guān)聯(lián)度示意Fig.15 Schematic diagram of real-time correlation degree of Hongqiao Station
通過分析多組站點實時關(guān)聯(lián)度,本文以9 路公交的站點分布和周圍路網(wǎng)為例,總結(jié)得出以下結(jié)論。
(1)TFMA 算法計算得出的站點實時關(guān)聯(lián)度R與主要客流路徑上站點的客流量和客流變化率相關(guān)。當(dāng)關(guān)聯(lián)度高的某站點X產(chǎn)生擁堵時,擁堵造成的影響反映在客流量和客流變化率中進(jìn)入到站點X的編碼信息中,并通過R值和站點X的編碼信息在后續(xù)的計算中對目標(biāo)站點的未來時段預(yù)測客流產(chǎn)生影響。圖16中,倘若路口A產(chǎn)生擁堵,距離其450 m 的三園新村站的公交客流基本不會受到擁堵影響,但馨蓮橋站和虹橋站會受到嚴(yán)重影響,且該影響將先對馨蓮橋站產(chǎn)生。路口B 前、后的開放大學(xué)站和彩香新村北站亦同。因此,雖然開放大學(xué)站和彩香新村北站,與虹橋站在路網(wǎng)中的位置非常相似,但TFMA 給了開放大學(xué)站較高的實時站點關(guān)聯(lián)度,彩香新村北站的實時站點關(guān)聯(lián)度明顯更低。
(2)TFMA算法可以計算出更長時間跨度內(nèi)的站點實時關(guān)聯(lián)度,該時間跨度由站點信息編碼中包含的時間跨度決定。由圖16可知,蘇大北校區(qū)東站與虹橋站相隔10個站點,TFMA仍然認(rèn)為兩者之間具有較強(qiáng)的實時站點關(guān)聯(lián)性,因為蘇大北校區(qū)東站點產(chǎn)生的擁堵將對后續(xù)同路段的站點造成影響。因此,雖然距離虹橋站較遠(yuǎn),但TFMA 認(rèn)為兩者之間存在稍強(qiáng)的實時站點關(guān)聯(lián)度。
圖16 虹橋站附近路網(wǎng)及站點分布Fig.16 Schematic diagram of road network and station distribution near Hongqiao Station
(3)TFMA 算法計算得出的站點實時關(guān)聯(lián)度R也含有時間序列關(guān)系。圖15中短劃線所指向的關(guān)聯(lián)度,由于客流信息的相似性,虹橋站上周同星期、同時段編碼被賦予了較高的站點實時關(guān)聯(lián)度。
3.2.2 公交線路之間鄰近站點的關(guān)聯(lián)度分析
選擇關(guān)聯(lián)性較強(qiáng)且具有代表性的的14 個9 路公交站點和13 個38 路公交站點作為示例,時間為2019年12月25日(星期三)9:00-9:15,站點編碼中包含的時段為從8:00-9:15 以15 min 為間隔的5 個時段及其對應(yīng)的客流,通過路網(wǎng)中以上時間的客流數(shù)據(jù)實時預(yù)測未來15 min的站點客流,每個站點的昨日同時段編碼和上周同日、同時段編碼不納入關(guān)聯(lián)度分析的范圍。選擇的具體公交站點如圖17所示。
圖17 線路間代表性站點選擇示意Fig.17 Schematic diagram for selection of representative stations between lines
經(jīng)過計算和可視化后,以熱力圖的形式展示兩條公交線路鄰近站點的關(guān)聯(lián)度如圖18所示。
通過分析圖18,總結(jié)出以下結(jié)論:
圖18 9路與38路線路之間重要站點關(guān)聯(lián)度熱力圖Fig.18 Thermodynamic diagram of correlation degree of important stations between Route 9 and route 38
(1)屬于同一線路的站點之間關(guān)聯(lián)度明顯高于屬于不同線路的站點之間關(guān)聯(lián)度,但在線路交匯的鄰近站點之間,即使不屬于同一線路,關(guān)聯(lián)度也較高,這也印證了“TFMA 算法計算得出的站點實時關(guān)聯(lián)度R與主要客流路徑上站點的客流量和客流變化率相關(guān)”的觀點。
(2)當(dāng)公交站點與地鐵站存在接駁關(guān)系時,該站點與其他所有站點的關(guān)聯(lián)度均下降,同時,該站點的自關(guān)聯(lián)度顯著提升。其現(xiàn)實含義為:與地鐵存在接駁關(guān)系的站點,其客流預(yù)測時包含的自身客流時間序列關(guān)系權(quán)重更大,受到其他站點所傳遞的交通環(huán)境相關(guān)度權(quán)重減小。例如,相門站、學(xué)士街站、三香廣場站等,均屬于與地鐵站接駁的公交站點,其自身的關(guān)聯(lián)度R值均達(dá)到13%以上。
為佐證站點關(guān)聯(lián)度,使用客流量和變化率相似度指標(biāo)PCS(Passenger volume and Change rate Similarity)進(jìn)行研究,計算公式為
式中:EPCSij為第i個站點相對于第j個站點的客流量和變化率相似度指標(biāo);Ai為第i個站點的客流量向量;Bi為第i個站點的客流量變化率向量。通過對站點之間的客流量向量和客流量變化率向量分別進(jìn)行余弦相似度計算,再分別進(jìn)行歸一化處理,將兩者縮小50%后相加即可得到PCS 值。PCS 值代表站點之間的客流量相似度和客流量變化率相似度之和。以14個9路公交站點和13個38路公交站點在2019年12月25日(星期三)9:00-9:15的數(shù)據(jù)為基礎(chǔ),將烽火路北站作為目標(biāo)站點,計算它與其他站點的PCS值,并將得到的結(jié)果與站點關(guān)聯(lián)度進(jìn)行對比,結(jié)果如表2和圖19所示。
由表2和圖19可知:
圖19 烽火路北站指標(biāo)對比結(jié)果柱形圖Fig.19 Columnar chart of comparison results of two indexes in Fenghuo Road North Station
表2 烽火路北站兩種指標(biāo)對比表Table 2 Two indicators of Fenghuo Road north contrast table
(1)烽火路北站與其自身的PCS 值是最大的,為0.0885;與38 路的附二醫(yī)院(體育中心站)的PCS值最小,為0.0028。
(2)烽火路北站和其他站點的關(guān)聯(lián)度與PCS值的結(jié)果大致相同,而PCS值所表示的即為站點之間的客流量和客流量變化率相似度,說明TFMA算法計算得出的站點實時關(guān)聯(lián)度R與主要客流路徑上站點的客流量和客流變化率相關(guān)。
(3)PCS值中部分?jǐn)?shù)值較小的結(jié)果在站點關(guān)聯(lián)度R值中被算法調(diào)整為“0”值,這是由于在TFMA算法中除了客流量和客流變化率數(shù)據(jù),還融入了代表站點屬性和站點線路歸屬的信息,這些信息也會影響算法內(nèi)部的站點相似性度量,在多次參數(shù)調(diào)整后最終得到不同站點之間的關(guān)聯(lián)度存在“0”值的情況,證明屬于同一線路的站點之間關(guān)聯(lián)度明顯高于屬于不同線路的站點之間關(guān)聯(lián)度。
3.4.1 站點實時關(guān)聯(lián)度對算法的意義
站點實時關(guān)聯(lián)度可以將算法的關(guān)注點更集中于對目標(biāo)站點關(guān)聯(lián)度高的站點編碼信息中,從而在訓(xùn)練和預(yù)測時降低算法的復(fù)雜度,加快訓(xùn)練速度。在算法實際訓(xùn)練中,encoder 端和decoder 端最后得到的與目標(biāo)站點存在關(guān)聯(lián)度的站點數(shù)目一般不超過30個,因此,在算法預(yù)測某一站點的未來客流時會忽略絕大多數(shù)沒有關(guān)聯(lián)性的站點信息,達(dá)到降低算法復(fù)雜度、加速訓(xùn)練的目的。
3.4.2 站點實時關(guān)聯(lián)度對交通管控的現(xiàn)實意義
站點實時關(guān)聯(lián)度可以為交通管控提供有力的策略指導(dǎo),實現(xiàn)區(qū)域公交站點客流疏導(dǎo)等任務(wù)。在現(xiàn)實中,由于站點之間被路網(wǎng)結(jié)構(gòu)連通性、公交線路承接性及OD客流的規(guī)律性所互相聯(lián)系,城市路網(wǎng)中重要站點的客流擁堵往往與關(guān)聯(lián)度高的站點存在千絲萬縷的聯(lián)系,只針對單個重要公交站點進(jìn)行管控往往達(dá)不到良好疏導(dǎo)作用。而利用站點實時關(guān)聯(lián)度,篩選出與目標(biāo)站點關(guān)聯(lián)度高的站點,則可以實現(xiàn)區(qū)域性的交通管控。
本文基于站點實時關(guān)聯(lián)度的短時公交客流預(yù)測方法得到的主要結(jié)論如下:
(1)通過Attention機(jī)制計算得到了站點之間的實時關(guān)聯(lián)度,可根據(jù)強(qiáng)關(guān)聯(lián)度站點產(chǎn)生的客流變化對目標(biāo)站點的預(yù)測客流進(jìn)行調(diào)整,使得預(yù)測結(jié)果更精準(zhǔn)。
(2)將multi-headed 機(jī)制結(jié)合提升網(wǎng)絡(luò)性能的方法可實現(xiàn)不同時間尺度、空間尺度的特征向量表達(dá),克服計算量增大和網(wǎng)絡(luò)退化問題,使網(wǎng)絡(luò)的深層表達(dá)能力更強(qiáng)。
(3)站點實時關(guān)聯(lián)度具有現(xiàn)實意義。它可以將算法的關(guān)注點更集中于對目標(biāo)站點關(guān)聯(lián)度高的站點編碼信息中,降低算法的復(fù)雜度,加快訓(xùn)練速度;也可以為交通管控提供有力的策略指導(dǎo),實現(xiàn)區(qū)域公交站點客流疏導(dǎo)等任務(wù)。