劉大偉, 陳建雄
(1.中遠海運科技股份有限公司,上海 200135;2.上海船舶運輸科學研究所有限公司,上海 200135)
近年來,隨著我國機動車數(shù)量不斷增多,高速公路擁堵問題越來越嚴重,由此引發(fā)的時間延誤和環(huán)境污染等問題給社會造成了巨大的經(jīng)濟損失。根據(jù)2021年12月國務院印發(fā)的《“十四五”現(xiàn)代綜合交通運輸體系發(fā)展規(guī)劃》[1],在智慧公路方面,應穩(wěn)步推進集監(jiān)測、調度、管控、應急和服務等功能于一體的智慧路網(wǎng)云控平臺建設,提取、識別和分析高速公路的交通狀態(tài)是管控的前提。國內外學者對此開展了一系列研究。LINDLEY[2]利用路段飽和度對交通擁堵情況進行了評估,將采集到的高峰時段車流量擴充為24 h的日車流量,并與最大通行能力相對比,確定當路段飽和度大于0.77時,路段處于交通擁堵狀態(tài)。劉嚴磊[3]提出了改進的California算法,通過計算相鄰線圈的占有率,并與標定的閾值相對比,判別路段是否存在交通事件。譚娟等[4]利用多元基礎數(shù)據(jù)構建綜合的交通流特征向量,將其作為數(shù)據(jù)支撐(包含交通流量參數(shù)、環(huán)境狀態(tài)和時段等數(shù)據(jù)),提出了一種基于自編碼(Auto-Encoder)的深度學習模型,并結合Softmax回歸對交通擁堵狀態(tài)進行了預測。張誠[5]對McMaster算法進行了改進,通過對大量歷史數(shù)據(jù)進行分析,得到流量與占有率的二維數(shù)據(jù)關系圖,該關系圖由4個區(qū)域組成,每個區(qū)域代表1個特別的交通狀態(tài)。采用這些研究方法計算得到的交通狀況評價指標實時性較差,精確度較低。對此,本文以高速公路收費站出入口流水表和ETC(Electronic Toll Collection)門架牌識數(shù)據(jù)等為研究對象,采用Van-Aerde模型對區(qū)域交通流進行描述,采用短時路況預測算法對區(qū)域內可能出現(xiàn)的交通擁堵問題進行預測,并將所得結果與高速公路上現(xiàn)有的情報板設備對接,設計一種基于交通態(tài)勢算法的交通預警系統(tǒng),合理準確地展示當前的交通狀況,為高速公路擁堵治理和交通管理者疏導交通提供依據(jù)。
該系統(tǒng)采用主流的微服務框架設計,在提高系統(tǒng)性能的同時,增強其拓展性?;诮煌☉B(tài)勢算法設計該系統(tǒng)的架構,主要分為數(shù)據(jù)來源層、數(shù)據(jù)庫層、業(yè)務層、網(wǎng)絡通信層和訪問層,各層次根據(jù)不同的功能劃分為不同的應用模塊。圖1為系統(tǒng)架構圖。
圖1 系統(tǒng)架構圖
1.1.1 數(shù)據(jù)來源層
該層通過不同的方式采集多種數(shù)據(jù),包括但不限于收費站出入口流水表和ETC門架牌識數(shù)據(jù)等,為系統(tǒng)提供數(shù)據(jù)流支撐。
1.1.2 數(shù)據(jù)庫層
數(shù)據(jù)庫采用MySQL和分布式OLAP(Online Analytical Processing)聯(lián)機分析處理系統(tǒng)。MySQL具有體積小、速度快和開源等特性,在系統(tǒng)開發(fā)中得到了廣泛應用。分布式OLAP數(shù)據(jù)庫能進行線性擴展,且支持多副本,無單點故障,以保證系統(tǒng)具有高可用和高并發(fā)的特點。數(shù)據(jù)庫能與Grafana和Prometheus等開源監(jiān)控軟件集成,為運維提供方便。
1.1.3 業(yè)務層
系統(tǒng)基于智能中臺實現(xiàn)各功能模塊的具體功能,是預警系統(tǒng)的核心部分。
1.1.4 網(wǎng)絡通信層
將系統(tǒng)打包部署至租用的公有云環(huán)境中,并搭建nginx負載均衡集群,以保證系統(tǒng)具有良好的性能和高可用性。采用容分發(fā)網(wǎng)絡(Content Delivery Network,CDN),能避開影響數(shù)據(jù)傳輸速度和魯棒性的環(huán)節(jié),使信息傳輸?shù)乃俣雀?,安全性更強?/p>
1.1.5 訪問層
可通過PC(Personal Computer)端訪問系統(tǒng),實時掌握當前的交通態(tài)勢,交通管理者以此為依據(jù)進行交通疏導,同時將內容實時推送給高速公路可變情報板,為出行者的路徑選擇提供依據(jù)。
該系統(tǒng)主要包含區(qū)域交通態(tài)勢實時計算模塊、異常擁堵預警模塊和交通遷徙計算模塊,見圖2。
圖2 系統(tǒng)功能模塊圖
將高速路網(wǎng)劃分為數(shù)個網(wǎng)格區(qū)域,基于實時數(shù)據(jù),利用交通流基本圖模型,結合路段擁堵狀態(tài)、平均車速和出入口排隊長度等指標,實時監(jiān)測道路交通狀態(tài)的變化。采用短時路況預測算法,根據(jù)區(qū)域交通的變化和區(qū)域類型對該區(qū)域的交通態(tài)勢進行預測,并發(fā)出有關異常擁堵的預警。通過采集各收費站流入和流出的車輛數(shù)據(jù),結合特殊事件(如節(jié)假日等),統(tǒng)計各區(qū)域車輛的OD(Origin-Destination)狀況,計算交通遷徙情況。
交通態(tài)勢實時計算算法的輸出延時小于5 s;實時路況及異常擁堵預警準確率能達到80%;實時路況更新時間小于2 min。
在傳統(tǒng)的交通流理論中,并沒有明確給出交通態(tài)勢算法的定義和描述。近年來,隨著交通信息化和智能交通的不斷發(fā)展,逐漸出現(xiàn)了一些新的概念和交通流分析方法,但本質上并未脫離傳統(tǒng)的交通流理論范疇[6]。在高速公路上,受天氣、道路和事故等眾多不確定因素的影響,交通流運行狀態(tài)是不斷發(fā)生變化的。交通態(tài)勢就是在一定的道路交通條件下,路網(wǎng)中行駛的車輛表現(xiàn)出的狀態(tài)和變化趨勢。系統(tǒng)實時計算當前的交通狀態(tài),并預測未來的車輛平均行駛速度,由此對道路異常擁堵情況進行預警;同時,計算省內外的交通遷徙情況,準確了解車輛的流動趨勢,全面掌握路網(wǎng)運行狀況。
交通流基本圖模型通過刻畫流量、速度和密度等3個交通要素之間的關系,表征交通流的狀態(tài)和變化規(guī)律,并通過數(shù)據(jù)擬合得到三者之間的函數(shù)關系式[6]。本文采用最小二乘法和標準遺傳算法進行參數(shù)標定。系統(tǒng)實時獲取高速公路收費站出入口流水表和ETC門架牌識數(shù)據(jù),利用Van-Aerde模型[7]對區(qū)域交通流進行描述,模型的表達式為
(1)
式(1)中:s為車頭時距,km;v為平均速度,km/h;vf為自由流速度,km/h;c1為車頭間距參數(shù),km;c2為可變跟車參數(shù),km2/h;c3為車頭時距參數(shù),h。
c1、c2、和c3的計算公式[6]為
(2)
(3)
(4)
式(2)~式(4)中:vm為臨界(最高)速度,km/h;vf為自由流速度,km/h;ρc為阻塞密度,輛/km;qm為通行能力,輛/h。
ρ為車頭間距的倒數(shù),即
(5)
平均速度采用路段平均行程速度,是指道路上或路網(wǎng)中所有車輛的總行駛里程與總行程時間的比值,其中行程時間包括中間停車和排隊時間。主要根據(jù)高速公路出口流水表進行計算,同時區(qū)分車型,并剔除壞值數(shù)據(jù),主要流程如下:
1)選擇相應區(qū)間和相應時間段(實時)的數(shù)據(jù);
2)根據(jù)車輛出入口收費站的序號匹配每輛車的行駛路段長度si,并計算每輛車的行駛時間ti(ti為出站時間與入站時間的差值);
3)設置行駛時間ti的范圍為0~24 h,將超出該范圍的數(shù)據(jù)剔除;
5)根據(jù)
(6)
流量q可由速度和密度得出,即
q=ρv
(7)
通過采集寧夏高速公路車輛數(shù)據(jù)對模型參數(shù)進行設置,結果見表1。
表1 Van-Aerde模型參數(shù)
根據(jù)設置的參數(shù)可得到流量-密度曲線(見圖3)、速度-密度曲線(見圖4)和速度-流量曲線(見圖5),清楚地顯示交通流基本圖模型3個要素之間的關系[8]。隨著密度的不斷增大,流量不斷增大,會處于自由流狀態(tài),但當密度達到某個閾值之后,隨著密度的繼續(xù)增大,流量逐漸減小,交通逐步進入擁堵狀態(tài);隨著密度的不斷增大,車流速度逐漸減少;速度與流量的關系基本上與密度與流量的關系一致,也存在閾值。將交通流控制在閾值附近,以提高道路通行效率。
在得到區(qū)域整體的交通流特征之后,評估區(qū)域的交通運行狀態(tài),對交通流運行是否順暢、是否產生擁堵進行分析。平均速度是最能表征車輛運行狀態(tài)的指標:平均速度較高,說明交通流基本上處于自由流狀態(tài),未受天氣和道路交通條件等不確定因素的影響;平均速度較低,說明交通流的運行受到了干擾,交通流基本上處于擁堵狀態(tài)。根據(jù)不同的限速標準,結合平均速度將擁堵狀況劃分為5個等級,具體見表2。
表2 平均速度分級表
根據(jù)實時交通信息計算交通態(tài)勢的變化情況,及時對擁堵情況進行預警,并預測路網(wǎng)運行指數(shù)、擁堵長度和擁堵時間,需明確擁堵路段。
2.2.1 GCN-LSTM模型
為預測某路段未來的擁堵狀況,首先需預測該路段未來的車速情況。車速預測采用基于圖卷積網(wǎng)絡(Graph Convolutional Network, GCN)和長短期記憶(Long Short-Term Memory, LSTM)單元的時間圖進化網(wǎng)絡(GCN-LSTM)模型完成,流程見圖6。該模型同時考慮了交通數(shù)據(jù)的空間性和時間依賴性[9]。利用GCN提取每個窗口時刻目標路段實際速度的空間特征,并映射輸出窗口時刻目標路段的隱藏空間關聯(lián)特征[10]。速度在時間維度存在時間相關性,LSTM模型為提取時間序列特征常用的模型,將其作為提取時間特征的關鍵方法。GCN-LSTM模型整體框架見圖7。
圖6 基于GCN-LSTM模型的車速預測流程
圖7 GCN-LSTM模型整體框架
2.2.2 模型參數(shù)設計
GCN-LSTM模型參數(shù)[10]主要包括批量大小、學習率、迭代次數(shù)、忘記偏置和LSTM單元數(shù),通過不斷地進行參數(shù)調試得到模型參數(shù)見表5,此時預測精度最高。
表5 GCN-LSTM模型參數(shù)
對于模型輸入層,前80%的數(shù)據(jù)作為訓練集對模型進行訓練,剩余20%的數(shù)據(jù)作為測試集對模型進行評價。GCN-LSTM模型采用Adam優(yōu)化器訓練。
2.2.3 損失函數(shù)及評價指標
(8)
式(8)中:Lreg為L2正則項,防止過擬合;λ為超參數(shù)。
(9)
(10)
(11)
具體地:ERMS和EMA用于衡量預測誤差,二者的值越小越好,二者的值越小,代表誤差越??;R2越大越好,R2的值可以為1,即模型為不犯任何錯誤的完美模型,這在現(xiàn)實中往往是不存在的。
2.2.4 模型評價
基于寧夏高速公路運行數(shù)據(jù)集,對未來1 h內高速公路上的車輛通行速度進行預測,將ERMS、EMA和R2作為評價指標,分別對本文提出的GCN-LSTM模型與自回歸綜合移動平均(Autoregressive Integrated Moving Average,ARIMA)模型和支持向量機(Support Vector Machine,SVM)模型2種常用預測模型的預測結果進行對比,結果見表6。由表6可知:ARIMA模型基于歷史數(shù)據(jù),從時間維度描述交通流的變化規(guī)律,在交通流平緩時效果良好,但不適用于交通狀況急劇變化的情形;SVM模型通過對歷史數(shù)據(jù)進行訓練得到輸入與輸出之間的關系之后,根據(jù)給出的未來交通數(shù)據(jù)進行交通預測;GCN-LSTM模型充分考慮空間相關性和時間相關性,在所有評價指標下都具有良好的性能,展示出了其在交通預測方面的優(yōu)勢。
表6 3種模型的預測結果對比
2.2.5 模型使用
采用GCN-LSTM模型對細分路段車輛的平均行駛速度進行預測;根據(jù)表2確定未來該路段的擁堵指數(shù),同樣分為5個等級;同時,對處于嚴重擁堵和中度擁堵狀態(tài)的路段里程數(shù)求和,將其作為未來擁堵長度并計算擁堵時長。根據(jù)高速公路運行狀態(tài)等級劃分標準動態(tài)繪制路段顏色,通過接口將結果推送給動態(tài)情報板(見圖8),實時展示交通狀況,誘導司乘行為,提升高速公路通行效率。
圖8 高速公路動態(tài)情報板
通過采集各收費站流入、流出車輛的數(shù)量,結合特殊事件(如節(jié)假日等)統(tǒng)計各區(qū)域車輛的OD狀況,計算交通遷徙情況。交通遷徙分為內部遷徙(省內)和外部遷徙。以寧夏為例:內部遷徙指寧夏5個地級市內部的交通遷徙;外部遷徙指外省市與寧夏之間的交通遷徙。通過統(tǒng)計各收費站的車流量,計算出寧夏5個地級市之間的遷徙情況和寧夏與外省之間的遷徙情況,見圖9。
a)省內遷徙圖
在高速公路管控方面,對實時交通態(tài)勢進行研究具有重要意義,只有精確刻畫當前的交通運行狀況,才能準確誘導司乘行為,并提出合理的管控策略。本文設計了一種基于交通態(tài)勢算法的交通預警系統(tǒng),利用Van-Aerde模型準確描述區(qū)域交通流的變化特征,綜合考慮交通預測的時空性,創(chuàng)新性地提出采用GCN-LSTM模型預測未來1 h內高速公路車輛通行速度。相比ARIMA模型和SVM模型,該模型的預測準確度明顯提高,為高速公路的安全高效運行提供了重要保障。