樊博, 馬筱櫟
(1.重慶交通大學(xué) 交通運(yùn)輸學(xué)院, 重慶 400074;2.重慶市交通運(yùn)輸工程重點(diǎn)實(shí)驗(yàn)室, 重慶 400074)
高速公路旅行時(shí)間是誘導(dǎo)公眾出行的重要依據(jù),是評(píng)價(jià)道路實(shí)時(shí)運(yùn)行狀態(tài)的重要指標(biāo),也是輔助道路管理人員進(jìn)行管控資源配置的決策參考。旅行時(shí)間預(yù)測(cè)對(duì)于交通使用者和管理者都具有重要意義和應(yīng)用價(jià)值,可以說,旅行時(shí)間預(yù)測(cè)是高速公路交通管理系統(tǒng)、出行者信息系統(tǒng)中不可或缺的部分。
由于國(guó)外檢測(cè)器鋪設(shè)密度相對(duì)較高,旅行時(shí)間預(yù)測(cè)研究可以在高精度交通流數(shù)據(jù)下開展,如Moonam H.等基于歷史真實(shí)數(shù)據(jù),使用卡爾曼濾波器,針對(duì)不同類型道路預(yù)測(cè)旅行時(shí)間。對(duì)于利用收費(fèi)數(shù)據(jù)進(jìn)行旅行時(shí)間預(yù)測(cè)的研究,王翔等根據(jù)交通事故持續(xù)時(shí)間和不同時(shí)段交通狀態(tài)的特征,構(gòu)建基于改進(jìn)最近鄰非參數(shù)回歸的方法預(yù)測(cè)旅行時(shí)間,算法中各類別歷史真實(shí)數(shù)據(jù)集中K值采用交叉驗(yàn)證的方法標(biāo)定;趙建東等采用決策級(jí)融合策略,對(duì)收費(fèi)數(shù)據(jù)和微波車檢數(shù)據(jù)進(jìn)行融合,通過建立模型分配權(quán)重,使用BP神經(jīng)網(wǎng)絡(luò)進(jìn)行旅行時(shí)間預(yù)測(cè),同時(shí)引入遺傳算法對(duì)BP神經(jīng)網(wǎng)絡(luò)進(jìn)行優(yōu)化,模型預(yù)測(cè)結(jié)果的相對(duì)誤差在10%以內(nèi)。該文以高速公路中主線收費(fèi)站路段為基礎(chǔ)進(jìn)行分析,構(gòu)建影響旅行時(shí)間的解釋變量,采用支持向量回歸算法,提出一種基于收費(fèi)數(shù)據(jù)的高速公路站間旅行時(shí)間預(yù)測(cè)模型。
數(shù)據(jù)來自重慶高速公路網(wǎng)2017—2019年聯(lián)網(wǎng)收費(fèi)數(shù)據(jù),刪除其中異常數(shù)據(jù)(包括但不限于字段缺失、字段取值無效和車輛進(jìn)出收費(fèi)站的時(shí)間不合邏輯等)后提取每條信息中的車輛OD信息。經(jīng)過數(shù)據(jù)預(yù)處理后一條完整的收費(fèi)數(shù)據(jù)所包含的主要字段及含義見表1。
表1 收費(fèi)數(shù)據(jù)中包含的主要字段
選取重慶G65包茂(包頭—茂名)高速公路渝湘段為研究對(duì)象。該項(xiàng)目全長(zhǎng)84.5 km,由巴南主線收費(fèi)站起,出城單向途經(jīng)南彭、接龍、石龍、大觀、南川、金佛山8個(gè)收費(fèi)站后到水江收費(fèi)站為止。
以2018年為例,路網(wǎng)上總流量分布受客車流量分布影響最大,貨車流量則基本上維持在相對(duì)穩(wěn)定狀態(tài)(見圖1)??蛙囍械囊恍涂蛙嚕浣煌空伎蛙嚵髁康慕^大部分,具有一定的代表性。同時(shí)已有研究表明,高速公路交通系統(tǒng)中可用一型客車的旅行時(shí)間來推算其他車型的旅行時(shí)間。因此,以一型客車作為主要研究車型。
隨機(jī)統(tǒng)計(jì)工作日、周末和節(jié)假日路網(wǎng)流量小時(shí)分布,結(jié)果見圖2。由圖2可知:路網(wǎng)夜晚和凌晨時(shí)段流量相對(duì)稀少,該時(shí)段車輛以自由流速度行駛,無預(yù)測(cè)必要。因此,以7:00—20:00作為預(yù)測(cè)時(shí)段。
圖1 重慶高速公路網(wǎng)2018年全年流量月份分布
圖2 重慶高速公路網(wǎng)流量小時(shí)分布
如圖3所示,高速公路A、B收費(fèi)站之間的路段稱為k站間,站間旅行時(shí)間是指在某時(shí)間周期內(nèi)由A入口駛?cè)?、B出口駛出高速公路的所有車輛的平均行駛時(shí)間,也可稱為旅行時(shí)間。
圖3 高速公路收費(fèi)站間示意圖
可根據(jù)收費(fèi)數(shù)據(jù)中車輛經(jīng)收費(fèi)站進(jìn)出高速公路的時(shí)間計(jì)算k站間在周期T內(nèi)的旅行時(shí)間:
(1)
(2)
由于部分時(shí)間相鄰收費(fèi)站間OD記錄較少,甚至某些相鄰站間在某些時(shí)段內(nèi)無OD記錄,無法提取站間真實(shí)交通運(yùn)行狀態(tài)的旅行時(shí)間。另外,由于某些特殊駕駛行為(如車輛長(zhǎng)時(shí)間以低于最低限速或超速行駛、車輛進(jìn)入服務(wù)區(qū)休息等)產(chǎn)生的異常旅行時(shí)間對(duì)提取OD間準(zhǔn)確的旅行時(shí)間有所影響,有必要對(duì)該類數(shù)據(jù)進(jìn)行控制。
對(duì)旅行時(shí)間數(shù)據(jù)的控制主要分為數(shù)據(jù)清洗和數(shù)據(jù)修補(bǔ)。數(shù)據(jù)清洗流程如下:1) 刪除旅行時(shí)間大于一個(gè)自然日的數(shù)據(jù);2) 刪除平均速度超過道路最大限速20%的數(shù)據(jù);3) 計(jì)算各周期內(nèi)車輛旅行時(shí)間的均值μ和標(biāo)準(zhǔn)差δ,按照2δ原理刪除旅行時(shí)間不在[μ-2δ,μ+2δ]范圍內(nèi)的數(shù)據(jù);4) 重復(fù)步驟3直至剔除所有不在有效范圍內(nèi)的數(shù)據(jù)。
(3)
(4)
(5)
在構(gòu)建影響旅行時(shí)間的解釋變量時(shí),將變量分為前期旅行時(shí)間,月份、周天、時(shí)段,大小車旅行時(shí)間差值,道路環(huán)境、天氣條件。
選取該預(yù)測(cè)站間k的前期旅行時(shí)間為備選變量,為確定變量中前期旅行時(shí)間的周期數(shù)量,隨機(jī)選取該項(xiàng)目某2個(gè)月、某2個(gè)不相鄰站間p和q的前5個(gè)周期旅行時(shí)間進(jìn)行相關(guān)性分析,相關(guān)系數(shù)計(jì)算結(jié)果見表2。
表2 當(dāng)前周期旅行時(shí)間與前期旅行時(shí)間的相關(guān)系數(shù)
由表2可知:當(dāng)前時(shí)間下的旅行時(shí)間與其前3 個(gè)周期旅行時(shí)間的相關(guān)性較高。因此,選擇前3 個(gè)周期旅行時(shí)間作為備選變量。
以月份、周天和時(shí)段為變量對(duì)主線收費(fèi)站交通量分布規(guī)律進(jìn)行分析,確定各變量分類。
對(duì)于時(shí)段,根據(jù)圖2路網(wǎng)流量分布可將預(yù)測(cè)時(shí)段分為兩類:一類為出行高峰時(shí)段7:00—11:00和13:00—18:00;另一類為平峰時(shí)段11:00—13:00和18:00—20:00。
對(duì)于月份,統(tǒng)計(jì)2018年各月進(jìn)入主線收費(fèi)站的日均流量,結(jié)果見圖4。按照各月日均流量分布可將全年12個(gè)月分為兩類:第一類為1、3、4、5、10、11和12月;第二類為2、6、7、8和9月。
圖4 通道主線收費(fèi)站日均流量月份分布
再統(tǒng)計(jì)各周天進(jìn)入主線收費(fèi)站的日均流量,并進(jìn)行系統(tǒng)聚類,結(jié)果見圖5。根據(jù)圖5,將周天變量分為三類:周一到周四為一類;周日為一類;周五、周六為一類。
圖5 周天聚類譜系圖
相比城市交通系統(tǒng),高速公路系統(tǒng)各周期內(nèi)貨車平均數(shù)量較多,交通流量中貨運(yùn)車輛所占比例對(duì)交通運(yùn)行狀態(tài)有一定影響,而交通運(yùn)行狀態(tài)又與車輛旅行時(shí)間密切相關(guān)。小車(一型客車)旅行時(shí)間與大車(所有貨車)旅行時(shí)間的差值一定程度上能反映站間交通狀態(tài),在運(yùn)行暢通的路段上,大、小車旅行時(shí)間基本維持在相對(duì)固定的差值;較為擁堵時(shí),大、小車旅行時(shí)間差值會(huì)降低,意味著交通狀態(tài)已經(jīng)或正在發(fā)生某些改變,這些改變又會(huì)對(duì)下一時(shí)刻的旅行時(shí)間產(chǎn)生影響。因此,引入周期內(nèi)大小車旅行時(shí)間差值作為變量之一。
就道路環(huán)境而言,根據(jù)重慶山區(qū)高速公路多橋梁、隧道的特點(diǎn),選取站間內(nèi)橋梁、隧道長(zhǎng)度作為備選變量。對(duì)于天氣條件,按晴天、陰雨天和霧天雪天對(duì)其進(jìn)行劃分。
綜上,影響高速公路旅行時(shí)間的解釋變量及含義見表3。
表3 解釋變量
(6)
κ(xu,xv)=exp(-δ‖xu-xv‖)2
(7)
式中:δ為超參數(shù),設(shè)置為1。
對(duì)式(6)進(jìn)行求解,得:
(8)
式中:b為偏置誤差項(xiàng),可借助KKT條件求解。
4.2.1 性能評(píng)價(jià)指標(biāo)
選取均方根誤差(RMSE)、平均相對(duì)誤差(MAPE)作為模型的評(píng)價(jià)指標(biāo),計(jì)算公式如下:
(9)
(10)
4.2.2 預(yù)測(cè)結(jié)果分析
以某站間某天的旅行時(shí)間為例,通過修正,旅行時(shí)間相比未經(jīng)處理的原數(shù)據(jù)波動(dòng)范圍有所減小,缺少有效數(shù)據(jù)的周期也得到修補(bǔ)(見圖6)。
圖6 修正旅行時(shí)間
將真實(shí)旅行時(shí)間按7∶3劃分訓(xùn)練集和測(cè)試集,選取m站間(路段長(zhǎng)度為6 km,其中橋梁、隧道長(zhǎng)度為零)和n站間(路段長(zhǎng)度為16 km,其中橋梁、隧道長(zhǎng)度為4.85 km)。圖7為m站間在一般情況場(chǎng)景下某周一和某事故場(chǎng)景下的模型預(yù)測(cè)結(jié)果,圖8為n站間在暑期場(chǎng)景下某周日和端午節(jié)假日下的模型預(yù)測(cè)結(jié)果。
圖7 m站間分場(chǎng)景預(yù)測(cè)結(jié)果
由圖7可知:模型在一般情況場(chǎng)景下表現(xiàn)較好;由于構(gòu)建的解釋變量中缺少能準(zhǔn)確描述偶然事件下旅行時(shí)間的影響因素,模型對(duì)偶然事件場(chǎng)景下的預(yù)測(cè)能力表現(xiàn)不足,但在非事故影響周期內(nèi),模型仍有一定的預(yù)測(cè)能力。
由圖8可知:模型在暑期場(chǎng)景下的預(yù)測(cè)精度總體較高;在節(jié)假日?qǐng)鼍跋乱簿哂幸欢ǖ念A(yù)測(cè)能力。
綜上,模型總體表現(xiàn)能力較優(yōu),尤其是在一般場(chǎng)景和暑期場(chǎng)景下,平均相對(duì)誤差分別為5.17%、8.30%;相較于一般場(chǎng)景和暑期場(chǎng)景,節(jié)假日?qǐng)鼍跋露虝r(shí)間內(nèi)或某些周期內(nèi)的車流量更多,模型預(yù)測(cè)誤差較高。不同場(chǎng)景下模型預(yù)測(cè)結(jié)果的誤差見表4。
圖8 n站間分場(chǎng)景預(yù)測(cè)結(jié)果
表4 模型預(yù)測(cè)結(jié)果評(píng)價(jià)
(1) 構(gòu)造SVR模型預(yù)測(cè)高速公路旅行時(shí)間可行、有效,模型在一般情況場(chǎng)景和暑期場(chǎng)景下的預(yù)測(cè)精度較高,對(duì)節(jié)假日也有一定的預(yù)測(cè)能力。
(2) 要實(shí)現(xiàn)模型對(duì)偶然事件下的準(zhǔn)確預(yù)測(cè),僅考慮大小車旅行時(shí)間差值還不夠,需引進(jìn)更能描述偶然事件的參數(shù)變量。
(3) 下一步可考慮道路線形等相關(guān)變量,進(jìn)一步提高模型的可靠性和適用性;同時(shí)使用特征選擇方法,去掉解釋變量中可能存在的冗余變量,進(jìn)一步提高模型的計(jì)算能力。