楊 航,王忠宇,鄒亞杰,吳 兵
(1.同濟(jì)大學(xué) 道路與交通工程教育部重點實驗室,上海 201804;2.上海海事大學(xué) 交通運(yùn)輸學(xué)院,上海 201306)
短時行程時間預(yù)測是智能交通系統(tǒng)的基礎(chǔ)輸入之一,也是道路交通運(yùn)行狀態(tài)的重要評價指標(biāo)[1].一般認(rèn)為,兩個決策點之間的時間跨度小于或等于15 min屬于短時預(yù)測[2].高速公路行程時間的預(yù)測方法主要有時間序列法[3]、卡爾曼濾波模型[4]、支持向量機(jī)模型[5]、神經(jīng)網(wǎng)絡(luò)模型[6]、數(shù)據(jù)挖掘法[7]以及一系列組合模型[8]等.在近幾年的研究中,由于組合模型可以克服單一模型在預(yù)測時的缺陷,通常呈現(xiàn)出優(yōu)于單一模型的預(yù)測精度[9],因此組合模型出現(xiàn)的頻率逐漸提高.Zhang等[10]指出,交通流特征由兩部分組成:一是確定性特征,影響因素為道路幾何設(shè)計、常態(tài)下的交通需求、交通管理措施(限速)等;二是非確定性特征,影響因素為交通事件、惡劣天氣等突發(fā)因素.因此,高速公路行程時間不僅包含確定性的周期性特征,還存在非確定性的殘余成分[11].
周期性分析是行程時間預(yù)測中極其重要的一部分,現(xiàn)有研究已經(jīng)證明行程時間在時間上和空間上均存在著較為顯著的周期性.Zhang等[12]提出行程時間的周期性特征表現(xiàn)為以下兩種:一種是以一天24 h為比較維度,一種是以一周7 d為比較維度.兩種維度下相同路段的行程時間多數(shù)呈現(xiàn)較為明顯的周期性特征.Zou等[13]采用了基于三角函數(shù)成分的回歸模型對行程時間的周期性進(jìn)行了分析,并證明該回歸模型在預(yù)測間隔超過30 min時仍具有較好的預(yù)測精度.Zhang等[14]采用頻率分析法對車輛在不同路段的周期性特征進(jìn)行了提取和分析,并基于分析結(jié)果對車輛在不同貨運(yùn)點的延誤時間進(jìn)行了預(yù)測.
除去體現(xiàn)確定性成分的周期性特征,還需要對非確定性的殘余成分進(jìn)行分析,以提高預(yù)測精度.Vlahogianni等[15]指出,需要對行程時間數(shù)據(jù)進(jìn)行去趨勢化分析,以提升預(yù)測精度.去趨勢化分析指的是將周期性預(yù)測值從原始數(shù)據(jù)中去除,對剩余不確定性的殘量部分進(jìn)行二次預(yù)測.現(xiàn)有研究主要采用多狀態(tài)轉(zhuǎn)換模型[16]進(jìn)行去趨勢化分析.馬爾可夫鏈模型是去趨勢化分析中較為有效和常見的一種手段,往往用于和其他模型配合使用以提高預(yù)測精度.D’Angelo等[17]采用馬爾可夫鏈與周期性預(yù)測相結(jié)合的方式,對高速公路的常發(fā)性擁堵進(jìn)行了預(yù)測,結(jié)果證明該模型比對照組模型有較為顯著的預(yù)測優(yōu)勢.Yeon等[18]基于交通狀態(tài)劃分結(jié)果,建立了交通狀態(tài)概率轉(zhuǎn)移矩陣,構(gòu)建了非連續(xù)的馬爾可夫鏈模型,并比較了不同交通狀態(tài)下各模型對高速公路各路段行程時間的預(yù)測精度.
基于二次訓(xùn)練的周期性預(yù)測和去趨勢化分析的結(jié)合是當(dāng)前大部分組合模型的組成結(jié)構(gòu),但Polson等[19]通過分析一次訓(xùn)練與二次訓(xùn)練的誤差傳遞規(guī)律得出:基于多次訓(xùn)練的預(yù)測方法會造成過擬合的發(fā)生,降低模型在數(shù)據(jù)波動性較強(qiáng)情況下的預(yù)測精度.Zhang等[20]考慮了預(yù)測中數(shù)據(jù)的波動性因素,并采用頻譜分析法提高了行程時間的預(yù)測可靠度.
現(xiàn)有研究的關(guān)注點多數(shù)聚焦在如何提升短時行程時間預(yù)測模型的預(yù)測精度,而對于不同交通狀態(tài)下的預(yù)測穩(wěn)定性、組合模型可能產(chǎn)生的多余噪聲以及行程時間突變點(數(shù)值激增或驟降的時刻)的預(yù)測及時性等方面的內(nèi)容涉及相對較少[21-22],需要進(jìn)一步考慮模型在這些方面的優(yōu)化問題.
本研究改善了傳統(tǒng)組合預(yù)測模型的結(jié)構(gòu),通過噪聲修正模型構(gòu)建了波動性分析模塊,緩解了過擬合效應(yīng)所帶來的預(yù)測不穩(wěn)定性.同時,面向相對誤差修正的馬爾可夫鏈不需要針對交通狀態(tài)進(jìn)行狀態(tài)劃分,提升了模型的應(yīng)用靈活性,使得模型具備了處理其他高速公路路段行程時間數(shù)據(jù)的潛力.此外,噪聲修正模塊的加入提高了模型在擁堵狀態(tài)下的預(yù)測精度和魯棒性,使得模型具備了捕捉行程時間突變點的能力,緩解了預(yù)測的延遲性,從而可為高速公路交通運(yùn)行管理提供決策依據(jù).
本研究所使用的行程時間數(shù)據(jù)采集于美國高速公路US -290中的編號 I-610 至 FM-1960間的路段,位于德克薩斯州的城市休斯頓.數(shù)據(jù)采集時間段為2008年1月至2008年8月的每周二到四,每隔30 s采集一次,每30 s的檢測數(shù)據(jù)集計成5 min的區(qū)間,一天共采集24 h.該路段有著較明顯的潮汐特征,路段由東向西方向在晚高峰承擔(dān)了大量交通流.這種交通流的不均衡性,有助于檢驗組合模型波動性分析模塊的有效性,也有助于驗證組合模型在捕捉晚高峰行程時間“拐點”的及時性和穩(wěn)定性.研究路段長19.3 km,自由流速度下的通過時間約為15 min.路段上共布設(shè)了六個AVI (automatic vehicle identification) 檢測器,在車輛通過時記錄車牌號,通過相同車牌在各個檢測器經(jīng)過的時刻間隔獲取行程時間.六個檢測器將選定路段分為五個子路段(A、B、C、D、E),長度分別為1.3、4.2、4.8、2.4、6.6 km.檢測器布置如圖1所示,虛線框包圍部分為本研究所要涉及的路段,每個雷達(dá)感應(yīng)器旁標(biāo)注的四位數(shù)為對應(yīng)編號.
本研究的組合模型分為以下三部分:體現(xiàn)確定性特征的周期性部分,采用小波神經(jīng)網(wǎng)絡(luò)(WNN)預(yù)測原始數(shù)據(jù),得到初步預(yù)測值;體現(xiàn)非確定性誤差特征的殘量部分,采用馬爾可夫鏈(MKC)對初步預(yù)測值的相對誤差進(jìn)行修正,得到預(yù)測后的相對誤差值;體現(xiàn)非確定性噪聲的波動分析模塊,采用GJR-GARCH (Glosten-Jagannathan-Runkle-generalized-autoregressive-conditional-heteroskedasticity)模型緩解噪聲.最終的短時行程時間組合預(yù)測值為三部分預(yù)測值之和,組合預(yù)測模型WNN-MKC-GJR的結(jié)構(gòu)表達(dá)式如下所示:
Xt=ct+rt+vt
(1)
式中:Xt為組合模型t時刻的預(yù)測值;ct為改進(jìn)后的小波神經(jīng)網(wǎng)絡(luò)t時刻的周期性預(yù)測值;rt為經(jīng)過馬爾可夫鏈修正的t時刻的相對誤差值;vt為GJR-GARCH模型預(yù)測的t時刻波動量.
作為人工智能算法之一的神經(jīng)網(wǎng)絡(luò)可用于檢測常態(tài)下交通流的周期性特征,并在預(yù)測行程時間周期性的實例中得到了成功應(yīng)用[23].小波神經(jīng)網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu)如圖2所示.圖2中,ui為第i個輸入變量,wi為ui對應(yīng)的輸入層節(jié)點,Ti為ui對應(yīng)的輸出層節(jié)點,Y(ui)為ui對應(yīng)的小波基函數(shù).本研究的神經(jīng)網(wǎng)絡(luò)中,輸入層為各個時刻的行程時間真實值,輸出層為各個時刻對應(yīng)的行程時間預(yù)測值,中間層為各個輸入值對應(yīng)的小波變換函數(shù),因此各層的神經(jīng)元數(shù)量相同.
圖1 US-290路段
圖2 小波神經(jīng)網(wǎng)絡(luò)的拓?fù)浣Y(jié)構(gòu)
采用母小波基函數(shù)作為隱藏層激發(fā)函數(shù),該函數(shù)通過變換分析信號的局部特征,在捕捉原始數(shù)據(jù)的周期性特征上具有穩(wěn)定性和高效性[24],函數(shù)表達(dá)式為
(2)
小波神經(jīng)網(wǎng)絡(luò)的算法核心是小波分析和傅里葉變換,變換的頻率和振幅決定了小波預(yù)測結(jié)果的振蕩幅度.Antonini等[24]通過增加二次誤差反饋模塊,基于誤差動態(tài)實現(xiàn)小波變換的頻率和振幅,增加了小波變換的穩(wěn)定性.動態(tài)小波變換函數(shù)yt和小波系數(shù)關(guān)系函數(shù)O(yt-1)如下所示:
yt=f(yt-1)+g(xt-1)+et
(3)
(4)
式中:x(t-1)為(t-1)時刻的狀態(tài)向量;yt-1為(t-1)時刻反饋的行程時間輸入向量;f(·)為關(guān)于yt-1的標(biāo)量化非線性映射函數(shù);g(·)為關(guān)于xt的標(biāo)量化非線性映射函數(shù);et為t時刻實際行程時間值與未來輸出層預(yù)測值之間的誤差向量;M為分析時段內(nèi)出現(xiàn)的完整小波周期數(shù);O(yt-1)為f(yt-1)的極大似然估計值;Wq為第q個周期的離散化小波變換系數(shù);a為頻率(振幅);b為時空維度;L(yt-1)為小波變換函數(shù)yt-1的二維函數(shù)空間;ψa,b(yt-1)為二維小波衍生函數(shù).ψa,b(yt-1)是基于標(biāo)準(zhǔn)化小波函數(shù)轉(zhuǎn)化而來,如下所示:
(5)
式中:φ(·)為標(biāo)準(zhǔn)化小波函數(shù).以這兩個函數(shù)構(gòu)成小波變換函數(shù),對傳統(tǒng)小波神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)進(jìn)行改進(jìn),減少需要標(biāo)定的參數(shù)個數(shù),提高算法的收斂速度.
Zhang[25]的研究指出,神經(jīng)網(wǎng)絡(luò)在t時刻的預(yù)測誤差與(t-1)時刻是高度相關(guān)的,而與之前時刻的相關(guān)性很小.馬爾可夫鏈模型的顯著特征是非后效性,即目標(biāo)在當(dāng)前時刻的狀態(tài)只與前一個時刻的狀態(tài)相關(guān),而與之前任何時刻的狀態(tài)無關(guān),與神經(jīng)網(wǎng)絡(luò)預(yù)測誤差的特征相符合.現(xiàn)有研究多采用馬爾可夫鏈對交通流運(yùn)行狀態(tài)進(jìn)行劃分,分為擁堵、半擁堵與非擁堵三個狀態(tài)[18].該劃分方法的缺點在于半擁堵的過渡狀態(tài)很難量化,當(dāng)過渡狀態(tài)不明顯時,會嚴(yán)重影響馬爾可夫鏈的收斂精度及速度.針對誤差的狀態(tài)劃分方法則具有更廣泛的適用性.采用馬爾可夫鏈對初步預(yù)測值的相對誤差進(jìn)行二次修正,獲得的修正值將作為相對誤差預(yù)測值.
多狀態(tài)轉(zhuǎn)換模型的預(yù)測過程包含以下三個步驟:確定各個狀態(tài)及對應(yīng)區(qū)間,將待處理數(shù)據(jù)放入對應(yīng)區(qū)間,預(yù)測每個區(qū)間出現(xiàn)的概率.作為多狀態(tài)轉(zhuǎn)換模型的一種,馬爾可夫鏈的構(gòu)建及求解過程亦遵循這一過程.首先將小波神經(jīng)網(wǎng)絡(luò)訓(xùn)練組的相對誤差集合成數(shù)據(jù)鏈,將相對誤差劃分為N個狀態(tài)(s1,s2,…,sN),每一個狀態(tài)對應(yīng)一個相對誤差區(qū)間.采用一種基于二叉判定圖的劃分方法對數(shù)據(jù)鏈進(jìn)行狀態(tài)劃分,關(guān)于該方法的細(xì)節(jié)可參考Xie等[26]的研究,每個狀態(tài)對應(yīng)一個相對誤差的范圍區(qū)間.接著,將數(shù)據(jù)鏈中的各個誤差分入對應(yīng)的區(qū)間.最后,在數(shù)據(jù)劃分的基礎(chǔ)上對相對誤差的最終狀態(tài)進(jìn)行求解.
構(gòu)建馬爾可夫鏈一步轉(zhuǎn)移概率矩陣P,矩陣中的每個元素為pIJ,表達(dá)式如下所示:
(6)
式中:pIJ為小波神經(jīng)網(wǎng)絡(luò)訓(xùn)練組的相對誤差由第I個狀態(tài)轉(zhuǎn)移至第J個狀態(tài)的出現(xiàn)概率;oI為第I個狀態(tài)出現(xiàn)的次數(shù);oIJ為第I個狀態(tài)轉(zhuǎn)移至第J個狀態(tài)的次數(shù).
定義系統(tǒng)的初始狀態(tài)矩陣為S0,表達(dá)式如下所示:
(7)
經(jīng)過K次一步轉(zhuǎn)移概率矩陣運(yùn)算后得到最終狀態(tài)SK,SK可通過切普曼-柯爾莫哥洛夫方程求得,如下所示:
SK=SK-1P=S0PK
(8)
待馬爾可夫鏈?zhǔn)諗恐?,每個最大概率對應(yīng)的狀態(tài)被選為修正狀態(tài),對應(yīng)的區(qū)間作為相對誤差的修正區(qū)間,取每個時刻t的預(yù)測區(qū)間中值Ut作為相對誤差值的預(yù)測值rt,表達(dá)式如下所示:
rt=dt(1-Ut)
(9)
式中:dt是經(jīng)過AVI檢測器獲取的t時刻行程時間原始數(shù)據(jù).
將人工智能算法與統(tǒng)計學(xué)方法相結(jié)合的組合預(yù)測模型容易引入多余噪聲,從而產(chǎn)生過擬合效應(yīng),這對于高峰時期波動性較大的行程時間的預(yù)測精度和預(yù)測穩(wěn)定性帶來很大影響.一般認(rèn)為,過擬合效應(yīng)所帶來的白噪聲一般符合白噪聲屬性[20].廣義的自回歸條件化異方差(GARCH)模型能夠較好地描述過擬合效應(yīng)中波動量vt的概率分布,如下所示:
(10)
(11)
式中:zt為t時刻符合標(biāo)準(zhǔn)正態(tài)分布的數(shù)集;ht為t時刻vt的中間變量;E為期望值計算;Ft-1為(t-1)時刻波動量vt-1對應(yīng)的F檢驗標(biāo)準(zhǔn)值.
基于條件化的異方差模型,本研究所采用的波動分析模型考慮了不同時刻的行程時間數(shù)據(jù)所對應(yīng)的不同條件變量,通過異方差模型模擬波動性變量vt在不同時刻的概率分布.
Bollerslev[27]首次提出可采用廣義的自回歸條件化異方差模型來模擬噪聲分布,該模型適用性較廣,但沒有考慮原數(shù)據(jù)的不對稱性,而研究路段的行程時間具有明顯的潮汐性,因此該方法并不適用.Glosten等[28]在Bollerslev研究的基礎(chǔ)上提出了GJR-GARCH模型,通過引入新的二維條件變量,獲取股票數(shù)據(jù)初始預(yù)測誤差中的不對稱特性,并通過正變量和負(fù)變量的交替以及不同時段下系數(shù)與波動量的交叉修正,緩解了多步預(yù)測時誤差在傳播過程中所產(chǎn)生的振蕩,對過擬合所形成的多余噪聲進(jìn)行了平滑修正,從而很大程度上緩解了過擬合效應(yīng),表達(dá)式如下所示:
(12)
式中:G為常數(shù);l為系數(shù)βj對應(yīng)的波動平滑時段;βj為與j時刻交叉對應(yīng)的中間變量ht-j的非負(fù)平滑系數(shù);Q為系數(shù)αk和γk對應(yīng)的波動平滑時段;αk為與k時刻交叉對應(yīng)的波動量vt-k的非負(fù)平滑系數(shù);γk為與k時刻交叉對應(yīng)的引入修正變量的波動量vt-k的非負(fù)平滑系數(shù);λt-k為(t-k)時刻關(guān)于波動量vt-k的二元修正變量.λt-k的表達(dá)式如下所示:
(13)
當(dāng)所有γk均為零時,GJR-GARCH模型轉(zhuǎn)變?yōu)闃?biāo)準(zhǔn)化的GARCH(l,Q)模型.本研究中將采用該模型對行程時間預(yù)測中可能產(chǎn)生的過擬合效應(yīng)進(jìn)行緩解.
3.1.1改進(jìn)的小波神經(jīng)網(wǎng)絡(luò)模型
基于組合模型WNN-MKC-GJR的架構(gòu),對行程時間數(shù)據(jù)進(jìn)行組合預(yù)測.本研究選用的WNN模型的輸入層為所選路段的歷史行程時間數(shù)據(jù).根據(jù)數(shù)據(jù)篩選,將3月至7月的每周二到四的行程時間數(shù)據(jù)作為訓(xùn)練組,將8月前12個研究日的數(shù)據(jù)作為測試組,輸出層為第13個研究日,即8月28日的行程時間預(yù)測值.將行程時間波動較大的路段D作為目標(biāo)路段,用以檢驗波動性分析模塊的有效性.以路段D上游的路段A、B、C以及下游的路段E作為關(guān)聯(lián)路段,通過改進(jìn)的動態(tài)小波變換函數(shù)對關(guān)聯(lián)路段進(jìn)行動態(tài)權(quán)重賦值.五條路段的歷史行程時間數(shù)據(jù)的中值統(tǒng)計情況如圖3所示.
圖3 五個路段的歷史行程時間數(shù)據(jù)分布
圖3中,每個時間點對應(yīng)的行程時間值為2008年1月—8月中所有對應(yīng)時間點的行程時間值的平均數(shù).由圖3可以看出,各個路段上每天均有3 h左右的波峰時段,即高峰擁堵時段,但在出現(xiàn)的時間上有先后差異.路段A的行程時間在15∶00左右開始增加,16∶30左右達(dá)到峰值,并在18∶00左右完成擁堵消散.路段B、C的行程時間同樣在15∶00開始呈現(xiàn)上升趨勢,17∶30左右達(dá)到峰值,并在19∶00左右恢復(fù)平峰速度.路段D、E的行程時間在16∶00左右開始上升,較前三個路段晚了1 h,峰值在17∶30左右產(chǎn)生,擁堵結(jié)束時間為19∶00左右.五個路段的行程時間在時空分布上具有相似性和傳遞性,因此相互之間有著較強(qiáng)的相關(guān)性.基于此相關(guān)性,在小波神經(jīng)網(wǎng)絡(luò)中可將其中幾個路段作為關(guān)聯(lián)路段,將剩下的路段作為目標(biāo)路段進(jìn)行訓(xùn)練,以提高預(yù)測精度.路段D上的行程時間波動較大,可用來檢驗波動分析模塊的有效性.因此,以路段D為目標(biāo)路段,以路段D上游的路段A、B、C以及下游的路段E作為關(guān)聯(lián)路段,通過改進(jìn)的動態(tài)小波變換函數(shù)對關(guān)聯(lián)路段進(jìn)行動態(tài)賦權(quán).
3.1.2馬爾可夫鏈模型
在小波神經(jīng)網(wǎng)絡(luò)模型得到初步預(yù)測值之后,采用馬爾可夫鏈對初步預(yù)測值的對應(yīng)相對誤差進(jìn)行修正,t時刻相對誤差Zt3的表達(dá)式如下所示:
(14)
式中:Zt1和Zt2分別為t時刻行程時間的實際值和小波神經(jīng)網(wǎng)絡(luò)預(yù)測值.
根據(jù)基于二叉判定圖[26]的劃分方法對數(shù)據(jù)鏈進(jìn)行狀態(tài)劃分,將初始預(yù)測值對應(yīng)的相對誤差集合劃分為九個狀態(tài)(s1,s2,…,s9),具體對應(yīng)區(qū)間如表1所示.
基于狀態(tài)劃分結(jié)果,分別建立小波神經(jīng)網(wǎng)絡(luò)測試組在15∶30—19∶30各個時刻的狀態(tài)分布矩陣.將15∶30的狀態(tài)分布矩陣作為初始狀態(tài)矩陣S0,并構(gòu)建馬爾可夫鏈一步轉(zhuǎn)移概率矩陣P,如下所示:
(15)
表1 馬爾可夫鏈狀態(tài)劃分
基于切普曼-柯爾莫哥洛夫方程,可得到8月28日15∶30—19∶30每隔5 min的時刻點對應(yīng)的預(yù)測相對誤差值.
3.1.3GJR-GARCH模型
不同的(l,Q)組合下,GJR-GARCH模型的噪聲削減效果不盡相同.Zhang等[20]指出,當(dāng)l、Q均為1時,GJR-GARCH(1,1)模型相比于其他參數(shù)模型能夠更好地應(yīng)對非對稱性較強(qiáng)的行程時間數(shù)據(jù),并且具有較好的白噪聲削減作用,因此研究也采用GJR-GARCH(1,1)模型作為波動性分析模型.參數(shù)估計都采用最大似然估計法,并通過Matlab的“garch”工具箱中的多變量GARCH模型實現(xiàn)GJR-GARCH(1,1)模型的波動性分析功能.
3.1.4對照模型
使用三個經(jīng)典模型作為組合預(yù)測模型的對照組,分別是傳統(tǒng)小波神經(jīng)網(wǎng)絡(luò)模型、BP神經(jīng)網(wǎng)絡(luò)模型以及兩步自回歸(automatic regression 2-step, AR(2))模型.AR(2)模型的計算表達(dá)式如下所示:
H(t)=θH(t-1)+(1-θ)H(t-2)+δ(t)
(16)
式中:H(t)為t時刻AR(2)模型的預(yù)測值;θ為平滑權(quán)重系數(shù);δ(t)為t時刻的隨機(jī)噪聲.
經(jīng)過對不同θ的檢驗測試,當(dāng)平滑權(quán)重系數(shù)搜索至0.5附近時,模型的預(yù)測表現(xiàn)最佳,并且在(0.50-0.01,0.50+0.01)范圍內(nèi)波動時AR(2)的預(yù)測精度區(qū)別不大,因此以0.5作為AR(2)模型的平滑權(quán)重系數(shù).
除以上三個模型,本研究還將基于BP、AR(2)、MKC和GJR-GARCH模型構(gòu)建另外兩個對照組合模型,因此共有五個對照模型.兩個對照組合模型分別是BP-MKC-GJR模型和AR(2)-MKC-GJR模型,結(jié)構(gòu)及計算過程與WNN-MKC-GJR模型類似,波動分析模塊均采用GJR-GARCH(1,1)模型.
采用平均絕對誤差E1、平均絕對百分比誤差E2與均方根誤差E3評價模型性能,表達(dá)式如下所示:
(17)
式中:n為預(yù)測時段內(nèi)時刻點的總個數(shù).
所有模型對2008年8月28日路段D行程時間數(shù)據(jù)的預(yù)測如圖4、5所示.
圖4比較了各模型預(yù)測值與真實值的差異,用于觀察各模型的預(yù)測精度.圖5展示了各個時間點不同模型預(yù)測值與真實值的相對誤差,用于體現(xiàn)各模型在不同時段的預(yù)測穩(wěn)定性.
如圖4所示,在非擁堵時段15∶30—16∶45內(nèi),各模型曲線趨于平穩(wěn)且較為接近,說明該時段內(nèi)各模型都能較好地預(yù)測行程時間;在擁堵時段16∶50—18∶50內(nèi),WNN-MKC-GJR組合模型所在的曲線最接近真實值曲線,說明該組合預(yù)測模型在高峰時段內(nèi)有較高的預(yù)測精度;AR(2)所在的曲線偏離真實值曲線較多,并且當(dāng)16∶50行程時間出現(xiàn)突變時,AR(2)對于該拐點的預(yù)測滯后于其他五個模型,在拐點的預(yù)測誤差為62 s,說明AR(2)模型在處理波動性較強(qiáng)的數(shù)據(jù)時有明顯局限性;WNN-MKC-GJR組合模型在拐點 16∶50 預(yù)測上沒有滯后性,在16∶45—16∶50準(zhǔn)確預(yù)測了行程時間的突變趨勢,在突變點的預(yù)測值與真實值最為接近,預(yù)測誤差為18 s.
圖4 行程時間預(yù)測結(jié)果
圖5 預(yù)測的相對誤差
如圖5所示,非擁堵時段內(nèi)各模型預(yù)測值對應(yīng)的相對誤差波動較小,說明各模型在該時段都有著較好的預(yù)測穩(wěn)定性;在行程時間發(fā)生突變的時間點 16∶50,各預(yù)測模型相對誤差曲線都出現(xiàn)了不同程度的振蕩,其中WNN-MKC-GJR組合模型的振蕩幅度最小,相對誤差為-15%,并且該值在擁堵時段內(nèi)一直保持相對較低的水平,曲線保持平穩(wěn),相對誤差極值為26%,說明該組合模型在高峰時段內(nèi)有著較好的預(yù)測穩(wěn)定性;AR(2)模型在擁堵時段內(nèi)的相對誤差較于其他五個模型偏高,說明該模型的預(yù)測穩(wěn)定性較低.
圖4、5表明:在增加馬爾可夫鏈二次修正模塊和GJR-GARCH模型的波動性分析模塊后,模型的預(yù)測精度和預(yù)測穩(wěn)定性較之對應(yīng)的單個模型都會有不同程度的提升.通過三個指標(biāo)進(jìn)一步反映各個模型在不同時段(行程時間突變點前后)內(nèi)的預(yù)測能力,如表2所示.從表2可得出以下結(jié)論:
(1) 從整個晚高峰時段來看,WNN-MKC-GJR模型在三個指標(biāo)下的表現(xiàn)都要好于其他五個模型.在行程時間突變發(fā)生之前,基于線性預(yù)測的AR(2)模型表現(xiàn)最優(yōu),原因在于當(dāng)行程時間波動較小時,基于線性迭代的預(yù)測方法能更好地接近真實值;在行程時間發(fā)生突變之后,WNN-MKC-GJR模型明顯優(yōu)于其他模型,說明所提出的組合模型在擁堵時段內(nèi)有著更好的預(yù)測精度.
表2 預(yù)測性能指標(biāo)比較
(2) 行程時間突變點之前,在增加MKC-GJR模塊之后,WNN、BP和AR(2)模型在三個指標(biāo)上并未全部提升;在行程時間發(fā)生突變之后,MKC-GJR模塊對于WNN、BP和AR(2)模型的預(yù)測精度均有不同程度的提升,說明馬爾可夫鏈與GJR-GARCH模型的組合可以提升單一模型在擁堵時段內(nèi)的預(yù)測精度.
(3)E3值方面,單個模型在加入MKC-GJR模塊成為組合模型之后,某些預(yù)測性能上可能會超過原本比自己高級的單一模型,如BP-MKC-GJR在特定時段(全時段和突變后)內(nèi)三個指標(biāo)均優(yōu)于WNN,同時AR(2)-MKC-GJR在任何時段三個指標(biāo)均優(yōu)于BP.在實際運(yùn)營管理中考慮計算時間的約束時,這一個特征也可以為預(yù)測模型的選擇帶來更多的靈活性.
(1) 在充分考慮實際運(yùn)行過程中行程時間周期性、潮汐性、高峰時段不穩(wěn)定性后,基于周期性預(yù)測、殘量修正和波動性分析三個部分構(gòu)建了新的組合架構(gòu),采用改進(jìn)后的小波神經(jīng)網(wǎng)絡(luò)、馬爾可夫鏈和GJR-GARCH模型構(gòu)建了WNN-MKC-GJR組合預(yù)測模型.基于相對誤差狀態(tài)構(gòu)建的馬爾可夫鏈成分使得組合模型無需對復(fù)雜的交通狀態(tài)進(jìn)行量化判別,因此具有較強(qiáng)的可移植性.
(2) 加入相對誤差修正以及過擬合噪聲修正這兩個模塊之后,WNN-MKC-GJR組合預(yù)測模型具有更高的預(yù)測精度和更強(qiáng)的預(yù)測穩(wěn)定性,這一表現(xiàn)在高峰時段內(nèi)尤為明顯,預(yù)測精度和穩(wěn)定性要明顯優(yōu)于其他五個對照模型.在平峰時段內(nèi),線性的AR(2)模型具有較好的預(yù)測精度,這表明在平峰時段內(nèi)采取平穩(wěn)的時間序列模型會取得更好的預(yù)測效果.
(3) 在行程時間發(fā)生突變的時刻,WNN-MKC-GJR組合預(yù)測模型可以及時捕捉突變的“拐點”,而其他五種模型都有不同程度的預(yù)測滯后.在實際城市交通管控策略的實施過程中,若能準(zhǔn)確感知行程時間突變(即大規(guī)模擁堵可能形成)時刻,則可以提前采取相關(guān)的主動管控措施,緩解擁擠的擴(kuò)散速度,為高速公路交通流運(yùn)行管理的決策提供依據(jù).
本研究所涉及的路段上交通事件發(fā)生數(shù)量不多,因此需要在日后的研究中進(jìn)一步檢驗組合模型處理交通事件數(shù)據(jù)的預(yù)測能力.