教欣萍,王江鋒*,陳磊,高志軍,董佳寬,黃海濤,葉勁松
(1.北京交通大學(xué) 交通運(yùn)輸學(xué)院 綜合交通運(yùn)輸大數(shù)據(jù)應(yīng)用技術(shù)交通運(yùn)輸行業(yè)重點(diǎn)實(shí)驗(yàn)室,北京 100044;2.交通運(yùn)輸部科學(xué)研究院,北京 100029)
智能交通協(xié)同誘導(dǎo)技術(shù)為有效改善高速公路出行服務(wù)水平提供了有力支撐,作為其中關(guān)鍵技術(shù)的短時(shí)交通流預(yù)測(cè),可實(shí)現(xiàn)交通流態(tài)勢(shì)實(shí)時(shí)預(yù)估,為出行者提供更可靠的出行路徑參考方案。但是,交通流蘊(yùn)含的不同時(shí)間維度信息對(duì)其短時(shí)預(yù)測(cè)結(jié)果具有顯著影響[1-2]。
目前,短時(shí)預(yù)測(cè)方法多考慮交通流低維信息,易使其信息丟失導(dǎo)致無(wú)法滿足預(yù)測(cè)精準(zhǔn)度的要求。國(guó)內(nèi)外學(xué)者陸續(xù)將卡爾曼濾波理論、K近鄰法、ARIMA模型等用于短時(shí)交通流預(yù)測(cè)[3-5]。文獻(xiàn)[6-9]基于卡爾曼濾波方法、K近鄰法提出一些改進(jìn)算法用于優(yōu)化預(yù)測(cè)性能;文獻(xiàn)[10-14]基于小波分析、高斯回歸過(guò)程、分形理論、突變理論、混沌理論等方法進(jìn)行了短時(shí)交通流預(yù)測(cè);神經(jīng)網(wǎng)絡(luò)具有高度非線性的動(dòng)力學(xué)系統(tǒng),有強(qiáng)大的非線性擬合能力,文獻(xiàn)[15-18]將神經(jīng)網(wǎng)絡(luò)方法應(yīng)用于短時(shí)交通流預(yù)測(cè),其中BP神經(jīng)網(wǎng)絡(luò)應(yīng)用最為廣泛;隨著組合模型的廣泛運(yùn)用,文獻(xiàn)[19-21]將多種模型組合應(yīng)用于短時(shí)交通流預(yù)測(cè)。傳統(tǒng)短時(shí)交通流預(yù)測(cè)算法大多將交通流數(shù)據(jù)視為一維時(shí)間序列,這種線性或平面數(shù)據(jù)表征方法忽略了交通流數(shù)據(jù)在多時(shí)間維度的信息挖掘,難以有效利用交通流數(shù)據(jù)的內(nèi)部結(jié)構(gòu)性和規(guī)律性。
近年來(lái),張量作為一種高階數(shù)據(jù)空間的多重線性映射模型,可以深層挖掘數(shù)據(jù)內(nèi)部結(jié)構(gòu)與規(guī)律,已經(jīng)成為大數(shù)據(jù)處理領(lǐng)域的研究熱點(diǎn)[22],國(guó)內(nèi)外學(xué)者在張量理論研究方面積累了良好的研究基礎(chǔ)[23-25]。由于交通流數(shù)據(jù)在不同時(shí)間維度上具有很強(qiáng)的規(guī)律性,為張量理論應(yīng)用于短時(shí)交通流預(yù)測(cè)提供了理論基礎(chǔ)。本文基于實(shí)際交通流速度數(shù)據(jù),挖掘其在不同時(shí)間維度的規(guī)律特征,建立基于高精度低秩張量填充(high accuracy low-rank tensor completion,HALRTC)理論的短時(shí)交通流預(yù)測(cè)算法,提升短時(shí)交通流預(yù)測(cè)的預(yù)測(cè)效果與精度。
為了充分挖掘交通流數(shù)據(jù)在不同時(shí)間維度上的規(guī)律性,實(shí)現(xiàn)滾動(dòng)式數(shù)據(jù)輸入預(yù)測(cè)未來(lái)時(shí)間段交通狀態(tài),將短時(shí)交通流預(yù)測(cè)問(wèn)題轉(zhuǎn)化為動(dòng)態(tài)張量填充問(wèn)題。以京港澳高速公路杜家坎路段2017年4月至6月共10周的速度數(shù)據(jù)為例,構(gòu)建了周維度×天維度×?xí)r段維度的三維動(dòng)態(tài)張量矩陣模型,如圖1所示。實(shí)際交通流數(shù)據(jù)從每日零點(diǎn)開(kāi)始采集,每5 min為一時(shí)段,一天共采集288個(gè)時(shí)段數(shù)據(jù)。
圖1 動(dòng)態(tài)張量模型示意圖
結(jié)合圖1構(gòu)建的動(dòng)態(tài)張量矩陣模型,設(shè)計(jì)基于HALRTC理論的短時(shí)交通流預(yù)測(cè)算法。該算法按照運(yùn)算邏輯,包括算法函數(shù)確定、增廣拉格朗日函數(shù)轉(zhuǎn)換和迭代求解3個(gè)步驟,即可獲得短時(shí)交通流的預(yù)測(cè)結(jié)果。
設(shè)A為由交通流速度數(shù)據(jù)構(gòu)成的三維動(dòng)態(tài)張量,大小為I1×I2×I3。同樣設(shè)置大小為I1×I2×I3的非負(fù)權(quán)重張量W,權(quán)重張量中元素賦值如下:
(1)
引入3個(gè)相同大小的三維張量M1、M2及M3,則算法函數(shù)可定義為張量核范數(shù)最小化問(wèn)題:
(2)
式中,M1(1)為M1按模式I1×(I2I3)展開(kāi)所得數(shù)值矩陣,同理M2(2)、M3(3)為M2、M3按模式I2×(I1I3)、(I1I2)×I3展開(kāi)所得數(shù)值矩陣。參數(shù)α1、α2及α3滿足α1+α2+α3=1,實(shí)際運(yùn)算中3個(gè)參數(shù)常取相等數(shù)值。
對(duì)算法函數(shù)進(jìn)行推導(dǎo),可得其增廣拉格朗日函數(shù)如下:
(3)
式中,Y1、Y2、Y3為額外變量,參數(shù)ρ隨迭代次數(shù)而逐漸增加,通常設(shè)ρ0=ρ,有ρk+1=tρk,t∈[1.15,1.25]。
借助交替方向乘子法思路,可對(duì)式(3)進(jìn)行迭代:
(4)
(5)
(6)
交替方向乘子法可確保增廣拉格朗日函數(shù)中迭代過(guò)程的收斂性,加快參數(shù)迭代計(jì)算過(guò)程。
對(duì)于M1、M2及M3,每次更新有如下優(yōu)化問(wèn)題:
(7)
通過(guò)奇異值收縮算子計(jì)算可得式(7)的閉形式解為:
(8)
(9)
由一階最優(yōu)性條件可得其解為:
(10)
則N階張量X∈RI1×I2×…×IN的HALRTC算法函數(shù)與增廣拉格朗日函數(shù)可描述為:
(11)
s.t.X=Mi,i=1,…,n,
(12)
圖2 HALRTC預(yù)測(cè)算法邏輯流程圖
利用京港澳高速公路杜家坎路段2017年4月至6月速度數(shù)據(jù)對(duì)所提出HALRTC算法進(jìn)行實(shí)證分析,分別進(jìn)行天維度、周維度預(yù)測(cè)精度分析,以及缺失數(shù)據(jù)下該算法與其他經(jīng)典算法的精度對(duì)比分析。
針對(duì)天維度,分析算法在周維度與時(shí)段維度預(yù)測(cè)精度的變化規(guī)律,選擇平均絕對(duì)誤差(mean absolute error,MAE)為評(píng)價(jià)指標(biāo)。圖3為不同周維度、時(shí)段維度下第10周周一交通流速度預(yù)測(cè)精度結(jié)果。從時(shí)段維度上看,預(yù)測(cè)精度隨著時(shí)段維度的增大而增大,在時(shí)段維度為18或20時(shí)預(yù)測(cè)精度呈現(xiàn)平面狀態(tài),MAE指標(biāo)穩(wěn)定在2.8%左右;從周維度上看,MAE在周維度大于6后表現(xiàn)出略微增長(zhǎng)趨勢(shì),說(shuō)明所提出預(yù)測(cè)算法能夠基于較少歷史數(shù)據(jù)較快達(dá)到良好的預(yù)測(cè)效果。
圖3 天維度預(yù)測(cè)精度變化趨勢(shì)
針對(duì)周維度,分析算法在同周不同日的預(yù)測(cè)精度。表1為不同周維度、時(shí)段維度下第11周共計(jì)7 d的速度數(shù)據(jù)預(yù)測(cè)精度結(jié)果,MAE指標(biāo)平均值約為3.6%。其中非工作日預(yù)測(cè)精度較低,說(shuō)明當(dāng)速度數(shù)據(jù)波動(dòng)加大時(shí),所提出算法需要更多歷史數(shù)據(jù)才能獲得良好預(yù)測(cè)效果。
表1 算法第11周速度預(yù)測(cè)精度結(jié)果
為深入分析速度數(shù)據(jù)波動(dòng)較大時(shí)所提出預(yù)測(cè)算法的預(yù)測(cè)性能,分別選取第11周周四與周日作為分析對(duì)象,算法的預(yù)測(cè)精度結(jié)果如圖4所示。結(jié)果表明,當(dāng)出現(xiàn)明顯速度波動(dòng)時(shí),所提出算法依然能夠有效預(yù)測(cè)速度波動(dòng),即使在速度波動(dòng)頻繁的周日,算法也能取得良好的預(yù)測(cè)效果,成功實(shí)現(xiàn)對(duì)兩個(gè)速度高峰時(shí)期的曲線跟蹤。
圖4 算法針對(duì)速度波動(dòng)的預(yù)測(cè)結(jié)果
針對(duì)不同比例缺失數(shù)據(jù),分析所提出短時(shí)交通流預(yù)測(cè)算法的精度變化情況。表2給出了不同比例缺失數(shù)據(jù)情況下所提出算法的預(yù)測(cè)精度結(jié)果,預(yù)測(cè)精度隨缺失數(shù)據(jù)比例增大而呈現(xiàn)下降趨勢(shì),說(shuō)明所提出算法對(duì)數(shù)據(jù)缺失較為敏感,在短時(shí)交通流預(yù)測(cè)時(shí)也會(huì)對(duì)數(shù)據(jù)完整性有一定要求。對(duì)缺失數(shù)據(jù)進(jìn)行預(yù)處理后,所提出算法的預(yù)測(cè)精度得到大幅提升。
表2 缺失數(shù)據(jù)下所提出算法預(yù)測(cè)精度結(jié)果
選擇ARIMA、BPNN和KNN作為比較算法,進(jìn)一步分析不同比例數(shù)據(jù)缺失情況下所提出算法的預(yù)測(cè)性能。為保證算法預(yù)測(cè)結(jié)果的有效性,利用不同比例缺失數(shù)據(jù)分別進(jìn)行4種算法預(yù)測(cè)性能測(cè)試,重復(fù)進(jìn)行10次,測(cè)試結(jié)果的MAE指標(biāo)平均值如圖5所示。隨著數(shù)據(jù)缺失比例增大,4種算法的預(yù)測(cè)精度均有所下降。相比較而言,本算法的預(yù)測(cè)效果較好,明顯低于其他3種經(jīng)典算法的預(yù)測(cè)誤差,算法表現(xiàn)出更好的預(yù)測(cè)精度。
圖5 缺失數(shù)據(jù)下4種算法預(yù)測(cè)精度結(jié)果
針對(duì)交通流所蘊(yùn)含的不同時(shí)間維度信息特征,本文從周維度×天維度×?xí)r段維度構(gòu)建了動(dòng)態(tài)張量模型,提出一種基于HALRTC理論的短時(shí)交通流預(yù)測(cè)算法。所提出算法可實(shí)現(xiàn)針對(duì)工作日與非工作日的交通流有效預(yù)測(cè),MAE指標(biāo)平均值約為3.6%,并能及時(shí)跟蹤交通流波動(dòng)性。在缺失數(shù)據(jù)情況下,所提出算法預(yù)測(cè)精度隨數(shù)據(jù)缺失比例增大而降低,但相較于3種經(jīng)典預(yù)測(cè)算法可表現(xiàn)出更好的預(yù)測(cè)精度。本文的算法效率有待提高,同時(shí)選取的路況比城市道路簡(jiǎn)單,未來(lái)可以將HALRTC理論應(yīng)用于城市道路并改進(jìn)算法的效率。