陳喜群,曹震,莫棟
(浙江大學(xué),建筑工程學(xué)院,杭州 310058)
智能交通系統(tǒng)發(fā)展離不開(kāi)大數(shù)據(jù)等先進(jìn)技術(shù)的支撐[1],隨著科技進(jìn)步,交通檢測(cè)數(shù)據(jù)獲取渠道和數(shù)據(jù)量變得越來(lái)越多,高速公路全路段交通管控需要以高質(zhì)量交通狀態(tài)信息為基礎(chǔ)。由于檢測(cè)器布設(shè)成本高等原因,雷達(dá)、卡口、線圈及不停車(chē)電子收費(fèi)系統(tǒng)(Electronic Toll Collection,ETC)等高速公路檢測(cè)器的空間覆蓋率存在稀疏性,檢測(cè)數(shù)據(jù)存在缺失。因此,從感知全路段交通狀態(tài)角度分析高速公路數(shù)據(jù)質(zhì)量至關(guān)重要,如何根據(jù)檢測(cè)器布設(shè)方案估計(jì)全路段交通狀態(tài)值得深入研究?,F(xiàn)有研究主要集中在構(gòu)建完整性、可用性、準(zhǔn)確性及時(shí)效性的數(shù)據(jù)質(zhì)量評(píng)價(jià)指標(biāo)體系,利用統(tǒng)計(jì)和人工智能算法估計(jì)缺失數(shù)據(jù),而在全路段交通狀態(tài)估計(jì)誤差界限方面存在研究不足。本文在估計(jì)誤差下界[2]研究基礎(chǔ)上,提出一種決策級(jí)融合模型,利用擴(kuò)展卡爾曼濾波交通狀態(tài)估計(jì)方法和平方流量誤差界分析數(shù)據(jù)質(zhì)量,在可用數(shù)據(jù)有限條件下,感知高速公路全路段交通狀態(tài),給出全路段特別是無(wú)檢測(cè)器路段的估計(jì)誤差界限,分析檢測(cè)器覆蓋率對(duì)估計(jì)誤差上界和下界的影響效應(yīng)。
數(shù)據(jù)質(zhì)量分析研究涉及交通工程、統(tǒng)計(jì)學(xué)及概率論等多個(gè)學(xué)科,對(duì)交通流檢測(cè)數(shù)據(jù)質(zhì)量進(jìn)行深入分析和數(shù)據(jù)修補(bǔ)是亟待解決的實(shí)際問(wèn)題。美國(guó)交通部在交通流數(shù)據(jù)質(zhì)量管理報(bào)告[3]中提出交通流數(shù)據(jù)質(zhì)量評(píng)價(jià)指標(biāo)體系,包括正確性、有效性、及時(shí)性、完整性、可用性和覆蓋率等指標(biāo)。馬韻楠[4]采用模糊綜合評(píng)價(jià)法構(gòu)建城市交通流數(shù)據(jù)質(zhì)量評(píng)價(jià)體系,基于視頻檢測(cè)器數(shù)據(jù)評(píng)價(jià)路段和路網(wǎng)數(shù)據(jù)質(zhì)量。李翠翠[5]從數(shù)據(jù)有效性和完整度等方面提出數(shù)據(jù)質(zhì)量問(wèn)題識(shí)別方法,建立層次分析-模糊綜合評(píng)價(jià)方法,從不同維度評(píng)估高速公路交通數(shù)據(jù)質(zhì)量。趙盼明[6]采用兩種綜合評(píng)價(jià)方法評(píng)價(jià)線圈、微波、射頻識(shí)別技術(shù)(Radio Frequency Identification,RFID)和視頻等4種道路交通數(shù)據(jù)有效性。張程瀚[7]以城市快速路微波數(shù)據(jù)為研究對(duì)象,利用相關(guān)性檢驗(yàn)方法分析快速路交通流時(shí)空特性,確立交通流數(shù)據(jù)質(zhì)量評(píng)價(jià)體系,并利用張量理論修復(fù)交通數(shù)據(jù)。施風(fēng)東[8]利用隸屬度函數(shù)將改進(jìn)模糊綜合評(píng)價(jià)法與優(yōu)劣解距離法(Technique for Order Preference by Similarity to an Ideal Solution,TOPSIS)評(píng)價(jià)法相結(jié)合,組成混合評(píng)價(jià)方法評(píng)價(jià)多源檢測(cè)器速度數(shù)據(jù)質(zhì)量,克服單一評(píng)價(jià)方法的局限性。
上述方法利用數(shù)據(jù)有效性和完整性等指標(biāo)體系分析交通數(shù)據(jù)質(zhì)量,而基于當(dāng)前數(shù)據(jù)環(huán)境下交通狀態(tài)估計(jì)界限的數(shù)據(jù)質(zhì)量分析相關(guān)研究較少。WANG 等[2]利用Fisher 矩陣推導(dǎo)平方流量誤差界,研究城市道路交通缺失數(shù)據(jù)的估計(jì)誤差下界和達(dá)到準(zhǔn)確估計(jì)結(jié)果的條件,解決奇異和非奇異Fisher矩陣下的缺失數(shù)據(jù)估計(jì)精度問(wèn)題。這需要大量時(shí)空點(diǎn)位觀測(cè)樣本,而由于檢測(cè)器布設(shè)的稀疏性,無(wú)檢測(cè)器路段沒(méi)有觀測(cè)樣本,難以進(jìn)行全路段狀態(tài)感知和數(shù)據(jù)環(huán)境質(zhì)量分析。擴(kuò)展卡爾曼濾波器是一種動(dòng)態(tài)系統(tǒng)狀態(tài)估計(jì)器,考慮系統(tǒng)隨機(jī)噪聲和檢測(cè)器測(cè)量噪聲,并引入宏觀交通流模型,模擬交通狀態(tài)演化過(guò)程。EKF 已有廣泛研究,例如,WANG等[9]提出結(jié)合宏觀交通流模型和測(cè)量模型的高速公路完整交通狀態(tài)EKF 估計(jì)器,分析估計(jì)器跟蹤能力,交通狀態(tài)初始值敏感性及模型參數(shù)在線估計(jì)顯著性等問(wèn)題。LI等[10]認(rèn)為交通流的內(nèi)在隨機(jī)性、模型初始條件、模型參數(shù)和模型結(jié)構(gòu)不確定性會(huì)影響交通狀態(tài)估計(jì)精度,提出集成學(xué)習(xí)框架提高估計(jì)精度。蔣陽(yáng)升等[11]采用車(chē)聯(lián)網(wǎng)實(shí)時(shí)數(shù)據(jù),構(gòu)建基于卡爾曼濾波的實(shí)時(shí)排隊(duì)長(zhǎng)度估計(jì)模型,解決現(xiàn)有排隊(duì)長(zhǎng)度估計(jì)方法不能對(duì)排隊(duì)長(zhǎng)度進(jìn)行實(shí)時(shí)秒級(jí)估計(jì)的問(wèn)題。因此,利用EKF機(jī)理模型拓展SFEB模型的適用范圍,具有重要的研究?jī)r(jià)值。
構(gòu)建SFEB 和EKF 決策級(jí)融合模型SFEBEKF,利用交通流模型演化機(jī)理刻畫(huà)能力和有限檢測(cè)數(shù)據(jù)估計(jì)全路段交通狀態(tài),基于得到的估計(jì)樣本,分別采用最近鄰法和SFEB 算法計(jì)算全路段交通狀態(tài),估計(jì)誤差上界和下界。
考慮共有Nl個(gè)路段的高速公路,包含Nm個(gè)檢測(cè)路段和Nu個(gè)無(wú)檢測(cè)器路段,Nl=Nm+Nu。以流量為例,假設(shè)Nm個(gè)檢測(cè)路段中有M個(gè)正常工作檢測(cè)器,θ1表示Nm-M個(gè)故障檢測(cè)器路段上所有缺失的時(shí)空點(diǎn)位,θ2表示Nu個(gè)無(wú)檢測(cè)器路段上所有未測(cè)量的時(shí)空點(diǎn)位,θ3表示M個(gè)正常工作檢測(cè)器路段上所有的測(cè)量時(shí)空點(diǎn)和Nm-M個(gè)故障檢測(cè)器路段上所有正常的時(shí)空數(shù)據(jù)點(diǎn),即
式中:qi,w,t為第i個(gè)正常工作檢測(cè)器路段在t時(shí)刻的流量,i=1,2,…,M,t=1,2,…,Tt;qi,m,t為第i個(gè)故障檢測(cè)器路段在t時(shí)刻的流量,i=1,2,…,Nm-M,t=1,2,…,Tt;qi,u,t為第i個(gè)無(wú)檢測(cè)器路段在t時(shí)刻的流量,i=1,2,…,Nu,t=1,2,…,Tt;Tt為總的時(shí)間步長(zhǎng);Km和Kav分別為故障檢測(cè)器的缺失數(shù)據(jù)時(shí)空點(diǎn)數(shù)量和正常數(shù)據(jù)時(shí)空點(diǎn)數(shù)量。
WANG 等[2]根據(jù)式(1)和Fisher 信息矩陣(Fisher Information Matrix,F(xiàn)IM)推導(dǎo)出定理1 和推論1,分別表示滿秩Fisher矩陣和奇異Fisher矩陣下的SFEB,具體推導(dǎo)過(guò)程本文不再贅述,詳見(jiàn)參考文獻(xiàn)[2]。
定理1 當(dāng)且僅當(dāng)Fisher 信息矩陣Jθ,r=是一個(gè)滿秩矩陣時(shí),參數(shù)向量存在有限方差的無(wú)偏估計(jì)量。其中,A為縮放矩陣,Rε為誤差協(xié)方差矩陣,Rθ為真實(shí)流量向量的協(xié)方差矩陣,為Rθ的Moore-Penrose 偽逆。假設(shè)是任一估計(jì)器關(guān)于θ的估計(jì),則的均方誤差(Mean Squared Error,MSE)滿足
式中:qo為尺寸為[MTt+Kav]×1 的觀測(cè)流量向量;θ為尺寸為[(Nm+Nu)Tt]×1的全路段整個(gè)Tt時(shí)刻的真實(shí)流量向量;A為尺寸為[MTt+Kav]×(Nm+Nu)Tt的縮放矩陣;Rqo為觀測(cè)流量向量的協(xié)方差矩陣。當(dāng)每對(duì)可用數(shù)據(jù)點(diǎn)之間沒(méi)有因果關(guān)系時(shí),A可以用觀測(cè)流量向量與未知參數(shù)向量之間的互相關(guān)矩陣Rθu,qo和未知參數(shù)向量的協(xié)方差矩陣Rθu的乘積表示,則式(2)可以改寫(xiě)為
推論1 當(dāng)Fisher 信息矩陣Jθ,r是奇異矩陣時(shí),當(dāng)且僅當(dāng)缺失點(diǎn)數(shù)量小于等于Jθ,r的秩時(shí),即(Nm+Nu)Tt-Kav-MTt≤rJ,rJ表示信息矩陣Jθ,r的秩,未知參數(shù)向量θu的無(wú)偏估計(jì)存在。估計(jì)向量的方差滿足
式中:I為單位矩陣;Λl和U1分別為非零特征值和對(duì)應(yīng)的特征空間;若矩陣M1≥M2意味著矩陣M1-M2是半正定的。當(dāng)(Nm+Nu)Tt-Kav-MTt >rJ時(shí),此時(shí)無(wú)法找到無(wú)偏估計(jì)量,估計(jì)向量的方差滿足
式中:H為任意縮放矩陣,行空間正交于Jθ,r零特征值對(duì)應(yīng)的特征空間;Hu、Ha為H對(duì)應(yīng)于θu、θa的子矩陣;θa為觀測(cè)流量向量;σ2ξ和σ2ε為高斯白噪聲方差。
估計(jì)誤差下界計(jì)算公式,涉及協(xié)方差矩陣和互相關(guān)矩陣的計(jì)算,其中,故障檢測(cè)器路段可用歷史數(shù)據(jù)確定,而無(wú)檢測(cè)器路段無(wú)法參與計(jì)算,因此,無(wú)法得到全路段交通狀態(tài)的估計(jì)誤差下界。為此,引入EKF交通狀態(tài)估計(jì)模型,利用有限檢測(cè)數(shù)據(jù)估計(jì)所有路段的完整狀態(tài),把無(wú)檢測(cè)器路段估計(jì)值作為真實(shí)值用于計(jì)算。SFEB與EKF模型的決策級(jí)融合過(guò)程如圖1所示。
圖1 SFEB-EKF模型決策級(jí)融合過(guò)程Fig.1 Decision-level fusion process of SFEB-EKF model
首先,建立狀態(tài)方程和觀測(cè)方程,兩者共同組成EKF交通狀態(tài)估計(jì)模型,計(jì)算得到全路段交通狀態(tài)估計(jì)樣本;在得到全路段估計(jì)樣本后,將無(wú)檢測(cè)器路段的估計(jì)值作為真實(shí)值輸入估計(jì)誤差下界計(jì)算模型中,得到高速公路全路段估計(jì)誤差下界計(jì)算融合模型SFEB-EKF。一方面,該融合模型利用宏觀交通流模型的機(jī)理刻畫(huà)能力估計(jì)全路段交通狀態(tài),實(shí)現(xiàn)全路段狀態(tài)感知;另一方面,在檢測(cè)器空間覆蓋不足情況下,計(jì)算全路段特別是無(wú)檢測(cè)器路段的交通狀態(tài)估計(jì)誤差界限。
融合模型SFEB-EKF 可用于分析檢測(cè)器空間覆蓋率對(duì)估計(jì)誤差界限的影響效應(yīng),在檢測(cè)器空間覆蓋率不足情況下,分析交通檢測(cè)器數(shù)據(jù)質(zhì)量,不同檢測(cè)器覆蓋率提供不同程度的有效狀態(tài)信息,精確有效的信息越多,估計(jì)誤差越小。根據(jù)感知精度與檢測(cè)器覆蓋率的關(guān)系,反推為實(shí)現(xiàn)特定估計(jì)精度,數(shù)據(jù)環(huán)境應(yīng)滿足的最低要求(例如,檢測(cè)器覆蓋路段占全路段的比例),為檢測(cè)器布設(shè)方案優(yōu)化提供參考。
利用臺(tái)灣桃園內(nèi)環(huán)線高速公路開(kāi)源數(shù)據(jù)測(cè)試融合模型效果,測(cè)試路段長(zhǎng)度約為7 km,主線為單向3車(chē)道,包含上匝道和下匝道各1條,參考WANG等[9]的劃分策略,將其劃為15段,主線上有5個(gè)檢測(cè)器L1、L2、L3、L4和L5,分別位于第1,3,6,11及15個(gè)路段,上匝道和下匝道分別布置檢測(cè)器R2 和R14,如圖2 所示。提取2021年1月1~31日共1 個(gè)月的數(shù)據(jù),具體為每天13:00-21:00 間隔5 min 的流量、速度和占有率,車(chē)道交通密度ρ(t) 通過(guò)時(shí)間占有率和時(shí)變等效車(chē)長(zhǎng)得到,即
圖2 高速公路位置、檢測(cè)器布設(shè)位置和路段劃分Fig.2 Geographic location,detectors layout,and division of road sectionsof study highway
式中:Toccupancy為時(shí)間占有率;gfactor為有效車(chē)長(zhǎng)(m)。
為分析檢測(cè)器覆蓋率對(duì)估計(jì)誤差上界和下界的影響,對(duì)主線檢測(cè)器路段進(jìn)行人為缺失,共設(shè)置3種覆蓋率情形,即缺失1個(gè)檢測(cè)器(覆蓋率為80%),缺失2 個(gè)檢測(cè)器(覆蓋率為60%)和缺失3 個(gè)檢測(cè)器(覆蓋率為40%)。由于交通流模型對(duì)邊界條件的依賴(lài)性,假設(shè)上游路段(路段1)和下游路段(路段15)的流量、速度和占有率是可觀測(cè)的,僅對(duì)中間路段檢測(cè)器進(jìn)行數(shù)據(jù)缺失測(cè)試。
采用均方誤差(Mean Square Error, MSE)和均方根誤差(Root Mean Square Error, RMSE)評(píng)價(jià)融合模型SFEB-EKF效果,定義為
式中:N為路段數(shù)量;Te為估計(jì)的時(shí)間步長(zhǎng);yit和分別為路段i在t時(shí)刻的流量真實(shí)值和估計(jì)值。
分析EKF 交通狀態(tài)估計(jì)結(jié)果,隨機(jī)展示2021年1月27日結(jié)果,在線估計(jì)基本圖參數(shù),賦予參數(shù)初始值自由流速度vf(0)=100 km·h-1,臨界密度ρc(0)=29 veh·km-1,參數(shù)α(0)=1.4。本文模型參數(shù)τ、υ、κ、δ的取值分別為17 s、5.7 km2·h-1、13 veh·(km·lane)-1、2,所有路段的參數(shù)相同。EKF模型中的隨機(jī)變量采用如下標(biāo)準(zhǔn)差[9-10]:
隨機(jī)展示80%覆蓋率下各路段的流量、密度和速度估計(jì)結(jié)果如圖3所示。
圖3 檢測(cè)器覆蓋率80%的估計(jì)結(jié)果(以缺失L4為例)Fig.3 Estimated results of 80%detector coverage(take missing L4 as an example)
結(jié)果表明,EKF交通狀態(tài)估計(jì)模型能夠?qū)崟r(shí)跟蹤各路段的狀態(tài)變化,捕捉流量、密度和速度突變,特別是晚高峰時(shí)段上匝道交通流量變大,匝道交匯區(qū)擁堵導(dǎo)致密度增加,速度和流量下降。
估計(jì)結(jié)果表明,覆蓋率越低估計(jì)效果越差,與實(shí)際相符。估計(jì)結(jié)果存在部分估計(jì)值與觀測(cè)值相差較大的情況,原因如下:一是檢測(cè)數(shù)據(jù)存在誤差甚至錯(cuò)誤導(dǎo)致觀測(cè)值沒(méi)有反映真實(shí)交通狀態(tài);二是當(dāng)檢測(cè)器非常稀疏時(shí),宏觀交通流模型發(fā)揮主導(dǎo)作用,缺少觀測(cè)值對(duì)純模型估計(jì)值的修正導(dǎo)致估計(jì)結(jié)果不準(zhǔn)確。整體而言,EKF估計(jì)模型在還原交通狀態(tài)任務(wù)中表現(xiàn)良好。
在得到1月份交通狀態(tài)估計(jì)樣本后,測(cè)試融合模型SFEB-EKF 效果,采用最近鄰法(NNM)、K 近鄰法(K Nearest Neighbor,KNN)以及克里金估計(jì)(Kriging Estimator)作為對(duì)比模型。其中,NNM 是指對(duì)無(wú)檢測(cè)器路段采用距離最近的檢測(cè)器測(cè)量值作為目標(biāo)路段估計(jì)值,該方法較為簡(jiǎn)單,適用范圍廣,雖然估計(jì)精度不高,但可以將其作為估計(jì)誤差上界。各模型估計(jì)效果如圖4所示。
圖4 對(duì)比各模型估計(jì)效果,包括:SFEB 平方根、SFEB-EKF 平方根、NNM、KNN 和Kriging。在所有覆蓋率下對(duì)比NNM、KNN和Kriging的誤差均大于SFEB 模型,驗(yàn)證了SFEB 是估計(jì)誤差下界。對(duì)比融合模型SFEB-EKF 和SFEB 在3 種覆蓋率情況下的測(cè)試結(jié)果可以發(fā)現(xiàn),兩者取得相似的效果且誤差保持在5%以?xún)?nèi),其中,EKF 估計(jì)得越準(zhǔn),兩者越接近。雖然SFEB-EKF 下界較SFEB 稍高,但仍?xún)?yōu)于其他估計(jì)器,更重要的是,SFEB無(wú)法計(jì)算無(wú)檢測(cè)器路段的估計(jì)誤差下界,在感知全路段交通狀態(tài)時(shí)受限。而本文提出的融合模型SFEB-EKF 可以在少數(shù)檢測(cè)器數(shù)據(jù)環(huán)境下,結(jié)合物理模型的優(yōu)勢(shì)得到高速公路所有路段的交通狀態(tài)估計(jì)樣本以及估計(jì)誤差界限。此外,當(dāng)估計(jì)誤差下界越低時(shí),說(shuō)明現(xiàn)有檢測(cè)數(shù)據(jù)越能表征全路段的隱藏共性,表示可用數(shù)據(jù)的質(zhì)量越好,以此可以分析檢測(cè)數(shù)據(jù)質(zhì)量。
從圖4中發(fā)現(xiàn),不同的檢測(cè)器覆蓋率可實(shí)現(xiàn)的估計(jì)誤差上界和下界是不同的,隨著檢測(cè)器覆蓋率下降,可用的觀測(cè)信息減少,估計(jì)難度增大,估計(jì)誤差也變大。如果對(duì)感知精度提出一定要求,SFEBEKF可以用于指導(dǎo)優(yōu)化檢測(cè)器布設(shè)方案,從而滿足相應(yīng)的感知精度,例如,本文高速公路案例中,當(dāng)交通管理部門(mén)對(duì)檢測(cè)器布設(shè)方案進(jìn)行優(yōu)化時(shí),要求實(shí)現(xiàn)不高于110 veh·h-1的流量估計(jì)誤差ERMSE,根據(jù)SFEB-EKF結(jié)果,檢測(cè)器的空間覆蓋率應(yīng)至少滿足60%的覆蓋下限。
圖4 融合模型SFEB-EKF與對(duì)照模型的比較Fig.4 Comparison results of fusion model SFEB-EKF with other baseline models
本文提出決策級(jí)融合模型SFEB-EKF,利用EKF模型的估計(jì)能力感知全路段交通狀態(tài),在檢測(cè)器不足環(huán)境下計(jì)算全路段交通狀態(tài)估計(jì)誤差下界。開(kāi)源高速公路數(shù)據(jù)集實(shí)測(cè)結(jié)果表明,融合模型SFEB-EKF在缺少真實(shí)樣本輸入情況下,仍能取得與SFEB相似的計(jì)算結(jié)果且誤差保持在5%以?xún)?nèi),不同檢測(cè)器覆蓋率仿真結(jié)果顯示,檢測(cè)器覆蓋率越高,有效信息越多,估計(jì)誤差下界越低。本文提出的模型可用于計(jì)算無(wú)檢測(cè)器路段以及全路段的估計(jì)誤差界限,在特定的感知精度要求下為檢測(cè)器布設(shè)方案提供參考。