賈若 戴昇宏 黃霓 李水瀅 劉志遠
(東南大學(xué) 交通學(xué)院,江蘇 南京 211189)
在國家、城市發(fā)展中,經(jīng)濟發(fā)展與交通建設(shè)一直密不可分。近年來,我國經(jīng)濟的高速發(fā)展,使城市交通出行需求急劇增加,但城市基礎(chǔ)設(shè)施建設(shè)速度較為滯后,無法滿足快速增長的出行需求,交通擁堵已成為城市交通運輸中最常見的問題之一。交通擁堵是一種車多擁擠且道路上車輛行駛速度緩慢的現(xiàn)象,國內(nèi)外每年因交通擁堵產(chǎn)生了大量的經(jīng)濟損失,且造成能源浪費以及環(huán)境污染。為了有效地減少擁堵的危害,各國學(xué)者都致力于緩解以及消除交通擁堵的研究與實踐,而這其中關(guān)鍵的一步便是交通擁堵的判別與分析。
國外學(xué)者自20世紀50年代起,就開始了對交通擁堵現(xiàn)象的系統(tǒng)研究。從傳統(tǒng)的交通流理論方法到新興的與計算機等學(xué)科交叉的機器學(xué)習(xí)方法,各國學(xué)者已經(jīng)進行了許多有效的探索。國內(nèi)對于交通擁堵判別的研究雖然起步較國際落后,但我國學(xué)者根據(jù)國內(nèi)的實際情況進行了拓展與創(chuàng)新,進一步推動了交通擁堵判別與分析理論的發(fā)展。
國外的研究通常采用研究交通異常事件的方法對交通擁堵進行判斷,我國通常采用道路占有率、排隊車輛及交通流速度作為城市交通擁堵的檢測標準,通過對道路通行能力、占有率等交通參數(shù)進行閾值判斷,綜合評判城市道路是否產(chǎn)生了擁堵。在交通擁堵自動檢測中,當(dāng)某路段在一定時間內(nèi),道路占有率、交通流速度和交通量等多個參數(shù)均超過閾值時,才認為存在交通擁堵[1]。傳統(tǒng)交通流理論的模型,通常使用傳統(tǒng)物理學(xué)、數(shù)學(xué)等基礎(chǔ)學(xué)科的理論描述交通行為。模型雖然合理簡單、有明確的物理意義,但其限制條件多[2]。相比之下,機器學(xué)習(xí)使用數(shù)據(jù)驅(qū)動方法,深入挖掘數(shù)據(jù)信息,對于異常特征及其特征變化十分敏感,同時更為注重模型的應(yīng)用價值和算法研究[3]。這類模型主要用于復(fù)雜交通流現(xiàn)象的研究,其中,一些機器學(xué)習(xí)方法能夠更好的檢測交通異常事件,并更好地獲取車流速度、道路占有率以及是否有擁堵車流等特征的變化,能夠被用于交通擁堵判別。
文中主要從傳統(tǒng)的交通流理論方法和機器學(xué)習(xí)方法中歸納總結(jié)交通擁堵判別方法。文中的主要內(nèi)容包括:交通流理論方法中的基于指標方法、基本圖方法、元胞自動機模型(CA Model)、元胞傳輸模型(CTM Model)以及二流理論(Two-fluid Model)。在機器學(xué)習(xí)部分,依次介紹了貝葉斯理論、馬爾科夫這兩種基于概率圖模型的方法,還介紹了支持向量機、K-近鄰、神經(jīng)網(wǎng)絡(luò)、聚類等非參數(shù)統(tǒng)計方法。最后對現(xiàn)有的傳統(tǒng)交通流理論方法和機器學(xué)習(xí)方法進行總結(jié),并指出一些有待解決的研究方向。
交通擁堵最直接體現(xiàn)是出行時間的增加和車輛行駛速度的下降,但各國對交通擁堵尚無統(tǒng)一的定義,也沒有統(tǒng)一的衡量標準[4]。自20世紀50年代起,國外相關(guān)科研機構(gòu)開始對交通擁堵評價體系進行研究,提出了近百種用于評價交通擁堵狀態(tài)的指標。對于路網(wǎng)中交通流速度降低、交通瓶頸的出現(xiàn)及車輛占有率增加等情況,研究者們通常根據(jù)多次實驗結(jié)果為各指標設(shè)定某一闕值,將模型的實際運行結(jié)果與闕值進行對比,進而判別擁堵狀態(tài)。其中傳統(tǒng)擁堵狀態(tài)判別的指標可分為基于出行時間的指標、基于排隊論的指標、基于公路通行能力手冊(HCM)的指標。不同指標適用于高速公路或城市道路等不同場景下的交通擁堵判別。在此基礎(chǔ)上,研究人員對不同指標進行組合,衍生出許多更加有效的基于指標的擁堵評價模型。
1.1.1 適用于高速公路的指標
(1)行程時間與延誤
行程時間與延誤是評價高速公路是否擁堵的有效指標。行程時間通常由地點車速或浮動車法調(diào)查得到。延誤是指因道路條件、天氣、排隊或者交通管制等各種因素引起的行駛時間的損失,表現(xiàn)為車輛通過某一段路時實際行駛時間與理想行駛的時間差[5]。
美國國家高速公路合作研究項目根據(jù)行程時間定義交通擁堵,將其分為可接受擁堵與不可接受擁堵[6- 8];其中當(dāng)行程時間大于自由流下的正常行程時間,且所形成的延誤時間較大時,即認為發(fā)生擁堵,當(dāng)延誤超過民眾接受范圍時即為不可接受擁堵。
(2)占有率
占有率包括時間占有率與空間占有率。空間占有率表示某一時刻某一路段內(nèi),車輛總長度與車道總長度之比,表明道路實際占用情況;但道路的空間占有率很難直接得到,因此往往很少應(yīng)用。時間占有率代表任一道路上所有車輛通過該段的累計時間與所有車輛觀測總時間的比值,反映了該路段車輛的排隊時間。根據(jù)道路交通流理論,車流密度小時車速快,時間占有率低,車流密度大時車速慢,時間占有率高。
美國芝加哥交通管理部門規(guī)定,車道占有率高于30%并且該狀態(tài)維持的時間超過5min時即為交通擁堵。Koukis等[8]對比分析了多個臨近周期的占有率數(shù)據(jù),并將結(jié)果與閾值對比進行擁堵判斷;國內(nèi)學(xué)者莊斌等[9]采用交通流量與占有率的增量變化率對交通擁堵狀態(tài)進行判別。
(3)服務(wù)水平
服務(wù)水平通常根據(jù)平均交叉口延誤及V/C比進行判斷,美國交通管理部門根據(jù)V/C比將公路服務(wù)水平分為6級,當(dāng)其大于0.9時處于不穩(wěn)定流狀態(tài),稍有干擾即處于擁堵狀態(tài);日本與我國分別實行對應(yīng)的三級、六級公路服務(wù)水平分類方法。
除此之外,區(qū)間平均車速也用于高速公路交通擁堵的判斷,例如公路通行能力手冊(HCM)當(dāng)中使用區(qū)間平均車速計算高速公路交織區(qū)服務(wù)水平判斷擁堵。區(qū)間平均車速需要特定地區(qū)長期的大量數(shù)據(jù)統(tǒng)計結(jié)果,不具有普適性,但不同地區(qū)可根據(jù)實際情況自行制定對應(yīng)標準,判斷擁堵狀態(tài)。
1.1.2 適用于城市道路的指標
(1)區(qū)間平均車速
區(qū)間平均車速可以更好的體現(xiàn)出車輛在某一特定的時間及路段上的行駛狀態(tài)[10],該指標不僅能夠反應(yīng)每輛車各自的交通行為,同時能夠隨著實際的交通供給與需求狀態(tài)改變而變化[11]。某一特定路段上的區(qū)間平均車速也可利用該區(qū)間長度除以此路段上所有車輛的平均行程時間。
日本道路公路團對城市快速路的擁堵定義為,當(dāng)某一城市快速路段上車隊以低于40 km/h的速度行駛或反復(fù)多次停駛,并持續(xù)該狀態(tài)15 min及行駛1 km以上即為擁堵[12];在2002年,我國公安部出臺規(guī)定,根據(jù)城市主干路的區(qū)間平均車速對交通運行狀態(tài)進行描述,定義區(qū)間平均車速低于30 km/h時的道路處于擁堵狀態(tài),低于10 km/h時為交通嚴重擁堵。德國學(xué)者Kerner[13]基于經(jīng)典交通流理論提出了三相交通流理論,并以區(qū)間平均速度區(qū)分交通自由流與擁堵狀態(tài),發(fā)現(xiàn)擁堵交通流中的車速低于自由流中的最低車速;北京工業(yè)大學(xué)交通工程北京市重點研究室[14]通過數(shù)據(jù)采集、利用默認闕值降噪處理數(shù)據(jù),類比三相交通流理論,運用統(tǒng)計分析方法得出交通流速度低于30 km/h時進入擁堵狀況。
(2)排隊長度
排隊長度指自交通間斷點,排隊或低速行駛的車輛占有的道路長度。排隊長度越長,擁堵越嚴重,該指標反映的擁堵情況直觀而易于理解。我國規(guī)定,3個信號周期車輛未能通過交叉口即為阻塞。當(dāng)交叉口進口處排隊延長到上游交叉口時,此時車輛的排隊長度不能準確評價交通擁堵狀態(tài)。
排隊長度比表示停車線上游排隊長度與停車線至上游交叉口停車線長度之比。若排隊長度比在低于0.5下的某一值附近浮動時,排隊長度小,交通較為流暢;若排隊長度比趨近于1,則排隊即將溢出,交通擁堵嚴重。
(3)流量比通行能力(V/C)
流量比通行能力指理想的道路交通條件下,最大服務(wù)交通量與基本通行能力之比,也稱道路負荷度,即V/C比。由于一個V/C比的值通常對應(yīng)兩種相反的交通狀態(tài),一般不單獨用于交通擁堵評價,而是與其他參數(shù)共同組成評價體系。
20世紀80年代末,Lindley[15]將實驗中獲取的高峰小時交通量擴樣為日交通量,使用V/C比對交通擁堵進行評價,若該值大于0.77時,認為道路處于擁堵狀態(tài);Cottrel[16]提出AADT/C的概念,美國加州35個城市規(guī)定了當(dāng)V/C比超過1.0或者AADT/C超過9.0時即發(fā)生了擁堵[17]。焦海賢等[18]提出虛擬路網(wǎng)容量均衡分析模型,考慮道路供需矛盾關(guān)系以V/C比為指標判別城市交通網(wǎng)絡(luò)中的交通瓶頸,為緩解城市交通擁堵、保障城市交通資源供需平衡提供了新思路。
(4)平均交叉口延誤
平均交叉口延誤是高峰行駛期間,所有車輛在交叉口延長度內(nèi)行駛的實際時間與在該路段內(nèi)以自由流速度行駛時間的差值的均值,該值能夠?qū)矶铝炕?,較為準確地評價交叉口擁堵情況。
對于城市道路,流量比通行能力(V/C)在評價城市道路通行狀況、公共交通運行狀況等方面有著廣泛應(yīng)用。在城市道路中,使用平均交叉口延誤及V/C比評價道路服務(wù)水平。但相比高速公路服務(wù)水平,城市道路服務(wù)水平尚且沒有統(tǒng)一理論,徐林等[19]定量劃分了北京的城市道路通行能力,初步探索了城市道路服務(wù)水平分級方法。
1.1.3 綜合指標判斷擁堵
相比上述采用單一指標對交通擁堵狀態(tài)進行判別,許多復(fù)雜情況下的擁堵判別需要采用多種參數(shù)進行判斷,將各種不同的指標組合在一起,通過系統(tǒng)的模型與算法對交通擁堵進行判別。
2007年Hartgen等[20]通過對不同地區(qū)的大量歷史數(shù)據(jù)分析,提出了出行時間指數(shù)(TTI)與超負荷車道長度(LMO)的擁堵指標。其中出行時間指數(shù)(TTI)是由行駛時間與自由流下行駛時間的比值定義的擁堵判別指標,超負荷車道為流量通行能力比大于等于1.0的車道。Bertini等[21]在2004年,利用俄勒岡州過境交通區(qū)的公交調(diào)度系統(tǒng)數(shù)據(jù)與車輛自動定位(AVL)數(shù)據(jù)獲取了行駛時間和速度兩種指標,以此分析交通運行狀態(tài)。該研究有助于過境機構(gòu)或交通研究人員更好的進行干線性能評估;Coifman等[22]在AVL數(shù)據(jù)中獲取了出行時間與平均速度,定量分析了交通流的情況;Bertin等[23]在2005年,利用倫敦附近環(huán)路探測器的數(shù)據(jù),進行了高速公路車道縮減處的交通流特性研究,采用時間平均速度、占有率等指標,探討了排隊消散流量與排隊形成流量之前的關(guān)系,通過計算交通波的傳播速度,判斷交通擁堵開始和持續(xù)的時間。
在道路服務(wù)水平的評價中,通常根據(jù)平均交叉口服務(wù)水平及V/C比兩個指標進行判斷。在交通流理論中,交通量由行駛速度及車輛密度共同確定,當(dāng)三參數(shù)均處于理想狀態(tài)時,交通流處于臨界狀態(tài),一旦車的數(shù)量有所增大,交通流量便會減小,同時行駛速度減小,交通流密度增大,該段道路便被判定為擁堵狀態(tài)。
不同單一指標以不同方式組合在一起,可以衍生出許多種行之有效的擁堵狀況綜合評價模型。與單一指標下的擁堵判別相比,綜合判斷指標適用范圍更廣,判斷判別的結(jié)果也更加可靠。上述指標也常作為機器學(xué)習(xí)方法的參數(shù),利用機器學(xué)習(xí)模型與方法,能夠更準確地捕捉指標特征的變化,且更有效地利用交通數(shù)據(jù),從而更好地判別交通擁堵?;谥笜伺袆e擁堵的重要參考文獻匯總?cè)绫?所示,將排隊論瓶頸值和交通流參數(shù)的變化進行量化,通過單一指標和綜合指標對交通擁堵進行判別。
上述基于指標的方法,通常用于判別局部路網(wǎng)的擁堵情況,實際應(yīng)用中具有相對的局限性。隨著人們對交通擁堵的研究從局部區(qū)域逐漸轉(zhuǎn)移至整個路網(wǎng),宏觀基本圖方法也逐漸被提出。
宏觀基本圖(MFD)的概念最早由Daganzo和Geroliminis[24]提出,并且他們在后續(xù)的研究中給出了宏觀基本圖的定義,被認為可以用于描述城市道路網(wǎng)中移動車輛數(shù)量與道路網(wǎng)絡(luò)運行水平之間的一般關(guān)系。宏觀基本圖模型通過統(tǒng)計分析路網(wǎng)的歷史數(shù)據(jù),得到不同參數(shù)之間的關(guān)系,從而得到宏觀基本圖模型。通常包括密度-速度模型、流量-速度模型和流量-密度模型。其中,最具代表性的密度-速度模型由Greenshields[25]在20世紀30年代提出。
根據(jù)MFD理論[26],現(xiàn)有兩種具有代表性的宏觀基本圖相關(guān)參數(shù)計算方法,其一為
(1)
式中:kw為城市路網(wǎng)范圍內(nèi)的加權(quán)密度;ow為其加權(quán)時間占有率;i為路網(wǎng)中路段編號;li為路段i的長度;qi為路段i的車流量;s為路網(wǎng)中行駛車輛的平均長度;oi為路段i的時間占有率;ki為路段i的密度。
還有一種方法為
(2)
式中,N為分析的路段或者檢測斷面數(shù)量,k為路網(wǎng)的平均密度,v為路網(wǎng)的平均速度,q為路網(wǎng)的平均流量。
1.2.1 宏觀基本圖在城市道路擁堵判別中的應(yīng)用
Daganzo等[27]于2001年在日本橫濱,使用主干道上的固定傳感器與出租車載移動傳感器,記錄車輛占有率及車輛行駛狀況,并于2007年提出了宏觀基本圖的概念。Buisson等[28]于2009年在法國圖盧茲市,利用線圈檢測器監(jiān)測路網(wǎng)中的交通流運行數(shù)據(jù),根據(jù)得到的MFD顯示,路網(wǎng)中宏觀交通量隨密度的變化概率與路網(wǎng)中檢測器與停車線的距離成正比。賀正冰等[29]在2014年利用北京市快速環(huán)路上分布的交通監(jiān)測器,利用宏觀基本圖的思想,研究得到路網(wǎng)密度分布的不均勻性與網(wǎng)絡(luò)流量的函數(shù)關(guān)系有相同的變化趨勢。通過分析快速環(huán)路的交通擁堵變化規(guī)律,得出該特征的原因是北京市快速環(huán)路擁堵的傳播過程是中心向外輻射的過程。
1.2.2 宏觀基本圖在高速公路擁堵判別中的應(yīng)用
Saberi等[30],在2012年利用波蘭高速公路網(wǎng)的數(shù)據(jù),研究了擁堵判別中信號控制對宏觀基本圖造成的影響與滯后性。姬楊蓓蓓[31]在2013年研究采用Vissim仿真實驗,根據(jù)實測數(shù)據(jù)建立并標定了阿姆斯特丹高速公路的仿真模型。通過對不同車道臨界密度的定量分析,量化了路網(wǎng)擁堵情況,并通過交通仿真使用MFD模型描述了路網(wǎng)交通擁堵的變化過程。Gavah等[32],于2011年提出,MFD模型只適用于高速公路網(wǎng)實施了交通管制措施的情況,如采取匝道控制、可變信息情報播報等。因為MFD良好應(yīng)用或者得到光滑的宏觀基本圖的前提,是交通擁堵較為平均的分布在被測路網(wǎng)中,而這需要一定的交通管制措施。
運用監(jiān)測手段獲取路網(wǎng)數(shù)據(jù),進而繪制城市路網(wǎng)宏觀基本圖,雖然在宏觀基本圖與交通擁堵的研究中被廣泛適用,但通常因成本較高與數(shù)據(jù)缺失,難以得到完整宏觀基本圖,對深入分析有一定影響。因此目前大部分關(guān)于宏觀基本圖的研究均采用交通仿真獲得所需數(shù)據(jù)。交通流的基本圖方法能夠比較直觀地體現(xiàn)交通擁堵形成的原因與過程,但是由于閾值的難以界定,在實際使用中往往有較大的局限。宏觀基本圖的分析方法文獻整理如表2所示。
表1 基于交通擁堵指標的重要文獻
表2 宏觀基本圖模型與應(yīng)用
元胞自動機是粒子在一個由具有離散、有限狀態(tài)的元胞組成的空間上,按照某種局部規(guī)則在離散的時間維度上演化的動力學(xué)系統(tǒng)模型[33]。元胞自動機理論最初由“計算機之父”馮諾依曼提出,并在20世紀90年代起成為了道路交通流領(lǐng)域的熱點研究方向,可以用于擁堵的判別與評估。
最初用于交通研究的一維元胞自動機模型模擬的是單車道的交通狀況,其中最具代表性的是在Wolfram[34]的元胞自動機規(guī)則基礎(chǔ)上建立的一維模型(NS)[35]。
該模型將一條單車道用一個一維點陣表示,每個位置點代表一個元胞,其中空置或容納一輛車,運行狀態(tài)取決于元胞是否空閑或者車速大小的不同,同時所有車輛按照特定的速度規(guī)則和位移規(guī)則運動,模擬真實的交通狀況。
NS模型設(shè)置了一種較為理想的車輛運行條件,能反映出車輛的啟動和停止過程,表現(xiàn)出交通流的擁擠和非擁擠狀態(tài),對交通擁堵的判別有一定作用。但考慮到城市道路往往交錯形成路網(wǎng),一維元胞自動機模型無法更細致地表現(xiàn)其交通特性,因此基于二維元胞自動機的模型(BML)[36]應(yīng)運而生。
BML模型首先給出了一個二維周期性邊界的正方形網(wǎng)絡(luò),每個格點上空缺或者存在僅向東或僅向北行駛的車輛。不同方向的車流在奇偶時間步上錯開運行,若某一輛車的前方格點上有車,則該車不運行。
BML模型考慮了交通信號燈因素下的情況,但只模擬了交叉口情況而忽視了路段,并且車輛只能在兩個方向上行駛,仍然與實際的交通狀況有很大區(qū)別。
為了改正這些問題,城市交通網(wǎng)絡(luò)模型[37](CS Model)在BML模型與NS模型結(jié)合的基礎(chǔ)上應(yīng)運而生。并且在此之后,各國學(xué)者都致力于BML模型的擴展與衍生。如Nagatani等[38- 40]分別在考慮了立交橋的設(shè)置、車輛的不對稱分布情形以及車輛的轉(zhuǎn)向情況后建立了新的元胞自動機模型等。
總之,元胞自動機模型形式簡單,且易于在計算機上模擬、實現(xiàn)。該模型不僅能夠得到每一輛車的微觀特性,而且能表現(xiàn)交通流的宏觀特點,從而進行交通擁堵的判別。然而,元胞自動機的研究雖然比較深入,理論也較為全面,但比較缺乏真正的應(yīng)用,因此在實際應(yīng)用中還需要進一步的檢驗。
LWR(Lighthill-Whitham Richards)模型是一個交通流一階流體動力學(xué)模型,可以用以下方程來表示:
(3)
式中,Q為交通量,x為位移,k為密度,t為時間。
LWR模型從流體力學(xué)的角度較好地描述了交通流特性,但是由于其求解過程比較復(fù)雜,并沒有被很好地實際應(yīng)用,因此知名學(xué)者Daganzo[41- 43]在此基礎(chǔ)上提出了元胞傳輸模型。
元胞傳輸模型(CTM模型)在經(jīng)典的LWR方程的基礎(chǔ)上進行了分段線性化處理,并將道路劃分為多個等距離的元胞,時間也同樣離散為多個時間間隔,原本的方程化簡為如下的離散形式:
(4)
(5)
通過這樣的離散形式,LWR模型所描述的交通流現(xiàn)象得到了較好的數(shù)學(xué)解法。因此CTM模型能夠重現(xiàn)與實際交通流情況接近的現(xiàn)象,并進行擁堵的判別與分析。
后來,Daganzo又在考慮車流滯后效應(yīng)的因素后提出了遲滯元胞傳輸模型(LCTM),該模型具有更高的計算精度[44]。在此后的時間里,其他各國學(xué)者也在他的研究基礎(chǔ)上進行了大量研究,先后提出了ELCTM模型、MCTM模型、SSM模型、ACTM模型、CCTM模型與LSCTM模型等[45],一步步提高了模型的普適性與準確性,使其與真實的交通狀態(tài)特性越來越接近。
由于元胞傳輸模型與實際交通情況的良好擬合特性,其常常被用在交通擁堵機理的研究上,也在實踐中被用于交通擁堵的判別與分析。元胞自動機模型和元胞傳輸模型的應(yīng)用整理后列于表3。
表3 元胞傳輸與元胞自動機模型的應(yīng)用
除了LWR模型和CTM模型利用流體力學(xué)的理論知識進行交通流的研究外,交通領(lǐng)域的研究者們從20世紀中期開始一直都在嘗試著用動力學(xué)理論描繪交通特性。
為了避免對不同的交通狀態(tài)下的細節(jié)進行分類討論,Herman等[46]在動力學(xué)理論的基礎(chǔ)上提出了二流理論,將交通流中存在的車輛分為運動和由于交通原因停止的兩類,并作出了如下兩個結(jié)論:①路網(wǎng)中車輛平均速度與運動車輛在整個交通流中所占的比重成正比;②路網(wǎng)中每單位距離的車輛行駛時間與單位距離的停車時間呈現(xiàn)線性相關(guān)趨勢。此后,Herman等[47]又在德克薩斯州的奧斯汀市進行了一系列實驗,除了證明上述兩個結(jié)論的正確性外,還提出了:③路網(wǎng)中循環(huán)測試過程時測試車的平均停車時間與整個路網(wǎng)中的停車時間相一致的假設(shè)。
此后,這一理論被證明除了在路網(wǎng)中成立外,還在城市干道及其各部分、各時間段下成立[48],并且被用在了城市道路服務(wù)水平的評價上。張翛等[49]建立了基于二流理論的城市干道交通模型,并提出了一個評分函數(shù)來對其服務(wù)水平進行評價。王殿海等[50]從二流理論出發(fā),對城市路網(wǎng)中宏觀層面的交通參數(shù)之間的關(guān)系進行了推導(dǎo),由此建立了對宏觀交通狀態(tài)進行評價的模型。
總之,二流理論由于其適用的廣泛性,在各種交通狀況下都可以直觀簡單地使用,并且不需要考慮各個過程的細節(jié)問題。因此,使用這一理論分析交通狀態(tài),進行交通擁堵的判別往往能收到良好的效果。
傳統(tǒng)交通流理論模型運用數(shù)學(xué)和物理學(xué)的定理來描述交通流特性,以分析的方法闡述交通現(xiàn)象及機理。但是數(shù)學(xué)和物理的模型并不能完全正確地描述現(xiàn)實復(fù)雜交通流。機器學(xué)習(xí)模型可以很好地克服此局限,它們沒有固定結(jié)構(gòu)約束,被證明與數(shù)據(jù)有更好的擬合[2]。利用機器學(xué)習(xí)方法判別擁堵的研究文獻整理于本章末尾的表4中。
建立概率圖模型也是常用的判別交通擁堵,預(yù)測交通流狀態(tài)的一類方法,其中具有代表性的模型包括貝葉斯網(wǎng)絡(luò)、馬爾科夫模型等。
2.1.1 貝葉斯網(wǎng)絡(luò)
(1)貝葉斯網(wǎng)絡(luò)簡介
貝葉斯網(wǎng)絡(luò)從形式上看是一個有向無環(huán)圖,以結(jié)點表示變量,有向邊表示結(jié)點之間的關(guān)聯(lián)關(guān)系,邊的權(quán)值為條件概率(設(shè)起點為A,終點為B,則有向邊的權(quán)值為P(A|B))。
(2)傳統(tǒng)貝葉斯網(wǎng)絡(luò)的構(gòu)造
構(gòu)造貝葉斯網(wǎng)絡(luò)的過程主要分為3步。
步驟1 確定變量集和變量域
步驟2 確定變量間拓撲關(guān)系,形成網(wǎng)絡(luò)結(jié)構(gòu)
建立網(wǎng)絡(luò)結(jié)構(gòu)最常見的方法就是從主觀的經(jīng)驗出發(fā)(通常是依據(jù)專家知識),根據(jù)變量間的因果關(guān)系建立網(wǎng)絡(luò)結(jié)構(gòu),例如盛春陽等[51]在使用貝葉斯網(wǎng)絡(luò)對交通狀態(tài)進行預(yù)測時,通過變量關(guān)系圖建立模型的網(wǎng)絡(luò)結(jié)構(gòu),直接獲得網(wǎng)絡(luò)結(jié)構(gòu),但缺陷是主觀成分較大?,F(xiàn)在也有學(xué)者從數(shù)據(jù)的相關(guān)性分析出發(fā),探索變量間的依賴關(guān)系,例如Liu等[52]學(xué)者在建立貝葉斯網(wǎng)路結(jié)構(gòu)時,采用定向依賴式分析的方法,通過計算兩個變量之間的條件獨立性來確定兩個節(jié)點是否需要用邊來連接(即變量間是否存在關(guān)聯(lián)關(guān)系),然后再采用基于條件交互信息的碰撞判別來確定邊的方向。
步驟3 確定貝葉斯網(wǎng)絡(luò)的概率分布
如圖1所示,要想求得目標——交通狀態(tài)的值,必須確定貝葉斯網(wǎng)絡(luò)的概率分布。確定概率分布的方式常常是從已有的數(shù)據(jù)和經(jīng)驗出發(fā)得到先驗概率,然后通過樣本訓(xùn)練得到后驗分布,多次迭代,得到最終的概率分布。
圖1 判別交通狀態(tài)的貝葉斯網(wǎng)絡(luò)
(3)貝葉斯網(wǎng)絡(luò)的演變和發(fā)展
除了傳統(tǒng)的貝葉斯網(wǎng)絡(luò)以外,一些非傳統(tǒng)的貝葉斯網(wǎng)絡(luò)也開始涌現(xiàn)。在一般情況下,交通流對時間敏感,具有明顯的高峰時段,因而在目前的研究中,常常使用含有時間序列的貝葉斯網(wǎng)絡(luò)來提高預(yù)測準確度。張敬磊等[53]建立了基于時間序列的動態(tài)貝葉斯網(wǎng)絡(luò),為貝葉斯網(wǎng)絡(luò)增加了時間維度。
此外,由于單一模型的適用范圍小、普適性差,貝葉斯網(wǎng)絡(luò)通常與其它基本預(yù)測模型結(jié)合組成貝葉斯組合模型,通過貝葉斯網(wǎng)絡(luò)的后驗概率計算得到各個基本模型的權(quán)重,從而實現(xiàn)對交通流的聯(lián)合預(yù)測,提高模型的普適性。如王建[54]等利用貝葉斯網(wǎng)絡(luò)實現(xiàn)了多方案組合的交通流短時預(yù)測,首先建立基于小波分析的BP神經(jīng)網(wǎng)絡(luò)算法、ARIMA算法等基本模型對交通流進行預(yù)測,然后將基本模型的預(yù)測結(jié)果和實際結(jié)果離散化處理后,利用貝葉斯網(wǎng)絡(luò)推理獲得在各個基本模型的預(yù)測結(jié)果組合下的聯(lián)合預(yù)測結(jié)果的概率分布,使得貝葉斯網(wǎng)絡(luò)成為多方法組合預(yù)測交通狀態(tài)的有效載體。
2.1.2 馬爾科夫模型在預(yù)測交通狀態(tài)方面的應(yīng)用
(1)馬爾科夫過程
馬爾科夫過程是一類隨機過程,它的特點在于未來的變化趨勢僅取決于現(xiàn)在的狀態(tài),而與過去的演變無關(guān)。Yu等[55]利用馬爾科夫過程的特性建立模型,對校園道路擁堵的預(yù)測進行了研究。
(2)馬爾科夫鏈
鄭建湖等[56- 57],結(jié)合大量的交通狀態(tài)轉(zhuǎn)移數(shù)據(jù),利用馬爾科夫鏈完成了對交通狀態(tài)的預(yù)測。李軍懷等[58]將馬爾科夫鏈與指數(shù)平滑法相結(jié)合,兼顧了歷史數(shù)據(jù)的演變和當(dāng)前狀態(tài)對未來變化趨勢的影響,進行交通狀態(tài)的預(yù)測。
(3)隱式馬爾科夫模型
隱式馬爾科夫模型較于傳統(tǒng)的馬爾科夫模型多了一個隱含的狀態(tài)鏈,即存在兩個隨機次過程。Zhu等[59]利用隱式馬爾科夫模型,不僅考慮特定道路區(qū)域本身的交通流狀態(tài)變化,還考慮到特定道路區(qū)域的交通流狀態(tài)變化與其它道路區(qū)域交通狀態(tài)的關(guān)系。這對于一個路網(wǎng)的交通擁堵預(yù)測具有重要的意義。
與參數(shù)統(tǒng)計方法相比,非參數(shù)統(tǒng)計方法對數(shù)據(jù)和模型的假定更少,適用范圍更廣,結(jié)果也更加穩(wěn)定,因此也更加適用于復(fù)雜的交通系統(tǒng)。
2.2.1 支持向量機模型(SVM)
傳統(tǒng)的統(tǒng)計模式判別方法在樣本量較大的情況下進行研究,而支持向量機[60]卻能夠很好的解決小樣本問題,在統(tǒng)計資料較少的交通問題研究中具有良好的表現(xiàn)。它在20世紀90年代中期被提出,是一種有監(jiān)督的統(tǒng)計機器學(xué)習(xí)方法。最初的SVM理論只能用來解決二類分類問題,隨著各國學(xué)者的不斷研究,多分類SVM算法以及與其他數(shù)據(jù)挖掘方法相結(jié)合的理論逐步建立并完善,支持向量機的應(yīng)用也更加廣泛,并被用于交通擁堵的模式判別。
SVM理論的核心思想是將輸入向量非線性地映射到一個高維度特征空間中,之后在這個空間中構(gòu)建一個決策超平面,將空間里的多個向量根據(jù)設(shè)定好的不同特征分為兩大類。每個分類中距離分隔平面最近的向量是該分類的邊緣向量,即支持向量。當(dāng)兩個分類的支持向量與平面的距離相等且取到最大時,認為該平面是最優(yōu)的決策超平面,距離和也稱為最優(yōu)間隔。圖2是一個二維空間下的例子,灰色部分選中的為支持向量,中間的虛線為最優(yōu)超平面,兩端實線間的距離即最優(yōu)間隔。
圖2 二維支持向量實例[57]
SVM算法在應(yīng)用時的兩大難點為超參數(shù)的選擇和核函數(shù)的確定,針對前者,Hong等[61- 62]將SVM模型結(jié)合模擬退火算法(SA)和蟻群優(yōu)化算法(ACO)進行解決,較好地預(yù)測了交通流狀態(tài),為擁堵判別提供了基礎(chǔ)。而在針對核函數(shù)進行的研究中,Wang等[63]采用小波函數(shù)構(gòu)造了一個新的核函數(shù),Cong 等[64]則將果蠅優(yōu)化算法(FOA)和最小二乘支持向量機模型(LSSVM)結(jié)合起來,取得了較為理想的結(jié)果。
支持向量機有著小樣本、高泛化的優(yōu)點,在交通狀態(tài)的劃分及交通擁堵的判別上有著較好的應(yīng)用,關(guān)鍵在于與其他數(shù)據(jù)挖掘方法或優(yōu)化算法的結(jié)合,來提高分類的精度,增大判別交通擁堵的準確性。
2.2.2 K-鄰近算法(KNN)
KNN是非參數(shù)統(tǒng)計算法中一種較為簡單的數(shù)據(jù)挖掘方法,其思路是:某個待測的數(shù)據(jù)在特征空間中有k個距離最近的已知類別的數(shù)據(jù),那么這k個數(shù)據(jù)中的大多數(shù)屬于哪一類,該待測數(shù)據(jù)也屬于這一類[65]。
原始的KNN模型僅采用時間序列作為計算標準,而Cai等[66]改進了KNN模型,用時空狀態(tài)矩陣描述路段的交通狀態(tài),更適于短期的交通狀態(tài)預(yù)測。Xu等[67]先提取比較具有代表性的交通流數(shù)據(jù)建立了道路交通狀態(tài)的參考序列,之后提取區(qū)域交通的吸引子序列構(gòu)造核函數(shù),得到當(dāng)前序列與參考序列的距離,最后獲得k個最小的距離,即利用核KNN算法(Kernel-KNN)判別了當(dāng)前序列的所屬交通狀態(tài)。
KNN算法通過多對象中的占優(yōu)類別進行決策,而非單一決策,因此能更好地進行交通擁堵狀態(tài)判別。其對于樣本的要求高于SVM模型,但在實際應(yīng)用中,相較于支持向量機的非線性映射與構(gòu)建線性決策超平面,KNN算法又更加易于處理。與決策樹模型相比,KNN算法同樣易于理解和使用。
2.2.3 神經(jīng)網(wǎng)絡(luò)
神經(jīng)網(wǎng)絡(luò)(ANN)是近40年來人工智能領(lǐng)域的研究熱點。它作為典型的監(jiān)督機器學(xué)習(xí)算法,已被廣泛用于交通狀態(tài)判別。目前應(yīng)用于交通擁堵判別預(yù)測領(lǐng)域的神經(jīng)網(wǎng)絡(luò)模型有:BP神經(jīng)網(wǎng)絡(luò)、遞歸神經(jīng)網(wǎng)絡(luò)、多層反饋神經(jīng)網(wǎng)絡(luò)、徑向基RBF神經(jīng)網(wǎng)絡(luò)等。
最基礎(chǔ)的ANN架構(gòu)包括輸入層、輸出層和隱含層。含有多個隱含層的感知器即為深度學(xué)習(xí)結(jié)構(gòu)。如圖3所示。
圖3 最基礎(chǔ)的ANN架構(gòu)
式中,wi=[wi1,wi2,…,win]T是輸入和第i個隱含層節(jié)點的連接權(quán)重。而βi=[βi1,βi2,…,βim]T是第i個隱含層節(jié)點和輸出的權(quán)重。bi是第i個隱含層節(jié)點的偏置。
(1)BP神經(jīng)網(wǎng)絡(luò)
實際的交通系統(tǒng)是實時變化的,十分復(fù)雜,因此對于交通狀態(tài)的判別模型需要能反映動態(tài)變化。Smith等[68]在BP神經(jīng)網(wǎng)絡(luò)模型與基于歷史數(shù)據(jù)的算法和時間序列模型等較傳統(tǒng)方法的比較中,發(fā)現(xiàn)BP模型在結(jié)果的準確率上相對較優(yōu),更能反映動態(tài)條件,并且沒有時間序列模型的滯后和過度預(yù)測特征;BP算法是神經(jīng)網(wǎng)絡(luò)中最具代表性的網(wǎng)絡(luò)訓(xùn)練方法,它通過梯度下降法求得隱含層節(jié)點參數(shù)的最優(yōu)取值[69]。
雖然BP算法檢測精度高,但是它學(xué)習(xí)速度較慢;因為是梯度下降,可能得到局部最優(yōu)收斂而非全局最優(yōu)收斂,從而導(dǎo)致網(wǎng)絡(luò)訓(xùn)練失敗。
(2)遞歸神經(jīng)網(wǎng)絡(luò)
時間序列交通流量預(yù)測要求模型的輸入為序列數(shù)據(jù),而遞歸神經(jīng)網(wǎng)絡(luò)(RNN)模型可以用來處理序列數(shù)據(jù)。遞歸神經(jīng)網(wǎng)絡(luò)記憶歷史數(shù)據(jù)的輸出,并且隨著網(wǎng)絡(luò)的外部輸入作為下一時刻隱藏層單元的輸入,該屬性使網(wǎng)絡(luò)可以動態(tài)記憶[70- 73]。
Ulbricht[74]介紹了解決短期交通預(yù)測任務(wù)的遞歸神經(jīng)網(wǎng)絡(luò)。在使用面向?qū)ο蟮纳窠?jīng)網(wǎng)絡(luò)進行短期交通狀態(tài)預(yù)測的研究中,Dia等[75]發(fā)現(xiàn)5 min速度預(yù)測的延時遞歸神經(jīng)網(wǎng)絡(luò)(TLRN)非常準確,精度達到90%~94%。
(3)多層神經(jīng)網(wǎng)絡(luò)
多層感知器包括至少一個隱藏層,可以判別線性函數(shù),也可以判別非線性函數(shù),對于非線性的交通參數(shù)預(yù)測具有非常好的效果。例如,Chen[76]介紹了多層前向神經(jīng)網(wǎng)絡(luò)在回路檢測站預(yù)測高速公路交通狀況的設(shè)計。結(jié)果表明,神經(jīng)網(wǎng)絡(luò)在低、中、高容量條件下(包括反復(fù)出現(xiàn)的擁塞和可能發(fā)生的事件期間)在體積、占用率和速度預(yù)測方面具有高精度;2005年,Vlahogianni等[77]提供了一種基于高級遺傳算法的多層感知神經(jīng)網(wǎng)絡(luò)交通流量預(yù)測模型,該模型不僅可以協(xié)助交通流數(shù)據(jù)的正確表示,也可協(xié)助時間、空間特征和神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)的選擇。
(4)徑向基神經(jīng)網(wǎng)絡(luò)RBF
RBF神經(jīng)網(wǎng)絡(luò)有全局近似與收斂的特性,所以使得它成為交通流判別預(yù)測的主要選擇之一。RBF神經(jīng)網(wǎng)絡(luò)的隱藏層空間是由徑向基函數(shù)作為隱單元的“基”構(gòu)成,隱節(jié)點被高斯函數(shù)定義:
(6)
式中,ci是第i個RBF隱藏集合的中心,xi是第i個RBF隱藏集合的寬度。
隱含層將低維的輸入矢量映射到高維特征空間。在該較高維空間中繪制最佳分離超平面,以將點分成不同的組,同時最大化線性決策邊界之間的邊界。其網(wǎng)絡(luò)結(jié)構(gòu)簡單,訓(xùn)練簡單,學(xué)習(xí)收斂速度快,具有接近任何非線性函數(shù)的能力,可以處理復(fù)雜的交通系統(tǒng)的擁堵判別問題。Park等[78]比較了4種神經(jīng)網(wǎng)絡(luò)模型,如徑向基神經(jīng)網(wǎng)絡(luò)(RBF)等,得出以下結(jié)論:RBF神經(jīng)網(wǎng)絡(luò)模型效果最好,比BP神經(jīng)網(wǎng)絡(luò)需要更少的計算時間。雖然RBF神經(jīng)網(wǎng)絡(luò)優(yōu)于指數(shù)平滑法,但它比指數(shù)平滑法更復(fù)雜。
以上提及神經(jīng)網(wǎng)絡(luò)在交通狀態(tài)判別與預(yù)測問題上表現(xiàn)優(yōu)異,但神經(jīng)網(wǎng)絡(luò)用于交通流預(yù)測也存在著一定的局限性。如訓(xùn)練需要大量數(shù)據(jù),若數(shù)據(jù)量過大則訓(xùn)練太耗時,若數(shù)據(jù)量過小則結(jié)果不夠精確。另外,隱層節(jié)點的數(shù)量需要由經(jīng)驗進行確定,太多將導(dǎo)致計算時間過長,太少又難以達到實際問題中計算精度的要求。
2.2.4 聚類
聚類是常見的無監(jiān)督的機器學(xué)習(xí)算法之一,可以在沒有任何先驗知識的情況下對交通流量數(shù)據(jù)進行分類。聚類旨在最小化類別內(nèi)的差異并使各個類別的差異最大化。
K-means聚類是最常見的聚類之一,2011 年,Montazeri等[79]提出了一種基于行駛路段聚類的交通狀況判別方法。使用k均值聚類算法判別駕駛特征并將其用于行駛路段聚類。結(jié)果表明,使用所提出的方法可以正確判別87%的交通狀況;2010 年,Azimi等[80]采用3種模式判別方法對高速公路交通流狀況進行流動特征分類。方法有K-means,F(xiàn)uzzy C-means和CLARA(聚類大應(yīng)用)。確定了與HCM分類一致的最佳聚類方法:K-means聚類。然后使用聚類方法補充HCM交通流狀況分類。此外,這些方法提供了合理分類過飽和流動條件的手段;但K-means聚類對聚類數(shù)目和噪聲數(shù)據(jù)的初始化很敏感,系統(tǒng)聚類缺乏魯棒性,非唯一性且難以解釋,所以此算法不能通用。
因此出現(xiàn)了嵌套和SOM等聚類。嵌套聚類類別數(shù)由數(shù)據(jù)的統(tǒng)計特性來確定,不斷分組直到差異過小不能分組為止。如2007 年,Xia 等[81]介紹了一種嵌套聚類技術(shù)及其在高速公路運行狀況分析中的應(yīng)用:利用探測器收集的交通數(shù)據(jù)(流量、速度、占有率)開發(fā)了一個聚類模型,并以5 min為增量進行聚合。
自組織映射(SOM)神經(jīng)網(wǎng)絡(luò)聚類是一種競爭學(xué)習(xí)型的神經(jīng)網(wǎng)絡(luò),它能將高維輸入數(shù)據(jù)映射到低維空間,同時保持其拓撲結(jié)構(gòu)不變,即將高維空間中相似的樣本點映射到輸出層相鄰的神經(jīng)元。它易于解釋和可視化,所以SOM在分析具有時變性和充滿噪音性質(zhì)的交通流數(shù)據(jù)方面具有優(yōu)勢。Andrienko等[82- 83]已經(jīng)在具有真實城市交通數(shù)據(jù)的大型數(shù)據(jù)集上得到驗證,SOM能夠?qū)矶录捌鋾r空演變規(guī)律進行有效判別。
通過分析交通狀態(tài)判別方法的研究現(xiàn)狀可以發(fā)現(xiàn),因現(xiàn)實中缺乏各種屬性參數(shù)和標簽的數(shù)據(jù),聚類分析已成為判別交通擁堵的最重要方法。但是,聚類方法從大數(shù)據(jù)中提取特征通常需要花費大量時間,所以可能無法滿足交通擁堵判別的實時性。于是,Chen等[84]提出了一種新的聚類算法,實時自動監(jiān)測和分析交通狀況。以道路上的車輛為數(shù)據(jù)點,提出了一種基于人工免疫網(wǎng)絡(luò)的K-means網(wǎng)格密度聚類算法,將車輛數(shù)據(jù)劃分為適當(dāng)?shù)拇?,并標記密度,以監(jiān)測和分析交通狀況。仿真實驗結(jié)果表明,該算法比傳統(tǒng)方法具有更高的效率和穩(wěn)定性。
表4 機器學(xué)習(xí)模型與應(yīng)用
機器學(xué)習(xí)模型使用數(shù)據(jù)驅(qū)動方法,能夠克服數(shù)學(xué)和物理模型描述復(fù)雜交通流的局限性,它們沒有固定結(jié)構(gòu)約束,被證明與數(shù)據(jù)有更好的擬合。從概率圖模型到支持向量機、K-近鄰算法、神經(jīng)網(wǎng)絡(luò)和聚類,這些機器學(xué)習(xí)方法,對于擁堵產(chǎn)生的異常特征及其特征變化十分敏感,能夠大幅提高擁堵判別的可靠性。
交通擁堵是諸多交通問題中影響最大、持續(xù)時間最長、出現(xiàn)頻率最高的問題。如想解決此問題,最先要做的就是能夠判別交通擁堵,然后利用各種信息平臺誘導(dǎo)車輛合理選擇行車路線。因此本文涵蓋傳統(tǒng)交通流理論與機器學(xué)習(xí)兩大類方法,系統(tǒng)綜述了國內(nèi)外擁堵判別的方法??傮w上,文獻的特點包括以下3點:
(1)國外學(xué)者對于交通擁堵現(xiàn)象的系統(tǒng)研究起步較早,已經(jīng)進行了許多較為有力的探索。國內(nèi)學(xué)者在交通擁堵判別方面的研究雖然起步較晚,但根據(jù)我國的實際情況進行了很多創(chuàng)新與拓展。
(2)傳統(tǒng)交通流理論與機器學(xué)習(xí)兩大類方法并不是完全分開的,只是它們所針對的應(yīng)用場景和采取的研究手段有所區(qū)別。傳統(tǒng)交通流理論物理意義明確但嚴謹、限制條件苛刻,機器學(xué)習(xí)方法注重實際應(yīng)用,但理解起來更困難。在研究不同的問題時它們各有優(yōu)缺點。
(3)不可否認,使用機器學(xué)習(xí)方法來判別交通擁堵的趨勢愈加明顯。機器學(xué)習(xí)算法可以有效地分析利用數(shù)據(jù),一些機器學(xué)習(xí)方法能夠更好的檢測交通異常事件,并更好地識別車速的降低、道路占有率的增加以及擁堵車流的出現(xiàn)等特征,許多研究都證明機器學(xué)習(xí)的算法有著強大的能力和可靠性,算法本身也在不斷創(chuàng)新。并且,隨著數(shù)據(jù)處理相關(guān)設(shè)備的更新,科研工作者數(shù)據(jù)處理能力的提高與信息科技的進步,交通領(lǐng)域積累了大量的數(shù)據(jù),這也給機器學(xué)習(xí)算法提供了廣闊的應(yīng)用空間。
國內(nèi)外學(xué)者在交通擁堵判別方面已經(jīng)獲得了較為豐富的成果,并逐步建立了相對完整的理論體系。然而已有研究還存在以下幾點不足:
(1)缺乏對交通擁堵的統(tǒng)一定義和衡量標準
判別擁堵時研究者們往往給參數(shù)設(shè)定某一閾值,當(dāng)達到這一閾值時,就可以判定交通擁堵狀態(tài)的形成。因為沒有統(tǒng)一定義和衡量標準,不同地區(qū)閾值不一樣,因此各標準不具有普適性,大大增加了判別擁堵的工作量。
(2)缺少傳統(tǒng)交通流理論與機器學(xué)習(xí)方法的協(xié)同合作
機器學(xué)習(xí)方法作為交通擁堵判別的重要組成部分,隨著數(shù)據(jù)相關(guān)設(shè)備的更新,數(shù)據(jù)處理能力的提高與信息科技的進步,應(yīng)用前景將更加廣闊。而傳統(tǒng)交通流理論作為交通領(lǐng)域的寶貴財富,曾指導(dǎo)許多交通擁堵判別問題,但目前兩者的協(xié)同合作并不密切或深入。因此,為更好地完成交通擁堵判別,需要加強傳統(tǒng)交通流理論與機器學(xué)習(xí)方法協(xié)同使用,進一步完善交通擁堵判別理論。
(3)應(yīng)用于擁堵判別的參數(shù)不足
首先,數(shù)據(jù)獲取困難,尤其是對于有高樣本量要求的參數(shù)統(tǒng)計方法,取得符合訓(xùn)練要求的數(shù)據(jù)不太容易。另外,交通流參數(shù)眾多,但現(xiàn)有研究中,每種方法只能關(guān)注幾個參數(shù),通過選取的部分參數(shù)進行交通流狀態(tài)判斷,并進而判別擁堵情況,這可能會導(dǎo)致解釋出的結(jié)果存在一定片面性。
總體而言,無論是傳統(tǒng)的交通流理論方法,還是新興的機器學(xué)習(xí)的方法,在進行交通擁堵狀態(tài)判別時,往往都會以流量、密度、速度、占用率、車頭時距等交通流參數(shù)為基礎(chǔ)進行交通狀態(tài)判斷,進而再檢測擁堵。這些方法使用類似數(shù)據(jù)的區(qū)別在于:傳統(tǒng)的基于指標的判別方法借助各類設(shè)備或信息平臺直接監(jiān)測路網(wǎng)內(nèi)的相關(guān)數(shù)據(jù),通過與閾值的比較來判斷是否擁堵。而傳統(tǒng)方法中的元胞傳輸模型與元胞自動機模型由于數(shù)學(xué)理論較強,大多通過純數(shù)學(xué)方法處理數(shù)據(jù)、進行研究。機器學(xué)習(xí)方法則看重數(shù)據(jù)特征的挖掘和樣本的訓(xùn)練,因此,即使采用的數(shù)據(jù)類似,處理方法也完全不同??紤]到已有研究的不足,未來的研究可基于(但不限于)以下幾個研究方向:
(1)考慮各國對擁堵的不同定義與衡量標準,基于高速發(fā)展的信息搜取和整合技術(shù),收集整理實際常使用的擁堵衡量標準,進而建立簡單通用的擁堵衡量標準,完善擁堵判別的理論研究體系;
(2)針對難以理解的機器學(xué)習(xí)模型,在已知輸入輸出的情況下,采用其他方法如敏感性分析等反推變量內(nèi)部聯(lián)系。這樣既可以保證判別預(yù)測的精確度,又可以幫助理解變量的影響;
(3)考慮傳統(tǒng)交通流理論與機器學(xué)習(xí)方法協(xié)同合作。利用機器學(xué)習(xí)中優(yōu)秀的算法及解決問題的思路來優(yōu)化傳統(tǒng)交通流模型,小到可以考慮對排隊論、流體力學(xué)模型、動力學(xué)模型等模型的某一步驟進行改進,大到利用算法減少人為對交通流規(guī)律分析、交通問題機理診斷判別的步驟。兩者互相配合,以期更好地判別交通擁堵。
(4)在未來,在研究數(shù)據(jù)這一方面還可以展開如下工作:首先,建立各省市完善統(tǒng)一的交通信息平臺,形成完整的交通流參數(shù)數(shù)據(jù)庫,便于各項擁堵判別的研究;其次,鑒于某些模型需采用特定參數(shù),為了更好的利用其它參數(shù)數(shù)據(jù),可以更多發(fā)掘不同參數(shù)之間的關(guān)聯(lián),以獲得方便可行、解釋全面、更具說服力的結(jié)果。