余 暢, 蘇躍江,2, 韋清波
(1.廣州市交通運輸研究院有限公司, 廣州 510635; 2.華南理工大學(xué) 土木與交通學(xué)院, 廣州 510614;3.廣州市公共交通數(shù)據(jù)管理中心有限公司, 廣州 510620)
近年來,隨著機動車保有量的迅猛增長,高速公路擁堵愈發(fā)頻繁發(fā)生,已成為影響交通安全和運行效率的主要問題。有效識別高速公路擁堵情況,準確掌握高速公路交通運行狀態(tài),是對高速公路進行科學(xué)的交通管理控制以及建設(shè)規(guī)劃的關(guān)鍵前提,對于改善高速公路擁堵狀況、提升運行效率和交通安全具有重要意義。
關(guān)于高速公路的交通擁堵識別分析,國內(nèi)外學(xué)者對于擁堵識別算法進行了大量研究,主要可以歸納為直接檢測算法和間接識別算法兩大類。直接檢測算法主要是基于各類視頻圖像識別技術(shù)對交通擁堵事件進行檢測[1-3],該類算法可以從微觀角度開展交通擁堵識別分析,但在實際應(yīng)用中成本較高。間接識別算法主要根據(jù)擁堵對交通流的影響來識別擁堵,主要包括基于交通流模型的算法以及基于智能算法的算法[4],其中交通流模型中常用于擁堵識別的度量參數(shù)有道路交通流車輛速度、車輛密度、占有率、車流量和行程時間等[5-7],交通流模型能夠定量分析交通運行情況,但部分交通流模型參數(shù)較多導(dǎo)致復(fù)雜度較高;智能算法主要包括深度神經(jīng)網(wǎng)絡(luò)[8]、支持向量機[9]、梯度提升[10]、聚類分析[11]等,智能算法能夠從數(shù)據(jù)層面準確識別交通運行狀態(tài),但無法探究交通內(nèi)部的運行機理。
數(shù)據(jù)源方面,目前被應(yīng)用于高速公路擁堵識別的數(shù)據(jù)來源多樣,主要包括車檢器數(shù)據(jù)[12]、視頻數(shù)據(jù)[13]、收費站流水數(shù)據(jù)[14]、移動信令數(shù)據(jù)[15]及多源數(shù)據(jù)融合等類型[16]。張騰月[17]基于高速收費流水數(shù)據(jù),分匝道和主線兩部分對行程時間進行估算并求取交通流參數(shù),從而進行交通狀態(tài)識別,但由于收費站流水數(shù)據(jù)顆粒度較粗,對于細分路段的分析精確度不高;韓坤林[18]提出一種決策級融合算法對車檢器數(shù)據(jù)和收費數(shù)據(jù)進行融合,以判別高速公路的交通異常狀態(tài),但國內(nèi)高速公路現(xiàn)有檢測設(shè)施布設(shè)稀疏,數(shù)據(jù)檢測率有待提高;陳子瑜[19]提出了基于電子收費(electronic toll collection,ETC)交易數(shù)據(jù)的區(qū)段交通擁堵檢測方法,從區(qū)段交通流量和行程時間速度兩個指標進行檢測分析,但其僅根據(jù)相關(guān)技術(shù)標準來設(shè)定指標閾值,設(shè)定方法主觀性較強,不夠精細。
隨著ETC系統(tǒng)技術(shù)的發(fā)展成熟, ETC門架系統(tǒng)已廣泛應(yīng)用于高速公路,其生成的門架流水數(shù)據(jù)體量大、覆蓋范圍廣、顆粒度細、采集處理方便,為高速公路的擁堵識別分析提供了新的路徑。本文基于海量高速公路門架數(shù)據(jù),全面獲取所有車輛出行信息,結(jié)合交通流參數(shù)和智能算法的優(yōu)勢,提出通過聚類算法獲取各路段擁堵行程時間閾值的擁堵識別方法,能夠快速實現(xiàn)對高速公路全網(wǎng)全路段全時段的擁堵識別分析,具有較強的普適性以及應(yīng)用可行性。
本文提出了一套基于門架數(shù)據(jù)的擁堵識別分析方法,研究框架如圖1所示。第一,通過數(shù)據(jù)清洗及預(yù)處理流程,過濾錯誤及異常數(shù)據(jù),并對缺漏數(shù)據(jù)進行補全;第二,以門架對應(yīng)路段為單位組織數(shù)據(jù),提取所有車輛在各門架路段上的行程時間集合。第三,基于目標路段所有的行程時間樣本統(tǒng)計來定義合適的參數(shù)特征,利用DBSCAN (density-based spatial clustering of applications with noise)聚類算法,對目標門架路段的行程時間集合進行聚類分析,根據(jù)聚類結(jié)果的類別特征對路段的擁堵行程時間閾值進行標定;第四,對于各個門架路段進行以上聚類分析流程,形成各門架路段的擁堵行程時間閾值經(jīng)驗庫;第五,對于目標時段路段,將路段對應(yīng)行程時間閾值與目標行程時間樣本集的統(tǒng)計特征進行對比分析,實現(xiàn)對任意時段的路段擁堵情況進行判別,從而掌握高速公路的擁堵時空分布特征。
為實現(xiàn)路段級別的精細化擁堵識別,采用門架數(shù)據(jù)作為基礎(chǔ)數(shù)據(jù),門架數(shù)據(jù)主要包括車輛信息(車牌號、車輛類型、門架路段、所在高速、通過時間等)和交易信息(通行介質(zhì)、計費里程等),如表1所示。由于高速電子不停車收費(electronic toll collection, ETC)門架系統(tǒng)存在的不完善,采集到的門架數(shù)據(jù)會出現(xiàn)出行漏檢(過車時無識別)、錯檢(過車時被對向門架檢測到)的情況。為了提高原始數(shù)據(jù)的質(zhì)量,提升車輛出行信息獲取的準確度,需要對原始數(shù)據(jù)進行以下數(shù)據(jù)清洗及預(yù)處理流程。
表1 門架數(shù)據(jù)示例
第一步:異常及冗余數(shù)據(jù)剔除。針對車牌號識別失敗、計費里程為0 km等異常數(shù)據(jù),以及同一車輛被同一門架檢測多次產(chǎn)生的冗余數(shù)據(jù),直接篩選出來進行剔除。
第二步:錯檢數(shù)據(jù)修正。針對通過車輛被對向門架檢測而產(chǎn)生的錯檢數(shù)據(jù),將門架路段信息融入高速路網(wǎng)模型,根據(jù)路網(wǎng)模型中的門架路段拓撲關(guān)系梳理出對向門架對應(yīng)關(guān)系以及門架路段序列,判斷異常過車邏輯;對于被對向門架檢測的錯誤數(shù)據(jù),將其替換為正確的門架路段。
第三步:漏檢數(shù)據(jù)補充。針對通過車輛未被門架有效識別或數(shù)據(jù)異常導(dǎo)致的門架數(shù)據(jù)缺失,利用均值插補法進行補全。根據(jù)高速路網(wǎng)模型中的相鄰門架對應(yīng)邏輯關(guān)系及門架路段序列,補全缺失的門架路段,對于相鄰門架之間的通行時間,則統(tǒng)計同時段在該路段(相鄰門架之間)所有同車型通行車輛的平均通行時間,依次倒推各個缺失門架的過車時間,從而對缺失門架數(shù)據(jù)進行補全。
路段行程時間是一個能反映路段交通運行狀態(tài)的重要指標?;陂T架數(shù)據(jù)統(tǒng)計分析所有相鄰門架對之間所有小客車(貨車運行速度差異較大,本文研究暫不考慮)的行程時間,得到相鄰門架路段在全天不同時段的行程時間集合;該集合中包含多個不同車輛樣本在全天不同時段(包含高峰時段和空閑時段)的行程時間,基本能反映路段在不同交通狀態(tài)下對應(yīng)的行程時間情況。為科學(xué)準確地從中提取出用于判別交通擁堵的行程時間閾值,利用DBSCAN聚類算法[20]對行程時間集合進行聚類,提取其中大部分小客車在不同交通狀況下行駛所需的行程時間,從而實現(xiàn)對路段的擁堵行程時間閾值的標定。
DBSCAN算法優(yōu)點在于不需要定義聚類個數(shù),對于不同特征的路段可以適應(yīng)性地劃分交通狀況類別數(shù)量,并且可以有效剔除數(shù)據(jù)集中的異常點。DBSCAN算法根據(jù)區(qū)域點密度的不同來定義聚類集群,該算法包含最大密度可達距離ε和最小樣本點數(shù)minPts兩個全局參數(shù)。如果在一個樣本點周圍半徑為ε的范圍內(nèi),有至少minPts個樣本點(密度足夠高),那么這個點可以被標定為一個聚類中心點ic,表達為
|Nε(ic)|≥minPts
(1)
式中:Nε(ic)為到ic的距離d(ic,i)小于ε的樣本點的數(shù)量。
在利用DBSCAN算法對行程時間集合進行聚類流程前,首先需要對聚類的兩個關(guān)鍵參數(shù)進行定義。最大密度可達距離ε為相同交通狀態(tài)下允許不同車輛樣本的行程時間差值,表示合理控制聚類個數(shù),將該參數(shù)定義為
(2)
最小樣本點數(shù)minPts用于判別聚類類別的有效性,排除個別噪聲數(shù)據(jù)干擾,該參數(shù)定義為
minPts=μi/βn
(3)
式中:μi為門架路段i對應(yīng)的過車樣本數(shù)量;n為劃分擁堵等級的最多個數(shù);β為允許樣本量偏差的修正系數(shù)。
為了科學(xué)地設(shè)定參數(shù)中的修正系數(shù)取值,采用不同的修正系數(shù)取值對聚類結(jié)果進行了敏感性測試,最終將可達距離的修正系數(shù)α設(shè)為4,樣本量偏差的修正系數(shù)β設(shè)為10。
利用DBSCAN算法進行路段行程時間聚類的具體流程如下:
1)按門架對應(yīng)路段提取相應(yīng)的行程時間樣本集合。
2)對目標路段的行程時間集合中隨機提取一條未訪問樣本,形成一個簇并將該樣本標記為已訪問。
3)以遞歸的方式,遍歷獲取下一條未訪問樣本與當前各個簇的中心的是否密度可達(距離小于ε)。
4)若存在密度可達的類則將該樣本擴展這個簇的密度區(qū)域,若不存在與該樣本密度可達的簇,則將這條樣本形成一個新的簇。
5)重復(fù)3)步直到集合中所有樣本都訪問過,對于每個簇,如果總樣本數(shù)少于minPts,則該簇中的樣本標記為噪聲,否則確認為一個有效聚類。
6)將各個聚類中心點的樣本平均值按大小排序,得到目標路段的不同擁堵等級對應(yīng)的行程時間。
7)按1)~6)步處理所有門架路段的行程時間集合,形成全路段的不同等級擁堵的行程時間閾值經(jīng)驗庫。
對所有路段進行以上行程時間聚類流程,形成各路段的擁堵行程時間閾值經(jīng)驗庫。對于需要分析的目標時段及路段,首先獲取該路段的行程時間閾值集合{P1,P2,…,Pn},對于某行程時間值i對應(yīng)的擁堵等級Ci劃分標準如下:
(4)
“互聯(lián)網(wǎng)+”教育深入融合的當今時代,微課等形式作為新的教學(xué)模式在教學(xué)課堂中如火如荼進行著。為解決成人繼續(xù)教育學(xué)員的工學(xué)時間矛盾的突出問題,提高教學(xué)效果和學(xué)員的學(xué)習(xí)質(zhì)量為教學(xué)目標,我們將微課理念融入繼續(xù)教育課程建設(shè)中,我們嘗試在“C語言程序設(shè)計”這門課的繼續(xù)教育中引入微課為基礎(chǔ)的翻轉(zhuǎn)課堂教學(xué),探究其在“C語言程序設(shè)計”中的應(yīng)用效果。
采用2021年5月10日至5月16日一周的廣州市高速公路門架數(shù)據(jù)作為研究基礎(chǔ)數(shù)據(jù)集,數(shù)據(jù)集規(guī)模達到2.84億條,平均每日4 059萬條。按照前文提出的研究方法對數(shù)據(jù)集進行處理,展開對廣州市高速公路的擁堵識別及分析。以廣州北環(huán)高速S81上的相鄰門架對“沙貝立交虛擬拆分點-廣清”和“廣清-廣花”之間對應(yīng)路段為例,在一周時段內(nèi)共提取27.8萬條小客車過車的行程時間樣本。對樣本集進行了DBSCAN聚類流程,最終的聚類分類結(jié)果如圖2所示。
圖2 路段行程時間樣本聚類結(jié)果
根據(jù)聚類結(jié)果將該路段劃分為4個擁堵等級,分別為:“順暢”等級,對應(yīng)行程時間閾值為254 s,在該閾值以內(nèi)路段處于順暢的自由流狀態(tài)下,行程時間樣本呈現(xiàn)近似正態(tài)分布特征;“輕度擁堵”等級,對應(yīng)行程時間閾值為453 s;“中度擁堵”等級,對應(yīng)行程時間閾值為655 s;“重度擁堵”等級,對應(yīng)行程時間閾值為858 s;擁堵等級越高,行程時間偏離越大,樣本量呈現(xiàn)逐漸減少的趨勢;而對于行程時間大于858 s的等級,由于樣本量未達到聚類參數(shù)的最小樣本點數(shù),被判定為噪聲。
基于路段各擁堵等級對應(yīng)的行程時間閾值,可對該路段的不同時段的擁堵情況進行判別。利用門架數(shù)據(jù),對該路段在不同出行日不同時段的平均行程時間進行統(tǒng)計,如圖3所示。
圖3 各時段平均行程時間分布情況
經(jīng)過路段擁堵判別流程,將各時段的行程時間統(tǒng)計特征與對應(yīng)的閾值進行對比,最終對該路段的擁堵等級判別情況如圖4所示。從擁堵時段分布情況來看,該路段工作日的早高峰時段擁堵情況較為嚴重,08:00—11:00都處于中度及以上擁堵的狀態(tài),擁堵持續(xù)時間較長;周末的上午時段基本處于順暢狀態(tài),擁堵主要出現(xiàn)在下午時段以及夜間21:00—22:00點時段。
圖4 各時段擁堵等級判別情況
利用以上方法,對廣州市所有高速公路門架路段進行擁堵判別分析。根據(jù)相鄰門架對劃分路段,共計劃分出1 307個有效路段,對全網(wǎng)所有路段的全天各個時段進行擁堵判別,即每天對應(yīng)31 368個路段樣本。統(tǒng)計一周不同出行日內(nèi)的路段擁堵等級分布情況,如表2所示。
表2 全路段時段擁堵等級日分布情況
從分布情況來看,全網(wǎng)在周五出現(xiàn)擁堵的路段時段最多,其次為周六,而周日出現(xiàn)擁堵的路段時段最少;總體而言,一周內(nèi)有80%的路段時段處于順暢狀態(tài),20%的路段時段處于擁堵狀態(tài),其中大部分為輕度擁堵,整體運行狀態(tài)良好。
從擁堵路段分布來看,全周累計發(fā)生擁堵的路段時段達到43 093段次,其中累計擁堵段次超過1 000次的高速公路達到17條,如表3示。發(fā)生路段擁堵最多次的5條高速分別是S4華南快速、S41機場高速、S81北環(huán)高速、G1508北二環(huán)高速、S73南沙港快速。
表3 常發(fā)擁堵的主要高速公路
結(jié)合門架流水數(shù)據(jù)以及高速收費站流水數(shù)據(jù),根據(jù)車輛在各門架路段的通過時間以及進出站時間,可對各收費站匝道進行擁堵判別分析。從收費站匝道擁堵情況來看,進站上高速匝道全周累計發(fā)生擁堵8 876段次,表4所示為上高速匝道常發(fā)擁堵的收費站;出站下高速匝道全周累計發(fā)生擁堵22 595段次,表5所示為下高速匝道常發(fā)擁堵的收費站。對于常發(fā)擁堵的收費站匝道,后期可考慮通過改擴建工程以及交通引導(dǎo)等措施進行優(yōu)化治理。
表4 上高速匝道常發(fā)擁堵的收費站
表5 下高速匝道常發(fā)擁堵的收費站
1)通過對行程時間樣本聚類進行擁堵等級劃分的結(jié)果呈現(xiàn)以下特征:順暢狀態(tài)下路段處于自由流狀態(tài),行程時間樣本呈現(xiàn)近似正態(tài)分布特征;擁堵狀態(tài)下?lián)矶碌燃壴礁?行程時間偏離越大,樣本量呈現(xiàn)逐漸減少的趨勢。
2)從擁堵時段分布來看,工作日的早高峰擁堵情況較為嚴重,且持續(xù)時間較長;周末的上午基本處于順暢狀態(tài),擁堵主要出現(xiàn)在下午時段。
3)從全路網(wǎng)擁堵的出行日分布來看,全網(wǎng)在周五的擁堵情況最為嚴重,其次為周六;總體而言,廣州市高速路網(wǎng)一周內(nèi)80%的路段時段處于順暢狀態(tài),出現(xiàn)擁堵的大多數(shù)為輕度擁堵,整體運行狀態(tài)良好。
4)本文的擁堵識別方法能夠有效識別全網(wǎng)范圍內(nèi)常發(fā)擁堵的路段以及收費站匝道,基于各路段的擁堵行程時間閾值經(jīng)驗庫來判別擁堵,易于實際應(yīng)用。
本文的研究能幫助全面掌握和有效評估高速公路的交通運行狀況,為高速公路的改擴建規(guī)劃以及優(yōu)化提升提供有效的決策支撐。