弓晉麗,彭賢武
(1.長沙理工大學交通運輸工程學院,長沙410114;2.三一重工股份有限公司,長沙410100)
城市干線道路交通擁擠態(tài)勢的監(jiān)測
弓晉麗*1,彭賢武2
(1.長沙理工大學交通運輸工程學院,長沙410114;2.三一重工股份有限公司,長沙410100)
以城市干線道路交通擁擠態(tài)勢監(jiān)測為目的,設計基于定點檢測數據的異常監(jiān)測系統(tǒng).獲取交通流基礎數據(流量、速度、占有率)后,使用模糊C-均值聚類算法將定量數據轉化為交通定性狀態(tài)(擁擠或暢通).以此為基礎,系統(tǒng)使用時間序列分形分析法確定交通擁擠態(tài)勢指數;以序列模式相似性度量法和凝聚分層聚類法進行常規(guī)運行模式的辨識;并使用基于距離的異常模式變點識別法實時監(jiān)測交通擁擠態(tài)勢是否偏離常規(guī)運行模式,以此確定系統(tǒng)是否存在異常.以上海南北高架東側11天的定點檢測數據為例進行實證分析,監(jiān)測得到了9月30日異常模式集中分布在中午12∶10-13∶20、13∶40-14∶30和下午17∶10-17∶15時間段內.
交通工程;擁擠態(tài)勢;時間序列;異常監(jiān)測;定點檢測數據
當交通擁擠成為城市交通的常態(tài)后,如何實時監(jiān)控城市交通日常運行中交通擁擠隨著時間的發(fā)展變化情況,避免大面積擁堵的發(fā)生變得尤為重要.城市交通干線(快速路和主干路)承擔了大量的交通量,在整個路網中具有關鍵性的作用,對干線交通擁擠發(fā)展態(tài)勢的監(jiān)測能夠為預防路網的大面積擁堵做出預警.
國內外學者對交通擁擠監(jiān)測問題進行了廣泛研究.國外形成了以美國、日本和歐洲的各個機構和學者為代表的研究陣營,國內也有多所大學的多名學者進行了許多相關的研究[1-4].受問題本身研究對象(城市道路、交叉口、高速公路、快速路、路網)應用主體(出行者、交通管理者、規(guī)劃設計人員)和數據條件(浮動車數據、環(huán)形監(jiān)測線圈、視頻采集等)的復雜性等因素影響,已有各種交通態(tài)勢的描述和監(jiān)測方法的應用范圍都具有較強的針對性.隨著ITS技術的發(fā)展,城市干線道路上布置了大量的檢測線圈.如何從這些線圈檢測到的數據中獲取交通擁擠態(tài)勢演變信息,對有可能引發(fā)路網大面積擁堵的干線道路異常狀態(tài)做出預警,成為有意義的研究課題.本文以城市干線道路的交通擁擠整體發(fā)展態(tài)勢為研究對象,將時間序列數據挖掘法應用于定點檢測數據(流量、速度和占有率)采集系統(tǒng)的歷史數據庫和實時數據序列的分析中,實現(xiàn)監(jiān)測對象交通異常發(fā)生時刻和嚴重程度的報警,為交通管理者和交通出行者提供服務.
根據檢測線圈布設位置,可將道路劃分為不同的路段,作為系統(tǒng)研究的“基本單元”.在得到環(huán)形檢測線圈獲得的流量、速度和占有率數據后,先使用模糊C-均值聚類算法,根據流量-速度-占有率關系對道路斷面進行交通狀態(tài)判別,區(qū)分暢通狀態(tài)和擁擠狀態(tài)(圖1)[5];然后定義“失效路段”為滿足上下游斷面同時處于擁擠狀態(tài)的路段,并統(tǒng)一將不滿足上述條件的路段稱為“暢通路段”(圖2).
圖1 交通狀態(tài)模糊C-均值聚類Fig.1 Fuzzy C-means for traffic qualitative state
圖2 城市道路模型化表示Fig.2 Model of city road
2001年Chen等[6]采用車公里長度(Vehicle Distance Traveled,VDT)、車小時長度(Vehicle Hours Traveled,VHT)、總延誤(Total Delay,TD)、效率損失(Productivity Loss,PL)等4個指標作為基于定點數據評價交通運行性能指標.為度量干線道路擁擠嚴重程度,本文在此基礎上定義以下集計指標集.
(1)失效性度量指標.
式中 Num()——集合計數函數;
N——路段劃分總數;
k——檢測時間間隔數,一般以5 min或15 min為一個間隔;
B(k)——k時間間隔內失效路段集合.根據定義,任意時間間隔內的失效路段數Ns小于等于道路路段劃分總數N.
(2)失效度度量指標集.
式中 TVH(k)——k時間間隔內干線總車小時長度,單位為veh·h,表示統(tǒng)計時間間隔內道路上所有車輛占用道路的總時長;
TVM(k)——k時間間隔內干線總車公里長度,單位為veh·km,表示統(tǒng)計時間間隔內道路上所有車輛行駛里程總和;
TD(k)——k時間間隔內干線總延誤,單位為veh·h,表示由于“失效”導致道路上行駛車輛產生的延誤總和;
TPL(k)——k時間間隔內干線總損失能力,單位為km·h,表示由于“失效”導致路段上通行能力的總損失量;
L——路段集合;
ρi(k)——k時間間隔內基本單元i的密度,單位為veh/km;
Vi(k)——k時間間隔內基本單元i的空間平均速度,單位為km/h;
vi——基本單元i的自由流速度,單位為km/h;
qi(k)——k時間間隔內從基本單元i流出的流量,單位為veh/h;
QM,i——基本單元i的通行能力,單位為veh/h;
Δxi——基本單元i的長度,單位為km; Ts——采樣周期(時間間隔),單位為h.
實際中,由于環(huán)形檢測線圈只能得到流量q、時間平均速度vt,上述計算中使用到的空間平均速度V和密度ρ采用以下公式轉換[7]:
式中 c.v.——變異系數,取值范圍為[0.08,0. 17].
上述多個指標構成了交通擁擠嚴重程度評價的時間序列指標集,可作為下文確定“交通擁擠態(tài)勢指數”的基礎指標集.
4.1 擁擠態(tài)勢描述指數確定模塊
在提出上述定性和定量指標集后,需對它們進行趨勢一致性驗證,以便確定能從定性角度與定量角度對干線擁擠態(tài)勢做出準確描述的綜合性指標.在時間序列數據挖掘算法中,R/S分析法[8]是一種用于驗證時間序列是否具有一定趨勢性的方法.運用該方法可計算各時間序列的Hurst指數,得到的結果越接近表明兩組時間序列的變化趨勢越一致.下文簡要介紹該方法的計算過程[8].
給定一個時間序列的N個連續(xù)觀測值X(1), X(2),…,X(N),均值記為.在此序列基礎上可以得出另一個序列Y,其中
令
則包括N個樣本的連續(xù)時間序列的Hurst指數H可按式(11)確定.如N=100,此時n可以取2、4、5、10、20、25、50等7個數,先求解(R/S)n,再由(R/S)n對n回歸求得H.
式中 n——原始序列被等分后子序列的長度,其值為[1,N]間能被N整除的正整數;
R——原始時間序列的子序列X1,X2,…,Xn經調整后的極差;
S——原始子序列標準差;
H——Hurst指數,值介于0到1之間,H愈接近1,持續(xù)性愈強,H愈接近0,反持續(xù)性愈強;
c——常數.
運用上述方法分別計算4個失效度指標和失效性指標時間序列的Hurst指數,找到定量與定性指標中結果最接近者作為擁擠態(tài)勢指數,流程如圖3所示.
4.2 擁擠態(tài)勢模式辨識模塊
當確定了“擁擠態(tài)勢描述指數”后,將一段時間內的一系列擁擠態(tài)勢指數時間序列作為輸入進行本模塊的計算.本模塊旨在從大量的歷史存檔數據中發(fā)現(xiàn)指標時間序列變化趨勢的模式,建立交通擁擠態(tài)勢日常模式,作為監(jiān)測交通狀態(tài)是否偏離常規(guī)模式的比較基準.時間序列模式被定義為一個相似時間序列的集合,模式辨識本質是實現(xiàn)以天為單位的具有相似性變化趨勢的交通擁擠態(tài)勢指數時間序列的聚類.具體方法:
圖3 交通擁擠態(tài)勢指數確定流程圖Fig.3 Flow-chart of traffic state evolution index determination
(1)以一天為一個樣本,計算樣本兩兩之間的形狀相似性距離.“模式距離[9]”可從形狀上度量樣本的相似度,下文簡要介紹其計算方法.令m= (X(k+1)-X(k))/Ts,則定義時間序列X= {X(1),X(2),…,X(n)}的模式XM為
式中 XM={-1,0,1}對應三種趨勢類型{上升,保持,下降};th表示“保持”趨勢斜率閾值,為接近0的某一較小值.在此基礎上定義時間序列X和Y之間模式距離DM(X,Y)為
式中 n表示時間序列間隔個數.根據定義式易知,X和Y的模式距離DM(X,Y)∈[0,2].
(2)由于凝聚分層算法在進行交通流時間序列分類時具有優(yōu)越性[10],本文使用該方法根據模式距離從形狀和嚴重程度上實現(xiàn)交通擁擠態(tài)勢指數時間序列的有效分離.
(3)計算各個樣本的交通擁擠態(tài)勢指數時間序列累計值,獲得聚類結果中平均累計值最大的一類,將其稱為“擁擠最嚴重類”,做為判斷系統(tǒng)是否發(fā)生異常的監(jiān)測基準類.
4.3 擁擠態(tài)勢異常實時在線監(jiān)測模塊
擁擠態(tài)勢“異?!笔侵附煌ㄟ\行狀態(tài)隨著時間的變化偏離了常規(guī)運行規(guī)律,也即交通系統(tǒng)運行內在機制發(fā)生了與常規(guī)狀態(tài)不同的改變.以上述模塊得到的“擁擠態(tài)勢常規(guī)模式”為比較基準,本模塊以天為單位將實時獲取的數據與常規(guī)模式比較以實現(xiàn)交通擁擠態(tài)勢的實時監(jiān)測.具體方法如下所述.
2000年Knorr[11]提出了基于距離的異常模式(Distance-based Outliers)的定義:“T中某子序列O與同數據庫中子序列p比較,其距離DB(p,O)大于閾值D,則認為O為異常序列”.以上述概念為基礎,本文基于相似性度量距離定義時間序列“異常因子(Outlier Factor,OF)”,用來描述模式異常的程度,并用于檢測某段時間內序列模式是否異常.
(1)異常因子的定義.
對于等長的待檢測序列q和比較基準類PB中某一序列p,異常因子OF(q):
式中 OF(q,p)——序列q和比較基準類PB中某一序列p間的模式相似性距離;
N(PB)——基準類PB所包含的樣本個數;
q(i)和p(i)(i=1,2,…,k)——分別為序列q和p第i個值;
ω1和ω2——分別為形狀相似距離和指標值偏離量的權重,表示它們對“異常因子”的貢獻大小,二者滿足等式ω1+ω2=1.
(2)基于滑動窗的異常模式實時檢測算法.
滑動窗口是指在處理數據時只考慮最近序列,被用來獲取當前數據流的特征信息.在滑動窗口內不僅有新數據連續(xù)到達,而且也會有舊數據過期[12].為進行定點數據的實時監(jiān)測,本算法使用滑動窗技術,與基準中時間序列比較,將異常因子作為序列特征,如果異常因子增大,并超過給定閾值,則認為實時狀態(tài)變化偏離歷史模式較嚴重,需要作出預警.圖4給出了算法流程,輸入參數為實時檢測序列X、監(jiān)測基準類PB,輸出為異常模式發(fā)生時刻及各個時刻異常因子的值.
圖4 基于滑動窗的異常模式實時檢測算法流程圖Fig4 Flow-chart of distance-based outlier real-time detection algorithm
以上海南北高架東側路段為例,應用本文所設計系統(tǒng)進行實證分析.將2009年3月20日(周五)至3月29日(周日)白天6:00-19:00間定點檢測數據作為歷史數據進行模式辨識,選取同年9月30日同時段數據作為實時監(jiān)測的對象.上述驗證過程選用Matlab編寫了相應的計算程序,并在Dell筆記本(CPU雙核1.6 GHz,內存1 G)上實現(xiàn).
5.1 R/S分析結果
利用R/S計算各擁擠態(tài)勢指標的Hurst指數,結果如表1所示.
據表1,上述指標的Hurst指數均大于0.5,表明交通擁擠態(tài)勢具有長期相關的特征,即整個演化過程整體上具有穩(wěn)定的持續(xù)性.其中,TD與失效性指標的Hurst指數最為接近,因此,下文將TD作為“擁擠態(tài)勢指數”.為比較方便,在下文的計算中,統(tǒng)一將“擁擠態(tài)勢指數”指標進行了歸一化處理.
表1 Hurst指數計算結果Table 1 Calculation results of Hurst index
5.2 常規(guī)運行模式辨識結果
對歷史數據庫中3月20日-3月29日6:00-17:00共計10個白天的檢測數據進行了模式辨識,結果如圖5所示.
圖5中橫坐標表示時間,縱坐標表示指標值.由圖可見,模式辨識首先將交通基本特征差異較大的工作日和周末序列進行了分離,并從形狀上將3月26日線從工作日中分離,然后從剩下的工作日序列中實現(xiàn)擁擠最嚴重的3月27日序列分離,最后成功將擁擠較嚴重的3月20日(周五)與其他工作日分離.在此基礎上計算各類樣本的類內平均累計值,對各類擁擠嚴重度做出排序,結果如表2所示.據此,得到“類3({3月27日})”為擁擠最嚴重類,作為監(jiān)測系統(tǒng)的比較基準.
圖5 模式辨識結果Fig.5 Results of pattern discrimination
表2 擁擠嚴重程度排序Table 2 Traffic congestion sevrity sorting
5.3 異常檢測結果
已知9月30日處于國慶放假的前一天,當天交通出行量大,上海市交通一度處于癱瘓狀態(tài),路網出現(xiàn)大面積擁堵.算法以該天為監(jiān)測對象,檢測當天交通擁擠態(tài)勢的異常時刻.
(1)算法輸入包括:實時檢測對象X=9月30日6:00~19:00以5 min為間隔的擁擠態(tài)勢指數時間序列;監(jiān)測類基準類PB=3月27日6:00~19:00以5 min為間隔的數據,PB為1*156維矩陣;初始窗口l1=12,即從7:00開始監(jiān)測;滑動窗長度l=12,即以一小時為滑動窗口.
(2)參數OFmax的標定:使用歷史庫中除3月27日外的9天數據標定OFmax,計算歷史天內各個時刻的異常因子OF(q,t),并設OFmax為99.5%分位的統(tǒng)計量(圖6),其值為0.41.
(3)檢測結果分析.
根據異常監(jiān)測算法,獲得9月30日異常報警結果如圖7所示.從圖7中可以看到,當天異常模式集中在中午12:10-13:20、13:40-14:30和下午17:10-17:15時間段內,正是由于這些時間段內擁擠未得到及時消散,導致了9月30日長時間的持續(xù)性擁堵.
圖6 異常因子經驗累積分布函數圖Fig 6 Experience cumulative distribution function diagram of Outlier Factor
圖7 9月30日異常因子時變圖Fig.7 Time changing diagram of outlier factor on September 30
本文以城市干線道路交通擁擠態(tài)勢異常監(jiān)測為目的,設計了基于定點數據的監(jiān)測系統(tǒng).在使用實際道路檢測數據驗證后,得出的結論包括:
(1)為從定性和定量角度對交通擁擠發(fā)展變化趨勢做出客觀評價,由時間序列挖掘算法中R/S法確定TD為“擁擠態(tài)勢指數”.實例中,各個擁擠態(tài)勢描述指標的Hurst指數均大于0.5,表明交通擁擠的趨勢變化具有較強的規(guī)律性,各天間交通擁擠態(tài)勢變化具有相似性.
(2)基于模式距離的凝聚分層算法可實現(xiàn)交通擁擠態(tài)勢模式相似性和差異性的辨識.在辨識結果基礎上,利用各類內擁擠態(tài)勢指數平均累計值實現(xiàn)各天擁擠嚴重度排序,確定實驗數據中擁擠最嚴重類“3月27日”為異常監(jiān)測的比較基準.
(3)定義了時間序列“異常因子(Outlier Factor,OF)”描述時間序列模式異常的程度,并將其作為序列特征設計了基于滑動窗的異常模式實時檢測算法.實例中,以9月30日為監(jiān)測對象,設置“異常因子”閾值為0.41,檢測得到當天異常集中分布在中午12:10-13:20、13:40-14:30和下午17:10-17:15時間段內,測算結果符合當日的實際交通情形.
綜上所述,本文研究成果可為交通管理者與交通出行者了解道路實時運行狀況,掌握交通擁擠發(fā)生規(guī)律提供服務.但本文研究僅限于具備定點檢測數據時對道路干線擁擠態(tài)勢做出監(jiān)測,未來可考慮使用數據融合技術擴展其他類型數據源(如浮動車數據),并可針對路網開展研究.本文的研究成果也有待結合更加具體的實際道路條件,推廣應用于實際城市道路的監(jiān)測與管理中,也有待于在應用中進一步實現(xiàn)功能的完善和方法的提升.
[1] Pravin Varaiya.California partners for advanced transit and highways(Path)[R].University of California, Berkeley,2004.
[2] Robert L Bertini,Steven Hansen,Spicer Matthews,et al.Portal implementing a new generation archived data user service in portland,oregon[C].12th World Congress on ITS,San Francisco,2005.
[3] 胡啟洲,劉英舜,郭唐儀.城市交通擁堵態(tài)勢監(jiān)控的時空分布形態(tài)識別模型[J].交通運輸系統(tǒng)工程與信息,2012,12(03):41-45.[HU Q Z,LIU Y S,GUO T Y.Space-time distribution model on state monitoring ofurbantrafficcongestion[J].Journalof Transportation Systems Engineering and Information Technology,2012,12(03):41-45.]
[4] 關偉,何蜀燕,馬繼輝.HMI—城市快速路發(fā)生交通擁堵的一個預警指標[J].交通運輸系統(tǒng)工程與信息,2008,8(05):26-31.[GUAN W,HE S Y,MA J H.HMI:Prewarning index of traffic jam formation on urban freeway[J].Journal of Transportation Systems Engineering andInformationTechnology,2008,8 (05):26-31.][5] 弓晉麗,楊東援.基于檢測線圈數據道路交通瓶頸分析[J].公路交通科技.2010,27(7):118-122. [GONG J L,YANG D Y.The road bottleneck analysis based on loop detector data[J].Journal of Highway and Transportation Research and Development.2010, 27(7):118-122.]
[6] Chao Chen,Karl Petty,Alex Skabardonis,et al. Freeway performance measurement system mining loop detector data[R].Transportation Research Record 1748.2001:96-102
[7] 胡小文,楊東援.城市快速道路交通流密度的估計[J].交通運輸系統(tǒng)工程與信息,2008,8(03):79-82.[HU X W,YANG D Y.Estimation of traffic densityonurbanfreeways[J].Journalof Transportation Systems Engineering and Information Technology,2008,8(03):79-82.]
[8] 埃德加E彼得斯.分形市場分析[D].北京:經濟科學出版社,2002.[Edgar E Peters.Fractal market analysis[M].Beijing:EconomicScience Press,2002.]
[9] 王達,榮岡.時間序列的模式距離[J].浙江大學學報(工學版),2004,38(07):795-798.[WANG D, RONG G.Pattern distance of time series[J].Journal of Zhejiang University(Engineering Science),2004,38 (07):795-798.]
[10] C Oller-Levet,F Klawonn,K-H Cho,et al.Fuzzy clustering of short time series and unevenly distributed Sampling[C].Proc of the 5the Int Symp on Intelligent Data Analysis.New York:ACM,2003.
[11] E Knorr,R Ng,V Tucakov.Distance-based outliers algorithms and applications[J].VLDB J,2000,8(3-4):237-253.
[12] P Domingos,G Hulten.Mining high-speed data streams [C].In Proceedings of the sixth ACM SIGKDD international conference on knowledge discovery and data mining,2000:71-80.
Monitoring the Evolution of Traffic on Main City Roads
GONG Jin-li1,PENG Xian-wu2
(1.School of Transportation Engineering,Changsha University of Science&Technology,Changsha 410114,China; 2.Sany Heavy Industry Co.,Ltd,Changsha 410100,China)
In order to monitor the evolution of traffic on main city roads,a fixed-point data monitoring system is devised.Firstly,after qualitative traffic data(flow,speed,and occupancy)are acquired,they are then translated into the traffic qualitative state(congested or uncongested)by Fuzzy C-means Clustering algorithm.Secondly,the Congestion Evolution Index is determined using Rescaled Range Analysis of data mining.Finally,by taking a sequence pattern similarity measurement and applying condensed hierarchical clustering methods,the routine pattern is distinguished.Consequently,real-time outlier detection is realized by a distance-based outlier detection algorithm.This algorithm was successfully applied based on 11 days of fixed-point data on the eastern segment of the Shanghai North-South expressway,it is concluded that the outliers distributed in 12:10-13:20,13:40-14:30 and 17:10-17:15 on September 30.
traffic engineering;traffic state evolution;time series;outlier detection;fixed-point data
U491.112
: A
U491.112
A
1009-6744(2013)05-0030-08
2013-03-28
2013-06-10錄用日期:2013-06-20
863計劃項目(2007AA12Z242);國家自然科學基金項目(50738004);公路工程教育部重點實驗室開放基金資助項目(kfj120106).
弓晉麗(1983-),女,山西省文水縣人,講師,工學博士.
*通訊作者:gjl2001cd@126.com