張亮亮,賈元華,牛忠海,廖 成
(北京交通大學(xué),北京100044)
交通狀態(tài)劃分的參數(shù)權(quán)重聚類方法研究
張亮亮,賈元華*,牛忠海,廖 成
(北京交通大學(xué),北京100044)
由于交通流量、速度、占有率或密度等參數(shù)在交通狀態(tài)劃分中作用不同,本文提出了基于參數(shù)權(quán)重聚類的交通狀態(tài)劃分方法.根據(jù)交通參數(shù)數(shù)據(jù)的相似性,應(yīng)用基于加權(quán)歐氏距離的相似性度量方法構(gòu)建了交通參數(shù)評(píng)價(jià)函數(shù),并用梯度下降法極小化評(píng)價(jià)函數(shù)對(duì)交通參數(shù)權(quán)重進(jìn)行求解.將交通參數(shù)權(quán)重應(yīng)用于模糊C均值聚類算法(FCM),得到基于參數(shù)權(quán)重的FCM道路交通狀態(tài)劃分方法.應(yīng)用提出的模型對(duì)選取的實(shí)際交通參數(shù)數(shù)據(jù)進(jìn)行交通狀態(tài)劃分,并與基于歐式距離的FCM狀態(tài)劃分結(jié)果對(duì)比.研究結(jié)果表明,本文提出的方法提高了交通狀態(tài)劃分精度,更接近交通實(shí)際運(yùn)行狀況.
城市交通;交通狀態(tài)劃分;參數(shù)權(quán)重;模糊C均值聚類
交通運(yùn)行狀態(tài)劃分是城市道路網(wǎng)采取合理交通控制與管理措施的基礎(chǔ),對(duì)緩解道路交通運(yùn)行壓力,提高路網(wǎng)運(yùn)行效率具有重要的意義.迄今為止,國(guó)內(nèi)外研究人員利用交通流量、速度、占有率或者密度等基本交通參數(shù)對(duì)交通狀態(tài)劃分進(jìn)行了大量研究,研究成果為交通狀態(tài)判別提供了技術(shù)支持.最初,Herman和Prigogine[1]將交通狀態(tài)劃分為兩類——擁擠狀態(tài)和暢通狀態(tài),其它狀態(tài)劃分方式大都是在這兩類狀態(tài)的基礎(chǔ)上進(jìn)一步細(xì)分;Kerner[2]提出了三相位交通流理論,并將交通流定性劃分為自由流、同步流和寬移動(dòng)阻塞三個(gè)相位;關(guān)偉和何蜀燕[3]利用實(shí)測(cè)數(shù)據(jù)將城市快速路交通流的狀態(tài)劃分為四類:自由流、諧動(dòng)流、同步流和堵塞流.由于交通狀態(tài)具有模糊特性,Christiane和Thomas[4]、陳德望[5]、王璇和翁小雄[6]等利用模糊理論方法對(duì)道路交通狀態(tài)進(jìn)行分類.近年來,國(guó)內(nèi)外研究人員認(rèn)為不同交通參數(shù)對(duì)交通狀態(tài)的影響不同,初步研究了不同交通參數(shù)對(duì)交通狀態(tài)判別的影響.陳德望[5]得出在速度很高、速度很低或者占有率很大的情況下,可以直接判斷交通狀態(tài),其它情況需要根據(jù)流量、速度、占有率等交通參數(shù)綜合判斷;張心哲和關(guān)偉[7]通過對(duì)流量、速度、密度等交通參數(shù)的某一個(gè)參數(shù)權(quán)重取值為1,而其它參數(shù)權(quán)重取值為0時(shí),采用k-means方法進(jìn)行狀態(tài)劃分,并得到密度是交通狀態(tài)劃分的關(guān)鍵參數(shù).由于國(guó)內(nèi)外研究人員在交通狀態(tài)劃分時(shí)忽略了不同交通參數(shù)對(duì)其狀態(tài)劃分的影響,即使考慮到不同交通參數(shù)對(duì)狀態(tài)劃分的影響,也缺乏對(duì)交通參數(shù)權(quán)重的定量計(jì)算方法.因此,本文從交通參數(shù)數(shù)據(jù)相似性入手,通過相似性度量方法構(gòu)建交通參數(shù)評(píng)價(jià)函數(shù)來定性研究交通參數(shù)權(quán)重,將參數(shù)權(quán)重引入到模糊C均值聚類方法,應(yīng)用基于參數(shù)權(quán)重的FCM方法對(duì)交通狀態(tài)進(jìn)行劃分,并進(jìn)行實(shí)證研究,以期提高交通狀態(tài)劃分精度,為交通智能控制與管理提供技術(shù)支持.
模糊C均值聚類方法[8]是聚類方法的一種.模糊C均值聚類是一種基于目標(biāo)優(yōu)化的聚類方法,通過迭代使樣本距離模糊聚類中心的距離加權(quán)和最小,設(shè)定目標(biāo)如式(1)所示.
式中 U是每個(gè)數(shù)據(jù)點(diǎn)與相應(yīng)聚類中心的隸屬度;vc為第i個(gè)模糊聚類中心;μij∈[0 ,1]表示第 j個(gè)數(shù)據(jù)點(diǎn)屬于第i個(gè)聚類中心的隸屬度;dij為第i個(gè)聚類中心與第 j個(gè)數(shù)據(jù)點(diǎn)的歐式距離;m∈[1 ,∞]是一個(gè)加權(quán)指數(shù),隨著m的增加,聚類的模糊性增大;且式(1)滿足
FCM算法的具體步驟為:
步驟1給定聚類類別c,模糊加權(quán)指數(shù)m,設(shè)定迭代停止閥值ε,算法的迭代次數(shù)為bmax,初始化隸屬度矩陣.
步驟2計(jì)算模糊聚類中心.
步驟3更新模糊聚類隸屬度矩陣U(b+1).
步驟4選擇某種合適的矩陣范數(shù)比較U(b),和U(b+1),如果‖U(b+1)-U(b)‖≤ε,系統(tǒng)達(dá)到穩(wěn)定,終止迭代;否則令b=(b+1)轉(zhuǎn)到步驟2繼續(xù)執(zhí)行.
數(shù)據(jù)間的相似性是聚類的基礎(chǔ),根據(jù)數(shù)據(jù)間的相似性,可以計(jì)算不同聚類屬性的權(quán)重值.目前,最常用的相似性度量方法有歐式距離、相關(guān)系數(shù)法等.考慮到交通流量、速度、占有率等參數(shù)對(duì)其運(yùn)行狀態(tài)分類的作用不同,本文采用一種加權(quán)歐氏距離對(duì)數(shù)據(jù)相似性進(jìn)行度量.
式中 β是[0,1]區(qū)間的一個(gè)常數(shù),通過調(diào)整 β能夠使得 ρ(pωq)的值均勻地分布在[0,1]內(nèi),β可按如下公式計(jì)算.
式中 dpq為普通歐式距離,而式(4)中d(pωq)是基于屬性權(quán)重的歐式距離,d(pωq)計(jì)算公式如下:
式中 ω=(ω1,ω2,…,ωm)是與輸入屬性相對(duì)應(yīng)的一個(gè)權(quán)重向量;ωk是描述k維屬性在聚類中重要性.通過調(diào)整ωk的值,數(shù)據(jù)ρp與數(shù)據(jù)qq間的相似性不斷變化.當(dāng)ω=(1 ,1,…,1)時(shí),所有屬性的重要性相等,數(shù)據(jù)間的相似度基于普通的歐式距離dpq.當(dāng)權(quán)重不全等于1時(shí),數(shù)據(jù)間的相似度就是基于權(quán)重的相似度.當(dāng)ωk=1時(shí),第k維屬性在聚類中發(fā)揮其全部的作用;ωk的值越小,該屬性在聚類過程中發(fā)揮的作用就越?。划?dāng)ωk=0時(shí),該屬性在聚類過程中不發(fā)揮任何作用.
基于以上分析,本文通過極小化評(píng)價(jià)函數(shù)E(ω)對(duì)各交通參數(shù)權(quán)重進(jìn)行求解[9].E(ω)計(jì)算公式如下:
為了極小化評(píng)價(jià)函數(shù)E(ω),本文采用梯度遞減算法進(jìn)行求解,該算法的具體步驟如下:
Step 1根據(jù)公式(5)確定β的值.
Step 2在 [0,1]內(nèi) 初 始 化 權(quán) 重 ω= (ω1,ω2,…,ωm).
Step 3計(jì)算權(quán)重的修正量
Step 4η是學(xué)習(xí)率,可以通過下式計(jì)算η的值.
Step 5當(dāng)ωj+Δωj>0 時(shí) ,更 新 權(quán) 重ωj=ωj+Δωj.
Step 6重復(fù)Step 3,Step 4,Step 5直到收斂,即E(ω)的值小于給定的閾值,或者迭代的次數(shù)達(dá)到用戶設(shè)定的閥值.
由于參數(shù)權(quán)重的引入,F(xiàn)CM算法的度量方式由傳統(tǒng)的歐式距離變成基于參數(shù)權(quán)重的歐式距離,得到了基于參數(shù)權(quán)重的模糊C均值聚類方法(fuzzy c-means clustering based on weight Euclidean distance,WFCM),因而WFCM算法的目標(biāo)函數(shù)定義如下:
根據(jù)式(12)、式(13)、式(14)就可以得到基于參數(shù)權(quán)重的模糊聚類算法,該方法的計(jì)算步驟仍為模糊C均值算法的四步.
要正確對(duì)道路交通狀態(tài)進(jìn)行劃分,交通狀態(tài)數(shù)據(jù)不僅要包含自由流狀態(tài)、寬移動(dòng)阻塞狀態(tài),還應(yīng)包括兩者之間的同步流狀態(tài).本文選取北京市四環(huán)路2013年3月17日至23日一周內(nèi)多個(gè)斷面的車道檢測(cè)數(shù)據(jù).數(shù)據(jù)采樣周期為2分鐘,每個(gè)車道包含5 040組數(shù)據(jù),每組檢測(cè)數(shù)據(jù)包含流量、速度、占有率等參數(shù).
將流量、速度、占有率三參數(shù)組成三維向量,計(jì)算各向量間的歐式距離,并根據(jù)式(5)求得β=0.37.在此基礎(chǔ)上,利用相似性度量公式構(gòu)建評(píng)價(jià)函數(shù)E(ω),并將流量、速度、占有率三參數(shù)賦予相同權(quán)重ω=(0.33,0.33,0.33),應(yīng)用式(8)~式(11)計(jì)算E(ω )的值,且當(dāng)E(ω)收斂時(shí)終止迭代,此時(shí)E(ω)的值為0.416,以及得到流量、速度、占有率三個(gè)參數(shù)的權(quán)重ω=(0.13,0.19,0.68).將參數(shù)權(quán)重引入到FCM聚類方法,并用該方法將交通劃分為自由流、同步流和寬移動(dòng)阻塞3個(gè)狀態(tài),得到三種交通狀態(tài)的聚類中心;同時(shí),運(yùn)用未改進(jìn)的FCM聚類方法對(duì)交通狀態(tài)進(jìn)行劃分,得到三種交通狀態(tài)的聚類中心.兩種聚類方法的聚類中心和聚類圖如表1,圖1和圖2所示.
表1 兩種狀態(tài)劃分方法的聚類中心Table 1 Cluster center by two measurements
圖1 基于歐式距離的FCM交通狀態(tài)劃分結(jié)果Fig.1 Results of classification by FCM based on Euclidean distance
圖2 基于加權(quán)歐式距離的FCM交通狀態(tài)劃分結(jié)果Fig.2 Results of classification by FCM based on weight Euclidean distance
從圖1可以看出,當(dāng)占有率小于20%時(shí),基于歐式距離的FCM狀態(tài)劃分結(jié)果包含自由流和同步流,但根據(jù)道路交通實(shí)際運(yùn)行情況,占有率小于20%時(shí),屬于自由流狀態(tài);該方法寬移動(dòng)阻塞狀態(tài)的占有率約為35%-80%,與實(shí)際交通狀態(tài)的寬移動(dòng)阻塞狀態(tài)的占有率在40%以上;同時(shí),基于歐式距離的FCM聚類方法劃分的各種交通狀態(tài)界限不明顯.從圖2可以看出,基于交通參數(shù)權(quán)重狀態(tài)劃分的各種狀態(tài)與實(shí)際運(yùn)行狀況基本相符,且各種交通狀態(tài)的分界線明顯.通過流量、速度、占有率參數(shù)得到的交通狀態(tài)聚類結(jié)果表明了本文所構(gòu)建模型的有效性.
為了驗(yàn)證構(gòu)建的狀態(tài)劃分模型在不同時(shí)段交通狀態(tài)判別中的應(yīng)用效果,本文選取一個(gè)斷面6:00~12:00交通參數(shù)數(shù)據(jù)(圖3),并判別不同時(shí)段交通狀態(tài).先將自由流狀態(tài)量化為1,同步流狀態(tài)量化為2,寬移動(dòng)阻塞狀態(tài)量化為3,然后根據(jù)WFCM和FCM得到的模糊聚類隸屬度矩陣分別確定各時(shí)段的交通狀態(tài),如圖4所示.
圖4 交通狀態(tài)判別結(jié)果Fig.4 Identification results of traffic state
從圖4中可以看出兩種劃分方法對(duì)不同時(shí)段的交通狀態(tài)判別結(jié)果不同.本文提出的方法得到10:12~10:48時(shí)段該斷面交通狀態(tài)屬于自由流,而FCM方法得到的交通狀態(tài)有同步流和寬移動(dòng)阻塞.結(jié)合圖3中流量、速度、占有率三參數(shù)曲線,可以確定該時(shí)段交通狀態(tài)屬于自由流.因此,通過對(duì)比兩種狀態(tài)劃分結(jié)果表明:本文構(gòu)建的基于參數(shù)權(quán)重的交通狀態(tài)劃分方法比基于歐式距離的FCM狀態(tài)劃分方法效果好,能夠提高交通狀態(tài)判別的精度.
交通運(yùn)行狀態(tài)劃分是交通狀態(tài)判別的基礎(chǔ),是正確選擇交通控制和誘導(dǎo)策略的核心技術(shù).考慮到不同交通參數(shù)在交通狀態(tài)劃分中的作用不同,本文給出一種基于交通參數(shù)權(quán)重的狀態(tài)劃分方法.
(1)通過基于加權(quán)歐氏距離的相似性度量方法構(gòu)建了參數(shù)評(píng)價(jià)函數(shù)對(duì)交通參數(shù)進(jìn)行求解,得到各交通參數(shù)權(quán)重.基于實(shí)測(cè)交通參數(shù)數(shù)據(jù),得到流量、速度、占有率3個(gè)基本交通參數(shù)中,占有率對(duì)交通狀態(tài)劃分影響最大.
(2)以北京市某一區(qū)域路網(wǎng)為例,進(jìn)行了實(shí)證研究,并與未改進(jìn)的FCM聚類方法對(duì)比.研究結(jié)果表明,本文提出的方法能夠?qū)煌顟B(tài)進(jìn)行劃分,且劃分結(jié)果與道路交通實(shí)際運(yùn)行狀態(tài)基本相符,提高了交通狀態(tài)劃分效果.
[1] Herman R,Prigogine I.A two-fluid approach to town traffic[J].Science,1979,204:148-151.
[2] Kener B S.Three-phase traffic theory and highway capacity[J].Physica A:Statistical Mechanics and its Applications,2004,333:379-440.
[3] 關(guān)偉,何蜀燕.基于統(tǒng)計(jì)特性的城市快速路交通流狀態(tài)劃分[J].交通運(yùn)輸系統(tǒng)工程與信息,2007,7(5):42-50.[GUAN W,HE S Y.Phase identification of urban freeway traffic based on statistical properties[J].Journal of Transportation Systems Engineering and Information Technology,2007,7(5):42-50.]
[4] Christiane S,Thomas A.Classification and prediction of road traffic using application-specific fuzzy clustering[J].IEEE Transactions on Fuzzy Systems, 2002,10(3):297-308.
[5] 陳德望.基于模糊聚類的快速路交通流狀況分類[J].交通運(yùn)輸系統(tǒng)工程與信息,2005,5(1):62-67.[CHEN D W.Classification of traffic flow situation of urban freeways based on fuzzy clustering[J]. Journal of Transportation Systems Engineering and Information Technology,2005,5(1):62-67.]
[6] 王璇,翁小雄.基于模糊C均值聚類的快速路交通流相態(tài)劃分[J].交通信息與安全,2009,27(1):149-152.[Classification of three-phase traffic flow of urban expressway based on fuzzy c-means clustering[J]. Journal of Transport Information and Safety,2009,27 (1):149-152.]
[7] 張心哲,關(guān)偉.城市快速路路段交通流狀態(tài)評(píng)估方法[J].北京交通大學(xué)學(xué)報(bào),2009,33(6):47-51.[JANG S C,GUAN W.A Method to estimate traffic flow state of urban freeway road section[J].JournalofBeijing Jiaotong University,2009,33(6):47-51.]
[8] Bezdek J C.Pattern recognition with fuzzy objective function algorithms[M].New York:Plenum Press,1981.
[9] Yeung D S,WANG X Z.Improving performance of similarity-based clustering by feature weight learning [J].IEEE Transactions on Pattern Analysis and Machine Intelligence,2002,24(4):556-561.
Traffic State Classification Based on Parameter Weighting and Clustering Method
ZHANG Liang-liang,JIAYuan-hua,NIU Zhong-hai,LIAO Cheng
(Beijing Jiaotong University,Beijing 100044,China)
Considering the different effect of each traffic parameter(traffic flow,speed,occupancy or density)on traffic state classification,the method is proposed to classify traffic state of urban traffic based on the parameter weighting.According to the similarity measurement method,a parameter evaluation function is put forward to give each parameter a parameter weighting based on weighted Euclidean distance,and minimize the function using the gradient method.After obtaining parameter weighting values,this paper uses the weighted Euclidean distance to replace the common Euclidean distance in Fuzzy C-means Clustering (FCM).Finally,we classify the traffic state using the proposed methodology,the traffic parameter data come from the road network,and comparing to the method of FCM.The results show that the proposed methodology which classifies the traffic state classification is more consistent with actual conditions.
urban traffic;traffic state classification;parameter weighting;fuzzy c-means clustering
2014-06-10
2014-09-28錄用日期:2014-10-08
國(guó)家自然科學(xué)研究基金項(xiàng)目(71340020).
張亮亮(1986-),男,江蘇徐州人,博士生. *
yhjia@bjtu.edu.cn
1009-6744(2014)06-0147-05
U491
A