孫廣林, 劉君
(公安部道路交通安全研究中心, 北京 100062)
道路交通狀態(tài)是表征交通運(yùn)行狀況的關(guān)鍵指標(biāo)。準(zhǔn)確識(shí)別當(dāng)前交通狀態(tài)是引導(dǎo)出行者合理選擇出行方式及路徑,提高道路交通資源利用效率和防止交通狀態(tài)持續(xù)惡化的重要依據(jù)。根據(jù)已有研究成果,交通狀態(tài)可劃分為暢通和擁擠兩類,以此為基礎(chǔ)可進(jìn)一步細(xì)分為自由流、密集流、擁堵流和阻塞流等。交通狀態(tài)識(shí)別主要依據(jù)交通量、速度、占有率、密度、排隊(duì)長(zhǎng)度、飽和度等基本交通參數(shù),采用聚類分析方法劃分狀態(tài)類型。實(shí)際應(yīng)用中,不同交通參數(shù)對(duì)交通狀態(tài)聚類的貢獻(xiàn)程度不一樣,且樣本屬性特征間具有不平衡性。傳統(tǒng)的聚類分析方法假定所有數(shù)據(jù)樣本及其特征具有一致性,未體現(xiàn)樣本及特征屬性對(duì)聚類結(jié)果的影響。針對(duì)傳統(tǒng)聚類算法理想化的假設(shè)條件,提出多屬性加權(quán)的改進(jìn)聚類算法,該方法主要采用樣本概率分布和最大熵原理確定權(quán)重值。多采用信息熵原理確定各交通狀態(tài)識(shí)別指標(biāo)的權(quán)重或根據(jù)交通參數(shù)間的相似性構(gòu)建評(píng)價(jià)函數(shù),通過(guò)最優(yōu)化方法獲得權(quán)值。樣本與特征雙加權(quán)聚類算法的提出及在圖像識(shí)別等領(lǐng)域的應(yīng)用,補(bǔ)充了樣本及特征對(duì)聚類結(jié)果的影響,也為解決傳統(tǒng)模糊C均值(Fuzzy C-means,F(xiàn)CM)聚類算法在交通狀態(tài)識(shí)別應(yīng)用中的弊端提供了路徑。該文在確定交通狀態(tài)類別和FCM算法的基礎(chǔ)上,利用樣本和特征加權(quán)FCM聚類方法進(jìn)行交通狀態(tài)識(shí)別,采用拉格朗日乘數(shù)法更新隸屬度和簇中心及樣本與特征權(quán)值,進(jìn)一步設(shè)計(jì)雙加權(quán)聚類算法,通過(guò)實(shí)例對(duì)比分析雙加權(quán)策略FCM與傳統(tǒng)FCM聚類的效果和性能,驗(yàn)證雙加權(quán)策略FCM識(shí)別交通狀態(tài)的有效性。
傳統(tǒng)交通流理論應(yīng)用交通量、車(chē)速和密度描述交通流狀態(tài)特征,并將交通流劃分為自由流和擁擠流兩種狀態(tài)。這里根據(jù)道路交通管理需要及出行者對(duì)交通運(yùn)行的直觀感受,將交通狀態(tài)劃分為自由流、擁堵流和阻塞流3種類型。道路交通量、速度、密度是描述交通流基本特征的主要參數(shù),其中交通密度在實(shí)際應(yīng)用中往往采用容易測(cè)量的車(chē)道占用率來(lái)間接表征,包括空間擁有率和時(shí)間占用率。綜合現(xiàn)有研究成果選用交通狀態(tài)參數(shù)的頻率及參數(shù)樣本獲取的便利性,選取交通量、平均速度、空間占用率3個(gè)交通參數(shù)進(jìn)行聚類分析,識(shí)別交通狀態(tài)類別。
(1) 自由流。自由流狀態(tài)下交通流量小、車(chē)速高、路段車(chē)輛空間占有率低,駕駛?cè)司哂休^大的行車(chē)自由度,車(chē)輛行駛幾乎不受其他車(chē)輛影響,道路交通處于暢通狀態(tài)。
(2) 擁堵流。擁堵流狀態(tài)下交通流量接近道路通行能力,車(chē)速顯著下降,路段車(chē)輛空間占有率較高,駕駛?cè)笋{車(chē)自由度明顯受限,行駛車(chē)輛之間相互影響,道路交通處于不穩(wěn)定狀態(tài),交通流波動(dòng)較大。
(3) 阻塞流。阻塞流狀態(tài)下交通流量呈斷崖式下降,車(chē)輛間歇性停駛,車(chē)頭時(shí)距趨于穩(wěn)定,路段車(chē)輛空間占有率非常高,整個(gè)路段車(chē)輛處于同步跟馳狀態(tài),相鄰車(chē)道車(chē)速基本一致。
FCM聚類是基于目標(biāo)優(yōu)化的聚類方法。設(shè)給定的數(shù)據(jù)集X={X1,X2,…,Xn}包含n個(gè)樣本,將樣本分為c類,1 (1) 式中:J(U,V)為樣本到簇中心的距離加權(quán)值;U={uij},為c×n階模糊分類矩陣;V=[v1,v2,…,vc],為p×c階簇中心矩陣;vi為簇中心;uij為第j個(gè)樣本隸屬于第i個(gè)簇的程度,1≤i≤n,1≤j≤c;m為加權(quán)指數(shù);(dij)2=‖xj-vi‖2,為樣本到簇中心的歐式距離。 由樣本距離模糊簇中心最小準(zhǔn)則,可獲得聚類目標(biāo)表達(dá)式: (4) 拉格朗日乘數(shù)法是求解變量在多個(gè)條件限制下多元函數(shù)極值的方法,具有較高的通用性和普適性。因此,通過(guò)構(gòu)建拉格朗日函數(shù),采用拉格朗日乘數(shù)法求解隸屬度uij及簇中心vi。 (5) 2.1.1 隸屬度的確定 由式(5)~(8),采用Lagrange方法確定隸屬度。定義f、g、h為L(zhǎng)agrange乘子,其中f是由Lagrange乘子構(gòu)成的向量,f=(f1,f2,…,n)。Lagrange函數(shù)L表示為: 1.對(duì)于縣級(jí)金融機(jī)構(gòu)的撤并,縮減農(nóng)村金融服務(wù)。從1999年起,中國(guó)工商銀行、中國(guó)農(nóng)業(yè)銀行、中國(guó)銀行、中國(guó)建設(shè)銀行從農(nóng)村逐步撤出,四大國(guó)有銀行基本取消了縣級(jí)分支機(jī)構(gòu)?,F(xiàn)有網(wǎng)點(diǎn)主要是集中于縣城,鄉(xiāng)鎮(zhèn)農(nóng)村金融基本上被邊緣化。這導(dǎo)致在一些金融服務(wù)城鄉(xiāng)經(jīng)濟(jì)中出現(xiàn)了空白現(xiàn)象,農(nóng)村嚴(yán)重缺失金融資金供給,農(nóng)村金融服務(wù)的狀況令人擔(dān)憂。 (9) 將Lagrange函數(shù)L分別對(duì)uij和fj求偏導(dǎo),令?L/?uij=0、?L/?fj=0,則: (10) (11) 由式(10)計(jì)算隸屬度uij,得: (12) 將Lagrange函數(shù)L對(duì)簇中心vik求導(dǎo),由?L/vik=0得到簇中心值: (13) 聯(lián)合式(11)、式(12)求解隸屬度uij,得: (14) 2.1.2 權(quán)值的確定 將Lagrange函數(shù)L分別對(duì)樣本權(quán)值αj、特征權(quán)值βk求導(dǎo),由?L/αj=0、?L/βk=0,得樣本與特征權(quán)值分別為: (15) (16) 根據(jù)式(5)~(16),設(shè)計(jì)雙加權(quán)FCM聚類算法(DFCM)如下: (2) 若j 3.1.1 數(shù)據(jù)準(zhǔn)備 選取北京市西五環(huán)晉元橋—石景山路出口段南向交通視頻數(shù)據(jù)作為聚類分析的數(shù)據(jù)源,該路段長(zhǎng)1 km,單向三車(chē)道,最高限速80 km/h。視頻數(shù)據(jù)記錄時(shí)間為2019年3月13日7:00—19:00,未發(fā)生交通事故或其他突發(fā)事件。以5 min為單位(共145個(gè)樣本)統(tǒng)計(jì)該路段交通量、平均速度、空間占有率時(shí)間分布情況,結(jié)果見(jiàn)圖1~3。 從圖1~3可以看出:測(cè)試路段7:25—8:25、17:25—18:25出現(xiàn)顯著的流量高峰,流量波動(dòng)幅度較大,交通運(yùn)行處于擁堵流狀態(tài);中午時(shí)段流量相對(duì)較低,對(duì)應(yīng)的平均車(chē)速較高、道路空間占有率較低,交通運(yùn)行處于自由流狀態(tài);17:20平均速度降至最低20 km/h,道路空間占有率達(dá)到最高0.64,同時(shí)流量顯著下降,交通運(yùn)行處于阻塞流狀態(tài)。測(cè)試路段7:00—19:00時(shí)段內(nèi)具有不同的交通運(yùn)行狀態(tài)特征分布,源數(shù)據(jù)完整可用并具有良好的適用性。 圖1 測(cè)試路段交通量時(shí)間分布 圖2 測(cè)試路段平均速度時(shí)間分布 圖3 測(cè)試路段空間占有率時(shí)間分布 3.1.2 參數(shù)初始化 輸入測(cè)試路段源數(shù)據(jù)及初始化參數(shù)值,采用MATLAB模糊聚類工具箱輸出傳統(tǒng)FCM聚類結(jié)果,對(duì)比分析3類交通狀態(tài)隸屬度函數(shù)值、聚類目標(biāo)函數(shù)值,比較兩類算法的聚類效果與計(jì)算效率。 3.2.1 簇中心矩陣 FCM和DFCM聚類算法簇中心矩陣V1、V2為: V1與V2中,行表示交通狀態(tài),列表示狀態(tài)識(shí)別指標(biāo),各類交通狀態(tài)識(shí)別指標(biāo)值均在交通量閾值[189,2 047]、平均速度閾值[20,76]、占有率閾值[0.1,0.64]內(nèi),簇中心可用于聚類計(jì)算。 3.2.2 隸屬度值 聚類算法樣本隸屬度值接近0/1的數(shù)量可用來(lái)衡量聚類算法效果的優(yōu)劣,隸屬度值越接近0/1,類內(nèi)樣本的相似度越高,不同類間的差異越顯著,聚類效果愈顯著。FCM和DFCM聚類算法3類交通狀態(tài)隸屬度函數(shù)值見(jiàn)圖4~6。 圖4 FCM與DFCM阻塞流樣本隸屬度 圖5 FCM與DFCM擁堵流樣本隸屬度 圖6 FCM與DFCM自由流樣本隸屬度 3.2.3 目標(biāo)函數(shù) 傳統(tǒng)FCM和DFCM聚類算法目標(biāo)函數(shù)值的變化見(jiàn)圖7。 圖7 FCM與DFCM的目標(biāo)函數(shù)值 由圖7可知:DFCM聚類算法的目標(biāo)函數(shù)值遠(yuǎn)小于FCM聚類算法,DFCM聚類算法經(jīng)過(guò)43次迭代即滿足迭代終止條件,而FCM聚類算法經(jīng)過(guò)70次迭代才滿足迭代終止條件,DFCM聚類算法的計(jì)算效率比FCM聚類算法提高1.6倍。 引入樣本權(quán)值和特征權(quán)值,提出雙加權(quán)FCM的交通狀態(tài)識(shí)別方法。針對(duì)實(shí)測(cè)路段交通視頻數(shù)據(jù),分別采用傳統(tǒng)FCM與雙加權(quán)FCM進(jìn)行計(jì)算,并對(duì)聚類結(jié)果進(jìn)行對(duì)比分析。結(jié)果表明:雙加權(quán)FCM聚類算法獲得的交通狀態(tài)識(shí)別效果、相同狀態(tài)內(nèi)樣本相似度、不同狀態(tài)間的差異性及計(jì)算性能均優(yōu)于傳統(tǒng)FCM聚類算法,能有效體現(xiàn)數(shù)據(jù)樣本和特征屬性對(duì)交通狀態(tài)聚類結(jié)果的影響。2 加權(quán)FCM聚類算法
2.1 隸屬度與權(quán)值
2.2 算法實(shí)現(xiàn)
3 實(shí)例分析
3.1 數(shù)據(jù)準(zhǔn)備與初始化
3.2 聚類效果分析
4 結(jié)論