趙遠洋,薛運強,徐佳云,劉 銳
(華東交通大學(xué)交通運輸與物流學(xué)院,江西 南昌 330013)
近年來,傳感器技術(shù)蓬勃發(fā)展。特別是在交通運輸領(lǐng)域,以道路檢測器為例,其可靠性得到了大幅度提升,并且所采集的數(shù)據(jù)量很大,便于后續(xù)進行研究分析。目前,檢測器數(shù)據(jù)在交通運輸領(lǐng)域的應(yīng)用大體上有以下幾類:一是基于一些算法(如小波分析、神經(jīng)網(wǎng)絡(luò)、聚類算法等)進行交通預(yù)測[1];二是關(guān)于道路交通參數(shù)的綜合研究[2];三是通過分析其自身的檢測屬性進而優(yōu)化檢測器進行物理布局[3?4]。當(dāng)前數(shù)據(jù)挖掘算法應(yīng)用廣泛,而且與傳統(tǒng)的時間序列算法相結(jié)合更有意義。特別是對于交叉口,由于其存在4個方向,各個方向之間的聯(lián)系十分緊密,僅根據(jù)交通流的時間分布及空間分布來研究其交通運行特性是不夠全面的。國內(nèi)有很多關(guān)于交叉口交通運行特性的研究,其中按交通流組成成分劃分,一類是以機動車為研究主體,討論交叉口的運行指標(biāo)[5];另一類是以非機動車和行人作為研究整體,研究慢行交通對交叉口通行效率的影響等[6?7]。國外的一些研究還傾向于說明交通參與者的行為對交通運行特性的影響[8?9]。
為了更加全面地對道路交通運行特性進行研究分析,本文結(jié)合江西省南昌市青山湖區(qū)某交叉口的交通數(shù)據(jù),按短期、中期、較長期3個階段分解交通流量,提出一種組合式交通流量特征研究方法,該方法不是簡單地將交通流數(shù)據(jù)與某種數(shù)學(xué)算法結(jié)合而得出整體的流量特征,而是利用交通流數(shù)據(jù)本身所具有的狀態(tài)相似性和周期性,采用譜聚類算法與快速獨立成分分析(Fast Independent Component Analysis,簡稱FastICA)算法分階段分析,并比較各進口流量特征,最后得出研究結(jié)論。該研究結(jié)論可為交通管理部門制定更加有效的交通控制措施提供科學(xué)依據(jù)。
短期交通流量分布的隨機性較大,為了降低其對結(jié)果準確度的影響,采用以幾何理論為背景的譜聚類算法。在譜聚類[10?12]算法中,能夠根據(jù)數(shù)據(jù)集合構(gòu)造出一個描述各數(shù)據(jù)點相似度的矩陣,并且計算矩陣的特征向量和特征值,然后選擇恰當(dāng)?shù)奶卣飨蛄繉Σ煌臄?shù)據(jù)點聚類。本文在處理全天流量數(shù)據(jù)時,應(yīng)用譜聚類算法,其具體實現(xiàn)步驟如下[13?16]:
(1)匯總各進口道的流量數(shù)據(jù),共分為4個進口道,每個數(shù)據(jù)單元代表每5min流量數(shù)據(jù),最終制作成288×4矩陣;
(2)先后對南北進向、東西進向分別利用K近鄰(K?Nearest Neighbors,簡稱KNN)方法將空間數(shù)據(jù)集轉(zhuǎn)化為K近鄰網(wǎng)絡(luò)(即構(gòu)建樣本的相似矩陣S);
(3)根據(jù)相似矩陣S構(gòu)建鄰接矩陣W和度矩陣D;
(4)計算拉普拉斯矩陣:
(5)構(gòu)造標(biāo)準化后的拉普拉斯矩陣:
(6)計算Lsym降序的前K個特征值所各自對應(yīng)的特征向量f,其中K是期望的簇數(shù);
(7)將特征向量f組成的矩陣按行進行標(biāo)準化,形成特征矩陣F;
(8)將F中的每一行作為一個樣本,應(yīng)用K均值(K?Means)聚類方法聚類。
交通流量變化在較長時間內(nèi)會呈現(xiàn)出一定的規(guī)律性,而信號波形的變化往往呈一定的周期性,將交叉口交通流量變化與信號變化相類比,發(fā)現(xiàn)它們在時間上具有一定的相似性,由此為了減少無關(guān)因素對較長期流量數(shù)據(jù)變化特征的影響,引入FastI?CA算法。FastICA算法是獨立成分分析(Indepen?dent Component Analysis,簡稱ICA)算法中適用范圍廣泛、分離準確度較高的算法,它是基于定點遞推算法得到的。將其運用至本文中,核心步驟如下。
定義信號源S(t)、混合矩陣A、觀察信號X(t)、解混矩陣WT。其中ICA 關(guān)系模型為[17?18]:
令y=WTX(t),則y=WTAS(t),由此可知y是S(t)的線性組合。當(dāng)WT接近A?1時:
這樣將問題轉(zhuǎn)化為最大化y的非高斯性進而求解W。具體的算法實現(xiàn)步驟見圖1[19?21]。其中,數(shù)據(jù)集是依據(jù)1周的流量數(shù)據(jù)建立大小為2016×4的矩陣。
圖1 FastICA算法流程圖
算例交叉口位于江西省南昌市青山湖區(qū)(見圖2),其中東進口與八一橋直接相連,滿足往來車輛及行人的過江交通需求;西進口與廬山南大道地鐵站(地鐵一號線的??空局唬┫噙B,南進口方向可直通紅谷灘新區(qū),北進口方向可達英雄大橋。此交叉口交通地位十分重要。
圖2 交叉口平面圖
選取該交叉口現(xiàn)有的9個車輛檢測器的檢測數(shù)據(jù)作為研究對象,時間為2017年10月9日—2017年10月15日(5個工作日加2個休息日),數(shù)據(jù)采樣間隔為5min。為了方便研究各進口道的交通運行特性,將數(shù)據(jù)劃分為4個單元(東、南、西、北)并經(jīng)匯總處理后,最終得到8 064個研究數(shù)據(jù)。根據(jù)交通量的時間分布特點分別選取1h,1d,1周的數(shù)據(jù)(見圖3)。
圖3 檢測器數(shù)據(jù)劃分圖
(1)關(guān)于短時交通流量的研究,分別選取2017年10月10日的早高峰小時、平峰小時、晚高峰小時的流量數(shù)據(jù),得到了流量的方向分布(見圖4)和對應(yīng)的變化細節(jié)(見圖5)。從圖4看出,東進口的交通量不論是在高峰期還是在平峰期均維持在較高的水平,其他3個方向的流量占比較小。由此可知,在1d中的3個特殊小時時段內(nèi),八一橋?qū)υ摻徊婵诮煌ㄟ\行狀態(tài)的影響程度基本相同。從圖5可知3個特殊時段各進口的流量變化情況,西進口的流量變化幅度比其他3個進向大,雖然東進口的流量一直居高不下,但流量的變化幅度較小。南北進口的流量變化幅度不大。以上的分析是基于3個特殊小時流量數(shù)據(jù),屬于短期研究階段。
圖4 小時流量方向分布圖
圖5 小時流量變化箱線圖
(2)為了更好地研究對向交通流量實時變化情況,延長檢測器數(shù)據(jù)的觀測時間,選取2017年10月10日全天的各進口每5min流量數(shù)據(jù),并進行歸一化處理,然后分別對東、西進口和南、北進口應(yīng)用譜聚類分析法分析,最終得出了數(shù)據(jù)集的相似度圖(見圖6)。從圖6(a)和圖6(b)中可以看出,每個網(wǎng)絡(luò)均可以被虛線較為清晰地劃分為兩個子圖。按照對交叉口流量分析的基本主觀判斷,分類數(shù)(即K值)應(yīng)該至少取2,存在高峰和平峰兩個基本特征流量類。這里也分別計算出了其他聚類數(shù)所對應(yīng)的輪廓值(見表1)。但發(fā)現(xiàn)不論是東、西進口,還是南、北進口流量聚類的輪廓圖,K=2都比其他聚類結(jié)果要好(即K=2比其他聚類數(shù)目所得出的結(jié)果準確度更高)。這說明該交叉口高峰期與平峰期的流量特征存在較大差異。根據(jù)聚類數(shù)為2時交通量聚類分析(見圖7)及輪廓圖(見圖8),對各類進行研究。
圖6 相似度圖
表1 對向交通量聚類效果輪廓值表
圖7 交通量聚類分析(K=2)
圖8 交通量聚類分析輪廓圖(K=2)
通過表1、圖7(a)和圖7(b)可知,它們各自聚類中心連線的斜率基本趨近于1,由于聚類數(shù)據(jù)是取同一時刻相同時間長度(5min)各進口道的交通量,反映了南、北兩個方向車輛到達的相對情況(東、西方向同理)。從南、北兩個方向聚類流量點的分布可以看出,車輛在南進口到達數(shù)比北進口多。在A聚類團與B聚類團分界處(圖中虛線)流量點排列較為規(guī)整,即兩個方向相似的車輛到達情況比較多。在圖的左下角,存在分布集中的流量點,表明兩個進口道在觀測日中存在一段時間車輛到達率很低的情況。從東、西兩個方向聚類團流量點的分布可以看出,由于存在東進口車流量的客觀影響,使聚類中心連線偏下,然而分界線周圍流量點分布稀疏,即兩個方向車輛到達數(shù)差異較大。雖然東進口車輛到達數(shù)要大于西進口,但西進口車輛到達隨機性更大,最終造成D聚類團縱向離散程度高。
(3)針對交通流量的時間變化情況,為挖掘各進向交通流量影響規(guī)律,選取2017年10月9日—2017年10月15日1周的流量數(shù)據(jù),進行方向分類得到圖9。根據(jù)圖9中數(shù)據(jù)趨勢的變化,各進向流量分布特征和日變化特征相似,平均流量曲面基本上呈現(xiàn)出了該時間尺度下流量的分布情況。東進口仍然是這個交叉口主要的流量輸入方向。西進口短時流量變化幅度減弱,與其他進口間的流量相比要更穩(wěn)定。對各進口流量利用FastICA算法進行降噪處理,分別得到處理前(見圖10(a))及處理后(見圖10(b))變化規(guī)律。在相同的描述范圍內(nèi),各向流量的變化特征更為明顯,存在一定的變化規(guī)律。比如,北進口流量變化趨勢明顯,而其他3個方向所呈現(xiàn)的變化趨勢比較模糊,并且西進口流量變化情況與短期流量變化情況相似,短期流量較大的東進口呈現(xiàn)出較西進口更為穩(wěn)定的流量分布。
圖9 交叉口各進口5min交通流量統(tǒng)計圖(2017年10月9日—2017年10月15日)
圖10 1周內(nèi)交叉口各進向流量變化圖
綜合上述分析,可得出如下結(jié)論:從宏觀角度看,本文所提方法融入了信號降噪算法,濃縮并提煉了數(shù)據(jù)的周期性特征,可以較好地把握交叉口各進口流量的長期變化趨勢;從微觀角度看,該方法應(yīng)用譜聚類算法,通過分析數(shù)據(jù)的幾何相似性特征,能夠避免短期流量突變而造成的結(jié)果失真,對保證研究結(jié)果準確性具有十分重要的意義。算例的分析過程表明,該方法在理論計算上實現(xiàn)了多個時間角度的參照對比,使得結(jié)果更具代表性。最后,本文所提出的方法在理論上能夠得出交叉口交通運行特征,為后續(xù)提高交叉口通行效率的研究奠定了理論基礎(chǔ)。由于該方法應(yīng)用的數(shù)據(jù)集較小,造成時間長度的上限是1周,該時間單位對交叉口長期交通運行特性的把握還不夠全面,所以擴大數(shù)據(jù)集和時間長度是下一步研究的重點。