孟勃 孔祥科 李樹彬
摘要:為了進(jìn)一步研究交通流特性,采用復(fù)雜網(wǎng)絡(luò)方法對(duì)交通序列數(shù)據(jù)進(jìn)行分析。提出了箱型圖-聚類算法模型用于識(shí)別和填充初始數(shù)據(jù)中的缺失值和異常值;通過相空間重構(gòu)方法將一維數(shù)據(jù)重構(gòu)為網(wǎng)絡(luò)節(jié)點(diǎn),選取連接閾值確定網(wǎng)絡(luò)節(jié)點(diǎn)的連接關(guān)系,將交通序列數(shù)據(jù)構(gòu)建為復(fù)雜網(wǎng)絡(luò),對(duì)復(fù)雜網(wǎng)絡(luò)的結(jié)構(gòu)和定量指標(biāo)進(jìn)行分析。研究結(jié)果表明交通序列數(shù)據(jù)復(fù)雜網(wǎng)絡(luò)的結(jié)構(gòu)一定程度上可以反映路段的交通流狀態(tài)。該結(jié)果有助于優(yōu)化數(shù)據(jù)預(yù)處理方法,拓展復(fù)雜網(wǎng)絡(luò)在交通序列數(shù)據(jù)研究中的應(yīng)用。
關(guān)鍵詞:復(fù)雜網(wǎng)絡(luò);數(shù)據(jù)分析;網(wǎng)絡(luò)構(gòu)建方法;相空間重構(gòu);聚類算法
中圖分類號(hào):U491?? 文獻(xiàn)標(biāo)志碼:A?? 文章編號(hào):1002-4026(2024)01-0107-11
The characteristics of traffic sequence data based on complex network
Abstract∶To study the traffic flow characteristics, the traffic data is analyzed using a complex network method. A box plot-clustering algorithm model is proposed to identify and fill in missing values and outliers in the initial data. The one-dimensional data is reconstructed into network nodes using the phase space reconstruction method. Additionally, the connection threshold is selected to determine the connection relationship of network nodes to convert the traffic sequence data as a complex network and analyze the structure and quantitative indicators of the network. The result shows that the structure of the complex network of traffic data can reflect the traffic flow state of the road section to a certain extent. The research optimizes the data preprocessing method and extends the application of complex networks into traffic data research.
Key words∶complex networks; data analysis; network building methods; phase space reconstruction; clustering algorithm
近年來,隨著數(shù)據(jù)分析、人工智能的發(fā)展,通過交通序列數(shù)據(jù)研究復(fù)雜的交通系統(tǒng)逐漸成為研究熱點(diǎn)。交通序列數(shù)據(jù)是按照時(shí)間順序和固定的時(shí)間間隔采集的交通流參數(shù)數(shù)據(jù),用于描述交通流隨時(shí)間的變化情況。目前,基于交通序列數(shù)據(jù)的研究主要集中在采用人工智能算法的交通流預(yù)測(cè)。武瓊[1]基于支持向量回歸模型預(yù)測(cè)交通流參數(shù),并進(jìn)行了動(dòng)態(tài)預(yù)測(cè)系統(tǒng)開發(fā)。趙懷柏等[2]利用遺傳算法對(duì)BP(back propagation)反向傳播神經(jīng)網(wǎng)絡(luò)神經(jīng)網(wǎng)絡(luò)的參數(shù)進(jìn)行優(yōu)化,實(shí)驗(yàn)證明了優(yōu)化后模型在進(jìn)行交通流預(yù)測(cè)時(shí)在預(yù)測(cè)精度和運(yùn)算效率方面具有明顯提升。Ma等[3]構(gòu)建了基于長短期神經(jīng)網(wǎng)絡(luò)的交通流預(yù)測(cè)模型,對(duì)比驗(yàn)證了該模型具有更好的預(yù)測(cè)精度。上述研究主要集中于交通序列數(shù)據(jù)的直接應(yīng)用,研究重點(diǎn)集中在通過優(yōu)化模型參數(shù)或構(gòu)建組合模型來提高模型的預(yù)測(cè)精度,往往缺乏對(duì)交通序列數(shù)據(jù)的深入分析和挖掘。
復(fù)雜網(wǎng)絡(luò)理論作為一種表征系統(tǒng)內(nèi)部各因素相互關(guān)系的通用工具,逐漸在各個(gè)研究領(lǐng)域得到更多應(yīng)用。以交通領(lǐng)域?yàn)槔?,?fù)雜網(wǎng)絡(luò)廣泛應(yīng)用在城市道路網(wǎng)和城市公共交通網(wǎng)的研究中。對(duì)于城市道路網(wǎng),Strano等[4]以原始圖法對(duì)比分析了歐洲10個(gè)城市的街道網(wǎng)絡(luò)的結(jié)構(gòu)相似性和特性。葉彭姚[5]分析了中國城市道路網(wǎng)絡(luò)的特征,并驗(yàn)證了網(wǎng)絡(luò)節(jié)點(diǎn)度服從冪分布。對(duì)于城市公交網(wǎng)絡(luò),Lu等[6]驗(yàn)證了公交網(wǎng)絡(luò)參數(shù)符合復(fù)雜網(wǎng)絡(luò)特征,并發(fā)現(xiàn)這些參數(shù)對(duì)公共交通的可達(dá)性、安全性有影響。許晴等[7]利用公交路線換乘關(guān)系模型研究了中國330個(gè)城市的公交復(fù)雜網(wǎng)絡(luò)結(jié)構(gòu)特征。Yang等[8]構(gòu)建了公交-地鐵復(fù)合網(wǎng)絡(luò),通過級(jí)聯(lián)失效模型,研究極端天氣下公共交通網(wǎng)絡(luò)的魯棒性。
城市道路和公共交通均具備一定的網(wǎng)絡(luò)實(shí)體結(jié)構(gòu),如城市道路可以抽象為交叉口和路段組成的網(wǎng)絡(luò)結(jié)構(gòu),公共交通可以抽象為站點(diǎn)和線路組成的網(wǎng)絡(luò)結(jié)構(gòu),因此在構(gòu)建復(fù)雜網(wǎng)絡(luò)時(shí)往往是對(duì)其物理結(jié)構(gòu)的復(fù)現(xiàn)。然而,不同于上述網(wǎng)絡(luò),數(shù)據(jù)不具備典型的網(wǎng)絡(luò)結(jié)構(gòu)形式,在構(gòu)建復(fù)雜網(wǎng)絡(luò)時(shí)需要進(jìn)行節(jié)點(diǎn)的構(gòu)造和連接關(guān)系的確定。Wang等[9]利用可見圖法構(gòu)建GDP國內(nèi)生產(chǎn)總值時(shí)序數(shù)據(jù)復(fù)雜網(wǎng)絡(luò),并分析網(wǎng)絡(luò)特性。Gao等[10]驗(yàn)證了以時(shí)間序列數(shù)據(jù)構(gòu)建的網(wǎng)絡(luò)能夠保留數(shù)據(jù)的主要性質(zhì)。Mao等[11]基于可見圖的預(yù)測(cè)方法將時(shí)間序列轉(zhuǎn)換成復(fù)雜網(wǎng)絡(luò),預(yù)測(cè)節(jié)點(diǎn)間的相似度。
目前,通過復(fù)雜網(wǎng)絡(luò)對(duì)交通序列數(shù)據(jù)的研究還較少,在交通序列數(shù)據(jù)處理、網(wǎng)絡(luò)構(gòu)建等方面還存在不足。因此,本文以交通序列數(shù)據(jù)為研究對(duì)象,主要研究交通序列數(shù)據(jù)的網(wǎng)絡(luò)化表示方法以及網(wǎng)絡(luò)結(jié)構(gòu)、特性指標(biāo)所表現(xiàn)出的交通流特征,探究二者之間的內(nèi)在聯(lián)系。本文首先提出了箱型圖-聚類算法模型,用于處理數(shù)據(jù)中的缺失值和異常值;然后通過相空間重構(gòu)和臨界閾值將交通序列數(shù)據(jù)構(gòu)建為復(fù)雜網(wǎng)絡(luò),最后進(jìn)行網(wǎng)絡(luò)結(jié)構(gòu)分析和網(wǎng)絡(luò)指標(biāo)計(jì)算。
1 數(shù)據(jù)分析與預(yù)處理
1.1 交通序列數(shù)據(jù)
交通系統(tǒng)是一個(gè)多維、動(dòng)態(tài)的復(fù)雜系統(tǒng),系統(tǒng)內(nèi)部各因素相互影響。交通流特性是交通流運(yùn)行狀態(tài)的定性、定量表征,宏觀上用于描述交通流作為一個(gè)整體表現(xiàn)出來的特性,微觀上是指彼此相關(guān)的交通參與者的運(yùn)行狀態(tài)。在不受橫向交叉影響的路段上,交通流呈連續(xù)流狀態(tài);當(dāng)受到橫向干擾時(shí),如路口信號(hào)燈管制時(shí),交通流呈現(xiàn)出斷續(xù)流狀態(tài)。
交通流隨著時(shí)間和空間的變化而變化,由于出行的規(guī)律性,交通流在一定周期內(nèi)呈現(xiàn)出重復(fù)性,即具有周期性特征;同時(shí),交通流受到車輛、行人和其他干擾因素的影響,又表現(xiàn)出強(qiáng)烈的隨機(jī)性和不確定性。交通流的特性可以通過交通序列數(shù)據(jù)進(jìn)行表征和分析,本文主要以交通流的速度序列數(shù)據(jù)為研究對(duì)象。圖1繪制了廣州市兩條快速路不同時(shí)間周期的速度變化圖,數(shù)據(jù)來源于廣州市交通委員會(huì)公布的開源數(shù)據(jù)。由圖1可以看出路段速度變化在一周內(nèi)具有明顯的周期波動(dòng)性,每天的速度變化具有相似性,但并非完全相同,這表明了交通系統(tǒng)具有一定的隨機(jī)性。
交通序列數(shù)據(jù)是交通系統(tǒng)運(yùn)行狀態(tài)的最直接反應(yīng),分析研究交通序列數(shù)據(jù)對(duì)于挖掘交通系統(tǒng)運(yùn)行規(guī)律、緩解城市交通擁堵具有重要意義。目前,交通序列數(shù)據(jù)的采集方式主要有磁頻采集技術(shù)、波頻采集技術(shù)和視頻采集技術(shù)等方法,由于受到環(huán)境干擾、傳感器精度等因素的影響,交通序列數(shù)據(jù)的質(zhì)量往往會(huì)受到缺失數(shù)據(jù)和噪聲數(shù)據(jù)的干擾,從而影響到基于數(shù)據(jù)的分析結(jié)果[12]。
1.2 改進(jìn)數(shù)據(jù)預(yù)處理方法
數(shù)據(jù)預(yù)處理是進(jìn)行數(shù)據(jù)分析的重要前提,缺失值的填充、異常值的替換是數(shù)據(jù)預(yù)處理的兩個(gè)關(guān)鍵。插值法和數(shù)理統(tǒng)計(jì)法是較為常見的數(shù)據(jù)預(yù)處理方法[13-14]。插值法主要依賴時(shí)間或空間相鄰數(shù)據(jù)進(jìn)行填充,對(duì)于連續(xù)缺失的數(shù)據(jù)處理效果較差。數(shù)理統(tǒng)計(jì)法主要通過假設(shè)的數(shù)據(jù)分布估計(jì)填充值,相關(guān)參數(shù)的假設(shè)對(duì)于填充值的影響較大。為了提高數(shù)據(jù)預(yù)處理的效果,本文基于機(jī)器學(xué)習(xí),改進(jìn)傳統(tǒng)的數(shù)據(jù)預(yù)處理方法,提出了箱型圖-聚類算法的數(shù)據(jù)預(yù)處理模型。模型共分為如下關(guān)鍵步驟。
步驟一:通過箱型圖法識(shí)別數(shù)據(jù)集中的異常值。箱型圖法是一種較為客觀的判定異常值的有效方法[14]。如式(1)所示,f(x)為異常值的判定函數(shù),當(dāng)f(x)=1時(shí),判定數(shù)據(jù)為異常值;反之,當(dāng)f(x)=0時(shí),判定數(shù)據(jù)為正常值。
其中,Q1為升序數(shù)列的25%位點(diǎn);Q3為升序數(shù)列的75%位點(diǎn);Δ=Q3-Q1。
步驟二:通過聚類算法對(duì)交通序列數(shù)據(jù)進(jìn)行聚類分析。本文選用的聚類算法為層次聚類算法,該方法依據(jù)數(shù)據(jù)點(diǎn)的相似度,構(gòu)建多層嵌套樹模型進(jìn)行數(shù)據(jù)聚類,主要聚類流程為將采集的原始數(shù)據(jù)構(gòu)建為初始數(shù)據(jù)簇,在初始數(shù)據(jù)簇的基礎(chǔ)上,每次選擇相似度最高的兩個(gè)數(shù)據(jù)簇合并為新的簇,依次迭代到目標(biāo)分類數(shù)。
步驟三:根據(jù)步驟二的層次聚類結(jié)果對(duì)不同類別的交通狀態(tài)進(jìn)行認(rèn)定,計(jì)算相同交通狀態(tài)數(shù)據(jù)的平均值。
步驟四:確定缺失值或異常值所處的交通狀態(tài),以相同狀態(tài)數(shù)據(jù)的平均值進(jìn)行填充。層次聚類算法填充缺失值和異常值的主要流程如圖2所示。
2 復(fù)雜網(wǎng)絡(luò)的構(gòu)建
2.1 網(wǎng)絡(luò)節(jié)點(diǎn)的確定
網(wǎng)絡(luò)是由節(jié)點(diǎn)和節(jié)點(diǎn)間的連接關(guān)系確定的,以城市軌道交通網(wǎng)絡(luò)為例,在構(gòu)建復(fù)雜網(wǎng)絡(luò)時(shí)常以軌道站點(diǎn)作為節(jié)點(diǎn),存在地鐵線路連接的站點(diǎn)之間則設(shè)置連邊。由于在數(shù)據(jù)中不存在典型的網(wǎng)絡(luò)節(jié)點(diǎn),因此本文利用相空間重構(gòu)方法,將一維數(shù)據(jù)構(gòu)建為多維相空間,作為復(fù)雜網(wǎng)絡(luò)的節(jié)點(diǎn)。相空間重構(gòu)存在兩個(gè)關(guān)鍵參數(shù):延遲時(shí)間和嵌入維數(shù)。在Takens嵌入定理中,證明了延遲時(shí)間和嵌入維數(shù)理論上的存在性[15]。在實(shí)際數(shù)據(jù)應(yīng)用中,需要根據(jù)數(shù)據(jù)的實(shí)際情況選取。
假設(shè)交通流時(shí)間序列為x=xii=1,2,…,n,其中n為時(shí)間序列長度。通過相空間重構(gòu)將該分量重構(gòu)矩陣X,如式(2)所示。
其中,τ表示延遲時(shí)間,即序列時(shí)間間隔;m表示嵌入維數(shù),即重構(gòu)后矩陣維度;N=n-(m-1)τ。
2.1.1 延遲時(shí)間選取
本文采用互信息熵法[16]計(jì)算相空間重構(gòu)的延遲時(shí)間。假設(shè)存在序列A=a1,a2,…,an和序列B=b1,b2,…,bn,則二者的互信息熵δ(A,B)計(jì)算如式(3)。
其中,p(ai),p(bj)為樣本集合中ai和bj所占的比例,p(ai,bj)為ai和bj的聯(lián)合分布概率。
互信息熵表示在已知序列A的前提下,序列B的不確定性減小程度。兩個(gè)序列之間的互信息熵越小,說明序列間的相關(guān)程度越低。因此在相空間重構(gòu)時(shí),通過計(jì)算原始序列數(shù)據(jù)和延遲后的序列數(shù)據(jù)的互信息熵,并繪制互信息熵隨延遲時(shí)間的變化圖來確定最佳的延遲時(shí)間。
2.1.2 嵌入維數(shù)選取
Cao方法[17]是在偽臨近點(diǎn)法的基礎(chǔ)上改進(jìn)而來,該方法相較于其他方法,所需數(shù)據(jù)量小,設(shè)定參數(shù)少且能夠有效識(shí)別數(shù)據(jù)的確定性和隨機(jī)性。Cao方法通過判定指標(biāo)E1(m)的變化來選取嵌入維數(shù)。假設(shè)Xi(m)=(xi,xi+τ,…,xi+(m-1)τ)是重構(gòu)后矩陣的第i個(gè)相點(diǎn)矢量,i=1,2,…,N, m表示重構(gòu)矩陣的維數(shù),其最鄰近點(diǎn)為XNNi(m),定義
其中,
E1(m)的計(jì)算公式如式(6)所示,當(dāng)E1(m)從某個(gè)值m0不再改變時(shí),則認(rèn)為m0為最小嵌入維數(shù)。
在實(shí)際研究中,對(duì)于E1(m)是緩慢增長還是停止變化是難以判斷的,因此增加一個(gè)判斷指標(biāo)E2(m),如式(7)~(8)。
對(duì)于隨機(jī)數(shù)列,數(shù)據(jù)之間不存在相關(guān)性,E2(m)的值會(huì)始終為1;對(duì)于確定性序列,數(shù)據(jù)點(diǎn)間的相關(guān)性取決于嵌入維數(shù)m的值,總存在一些E2(m)的值不等于1。因此在相空間重構(gòu)時(shí),通過E2(m)的值確定數(shù)據(jù)是否為確定性數(shù)據(jù),通過E1(m)隨著嵌入維數(shù)的變化情況來確定最佳嵌入維數(shù)。
2.2 網(wǎng)絡(luò)邊的確定
對(duì)于相空間重構(gòu)后的時(shí)間序列,以重構(gòu)空間中的矢量點(diǎn)作為網(wǎng)絡(luò)節(jié)點(diǎn)v,節(jié)點(diǎn)間的連接由節(jié)點(diǎn)間的空間距離L和臨界閾值ε共同決定。假設(shè)矩陣W=(wvivj)為網(wǎng)絡(luò)鄰接矩陣,其連接規(guī)則由公式(9)所示。
式中,wvivj=1表示節(jié)點(diǎn)vi,vj連接;wvivj=0表示節(jié)點(diǎn)vi,vj之間斷開。
由式(9)可以看出,連接閾值對(duì)于網(wǎng)絡(luò)的構(gòu)建具有重要意義。本文將網(wǎng)絡(luò)密度的變化率作為確定最佳連接閾值的指標(biāo)。隨著連接閾值的增加,網(wǎng)絡(luò)中節(jié)點(diǎn)之間的連邊數(shù)增加,即網(wǎng)絡(luò)密度增加。當(dāng)連接閾值接近網(wǎng)絡(luò)中所有簇的平均半徑時(shí),邊增加將達(dá)到最大速率;繼續(xù)增加連接閾值將導(dǎo)致節(jié)點(diǎn)間的冗余連接,邊增加得趨于緩慢,網(wǎng)絡(luò)密度的增速放緩[18-19]。因此,本文通過繪制網(wǎng)絡(luò)密度變化率隨連接閾值的變化圖,選取網(wǎng)絡(luò)密度增加速率最大的點(diǎn)作為最佳閾值。
3 案例分析
本研究采用廣州市2條快速路的實(shí)測(cè)車速數(shù)據(jù),時(shí)間窗為10 min,一周的數(shù)據(jù)總量為1 008條。通過箱型圖-聚類算法模型對(duì)原始數(shù)據(jù)進(jìn)行預(yù)處理,然后將車速數(shù)據(jù)構(gòu)建為復(fù)雜網(wǎng)絡(luò),并通過復(fù)雜網(wǎng)絡(luò)的相關(guān)指標(biāo)對(duì)網(wǎng)絡(luò)特性進(jìn)行分析。
3.1 數(shù)據(jù)預(yù)處理
本節(jié)首先利用箱型圖-聚類算法模型對(duì)原始數(shù)據(jù)中的異常值和缺失值進(jìn)行識(shí)別與填充。圖3繪制了箱型圖對(duì)車速數(shù)據(jù)中異常值的判定結(jié)果,由圖3可以看出,本文采用的快速路車速數(shù)據(jù)中的異常值主要分布在較小值。
本文采用的聚類算法為層次聚類算法,以原始數(shù)據(jù)中的每個(gè)值作為一個(gè)初始聚類簇,依次選擇距離最近的兩個(gè)簇合并為新的簇,直到迭代達(dá)到目標(biāo)分類數(shù)。德國學(xué)者Kerner[20]在對(duì)大量交通流數(shù)據(jù)進(jìn)行統(tǒng)計(jì)分析的基礎(chǔ)上,提出了三相交通流理論,即認(rèn)為交通流存在自由流、同步流和寬運(yùn)動(dòng)堵塞流3種狀態(tài)。因此,根據(jù)三相交通流理論,本文在進(jìn)行聚類分析時(shí)預(yù)設(shè)目標(biāo)分類數(shù)為3類。
圖4繪制了車速數(shù)據(jù)的聚類分析結(jié)果,結(jié)果顯示聚類算法能夠很好的識(shí)別交通狀態(tài),交通流狀態(tài)被劃分為自由流、同步流和寬運(yùn)動(dòng)堵塞流。表1列舉了每組數(shù)據(jù)的層次聚類得到的不同交通狀態(tài)下的速度平均值。
3.2 網(wǎng)絡(luò)構(gòu)建
3.2.1 網(wǎng)絡(luò)節(jié)點(diǎn)的確定
圖5繪制了互信息熵隨延遲時(shí)間的變化圖。由圖5可以看出,隨著延遲時(shí)間的增加,互信息熵逐漸減少并趨于穩(wěn)定,根據(jù)曲線的變化情況,選取互信息熵減小至較小值并趨于穩(wěn)定時(shí)的點(diǎn)作為相空間重構(gòu)的延遲時(shí)間,取值見表2。
圖6繪制了E1(m)、E2(m)隨嵌入維數(shù)的變化圖。由圖可以看出,隨著嵌入維數(shù)的增加,E2(m)在值1的上下波動(dòng),可認(rèn)為所研究的時(shí)間序列均為確定性過程,E1(m)先增加后趨于平穩(wěn),選取E1(m)增加并趨于穩(wěn)定時(shí)的值作為相空間重構(gòu)的嵌入維數(shù),取值見表2。
3.2.2 連接閾值的確定
圖7繪制了隨著嵌入維數(shù)的變化,網(wǎng)絡(luò)密度變化率的情況,選擇網(wǎng)絡(luò)密度變化率最高的點(diǎn)作為連接閾值的最佳值,因此道路一一日、道路一一周、道路二一日和道路二一周選取的最佳連接閾值分別是20、19、20、24。
3.3 網(wǎng)絡(luò)分析
根據(jù)選取的閾值將節(jié)點(diǎn)之間的距離矩陣轉(zhuǎn)化為鄰接矩陣,如圖8所示。圖中橫縱坐標(biāo)表示網(wǎng)絡(luò)中的節(jié)點(diǎn)序列,藍(lán)色點(diǎn)位表示對(duì)應(yīng)節(jié)點(diǎn)對(duì)之間存在連接,白色點(diǎn)位則表示節(jié)點(diǎn)對(duì)之間不存在連接。對(duì)比道路一和道路二的鄰接矩陣可以看出,道路一的鄰接矩陣圖像中藍(lán)色點(diǎn)位區(qū)域更為聚集,而道路二的圖像中,藍(lán)色點(diǎn)位區(qū)域較為分散,且存在一些孤立的藍(lán)色點(diǎn)。由此可以得出,不同的道路交通流狀態(tài)會(huì)導(dǎo)致鄰接矩陣圖像的差異性,進(jìn)而影響復(fù)雜網(wǎng)絡(luò)的結(jié)構(gòu)。
根據(jù)網(wǎng)絡(luò)構(gòu)建方法和閾值選取結(jié)構(gòu),構(gòu)建了交通序列數(shù)據(jù)復(fù)雜網(wǎng)絡(luò)。在此基礎(chǔ)上,選擇網(wǎng)絡(luò)平均度、介數(shù)、聚類系數(shù)作為網(wǎng)絡(luò)評(píng)價(jià)指標(biāo)。度是指網(wǎng)絡(luò)節(jié)點(diǎn)相關(guān)聯(lián)的邊的數(shù)量,平均度則是所有網(wǎng)絡(luò)節(jié)點(diǎn)度的平均值。介數(shù)是指網(wǎng)絡(luò)中的最短路徑中,經(jīng)過某節(jié)點(diǎn)的最短路徑的占比。聚類系數(shù)是度量網(wǎng)絡(luò)中節(jié)點(diǎn)聚集程度的系數(shù),從數(shù)學(xué)上講,節(jié)點(diǎn)vi的局部聚類系數(shù)Cvi表示為公式(10)。
式中,evi表示節(jié)點(diǎn)vi的鄰域內(nèi)節(jié)點(diǎn)間的連接邊數(shù),即由節(jié)點(diǎn)vi以及其鄰域內(nèi)兩個(gè)節(jié)點(diǎn)形成的三角形數(shù)量,kvi是節(jié)點(diǎn)vi的度。
圖9分別繪制了兩條道路不同時(shí)間周期的復(fù)雜網(wǎng)絡(luò)圖。對(duì)比不同尺度的時(shí)間序列網(wǎng)絡(luò)可以看出,一定程度上時(shí)間尺度的增加對(duì)于網(wǎng)絡(luò)分析具有重要意義。隨著時(shí)間尺度的增加,兩條道路的時(shí)間序列網(wǎng)絡(luò)結(jié)構(gòu)特征更加明顯。由圖9(a)(c)可以看出,日周期的交通序列數(shù)網(wǎng)絡(luò)表現(xiàn)出一定的集群結(jié)構(gòu)特征,網(wǎng)絡(luò)中存在兩個(gè)較大的集群,而對(duì)于周周期的交通序列數(shù)據(jù)網(wǎng)絡(luò),如圖9(b)(d)所示,網(wǎng)絡(luò)的明顯的收斂在一個(gè)區(qū)域,形成一個(gè)大簇。
表3列舉了不同網(wǎng)絡(luò)的定量指標(biāo),對(duì)比道路一和道路二的網(wǎng)絡(luò)結(jié)構(gòu)和指標(biāo)可以看出,道路一交通序列數(shù)據(jù)網(wǎng)絡(luò)的平均度和平均聚類系數(shù)更高,網(wǎng)絡(luò)的集聚性更加凸顯,而道路二交通序列數(shù)據(jù)網(wǎng)絡(luò)中的孤立節(jié)點(diǎn)和孤立集群的數(shù)量和比例更高。復(fù)雜網(wǎng)絡(luò)的結(jié)構(gòu)和指標(biāo)一定程度上表明:相較于道路二,道路一不同時(shí)間段的交通流參數(shù)的波動(dòng)較小,交通運(yùn)行狀態(tài)較為穩(wěn)定,而道路二的交通運(yùn)行狀態(tài)存在較大波動(dòng)。穩(wěn)定的交通流反映在網(wǎng)絡(luò)上表現(xiàn)為網(wǎng)絡(luò)節(jié)點(diǎn)之間的相似度更高,節(jié)點(diǎn)之間的聚集性更好;而波動(dòng)的交通流則容易形成分散的集群或孤立的節(jié)點(diǎn)。因此,在對(duì)路段進(jìn)行交通管控時(shí),應(yīng)重點(diǎn)針對(duì)孤立節(jié)點(diǎn)和集群對(duì)應(yīng)的時(shí)間段,深入分析交通波動(dòng)誘因,以采集精細(xì)化的交通管控手段。
4 結(jié)論
交通序列數(shù)據(jù)是交通流狀態(tài)的直接表現(xiàn),分析和研究交通序列數(shù)據(jù)對(duì)于深入理解復(fù)雜的交通系統(tǒng),制定切實(shí)有效的交通管控措施具有重要意義。本文將復(fù)雜網(wǎng)絡(luò)理論引入交通流研究中并用于交通序列數(shù)據(jù)分析,提出的基于機(jī)器學(xué)習(xí)層次聚類算法能夠在考慮交通流狀態(tài)的基礎(chǔ)上,實(shí)現(xiàn)缺失值和異常值的填充;在復(fù)雜網(wǎng)絡(luò)構(gòu)建方面,利用相空間重構(gòu)技術(shù)將一維數(shù)據(jù)轉(zhuǎn)化為多維矢量點(diǎn),作為復(fù)雜網(wǎng)絡(luò)的節(jié)點(diǎn);通過網(wǎng)絡(luò)密度確定節(jié)點(diǎn)連接閾值,將節(jié)點(diǎn)間距離矩陣轉(zhuǎn)化為鄰接矩陣,并構(gòu)建成網(wǎng)絡(luò);通過分析網(wǎng)絡(luò)結(jié)構(gòu)和指標(biāo)論證了網(wǎng)絡(luò)結(jié)構(gòu)一定程度上可以反映道路交通流狀態(tài)。本文研究成果可為交通管理部門提供可行建議,但是如何通過時(shí)間序列網(wǎng)絡(luò)指標(biāo)定量的精確識(shí)別交通狀態(tài)仍是未來研究需要努力的方向。
參考文獻(xiàn):
[1]武瓊. 基于支持向量回歸的短時(shí)交通流預(yù)測(cè)方法研究與應(yīng)用[D]. 西安:長安大學(xué), 2016.
[2]趙懷柏, 王逸凡, 宋曉鵬. 基于遺傳算法優(yōu)化BP神經(jīng)網(wǎng)絡(luò)的交通流預(yù)測(cè)[J]. 交通與運(yùn)輸(學(xué)術(shù)版), 2017(2): 32-36.
[3]MA X L, TAO Z M, WANG Y H, et al. Long short-term memory neural network for traffic speed prediction using remote microwave sensor data[J]. Transportation Research Part C: Emerging Technologies, 2015, 54: 187-197. DOI: 10.1016/j.trc.2015.03.014.
[4]STRANO E, VIANA M, da FONTOURA COSTA L, et al. Urban street networks, a comparative analysis of ten European cities[J]. Environment and Planning B: Planning and Design, 2013, 40(6): 1071-1086. DOI: 10.1068/b38216.
[5]葉彭姚. 城市道路網(wǎng)拓?fù)浣Y(jié)構(gòu)的復(fù)雜網(wǎng)絡(luò)特性研究[J]. 交通運(yùn)輸工程與信息學(xué)報(bào), 2012, 10(1): 13-19. DOI: 10.3969/j.issn.1672-4747.2012.01.003.
[6]LU H P, SHI Y. Complexity of public transport networks[J]. Tsinghua Science & Technology, 2007, 12(2): 204-213. DOI: 10.1016/S1007-0214(07)70029-9.
[7]許晴, 祖正虎, 徐致靖, 等. 330個(gè)中國城市P空間下公交復(fù)雜網(wǎng)絡(luò)實(shí)證研究[J]. 交通運(yùn)輸系統(tǒng)工程與信息, 2013, 13(1): 193-198. DOI: 10.16097/j.cnki.1009-6744.2013.01.001.
[8]YANG H H, AN S. Robustness evaluation for multi-subnet composited complex network of urban public transport[J]. Alexandria Engineering Journal, 2021, 60(2): 2065-2074. DOI: 10.1016/j.aej.2020.12.016.
[9]WANG N, LI D, WANG Q W. Visibility graph analysis on quarterly macroeconomic series of China based on complex network theory[J].Physica A: Statistical Mechanics and Its Applications, 2012, 391(24): 6543-6555. DOI: 10.1016/j.physa.2012.07.054.
[10]GAO Z K, JIN N D. Complex network from time series based on phase space reconstruction[J]. Chaos: an Interdisciplinary Journal of Nonlinear Science, 2009, 19(3): 033137. DOI: 10.1063/1.3227736.
[11]MAO S Z, XIAO F Y. Time series forecasting based on complex network analysis[J]. IEEE Access, 2019, 7: 40220-40229. DOI: 10.1109/ACCESS.2019.2906268.
[12]鄒曉芳. 城市快速路交通流故障數(shù)據(jù)修復(fù)方法研究[D]. 北京:北京交通大學(xué), 2014.
[13]苗旭, 王忠宇, 鄒亞杰,等. 改進(jìn)的固定交通檢測(cè)器缺失數(shù)據(jù)綜合修復(fù)方法[J]. 同濟(jì)大學(xué)學(xué)報(bào)(自然科學(xué)版), 2019, 47 (10): 1477-1484. DOI: 10.11908/j.issn.0253-374x.2019.10.013.
[14]姜桂艷, 冮龍暉, 張曉東,等.動(dòng)態(tài)交通數(shù)據(jù)故障識(shí)別與修復(fù)方法[J]. 交通運(yùn)輸工程學(xué)報(bào), 2004(01): 121-125. DOI: 10.3321/j.issn:1671-1637.2004.01.030.
[15]孟力, 畢葉平. 相空間重構(gòu)文獻(xiàn)綜述可視化分析[J]. 系統(tǒng)仿真學(xué)報(bào), 2017, 29(12): 3167-3175. DOI: 10.16182/j.issn1004731x.joss.201712030.
[16]李媛媛. 基于相空間重構(gòu)和SVR的短時(shí)間交通流預(yù)測(cè)方法研究[D]. 北京: 北京交通大學(xué), 2018.
[17]CAO L Y. Practical method for determining the minimum embedding dimension of a scalar time series[J].Physica D: Nonlinear Phenomena, 1997, 110(1/2): 43-50. DOI: 10.1016/S0167-2789(97)00118-8.
[18]TANG J J, WANG Y H, LIU F. Characterizing traffic time series based on complex network theory[J]. Physica A: Statistical Mechanics and Its Applications, 2013, 392(18): 4192-4201. DOI: 10.1016/j.physa.2013.05.012.
[19]TANG J J, WANG Y H, WANG H, et al. Dynamic analysis of traffic time series at different temporal scales: a complex networks approach[J]. Physica A: Statistical Mechanics and Its Applications, 2014, 405: 303-315. DOI: 10.1016/j.physa.2014.03.038.
[20]KERNER B S. The physics of traffic[J]. Physics World, 1999, 12(8): 25-30. DOI: 10.1088/2058-7058/12/8/30.