侯軍軍, 龍佰超, 王洪鈺, 肖建力
(上海理工大學(xué) 光電信息與計(jì)算機(jī)工程學(xué)院,上海 200093)
現(xiàn)有的交通狀態(tài)預(yù)報(bào)方法通常以較小空間尺度的路段作為研究對(duì)象。例如,高德地圖和百度地圖顯示的交通狀態(tài)就是以路段的不同顏色來(lái)表示。然而,在某些情形下,大空間尺度的路網(wǎng)交通狀態(tài)預(yù)報(bào)往往更為重要,特別是對(duì)宏觀路網(wǎng)區(qū)域交通狀態(tài)的預(yù)報(bào)。例如,假設(shè)需要選擇一個(gè)交通狀態(tài)良好的區(qū)域舉辦一場(chǎng)演唱會(huì),選擇徐家匯還是人民廣場(chǎng)區(qū)域,此時(shí),需要對(duì)區(qū)域的交通狀態(tài)進(jìn)行評(píng)價(jià)。然而,對(duì)區(qū)域交通狀態(tài)進(jìn)行評(píng)價(jià),首先必須產(chǎn)生路網(wǎng)區(qū)域。因此,本文主要關(guān)注路網(wǎng)區(qū)域劃分方法的研究。
早期的城市路網(wǎng)區(qū)域劃分主要根據(jù)行政區(qū)域及土地性質(zhì)等因素來(lái)進(jìn)行[1]。該方法主要用于研究區(qū)域的演變及其空間格局的變化,其特點(diǎn)是將鄉(xiāng)鎮(zhèn)街道的變化等因素融入路網(wǎng)區(qū)域劃分的研究中。近年來(lái),路網(wǎng)交通狀態(tài)的預(yù)報(bào)對(duì)路網(wǎng)區(qū)域劃分的目標(biāo)提出了更高的要求,需要進(jìn)行路網(wǎng)區(qū)域劃分后得到的區(qū)域盡量能夠反映本區(qū)域的交通特性,如果仍然基于之前的思路進(jìn)行劃分,顯然已無(wú)法滿足現(xiàn)代路網(wǎng)區(qū)域劃分的要求[2]。國(guó)內(nèi)外學(xué)者對(duì)此展開了深入的研究。
目前,國(guó)內(nèi)學(xué)者對(duì)城市路網(wǎng)區(qū)域劃分的研究,大體上可以分為兩種思路:一種是以路網(wǎng)內(nèi)交叉口的交通特性作為劃分標(biāo)準(zhǔn),將交通特性相近的交叉路口劃分為同一個(gè)交通區(qū)域,這種路網(wǎng)劃分方法稱為聚類分析方法[3];第二種是考慮交通路網(wǎng)中所有路段的交叉口,再通過已經(jīng)規(guī)定好的搜索規(guī)則,對(duì)符合搜索規(guī)則的交叉口路段統(tǒng)一考慮后劃入同一個(gè)區(qū)域,這種路網(wǎng)劃分方法稱為遍歷搜尋法[4]。Moore等[5]提出兩步劃分法,將路網(wǎng)劃分分成兩步:初次劃分時(shí)依據(jù)交叉路口的流量大小以及信號(hào)控制參數(shù)作為劃分的標(biāo)準(zhǔn),通過聚類分析完成初次的區(qū)域劃分;然后加入最大綠波帶優(yōu)化模型,并以信號(hào)配時(shí)優(yōu)化為目標(biāo),在初次劃分的結(jié)果上對(duì)路網(wǎng)區(qū)域?qū)崿F(xiàn)二次劃分。Geroliminis等[6]提出了宏觀基本圖的概念,通過應(yīng)用示例數(shù)據(jù)區(qū)交通流進(jìn)行數(shù)據(jù)分析,發(fā)現(xiàn)城市路網(wǎng)中均存在“回滯環(huán)”的現(xiàn)象,即宏觀基本圖客觀存在且具有不隨時(shí)間變化的共性,這為城市路網(wǎng)區(qū)域劃分提供了新的研究思路。
總體來(lái)看,現(xiàn)有的路網(wǎng)區(qū)域劃分方法的研究還是不夠成熟,不能夠適應(yīng)現(xiàn)代路網(wǎng)區(qū)域劃分的要求。為此,本文提出了基于交通指數(shù)聚類的路網(wǎng)區(qū)域動(dòng)態(tài)劃分方法。為驗(yàn)證城市路網(wǎng)區(qū)域劃分方法的性能,采用基于k-means++聚類算法[7]的路網(wǎng)區(qū)域劃分方法進(jìn)行區(qū)域劃分,并與其他聚類方法進(jìn)行對(duì)比。結(jié)果表明,本文提出的路網(wǎng)區(qū)域劃分方法的精度要優(yōu)于其他對(duì)比方法,且具有良好的穩(wěn)定性。
圖1呈現(xiàn)了基于聚類的路網(wǎng)區(qū)域劃分方法的流程,其具體步驟為:第一步,對(duì)整個(gè)城市區(qū)域進(jìn)行網(wǎng)格劃分,路網(wǎng)中的路段被網(wǎng)格切分成不同的子路段,每個(gè)子路段都從屬于某個(gè)特定的網(wǎng)格;第二步,計(jì)算每個(gè)網(wǎng)格的交通指數(shù);第三步,對(duì)每個(gè)網(wǎng)格提取特征,建立樣本特征矩陣;第四步,對(duì)樣本特征矩陣進(jìn)行聚類,得到初始聚類標(biāo)簽;第五步,對(duì)奇異網(wǎng)格的標(biāo)簽進(jìn)行修正,得到網(wǎng)格的最終標(biāo)簽,同時(shí)對(duì)面積過小的區(qū)域進(jìn)行合并;最后,將具有相同標(biāo)簽的網(wǎng)格組成一個(gè)路網(wǎng)區(qū)域,對(duì)城市路網(wǎng)區(qū)域劃分的結(jié)果進(jìn)行可視化,得到最終的劃分結(jié)果。
圖1 路網(wǎng)區(qū)域動(dòng)態(tài)劃分方法流程Fig.1 Flowchart of the dynamic division method of traffic road network area
本文提出的路網(wǎng)區(qū)域動(dòng)態(tài)劃分方法,其主要思路是先將整個(gè)路網(wǎng)區(qū)域劃分成相同大小的網(wǎng)格,然后對(duì)網(wǎng)格進(jìn)行聚類,從而得到路網(wǎng)區(qū)域。要實(shí)現(xiàn)這一想法,首先需要對(duì)整個(gè)城市區(qū)域進(jìn)行網(wǎng)格劃分。先選定整個(gè)城市的路網(wǎng)區(qū)域,該區(qū)域?yàn)橐粋€(gè)矩形區(qū)域。然后,將其劃分為N×N的網(wǎng)格,其中,N為矩形區(qū)域的長(zhǎng)或?qū)挼牡确謹(jǐn)?shù)且N為正整數(shù)。在本文的研究中,將整個(gè)上海區(qū)域劃分成50×50的網(wǎng)格。自然地,一條長(zhǎng)的路段會(huì)被網(wǎng)格切分成不同的子路段,每個(gè)子路段將從屬于一個(gè)唯一的網(wǎng)格。得到網(wǎng)格后,在接下來(lái)的小節(jié)中將為每個(gè)網(wǎng)格計(jì)算交通指數(shù)。
交通暢通指數(shù)[8]被定義為在給定時(shí)間段內(nèi),城市路網(wǎng)或區(qū)域的總體暢通程度的相對(duì)數(shù),它是一個(gè)無(wú)量綱的量。交通暢通指數(shù)的區(qū)間為[0,100],數(shù)值大小與暢通程度成正比,即數(shù)值越大表示狀態(tài)越暢通,數(shù)值越小則越擁堵[9]。本文將交通暢通指數(shù)簡(jiǎn)稱為交通指數(shù)。
一個(gè)路網(wǎng)區(qū)域的交通指數(shù)可由式(1)計(jì)算得到,即
式中:TFI表示一個(gè)網(wǎng)格的交通指數(shù);i代表當(dāng)前路網(wǎng)區(qū)域中的第i條子路段;r代表當(dāng)前區(qū)域?qū)儆诘趓種路網(wǎng);t代表當(dāng)前時(shí)間屬于第t個(gè)時(shí)間段;vi為路段實(shí)際交通流速度;vfr為不同路網(wǎng)下的路段的自由流車速,根據(jù)路網(wǎng)為快速路、地面主干道、次干道、支路以及高速公路取不同的值;li為路段i的里程長(zhǎng)度;ki為路段的車道數(shù);wt為時(shí)間權(quán)重系數(shù),按高峰時(shí)段和平峰時(shí)段取不同的權(quán)重;wr為路網(wǎng)權(quán)重系數(shù),根據(jù)路網(wǎng)屬于快速路、地面主干道、地面次干道、地面支路、高速公路取不同的權(quán)重。
為了后續(xù)對(duì)網(wǎng)格進(jìn)行聚類,必須先對(duì)每個(gè)網(wǎng)格進(jìn)行特征提取??梢杂删W(wǎng)格連續(xù)一段時(shí)間內(nèi)的交通指數(shù)以及網(wǎng)格的坐標(biāo)來(lái)構(gòu)造該網(wǎng)格的特征向量。例如,取一個(gè)小時(shí)內(nèi)網(wǎng)格的交通指數(shù),由于指數(shù)的計(jì)算周期是10 min/次,即一共取6組交通指數(shù)加入到網(wǎng)格的特征向量中。對(duì)于第i個(gè)網(wǎng)格,其特征向量可以表示為
式中:fi表示第i個(gè)網(wǎng)格的特征向量;(x,y)表示第i個(gè)網(wǎng)格的坐標(biāo);TFIi,1表示第i個(gè)網(wǎng)格的第1個(gè)計(jì)算周期的交通指數(shù),其余的5個(gè)交通指數(shù)以此類推。
對(duì)所有網(wǎng)格均作類似處理,可以得到由所有網(wǎng)格的特征向量組成的樣本特征矩陣。由于本文中路網(wǎng)劃分是按照50×50來(lái)進(jìn)行劃分的,即一共有2 500個(gè)網(wǎng)格。于是,樣本特征矩陣可表示為
可以將樣本特征矩陣F表示為列向量的形式,即有
a. 初始聚類。
得到樣本特征矩陣后,需要對(duì)其進(jìn)行聚類,從而產(chǎn)生初始的聚類標(biāo)簽。一些常見的聚類算法都可以用來(lái)執(zhí)行聚類任務(wù),例如,k-means聚類算法[10]、k-means++聚類算法、Birch聚類算法[11]和AGNES聚類算法[12]等。本文采用k-means++聚類算法進(jìn)行樣本特征矩陣的聚類。
在k-means++聚類算法中,數(shù)據(jù)點(diǎn)與聚類中心之間的最近距離用D(x)表示,其中μo(o=1,2,···,n)表示n個(gè)聚類中心點(diǎn),D(x)的具體計(jì)算公式[13]如下:G={g1,g2,···,gk},則聚類中心的數(shù)學(xué)表達(dá)式可以表示為[13]
k-means++聚類算法在聚類中心點(diǎn)的選取過程中引入了概率的思想:將每一個(gè)被選中的樣本數(shù)據(jù)點(diǎn)概率與距其最近的已選中心點(diǎn)的距離相互聯(lián)系,這樣距離越大被選中的概率就越大。選取好k-means++聚類中心點(diǎn)后,還需要對(duì)選定的聚類中心點(diǎn)進(jìn)行不斷更新,直到聚類中心點(diǎn)不再發(fā)生變化。假定類別數(shù)為k,則聚類中心G可以表示為
式中:gk表示第k類樣本簇的中心點(diǎn);|Gk|表示第k類樣本簇的樣本總數(shù);Ak表示第k類樣本簇的樣本集合;xi表示第k類樣本簇的第i個(gè)樣本。kmeans++聚類算法的具體步驟如下:
步驟1從輸入的樣本特征數(shù)據(jù)F={x1,x2,···,xn}中隨機(jī)選擇一個(gè)數(shù)據(jù)點(diǎn)作為第一個(gè)聚類中心點(diǎn)μ1;
步驟2對(duì)于數(shù)據(jù)點(diǎn)xi,計(jì)算數(shù)據(jù)點(diǎn)與第一個(gè)聚類中心點(diǎn)的最近距離;
步驟3選擇新的數(shù)據(jù)點(diǎn)作為新的聚類中心點(diǎn),其中選取的原則為D(x)中距離較大的點(diǎn),其被選為聚類中心點(diǎn)的概率較大;
步驟4重復(fù)上述步驟2和步驟3,選出k個(gè)聚類中心點(diǎn),然后對(duì)其更新,直到滿足所有條件,輸出聚類標(biāo)簽。
通過k-means++聚類算法對(duì)樣本特征矩陣進(jìn)行初始的聚類后,可以得到網(wǎng)格的聚類標(biāo)簽。圖1(b)為網(wǎng)格數(shù)為10、類別數(shù)為6的帶有聚類標(biāo)簽的可視化效果圖,數(shù)字代表每個(gè)小網(wǎng)格的聚類標(biāo)簽。注意,該圖只是一個(gè)示意圖,為給讀者一個(gè)直觀的展示。
b. 奇異網(wǎng)格標(biāo)簽的修正。
通過初始聚類得到聚類標(biāo)簽,然后對(duì)具有相同類別標(biāo)簽的網(wǎng)格著上同一種顏色,得到初始聚類的可視化結(jié)果圖,如圖1(c)所示。為了更清楚地觀察到初始聚類可視化結(jié)果圖中存在的奇異網(wǎng)格,對(duì)圖1(c)進(jìn)行局部放大,結(jié)果如圖1(d)所示。對(duì)其中存在的部分奇異網(wǎng)格用紅色方框標(biāo)識(shí)出來(lái)。所謂奇異網(wǎng)格是指其標(biāo)簽(即顏色)與周圍鄰域內(nèi)網(wǎng)格的絕大多數(shù)標(biāo)簽存在明顯差異的網(wǎng)格。奇異網(wǎng)格的標(biāo)簽可能是錯(cuò)誤的,因此,需要采用正確的方法對(duì)奇異網(wǎng)格的標(biāo)簽進(jìn)行修正。
圖1(d)展示了中心網(wǎng)格的四連通和八連通區(qū)域內(nèi)的奇異網(wǎng)格??梢钥吹狡娈惥W(wǎng)格與四連通和八連通區(qū)域內(nèi)絕大多數(shù)網(wǎng)格的顏色明顯不同。為便于后續(xù)論述,先給出四連通與八連通區(qū)域的基本概念。
根據(jù)數(shù)字圖像處理[14]中的相關(guān)理論,四連通區(qū)域是指處于中心網(wǎng)格上、下、左、右,緊鄰的4個(gè)網(wǎng)格區(qū)域,如圖2(a)所示。共有4個(gè)方向,所以稱為四連通區(qū)域,又稱四鄰域。假設(shè)中心網(wǎng)格p的坐標(biāo)為(x,y),則四連通數(shù)學(xué)含義可定義為
同理,八連通區(qū)域,是指在中心網(wǎng)格的上、下、左、右、左上、右上、左下、右下,是緊鄰的網(wǎng)格和斜向相鄰的網(wǎng)格區(qū)域組成的全體,共8個(gè)方向,所以稱之為八連通區(qū)域或八鄰域,如圖2(b)所示。假設(shè)中心網(wǎng)格p的坐標(biāo)為(x,y),則八連通數(shù)學(xué)含義可定義為
圖2 奇異網(wǎng)格示意圖Fig.2 Examples of singular grids
本文提出一種基于八連通多數(shù)投票的奇異網(wǎng)格標(biāo)簽修正方法,其具體步驟如下:
步驟1輸入初始聚類標(biāo)簽;
步驟2判斷在中心網(wǎng)格的八連通區(qū)域中是否存在奇異網(wǎng)格,如果存在奇異網(wǎng)格,則將奇異網(wǎng)格聚類標(biāo)簽修正為八鄰域內(nèi)數(shù)目最多的標(biāo)簽,同時(shí)中心網(wǎng)格右移一個(gè)網(wǎng)格,直到所有奇異網(wǎng)格的聚類標(biāo)簽都得到修正,否則重復(fù)步驟1和步驟2;
步驟3輸出修正后的聚類標(biāo)簽。
經(jīng)過基于八連通多數(shù)投票的奇異網(wǎng)格標(biāo)簽修正后,即可得到初始的路網(wǎng)區(qū)域劃分,觀察各個(gè)區(qū)域,一旦發(fā)現(xiàn)某個(gè)區(qū)域的面積過小,且其顏色與周圍面積較大區(qū)域的顏色相近,則將該區(qū)域進(jìn)行合并。
對(duì)于上述步驟得到的區(qū)域,還需要用輪廓線進(jìn)行標(biāo)識(shí),具體方法為:通過比較各網(wǎng)格的聚類標(biāo)簽來(lái)畫出城市路網(wǎng)區(qū)域的輪廓線。首先確定輪廓線起點(diǎn),接下來(lái)如果兩個(gè)聚類標(biāo)簽不相同就在兩個(gè)聚類標(biāo)簽中間畫一條直線,相同則不作處理,依次迭代下去,直到將所有聚類簇的輪廓線都畫出來(lái)為止。最終得到城市路網(wǎng)區(qū)域劃分結(jié)果,如圖1(f)所示。
本文實(shí)驗(yàn)部分的GPS數(shù)據(jù)來(lái)源于上海市交通信息中心,時(shí)間為2012年2月1日,一天24 h的GPS數(shù)據(jù)。
為了后續(xù)驗(yàn)證路網(wǎng)區(qū)域劃分方法的精度,將網(wǎng)格的交通指數(shù)映射為不同的顏色,顏色映射的規(guī)則為:將交通指數(shù)由0到100分別映射為深紅到深綠色,顏色會(huì)隨著交通指數(shù)數(shù)值由小到大呈現(xiàn)出不斷漸變的過程[15-16]。其中,某些缺少交通指數(shù)的網(wǎng)格則用白色表示,效果圖如圖3所示。
圖3 交通指數(shù)顏色映射圖Fig.3 Map generated by mapping the traffic indexes into the color space
將城市路網(wǎng)區(qū)域劃分結(jié)果圖1(f)疊加到圖3中得到圖4。在圖4中紅色線段所框出來(lái)的區(qū)域中,組成區(qū)域的網(wǎng)格主要由兩部分組成,主基色網(wǎng)格以及輔基色網(wǎng)格。所謂主基色網(wǎng)格是指一個(gè)區(qū)域內(nèi)顏色接近且網(wǎng)格數(shù)目占絕大多數(shù)的網(wǎng)格,輔基色網(wǎng)格則是指區(qū)域內(nèi)除了主基色網(wǎng)格之外的其他顏色網(wǎng)格。一般而言,輔基色網(wǎng)格的顏色與主基色網(wǎng)格顏色不同,且其網(wǎng)格數(shù)量占該區(qū)域的少數(shù)。區(qū)域面積則可由該區(qū)域內(nèi)的網(wǎng)格總數(shù)來(lái)表示,也即主基色網(wǎng)格數(shù)量和輔基色網(wǎng)格數(shù)量的總和。
圖4 路網(wǎng)區(qū)域及區(qū)域中的主基色網(wǎng)格和輔基色網(wǎng)格Fig. 4 Traffic road network areas and the major color grids and minor color grids in these areas
為了評(píng)價(jià)不同城市路網(wǎng)區(qū)域劃分方法的精度,創(chuàng)新性地提出了一個(gè)衡量某個(gè)區(qū)域劃分精度的指標(biāo)P,其計(jì)算公式為
式中:P表示當(dāng)前區(qū)域的劃分精度,P值越小表示劃分精度越好,P值越大表示劃分精度越不理想;H表示路網(wǎng)區(qū)域中的主基色網(wǎng)格數(shù)量;hi為第i種輔基色網(wǎng)格的數(shù)目,n為輔基色顏色的總數(shù),表示路網(wǎng)區(qū)域中輔基色網(wǎng)格總數(shù);S表示當(dāng)前區(qū)域的面積大小,即當(dāng)前區(qū)域內(nèi)網(wǎng)格的總數(shù)。
為了衡量整個(gè)路網(wǎng)劃分的精度,可以計(jì)算P的平均值Pave,即有
式中:N表示城市路網(wǎng)中的區(qū)域總數(shù);Pk表示第k個(gè)區(qū)域的劃分精度;Pave指標(biāo)用來(lái)衡量整個(gè)城市路網(wǎng)劃分的平均精度。
實(shí)驗(yàn)部分根據(jù)如下思路進(jìn)行組織:實(shí)驗(yàn)1分別對(duì)不同的路網(wǎng)區(qū)域劃分方法的精度進(jìn)行定性和定量分析,實(shí)驗(yàn)2對(duì)不同的路網(wǎng)區(qū)域劃分方法的穩(wěn)定性進(jìn)行驗(yàn)證。
將k-means++聚類算法與k-means聚類算法、AGNES聚類算法以及Birch聚類算法4種方法對(duì)比驗(yàn)證。k-means聚類算法流程如下:首先設(shè)置聚類的類別數(shù)k,然后從樣本數(shù)據(jù)中隨機(jī)選取k個(gè)樣本作為初始的聚類中心,通過計(jì)算聚類中心與樣本數(shù)據(jù)點(diǎn)之間的距離,把每個(gè)數(shù)據(jù)點(diǎn)分配到距離它最近的聚類中心;再將同一類別的所有樣本數(shù)據(jù)特征取平均值,并將平均后所得的數(shù)據(jù)點(diǎn)作為新的聚類中心;最后,重復(fù)上述步驟直到聚類中心滿足終止條件,輸出聚類標(biāo)簽。AGNES聚類算法采取自下而上的聚類思想。首先將樣本數(shù)據(jù)作為一個(gè)聚類簇,然后根據(jù)一定的相似性度量將這些聚類簇逐漸合并成一個(gè)大的聚類簇,直到達(dá)到初始設(shè)定的類別數(shù)為止。Birch聚類算法引入聚類特征和聚類特征樹兩個(gè)新的概念來(lái)概括對(duì)聚類的描述。其中,聚類特征樹概括了聚類中的有用信息,占用的空間比原來(lái)的數(shù)據(jù)集要小,這節(jié)約了內(nèi)存空間,提升了Birch算法在大型數(shù)據(jù)集上的聚類速度[17-20]。
a.方法精度驗(yàn)證。
分別選取以下4個(gè)時(shí)間段:04:00—04:20、17:40—18:00、08:00—08:20、00:40—01:00,通過定性分析和定量計(jì)算驗(yàn)證基于k-means++聚類算法的路網(wǎng)區(qū)域劃分方法的精度。
定性分析,以圖5(a)~(d)的結(jié)果,基于kmeans++聚類算法的路網(wǎng)區(qū)域劃分方法的精度,對(duì)其展開定性分析。通過觀察圖5(a)~(d)發(fā)現(xiàn)各個(gè)路網(wǎng)區(qū)域中網(wǎng)格的顏色一致性較強(qiáng),這表明路網(wǎng)區(qū)域劃分的精度較高。
圖5 k-means++聚類算法的精度驗(yàn)證Fig.5 Accuracy verification of k-means++ clustering algorithm
定量分析,通過對(duì)城市路網(wǎng)的各區(qū)域分別計(jì)算精度性能評(píng)價(jià)指標(biāo)P,然后計(jì)算P的均值Pave來(lái)評(píng)價(jià)路網(wǎng)區(qū)域劃分方法的精度,Pave值越小精度越高。選取的交通指數(shù)時(shí)間段為17:40—18:00。圖6(a)~(d)分別為基于k-means++,k-means,AGNES,Birch聚類算法的路網(wǎng)區(qū)域劃分方法的劃分結(jié)果,由圖6(a)~(d)分別計(jì)算各方法劃分結(jié)果的Pave值,并總結(jié)于表1中。由表1可知,基于k-means++聚類算法的路網(wǎng)區(qū)域劃分方法精度最高。
表1 不同方法的Pave值Tab.1 Pave values of different methods
圖6 不同聚類算法對(duì)比圖Fig. 6 Comparison of different clustering algorithms
b. 方法穩(wěn)定性驗(yàn)證。
如圖7(a)~(i)所示,對(duì)基于k-means++聚類算法的路網(wǎng)區(qū)域劃分方法在不同時(shí)間段上的穩(wěn)定性進(jìn)行驗(yàn)證,選取的9個(gè)時(shí)間段分別是:12:00—12:20、13:00—13:20、14:00—14:20、15:00—15:20、16:00—16:20、17:00—17:20、18:00—18:20、19:00—19:20和20:00—20:20。縱觀整個(gè)路網(wǎng)區(qū)域,劃分結(jié)果會(huì)隨著不同時(shí)間段的交通指數(shù)發(fā)生一定的變化。但是,總體上同一區(qū)域的劃分結(jié)果不會(huì)發(fā)生太大的空間區(qū)域變化。實(shí)驗(yàn)結(jié)果證實(shí)了基于k-means++聚類算法的路網(wǎng)區(qū)域劃分方法其穩(wěn)定性較為良好。
圖7 k-means++聚類算法穩(wěn)定性驗(yàn)證Fig.7 Stability verification of k-means++ clustering algorithm
分別在9個(gè)不同時(shí)間段的路網(wǎng)區(qū)域劃分結(jié)果圖中選取5個(gè)空間地理位置接近的區(qū)域,通過觀察這5個(gè)區(qū)域在不同時(shí)間段上形狀的變化,來(lái)定性分析算法的穩(wěn)定性。如圖7(a)~(i)所示,選取的區(qū)域?yàn)椋簠^(qū)域No.1、區(qū)域No.2、區(qū)域No.3、區(qū)域No.4和區(qū)域No.5,采用不同顏色的輪廓線對(duì)5個(gè)區(qū)域進(jìn)行標(biāo)注。通過對(duì)比9個(gè)時(shí)間段上的城市路網(wǎng)區(qū)域劃分的結(jié)果,發(fā)現(xiàn)在不同的時(shí)間段上,5個(gè)區(qū)域面積大小、劃分區(qū)域的路網(wǎng)拓?fù)浣Y(jié)構(gòu)沒有發(fā)生較大變化。這從局部細(xì)節(jié)上反映了基于kmeans++聚類算法的路網(wǎng)區(qū)域劃分方法的穩(wěn)定性較為良好。
提出了一種基于交通指數(shù)聚類的路網(wǎng)區(qū)域動(dòng)態(tài)劃分方法,該方法能夠?qū)Τ鞘新肪W(wǎng)區(qū)域?qū)崿F(xiàn)動(dòng)態(tài)劃分,并具有良好的劃分精度和穩(wěn)定性。本文創(chuàng)新性地提出了衡量不同城市路網(wǎng)區(qū)域劃分方法的精度衡量指標(biāo),使對(duì)路網(wǎng)區(qū)域劃分方法的精度進(jìn)行定量分析成為可能。通過將基于k-means++聚類算法的路網(wǎng)區(qū)域劃分方法與其他3種方法進(jìn)行實(shí)驗(yàn)對(duì)比,實(shí)驗(yàn)結(jié)果表明,基于k-means++聚類算法的路網(wǎng)區(qū)域劃分方法相比于其他3種方法具有更好的劃分精度和穩(wěn)定性。在今后的研究中,可以將性能更加優(yōu)越的聚類算法引入到城市路網(wǎng)區(qū)域劃分中,進(jìn)一步提高路網(wǎng)區(qū)域劃分的性能。
上海理工大學(xué)學(xué)報(bào)2021年4期