代維秀,陳占龍,謝 鵬
1. 中國(guó)地質(zhì)大學(xué)(武漢)地理與信息工程學(xué)院,湖北 武漢 430074; 2. 西安測(cè)繪研究所,陜西 西安 710054; 3. 地理信息工程國(guó)家重點(diǎn)實(shí)驗(yàn)室,陜西 西安 710054
大數(shù)據(jù)對(duì)地理信息的研究提供了新的視野,人們從基礎(chǔ)的地理信息研究轉(zhuǎn)移到利用計(jì)算機(jī)技術(shù)解決地理和城市問(wèn)題上。與傳統(tǒng)小數(shù)據(jù)相比,地理大數(shù)據(jù)具有粒度細(xì)、廣度寬、密度大、偏度重和精度差的特點(diǎn)[1-2]。合理利用地理大數(shù)據(jù)的優(yōu)點(diǎn),挖掘其隱藏價(jià)值,使其在實(shí)際應(yīng)用中發(fā)揮作用。出租車作為城市交通工具的重要組成部分,對(duì)居民出行尤為重要。出租車軌跡數(shù)據(jù)包含移動(dòng)過(guò)程中的位置、速度、時(shí)間等信息,能夠體現(xiàn)人們時(shí)間序列上的位置變化,反映人們的出行規(guī)律,并且數(shù)據(jù)量極大,符合地理大數(shù)據(jù)的特征。隨著技術(shù)的發(fā)展,挖掘軌跡數(shù)據(jù)信息,研究城市居民活動(dòng)極具價(jià)值。軌跡數(shù)據(jù)的研究從個(gè)體研究群體,從大量的個(gè)體數(shù)據(jù)之間,分析群體性特征。隨著城市的發(fā)展,一些與居民出行有關(guān)的城市問(wèn)題逐漸顯現(xiàn),如交通擁堵等,軌跡數(shù)據(jù)是研究這類問(wèn)題的基礎(chǔ)。
軌跡數(shù)據(jù)在城市中的應(yīng)用研究主要分為城市空間結(jié)構(gòu)功能單元識(shí)別、人類活動(dòng)模式的挖掘、行為預(yù)測(cè)、異常監(jiān)測(cè)、城市計(jì)算等內(nèi)容[3]。出租車軌跡數(shù)據(jù)反映城市居民行為特征,通過(guò)對(duì)其挖掘和分析能夠揭示居民的生活規(guī)律、行為特征。一些學(xué)者通過(guò)對(duì)軌跡數(shù)據(jù)進(jìn)行分析來(lái)識(shí)別城市結(jié)構(gòu)單元,為城市建設(shè)決策和交通疏導(dǎo)提供參考依據(jù)[4-10]。除了對(duì)人們出行活動(dòng)的研究外,利用出租車軌跡數(shù)據(jù)對(duì)居民活動(dòng)進(jìn)行預(yù)測(cè)和推薦也是研究的重點(diǎn)[11-14]。通過(guò)分析軌跡數(shù)據(jù)的規(guī)律分析及預(yù)測(cè),從而進(jìn)行異常檢測(cè),來(lái)識(shí)別異常移動(dòng)模式[15-16]。文獻(xiàn)[17]提出了位置鏈接和用戶鏈接模式挖掘算法,利用手機(jī)位置數(shù)據(jù)驗(yàn)證了算法的可行性。此外,語(yǔ)義信息的挖掘也是出租車軌跡數(shù)據(jù)的一項(xiàng)重要研究?jī)?nèi)容,彌補(bǔ)了軌跡數(shù)據(jù)豐富而活動(dòng)信息匱乏的不足[18-33]。眾多國(guó)內(nèi)外學(xué)者[34-39]都在軌跡數(shù)據(jù)信息挖掘方面進(jìn)行深入的研究,為進(jìn)一步利用地理大數(shù)據(jù)提供經(jīng)驗(yàn)。
根據(jù)包含出租車的位置、時(shí)間等信息的軌跡數(shù)據(jù)對(duì)居民活動(dòng)規(guī)律進(jìn)行挖掘,是研究軌跡數(shù)據(jù)的一項(xiàng)重要內(nèi)容??紤]時(shí)空約束,首先對(duì)軌跡數(shù)據(jù)進(jìn)行停留點(diǎn)提取,并對(duì)停留點(diǎn)進(jìn)行語(yǔ)義類別推斷,然后利用語(yǔ)義類別信息建立語(yǔ)義交互矩陣,對(duì)居民行為目的交互模式挖掘。以北京市出租車軌跡數(shù)據(jù)為樣本進(jìn)行方法的驗(yàn)證,分析不同日?;顒?dòng)的時(shí)空特征,挖掘行為目的交互模式。本文有助于揭示城市結(jié)構(gòu)和資源配置,為城市規(guī)劃提供科學(xué)依據(jù)。
出租車軌跡數(shù)據(jù)包含上下客位置、時(shí)間等信息,但上下客位置信息并不代表確定的活動(dòng)語(yǔ)義信息。本研究首先通過(guò)軌跡數(shù)據(jù)提取停留點(diǎn),以停留點(diǎn)和興趣點(diǎn)為基礎(chǔ)數(shù)據(jù),然后采用高斯核密度推斷停留點(diǎn)的語(yǔ)義類別,采用DBSCAN聚類方法識(shí)別居民活躍度高的區(qū)域,最后通過(guò)停留點(diǎn)語(yǔ)義類別交互信息構(gòu)建語(yǔ)義交互矩陣,并對(duì)不同時(shí)間段語(yǔ)義交互矩陣進(jìn)行相似性度量,挖掘行為目的交互模式。整體研究流程如圖1所示。
圖1 研究流程Fig.1 Research scheme
根據(jù)出租車的載客狀態(tài)變化可以確定出租車的上、下客情況。當(dāng)出租車載客狀態(tài)由0變?yōu)?時(shí),則可確定該處為上客點(diǎn)。定義上客點(diǎn)位置集為SP,表示為P={spk∈SP|spk=1 and spk-1=0}。當(dāng)出租車載客狀態(tài)由1變?yōu)?時(shí),則可確定該處為下客點(diǎn)。定義下客點(diǎn)位置集為SD,表示為D={sdk∈SD|sdk=0 and sdk-1=1}。其中k為連續(xù)的k個(gè)出租車位置,spk表示第k個(gè)上客位置對(duì)應(yīng)的出租車狀態(tài),sdk表示第k個(gè)下客位置對(duì)應(yīng)的出租車狀態(tài)。為了方便后續(xù)研究,本文將上客點(diǎn)和下客點(diǎn)統(tǒng)稱為停留點(diǎn)。
根據(jù)居民日常出行目的對(duì)POI進(jìn)行重分類,以便更準(zhǔn)確的刻畫(huà)居民活動(dòng),本文中POI重分類結(jié)果為:住宿、工作、休閑、教育、餐飲、其他(一定范圍內(nèi)無(wú)以上類型POI定義為基于其他目的出行),對(duì)分類后的POI點(diǎn)賦予合理的開(kāi)放時(shí)間[40]??紤]到權(quán)重分配的全面性和平滑性,構(gòu)建高斯核密度估計(jì)方程計(jì)算各類POI成為停留目的的概率公式,停留點(diǎn)目的概率為聚集在停留點(diǎn)一定范圍內(nèi)的不同類別的POI成為該停留點(diǎn)目的的概率,如式(1)所示
(1)
式中,yj為第j類POI點(diǎn)成為停留點(diǎn)目的概率密度;j為1,2,3,…,6,表示POI類別;xi是該點(diǎn)距離停留點(diǎn)的直線距離;i為1,2,3,…,n,表示搜索半徑內(nèi)第j類POI點(diǎn)的數(shù)量;δ是標(biāo)準(zhǔn)差,本文中定義為250 m;μ是均值,本文忽略道路優(yōu)勢(shì),故取值為0;ρj表示第j類POI數(shù)量之和的倒數(shù)。為了消除由于POI數(shù)量差異引起的結(jié)果誤差,故采用倒數(shù)對(duì)其數(shù)量進(jìn)行平衡。綜合居民行為特點(diǎn),大都會(huì)選擇在臨近目的地的位置上下車,本文中將搜索半徑選為100 m,研究對(duì)象為搜索范圍內(nèi)所有的POI點(diǎn),通過(guò)采用式(1)確定每類POI對(duì)應(yīng)的停留點(diǎn)目的概率密度,選取其最大值所對(duì)應(yīng)的POI類別作為該停留點(diǎn)的語(yǔ)義類別。停留點(diǎn)語(yǔ)義類別為該停留點(diǎn)研究范圍內(nèi),概率密度最大值所對(duì)應(yīng)的POI類別,具體為:①計(jì)算停留點(diǎn)目的概率yj; ②判斷max(yi)所對(duì)應(yīng)的POI類別; ③將②所得出的POI類別作為此停留點(diǎn)的語(yǔ)義類別。停留點(diǎn)語(yǔ)義類別如式(2)
Pt=max(yi)
(2)
式中,Pt為停留點(diǎn)語(yǔ)義類別;yi為停留點(diǎn)目的概率。停留點(diǎn)語(yǔ)義類別推斷過(guò)程如圖2所示。
圖2 居民出行停留點(diǎn)類別推斷Fig.2 The inference of residents’ travel purpose
本研究通過(guò)對(duì)語(yǔ)義類別相同停留點(diǎn)進(jìn)行聚類,分析不同語(yǔ)義類別的停留點(diǎn)在不同時(shí)間段內(nèi)空間分布情況,對(duì)其進(jìn)行可視化及聚類研究。DBSCAN算法因其結(jié)構(gòu)簡(jiǎn)單,多用于處理高密度數(shù)據(jù),因此本文采用DBSCAN聚類算法對(duì)不同語(yǔ)義類別的停留點(diǎn)進(jìn)行聚類分析,根據(jù)相關(guān)研究可知DBSCAN對(duì)Eps(簇半徑參數(shù))和minPts(鄰域密度閾值)參數(shù)非常敏感。本文通過(guò)多次試驗(yàn)分析,設(shè)置minPts值為當(dāng)前數(shù)據(jù)集總點(diǎn)數(shù)的1/25[41]。Eps通過(guò)k-距離曲線取值為500 m。
停留點(diǎn)活躍度指相同時(shí)間段內(nèi)每類語(yǔ)義類別的停留點(diǎn)的數(shù)量之和,即每類停留點(diǎn)的活躍程度,如式(3)所示,反映了不同時(shí)間段內(nèi)居民出行行為的特征。
(3)
式中,j為停留點(diǎn)的語(yǔ)義類別,j為1,2,3,…,6;pij為研究時(shí)段內(nèi)第i個(gè)j類的停留點(diǎn),i為1,2,3,…,n。
停留點(diǎn)活躍度可以直觀反映居民出行目的隨時(shí)間的分布狀態(tài),但是不能反映上下客點(diǎn)之間的語(yǔ)義交互情況,因此在停留點(diǎn)活躍度研究的基礎(chǔ)上進(jìn)一步進(jìn)行停留點(diǎn)交互情況的研究。在不同的時(shí)間段,居民出行目的不同,即停留點(diǎn)的語(yǔ)義類別不同。本文將停留點(diǎn)語(yǔ)義類別作為居民的行為目的屬性,以此構(gòu)建不同時(shí)段內(nèi)的語(yǔ)義交互矩陣,度量行為目的屬性之間的交互。即對(duì)一天24個(gè)時(shí)間段的語(yǔ)義交互矩陣進(jìn)行度量,總結(jié)居民出行的交互規(guī)律。交互一般指發(fā)生在可以互相影響的兩方或多方之間的行為,相同時(shí)間段內(nèi),不同行為目的屬性的上、下客點(diǎn)發(fā)生互動(dòng),此過(guò)程即形成了城市居民的行為目的交互模式,例如語(yǔ)義類別為住宿的上客點(diǎn)與語(yǔ)義類別為工作的下客點(diǎn)之間的互動(dòng)為住宿-工作交互模式。頻繁交互是指在行為目的交互模式中頻繁出現(xiàn)的互動(dòng),通過(guò)頻繁交互挖掘可以對(duì)居民行為進(jìn)行總結(jié)分析。
語(yǔ)義交互矩陣構(gòu)建是研究行為目的交互模式的重要部分。為了構(gòu)建不同時(shí)間段內(nèi)的語(yǔ)義交互矩陣,首先對(duì)不同時(shí)間段內(nèi)的上下客點(diǎn)的行為目的屬性的交互情況進(jìn)行統(tǒng)計(jì),即每類上車點(diǎn)語(yǔ)義類別流向各類不同下車點(diǎn)語(yǔ)義類別的交互次數(shù)構(gòu)成矩陣的元素,然后對(duì)同時(shí)間段的上下車點(diǎn)的語(yǔ)義類別進(jìn)行交互索引,構(gòu)建語(yǔ)義交互矩陣。具體矩陣如下
(4)
式中,Dt表示t時(shí)對(duì)應(yīng)的語(yǔ)義交互矩陣,Dtij表示在t時(shí)刻上車點(diǎn)的語(yǔ)義類別為i(i為1,2,3,…,6)的流向下車點(diǎn)語(yǔ)義類別為j(j為1,2,3,…,6)的關(guān)聯(lián)值。矩陣的行表示上車點(diǎn)語(yǔ)義類別為i與下車點(diǎn)各類語(yǔ)義類別之間的交互,矩陣的列表示下車點(diǎn)語(yǔ)義類別為j與上車點(diǎn)各類別間的交互。
由于不同時(shí)間內(nèi)出行量差異巨大,不同時(shí)間段對(duì)應(yīng)的矩陣元素差異較大,因此需要進(jìn)行矩陣的歸一化處理,這樣可以平衡矩陣元素之間的巨大差異,也可以均衡不同特征值差異太大導(dǎo)致的影響差異大。本文對(duì)交互矩陣進(jìn)行了歸一化處理,選取的歸一化方法為min-max scaling方法。該方法將原始矩陣的行采用線性化的方法將數(shù)轉(zhuǎn)換到[0,1]之間。具體實(shí)現(xiàn)公式如下
(5)
對(duì)歸一化的語(yǔ)義交互矩陣進(jìn)行相似性度量,可以對(duì)24個(gè)時(shí)間段內(nèi)的語(yǔ)義交互矩陣進(jìn)行相似性區(qū)分,進(jìn)而挖掘不同時(shí)間段居民出行規(guī)律。該研究中語(yǔ)義交互矩陣維度相同,傳統(tǒng)的矩陣度量方法如矩陣減法、R平方法等均可以作為該類型矩陣的度量方法。本文采用矩陣減法度量歸一化后的矩陣,對(duì)兩個(gè)時(shí)段歸一化后的矩陣作差,分別計(jì)算3個(gè)矩陣范數(shù),通過(guò)式(6)進(jìn)行相似度計(jì)算
sim=1-dis(m1,m2)
(6)
式中,sim為度量后兩個(gè)矩陣的相似性,取值范圍sim∈[0,1];dis(m1,m2)為差向量范數(shù)與m1、m2歐氏距離度的比值。sim越接近于0則表示兩個(gè)矩陣相似性越低,sim越接近于1則表示兩個(gè)矩陣相似度越高。
北京市是我國(guó)的政治、經(jīng)濟(jì)、文化、科教以及創(chuàng)新中心,圖3所示區(qū)域是北京核心功能區(qū),其城市功能齊全,人口密度大,城市結(jié)構(gòu)復(fù)雜,且出租車是北京市居民重要的出行方式,因此選擇該區(qū)域作為研究區(qū)。
圖3 研究區(qū)域Fig.3 Research area
本文中采用的是北京市2012年11月共30 d的出租車GPS記錄數(shù)據(jù),以*.txt格式存儲(chǔ),出租車軌跡數(shù)據(jù)說(shuō)明見(jiàn)表1,根據(jù)研究需求對(duì)軌跡數(shù)據(jù)進(jìn)行處理。研究中采用的POI數(shù)據(jù)通過(guò)百度地圖服務(wù)(http:∥map.baidu.com)獲??;北京市路網(wǎng)數(shù)據(jù)從open street map(OSM)獲取,研究數(shù)據(jù)說(shuō)明見(jiàn)表2。
表1 軌跡數(shù)據(jù)說(shuō)明
通過(guò)推斷停留點(diǎn)的語(yǔ)義類別,對(duì)不同語(yǔ)義類別的停留點(diǎn)進(jìn)行聚類分析,以獲得不同類別的熱點(diǎn)區(qū)域分布情況。不同語(yǔ)義類別的停留點(diǎn)分布可以直觀表現(xiàn)區(qū)域規(guī)劃情況以及各類別停留點(diǎn)間的關(guān)系,分析結(jié)果如圖4—圖13所示。
圖4 工作日上午9時(shí)住宿類別停留點(diǎn)分布Fig.4 The distribution of accommodation data stay point at 9 am on workdays
圖5 工作日上午9時(shí)工作類別停留點(diǎn)分布Fig.5 The distribution of work data stay point at 9 am on workdays
圖6 工作日9時(shí)教育類別停留點(diǎn)分布Fig.6 The distribution of educational data stay point at 9 am on workdays
圖7 非工作日11時(shí)休閑類別停留點(diǎn)分布Fig.7 The distribution of leisure data stay point at 11 am on non-workdays
圖8 工作日13時(shí)餐飲類別停留點(diǎn)分布Fig.8 The distribution of catering data point at 1 pm on workdays
圖9 工作日和非工作日住宿熱點(diǎn)載客路徑Fig.9 The hot routes for accommodation on workdays and non-workdays
圖10 工作日和非工作日工作熱點(diǎn)載客路徑Fig.10 The hot routes for work on workdays and non-workdays
圖11 工作日和非工作日教育熱點(diǎn)載客路徑Fig.11 The hot routes for education on workdays and non-workdays
圖12 工作日和非工作日休閑熱點(diǎn)載客路徑Fig.12 The hot routes for leisure on workdays and non-workdays
圖13 工作日和非工作日餐飲熱點(diǎn)載客路徑Fig.13 The hot routes for catering on workdays and non-workdays
圖4—圖8為各類語(yǔ)義類別的停留點(diǎn)時(shí)空分布情況,圖中不同顏色的停留點(diǎn)為聚類結(jié)果可視化,以Ci(i為正整數(shù))表示。工作日8—9時(shí)段為上班高峰期,工作類別的停留點(diǎn)分布能直接反映研究區(qū)的商業(yè)分布情況;住宿類別的停留點(diǎn)分布與商業(yè)分布有一定的關(guān)聯(lián),這一現(xiàn)象在中心區(qū)域反映較為明顯;教育類別的停留點(diǎn)與商業(yè)分布一定程度上相關(guān),特別是教育發(fā)達(dá)的海淀區(qū);休閑類別的停留點(diǎn)除了在商業(yè)圈分布,在景點(diǎn)處也形成明顯聚集;餐飲類別的停留點(diǎn)分布與商業(yè)分布的相關(guān)程度不能僅通過(guò)停留點(diǎn)反映,這與居民多擇近就餐有關(guān)。
通過(guò)分析不同語(yǔ)義類別的停留點(diǎn)聚集情況可知:北京市的商業(yè)分布和高校之間互相依托,共同發(fā)展,奠定了經(jīng)濟(jì)發(fā)展與教育事業(yè)共存的基礎(chǔ);居民區(qū)圍繞著商業(yè)圈分布,這符合職住一體的規(guī)劃,從一定程度上節(jié)省了通勤時(shí)間;餐飲與商業(yè)的分布有限相關(guān);五環(huán)內(nèi)的休閑不僅與景點(diǎn)有關(guān)也與商業(yè)分布相關(guān),這與商業(yè)圈規(guī)劃的多功能性有關(guān)。
將沿道路分布的各類語(yǔ)義停留點(diǎn)進(jìn)行可視化表達(dá)(圖9—13),對(duì)停留點(diǎn)聚集程度高的路段進(jìn)行提取分析可知:①工作日和非工作日各類停留點(diǎn)的載客熱點(diǎn)路徑分布存在明顯差異,特別是工作、住宿和休閑類別,工作日時(shí)工作和住宿類別的停留點(diǎn)高于非工作日,工作和住宿類別停留點(diǎn)在工作日分布相對(duì)發(fā)散,非工作日分布更趨向中心集中,休閑類別停留點(diǎn)的活躍度在非工作日時(shí)明顯比工作日高且非工作日時(shí)更為發(fā)散;②教育和餐飲類別的停留點(diǎn)的熱點(diǎn)載客路徑在工作日和非工作日的發(fā)散程度區(qū)別不太,但教育類別的停留點(diǎn)在工作日時(shí)更趨于中心分布。
研究不同類別的停留點(diǎn)的分布情況,可以直觀認(rèn)識(shí)城市布局,即北京市的商業(yè)和高新科技集中于中心城區(qū),也可以得出人流量大的熱點(diǎn)區(qū)域。北京市城市規(guī)劃政策即通過(guò)疏解非首都功能,實(shí)現(xiàn)人隨功能走、人隨產(chǎn)業(yè)走,不斷調(diào)整人口布局,緩解城市壓力。中心城區(qū)人口密度大,以業(yè)控人,通過(guò)產(chǎn)業(yè)疏解進(jìn)而達(dá)到人口疏散,緩解中心城區(qū)的壓力。此外也將增加公共服務(wù)設(shè)施、交通市政基礎(chǔ)設(shè)施、公共綠地等用地規(guī)劃,以人為本,提高居民生活品質(zhì),從源頭入手,解決“大城市病”。
通過(guò)分析不同時(shí)段、不同語(yǔ)義類別的停留點(diǎn)活躍度,直觀了解居民出行目的的差異,為交互模式挖掘提供一定的依據(jù)。與其他交通系統(tǒng)類似,基于出租車服務(wù)的居民出行行為表現(xiàn)出時(shí)間和空間的日常周期性,反映了潛在的人類活動(dòng)模式[42]。不同行為目的屬性的上下客點(diǎn)發(fā)生互動(dòng)形成了城市居民的交互模式,交互模式反映了不同類型停留點(diǎn)之間的互動(dòng)情況。O-D矩陣可以表達(dá)居民的行為,通過(guò)挖掘O-D矩陣在不同時(shí)段描述的居民行為變化或差異,以便有效管理出租車服務(wù)運(yùn)營(yíng)以及資源分配。本文通過(guò)構(gòu)建停留點(diǎn)語(yǔ)義交互矩陣,基于該語(yǔ)義交互矩陣進(jìn)行交互模式分析,并根據(jù)不同語(yǔ)義類別的停留點(diǎn)之間的互動(dòng)情況進(jìn)一步挖掘居民行為目的的頻繁交互。
通過(guò)式(3)對(duì)不同類別的停留點(diǎn)活躍度進(jìn)行統(tǒng)計(jì),并對(duì)其進(jìn)行標(biāo)準(zhǔn)化處理,分析每類停留點(diǎn)活躍度相對(duì)變化情況(圖14、圖15)。
圖14 工作日各類停留點(diǎn)上下車的活躍度變化Fig.14 Activity change of track stay points of up and down vehicles on workdays
圖15 非工作日各類停留點(diǎn)的上下車活躍度變化Fig.15 Activity change of stay points of up and down vehicle on non-workdays
通過(guò)工作日和非工作日各類停留點(diǎn)的活躍度對(duì)比分析可知:
(1) 工作日和非工作日在0—6時(shí)段各類停留點(diǎn)的活躍度較低并在該時(shí)段內(nèi)出現(xiàn)最小值,下客點(diǎn)的活躍度最小值遲于上客點(diǎn)的出現(xiàn);6—8時(shí)段停留點(diǎn)的活躍度呈陡增趨勢(shì),9—22時(shí)段活躍度出現(xiàn)波動(dòng),在22時(shí)后整體呈現(xiàn)下降趨勢(shì)。
(2) 非工作日的各類停留點(diǎn)的活躍度峰值比工作日出現(xiàn)晚,非工作日停留點(diǎn)在10—16時(shí)段活躍度較高,工作日停留點(diǎn)的活躍度從10時(shí)持續(xù)到22時(shí)。非工作日18—24時(shí)段停留點(diǎn)的活躍度驟減。
(3) 工作日各類停留點(diǎn)的活躍度對(duì)比明顯,對(duì)于上客點(diǎn),住宿類別的停留點(diǎn)的活躍度在8時(shí)陡增;休閑類別的停留點(diǎn)的活躍度在19—22時(shí)段活躍程度較高。對(duì)于下客點(diǎn),工作類別的停留點(diǎn)的活躍度在9—10時(shí)段達(dá)到峰值,19時(shí)起其活躍度驟降;住宿和休閑類別停留點(diǎn)呈現(xiàn)小幅增長(zhǎng)。各類型的停留點(diǎn)的活躍度均在12—13時(shí)段出現(xiàn)谷值。
(4) 非工作日停留點(diǎn)的活躍度在10—14出現(xiàn)峰值。對(duì)于上客點(diǎn),住宿類別停留點(diǎn)的活躍度峰值在10—11時(shí)段出現(xiàn);住宿、休閑和其他類別停留點(diǎn)在13—14時(shí)段出現(xiàn)下降,而教育類別停留點(diǎn)在14時(shí)上升達(dá)到峰值;休閑類別停留點(diǎn)的活躍度在18時(shí)后高于其他類型。對(duì)于下客點(diǎn),住宿類別的停留點(diǎn)在18時(shí)前低于其他類型停留點(diǎn)的活躍度,18時(shí)后有所增長(zhǎng);工作類別停留點(diǎn)的活躍度在11—12時(shí)達(dá)到峰值。除住宿外其他類別停留點(diǎn)在16時(shí)后活躍度逐漸下降。
分析不同類別停留點(diǎn)的活躍度可以直觀展現(xiàn)居民出行情況,但僅研究停留點(diǎn)活躍度無(wú)法提示出居民出行的交互情況,因此,后續(xù)需要進(jìn)行交互模式研究。對(duì)語(yǔ)義類別分類后的停留點(diǎn),構(gòu)建停留點(diǎn)語(yǔ)義類別信息的語(yǔ)義交互矩陣(式(4)),通過(guò)對(duì)語(yǔ)義交互矩陣歸一化后的相似性度量(式(6)),可以得出工作日和非工作日不同時(shí)段的居民行為目的交互模式。將一天24 h的語(yǔ)義交互矩陣分別進(jìn)行相似性度量,根據(jù)相似性度量的結(jié)果構(gòu)建相似度熱力圖(圖16、圖17)。
圖16 工作日與非工作日居民出行交互熱度Fig.16 Interaction heat of residents’ travel on workdays and non-workdays
圖17 工作日和非工作日交互模式Fig.17 Interactive mode of residents’ travel on workdays and non-workdays
由圖16、圖17可知:工作日凌晨0—6時(shí)段內(nèi),多為其他語(yǔ)義類別與住宿之間的交互;8—10時(shí)和14時(shí)內(nèi),主要為工作與工作之間的交互、住宿與工作的交互、其他各語(yǔ)義類別與工作交互;上午10—12時(shí)和下午15—17時(shí)內(nèi),表現(xiàn)為工作與其他類別的交互;18—24時(shí)內(nèi)交互類與下班后居民的生活習(xí)性有關(guān),主要為工作類型與住宿、休閑以及餐飲間的交互。非工作日凌晨0—5時(shí)相似性較高,主要是與住宿相關(guān)的交互;8—17時(shí)交互相似性較高,多為居民的休閑娛樂(lè)出行相關(guān),非工作日居民出行時(shí)間寬泛,可以自由選擇出行時(shí)間;19—24時(shí)交互相似性高,多為居民活動(dòng)結(jié)束后返回居住地有關(guān)??傮w而言,工作日住宿、工作、教育為主要的交互內(nèi)容,其中工作和住宿之間的交互最為主要;非工作日則以休閑、住宿、教育交互為主,住宿與休閑的交互明顯。
工作日和非工作日之間交互整體上都分為3段,0—7時(shí)、7—18時(shí)和18—24時(shí)。但是在行為目的交互模式方面有所不同,工作日主要為職住交互、工作交互、住宿交互。非工作日的交互主要為居住-休閑交互、休閑交互、住宿交互。工作日和非工作日同一時(shí)間段內(nèi)對(duì)應(yīng)著不同的行為目的交互模式,這與工作時(shí)間對(duì)于居民的影響有關(guān)。挖掘行為目的交互模式可以反映居民出行中不同語(yǔ)義類別的停留點(diǎn)間的交互情況,可以根據(jù)不同時(shí)段的交互特征,為城市的管理、交通規(guī)劃提供一定的參考依據(jù),在城市規(guī)劃時(shí)應(yīng)更加注重職住資源匹配、通勤成本以及資源協(xié)調(diào)分配,也為居民在不同的高峰時(shí)間段出行提供合理的規(guī)劃建議,既節(jié)省了交通成本,又避免了時(shí)間的浪費(fèi)。
本文提出了基于語(yǔ)義交互矩陣進(jìn)行居民行為活動(dòng)挖掘的方法,該方法考慮了時(shí)空約束。首先對(duì)軌跡數(shù)據(jù)進(jìn)行停留點(diǎn)提取,并對(duì)停留點(diǎn)進(jìn)行語(yǔ)義類別推斷,然后利用語(yǔ)義類別信息建立語(yǔ)義交互矩陣,挖掘居民行為目的的交互模式。采用北京市中心區(qū)域出租車軌跡數(shù)據(jù)對(duì)本文方法進(jìn)行了驗(yàn)證,研究了北京市中心區(qū)域居民的不同日常活動(dòng)的時(shí)空特征,挖掘行為目的的交互模式。本文方法可以為城市規(guī)劃管理、資源調(diào)度和應(yīng)急管理提供一定的決策支持。隨著出行方式的多樣化,人們有更多的出行方式選擇,下一步將考慮集成新的數(shù)據(jù)源進(jìn)行研究,對(duì)研究方法進(jìn)一步改進(jìn),使之能夠更充分反映居民的行為。