蔣浩
長(zhǎng)江大學(xué)地球科學(xué)學(xué)院 湖北 武漢 430000
在城市長(zhǎng)時(shí)間發(fā)展過(guò)程中,由人為設(shè)計(jì)或自然原因形成了不同的功能區(qū),承擔(dān)不同的城市職能,如商業(yè)區(qū)、住宅區(qū)和娛樂(lè)休閑區(qū)[1-2]。不同功能區(qū)往往有著不同的活動(dòng)模式。了解城市功能區(qū)的分布,有利于對(duì)城市布局做出合理的評(píng)價(jià)與調(diào)整,緩解交通壓力[3-5]。
隨著全球定位技術(shù)(GPS)與通信技術(shù)(ICT)的發(fā)展與應(yīng)用,各種記錄人類生活軌跡數(shù)據(jù)出現(xiàn)在大眾視野,如手機(jī)信令數(shù)據(jù)、浮動(dòng)車數(shù)據(jù)、簽到數(shù)據(jù)等等[6]。多源、海量、現(xiàn)勢(shì)性高、高時(shí)空分辨的軌跡大數(shù)據(jù)蘊(yùn)含著豐富的人類行為模式、城市結(jié)構(gòu)、交通運(yùn)行狀態(tài)等信息。出租車作為城市交通運(yùn)輸系統(tǒng)的重要組成部分,為乘客提供靈活便捷的服務(wù)。利用出租車上、下車熱點(diǎn)在時(shí)間上具有不同的時(shí)間分布特征對(duì)城市功能區(qū)進(jìn)行分類是一種高效的方法。
為了提高功能區(qū)的劃分精度,本文從熱點(diǎn)區(qū)域的劃分方式進(jìn)行改進(jìn)。出租車行駛在城市路網(wǎng)中,乘客上下車點(diǎn)與路網(wǎng)有不可忽略的關(guān)聯(lián)關(guān)系。一方面,地出租車軌跡點(diǎn)的定位精度在20至60米之間,絕大部分軌跡點(diǎn)分布在道路兩側(cè),有必要使用地圖匹配定位技術(shù)將軌跡點(diǎn)匹配到所在有向路段。另一方面,乘客上、下車點(diǎn)在某一有向道路上的分布并不是均勻的。因此,有必要針對(duì)每個(gè)有向路段進(jìn)行熱點(diǎn)分析。針對(duì)這個(gè)問(wèn)題,借鑒物理學(xué)中的“數(shù)據(jù)場(chǎng)”概念,本文提出了一種基于“數(shù)據(jù)場(chǎng)”變化趨勢(shì)的分段方法來(lái)找出有向路段隨時(shí)間變化最穩(wěn)定的熱點(diǎn)路段。在地圖匹配的基礎(chǔ)上,我們計(jì)算每個(gè)有向路段的“數(shù)據(jù)場(chǎng)”在時(shí)間與空間上最穩(wěn)定的分布并提取出來(lái)作為穩(wěn)定該有向路段的熱點(diǎn)路段。以劃分研究區(qū)可以描繪出城市功能區(qū)細(xì)節(jié)分布特征。
本研究以四川省會(huì)成都為例,成都是國(guó)家重要的高新技術(shù)產(chǎn)業(yè)基地和西部地區(qū)重要的中心城市。根據(jù)成都市人民政府官方網(wǎng)站(截至2018年,成都市域面積14335平方公里,常住人口1633萬(wàn)人, GDP15342.77億元。選取成都市四環(huán)環(huán)內(nèi)的區(qū)域作為研究區(qū)域。
出租車軌跡數(shù)據(jù)來(lái)源于交通網(wǎng)絡(luò)公司滴滴出行的GAIA開(kāi)放數(shù)據(jù)倡議(https://gaia.didichuxing.com)。所選數(shù)據(jù)集記錄了2018年8月7日在中國(guó)成都的14800多輛出租車。出租車的軌跡由一組GPS點(diǎn)組成,GPS點(diǎn)的信息記錄如表1所示。由于定位誤差,原始數(shù)據(jù)不能直接用于分析。首先,過(guò)濾速度過(guò)大的軌跡點(diǎn)(超過(guò)120公里/小時(shí))。其次,如果兩個(gè)連續(xù)點(diǎn)之間的距離超出了(它們可以以最快的速度到達(dá)對(duì)方的位置)合理范圍,它們都被過(guò)濾掉了。最后,我們根據(jù)乘客乘車狀態(tài)提取每條出租車軌跡的取下車點(diǎn),得到約300萬(wàn)次取車/下車。
出租車在一天內(nèi)工作時(shí)段內(nèi)總是在1,2級(jí)道路網(wǎng)中不斷巡游尋找客源。在進(jìn)行出租車上、下客點(diǎn)提取之前,有必要利用地圖匹配技術(shù)將軌跡點(diǎn)匹配到出租車實(shí)際行駛的路段上。一方面,城市路網(wǎng)稠密,當(dāng)出租車行駛在并行公路、道路交叉口、隧道等復(fù)雜路段時(shí),根據(jù)現(xiàn)有GPS定位精度不能直接判斷出租車軌跡點(diǎn)所在道路。另一方面,城市高樓林立,GPS信號(hào)總會(huì)產(chǎn)生路徑延遲,GPS定位位置與實(shí)際位置總有較大的偏差。因此應(yīng)用地圖匹配技術(shù)對(duì)軌跡點(diǎn)與路網(wǎng)進(jìn)行匹配,不僅能提高軌跡點(diǎn)的定位精度,而且能將軌跡點(diǎn)與所屬路段關(guān)聯(lián)起來(lái)以便于進(jìn)一步分析。
地圖匹配算法可分為綜合匹配算法與高級(jí)匹配算法。高級(jí)匹配算法包括卡爾曼濾波[3]、隱馬爾可夫模型等方法,高級(jí)地圖匹配算法要求軌跡點(diǎn)的采樣頻率高,計(jì)算資源消耗大。本研究使用綜合匹配算法進(jìn)行出租車軌跡點(diǎn)與路網(wǎng)的匹配。綜合匹配算法利用軌跡點(diǎn)與路段的距離、車頭朝向與路段朝向的夾角角度,道路拓?fù)浣Y(jié)構(gòu)、道路轉(zhuǎn)彎限制等因素進(jìn)行加權(quán)計(jì)算來(lái)選擇最佳路段,這種方法計(jì)算效率較高,穩(wěn)定性強(qiáng)。值得注意的是現(xiàn)有研究總大多數(shù)是以靜態(tài)權(quán)重計(jì)算。實(shí)際上,車輛朝向的權(quán)重應(yīng)該隨著車輛速度的增加而增大。算法應(yīng)該考慮在匹配錯(cuò)誤時(shí)回溯問(wèn)題。本文采用的地圖匹配算法彌補(bǔ)了以上不足。
我們使用高斯分布來(lái)模擬軌跡點(diǎn)實(shí)際位置的在觀測(cè)點(diǎn)不同距離位置上出現(xiàn)的概率[6]。如公式(1)。
本文研究時(shí)段為6:00am~24:00pm,我們以一小時(shí)為間隔將研究時(shí)段劃分為18時(shí)區(qū)。分別表示第一個(gè)小時(shí)上車個(gè)數(shù)與下車個(gè)數(shù),以此類推[3]。實(shí)際上,當(dāng)熱點(diǎn)路段上的出租車上、下車點(diǎn)數(shù)量較少,熱點(diǎn)路段每個(gè)時(shí)段內(nèi)的上下車數(shù)據(jù)就會(huì)具有很強(qiáng)的隨機(jī)性,不足以體現(xiàn)熱點(diǎn)路段時(shí)間分布特征。我們認(rèn)為在城市功能區(qū)在研究時(shí)段的內(nèi)不會(huì)改變的假設(shè)下,某一熱點(diǎn)路段乘客總是偏向于某一固定時(shí)段,因此可以使用不同日期的數(shù)據(jù)疊加來(lái)突出熱點(diǎn)時(shí)間特征,削弱乘客上、下車隨機(jī)因素的影響。我們將成都市2014年8月份(除去周六、周日)不同日期的上下車個(gè)數(shù)進(jìn)行累加得到熱點(diǎn)路段的時(shí)間分布特征。當(dāng)熱點(diǎn)路段的上下車個(gè)數(shù)較少時(shí),數(shù)據(jù)的隨機(jī)發(fā)生概率大,因此刪除時(shí)間段密度小于5的上下車熱點(diǎn)路段。
在本文研究中,我們使用K-means方法對(duì)研究區(qū)內(nèi)的熱點(diǎn)進(jìn)行聚類。熱點(diǎn)路段類別與的距離函數(shù)定義如公式(2)。根據(jù)聚類結(jié)果的輪廓系數(shù)(Silhouette Coefficient)判斷最終的分類結(jié)果。
根據(jù)分類結(jié)果我們發(fā)現(xiàn),當(dāng)分類結(jié)果類別個(gè)數(shù)為3時(shí),分類結(jié)果的輪廓系數(shù)變化最為穩(wěn)定。三種類別的樣本數(shù)量占總分實(shí)驗(yàn)樣本數(shù)量的50.29%、31.77%、19.6%。不同類別的空間分布特征如圖1。為了建立分類結(jié)果與現(xiàn)實(shí)世界中不同功能區(qū)之間對(duì)關(guān)系。本文實(shí)驗(yàn)采集了14種典型的POI興趣點(diǎn)表示不同的典型社會(huì)功能。POI類別見(jiàn)表1[7]。我們采用距離最近原則將POI點(diǎn)與熱點(diǎn)路段進(jìn)行關(guān)聯(lián),然后統(tǒng)計(jì)不同類別熱點(diǎn)路段所關(guān)聯(lián)不同類別POI點(diǎn)的數(shù)量見(jiàn)表1。
圖1 商業(yè),娛樂(lè),住宅區(qū)的空間分布圖
表1 熱點(diǎn)路段的類別對(duì)不同類型的POI占有比例
分析實(shí)驗(yàn)結(jié)果,我們發(fā)現(xiàn)POI興趣點(diǎn)與實(shí)驗(yàn)分類結(jié)果并沒(méi)有典型的一對(duì)一關(guān)系,而是以組合的方式與分類結(jié)果對(duì)應(yīng)。換言之,城市功能區(qū)并不是擁有單一的城市功能、規(guī)則區(qū)域形狀的簡(jiǎn)單個(gè)體。城市功能區(qū)中總是包含多種擁有典型社會(huì)功能的單位組合在一起而形成的。這些單位包括醫(yī)院、體育館、學(xué)校、公司、商場(chǎng)、居民區(qū)……等等。不同的比例使功能區(qū)表現(xiàn)出偏向某一方面的職能,在活動(dòng)模式表現(xiàn)出不同的時(shí)間特征。
我們發(fā)現(xiàn)前三種類別包含了90%以上的POI,并且作為城市主體的住宅區(qū)在主要類別之間分布較為均勻,這說(shuō)明住宅區(qū)與不同社會(huì)職能POI組合在一起會(huì)被歸為不同的類型。
我們結(jié)合類別的上、下車點(diǎn)的時(shí)間分布特征與空間分布特征進(jìn)行分析,找出各個(gè)類別與城市功能區(qū)之間的對(duì)應(yīng)關(guān)系。當(dāng)POI與相關(guān)類別關(guān)聯(lián)關(guān)系較為純粹時(shí),我們簡(jiǎn)單認(rèn)為該路段為相關(guān)功能區(qū)的簡(jiǎn)單組合或者執(zhí)行單一社會(huì)職能的熱點(diǎn)路段。
1.商業(yè)路段:類別1上車點(diǎn)在整個(gè)時(shí)間段上明顯大于下車點(diǎn),在9:00至16:00的工作時(shí)段維持高峰狀態(tài)、上下浮動(dòng)不大。在18:00傍晚進(jìn)餐時(shí)段處于低谷時(shí)期。并且類別1的明顯特征就是在20:00至23:00時(shí)段上車點(diǎn)急劇增加,明顯高于其他時(shí)段。城市工作壓力大,大部分城市工作人員選擇晚點(diǎn)加班,晚點(diǎn)回家。因此我們認(rèn)為類別1為商業(yè)熱點(diǎn)路段。從類別1的空間分布我們可以看出,工作熱點(diǎn)路段分布與城市一、二級(jí)路網(wǎng)有很強(qiáng)的關(guān)聯(lián)關(guān)系,這表明成都市商業(yè)交流的順利進(jìn)行依賴于發(fā)達(dá)的交通系統(tǒng)。從POI與類別1的關(guān)聯(lián)關(guān)系,可以看出成都市的住宅區(qū)大部分為商業(yè)住宅。
2.娛樂(lè)購(gòu)物路段:類別2下車點(diǎn)的數(shù)量遠(yuǎn)大于上車點(diǎn)的數(shù)量,下車點(diǎn)的數(shù)量在8:00至9:00、13:00至16:00、19:00至21:00點(diǎn)達(dá)到局部最大值,并且類別2關(guān)聯(lián)了50%左右的政府及事業(yè)單位、醫(yī)院、景點(diǎn)、娛樂(lè)場(chǎng)所、購(gòu)物中心的POI。這表明成都市居民習(xí)慣于在上午8:00至9:00、13:00至16:00之間到相關(guān)政府及事業(yè)單位、醫(yī)院處理相關(guān)事務(wù)或者到景區(qū)游玩。而在19:00至21:00之間到購(gòu)物中心購(gòu)物或者到相關(guān)娛樂(lè)場(chǎng)所放松身心。因此我們認(rèn)為類別2為娛樂(lè)購(gòu)物路段。在地理分布上,娛樂(lè)購(gòu)物路段集中分布于成都市市中心,與商業(yè)路段不同,娛樂(lè)購(gòu)物路段總是成群分布,這與現(xiàn)實(shí)世界中的步行街、購(gòu)物廣場(chǎng)、商業(yè)街等有很好的對(duì)應(yīng)關(guān)系。
3.住宅區(qū)路段:該類別上、下車點(diǎn)在隨時(shí)間的增加過(guò)程中,下車點(diǎn)與上車點(diǎn)的數(shù)量逐漸變大,在19:00急劇增加并在22:00達(dá)到最大值。直覺(jué)上,城市居民在完成自己的工作后,習(xí)慣在19:00至22:00之間回家休息。我們認(rèn)為這是典型性的居民區(qū)特征曲線。在地理分布上,居民區(qū)主要分布于一環(huán)路與二環(huán)路之間。
本研究利用出租車數(shù)據(jù)可以提取商業(yè)區(qū)、娛樂(lè)購(gòu)物區(qū)、住宅區(qū),并分析不同功能區(qū)在時(shí)間與空間上的分布特征。對(duì)城市規(guī)劃有重要的借鑒意義。在未來(lái)的研究中,我們可以從以下幾個(gè)方面改進(jìn):第一,本研究中并沒(méi)有找到很好標(biāo)準(zhǔn)來(lái)劃分不同的熱點(diǎn)路段與現(xiàn)實(shí)POIs之間的對(duì)應(yīng)關(guān)系。第二,出租車數(shù)據(jù)只是城市交通系統(tǒng)的一部分,以出租車軌跡數(shù)據(jù)對(duì)城市功能區(qū)分類會(huì)有局限性?;诙嘣磾?shù)據(jù)識(shí)別城市功能區(qū)是一個(gè)有效的方法。