汪瑞琪 陳建均
(1. 廣東省交通運輸規(guī)劃研究中心,廣東 廣州 510101;2. 廣州市交通規(guī)劃研究院,廣東 廣州 510375)
大數(shù)據(jù) (big data) 是指在一個可承受的時間范圍內(nèi),常規(guī)傳統(tǒng)軟件工具無法捕獲、管理和處理的數(shù)據(jù)集合。
“大數(shù)據(jù)”的內(nèi)涵正在不斷擴大,它是包括數(shù)字、文本、聲音、圖像和視頻等所有有價值信息的總稱[1]。其特點為Volume (海量性) 、Variety (多樣性) 、Veracity (真實性) 、Velocity (高速性) 、Value (重要性),可以概括為5V。
大規(guī)模數(shù)據(jù)為交通信息和交通數(shù)據(jù)的處理和分析帶來了許多挑戰(zhàn)。國務(wù)院于2015年印發(fā)《促進大數(shù)據(jù)發(fā)展行動綱要》,首次明確提出建設(shè)數(shù)據(jù)強國,至此大數(shù)據(jù)發(fā)展正式上升為國家戰(zhàn)略。
“大數(shù)據(jù)”成為城市規(guī)劃熱點的主要原因有兩個。第一,大數(shù)據(jù)在電子商務(wù)、移動互聯(lián)、社交網(wǎng)絡(luò)等領(lǐng)域的成功應(yīng)用,對人們的生活方式產(chǎn)生了影響,激勵著規(guī)劃者們將大數(shù)據(jù)系統(tǒng)應(yīng)用在交通領(lǐng)域。其次,城市規(guī)劃傳統(tǒng)上并不依賴數(shù)據(jù),常常被詬病為太軟、不真實和不科學(xué),而大數(shù)據(jù)無疑可以彌補這個缺點。大數(shù)據(jù)背景下的分析框架如圖1所示。
圖1 大數(shù)據(jù)背景下的分析框架
1.2.1 “大數(shù)據(jù)”背景下交通數(shù)據(jù)的采集技術(shù)
利用大數(shù)據(jù)的交通信息數(shù)據(jù)采集方法讓交通運輸行業(yè)發(fā)展更具前瞻性和科學(xué)性。主要表現(xiàn)為:一是能夠快速、及時地反映交通基礎(chǔ)設(shè)施的狀況,為應(yīng)急救援提供最有效、最直接的信息技術(shù)和決策支持;二是能夠獲得交通運行的連續(xù)觀測數(shù)據(jù),為道路管理措施的制定和公共交通政策的研究提供了動態(tài)依據(jù)。第三,通過對居民出行信息的動態(tài)采集,很好地解決了抽樣調(diào)查只能獲取單時段數(shù)據(jù)的問題。第四,動態(tài),實時地觀測交通擁堵狀況,持續(xù)評估緩解擁堵政策的實施效果。
1.2.2 “大數(shù)據(jù)”背景下交通數(shù)據(jù)的管理技術(shù)
當(dāng)前海量的數(shù)據(jù)源、多樣的數(shù)據(jù)類型給交通數(shù)據(jù)管理帶來了新的挑戰(zhàn)。第一,大數(shù)據(jù)的歸檔存儲及數(shù)據(jù)更新成為交通數(shù)據(jù)管理中亟須解決的重要問題;其次,多樣化多類型數(shù)據(jù)的統(tǒng)一化和精確化管理是交通數(shù)據(jù)管理的關(guān)鍵研究方向;第三,缺乏及時有效的數(shù)據(jù)提取與處理手段,建設(shè)智能交通的前提是構(gòu)建交通數(shù)據(jù)處理模型。第四,面向管理部門、科研機構(gòu)及運輸企業(yè)等多用戶的數(shù)據(jù)實時共享與交換系統(tǒng),需要滿足不同用戶對流量數(shù)據(jù)的多樣化需求。
大數(shù)據(jù)技術(shù)的發(fā)展使管理者和研究者能夠更深入地觀察規(guī)劃對象。大樣本的優(yōu)勢使人們能夠更準(zhǔn)確地細化不同類型活動的居民的空間分布結(jié)構(gòu)。連續(xù)追蹤觀測的優(yōu)點使得觀測城市交通行為的連續(xù)變化過程成為可能。多角度綜合觀測的優(yōu)點使規(guī)劃對象能夠通過多源數(shù)據(jù)從不同角度更全面的研究。多尺度的優(yōu)點可以使人們在不同的時間和空間測量條件下,研究交通宏觀與微觀的關(guān)系成為可能。
基于數(shù)據(jù)的建模方法可以從多維數(shù)據(jù)中學(xué)習(xí)復(fù)雜模式從而有效的彌補未被記錄的活動。從大型社交網(wǎng)站的數(shù)據(jù)中可以推斷出個體的活動特征,實現(xiàn)基于數(shù)據(jù)主題的建模。
移動通信網(wǎng)的信號覆蓋邏輯上設(shè)計為由若干的六邊形基站組成的蜂窩網(wǎng)絡(luò)業(yè)務(wù)區(qū),移動終端總是與其中一個基站保持聯(lián)系。移動通信網(wǎng)絡(luò)控制中心定期主動或被動記錄各移動終端時間序列的基站手機號信息[2]。具體示意圖如圖2所示。
圖2 移動通信網(wǎng)絡(luò)中手機用戶出行軌跡示意圖
將手機移動用戶時間序列的信令數(shù)據(jù)映射到真實的地理空間位置,從而完整客觀地還原手機用戶的出行活動軌跡,分析得到常住人口的地理空間分布特征和城市居民出行活動特征的動態(tài)信息。
主要研究思路包括:首先,利用手機定位數(shù)據(jù)分析居民在移動通信網(wǎng)絡(luò)中的活動;其次,建立移動通信網(wǎng)絡(luò)信號與所覆蓋的空間地理數(shù)據(jù)的對應(yīng)映射關(guān)系,分析移動用戶在城市空間中的活動路徑。第三,運用移動用戶活動模型、出行配流模型、時空聚類算法和移動模式識別算法等對移動用戶群體的活動特征進行分析和挖掘。第四,將手機用戶樣本擴展到一般人群 (包括手機用戶和非手機用戶) 進行特征指標(biāo)分析,如人口居住和工作場所的分布、流動人口活動特征、區(qū)域間客流的交換、城市發(fā)展軸線的延伸分布、核查線或關(guān)鍵通道客流與周邊城市客流聯(lián)系等。
2.3.1 地理位置特征
隨著衛(wèi)星定位技術(shù)和信息通信技術(shù)的進步,實現(xiàn)對手機用戶的自動識別、定位、跟蹤、控制和信息的互換。手機用戶每天出行時都會在無線通信服務(wù)提供商的信息數(shù)據(jù)庫中留下電子足跡,利用GSM、WIFI、RFID等定位技術(shù)和通信技術(shù)相結(jié)合,基于無線局域網(wǎng)實現(xiàn)對物體的智能化、實時化的識別、跟蹤和管理。也就是說,隨著移動電話使用頻率和定位精度的不斷提高,移動通信服務(wù)提供商連續(xù)積累了大量的手機用戶軌跡數(shù)據(jù),為研究獲取城市居民出行規(guī)律提供了豐富的數(shù)據(jù)資源。用戶的地理位置反映了相鄰區(qū)域間的緊密聯(lián)系,挖掘這些數(shù)據(jù)的軌跡特征,實現(xiàn)實時交通狀況監(jiān)控日益引起各領(lǐng)域廣泛的關(guān)注[3]。
2.3.2 城市用地特征
城市用地特征是科學(xué)開展城市規(guī)劃的基礎(chǔ)和前提,是影響基礎(chǔ)設(shè)施建設(shè)、公共資源分配、社會經(jīng)濟發(fā)展、生態(tài)環(huán)境持續(xù)的最根本因素。
利用社交網(wǎng)絡(luò)數(shù)據(jù)可預(yù)測城市土地利用(見圖3)。通過手機用戶在一段時間范圍內(nèi)在一定區(qū)域范圍出現(xiàn)的天數(shù)頻率,判別為常住性的手機用戶群體,從而分別識別出夜間和白天活動最為頻繁的區(qū)域近似為居住和工作地點,以收集每個區(qū)域相應(yīng)規(guī)模的居民和工作人口。
圖3 基于手機定位數(shù)據(jù)的實際及預(yù)測用地信息
2.3.3 居民出行分布
出行指的是人從始點到終點的一次移動,出行數(shù)量的多少為出行量。區(qū)域客流的產(chǎn)生量,指的是人以某個區(qū)域為出行始點產(chǎn)生的出行總數(shù)(見圖4),區(qū)域客流的吸引量,指的是人以某個區(qū)域為出行終點產(chǎn)生的出行總數(shù)(見圖5)。對不同類型土地利用對客流的產(chǎn)生吸引量進行分析,得到不同類型土地利用產(chǎn)生吸引率,以此作為預(yù)測基礎(chǔ),可以有效地提高交通需求預(yù)測的可行性及可靠性。
具體的分析法可以按照基于家、工作地等不同出行目的統(tǒng)一不同日期 (工作日、周末) 、不同時間區(qū)域 (高峰、平峰) 間的人的出行量的變化情況,來作為分析不同區(qū)域間交通聯(lián)系緊密程度的依據(jù)。同時,可結(jié)合區(qū)域周邊交通基礎(chǔ)設(shè)施的布局情況,分析城市內(nèi)部人們的空間出行軸向,為城市總規(guī)的編制與區(qū)域發(fā)展規(guī)劃提供定量支撐。
圖4 區(qū)域出行產(chǎn)生點
圖5 區(qū)域出行吸引點
基于手機移動數(shù)據(jù)的城市交通規(guī)劃決策支持系統(tǒng),是整合交通信息采集與融合、交通信息傳輸與管理、交通信息服務(wù)發(fā)布等形成的一個新環(huán)境系統(tǒng)[4]。該系統(tǒng)有效地利用了基于移動計算的全區(qū)域廣覆蓋、無線傳輸快捷等特點,充分利用了移動手機數(shù)據(jù)占據(jù)城市交通出行比例大、城市交通影響范圍廣等,是通信移動技術(shù)與交通運輸領(lǐng)域的有效結(jié)合與完美統(tǒng)一的具體實踐。
目前,隨著移動手機的普及,手機流量與覆蓋城市的居民活動總量密切相關(guān),而居民活動總量與該地區(qū)的活躍人口數(shù)直接相關(guān)。大量實驗證明,手機流量與相應(yīng)城市居民活動總量成正比,通過對手機流量時空分布的分析,定性地得到了該地區(qū)居民活動總量的時空分布特征。然后,根據(jù)區(qū)分每個區(qū)域的交通特征,將具有類似交通特征的區(qū)域合并為交通土地單元。此外,在一定的城市地區(qū),可量化的手機流量與活躍人口數(shù)量之間存在著統(tǒng)計意義上的正比關(guān)系,因此可以得到該地區(qū)活躍人口數(shù)量的時間分布特征,為交通網(wǎng)絡(luò)建模和分析提供了良好的依據(jù)。
手機信息映射的交通小區(qū)與基站的物理覆蓋范圍密切相關(guān),基于手機數(shù)據(jù)的交通小區(qū)映射將基站小區(qū)與移動通信網(wǎng)絡(luò)基站相結(jié)合,將基站小區(qū)映射到交通用地上,提出了一種更精確的基于手機信息的交通小區(qū)映射方法。該方法在基站覆蓋的物理范圍基礎(chǔ)上采用更精確的交通小區(qū)和OD矩陣。所謂“修邊”是將基站的覆蓋范圍映射到交通小區(qū),并將基站覆蓋范圍與交通小區(qū)的物理覆蓋范圍進行邏輯整合。
另一種方法是利用手機基站數(shù)據(jù),提取其中具有交通特性及與交通產(chǎn)生吸引有關(guān)的趨勢數(shù)據(jù),再利用聚類分析方法將交通屬性相近且基站距離近的數(shù)據(jù)集劃分為一個交通小區(qū)?;谑謾C數(shù)據(jù)的活動人群分布如圖6所示。
圖6 基于手機數(shù)據(jù)的活動人群分布
前面已經(jīng)提到了一個試驗結(jié)論:在相應(yīng)的城市地區(qū),手機流量與城市居民出行總量之間存在正相關(guān)關(guān)系。換言之,移動電話信號在基站之間移動的方向可以看作是個體出行的方向,通過建立的基站覆蓋范圍與交通小區(qū)的映射關(guān)系,將基站覆蓋區(qū)域內(nèi)手機用戶的出行方向和位置映射到劃分的交通小區(qū),得到相應(yīng)的客流OD數(shù)據(jù)。
傳統(tǒng)的交通數(shù)據(jù)調(diào)查每年都需要花費大量人力、物力和財力,而基于手機定位的交通數(shù)據(jù)采集與處理技術(shù)是對傳統(tǒng)方式的重要補充,是一種廣域動態(tài)的客流探測技術(shù),為交通調(diào)查和交通規(guī)劃提供了實時依據(jù)。一方面,手機數(shù)據(jù)能夠通過定位信息分析動態(tài)客流狀態(tài),充分把握當(dāng)前的交通狀況,從出行鏈、職住特征、人口動態(tài)、出行方式距離、活動軌跡等進行個體活動規(guī)律的研究,從而進行區(qū)域活動特征、走廊活動特征、節(jié)點活動特征的分析應(yīng)用。另一方面,移動數(shù)據(jù)可以應(yīng)用于交通規(guī)劃的需求預(yù)測,同時通過交通誘導(dǎo)、交通信息服務(wù)為交通擁堵治理、智能交通應(yīng)用等提供了一定的條件;也可用于交通規(guī)劃的后評估和模型參數(shù)的修正,從而真正實現(xiàn)交通規(guī)劃的建模、定量化和科學(xué)化[5],使人們重新認(rèn)識交通需求以及交通運行的內(nèi)在規(guī)律。