文/杜博文
交通大數(shù)據(jù)是典型的時空大數(shù)據(jù),那什么是時空大數(shù)據(jù)呢?
我們乘坐的出租、地面公交、城市地鐵甚至航空等交通工具所提供的位置數(shù)據(jù),都可以映射到空間維度上,而歷史狀態(tài)關(guān)聯(lián)變化,或者居民跨越多個空間位置的移動行為,都可以映射到時間維度,我們把這些數(shù)據(jù)統(tǒng)一歸結(jié)為時空數(shù)據(jù)。
但我們所居住的城市是在不斷演化的,特別是近年來京津冀、粵港澳大灣區(qū)協(xié)同發(fā)展被列為國家重大發(fā)展戰(zhàn)略,綜合交通被設(shè)為優(yōu)先發(fā)展目標(biāo)。居民出行范圍擴大,出行距離增長;單一交通變?yōu)榫C合交通,居民出行模式增多,他們需要知道哪條道路擁堵應(yīng)該避開,選擇哪條路線更快捷。
針對這一需求,科研人員想到將諸如出租、公交等公共車輛的位置數(shù)據(jù)視為移動傳感器,這樣做最大的優(yōu)點是實現(xiàn)了交通小樣本到交通大數(shù)據(jù)的轉(zhuǎn)變,這就是大家日常使用的導(dǎo)航軟件動態(tài)路況信息生成。
但這件事做起來并不容易,因為畢竟出租車不像其他車輛可連續(xù)行駛,有路邊休息的、慢速行駛尋找客人的,甚至沒有出租車行駛過路段導(dǎo)致數(shù)據(jù)缺失的。
如何將缺失擾動信息變成連續(xù)可信數(shù)據(jù)呢?我國科研人員提出了成套方法技術(shù),同時建立了國際上第一個、具有完全自主知識產(chǎn)權(quán)、可支持大規(guī)模商用的出行信息服務(wù)系統(tǒng)。
首先,從公交需求預(yù)測方面看。比如北京天通苑區(qū)域,是北京人口最集中住宅區(qū)域之一,從公交出行記錄來看,每天擁有百萬級規(guī)模,那么該區(qū)域出行群體每天都去哪里了呢?每一時刻需要安排多少輛公交車、需要多少節(jié)地鐵車廂才能滿足需求?
對此,就要做通勤群體出行需求解析,通過對到達地點的時空分布分析發(fā)現(xiàn)了一個很有意思的結(jié)果,天通苑所連接的百余個區(qū)域中,僅有9個區(qū)域為公交客流的主要通行區(qū)域,這就為城市公交線網(wǎng)優(yōu)化提供了大數(shù)據(jù)支撐。
另外,現(xiàn)在大家每天出行都不像以前一樣,只坐公交或地鐵,而是使用共享單車、出租車、地鐵等多種交通工具聯(lián)合出行,比如,先乘坐軌道交通到達目的地大致方位,再使用單車到達最后目的地。這就給城市交通管理部門帶來一個問題,每種交通工具需要多少才能滿足需求?
這被稱為多模式交通需求量預(yù)測。遺憾的是,現(xiàn)有方法主要針對單一交通方式,缺乏對多模式交通需求量之間相關(guān)性的分析與挖掘。
實際上,某一地鐵站附近的共享單車需求量是受地鐵客流、公交客流、出租車客流,甚至氣象、事件等多因素影響的,也就是說在不同方式的交通需求量之間,存在著較強的關(guān)聯(lián)性。下雨天大家從地鐵站出來就會選擇坐公交、坐出租而少有選擇騎單車,而風(fēng)和日麗的傍晚,大家的選擇就正好相反。所以需求的動態(tài)變化產(chǎn)生出不確定性及復(fù)雜性。每個時間點上,不只是單一的交通需求量,而是多種交通需求量的綜合,我們研究的正是通過挖掘不同交通方式在時間和空間上的關(guān)聯(lián)關(guān)系,來實現(xiàn)精準(zhǔn)需求預(yù)測目的,甚至指導(dǎo)交通規(guī)劃。
比如,當(dāng)你去外地旅游,你會想應(yīng)該先去游覽哪些景點?如何規(guī)劃旅游行程效率最高?實際上已經(jīng)有很多手機APP服務(wù)能滿足這個需求,這個在學(xué)術(shù)界叫出行路徑推薦。但以前只注意景點推薦,這些APP軟件只會告訴你在哪個景點,下一個需要去哪個景點。但人們的需求并不是都這樣,比如,去一個景點旅游很有可能還去逛逛附近的紀(jì)念品商店、去喝杯咖啡、去吃個午餐等等,所以這些旅行者訪問的實際上不簡簡單單的是一個景點,一個位置,而是一組位置,這個問題通過科研人員研發(fā)的集合式交通行為建模方法,不僅讓人們可以了解一個城市更詳細的信息,同時,使未來的旅游出行變得更加智慧和便捷。