林鵬飛,翁劍成,劉文韜,徐 碩,尹寶才
(1.北京工業(yè)大學(xué) 交通工程北京市重點(diǎn)實(shí)驗(yàn)室,北京 100124;2.北京市運(yùn)輸管理技術(shù)支持中心,北京 100073)
城市出租車客運(yùn)系統(tǒng)是城市公共交通的重要組成,是城市軌道交通和常規(guī)公交的重要補(bǔ)充,提供了比傳統(tǒng)公共交通運(yùn)輸服務(wù)更舒適、更個(gè)性化的居民出行服務(wù).目前,北京市出租車約6.8萬輛,出租車客運(yùn)量占城市公共交通客運(yùn)量的7%左右[1].Uber、滴滴專車等互聯(lián)網(wǎng)約租車(以下簡稱網(wǎng)約車)作為“互聯(lián)網(wǎng)+交通”一種創(chuàng)新融合,解決了乘客與出租車司機(jī)之間信息不對稱的問題,有效緩解了乘客“打車難”的問題.截至2016年底,全國已有近400個(gè)城市提供網(wǎng)約租車服務(wù).
在出租車運(yùn)營特征分析方面,李艷紅等[2]在出租車OD數(shù)據(jù)分析基礎(chǔ)上,構(gòu)建了出租車出行特征、出行時(shí)間分布及出行空間分布的指標(biāo)體系和分析方法.翁劍成等[3]通過對大量出租車的計(jì)價(jià)器與GPS數(shù)據(jù)的預(yù)處理和分析,完善面向出租車運(yùn)營管理應(yīng)用的廣域浮動(dòng)車數(shù)據(jù)處理方法體系,提出基于浮動(dòng)車數(shù)據(jù)的出租車運(yùn)營管理指標(biāo)計(jì)算模型.莊立堅(jiān)等[4]依托大規(guī)模浮動(dòng)車數(shù)據(jù)的分析和預(yù)處理,分析出租車GPS 數(shù)據(jù)的特征,提出面向出租車運(yùn)營管理的大規(guī)模浮動(dòng)車數(shù)據(jù)處理框架,并綜合出行需求、運(yùn)營效益和運(yùn)營效率,構(gòu)建基于浮動(dòng)車數(shù)據(jù)的出租車運(yùn)營管理指標(biāo)體系及其計(jì)算模型.扈中偉[5]基于出租車運(yùn)營信息數(shù)據(jù)分析和實(shí)際調(diào)查,研究了北京市出租車運(yùn)營的時(shí)空分布特點(diǎn),重點(diǎn)對城市出租車合理規(guī)模和駕駛員勞動(dòng)強(qiáng)度2個(gè)專題進(jìn)行了研究.Leng等[6-8]分別以北京、廈門和義烏的出租車計(jì)價(jià)器數(shù)據(jù)為基礎(chǔ),在網(wǎng)約車不同發(fā)展階段,利用出租車載客次數(shù)、里程利用率、司機(jī)收入等指標(biāo)變化間接分析網(wǎng)約車對出租車行業(yè)的影響.
針對網(wǎng)約車的運(yùn)營特征分析,國內(nèi)外相關(guān)學(xué)者重點(diǎn)關(guān)注了運(yùn)營管理、運(yùn)營特征等方面的定性分析.汪光燾等[9]總結(jié)國內(nèi)外打車軟件的主要區(qū)別,指出中國打車軟件的管理更為復(fù)雜、更容易引起社會(huì)矛盾,并建議在國家層面提出指導(dǎo)性意見.Fischer-Baum等[10]通過研究2014—2015年4—6月曼哈頓地區(qū)Uber和出租車全部訂單數(shù)據(jù)發(fā)現(xiàn),Uber在曼哈頓并沒有造成接單量的增加,相反拼車服務(wù)在市中心取代了出租車,同時(shí)對熱點(diǎn)區(qū)域的乘車需求進(jìn)行了補(bǔ)給.高永等[11]通過將問卷調(diào)查數(shù)據(jù)擴(kuò)樣測算結(jié)果顯示約租車的無序發(fā)展是導(dǎo)致城市小汽車出行量增加、局部區(qū)域(時(shí)段)擁堵加劇的重要原因之一.
目前基于實(shí)際交易數(shù)據(jù)的網(wǎng)約車運(yùn)營特征的系統(tǒng)分析相對較少,并缺乏與傳統(tǒng)出租車在運(yùn)營屬性、運(yùn)營時(shí)空特征等方面的差異量化分析.本研究依托出租車計(jì)價(jià)器數(shù)據(jù)、出租車GPS數(shù)據(jù)與網(wǎng)約車訂單數(shù)據(jù)等多源數(shù)據(jù),提出了面向大規(guī)模運(yùn)營數(shù)據(jù)處理的數(shù)據(jù)預(yù)處理流程以及運(yùn)營特征指標(biāo)模型,從運(yùn)營強(qiáng)度、訂單時(shí)空分布特征等角度剖析出租車、網(wǎng)約車2類個(gè)體機(jī)動(dòng)車出行服務(wù)車輛的運(yùn)營特征差異.
出租車計(jì)價(jià)器數(shù)據(jù)、GPS數(shù)據(jù)以及網(wǎng)約車的訂單數(shù)據(jù)記錄了車輛運(yùn)營過程的時(shí)空分布信息,是出租車和網(wǎng)約車運(yùn)營特性對比分析的重要數(shù)據(jù)源.統(tǒng)計(jì)分析2015年9月10個(gè)典型工作日數(shù)據(jù),出租車數(shù)據(jù)為全樣本數(shù)據(jù),北京市6.7萬輛出租車平均每天交易次數(shù)約90~110萬次,每天回傳的GPS數(shù)據(jù)約1億5 000萬條;網(wǎng)約車數(shù)據(jù)為抽樣數(shù)據(jù),包含了1萬名司機(jī)約20萬條網(wǎng)約車訂單數(shù)據(jù).
出租車計(jì)價(jià)器數(shù)據(jù)包括了出租車司機(jī)的基本信息、每一次交易的乘客上下車時(shí)間、等待時(shí)間、行駛距離、空駛距離、金額等信息.計(jì)價(jià)器通常定期回傳一次,數(shù)據(jù)具有滯后性,但運(yùn)營數(shù)據(jù)記錄更為準(zhǔn)確.
目前北京全市出租車都搭載了GPS定位模塊,車輛以30~60 s時(shí)間間隔回傳GPS數(shù)據(jù),包括出租車的時(shí)間、位置坐標(biāo)和角度等基本信息,以及出租汽車運(yùn)營中的狀態(tài)(如空載、滿載、駐車、停運(yùn)等)信息,能夠詳細(xì)記錄出租汽車的實(shí)時(shí)運(yùn)營狀態(tài).
表1 出租車計(jì)價(jià)器數(shù)據(jù)屬性
表2 出租車GPS數(shù)據(jù)屬性
網(wǎng)約車軟件均基于移動(dòng)定位技術(shù),網(wǎng)約車運(yùn)營數(shù)據(jù)包含司機(jī)、乘客的基本信息,還包括乘客下單、司機(jī)搶單、乘客上下車時(shí)間、起終點(diǎn)位置、行駛距離、金額等信息.
表3 網(wǎng)約車訂單數(shù)據(jù)
出租車計(jì)價(jià)器數(shù)據(jù)、GPS數(shù)據(jù)以及網(wǎng)約車的訂單數(shù)據(jù)在采集過程中存在異常數(shù)據(jù),為了提高數(shù)據(jù)質(zhì)量要對多源數(shù)據(jù)進(jìn)行預(yù)處理.出租車計(jì)價(jià)器數(shù)據(jù)存在的問題主要是載客距離、載客時(shí)間過短或過長等,研究采用閾值法剔除錯(cuò)誤數(shù)據(jù)與異常數(shù)據(jù).出租車GPS數(shù)據(jù)存在的問題主要有坐標(biāo)重復(fù)、缺失、漂移等.本研究利用GPS生成時(shí)間與計(jì)價(jià)器中上、下車時(shí)間進(jìn)行匹配,選取時(shí)間最接近的經(jīng)緯度數(shù)據(jù)作為上下車的位置,允許時(shí)間匹配誤差在閾值內(nèi),即認(rèn)為匹配成功.網(wǎng)約車數(shù)據(jù)除了存在載客距離、載客時(shí)間異常的問題之外,還存在著少量的無效訂單,即司機(jī)未搶單的情況,采用閾值法剔除錯(cuò)誤數(shù)據(jù)與異常數(shù)據(jù).經(jīng)過預(yù)處理及數(shù)據(jù)融合后,分別提取出租車與網(wǎng)約車的運(yùn)營特征,從運(yùn)營強(qiáng)度和訂單時(shí)空分布特征2個(gè)角度進(jìn)行對比分析.多源數(shù)據(jù)處理與分析流程如圖1所示.
圖1 多源數(shù)據(jù)處理與分析流程
結(jié)合多源數(shù)據(jù)基礎(chǔ),根據(jù)網(wǎng)約車與出租車2類營運(yùn)車輛特點(diǎn),遵照系統(tǒng)性、可操作性、差異性的指標(biāo)選取原則,研究構(gòu)建了運(yùn)營強(qiáng)度指標(biāo)、訂單時(shí)空分布指標(biāo)2類運(yùn)營特征指標(biāo).
運(yùn)營強(qiáng)度指標(biāo)主要包含載客時(shí)間、載客里程、載客次數(shù)3項(xiàng)指標(biāo),這3項(xiàng)指標(biāo)可以準(zhǔn)確表征2類運(yùn)營車輛運(yùn)能運(yùn)量水平及自身運(yùn)行特點(diǎn),同時(shí)能間接反應(yīng)居民的出行選擇行為是否存在差異.
載客時(shí)間表征出租車司機(jī)及網(wǎng)約車司機(jī)單日的平均勞動(dòng)強(qiáng)度等,指標(biāo)內(nèi)容包括日均載客時(shí)間、次均載客時(shí)間如式(1)(2):
(1)
(2)
式中,ti為第i輛車單日總載客時(shí)間;ni為第i輛車單日載客次數(shù);m為單日所有運(yùn)營車輛的數(shù)量,i=0,1,2…m.
載客里程表征兩類營運(yùn)車輛對道路資源的占用情況,指標(biāo)內(nèi)容包括日均載客里程、次均載客里程如式(3)式(4):
(3)
(4)
式中l(wèi)i為第i輛車單日總載客里程.
載客次數(shù)一方面可以表征司機(jī)的勞動(dòng)強(qiáng)度,另一方面可以反應(yīng)區(qū)域的交通出行需求,客次數(shù)越多,表明打車需求量越大.指標(biāo)內(nèi)容包括日均載客次數(shù)、車均載客次數(shù)等如式(5):
(5)
訂單在不同時(shí)段上的分布,客觀上反映了城市居民的生活節(jié)奏以及乘客對出租車、網(wǎng)約車的交通需求在時(shí)間上的分布的差異性.以時(shí)間為橫軸,縱向分析24 h內(nèi)不同時(shí)段統(tǒng)計(jì)分析訂單分布,從而定量化的掌握乘客對兩類出租車需求強(qiáng)度的差異.
居民出行的空間分布特征具有一定的規(guī)律性.工作日居民出行多以通勤行為為主,周末節(jié)假日居民出行以休閑娛樂目的為主.訂單的空間分布特征即將某個(gè)統(tǒng)計(jì)分析區(qū)域分為若干個(gè)單位網(wǎng)格,分別統(tǒng)計(jì)每個(gè)單位網(wǎng)格中上車和下車次數(shù).本研究提出分區(qū)均衡系數(shù)用于表征出租車和網(wǎng)約車訂單在空間分布的差異性.分區(qū)均衡系數(shù)越接近于1,說明訂單的空間分布越均衡.為保證函數(shù)有意義,在上車次數(shù)為0的單位網(wǎng)格利用0.000 1代替0.均衡系數(shù)如式(6):
(6)
式中,xi為某區(qū)域內(nèi)第i個(gè)單位網(wǎng)格內(nèi)上車次數(shù)占該區(qū)域上車次數(shù)的百分比;n為某區(qū)域內(nèi)單位網(wǎng)格的個(gè)數(shù).
對出租車計(jì)價(jià)器數(shù)據(jù)與網(wǎng)約車的訂單數(shù)據(jù)進(jìn)行頻率分布統(tǒng)計(jì),95%的訂單載客里程、載客時(shí)間分別在50 km和144 min以內(nèi),將這2個(gè)值作為載客里程、載客時(shí)間的閾值,將超出閾值的出租車計(jì)價(jià)器與網(wǎng)約車記錄剔除.本研究中,研究范圍為北京六環(huán)覆蓋的區(qū)域,將超出范圍的出租車GPS數(shù)據(jù)與網(wǎng)約車訂單數(shù)據(jù)刪除,同時(shí)剔除出租車GPS數(shù)據(jù)中的漂移點(diǎn)、重復(fù)點(diǎn).GPS數(shù)據(jù)與計(jì)價(jià)器數(shù)據(jù)時(shí)間關(guān)聯(lián)匹配的閾值為±30 s.將統(tǒng)一坐標(biāo)系后的訂單起終點(diǎn)位置匹配到對應(yīng)的分析區(qū)域中.
出租車與網(wǎng)約車的日載客次數(shù)的頻率統(tǒng)計(jì)結(jié)果顯示,出租車的日均載客次數(shù)約為20次,網(wǎng)約車的日均載客次數(shù)約為8次,前者約為后兩者2.5倍.網(wǎng)約車的日載客次數(shù)頻率最高的范圍在0~5次,運(yùn)營強(qiáng)度較低.北京市部分出租車實(shí)行“雙班”的運(yùn)營模式,因此載客次數(shù)高于網(wǎng)約車.出租車和網(wǎng)約車的日載客次數(shù)分布情況如圖2所示:
圖2 日載客次數(shù)頻率分布
圖3為出租車和網(wǎng)約車的日載客時(shí)間分布情況,網(wǎng)約車的日均載客時(shí)間明顯低于租車,反映網(wǎng)約車駕駛員的工作勞動(dòng)強(qiáng)度相對較小.出租車的日均載客時(shí)間為6.7 h,而網(wǎng)約車的日均載客時(shí)間分別為2.9 h,不足出租車日均載客時(shí)間的一半,約占50%的網(wǎng)約車的日載客時(shí)間主要集中在2 h以內(nèi).
圖3 日載客時(shí)間頻率分布
圖4為出租車和網(wǎng)約車的日載客里程分布情況,出租車的載客里程分布的偏度為0.2,近似為正態(tài)分布,而網(wǎng)約車的分布的偏度分別為1.1,屬于偏態(tài)分布,說明大部分網(wǎng)約車的日載客里程較短.出租車日均運(yùn)營里程為178.9 km里,網(wǎng)約車的日均載客里程為71.9 km,80%的網(wǎng)約車的每天的載客里程在120 km以內(nèi).
對出租車、網(wǎng)約車的次均載客里程、載客時(shí)間進(jìn)行頻率分布分析,采用箱型圖描述出租車與網(wǎng)約車次均載客里程、載客時(shí)間分布,如圖5所示.出租車和網(wǎng)約車的次均載客里程分別為8.9 km和9.5 km,均以中短途距離為主,四分位距分別為8.7 km、8.9 km.就距離影響因素而言,乘客對差異化服務(wù)模式的選擇傾向并不明顯.兩者的次均載客時(shí)間分布差異較大,次均載客時(shí)間分別為21 min和26 min,這主要與訂單的時(shí)空分布、載客區(qū)域的實(shí)時(shí)路況有關(guān).
圖4 日載客里程頻率分布
圖5 次均載客里程、時(shí)間分布
3.2.1 訂單時(shí)變特征
訂單時(shí)變特征分析即是以時(shí)間為橫軸,時(shí)間區(qū)間為0.5 h,分析訂單數(shù)隨時(shí)間的變化.因抽樣后網(wǎng)約車與出租車的訂單分布絕對數(shù)量差異較大,為了便于分析,以百分比為縱坐標(biāo),實(shí)現(xiàn)兩類運(yùn)營車輛的歸一化處理.
圖6 訂單時(shí)變特征
出租車訂單分布相對平穩(wěn),高峰特征不明顯.出租車的需求低谷期出現(xiàn)到上午07:00以前,在08:00—10:00上班早高峰期間,出租車需求量明顯上升并達(dá)到需求峰值,在10:00以后出行需求有所回落,在隨后的下午和晚上出行需求量基本維持在一個(gè)較高水平,10:00—23:00訂單量占全天的72%.
網(wǎng)約車訂單的時(shí)間分布則較為集中,尤其在早晚高峰時(shí)段形成較為明顯的增長,基本與路網(wǎng)車流量早晚高峰時(shí)段重合,2個(gè)時(shí)段的總訂單量接近全日訂單的40%左右.另外,夜間時(shí)段(21:00至23:00)專車訂單比例相對較高,夜間時(shí)段與晚高峰形成明顯的“雙高峰”的時(shí)間分布特征,與同一時(shí)期出租車的特征形成顯著差異.網(wǎng)約車全天高峰時(shí)段的訂單量約占總訂單量的50%以上.
3.2.2 訂單空間分布特征
為了研究出租車與網(wǎng)約車訂單分布的時(shí)空差異,用ArcGIS軟件生成0.01×0.01的經(jīng)緯度網(wǎng)格覆蓋北京市六環(huán)以內(nèi)的區(qū)域,共計(jì)3 484個(gè)單元網(wǎng)格.將出租車、網(wǎng)約車訂單數(shù)據(jù)中的上、下車位置與生成的網(wǎng)格進(jìn)行空間連接分析,分別統(tǒng)計(jì)每個(gè)單位網(wǎng)格中的上車和下車數(shù)量,由于三者訂單絕對數(shù)量差異較大,對統(tǒng)計(jì)結(jié)果采用Jenks自然間斷點(diǎn)法分類,進(jìn)行歸一化處理,上、下車熱點(diǎn)區(qū)域空間分布如圖7所示.
出租車的上車區(qū)域與下車區(qū)域的空間分布基本保持一致,熱點(diǎn)載客區(qū)域主要集中于市中心,熱度由內(nèi)向外遞減.較密集的地區(qū)主要包括北京西站、北京南站、北京站以及首都機(jī)場等對外交通樞紐,訂單量約占總量的10%.網(wǎng)約車服務(wù)熱點(diǎn)載客區(qū)域與出租車服務(wù)對應(yīng)的熱點(diǎn)區(qū)域大量重合,在呼家樓—國貿(mào)區(qū)域、中關(guān)村、國貿(mào)CBD、東單附近、西單商圈等商業(yè)辦公區(qū),其服務(wù)人群空間分布集中度顯著高于出租車,在一定程度上緩解了這些熱點(diǎn)區(qū)域的出行壓力.除此之外網(wǎng)約車出現(xiàn)了一些新的熱點(diǎn)區(qū)域,如來廣營、望京以及西二旗附近、通州北苑附近區(qū)域存在的上車熱點(diǎn),網(wǎng)約車在空間上彌補(bǔ)了部分出租車運(yùn)力較為緊張的區(qū)域.為了進(jìn)一步分析網(wǎng)約車對出租車的補(bǔ)充作用,分別計(jì)算在不同時(shí)段、不同空間范圍網(wǎng)約車引入前后的均衡系數(shù),結(jié)果如表4所示:
在市中心區(qū)域兩類運(yùn)營車輛載客區(qū)域大部分吻合.各時(shí)段引入網(wǎng)約車前后,二環(huán)以內(nèi)區(qū)域均衡系數(shù)變化不明顯,表明網(wǎng)約車的載客區(qū)域與出租車的載客區(qū)域重合度較高.
市區(qū)外圍區(qū)域均衡系數(shù)的改善效果明顯,網(wǎng)約車與出租車存在補(bǔ)充關(guān)系.從全天的均衡系數(shù)來看,出租車的訂單空間分布由內(nèi)到外不均衡程度逐漸加重,五、六環(huán)之間的區(qū)域訂單分布最不均衡,均衡系數(shù)僅為0.808 9,而引入網(wǎng)約車后,除二三環(huán)之間各個(gè)區(qū)域中的均衡指數(shù)均有明顯增加.早高峰時(shí)段,均衡系數(shù)改善明顯的區(qū)域在二三環(huán)之間、四六環(huán)之間;晚高峰和夜間時(shí)段均衡系數(shù)改善明顯區(qū)域則主要分布在四六環(huán)之間,與圖7中訂單空間分布特征吻合,這些區(qū)域的均衡指數(shù)分別在早、晚高峰和夜間時(shí)段最高提升了9.0%,5.7%和5.8%,網(wǎng)約車對城市外圍區(qū)域(四環(huán)外)出租車供給緊張區(qū)域的補(bǔ)充作用最為明顯,有效緩解了“打車難”問題.
圖7 訂單空間分布特征
表4 網(wǎng)約車引入前后訂單空間分布均衡系數(shù)變化
本文利用北京市部分工作日的出租車計(jì)價(jià)器、GPS數(shù)據(jù)和網(wǎng)約車訂單數(shù)據(jù),從運(yùn)營強(qiáng)度指標(biāo)、訂單時(shí)空分布2個(gè)方面構(gòu)建運(yùn)營特征指標(biāo)模型.兩者的運(yùn)營特征差異可總結(jié)為如下4點(diǎn):
1)網(wǎng)約車個(gè)體的日運(yùn)營強(qiáng)度明顯低于出租車.從日均運(yùn)營里程、日均載客時(shí)間和日均載客次數(shù)的角度來看,工作日網(wǎng)約車的日運(yùn)營強(qiáng)度明顯低于出租車,約為出租車的40%左右.
2)出租車和網(wǎng)約車的次均載客特征差異性并不顯著.兩者次均載客里程為8.9 km和9.5 km,均以中短途距離為主.
3)網(wǎng)約車訂單集中在早晚高峰及夜間時(shí)段.從訂單的時(shí)變特征來看,出租車在全日的訂單分布相對平穩(wěn),網(wǎng)約車訂單在早晚高峰及夜間時(shí)段形成較為明顯的增長,訂單量占全天訂單的50%以上,有效緩解了“打車難”的問題.
4)網(wǎng)約車訂單的空間分布更集中,成為出租車的有益補(bǔ)充.引入分區(qū)均衡系數(shù)衡量兩者訂單的空間分布均衡性,引入網(wǎng)約車后市中心區(qū)域均衡系數(shù)變化不明顯,表明網(wǎng)約車訂單與出租車服務(wù)對應(yīng)的熱點(diǎn)區(qū)域大量重合,在市區(qū)外圍“打車難”的區(qū)域,高峰時(shí)段均衡系數(shù)最高可提升9%,網(wǎng)約車形成對出租車有效補(bǔ)充.
本研究可以幫助政府和行業(yè)管理部門更好地了解網(wǎng)約車和出租車的運(yùn)營特征,尤其是在網(wǎng)約車合法化的背景下,為網(wǎng)約車監(jiān)管、出租車行業(yè)改革提供有效的數(shù)據(jù)支撐.
致謝
感謝滴滴政策研究院和北京市交通運(yùn)行監(jiān)測調(diào)度中心對本研究提供的數(shù)據(jù)支持.