岳鴻霄 韓雪源
【摘? 要】論文以海口市網約車運營服務為例,以2017年10月1日??谑芯W約車訂單數據為研究對象,利用Python對原始訂單數據進行清洗,借助ArcGIS與Surfer對清洗后的數據進行挖掘和可視化分析并探尋訂單的空間特征,利用Excel分析訂單的時間特征,研究??谑袊鴳c長假首日網約車訂單需求變化的時空分布規(guī)律,提出最優(yōu)配置建議。
【Abstract】This paper takes the ride-hailing operation service of Haikou City as an example, takes the ride-hailing order data of Haikou City on October 1, 2017 as the research object, uses Python to clean the original order data, and uses ArcGIS and Surfer to mine the cleaned data, conduct visual analysis and explore the spatial characteristics of the order. By using Excel to analyze the time characteristics of orders, this paper studies the temporal and spatial distribution of the demand change of online ride-hailing orders on the first day of National Day long holiday in Haikou City, and puts forward the optimal allocation suggestions.
【關鍵詞】地理大數據;網約車;配置優(yōu)化
【Keywords】geographic big data; online ride-hailing; allocation optimization
【中圖分類號】F572;F724.6? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ?【文獻標志碼】A? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ?【文章編號】1673-1069(2021)06-0107-03
1 引言
運用地理大數據深度挖掘網約車運營信息,如訂單類型、訂單起終點、經緯度、出行品類、乘車人數、乘車時間和時長等,進行數據可視化分析,精準描述并匹配用戶對于車輛類型、用車時間、行程距離、乘車路線等用車需求,分析網約車運營的時空分布規(guī)律,對于提高網約車的運營效率和服務能力、提高城市運力資源的配置效率具有重要意義。
2 文獻綜述
當前研究出租車、網約車運營管理與支持的文獻,主要是基于時間和空間2個維度,研究車輛運量投放和熱點區(qū)域探測及路徑推薦。時間維度上的研究,主要是基于車輛基本信息的統(tǒng)計分析,如運行時空特性及運營指標分析,根據這些基本信息確定出租車的市場供求關系以及出租車的運量投放規(guī)模,如翁劍成(2010)、程靜(2016)、吳華意(2019)等??臻g維度上的研究,主要是對車輛軌跡數據進行深層挖掘,研究對象有車輛的行駛速度、行駛里程、載客里程、上下客點、空載率、司機的收益排名情況,對出租車進行了行為分析,進行出行熱點區(qū)域探測、尋客策略擬定和路徑推薦,出行方向判斷以及打車需求預測等,如孫飛(2015)、畢碩本(2018)等。
綜上,當前研究車輛軌跡數據的文獻較為豐富,但大多文獻在進行空間分析時,未利用衛(wèi)星影像圖,沒有結合經緯度、行政區(qū)劃圖等地理、地圖要素進行可視化研究。本文基于地理大數據,以??谑芯W約車運營服務為例,以2017年10月1日??谑芯W約車訂單數據為研究對象,利用Python對原始訂單數據進行清洗,借助ArcGIS與Surfer軟件對清洗后的數據進行挖掘和可視化分析,并探尋訂單的空間特征,利用Excel分析訂單的時間特征,研究海口市國慶長假首日網約車訂單需求變化的時空分布規(guī)律,在此基礎上提出節(jié)假日網約車運營的最優(yōu)配置建議。
3 數據來源
本文數據均來源于滴滴出行公布的??谑?017年5月~10月每天的訂單信息。數據內容包括:訂單起點與終點的經緯度信息、訂單類型、出行品類、預估價格、乘車時長等。對于涉及乘客個人信息的數據已進行處理,不涉及個人隱私侵犯問題。受數據和研究手段限制,本文以小時為時間單位,以??谑?0月1日7:00~20:00共計13個小時的訂單信息作為研究數據,探尋以“十一長假”第一天為代表的節(jié)假日網約車運營的時間與空間特征規(guī)律。
4 研究方法
首先,利用Python進行數據清洗去除無效數據,導入Excel中進行格式轉換;其次,使用ArcGIS與Surfer軟件挖掘訂單的空間特征,對其進行數據分析與可視化;最后,使用Excel軟件對訂單的時間特征進行數據挖掘與數據分析。
4.1 訂單空間特征挖掘
①借助ArcMap與ArcScene,以50m×50m為單元,統(tǒng)計每個單元內逐小時及整個研究時段內的訂單數量,并使用不同的可視化方式使之更為直觀,便于分析。
在ArcMap中,根據清洗后的數據中的經緯度坐標,將每小時和整個研究區(qū)的訂單顯示在??谑行姓^(qū)劃圖中的相應位置。利用漁網功能,生成單元為50m×50m大小的漁網面。將生成的漁網面與導出后的訂單點數據關聯,以??谑行姓^(qū)劃圖為掩模進行裁剪。為統(tǒng)一且直觀地顯示訂單的密集程度,將裁剪后的圖層用自然斷點法分為8級,再進行手動調整,將沒有訂單的區(qū)域設為不可見(透明)。由于ArcScene只可以識別柵格圖層,還需要在ArcMap中將圖層轉為柵格存儲。最后在制作專題圖時添加相應的地圖要素。
②借助Surfer可以同時間對比多張圖的特征,對比逐小時的平均起點和平均終點與訂單數量。在Excel按時段進行統(tǒng)計,分別計算每個時段的總訂單數、平均起點和平均終點的經緯度坐標,并導出為文本文件。在Surfer軟件中,按照建立表面圖、網格化數據、生成等值線圖、生成表面圖的順序,以反距離插值的網格化方式,根據離散的經緯度坐標點和單數,完成東經110.3°~110.5°,北緯19.9°~20.02°范圍內,平均起點圖和平均終點圖的制作。再利用百度地圖的坐標反查功能,查找相應平均起點與終點的坐標與城市功能區(qū),探尋訂單整體的空間分布規(guī)律。
4.2 訂單時間特征挖掘
匯總全部數據后,繪制時間-產品線關系圖,探尋滴滴出行產品線(專車、快車、豪華車)與時間之間的關系;繪制時間-訂單數與均價、平均時長關系圖,探尋全部訂單數量、平均預估價格、平均時長、時間之間的關系;繪制時間-訂單類型關系圖,探尋訂單類型(實時單、預約單)與時間之間的關系。
5 網約車節(jié)假日運營時空特征分析
5.1 訂單空間特征分析
5.1.1 累計訂單起點的空間分布特征
在上述時間段內,滴滴出行一天累計訂單的空間分布及單位面積上訂單數量可視化圖(后續(xù)簡稱為訂單密度圖)如圖1、圖2所示。
根據訂單空間分布圖,可知:訂單數量的分布基本以城市核心區(qū)為中心,向外沿城市主干道、高速,呈輻射狀減少,其中沿河兩岸訂單數量明顯西岸多于東岸;西北部沿海區(qū)域訂單數相較于北部及東北部多,或許與中間隔著河有關;城市的中部和南部為2個明顯的訂單密集區(qū)。根據訂單密度圖,可更為直觀地發(fā)現訂單密度以核心區(qū)為中心,沿城市主要道路和高速路向外輻射擴散狀減少。
借助百度地圖經緯度坐標反查功能,查詢了所有訂單平均起點和終點的位置,如圖3所示。平均起點和終點之間的距離非常接近,但是向西北方向發(fā)生了一定的偏移,推測整體訂單中向西北方向移動的居多。其中平均起點為??谑旋埲A區(qū)坡博路,平均終點為??谑旋埲A區(qū)南沙路62號。由衛(wèi)星影像圖可知,平均起點和終點均處于??谑兄行奈恢?。
5.1.2 逐小時訂單起點的空間分布特征
按前述方法繪制海口市2017年10月1日7:00~20:00時間段內,滴滴出行每小時訂單密度圖(圖略)。通過觀察訂單空間分布圖可知,無論哪個時段,訂單的分布都較為集中,且單位面積上訂單數量多的位置也較為接近,同時,這些區(qū)域幾乎完全覆蓋城市一級道路,可知該區(qū)域為海口市核心區(qū)。通過逐小時訂單數量空間分布圖間的對比,可發(fā)現隨著時間的推移,訂單數量高的區(qū)域在不斷增加,在上午7~8時,訂單數量多的單元在實際中多為聚集性居民區(qū)。隨著時間的推移,由居民區(qū)向商業(yè)點或城市綠化景觀等休閑場所過度,但這2種區(qū)域的訂單數量都保持在較高的水準。
5.1.3 逐小時訂單起點與終點的平均位置空間特征
在研究時段內每小時對訂單的起點與終點的平均空間位置進行統(tǒng)計,數據如表1所示。隨著時間的推移,各時段平均起點整體呈現向西北方向移動的趨勢,平均終點整體呈現由西北向東南方向移動的趨勢。
利用Surfer對各個時段內的平均起點與終點進行分析,結合該時段的訂單數量得到圖4,其中,黃色為主色調的圖層為平均終點位置與用反距離插值后的訂單數量,深綠色為主色調的圖層為平均起點位置與用反距離插值后的頂點數量。通過2個圖層內的訂單數量的多少與位置,可獲得和上述內容一樣的結論。
5.2 訂單時間特征分析
根據滴滴出行數據,按照訂單數、實時單與預約單、專車與快車和豪華車、平均預估價格、平均時長進行逐小時統(tǒng)計,分別從產品線的時間特征、訂單數和均價、平均時長的時間特征、訂單數量的時間特征進行分析。
5.2.1 產品線時間特征
基于訂單數據繪制時間-產品折線圖(見圖5)。無論哪個時段,快車訂單的數量都遠大于專車的數量,而豪華車訂單的數量始終為0,這與滴滴出行公司提供的3種產品線的價格和數量有著密不可分的關系。
5.2.2 訂單數、均價與平均時間特征
繪制時間-訂單數與均價、平均時長關系圖(見圖6)。由圖6可知,隨著訂單量的增加,平均預估價格與平均時長呈現出減少的趨勢。隨著平均價格的降低,平均價格呈現出了與之相似的變化規(guī)律,當7~10點平均價格減少時,平均時長反而呈現出了增加的趨勢。
6 網約車節(jié)假日運營配置結論和建議
6.1 結論
①全市每個地理單位每小時訂單數量都隨時間的增加而增長,其中城市南部和中部的變化最為顯著。從10點開始,城南部的居民區(qū)訂單數量驟增,11~12點時達到頂峰,隨后緩慢下降,在15~16點時達到相對低谷,在16~17點時再次大量增長并保持相對穩(wěn)定。
②早晨時段城市中部的商業(yè)區(qū)、綠地等區(qū)域的訂單數量較低,隨后逐漸增長,但增速相較居民區(qū)緩慢,在12點過后訂單數量大幅增加又逐漸減少,在16~17時達到相鄰時段內的谷底,隨后再次增加,直至18時后達到同時段內訂單密度最高的區(qū)域。
③快車的訂單數量增長和減少與總訂單數同步,趨勢相同。
6.2 建議
6.2.1 空間配置建議
在進行網約車配置時,應以市中心為核心,沿主要道路逐漸向外減少車輛的調度,同時注意適量增加??谑形鞅辈康能囕v配置;節(jié)假日的7~9點、中午11點前后、下午17點前后,應主要配置在各個居民區(qū),且居民區(qū)密度越大,該區(qū)域網約車數量越多;中午12點后,應注意商業(yè)區(qū)和居民區(qū)的均衡配置;下午18點后,應以商業(yè)區(qū)為主要區(qū)域。
6.2.2 時間配置建議
自早上7時起,應不斷提高空閑網約車數量,以面對迅速增長的訂單數量;在12~19點的訂單高峰期,提高快車的數量同時控制專車、豪華車數量;鼓勵乘客選擇提前計劃出行時間,避免8~11點道路擁擠時出行,減小對城市路面交通的壓力。
【參考文獻】
【1】翁劍成,劉文韜,陳智宏,等.基于浮動車數據的出租車運營管理研究[J].北京工業(yè)大學學報,2010,36(06):779-784.
【2】程靜,劉家駿,高勇.基于時間序列聚類方法分析北京出租車出行量的時空特征[J].地球信息科學學報,2016,18(09):1227-1239.
【3】吳華意,黃蕊,游蘭,等.出租車軌跡數據挖掘進展[J].測繪學報,2019(11).
【4】孫飛,張霞,唐爐亮,等.基于GPS軌跡大數據的優(yōu)質客源時空分布研究[J].地球信息科學學報,2015,17(03):329-335.
【5】畢碩本,萬蕾,楊樹亮,等.基于GPS數據的南京出租車上下客時間特征及熱點時空分布[J].中國科技論文,2018,13(09):1023-1028.