唐雋玉, 朱 祎, 黃一哲
(上海交通大學(xué) 船舶海洋與建筑工程學(xué)院,上海 200240)
出租車(chē)是日常生活中不可或缺的交通工具,為人們提供便捷的門(mén)到門(mén)運(yùn)輸服務(wù)。出租車(chē)供需的隨機(jī)性,導(dǎo)致了出租車(chē)空車(chē)率水平的不合理問(wèn)題??哲?chē)率過(guò)高會(huì)增加司機(jī)的工作成本,造成時(shí)間和燃料的浪費(fèi)。而空車(chē)率過(guò)低會(huì)延長(zhǎng)乘客的等待時(shí)間。此外,過(guò)多的空車(chē)將會(huì)加劇交通擁堵,并造成空氣污染,如在臺(tái)灣,空車(chē)每年會(huì)造成9 000萬(wàn)L汽油的浪費(fèi)[1]。為緩解上述問(wèn)題,一些學(xué)者對(duì)出租車(chē)空車(chē)時(shí)長(zhǎng)/空車(chē)率進(jìn)行了一系列相關(guān)研究。關(guān)金平等[2]分析了出租車(chē)空駛的時(shí)空特性,并且從人文地理、城市規(guī)劃角度分析了成因。鞠煒奇等[3]以深圳為例對(duì)出租車(chē)空車(chē)率的時(shí)空分布特征及影響因素進(jìn)行了分析。但上述兩項(xiàng)關(guān)于出租車(chē)影響因素的研究?jī)H停留在定性分析階段。量化空車(chē)率和影響因素之間的關(guān)系,可為調(diào)節(jié)空車(chē)率至合理水平提供科學(xué)依據(jù)。提取空車(chē)率影響因素是量化二者關(guān)系的第一步,現(xiàn)有研究表明以下因素與出租車(chē)的空車(chē)率有密切關(guān)聯(lián):尋/送客時(shí)長(zhǎng)、距離[4],司機(jī)尋客策略[5],上車(chē)次數(shù)[6]等。然而,目前尚缺少將這些因素綜合起來(lái)進(jìn)行研究的文獻(xiàn)。
Logit模型作為一種數(shù)學(xué)工具被廣泛應(yīng)用于城市交通研究中[7],本文基于廣義多水平定序Logit模型(GMOL模型),旨在從駕駛員行為分析角度,建立一個(gè)全面且定量化的方法來(lái)挖掘出租車(chē)空車(chē)率的影響因素,從而尋求影響因素與空車(chē)率之間的量化關(guān)系,以合理化調(diào)節(jié)空車(chē)率水平,達(dá)到優(yōu)化出租車(chē)運(yùn)行效率及乘客滿意度的目的。
GPS數(shù)據(jù)由上海強(qiáng)生出租車(chē)公司采集,涵蓋10 000輛以上的出租車(chē)運(yùn)行信息,平均每10 s記錄一次。每條記錄包括出租車(chē)ID 號(hào)(唯一標(biāo)記)、載客狀態(tài)(1表示空車(chē),0表示重車(chē))、GPS信息接收時(shí)間、當(dāng)前位置的經(jīng)、緯度以及瞬時(shí)速度。
由于GPS信號(hào)遮擋、設(shè)備故障等原因,需要進(jìn)行數(shù)據(jù)清洗。將經(jīng)緯度在[120.852°E,121.925°E],[30.693°N,31.511°N]之外、瞬時(shí)速度在0,120 km/h之外的數(shù)據(jù)進(jìn)行剔除,刪除了占原始數(shù)據(jù)0.007%的異常數(shù)據(jù)。
對(duì)于空間劃分,本文的研究區(qū)域?yàn)槌コ缑鲘u的上海市主干區(qū)域,并將研究區(qū)域網(wǎng)格化,即將上海主干區(qū)域劃分為一系列約為500 m×400 m 大小相同的網(wǎng)格,總量為22 814個(gè)。
對(duì)于時(shí)間劃分,由于周五相較于其它4個(gè)工作日呈現(xiàn)出不同的出租車(chē)駕駛模式,同時(shí)為了減少計(jì)算復(fù)雜度,選擇2016年3月21日—2016年3月24日(周一至周四)作為計(jì)算原始數(shù)據(jù)。此外,還需對(duì)研究時(shí)段進(jìn)行劃分。
如圖1所示,載客車(chē)速度作為篩選研究時(shí)段的第一個(gè)指標(biāo),如果速度過(guò)低,說(shuō)明當(dāng)前路況擁擠,司機(jī)不能自主地采取策略進(jìn)行運(yùn)營(yíng)。而且,為保證足夠的樣本量,運(yùn)營(yíng)車(chē)數(shù)量作為第二個(gè)篩選時(shí)間段的指標(biāo)。最后,還需要排除司機(jī)用餐時(shí)間的影響,Qin et al[8]對(duì)上海市出租車(chē)司機(jī)的用餐時(shí)間進(jìn)行調(diào)研,發(fā)現(xiàn)用餐時(shí)間靈活地分布在11:00~14:00以及16:00~19:30之間。綜上,選取14:00~16:00作為研究時(shí)間段。
圖1 載客車(chē)速度、運(yùn)營(yíng)車(chē)數(shù)量在一天中的變化
視出租車(chē)的時(shí)間空車(chē)率為空車(chē)率的衡量標(biāo)準(zhǔn),因?yàn)槌鲎廛?chē)的機(jī)會(huì)成本是通過(guò)空車(chē)時(shí)間測(cè)算而非空車(chē)運(yùn)營(yíng)距離測(cè)算[9]。司機(jī)i的空車(chē)率VRi的計(jì)算如下
式中,t0i,j為司機(jī)i的第j 次重車(chē)行程的運(yùn)營(yíng)時(shí)間;t1i,j為司機(jī)i的第j 次空車(chē)行程的運(yùn)營(yíng)時(shí)間。
為了更為直觀以及減低隨機(jī)性的影響,將空車(chē)率分為3種水平:高、中、低。分類(lèi)標(biāo)準(zhǔn)為:將出租車(chē)空車(chē)率的標(biāo)準(zhǔn)差進(jìn)行升序排列,視標(biāo)準(zhǔn)差在前50%的司機(jī)為穩(wěn)定司機(jī),刪去標(biāo)準(zhǔn)差值處于后50%的司機(jī)空車(chē)率數(shù)值。之后,將空車(chē)率的數(shù)值從小到大排列,取0~20%、40%~60%以及80%~100%作為低、中、高3種空車(chē)率水平的判定標(biāo)準(zhǔn)。對(duì)應(yīng)的空車(chē)率總體分布見(jiàn)圖2,3 種空車(chē)率水平的分布如圖3 所示。觀察可得,上海市的出租車(chē)空車(chē)率大部分分布在中等水平,并且中等空車(chē)率水平的標(biāo)準(zhǔn)差最低,最為穩(wěn)定。
圖2 14:00~16:00時(shí)間段內(nèi)出租車(chē)空車(chē)率的分布
圖3 14:00~16:00時(shí)間段內(nèi)3種空車(chē)率水平的分布
2.3.1 尋客策略
(1)尋客距離。尋客距離Ds是指出租車(chē)在上一個(gè)乘客的下車(chē)事件與緊接著的下一個(gè)上車(chē)事件之間的空車(chē)運(yùn)行時(shí)間,計(jì)算如下
式中,ED[(lonj,latj),(lonj+1,latj+1)為出租車(chē)空車(chē)行程中第j條記錄和它下一條記錄之間的歐氏距離,可由經(jīng)緯度信息計(jì)算得到[4]。
(2)上車(chē)強(qiáng)度。上車(chē)強(qiáng)度Ip定義為空車(chē)經(jīng)過(guò)沿路一系列網(wǎng)格對(duì)應(yīng)的上車(chē)次數(shù)的加權(quán)平均數(shù),計(jì)算如下
式中,pTx,y為在時(shí)間T 內(nèi)網(wǎng)格(x,y)中的上車(chē)次數(shù);ETTx,y為在網(wǎng)格(x,y)中的第j條記錄和它上一條記錄之間經(jīng)歷的時(shí)間。
(3)運(yùn)行/等待。借鑒Li et al[5]的研究,用下列計(jì)算來(lái)區(qū)分司機(jī)的運(yùn)行/等待策略,從而判斷司機(jī)更傾向于沿路尋客,還是就地等客。定義在上車(chē)事件發(fā)生前3 min的空車(chē)運(yùn)行距離為Dp,則等待策略對(duì)應(yīng)著指標(biāo)Dp低于一定的閾值τp,而運(yùn)行策略則對(duì)應(yīng)著指標(biāo)Dp高于該閾值τp,公式表示為
從而建立對(duì)應(yīng)的運(yùn)行/等待指標(biāo)Iw,這是一個(gè)布爾變量,當(dāng)值為1時(shí)表示司機(jī)采用就地等客策略(等待);當(dāng)值為0時(shí),表示司機(jī)采用沿路尋客策略(運(yùn)行),即
2.3.2 送客策略
當(dāng)司機(jī)載有乘客時(shí),有的司機(jī)偏向于選擇保證較高運(yùn)行速度但較為迂回的道路,有的司機(jī)則偏好選擇最短路,這些選擇最終會(huì)通過(guò)改變重車(chē)時(shí)間的占比來(lái)影響對(duì)應(yīng)的出租車(chē)空車(chē)率。
(1)送客迂回程度。送客迂回程度Cd通過(guò)一次重車(chē)行程的實(shí)際運(yùn)行距離和起訖點(diǎn)之間的歐式距離的比值衡量,計(jì)算如下
式中,ED[(lono,lato),(lond,latd)]為起訖點(diǎn)之間的歐氏距離;Dd為一次重車(chē)行程的實(shí)際運(yùn)行距離,由相鄰兩記錄之間的歐氏距離累加得
(2)送客速度。為減少GPS數(shù)據(jù)采集間隔的非均質(zhì)性,送客速度vd為加入時(shí)間考慮的速度加權(quán)平均值,計(jì)算如下式中,ETj為一次重車(chē)行程中第j 條記錄和它上一條記錄之間經(jīng)歷的時(shí)間。
視3種空車(chē)率水平為定序的離散因變量yi(1=高,2=中,3=低),在前文中提取出的5個(gè)因素作為自變量Xi=(xi1,xi2,…,xi5),構(gòu)建GMOL模型,那么因變量對(duì)應(yīng)的概率計(jì)算如下
則廣義線性形式的模型可表示為
式中,β(1)為服從平行線假設(shè)的自變量對(duì)應(yīng)的系數(shù),也就是對(duì)于任意的空車(chē)率水平j(luò),對(duì)應(yīng)的系數(shù)均為β(1);β(2)為違反平行線假設(shè)的自變量對(duì)應(yīng)的系數(shù),它們的值隨著不同的空車(chē)率水平而產(chǎn)生變動(dòng)。上述系數(shù)的值可以通過(guò)最小二乘法估計(jì)得到。
多重共線性是指多元回歸模型中2個(gè)或2個(gè)以上獨(dú)立變量高度相關(guān)的現(xiàn)象。方差膨脹因子(VIF)是一種檢驗(yàn)多重共線性的方法。當(dāng)VIF 等于1時(shí),意味著沒(méi)有多重共線性存在;當(dāng)VIF 超過(guò)4時(shí),則需要進(jìn)一步進(jìn)行討論;而當(dāng)VIF 超過(guò)10時(shí),則意味著存在嚴(yán)重的多重共線性問(wèn)題。對(duì)可能影響空車(chē)率的因素進(jìn)行多重共線性檢驗(yàn),結(jié)果如表1所示。變量對(duì)應(yīng)的VIF 值變動(dòng)范圍為[1,1.84],所有的值均小于4。因此,可認(rèn)為提取出的5個(gè)變量之間不存在明顯的多重共線性問(wèn)題。
表1 變量的多重共線性結(jié)果和平行線假設(shè)檢驗(yàn)結(jié)果
平行線假設(shè)檢驗(yàn)用來(lái)分析在不同的空車(chē)率水平下,因素對(duì)空車(chē)率水平造成的影響是否發(fā)生改變。由表1可知,只有送客迂回程度(Cd)以及送客速度(vd)在0.05水平不顯著,服從平行線假設(shè),也就是說(shuō)這2個(gè)變量的系數(shù)將在不同的空車(chē)率水平下分別保持恒定。而其它3個(gè)變量違反了平行線假設(shè),在不同的空車(chē)率水平下,這3個(gè)變量產(chǎn)生的影響將發(fā)生變化。可能的解釋是送客迂回程度、送客速度因素對(duì)于不同的空車(chē)率水平造成了同等的影響,而其它3 個(gè)變量則會(huì)對(duì)多樣化空車(chē)率水平產(chǎn)生顯著的影響。因?yàn)镚MOL模型不需要嚴(yán)格遵循平行線假設(shè),故而上述結(jié)果亦證明了建立GMOL模型的必要性。
借助Stata 14.0軟件中的gologit2,求得對(duì)應(yīng)的GMOL 結(jié)果如表2所示。由于空車(chē)率水平有3種,因此,P(yi≤3)=1,表2中僅給出了P(yi≤1)和P(yi≤2)的結(jié)果。送客迂回程度、送客速度的系數(shù)在不同空車(chē)率水平下恒為0.115 8,-0.098 8。其它因素的系數(shù)的正負(fù)性保持一致,說(shuō)明這些因素對(duì)于空車(chē)率水平變化方向的影響恒定。
表2 不同空車(chē)率水平下的GMOL模型結(jié)果
對(duì)于尋客策略,增加尋客距離將會(huì)增加高空車(chē)率水平出現(xiàn)的概率,對(duì)于那些傾向于在距離上一個(gè)乘客下車(chē)點(diǎn)更遠(yuǎn)的地方搜尋下一個(gè)乘客的司機(jī)而言,他們更容易出現(xiàn)高空車(chē)率的情況,應(yīng)盡量縮短尋客距離。增加上車(chē)強(qiáng)度,會(huì)減少高空車(chē)率水平出現(xiàn)的概率,這表明高空車(chē)率水平的司機(jī)需要在那些熱門(mén)區(qū)域?qū)ふ蚁乱晃簧宪?chē)乘客。對(duì)于運(yùn)行/等待而言,選擇就地等待策略的司機(jī)會(huì)擁有更高的空車(chē)率水平,那么高空車(chē)率司機(jī)就需要多采取沿路開(kāi)車(chē)尋客的運(yùn)行策略來(lái)降低他們的空車(chē)率。
對(duì)于送客策略而言,減少送客的迂回程度、提高送客速度則會(huì)增加高空車(chē)率水平出現(xiàn)的概率。那么對(duì)于那些想提高送客效率的空車(chē)率水平較低的司機(jī)而言,他們需要采取合理的送客路徑規(guī)劃,或者選擇最短路徑去送客,或者選擇雖然路徑更為迂回但能夠保證良好的送客速度的道路,比如高架快速路。
結(jié)合上述計(jì)算結(jié)果,對(duì)于每一個(gè)空車(chē)率水平的概率的數(shù)學(xué)表達(dá)形式如下
從駕駛員行為角度入手,在司機(jī)的送客策略、尋客策略兩方面挖掘出了可能影響出租車(chē)空車(chē)率的5個(gè)因素,并基于GMOL模型,提出一種探究空車(chē)率及其影響因素之間關(guān)系的量化方法,得到結(jié)論如下。
(1)空車(chē)率的分布近似于正態(tài)分布。空車(chē)率的分布顯示大部分的上海市出租車(chē)空車(chē)率分布在中等水平,意味著上海市的總體空車(chē)率水平良好。
(2)不同的運(yùn)行策略會(huì)導(dǎo)致不同的空車(chē)率水平。高空車(chē)率水平的司機(jī)偏好遠(yuǎn)距離尋找乘客、不在熱門(mén)區(qū)域搜尋乘客、傾向于就地等待乘客、或者路徑選擇不好,選擇了又繞又堵的路徑送客。
(3)高、低空車(chē)率水平的司機(jī)需采取不同的運(yùn)行策略來(lái)平衡出租車(chē)運(yùn)行效率和乘客滿意度之間的矛盾。對(duì)于想降低空車(chē)率水平的司機(jī)而言,可采取以下策略:縮短尋客距離、采用運(yùn)行尋客策略、在需求熱門(mén)區(qū)域?qū)ふ页丝?。而?duì)于想提高送客效率、增加空車(chē)率水平的司機(jī)而言,則需要通過(guò)路徑選擇來(lái)減少重車(chē)時(shí)間占比。