董卜源
(上海交通大學安泰經(jīng)濟管理學院,上海 200030)
接單等待時間 TCR 是指從用戶下單時刻 TC 到配送員接單時刻 TR 的這段時間,是即時配送系統(tǒng)中一個非常重要的指標。訂單處理時間 TT 是接單等待時間 TCR,配送員取單時間 TRP 以及配送員送單時間 TPD 之和。
從用戶角度而言,接單等待時間是影響客戶體驗的重要部分,接單等待時間直接決定了即時配送訂單所需整體處理時間。用戶都希望所下訂單能被立即接單,對此有比較高的預期,因此其對接單等待時間也更為敏感。接單等待時間的控制對于平臺而言十分重要。從平臺角度而言,接單等待時間是配送運力供需平衡的結(jié)果。當客戶訂單較多,運力需求量大但是供給相對不足時,訂單需要等待較長時間才會被接單;相反,運力供給充足時,接單等待時間則會較短。從配送員的角度來看,接單等待時間能在一定程度上反應配送員對此類訂單的偏好程度,包括配送訂單的類型、配送距離、配送收入等。
圖1 即時配送訂單處理時間劃分
如上所述,接單等待時間的影響因素有很多,主要可以歸類為系統(tǒng)運力供給需求的平衡以及附近騎手對這個訂單的接單意愿兩個方面,本文將定量的探索各因素對接單等待時間的影響。
首先,配送系統(tǒng)中運力的供給可以用活躍騎手的數(shù)量R來表征。針對每個訂單i,只有這個訂單附近活躍的有效騎手數(shù)量可以被計算在運力供給中。對于每一個訂單i,我們統(tǒng)計其下單時刻TCi前一段時間t內(nèi)臨近區(qū)域出現(xiàn)的活躍騎手的數(shù)量,作為該訂單i附近的有效活躍騎手數(shù)量Ri。臨近區(qū)域則是指以訂單i的取單位置LPi為中心,以一定距離r為半徑做圓的區(qū)域。運力的需求用有效訂單數(shù)量D來表征。按與上述方法相同的,我們統(tǒng)計出訂單i附近區(qū)域內(nèi)的特定時段(TCi前一段時間t內(nèi))下單的其他訂單數(shù)量,記做Di。
配送員在決定是否接單時,通常會權(quán)衡訂單的完成難度和完成訂單能夠獲得的報酬。在本系統(tǒng)中運力來源形式為眾包,騎手沒有基本工資,騎手能夠獲得的報酬就是從每個訂單中獲取的配送費。騎手從訂單i中獲得的配送費由基礎配送費Feei、顧客小費Tipi和平臺補助Subi三部分組成。配送訂單的類型Type 和訂單的配送距離DDi直接影響到訂單的完成難度。
在研究中我們發(fā)現(xiàn),工作日和周末的接單等待時間存在明顯差異;另外在一天中也存在高峰與低谷,接單等待時間也會有明顯的波動,因此我們引入訂單發(fā)生在周幾Wi以及訂單生成時刻(當天中的第幾小時)Hi,作為控制變量。需要注意的是,Wi和Hi均是類別變量,在模型中我們將為其設置虛變量。
配送訂單的類型Type對接單等待時間的影響比較復雜,為了規(guī)避這種影響,我們將研究范圍限定在某特定配送類型中,以消除不同類型對接單等待時間的復雜影響。
基本研究模型如下:
TCRi=β0+β1Feei+β2Tipi+β3Subi+β4DDi+β5Ri+β6Di+β7Wi+β8Hi+Ei
(1)
研究數(shù)據(jù)來源于某即時配送平臺。該平臺是一個處在成長期的即時配送企業(yè),為客戶提供各種類型的即時配送服務以滿足客戶的多樣化的即時配送需求。配送類型 Type 包括隨意購、品牌外賣、同城快送、星巴克代購等。品牌外賣是指該平臺為合作的餐飲商家外賣訂單提供配送服務,從商家取餐后送至顧客要求的訂餐地址。隨意購則是顧客只指定購買某種商品,不指定特定購買地點,騎手可以就近選擇采購地址,然后送至顧客手中。相比品牌外賣,隨意購是一種非標準化的訂單。同城快送則是需要騎手從客戶手中取到包裹,然后送至指定地點。該平臺運力主要來源于眾包,騎手均非全職。
圖2 訂單量日分布及不同類型訂單占比
我們獲取了該即時配送平臺在某城市6個月的運營數(shù)據(jù),約有40萬條訂單記錄,均為實際完成訂單。就配送類型來看,超出60%的訂單為隨意購類型,接近30%為品牌外賣,同城快送占比不到10%,星巴克代購僅有少量訂單。不同類型的訂單配送難度也不相同。該平臺在該城市的日均單量在3千左右,日活躍騎手數(shù)量在800~1000名之間。人均日單量小于5單,這種情況也與兼職、眾包的運力模式相契合。
研究數(shù)據(jù)包涵訂單信息和配送信息兩方面內(nèi)容。訂單信息包括訂單號、配送員、訂單類型、訂單操作時刻(下單TCi、接單TRi、取單TPi、送達TDi)以及配送費用,其中包括基本的配送費用Feei、用戶給的小費Tipi以及平臺調(diào)度的補貼Subi。配送信息則主要記錄了配送員在完成某訂單i時接單、取單、送達的時刻和位置。其中時刻精確到秒,位置為經(jīng)緯度坐標。
我們先計算出每個訂單的接單等待時間 TCR。超過半數(shù)的訂單接單等待時間小于2分鐘,平均接單等待時間為3.5分鐘。接單等待時間與每小時訂單量的波動趨勢高度一致,系統(tǒng)中訂單越多,接單等待時間也相對變長。午高峰時,接單等待時間達到峰值,此時系統(tǒng)運力不足比較明顯。工作日與周末也存在明顯的差異,周末晚高峰運力不足的現(xiàn)象甚至比午高峰更突出,此時接單等待時間明顯比工作日同時段更長。
為了排除夜間等時段少量訂單帶來的偏差,我們將研究數(shù)據(jù)集中在白天訂單比較密集的時段。因此選定6、7、8三個月,下單時間從上午10時以后到晚上20時之前的訂單作為研究對象。同時我們舍棄了訂單類型為星巴克代購的訂單,該類型訂單占比極少。實際有效數(shù)據(jù)條數(shù)20余萬條。
訂單配送類型的影響較難量化。圖3-b中顯示了不同配送類型訂單一天中每小時平均接單等待時間波動的差異情況。通過對比我們可以發(fā)現(xiàn),品牌外賣的接單等待時間最短,隨意購類型接單等待時間平均比品牌外賣的多一分鐘左右,但是這兩種類型波動趨勢基本一致。同城快送訂單的接單等待時間與其他兩者存在較大差異,均值也大于其他兩者。通過方差分析,我們也可以清楚看到不同配送類型訂單的接單等待時間存在明顯差異。
圖3 平均接單等待時間分布
在接下來的回歸模型中,我們將剔除訂單類型的影響,只關(guān)注訂單配送類型為品牌外賣的訂單,降低問題的復雜程度。此類訂單標準化程度高,在總單量里約占30%,約5.2萬條記錄。接單平均等待時間均值為2.77分鐘,中位數(shù)0.73分鐘。
在計算附近活躍配送員數(shù)量Ri和訂單運力需求Di時,我們?nèi)∮唵蜗聠螘r刻前一段時間t=20 min以及附近距離r=3KM。使用如上數(shù)據(jù)回歸結(jié)果如下:
回歸模型的R方為0.093,也就是說所選取指標部分程度上可以對訂單接單等待時間進行解釋。除附近活躍配送員數(shù)量R不夠顯著外,其他因素均顯著。
從表中我們可以看出,訂單配送距離DD越短,基礎配送費Fee越高,訂單被接單的等待時間就越短?;A配送費每多1元錢,可以使接單等待時間減少0.02分鐘。
附近活躍配送員數(shù)量R越多,訂單量D越少,配送訂單就容易被更快接單。附近每多一個活躍騎手,接單等待時間會減少0.004分鐘;相反的,如果周圍每多一個訂單,接單等待時間則會延長0.025分鐘。需要注意的是,這里R與D表現(xiàn)出比較強的多重共線性。主要原因在于本文所用數(shù)據(jù)為實際成交訂單,缺失了因為運力不足而未滿足的訂單信息;同時活躍騎手的數(shù)量也是根據(jù)成交訂單推算而來,如果騎手上線但長時間空閑,則沒有納入統(tǒng)計。因此R與D均是強相關(guān)于實際成交訂單,所以兩者之間有較強的共線性。
表1 基本模型回歸結(jié)果
顧客小費Tip和平臺補貼Sub的結(jié)果則與我們的預期恰恰相反。兩者系數(shù)均為正值,也就是意味著,顧客小費和平臺補助越高,則訂單被接單的等待時間就越長。顯然這是與我們的認知相違背的。我們發(fā)現(xiàn)這里存在雙向因果導致的內(nèi)生性。接單等待時間過長,會刺激顧客增加消費以促使更快被接單,同時平臺對長時間未接的訂單增加官方補貼使其盡快被接單。也就是說接單等待時間會對小費和平臺補貼有同向的影響?;貧w所使用的數(shù)據(jù)為訂單被接單時顧客支付的消費和平臺給予的補貼,缺少變化的過程。因此得到的結(jié)果并不能夠真實的反應小費和補助對接單等待時間的影響。
上述結(jié)果中顯示回歸模型存在明顯的內(nèi)生性問題。顧客小費和平臺補貼作為影響因變量接單等待時間的主要因素,反過來又會被接單等待時間所影響,這種情況屬于內(nèi)生性問題中互為因果造成的內(nèi)生性問題。內(nèi)生性問題是指解釋變量和誤差項存在相關(guān)關(guān)系。內(nèi)生性的來源有許多種,其中包括遺漏變量偏差、選擇偏差、雙向因果、動態(tài)面板和測量誤差。內(nèi)生性問題的常用解決辦法主要有工具變量法和Heckman 兩階段模型。工具變量法的實質(zhì)是通過工具變量將存在內(nèi)生性問題的解釋變量分成外生部分和內(nèi)生部分兩部分。Heckman 兩階段模型主要是用來修正由于自選擇偏差和樣本選擇偏差造成的內(nèi)生性問題。
首先,本案例中模型的內(nèi)生性問題是在接單等待時間較長的情況下發(fā)生的。只有當接單等待時間較長時,會明顯增加消費者增加消費、平臺提高補貼的意愿。當接單等待時間較短的時候,消費者與平臺增加提高消費、補貼的意愿并不強烈。因此我們首先將進行分段回歸,首先選取接單等待時間較小的部分數(shù)據(jù)進行回歸,在這里我們?nèi)〗訂蔚却龝r間小于1分鐘的子樣本集進行回歸,其他設定不變?;貧w結(jié)果如下:
表2 接單等待時間較短的樣本子集回歸結(jié)果
從回歸結(jié)果中可以看出,當使用接單等待時間較小的子樣本進行回歸時,在原樣本回歸結(jié)果中發(fā)生的內(nèi)生性問題并沒有出現(xiàn)。此時顧客小費對接單等待時間的影響是負向的,也就是說小費越高,接單等待時間越短,與我們的認知所一致。平臺補貼表現(xiàn)為不顯著,因為接單等待時間較短時平臺很少會進行補貼,因此補貼這一項并不顯著。此外,用子樣本回歸時,除訂單量和配送員數(shù)量表現(xiàn)出強烈共線性之外,基礎配送費用和配送距離也存在共線性。
接下來我們回到原樣本集。本案例中數(shù)據(jù)存在缺失,因此給內(nèi)生新問題的處理帶來極大困難。原始數(shù)據(jù)缺少小費及補貼隨等待時間變化的過程,只有最終被接單時刻的數(shù)據(jù)。修正雙向因果造成的內(nèi)生性問題,工具變量法是最有效的。通過工具變量估計得到 的內(nèi)生解釋變量的擬合值替代內(nèi)生解釋變量,可以使擬合值與復合誤差項不相關(guān),即解決了雙向因果導致的內(nèi)生解釋變量與誤差項相關(guān)的問題。但是在本案例中由于初始小費以及小費增加次數(shù)數(shù)據(jù)的缺失,并沒有找到合適的工具變量。同時,Heckman兩階段模型并不適用于處理雙向因果造成的內(nèi)生性問題。
滯后變量模型(Lagged Variable)是經(jīng)濟學中解決內(nèi)生性問題的常用手段。滯后變量是具有滯后作用的變量。例如在消費函數(shù)中,本期消費不僅被本期收入所影響,還受到前期收入的影響。然而當我們引入內(nèi)生變量顧客小費Tip和平臺補貼Sub的前一期作為滯后變量,使用滯后變量模型回歸得到的結(jié)果也并不理想,對內(nèi)生性問題的解決沒有改善。
由于基礎配送費用、顧客消費、平臺補助、配送距離等解釋變量都是與每一條記錄一一對應的,我們主要通過改變附近活躍配送員數(shù)量Ri和訂單運力需求Di的計算方式,來進行穩(wěn)健性檢驗。附近活躍配送員數(shù)量Ri和訂單運力需求Di會隨著訂單下單時刻前一段時間t以及附近距離r的取值不同,有不同的計算結(jié)果。分別取附近距離r=3 KM、2KM以及時間t=30 min、20min、10min ,計算出不同條件下附近活躍配送員數(shù)量和訂單運力需求。各組回歸結(jié)果如下。
表3 時間t與距離r取值不同時的回歸結(jié)果
通過以上幾組回歸結(jié)果的對比,我們可以看到不同r與t取值得到的結(jié)論基本與原模型回歸結(jié)果保持一致。從運力供需平衡的角度看,附近活躍騎手越多,運力供給越充足,接單等待時間越短;配送需求的增加則會使得接單等待時間變長。從配送訂單配送距離越短以及基礎配送費越高的配送訂單,更收到配送員的青睞,接單等待時間就越短。小費與平臺補貼跟接單等待時間呈正相關(guān),同樣存在反向因果(互為因果)的內(nèi)生性問題。