馮蘇葦 林昌
(1.上海財(cái)經(jīng)大學(xué) 公共經(jīng)濟(jì)與管理學(xué)院,上海 200433;2.上海財(cái)經(jīng)大學(xué) 交通經(jīng)濟(jì)與政策研究中心,上海 200433)
算法個(gè)性化定價(jià)是指企業(yè)利用觀察、推斷或自愿提供收集到的個(gè)人消費(fèi)行為信息,估測出消費(fèi)者的支付愿意,進(jìn)而為不同的消費(fèi)者設(shè)定不同的價(jià)格[1]。其所產(chǎn)生的市場影響引發(fā)諸多爭議。支持者認(rèn)為,從市場自由出發(fā),企業(yè)應(yīng)該自由選擇各自的定價(jià)方法,包括有權(quán)向不同的客戶提供不同的價(jià)格,除非有令人信服的理由對(duì)其進(jìn)行監(jiān)管,否則應(yīng)該允許企業(yè)自由經(jīng)營[2];個(gè)性化定價(jià)在擴(kuò)大產(chǎn)出、促進(jìn)競爭和創(chuàng)造動(dòng)態(tài)激勵(lì)等方面也使消費(fèi)者受益[3]。反對(duì)者認(rèn)為,平臺(tái)企業(yè)利用算法制定產(chǎn)品或服務(wù)價(jià)格,產(chǎn)生價(jià)格軸輻合謀的現(xiàn)象,有損消費(fèi)者利益[4];在信息偏在、技術(shù)劣勢、監(jiān)管包容等因素疊加作用下,消費(fèi)者無力與互聯(lián)網(wǎng)企業(yè)相抗衡[5]。當(dāng)消費(fèi)者剩余被過度剝奪時(shí)需要政府進(jìn)行干預(yù)糾偏[6]。由于算法個(gè)性化定價(jià)會(huì)留下數(shù)據(jù)痕跡,反壟斷部門是否要進(jìn)行干預(yù),可以利用前沿的統(tǒng)計(jì)分析工具對(duì)交易大數(shù)據(jù)進(jìn)行研判以尋找證據(jù)。
本文從網(wǎng)約車乘客違約率居高不下的現(xiàn)象出發(fā),探討算法個(gè)性化定價(jià)對(duì)乘客違約率的影響機(jī)制,通過多種歸納學(xué)習(xí)算法進(jìn)行數(shù)據(jù)挖掘,識(shí)別乘客是否履約的關(guān)鍵特征。網(wǎng)約車約車步驟包括:①乘客發(fā)起預(yù)約請求;②平臺(tái)響應(yīng)并匹配車輛,向司機(jī)派發(fā)訂單;③平臺(tái)向乘客反饋行程金額、行程時(shí)間等信息,由乘客對(duì)訂單進(jìn)行最后的確認(rèn)。在此過程中,如乘客立即拒絕或事后取消預(yù)約,則整個(gè)交易過程即告失敗。相比傳統(tǒng)出租車,網(wǎng)約車乘客在下單過程中履(違)約率相對(duì)較低(高),過多的乘客毀約、違約行為將極大影響平臺(tái)的運(yùn)行效率,引發(fā)復(fù)雜的連鎖反應(yīng)。違約率與個(gè)性化定價(jià)不透明、要價(jià)過高及算法預(yù)測不準(zhǔn)確等因素有關(guān),也與乘客行程距離、平均候車時(shí)間顯著負(fù)相關(guān)[7]?,F(xiàn)有研究關(guān)注如何設(shè)計(jì)懲罰策略以提高平臺(tái)收益[8],算法個(gè)性化定價(jià)與乘客履約率之間的關(guān)聯(lián)性有待進(jìn)一步研究。
供需匹配算法及動(dòng)態(tài)定價(jià)策略是網(wǎng)約車平臺(tái)運(yùn)營的兩項(xiàng)關(guān)鍵技術(shù)[9]。現(xiàn)有研究構(gòu)建定價(jià)策略模型,探索如何通過價(jià)格調(diào)節(jié)手段實(shí)現(xiàn)司乘快速匹配[10-13],提高平臺(tái)運(yùn)營效率,節(jié)省客戶等待時(shí)間,實(shí)現(xiàn)司乘及平臺(tái)利益最大化,但較少涉及算法個(gè)性化定價(jià)所導(dǎo)致的價(jià)格歧視、消費(fèi)行為變化乃至市場影響。傳統(tǒng)出租車服務(wù)結(jié)束后按計(jì)價(jià)器顯示的金額結(jié)算,交易過程公開透明、便于監(jiān)管[14-15];而平臺(tái)則以保護(hù)商業(yè)秘密為由,不主動(dòng)公開定價(jià)規(guī)則[16],算法“黑箱”不利于市場監(jiān)管。隨著特征工程和前沿算法的推進(jìn),利用大數(shù)據(jù)挖掘平臺(tái)交易規(guī)則和算法,分析算法個(gè)性化定價(jià)產(chǎn)生的市場影響,并對(duì)平臺(tái)價(jià)格歧視與乘客履約率之間的因果關(guān)系進(jìn)行建模,將使算法“黑箱”和交易規(guī)則透明化,有助于維護(hù)消費(fèi)者知情權(quán),營造誠實(shí)守信的經(jīng)營環(huán)境,有利于網(wǎng)約車平臺(tái)的可持續(xù)經(jīng)營。
本文關(guān)注的問題是,當(dāng)網(wǎng)約車平臺(tái)響應(yīng)乘客的預(yù)約請求,反饋行程金額、行程時(shí)間等訂單信息后,乘客在何種條件下將完成交易或取消預(yù)約,以及哪些因素會(huì)影響乘客的選擇,從而解釋網(wǎng)約車乘客違約率居高不下的現(xiàn)象。首先建立一個(gè)網(wǎng)約車平臺(tái)競爭模型,描述個(gè)性化定價(jià)策略對(duì)消費(fèi)者決策的影響機(jī)制;其次,利用某網(wǎng)約車平臺(tái)百萬級(jí)大數(shù)據(jù)信息,采用Bhattacharyya 距離、提升決策樹、改進(jìn)拉斯維加斯方法等前沿算法對(duì)乘客履約率的影響因素進(jìn)行實(shí)證分析。由此可找出影響乘客決定購買網(wǎng)約車服務(wù)的關(guān)鍵因素,揭示網(wǎng)約車平臺(tái)定價(jià)、運(yùn)營規(guī)則對(duì)乘客消費(fèi)行為所產(chǎn)生的影響,使公眾更清楚地了解網(wǎng)約車服務(wù)背后的運(yùn)作規(guī)則,也為政府部門對(duì)網(wǎng)約車監(jiān)管提供分析工具和評(píng)判參考。
1929年線性Hotelling模型[17]被首次提出,用于研究產(chǎn)品差異化情形下各廠商的價(jià)格策略。由于直線形市場存在邊界性,線性Hotelling模型的可解析性隨著博弈方數(shù)量的增加而減小,且不容易存在均衡解。1979 年,Salop[18]提出環(huán)形Hotelling 博弈模型(即Salop 模型),其可以求解兩個(gè)及兩個(gè)以上對(duì)象之間的博弈。近年來,Salop 模型被廣泛應(yīng)用于雙邊市場競爭博弈、定價(jià)、交叉網(wǎng)絡(luò)外部性以及用戶歸屬問題[19-20]。相關(guān)研究發(fā)現(xiàn),歧視定價(jià)對(duì)平臺(tái)利潤的影響取決于用戶網(wǎng)絡(luò)外部性的大?。?1],隨機(jī)需求和不同競爭情形下最優(yōu)價(jià)格可以有效調(diào)控平臺(tái)供應(yīng)能力[22]。演化博弈方法亦被應(yīng)用于分析網(wǎng)約車平臺(tái)的補(bǔ)貼政策和服務(wù)質(zhì)量如何影響乘客服務(wù)類型選擇[23]。
為了探尋網(wǎng)約車平臺(tái)個(gè)性化定價(jià)與乘客違約率之間的關(guān)聯(lián)性,本節(jié)在兩種服務(wù)競爭的矩形Hotelling 模型基礎(chǔ)上,建立兩個(gè)網(wǎng)約車平臺(tái)之間的Stackelberg 博弈模型,揭示個(gè)性化定價(jià)如何影響乘客(用戶)履約率及其影響因素。考慮兩個(gè)網(wǎng)約車平臺(tái),分別為優(yōu)勢平臺(tái)(主導(dǎo)者)與劣勢平臺(tái)(跟隨者),用戶(c)和司機(jī)(d)均為單屬性,根據(jù)各自的效用決策使用哪個(gè)網(wǎng)約車平臺(tái)提供的服務(wù)。完成訂單后,用戶支付給網(wǎng)約車平臺(tái)的服務(wù)價(jià)格為p,無需再支付傭金,司機(jī)支付給平臺(tái)的傭金率為θ,即司機(jī)每單需支付給平臺(tái)θp的傭金。
本節(jié)采用兩種服務(wù)競爭的矩形Hotelling 模型(Salop 模型),且不考慮交叉外部性。用戶和司機(jī)的數(shù)量歸一化為1,對(duì)平臺(tái)的估值分別為vc和vd,服從(0,1)區(qū)間上的均勻分布。用戶和司機(jī)效用分別為和,只有當(dāng)時(shí),用戶和司機(jī)才會(huì)選擇網(wǎng)約車平臺(tái)的服務(wù),并且用戶在所考慮的區(qū)域和時(shí)段行程相同。靜態(tài)均衡分析時(shí)假設(shè)兩個(gè)平臺(tái)的價(jià)格滿足p1≤p2。
假設(shè)用戶和司機(jī)分布在正方形的邊上(見圖1),他們對(duì)平臺(tái)服務(wù)存在偏好異質(zhì)性并且對(duì)兩個(gè)平臺(tái)的偏好程度用4條邊的坐標(biāo)表示。比如,A(0,0)表示兩個(gè)平臺(tái)都不選擇,B(0,1)表示選擇平臺(tái)2,C(1,0)表示選擇平臺(tái)1,D(1,1)表示兩個(gè)平臺(tái)都選擇,AB邊或AD邊上分布的是對(duì)平臺(tái)2 或1 的忠實(shí)用戶或司機(jī),則兩個(gè)平臺(tái)的競爭情景表現(xiàn)為正方形邊上的用戶和司機(jī)的密度。設(shè)兩個(gè)平臺(tái)的競爭強(qiáng)度為τ,AB邊和AD邊表示兩個(gè)平臺(tái)的忠實(shí)用戶和司機(jī)的密度為1 (2 + 2τ),CD邊和BC邊的密度為τ(2 + 2τ)。
圖1 矩形Hotelling模型Fig.1 Rectangular Hotelling model
在AD邊上,用戶或司機(jī)選擇平臺(tái)1 而不選擇平臺(tái)2,即滿足U1=v1-p1> 0,此時(shí)效用均衡點(diǎn)v1=p1。在AB邊上,用戶或司機(jī)選擇平臺(tái)2而不選擇平臺(tái)1,即滿足U2=v2-p2> 0,此時(shí)效用均衡點(diǎn)v2=p2。在BC邊上,用戶或司機(jī)必然選擇平臺(tái)2,如果部分人選擇平臺(tái)1,即滿足U1=v1-p1>U2=v2-p2,不妨設(shè)v2= 1,此時(shí)效用均衡點(diǎn)v1= 1 +p1-p2。在CD邊上,用戶或司機(jī)必然選擇平臺(tái)1,如果部分人選擇平臺(tái)2,即滿足U1=v1-p1
下面考慮交叉網(wǎng)絡(luò)外部性。乘客選擇網(wǎng)約車平臺(tái)時(shí)考慮的因素包括平臺(tái)對(duì)打車需求的回應(yīng)速度、備選司機(jī)數(shù)量及其服務(wù)質(zhì)量等,這些與平臺(tái)粘合的司機(jī)數(shù)量和素質(zhì)有關(guān);類似地,司機(jī)在選擇平臺(tái)時(shí)也會(huì)考慮平臺(tái)乘客多寡以減少等待的時(shí)間成本。在矩形Hotelling模型中引入交叉網(wǎng)絡(luò)外部性[24],即在交易過程中,平臺(tái)每增加一個(gè)司機(jī)給用戶增加的效用為αc,每增加一個(gè)用戶給司機(jī)增加的效用為αd。假設(shè)用戶和司機(jī)的邊際效用無差異均為α,因此用戶和司機(jī)在完成一個(gè)交易過程中會(huì)獲得的交叉網(wǎng)絡(luò)外部性效用為和,其中和分別為第i個(gè)平臺(tái)司機(jī)和用戶的人數(shù)。則用戶的效用為,司機(jī)的效用為。兩個(gè)網(wǎng)約車平臺(tái)的用戶分布分別為
兩個(gè)網(wǎng)約車平臺(tái)的司機(jī)分布分別為
平臺(tái)的利潤函數(shù)為
采用逆向求解法求平臺(tái)的最優(yōu)值。第1步,聯(lián)立式(2)-(5),解出兩個(gè)平臺(tái)對(duì)應(yīng)的用戶和司機(jī)分布為
其中:
第3步,求出兩個(gè)平臺(tái)的最優(yōu)利潤,此時(shí)它們均與參數(shù)α、θ、τ、ci有關(guān):
其中,最優(yōu)用戶和司機(jī)數(shù)量分別為
下面采用比較靜態(tài)分析找出用戶違約行為的發(fā)生條件。當(dāng)平臺(tái)1提供的服務(wù)合意時(shí),用戶選擇平臺(tái)1 完成出行;否則選擇平臺(tái)2。平臺(tái)服務(wù)合意的因素包括價(jià)格合理、質(zhì)量有保證、服務(wù)及時(shí)和提供多種選項(xiàng)等。假設(shè)兩個(gè)平臺(tái)提供的服務(wù)質(zhì)量一致,而服務(wù)及時(shí)、選項(xiàng)多元等因素由交叉網(wǎng)絡(luò)外部性中的司機(jī)數(shù)量決定,則服務(wù)合意的影響因素主要由價(jià)格和交叉網(wǎng)絡(luò)外部性決定。當(dāng)時(shí),用戶選擇平臺(tái)1,即,若,則有,該不等式在p1
根據(jù)上述分析,假設(shè)平臺(tái)1 進(jìn)行歧視性定價(jià),當(dāng)價(jià)格p1高于p2時(shí),由于價(jià)格上漲所導(dǎo)致的平臺(tái)1用戶流失比率定義為訂單違約率。在均衡狀態(tài),它與兩個(gè)平臺(tái)相互競爭下的參數(shù)α、θ、τ、ci有關(guān)。比如,在其他參數(shù)不變的條件下,競爭強(qiáng)度τ對(duì)乘客違約率的影響如圖2所示,縱軸表示單位價(jià)格上漲所導(dǎo)致的用戶違約率,橫軸表示競爭強(qiáng)度τ。可以看出,隨著競爭強(qiáng)度加大,兩個(gè)平臺(tái)提供的服務(wù)趨于同質(zhì)化,乘客在平臺(tái)之間選擇的替代性減少,違約率降低;而隨著競爭強(qiáng)度降低,違約率在[25%,50%]區(qū)間內(nèi)變化,即相應(yīng)的履約率(等于1-違約率)極大值為75%,極小值為50%。上述分析表明,優(yōu)勢平臺(tái)的價(jià)格歧視會(huì)導(dǎo)致用戶對(duì)訂單的違約率上升,過高的定價(jià)使得用戶選擇其他平臺(tái)或采用其他出行方式,用戶最終的決定取決于兩個(gè)平臺(tái)交叉網(wǎng)絡(luò)外部性之差與價(jià)格差之間的權(quán)衡。
圖2 乘客違約率與競爭強(qiáng)度的關(guān)系Fig.2 Relationship between passengers’ order cancellation rate and competition intensity
本節(jié)在理論分析的基礎(chǔ)上,以國內(nèi)某知名網(wǎng)約車平臺(tái)公開的真實(shí)訂單數(shù)據(jù)為研究對(duì)象,采用前沿的特征工程方法對(duì)算法個(gè)性化定價(jià)與乘客履約或取消訂單行為之間的關(guān)聯(lián)性進(jìn)行實(shí)證分析:首先采用過濾法中的Bhattacharyya 距離判斷每一特征類別的可分程度,然后以提升決策樹(GBDT)為基分類器、對(duì)包裹法中的拉斯維加斯方法加以改進(jìn),識(shí)別出決定乘客是否履行預(yù)約訂單的關(guān)鍵統(tǒng)計(jì)特征,即篩選出乘客履(違)約率的影響因素。
所采用的數(shù)據(jù)來自國內(nèi)某知名網(wǎng)約車平臺(tái)2018年的公開數(shù)據(jù)集,共含988 175 條訂單記錄,每條記錄包含訂單id、司機(jī)id、乘客id,訂單創(chuàng)建日期與時(shí)間、訂單狀態(tài),預(yù)估行程金額、距離和時(shí)間,起點(diǎn)和終點(diǎn)區(qū)域id 等11 個(gè)字段。其中訂單預(yù)約未成功242 838條,預(yù)約取消183 824條,實(shí)際完成交易561 513條?!靶谐探痤~”顯示平均價(jià)格為75.52元,99%以上的數(shù)據(jù)分布在15~500 元區(qū)間。定義“訂單履約率”指標(biāo)為實(shí)際完成交易的訂單數(shù)/預(yù)約取消和實(shí)際完成交易的訂單數(shù),計(jì)算可得75.3%,即每4張派單便會(huì)發(fā)生1次違約。
乘客履約與否問題屬于典型的二分類問題,即依據(jù)特征將數(shù)據(jù)分為是與否兩類,或稱正類與反類。本節(jié)分3步進(jìn)行特征篩選。
(1)屬性構(gòu)造:根據(jù)訂單記錄所提供的信息內(nèi)容,構(gòu)造出多組與所討論問題相關(guān)的屬性,具體操作參見文獻(xiàn)[25]。
(2)特征初篩:采用過濾法中的Bhattacharyya距離進(jìn)行初步的特征篩選。Bhattacharyya 距離JB是一種基于概率分布的可分性判據(jù),直接考查某一特征下兩類樣本的概率分布情況,其定義為
其中,Pr(x|wi)(i= 1,2)為類條件密度,即連續(xù)隨機(jī)變量x在類別狀態(tài)為w時(shí)的概率密度函數(shù)。當(dāng)兩類概率密度函數(shù)完全重合時(shí),JB= 0;而兩類概率密度函數(shù)分離程度越高,JB越大,當(dāng)兩類概率密度函數(shù)完全不相交時(shí),JB= ∞。
(3)特征終篩:在完成過濾式特征選擇后,以GBDT 為基分類器,采用包裹法進(jìn)行最終的特征篩選。提升決策樹是機(jī)器學(xué)習(xí)及大數(shù)據(jù)分析中性能最好的方法之一,而包裹法直接把最終采用的學(xué)習(xí)器的性能作為特征子集的評(píng)價(jià)準(zhǔn)則,因此所選擇的特征最有利于提升學(xué)習(xí)器的性能。
包裹式特征選擇通??刹捎们跋?后向貪婪搜索策略或拉斯維加斯方法、遺傳算法等作為框架,但在特征選擇過程中需多次訓(xùn)練學(xué)習(xí)器,計(jì)算量非常大。拉斯維加斯方法使用隨機(jī)策略進(jìn)行子集搜索,能較好地避開局部最優(yōu)解,但在給定時(shí)間內(nèi)不一定能給出滿足要求的解。為此,本節(jié)對(duì)其搜索策略進(jìn)行改進(jìn),改進(jìn)的拉斯維加斯方法描述如下。
第1步 輸入數(shù)據(jù)集D、特征集A、停止條件控制參數(shù)T。
第2步 初始化特征集的權(quán)值分布wi= 0.5,i= 1,2,…,d,d為特征集維數(shù)。
第3步 設(shè)定初始值,令學(xué)習(xí)誤差E= ∞,特征子集A*=A,迭代次數(shù)t=0。
第4步 當(dāng)t ①依權(quán)值分布wi的概率產(chǎn)生特征子集A′; ②通過交叉驗(yàn)證,計(jì)算出基類學(xué)習(xí)算法L在特征子集上所產(chǎn)生的學(xué)習(xí)誤差E′= CV(L(DA′)),其中CV代表交叉驗(yàn)證過程; ③如果E′ ④否則,令t=t+1;循環(huán)結(jié)束,并輸出A*。 當(dāng)包裹法以GBDT 為基學(xué)習(xí)器時(shí),可極大地提高特征的搜索效率。GBDT的目標(biāo)函數(shù)定義為 式(16)第1 項(xiàng)中,n為數(shù)據(jù)集樣本數(shù),損失函數(shù)用來衡量預(yù)測值與真實(shí)值yi之間的誤差,對(duì)于二分類問題,通常選用負(fù)對(duì)數(shù)似然函數(shù)(或交叉熵)為損失函數(shù)。第2項(xiàng)為正則化項(xiàng),其中K為決策樹個(gè)數(shù),Tk′為每棵決策樹的葉節(jié)點(diǎn)數(shù),wk′為葉節(jié)點(diǎn)權(quán)值的集合,γ、λ為經(jīng)驗(yàn)常數(shù)。正則化項(xiàng)對(duì)特征進(jìn)行了“稀疏約束”(即使特征的非零分量盡量減少),由此使GBDT 在訓(xùn)練過程中也能自動(dòng)進(jìn)行特征選擇。訓(xùn)練過程可直接統(tǒng)計(jì)每個(gè)特征被選中的頻次,并計(jì)算出其在優(yōu)化目標(biāo)函數(shù)時(shí)所帶來的增益,因此可對(duì)每個(gè)特征所起的作用直接進(jìn)行量化評(píng)估,這非常有利于特征選擇。 應(yīng)用2.1 節(jié)的特征工程方法共篩選出17 維特征。為驗(yàn)證所選擇特征的準(zhǔn)確性,本節(jié)利用這17 維特征來訓(xùn)練一個(gè)包含5 000 個(gè)決策樹的GBDT分類器。訓(xùn)練過程中采用8折交叉驗(yàn)證的方法,將988 175條訂單記錄分為8等份,每次依次取出1份數(shù)據(jù)作為校驗(yàn)數(shù)據(jù),其余7 份數(shù)據(jù)作為訓(xùn)練數(shù)據(jù)。為衡量分類結(jié)果的準(zhǔn)確性,本節(jié)以AUC(Area Under ROC Curve)指標(biāo)來度量分類結(jié)果。AUC非常適用于評(píng)價(jià)求解二分類問題時(shí)的分類器性能,在概率意義上可理解為:對(duì)于二分類問題,任取一對(duì)正例與負(fù)例,分類器給正例的打分大于負(fù)例得分的概率;取值范圍在0~1之間,AUC值越大,分類結(jié)果越好。 以8 次交叉驗(yàn)證的AUC 平均值作為最后的結(jié)果,最終分類結(jié)果AUC=0.985。一般情況考慮二分類問題并取閾值0.5,總分類準(zhǔn)確率大于97.1%,表明本文應(yīng)用所選特征可對(duì)乘客履約與否的情況作出準(zhǔn)確的劃分。所篩選出的17 維特征按其屬性可分為6 類,表1 給出了具體的類別信息及每組特征的重要程度。其中,每組特征的重要程度以其在優(yōu)化目標(biāo)函數(shù)時(shí)所帶來增益作為衡量,以百分比表示。 表1 決定履約率的關(guān)鍵特征及其重要程度Table 1 Key features of determining compliance rates and their importance 借助所選特征,可對(duì)乘客取消預(yù)約的行為作出準(zhǔn)確合理的解釋,主要有以下研究發(fā)現(xiàn): (1)運(yùn)價(jià)是影響履約率的最重要因素,直接因素包括訂單金額和行程單價(jià),間接因素包括行程距離和時(shí)間。從表1可看出,訂單金額的重要程度為42.812%,居第1 位,行程單價(jià)的重要程度為42.140%,占第2 位,表明乘客對(duì)價(jià)格因素非常敏感。圖3 顯示隨著訂單金額增加,乘客履約率從75%下降到50%以下。 圖3 訂單履約率與訂單金額之間的關(guān)系Fig.3 Relationship between order compliance rate and order amount 由于傳統(tǒng)出租車定價(jià)由計(jì)價(jià)器給出,具有較好的公信力,而網(wǎng)約車定價(jià)由算法決定,相對(duì)不透明而使乘客對(duì)其缺乏信任,因此網(wǎng)約車平臺(tái)通過合理定價(jià)取得乘客的信任是促成交易的關(guān)鍵因素。在決定履約率的關(guān)鍵特征中,訂單金額的重要程度排第1 位,也恰好驗(yàn)證了這一點(diǎn)。此外,表1 中行程單價(jià)類特征包括司機(jī)平均每千米運(yùn)價(jià)(代表車型)及每張訂單中行程距離/行程金額等特征。圖4橫坐標(biāo)為行程單價(jià)的倒數(shù),其含義為每元可搭乘的公里數(shù),隨著行程單價(jià)的增加,履約率從90%下降到40%(從右向左)。由于行程單價(jià)直接影響總金額的大小,因此也會(huì)較大程度影響乘客的履約率。 圖4 訂單履約率與訂單單價(jià)倒數(shù)之間的關(guān)系Fig.4 Relationship between order compliance rate and reciprocal of order unit price 另外,對(duì)運(yùn)價(jià)有直接貢獻(xiàn)的行程距離、時(shí)間等也會(huì)間接影響乘客履約率。隨著行程距離的增加(等同于行程時(shí)間增加),訂單履約率逐步下降。以上與運(yùn)價(jià)直接或間接相關(guān)的3類因素,其重要程度相加達(dá)到89.457%,因此可認(rèn)為乘客消費(fèi)行為的決定因素中90%可以由運(yùn)價(jià)來解釋,即運(yùn)價(jià)的高低決定了乘客履約與否的決策。 (2)用車需求的時(shí)空不均衡程度也會(huì)影響乘客履約率。表1中訂單時(shí)間類特征(包含日期、星期、時(shí)段等屬性)反映了用車需求在時(shí)間上的分布不均衡狀態(tài),圖5 顯示履約率與約車時(shí)段之間的關(guān)系(橫軸的數(shù)值表示時(shí)段,如0 代表[00:00,01:00)時(shí)段,依此類推),在04:00—06:00、08:00—09:00和21:00—24:00 時(shí)段乘客有超過30%的概率取消預(yù)約。分析發(fā)現(xiàn),在這些時(shí)段運(yùn)營的車輛最少或乘車的需求劇增,致使乘客重復(fù)預(yù)約與取消,造成履約率下降。例如,將“各時(shí)段的乘車需求數(shù)”減去“所有時(shí)段平均乘車需求數(shù)”,取其絕對(duì)值,這一數(shù)值反映了乘車需求的波動(dòng)情況。計(jì)算這一數(shù)值與履約率之間的相關(guān)系數(shù),得到的數(shù)值為-0.68,說明乘車需求的急劇變化與履約率之間呈現(xiàn)顯著的負(fù)相關(guān)關(guān)系。在高峰時(shí)段乘客向多個(gè)平臺(tái)發(fā)起預(yù)約請求,假如這些請求中有2個(gè)及以上得到響應(yīng),此時(shí)用戶就必須取消多余的申請(即至少發(fā)生1 次違約),從而造成履約率下降。此外,熱點(diǎn)區(qū)域的訂單履約率低于非熱點(diǎn)區(qū)域,原因在于約車成功率下降及候車時(shí)間增長導(dǎo)致履約率的下降。因此表1中第4和第5類因素實(shí)際上反映了履約率的時(shí)空特性,對(duì)乘客的最終消費(fèi)選擇也有較大的影響。如果以優(yōu)化目標(biāo)函數(shù)來衡量,可帶來8.8%的增益,效果顯著。 圖5 訂單履約率與約車時(shí)段之間的關(guān)系Fig.5 Relationship between order compliance rate and taxihailing period (3)乘客消費(fèi)信息(包含乘客累計(jì)消費(fèi)次數(shù)、消費(fèi)金額等特征)也會(huì)正向影響履約率。圖6 顯示隨著乘客累積預(yù)約次數(shù)的增加,訂單履約率從72%逐步上升至82%。乘客累積預(yù)約次數(shù)越多,消費(fèi)金額越高,與網(wǎng)約車平臺(tái)之間建立的信任關(guān)系就越強(qiáng),這可以解釋“常乘客”比新乘客訂單履約率更高的現(xiàn)象。 圖6 訂單履約率與乘客累積預(yù)約次數(shù)之間的關(guān)系Fig.6 Relationship between order compliance rate and accumulated passenger appointment times 網(wǎng)約車是最早實(shí)施算法個(gè)性化定價(jià)的商業(yè)領(lǐng)域,平臺(tái)通過算法挖掘比對(duì)多源數(shù)據(jù)得到用戶個(gè)人信息和歷史消費(fèi)行為,使價(jià)格與消費(fèi)者的支付意愿相關(guān)聯(lián),不再基于供求關(guān)系所反映的價(jià)格規(guī)律,其所導(dǎo)致的信息不對(duì)稱、自然壟斷與算法共謀乃至對(duì)社會(huì)公平的沖擊,使得政府規(guī)制具有必要性。本文借助網(wǎng)約車平臺(tái)的交易大數(shù)據(jù),通過構(gòu)建機(jī)理模型和數(shù)據(jù)挖掘分析平臺(tái)定價(jià)與乘客違約行為之間的關(guān)聯(lián)性,發(fā)現(xiàn)乘客在平臺(tái)上的最終消費(fèi)選擇主要取決于價(jià)格因素,而改進(jìn)車輛匹配、派單策略,減少乘客候車時(shí)間可顯著提高訂單履約率。 與以往文獻(xiàn)相比,本文的發(fā)現(xiàn)在動(dòng)態(tài)定價(jià)、顧客畫像、反不正當(dāng)競爭和算法監(jiān)管等方面具有政策價(jià)值,具體表現(xiàn)為:首先,從表面上看違約率是用戶對(duì)合約的違背行為,但一定程度上是消費(fèi)者在不合理定價(jià)下對(duì)自身利益的維護(hù),因此違約率可以作為檢測指標(biāo)監(jiān)控個(gè)性化定價(jià)的偏移程度,為平臺(tái)定價(jià)的監(jiān)管提供依據(jù);其次,適度的個(gè)性化定價(jià)有利于提高社會(huì)福利,但平臺(tái)經(jīng)濟(jì)的可持續(xù)發(fā)展還有賴于合理定價(jià)、增進(jìn)雙邊市場的粘性、提高信息撮合效率、營造三方誠信的交易環(huán)境,研究結(jié)果證明了培養(yǎng)用戶使用習(xí)慣與提高訂單履約率之間呈現(xiàn)正向相關(guān)的特性,因此平臺(tái)應(yīng)通過制定合理的定價(jià)策略,保持供需雙方的平衡,提高其相互依賴程度,營造交易三方誠實(shí)守信的氛圍;此外,隨著數(shù)據(jù)挖掘技術(shù)的進(jìn)步,利用交易數(shù)據(jù)反推交易規(guī)則的算法日趨成熟,為算法監(jiān)管提供了實(shí)時(shí)管理工具。本文采用多種算法有效解析了平臺(tái)定價(jià)和交易規(guī)則,應(yīng)用算法找出決定問題的關(guān)鍵特征,在此基礎(chǔ)上進(jìn)行數(shù)值分析,從而實(shí)現(xiàn)對(duì)平臺(tái)運(yùn)營狀況的監(jiān)控與預(yù)測,所采用的多種數(shù)據(jù)分析方法可為相關(guān)理論研究及政府監(jiān)管提供重要的技術(shù)參考。除了平臺(tái)和司機(jī)營收和用戶違約率等指標(biāo)外,監(jiān)管者可以將大數(shù)據(jù)和相關(guān)算法作為管理工具,有效提升對(duì)復(fù)雜管理問題的回應(yīng)性和數(shù)據(jù)輔助決策水平。 當(dāng)前日益成熟的數(shù)據(jù)挖掘技術(shù)有利于探索平臺(tái)算法個(gè)性化定價(jià)的內(nèi)在規(guī)律,為市場監(jiān)管提供科學(xué)依據(jù),然而,算法個(gè)性化定價(jià)與乘客行為之間的相互影響機(jī)制還需要更精確的建模與仿真。如何將數(shù)據(jù)挖掘結(jié)果與機(jī)理建模更好地結(jié)合起來,也是今后進(jìn)一步研究的方向。2.2 結(jié)果分析
3 結(jié)論