摘 要:車(chē)貨匹配平臺(tái)中存在著大量的車(chē)貨信息,通過(guò)對(duì)歷史數(shù)據(jù)的分析和處理,能夠預(yù)測(cè)司機(jī)點(diǎn)擊貨物的概率(司機(jī)點(diǎn)擊率預(yù)測(cè)),從而為司機(jī)推薦貨物。據(jù)了解,目前還沒(méi)有研究項(xiàng)目將點(diǎn)擊率預(yù)測(cè)與車(chē)貨匹配結(jié)合起來(lái),更不要說(shuō)基于此來(lái)考慮車(chē)貨信息中的興趣序列和特征交互問(wèn)題。因此,在車(chē)貨匹配的背景下,文章提出了一種考慮興趣序列和特征交互的司機(jī)點(diǎn)擊率預(yù)測(cè)模型——深度興趣交互網(wǎng)絡(luò)(Deep Interest Interaction Network,DIIN)。一方面,在司機(jī)興趣抽取模塊中利用Bi-GRU和SENet從司機(jī)的歷史行為中推斷出司機(jī)的興趣點(diǎn);另一方面,在車(chē)貨特征交互模塊中利用FM和ResNet同時(shí)建模低階和高階特征交互。通過(guò)對(duì)某車(chē)貨匹配平臺(tái)的數(shù)據(jù)集進(jìn)行實(shí)驗(yàn),結(jié)果表明模型DIIN與基準(zhǔn)模型相比具有更好的性能,即使與DIEN模型相比,在AUC和LogLoss兩個(gè)評(píng)價(jià)指標(biāo)上,模型DIIN分別提升了3.5個(gè)百分點(diǎn)和1.8個(gè)百分點(diǎn)。這不僅證明了將深度學(xué)習(xí)和點(diǎn)擊率預(yù)測(cè)用于車(chē)貨匹配的可行性,也證明了挖掘歷史數(shù)據(jù)中的序列關(guān)系和特征交互有助于預(yù)測(cè)車(chē)貨匹配中司機(jī)點(diǎn)擊貨物的概率。
關(guān)鍵詞:車(chē)貨匹配;深度學(xué)習(xí);點(diǎn)擊率預(yù)測(cè);雙向門(mén)控循環(huán)單元;擠壓和激勵(lì)網(wǎng)絡(luò)
中圖分類號(hào):F5;TP391.1 文獻(xiàn)標(biāo)志碼:A DOI:10.13714/j.cnki.1002-3100.2024.06.017
Abstract: There is a large amount of vehicle cargo information in the vehicle cargo matching platform. By analyzing and processing historical data, it is possible to predict the probability of drivers clicking on goods (driver click-through rate prediction), thereby recommending goods to drivers. It is understood that there is currently no research combining click-through rate prediction with vehicle cargo matching, let alone considering the issue of interest sequences and feature interactions in vehicle cargo information based on this. Therefore, in the context of vehicle cargo matching, the paper proposes a driver click-through rate prediction model that considers interest sequences and feature interactions—Deep Interest Interaction Network (DIIN). On the one hand, in the driver interest extraction module, Bi-GRU and SENet are used to infer driver interest points from the driver's historical behavior. On the other hand, in the vehicle cargo feature interaction module, FM and ResNet are used to simultaneously model low order and high-order feature interactions. Through experiments on a dataset of a vehicle cargo matching platform, the results show that the model DIIN has better performance compared to the benchmark mode. Compared with the DIEN model, the AUC and LogLoss evaluation indicators have increased by 3.5 percentage points and 1.8 percentage points, respectively. This not only proves the feasibility of using deep learning and click-through rate prediction for vehicle cargo matching, but also proves that mining sequence relationships and feature interactions in historical data can help predict the probability of drivers clicking on goods in vehicle cargo matching.
Key words: vehicle-cargo matching; deep learning; click-through rate prediction; bidirectional gated recurrent unit; squeeze-and-excitation networks
0" " 引" " 言
車(chē)貨匹配是基于車(chē)貨匹配平臺(tái)對(duì)車(chē)源和貨源的合理調(diào)控,目的是在滿足雙方需求的情況下,為每一個(gè)貨源找到最合適的車(chē)源,為每一個(gè)車(chē)源找到最合適的貨源[1]。隨著車(chē)源和貨源數(shù)量的急劇增加,車(chē)貨匹配面臨著越來(lái)越大的挑戰(zhàn)。點(diǎn)擊率預(yù)測(cè)在廣告系統(tǒng)中發(fā)揮著至關(guān)重要的作用,通過(guò)預(yù)測(cè)用戶點(diǎn)擊廣告的概率,可以為用戶推薦合適的廣告。廣告系統(tǒng)中存在著大量的用戶及廣告,而在車(chē)貨匹配系統(tǒng)中也存在著大量的司機(jī)和貨物。在廣告系統(tǒng)中運(yùn)用點(diǎn)擊率預(yù)測(cè)可以為用戶推薦合適的廣告,因此在車(chē)貨匹配系統(tǒng)中利用點(diǎn)擊率預(yù)測(cè)也可以為司機(jī)推薦合適的貨物。將點(diǎn)擊率預(yù)測(cè)與車(chē)貨匹配相結(jié)合是一個(gè)新穎且可行的研究方向,對(duì)于探索新的車(chē)貨匹配方法、推動(dòng)車(chē)貨匹配平臺(tái)發(fā)展具有重要意義。
傳統(tǒng)的車(chē)貨匹配方法是建立以優(yōu)化思想為主的車(chē)貨匹配模型,但是其在面對(duì)大規(guī)模數(shù)據(jù)集時(shí)表現(xiàn)不佳[2-3]。因此,少數(shù)學(xué)者以大規(guī)模數(shù)據(jù)為核心,開(kāi)展了對(duì)車(chē)貨匹配方法的研究。黃美華等利用C4.5決策樹(shù)算法建立車(chē)貨匹配模型,利用中國(guó)物通網(wǎng)的真實(shí)數(shù)據(jù)證明所建模型達(dá)到較高的匹配精確度[4];在此基礎(chǔ)上,黃美華等進(jìn)一步運(yùn)用最小二乘支持向量機(jī)建立車(chē)貨信息匹配模型,在保持匹配精確度的同時(shí),縮短了一半的計(jì)算時(shí)間[5]。上述研究利用機(jī)器學(xué)習(xí)對(duì)大規(guī)模的數(shù)據(jù)進(jìn)行了處理,對(duì)提出的車(chē)貨匹配方法進(jìn)行了驗(yàn)證,取得了較好的效果。周夏利用集成學(xué)習(xí)方法建立了車(chē)貨匹配預(yù)測(cè)模型,利用P平臺(tái)中的真實(shí)數(shù)據(jù)驗(yàn)證了集成學(xué)習(xí)方法在車(chē)貨匹配預(yù)測(cè)方面的可行性[6]。2018年,運(yùn)滿滿舉辦了YMM-TECH算法大賽,對(duì)用戶和用戶上下文進(jìn)行有效的嵌入,然后映射到貨源向量空間,尋找與貨主和當(dāng)前上下文的“最相近貨源”[7]。從司機(jī)的歷史行為數(shù)據(jù)中挖掘司機(jī)潛在的興趣,從而將貨源推薦給相應(yīng)的司機(jī),這對(duì)于探索新的車(chē)貨匹配方法是很好的啟發(fā),也是強(qiáng)有力的現(xiàn)實(shí)支撐,但是相關(guān)的學(xué)術(shù)研究卻很少。
受運(yùn)滿滿車(chē)貨匹配基本思路和點(diǎn)擊率預(yù)測(cè)在廣告系統(tǒng)中的優(yōu)越表現(xiàn)的啟發(fā),本文將點(diǎn)擊率預(yù)測(cè)和車(chē)貨匹配結(jié)合起來(lái),提出了一種考慮興趣序列和特征交互的司機(jī)點(diǎn)擊率預(yù)測(cè)模型——DIIN,旨在為司機(jī)推薦合適的貨源。
1" " 基于DIIN的司機(jī)點(diǎn)擊率預(yù)測(cè)
車(chē)貨匹配平臺(tái)中的歷史數(shù)據(jù)可以充分反映司機(jī)對(duì)貨物的興趣,其中司機(jī)點(diǎn)擊過(guò)的歷史貨物中也隱藏著序列關(guān)系,除了原始特征外,通過(guò)捕捉特征之間的交互能夠產(chǎn)生新的特征,也能反映出司機(jī)對(duì)貨物的興趣。因此,為了提升車(chē)貨匹配的效率和準(zhǔn)確度,本研究將深度學(xué)習(xí)和點(diǎn)擊率預(yù)測(cè)應(yīng)用到車(chē)貨匹配中,提出了深度興趣交互網(wǎng)絡(luò)DIIN。這一模型充分利用了車(chē)貨匹配平臺(tái)中的大規(guī)模數(shù)據(jù),不僅挖掘了其中的序列關(guān)系,還加強(qiáng)了原始特征之間的交互,從大規(guī)模貨源中發(fā)現(xiàn)司機(jī)點(diǎn)擊概率較高的貨物,充分挖掘司機(jī)對(duì)貨物的興趣。下文首先對(duì)車(chē)貨匹配問(wèn)題進(jìn)行形式化描述,然后詳細(xì)介紹DIIN模型。
1.1" " 車(chē)貨匹配問(wèn)題描述
對(duì)于司機(jī)和貨物,共選取四大特征:司機(jī)行為特征、目標(biāo)貨物特征、上下文特征和司機(jī)畫(huà)像特征。以司機(jī)D為例,對(duì)于司機(jī)行為特征,選取其點(diǎn)擊過(guò)的n個(gè)歷史貨物,用X=[x1,x2,...,xn-1,xn]表示;對(duì)于其他三類特征,共選取m個(gè)特征,用X=[x10,...,xi0,...,xm0]表示。所以,整個(gè)網(wǎng)絡(luò)的總輸入為[x0,x1,x2,...,xn-1,xn]。通過(guò)將上述特征輸入到網(wǎng)絡(luò)中,訓(xùn)練司機(jī)與貨物之間的隱藏關(guān)系,最終輸出司機(jī)點(diǎn)擊貨物的概率。定義司機(jī)點(diǎn)擊貨物的標(biāo)簽為y,其中,y=1表示司機(jī)點(diǎn)擊了貨物,y=0表示司機(jī)未點(diǎn)擊貨物。綜上所述,本研究的目標(biāo)是預(yù)測(cè)司機(jī)點(diǎn)擊貨物的概率。
1.2" " DIIN模型
DIIN模型如圖1所示,共由四個(gè)模塊組成,分別是車(chē)貨特征嵌入層、司機(jī)興趣抽取模塊、車(chē)貨特征交互模塊和點(diǎn)擊率輸出層。底部模塊是車(chē)貨特征嵌入層,輸入的數(shù)據(jù)通過(guò)獨(dú)熱編碼(one-hot)被映射為稀疏向量,然后經(jīng)過(guò)嵌入層被轉(zhuǎn)換為密集的低維向量。圖1的左部是司機(jī)興趣抽取模塊,使用Bi-GRU來(lái)模擬司機(jī)點(diǎn)擊貨物之間的依賴性,并進(jìn)一步通過(guò)SENet來(lái)捕捉不同貨物的重要程度,然后通過(guò)平均池化得到司機(jī)的興趣表示。圖1的右部是車(chē)貨特征交互模塊,一是利用FM捕捉低階特征的交互,二是利用ResNet捕捉高階特征的交互,以達(dá)到同時(shí)建模低階和高階特征交互的目的。上方模塊是點(diǎn)擊率輸出模塊,將兩個(gè)模塊的輸出拼接后輸入到MLP中,從而計(jì)算司機(jī)點(diǎn)擊貨物的概率。
1.2.1" " 車(chē)貨特征嵌入層
對(duì)于司機(jī)行為特征,選取貨物ID和貨物所屬類別的ID進(jìn)行輸入,統(tǒng)一使用one-hot編碼后通過(guò)嵌入層映射到低維、稠密的向量空間中進(jìn)行拼接。以貨物ID為例,設(shè)該特征有k種取值,其第i項(xiàng)取值的one-hot向量oig_id與權(quán)重矩陣Wig_id進(jìn)行點(diǎn)乘得到嵌入結(jié)果g_idi,以特征取第4個(gè)可能取值為例,其嵌入向量記為g_id4,原理如式(1)所示,d表示希望得到的低維向量維度,0的不同下標(biāo)是為了說(shuō)明其所在位置。
類似地,仍以第i項(xiàng)為例,我們也可以得到貨物所屬類別ID的嵌入向量,設(shè)為c_idi,c_idi∈Rd,然后將g_idi和c_idi進(jìn)行拼接,可以得到第i個(gè)貨物的嵌入向量x'i=(g_idi,c_idi),x'i∈R2d。將從司機(jī)行為特征中選取的n個(gè)貨物按照司機(jī)點(diǎn)擊行為的先后順序進(jìn)行排序,可以得到序列X '=[x'1,x'2,...,x'n-1,x'n],以司機(jī)D為例,司機(jī)D的司機(jī)行為特征X 'D可表示為式(2)。
對(duì)于其他三類特征,處理方式與上文類似,也是通過(guò)one-hot編碼后進(jìn)行嵌入,每個(gè)特征的維度均為M維,具體表示為式(3)。
1.2.2" " 司機(jī)興趣抽取模塊
司機(jī)興趣抽取模塊可以被分為三個(gè)部分:Bi-GRU、SENet和平均池化。
Bi-GRU可以被看作是兩層GRU,能夠從兩個(gè)方向捕獲司機(jī)點(diǎn)擊行為的關(guān)系,如圖2所示。首先,按點(diǎn)擊順序排列的歷史貨物數(shù)據(jù)被用作Bi-GRU的輸入,同時(shí)被輸入到兩個(gè)方向相反的GRU隱層。由此,兩個(gè)GRU隱層可以捕獲隱藏在輸入數(shù)據(jù)中的綜合信息,然后通過(guò)前向和后向GRU提取隱藏層特征和,式(4)—(7)說(shuō)明了點(diǎn)擊貨物i隱藏狀態(tài)的計(jì)算過(guò)程。
其中,x'i為當(dāng)前的輸入,hi為當(dāng)前的輸出,hi-1為前一個(gè)隱藏狀態(tài)的輸出,zi和ri分別代表更新門(mén)和重置門(mén),為要更新的信息,W和U是權(quán)重矩陣,b是偏置向量,σ是sigmoid函數(shù),tanh為激活函數(shù)。
最后,Bi-GRU的輸出為前向和后向GRU輸出的和。以上述貨物i為例,此時(shí)的輸出為hi=+,那么,對(duì)于整個(gè)Bi-GRU的輸出,我們可以得到H=[h1,h2,...,hn-1,hn]。
對(duì)于Bi-GRU的輸出,我們可以將其看作n個(gè)貨物的綜合信息表示。對(duì)于這n個(gè)貨物特征向量來(lái)說(shuō),其所包含的特征種類是相同的,但是所包含的具體內(nèi)容是有差異的,對(duì)于推測(cè)司機(jī)興趣所起到的作用也不同。具體來(lái)講,在這n個(gè)貨物特征向量中,有的特征向量能夠充分顯示出司機(jī)的興趣,有的則關(guān)聯(lián)不大,所以我們想要突出前者的貢獻(xiàn),淡化后者的作用。對(duì)于特定的點(diǎn)擊率預(yù)測(cè)任務(wù),可以通過(guò)SENet機(jī)制動(dòng)態(tài)地增加重要特征的權(quán)重,減少無(wú)信息特征的權(quán)重。受此啟發(fā),為了達(dá)到研究目的,我們通過(guò)SENet機(jī)制動(dòng)態(tài)增加了重要貨物特征向量的權(quán)值,減少了非重要貨物特征向量的權(quán)值,如圖3所示。SENet共分為三步:擠壓、激勵(lì)、再稱重,具體計(jì)算過(guò)程如下。
通過(guò)Bi-GRU和SENet的計(jì)算,我們得到了新的貨物向量H',H'可以被看作是司機(jī)興趣向量的表示。為了使其更方便地與其他向量進(jìn)行拼接,我們采用平均池化將n個(gè)向量壓縮為1個(gè)向量。假設(shè)最終的輸出為VI,則VI=(v1,v2,...,vi,...,v2d-1,v2d),其中vi,i∈[1,...,2d]是標(biāo)量值,vi的具體計(jì)算過(guò)程如下。
其中h'ti是h't第i維所對(duì)應(yīng)的值。
1.2.3" " 車(chē)貨特征交互模塊
車(chē)貨特征交互模塊可以被分為兩部分:FM和ResNet。
以特征x'i0和x'j0為例,對(duì)應(yīng)的隱向量分別為wi和wj,設(shè)FM的輸出為VL,表示其他三類特征的二階特征交互向量,VL具體計(jì)算過(guò)程如下。
其中wi,wj∈Rk。
ResNet結(jié)構(gòu)如圖4所示,輸入為其他三類特征x'0,可以包含多個(gè)殘差塊,每一個(gè)殘差塊包括兩個(gè)隱藏層,每一個(gè)隱藏層具有相同數(shù)量的節(jié)點(diǎn),用mL表示。每個(gè)節(jié)點(diǎn)的激活函數(shù)均用ReLU表示,相鄰隱藏層之間的節(jié)點(diǎn)為全連接。以第一個(gè)殘差塊為例,第一個(gè)隱藏層的輸出如下式所示。
第二個(gè)隱藏層的輸出如下式所示。
在上述公式中,W0(W0∈RmL×m)表示從嵌入層到第一層隱藏層的權(quán)重矩陣,b0(b0∈RmL)是第一層隱藏層的偏置向量;類似地,W1(W1∈RmL×mL)是第一層隱藏層到第二層隱藏層的權(quán)重矩陣,b1(b1∈RmL)是第二層隱藏層的偏置向量。在計(jì)算完第二個(gè)隱藏層的輸出后,整個(gè)殘差塊的輸出為x'0和j2的元素加和(element-wise sum),為了使x'0和j2能夠相加,需要保證兩者的節(jié)點(diǎn)數(shù)相同,因此需要對(duì)x'0做進(jìn)一步的轉(zhuǎn)換,使
則殘差塊的輸出為:
ResNet中包含多個(gè)殘差塊,設(shè)最后一個(gè)殘差塊的輸出為VH(VH∈RmL),VH表示其他三類特征的高階特征交互向量。
1.2.4" " 點(diǎn)擊率輸出層
最后,將司機(jī)興趣抽取模塊和車(chē)貨特征交互模塊的輸出拼接在一起,表示為Vfinal=[V1;V2;VH]。雖然之前已經(jīng)進(jìn)行了特征交互,但是VI并沒(méi)有與其他特征進(jìn)行交互,所以Vfinal會(huì)被輸入到用ReLU函數(shù)激活的全連接層中,然后用sigmoid函數(shù)計(jì)算司機(jī)點(diǎn)擊貨物的概率。具體計(jì)算過(guò)程如下。
點(diǎn)擊率預(yù)測(cè)是一個(gè)經(jīng)典的二元分類問(wèn)題,所以,選擇負(fù)對(duì)數(shù)似然函數(shù)作為目標(biāo)函數(shù),具體計(jì)算公式如下。
其中S表示總訓(xùn)練集,x和y分別是網(wǎng)絡(luò)的輸入和標(biāo)簽,P(x)是網(wǎng)絡(luò)的輸出,表示司機(jī)點(diǎn)擊貨物的概率。
2" " 實(shí)" " 驗(yàn)
本節(jié)描述了為評(píng)估DIIN方法的性能而進(jìn)行的實(shí)驗(yàn),其中包括實(shí)驗(yàn)使用的數(shù)據(jù)集、評(píng)價(jià)指標(biāo)、對(duì)比方法和實(shí)驗(yàn)流程。
2.1" " 數(shù)據(jù)集
上述實(shí)驗(yàn)所使用的數(shù)據(jù)集是某車(chē)貨匹配平臺(tái)所提供的非公開(kāi)的司機(jī)行為數(shù)據(jù)集,該數(shù)據(jù)集包括667名司機(jī),2 208 579件貨物和1 751 673條司機(jī)行為,其中司機(jī)行為包括瀏覽貨物、點(diǎn)擊貨物和打電話。由于瀏覽貨物是經(jīng)常發(fā)生且無(wú)意識(shí)的行為,因此本實(shí)驗(yàn)認(rèn)為點(diǎn)擊貨物和打電話屬于點(diǎn)擊行為。為了保證實(shí)驗(yàn)的真實(shí)性,對(duì)數(shù)據(jù)進(jìn)行了處理。具體來(lái)說(shuō),刪除了歷史行為不超過(guò)100次和點(diǎn)擊行為次數(shù)不超過(guò)10次的司機(jī),因此最終的實(shí)驗(yàn)數(shù)據(jù)集包括582名司機(jī)、1 105 719件貨物和1 735 993條司機(jī)行為。
2.2" " 評(píng)價(jià)指標(biāo)
選擇了兩種評(píng)價(jià)指標(biāo)來(lái)評(píng)估本實(shí)驗(yàn)方法,如下所示。
AUC是點(diǎn)擊率預(yù)測(cè)領(lǐng)域中常用的評(píng)價(jià)指標(biāo),將樣本根據(jù)預(yù)測(cè)點(diǎn)擊率由大到小進(jìn)行排列,然后隨機(jī)抽取一個(gè)正樣本和一個(gè)負(fù)樣本,正樣本排在負(fù)樣本前的概率即為AUC。
LogLoss用交叉熵來(lái)度量每個(gè)樣本的預(yù)測(cè)概率和實(shí)際標(biāo)簽之間的距離。計(jì)算公式如式(19)所示,LogLoss值越低,表明與實(shí)際標(biāo)簽的偏差越小,性能越好。
2.3" " 對(duì)比方法
為了驗(yàn)證所提出的DIIN模型的性能是否科學(xué),將其與LR、FM、DNN、ResNet、Wideamp;Deep、DeepFM、DIN、DIEN等方法進(jìn)行了比較。其中,LR和FM是非DNN方法,其他則是基于DNN的方法。具體來(lái)講,DNN和ResNet是單模型,Wideamp;Deep和DeepFM是雙組合模型,DIN和DIEN則可以被看作是興趣模型。
2.4" " 實(shí)驗(yàn)流程
使用PyTorch來(lái)試驗(yàn)本文提出的方法和所有對(duì)比方法,采用60%的數(shù)據(jù)集作為訓(xùn)練集來(lái)學(xué)習(xí)參數(shù),20%的數(shù)據(jù)集作為驗(yàn)證集來(lái)調(diào)整超參數(shù),20%的數(shù)據(jù)集作為測(cè)試集來(lái)評(píng)估性能。
3" " 討" " 論
本節(jié)將所提出的方法DIIN與對(duì)比方法進(jìn)行比較,以評(píng)估其性能。為了探索SENet和ResNet的貢獻(xiàn),本文還進(jìn)行了消融研究。
3.1" " 結(jié)" " 果
實(shí)驗(yàn)結(jié)果如表1所示。根據(jù)實(shí)驗(yàn)結(jié)果,應(yīng)注意以下幾個(gè)方面。
非DNN模型在結(jié)果方面均差于基于DNN的模型,這是因?yàn)楹笳叩谋磉_(dá)能力更強(qiáng),能夠挖掘出更多潛藏在數(shù)據(jù)中的模式,而且其具有更靈活的模型結(jié)構(gòu)。在非DNN模型中,LR的結(jié)果要比FM差,這說(shuō)明LR的泛化能力和表達(dá)能力有限。而FM不僅包括LR對(duì)單一特征做簡(jiǎn)單加權(quán)的部分,還包括對(duì)所有特征進(jìn)行兩兩交叉,有效地捕捉了低階特征交互。
相比于非DNN模型,單DNN模型在結(jié)果上也有一定的進(jìn)步。這是因?yàn)榉荄NN模型在特征交互方面的能力是有限的,而單DNN模型能夠捕捉高階特征交互。具體來(lái)說(shuō),DNN是一個(gè)標(biāo)準(zhǔn)的深度神經(jīng)網(wǎng)絡(luò),只包括用于預(yù)測(cè)的嵌入和MLP層。DNN的出現(xiàn)是一個(gè)新的突破,同時(shí)也是其他DNN模型的原型。但是隨著網(wǎng)絡(luò)深度的不斷增加,不可避免地出現(xiàn)了梯度消失問(wèn)題,而ResNet使用跳躍連接緩解了該問(wèn)題,能夠更有效地捕捉高階特征交互。
相比于單DNN模型,雙組合DNN模型可以被看作是非DNN模型和單DNN模型的結(jié)合,能夠同時(shí)捕捉低階和高階特征,在結(jié)果方面也取得了更好的成效。具體來(lái)說(shuō),Wideamp;Deep將線性模塊和DNN模塊組合起來(lái)平衡了模型的記憶能力和泛化能力。DeepFM對(duì)其進(jìn)行了改進(jìn),用FM代替了線性模塊,加強(qiáng)了淺層網(wǎng)絡(luò)部分特征組合的能力。
與雙組合DNN模型相比,興趣DNN模型考慮了通過(guò)顯示交互關(guān)系來(lái)分析用戶的偏好,充分利用了用戶的歷史行為關(guān)系,取得了更好的效果。具體來(lái)說(shuō),DIN引入了注意力機(jī)制,能夠自適應(yīng)地從歷史行為中學(xué)習(xí)用戶興趣的表示;而DIEN則是在此基礎(chǔ)上,用序列模型模擬了用戶興趣的進(jìn)化過(guò)程,更好地捕捉了行為中隱藏的時(shí)間信息。
與結(jié)果最好的DIEN模型相比,本研究所提出的DII模型在AUC和LogLoss方面各有2.15%和1.82%的提升。由于本實(shí)驗(yàn)加強(qiáng)了特征的交互,同時(shí)對(duì)序列模型和注意力機(jī)制進(jìn)行了改進(jìn),使得該模型能夠更有效地提取司機(jī)興趣。
3.2" " SENet的有效性
在DIIN中,SENet的作用在于動(dòng)態(tài)地表示不同貨物的重要程度。為了驗(yàn)證SENet的有效性,進(jìn)行了SENet的消融研究。首先,考慮在DIIN中移除SENet,將該方法命名為DIIN-1;然后,將SENet作為注意力機(jī)制中的一種,考慮用attention機(jī)制替換SENet,將該方法命名為DIIN-2。圖5是DIIN方法與這兩種方法的性能比較。從圖5中可以觀察到,與DIIN-1相比,DIIN-2和DIIN均取得了較高的AUC結(jié)果和較低的LogLoss結(jié)果,說(shuō)明注意力機(jī)制的使用是非常必要且有效的。與DIIN-2相比,DIIN在AUC和LogLoss方面各得到了1.29%和1.26%的提升,說(shuō)明SENet能夠更加準(zhǔn)確地表示不同貨物的重要性。
3.3" " ResNet的有效性
在DIIN中,ResNet的作用是捕捉高階特征的交互。為了驗(yàn)證ResNet的有效性,進(jìn)行了ResNet的消融研究。首先,考慮在DIIN中移除ResNet,將該方法命名為DIIN-3。其次,在傳統(tǒng)點(diǎn)擊率預(yù)測(cè)方法中,DNN常被用來(lái)捕捉高階特征交互,因此考慮用DNN替換ResNet,將該方法命名為DIIN-4。圖6為DIIN方法與這兩種方法的性能比較情況。從圖6中可以觀察到,與DIIN-3相比,DIIN-4和DIIN在AUC結(jié)果上各有0.48%和1.92%的提升,在LogLoss結(jié)果上各有0.37%和1.43%的提升,說(shuō)明了深度模塊捕捉高階特征交互的必要性。與DIIN-4相比于DIIN-3的漲幅相比,DIIN相比于DIIN-4的漲幅在AUC方面是其3倍,在LogLoss方面是其2.86倍,說(shuō)明在捕捉高階交互上,ResNet具有更好的效果。
4" " 結(jié)" " 論
本文以車(chē)貨匹配平臺(tái)中大規(guī)模的數(shù)據(jù)為出發(fā)點(diǎn),將車(chē)貨匹配問(wèn)題轉(zhuǎn)化為司機(jī)對(duì)候選貨物的點(diǎn)擊率預(yù)測(cè)問(wèn)題,并提出了一種基于深度學(xué)習(xí)的司機(jī)點(diǎn)擊率預(yù)測(cè)模型DIIN,該模型能夠捕捉司機(jī)興趣表示、加強(qiáng)特征交互。本文充分利用司機(jī)歷史行為日志中的信息,利用Bi-GRU和SENet抽取司機(jī)的興趣,同時(shí)利用FM和ResNet進(jìn)行特征交互,在某車(chē)貨匹配平臺(tái)數(shù)據(jù)集的支持下所得到的實(shí)驗(yàn)結(jié)果也驗(yàn)證了該方法的有效性。相比于之前的研究,本文利用深度學(xué)習(xí)來(lái)解決車(chē)貨匹配問(wèn)題,同時(shí)將其與點(diǎn)擊率預(yù)測(cè)問(wèn)題相結(jié)合,具有一定的創(chuàng)新性。此外,DIIN模型在車(chē)貨匹配場(chǎng)景中取得了成功,可以考慮將其推廣到其他點(diǎn)擊率預(yù)測(cè)場(chǎng)景中。在未來(lái)可以繼續(xù)考慮數(shù)據(jù)和車(chē)貨匹配場(chǎng)景這兩方面的內(nèi)容,探索更加有效的模型,以更好地解決車(chē)貨匹配問(wèn)題。未來(lái)的研究不僅要從數(shù)據(jù)源中挖掘更多的隱藏關(guān)系,還要充分利用車(chē)貨匹配場(chǎng)景中的專業(yè)知識(shí),使所提出的模型更切合實(shí)際。
參考文獻(xiàn):
[1] 肖斌.基于深度學(xué)習(xí)的車(chē)貨匹配問(wèn)題研究[D].成都:西南交通大學(xué),2020.
[2] 倪少權(quán),羅軒,肖斌.考慮三方利益的車(chē)貨匹配優(yōu)化[J].西南交通大學(xué)學(xué)報(bào),2023,58(1):48-57.
[3] 楊濱舟,葉欣揚(yáng),王睿,等.基于直覺(jué)模糊優(yōu)化的車(chē)貨雙邊公平匹配方法[J].計(jì)算機(jī)集成制造系統(tǒng),2023,29(5):1696-1707.
[4] 黃美華,李君,馬煒,等.基于數(shù)據(jù)挖掘的車(chē)貨信息匹配研究[J].浙江萬(wàn)里學(xué)院學(xué)報(bào),2017,30(6):66-71.
[5] 黃美華,李君,吳耀輝,等.基于最小二乘支持向量機(jī)的車(chē)貨匹配實(shí)現(xiàn)研究[J].浙江萬(wàn)里學(xué)院學(xué)報(bào),2018,31(2):87-92.
[6] 周夏.基于Stacking算法的貨運(yùn)平臺(tái)車(chē)貨匹配預(yù)測(cè)研究[D].南京:南京大學(xué),2021.
[7] 運(yùn)滿滿.物流極客出爐|運(yùn)滿滿首屆YMM-TECH算法大賽冠軍誕生[EB/OL].(2018-9-12)[2023-11-14].https://www."ymm56.com/article4153.html.