王子君 梁峰
摘 要:客戶未來(lái)活躍度和購(gòu)買頻次信息對(duì)客戶關(guān)系管理具有重要決策參考價(jià)值。文章基于國(guó)內(nèi)某大型石化企業(yè)成品油客戶購(gòu)油數(shù)據(jù),采用MBG/CNBD-k模型對(duì)客戶未來(lái)活躍度及購(gòu)買頻次進(jìn)行建模,研究結(jié)果表明,該模型對(duì)客戶流失率預(yù)測(cè)具有較高的準(zhǔn)確率,有助于石化企業(yè)及時(shí)發(fā)現(xiàn)可能流失的客戶,針對(duì)性地開(kāi)展客戶維系與挽留措施,減少客戶流失。
關(guān)鍵詞:MBG/CNBD-k模型;客戶活躍度;客戶購(gòu)買行為預(yù)測(cè)
中圖分類號(hào):F274 文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):1005-6432(2022)13-0137-04
DOI:10.13939/j.cnki.zgsc.2022.13.137
1 引言
在客戶關(guān)系管理中,非契約客戶與企業(yè)關(guān)系不受合同影響,客戶轉(zhuǎn)移成本較低,客戶未來(lái)活躍度信息對(duì)于營(yíng)銷決策具有重要價(jià)值。管理者可以依據(jù)客戶活躍度預(yù)測(cè),提升營(yíng)銷政策的精準(zhǔn)性,通過(guò)對(duì)客戶活躍度細(xì)分,及時(shí)采取措施降低客戶流失率。目前,預(yù)測(cè)客戶購(gòu)買活躍度主要有兩大類方法:一類是機(jī)器學(xué)習(xí)模型,例如邏輯回歸模型[1]、決策樹(shù)模型[2]、支持向量機(jī)[3]等;另一類是概率模型,例如Pareto/NBD模型[4-5]、BG/NBD模型[6-7]、MBG/NBD模型[8]、MBG/CNBD-k模型[9]等,這兩條技術(shù)路線均有各自的追隨者。MBG/CNBD-k模型是新提出的針對(duì)客戶購(gòu)買行為的概率建模方法[9],其對(duì)經(jīng)典Pareto/NBD概率模型進(jìn)行了改進(jìn),由于提出時(shí)間較短,其預(yù)測(cè)效果尚未得到廣泛驗(yàn)證。文章基于國(guó)內(nèi)某大型石化企業(yè)成品油客戶購(gòu)油數(shù)據(jù),使用MBG/CNBD-k模型對(duì)客戶活躍度及購(gòu)買頻次構(gòu)建模型,增進(jìn)客戶管理相關(guān)領(lǐng)域?qū)BG/CNBD-k模型的認(rèn)識(shí)及推廣應(yīng)用。
2 MBG/CNBD-k模型簡(jiǎn)介
2.1 模型設(shè)定
MBG/CNBD-k模型建立在MBG/NBD模型的基礎(chǔ)之上,模型有六個(gè)基本假設(shè)。
(1)在客戶活躍時(shí),客戶與企業(yè)交易的動(dòng)機(jī)和行為是隨機(jī)的,并且客戶交易次數(shù)服從交易率為λ的泊松分布,客戶交易時(shí)間間隔服從k階愛(ài)爾朗分布,其概率密度為:
當(dāng)k等于1時(shí),MBG/CNBD-k模型退化為MBG/NBD模型,k值越大意味購(gòu)買時(shí)間間隔的規(guī)律性越強(qiáng)。
(2)不同客戶之間的交易率存在異質(zhì)性,既有頻繁購(gòu)買客戶,也有購(gòu)買一次之后流失的客戶。假定交易率λ在不同客戶間的異質(zhì)性服從形狀參數(shù)為r和尺度參數(shù)為α的伽瑪分布,其概率密度為:
不同客戶交易率的平均值為E[λ|r, α]=r/α,方差為D[λ|r, α]=r/α2。客戶的交易率受到參數(shù)r和α的共同影響。
(3)每個(gè)客戶存在一個(gè)不可觀測(cè)的生命周期,假定客戶每次交易后變得不活躍的概率為p,允許客戶在首次交易便以概率p退出,客戶退出時(shí)間點(diǎn)服從幾何分布。
(4)假定客戶流失概率p的異質(zhì)性服從形狀參數(shù)為a和尺度參數(shù)為b的貝塔分布。與伽瑪分布相比,貝塔分布其變量取值范圍介于0到1之間,適合用于描述未知概率值的變化。
其中B(a, b)為貝塔函數(shù), 可以用伽瑪函數(shù)表示為:
不同客戶流失概率的均值為E[p|a, b]=a/(a+b),故客戶的流失概率受到參數(shù)a和b的共同影響。
(5)交易率λ和流失概率p相互獨(dú)立。
(6)觀測(cè)期從客戶第一次購(gòu)買開(kāi)始。
2.2 參數(shù)估計(jì)
MBG/CNBD-k模型除了需要客戶在觀測(cè)期內(nèi)的重復(fù)購(gòu)買次數(shù)x、交易關(guān)系時(shí)間長(zhǎng)度tx 以及觀測(cè)截止時(shí)間T三個(gè)方面信息之外,還加入一個(gè)反映客戶購(gòu)買時(shí)間間隔規(guī)律性的變量,記為litt,這是MBG/CNBD-k模型與之前提出的概率模型一個(gè)重要不同之處。客戶交易時(shí)間間隔是否具有規(guī)律性,對(duì)于預(yù)測(cè)客戶活躍度具有重要影響,litt近似為客戶交易時(shí)間間隔的對(duì)數(shù)和,表達(dá)式如下:
其中ti表示第i次交易時(shí)間,ti+1-ti為交易時(shí)間間隔。litt值越大,客戶購(gòu)買時(shí)間間隔規(guī)律性越強(qiáng)。
MBG/CNBD-k模型中,隨機(jī)選擇的客戶在時(shí)間T活躍的條件概率為:
客戶在未來(lái)一段時(shí)間內(nèi)條件期望交易次數(shù)為:
模型中的五個(gè)參數(shù)k, r, α, a, b可以通過(guò)式(9)的最大似然法估計(jì)得到,樣本的似然函數(shù)如下。估計(jì)程序使用R語(yǔ)言BTYDplus程序包。
根據(jù)式(7)和式(8),代入客戶歷史購(gòu)買信息(x, tx, T, litt),可以計(jì)算客戶在觀測(cè)期結(jié)束時(shí)客戶活躍度及在未來(lái)指定時(shí)段的期望購(gòu)買頻次。
3 實(shí)證分析
3.1 數(shù)據(jù)處理及描述統(tǒng)計(jì)
本研究選取國(guó)內(nèi)某大型石化企業(yè)成品油客戶交易數(shù)據(jù),數(shù)據(jù)包含約5萬(wàn)客戶的80余萬(wàn)條購(gòu)油交易記錄,交易時(shí)間為2017年1月到2019年10月。對(duì)數(shù)據(jù)的轉(zhuǎn)換主要包括以下幾個(gè)方面。
(1)剔除數(shù)據(jù)中企業(yè)內(nèi)部交易記錄,該類交易屬于非市場(chǎng)化的交易行為。
(2)構(gòu)建客戶交易特征變量。將原始數(shù)據(jù)中同一客戶分布在多行的交易信息進(jìn)行匯總,測(cè)算每一客戶在觀測(cè)期內(nèi)除首次購(gòu)買之外的重復(fù)購(gòu)買頻次x;觀測(cè)期內(nèi)第一次交易與最后一次交易的時(shí)間間隔tx;客戶在觀測(cè)期內(nèi)第一次交易到觀測(cè)期截止的時(shí)間間隔T,計(jì)算客戶時(shí)間規(guī)律性變量litt。四個(gè)預(yù)測(cè)變量的描述性統(tǒng)計(jì)如表1所示。
3.2 實(shí)驗(yàn)設(shè)計(jì)
為防止模型出現(xiàn)過(guò)擬合,客觀評(píng)價(jià)模型的預(yù)測(cè)效果,本研究將數(shù)據(jù)分為訓(xùn)練數(shù)據(jù)集和測(cè)試數(shù)據(jù)集,訓(xùn)練集為從全部樣本客戶中隨機(jī)抽取80%樣本客戶,測(cè)試集為剩下20%的樣本客戶。并將訓(xùn)練集和測(cè)試集劃分為觀測(cè)期和驗(yàn)證期,觀測(cè)期為2017年1月到2019年6月客戶交易數(shù)據(jù),驗(yàn)證期為2019年7月到2019年10月數(shù)據(jù)。使用訓(xùn)練集觀測(cè)期數(shù)據(jù)估計(jì)模型參數(shù)。452F8187-7752-45FF-A17F-EB9E6F421547
MBG/CNBD-k模型對(duì)客戶流失率的預(yù)測(cè)效果使用預(yù)測(cè)準(zhǔn)確率、精確率、召回率、特異度、F1值五個(gè)指標(biāo)綜合評(píng)價(jià)。將預(yù)測(cè)的活躍度與客戶后期實(shí)際購(gòu)買情況對(duì)比,使用KS曲線選擇活躍度閾值,作為流失預(yù)測(cè)臨界點(diǎn)??蛻艋钴S度大于或等于該閾值為未流失客戶,小于該閾值為流失客戶。
3.3 參數(shù)估計(jì)結(jié)果及預(yù)測(cè)效果
代入樣本客戶信息(X=(x, tx, T, litt)),式(9)最大似然法得到估計(jì)參數(shù)結(jié)果為:k=2, r=0.87, α=15.09, a=0.37, b=3.53,代入式(7)得到客戶2019年6月30日的活躍度。根據(jù)KS曲線選擇MBG/CNBD-k模型活躍度閾值為0.8。MBG/CNBD-k模型準(zhǔn)確率為81.55%,指在模型預(yù)測(cè)結(jié)果中預(yù)測(cè)正確的樣本占總樣本數(shù)的81.55%;精確率為88.47%,指在模型預(yù)測(cè)為流失的客戶中預(yù)測(cè)正確的樣本所占比例,模型精確度越高,第一類錯(cuò)誤越低;召回率為80.22%,指在真正流失的客戶中模型預(yù)測(cè)為流失的客戶占真正流失客戶的比重,召回率越高,第二類錯(cuò)誤越低。這三個(gè)指標(biāo)互相補(bǔ)充,綜合反映模型的估計(jì)結(jié)果,遠(yuǎn)高于隨機(jī)判斷。
4 MBG/CNBD-k模型發(fā)現(xiàn)的客戶購(gòu)買行為規(guī)律
通過(guò)對(duì)比模型測(cè)算的客戶活躍度及其購(gòu)買特征,發(fā)現(xiàn)客戶在觀測(cè)截止時(shí)間點(diǎn)的活躍度與其購(gòu)買特征存在以下規(guī)律。
4.1 最近購(gòu)買時(shí)間距離當(dāng)前越近,活躍度及未來(lái)復(fù)購(gòu)頻次越高
具有相同復(fù)購(gòu)次數(shù)客戶,客戶最后一次購(gòu)買時(shí)間距離觀測(cè)截止點(diǎn)的時(shí)間越近,即tx與T差值越小,其計(jì)算得到的活躍度概率及未來(lái)交易次數(shù)越高。這表明與客戶之間沒(méi)有交易的時(shí)間越長(zhǎng),客戶流失的可能性越大。表2列出若干個(gè)隨機(jī)抽取的客戶,客戶6和客戶2重復(fù)購(gòu)買頻次x及客戶時(shí)間規(guī)律litt相同,客戶6距離當(dāng)前時(shí)間更短,其活躍度及未來(lái)復(fù)購(gòu)頻次高于客戶2。
4.2 復(fù)購(gòu)頻次越高,活躍度及未來(lái)復(fù)購(gòu)頻次越高
客戶最后一次購(gòu)買時(shí)間距離觀測(cè)截止點(diǎn)的時(shí)間相差不大,客戶重復(fù)購(gòu)買頻次越高,客戶活躍度及未來(lái)交易頻次越高,如表2中,客戶7和客戶5時(shí)間規(guī)律litt及客戶最后一次購(gòu)買時(shí)間距離觀測(cè)截止點(diǎn)的時(shí)間相差不大,客戶7復(fù)購(gòu)頻次更高,其活躍度及未來(lái)復(fù)購(gòu)頻次高于客戶5。
4.3 規(guī)律購(gòu)買客戶具有更高的活躍度及復(fù)購(gòu)頻次
客戶實(shí)際復(fù)購(gòu)頻次及最后一次購(gòu)買時(shí)間距離觀測(cè)截止點(diǎn)的時(shí)間間隔相差不大,客戶購(gòu)買時(shí)間規(guī)律性litt越大,客戶活躍度及未來(lái)交易頻次越高,如客戶3和客戶4復(fù)購(gòu)頻次及最近度相近,客戶4時(shí)間規(guī)律性越大,其活躍度及未來(lái)復(fù)購(gòu)頻次高于客戶4。
4.4 最近購(gòu)買時(shí)間對(duì)活躍度及未來(lái)復(fù)購(gòu)頻次的影響高于復(fù)購(gòu)次數(shù)及購(gòu)買規(guī)律性
客戶最后一次購(gòu)買時(shí)間距離觀測(cè)截止點(diǎn)時(shí)間間隔比復(fù)購(gòu)頻次對(duì)活躍度及未來(lái)交易頻次的影響更大,如客戶2和客戶6活躍度及未來(lái)復(fù)購(gòu)頻次變化幅度,遠(yuǎn)大于客戶5和客戶7的變化幅度;客戶最近度影響比時(shí)間規(guī)律性對(duì)活躍度及未來(lái)復(fù)購(gòu)頻次的影響更大,如客戶2和客戶6活躍度及未來(lái)交易頻次變化幅度大于客戶3和客戶4。
4.5 客戶活躍度與購(gòu)買頻次正向相關(guān)
隨著客戶活躍度增大,客戶購(gòu)買可能性和客戶未來(lái)復(fù)購(gòu)次數(shù)也隨之增加,詳見(jiàn)表3??蛻艋钴S度小于0.8,發(fā)生0次購(gòu)買的客戶占比較大,表明購(gòu)買概率較低,可認(rèn)為該客戶已流失;客戶活躍度大于或等于0.8,發(fā)生0次購(gòu)買的客戶比例明顯下降,發(fā)生多次購(gòu)買的客戶比例顯著增加。
從以上分析可知,采用KS曲線確定流失臨界值的效果較好??蛻艋钴S度臨界值對(duì)預(yù)測(cè)客戶購(gòu)買行為具有重要作用,客戶活躍度大于或等于該臨界值,客戶與企業(yè)發(fā)生交易的概率顯著提升。
5 小結(jié)與應(yīng)用建議
MBG/CNBD-k模型在預(yù)測(cè)客戶活躍度和重復(fù)購(gòu)買頻次有較好的準(zhǔn)確度,企業(yè)可將其用于客戶關(guān)系管理,作為石化企業(yè)預(yù)測(cè)客戶行為的決策依據(jù),有助于石化企業(yè)維持客戶。企業(yè)根據(jù)客戶活躍度和未來(lái)重復(fù)購(gòu)買頻次對(duì)客戶進(jìn)行細(xì)分,實(shí)行不同類型的客戶差異化管理。針對(duì)MBG/CNBD-k模型的應(yīng)用,文章提出以下建議。
5.1 根據(jù)客戶活躍度進(jìn)行客戶分類管理,提升營(yíng)銷的精準(zhǔn)性
根據(jù)客戶預(yù)測(cè)活躍度可將客戶分為兩大類客戶:活躍客戶和不活躍客戶。在活躍客戶中進(jìn)一步識(shí)別出零星活躍客戶,零星活躍客戶是指模型預(yù)測(cè)為活躍,但是兩次購(gòu)買時(shí)間間隔較長(zhǎng)的客戶。針對(duì)不同類型客戶采取個(gè)性化管理措施。零星活躍客戶在活躍與流失之間搖擺,挽留這類客戶是企業(yè)營(yíng)銷工作的重點(diǎn),可以給企業(yè)帶來(lái)較大價(jià)值。針對(duì)活躍客戶應(yīng)采取定期回訪措施,保持客戶的活躍度。不活躍客戶是已經(jīng)流失的客戶,應(yīng)該分析其流失原因,屬于近期流失還是早已流失,針對(duì)近期流失的采取必要的挽留營(yíng)銷措施。
5.2 定期根據(jù)客戶交易特征數(shù)據(jù)開(kāi)展客戶活躍度預(yù)測(cè),了解客戶活躍總規(guī)模
活躍度除了設(shè)置閾值判斷客戶活躍程度,反映具體客戶的流失情況,還可以運(yùn)用MBG/CNBD-k模型計(jì)算客戶活躍度,然后將所有客戶的活躍度進(jìn)行加總,以此估算企業(yè)客戶總規(guī)模??蛻艋钴S度總和反映企業(yè)有購(gòu)買需求的累計(jì)客戶數(shù)量,該統(tǒng)計(jì)指標(biāo)是對(duì)以客戶人數(shù)記錄測(cè)度客戶規(guī)模指標(biāo)的一個(gè)補(bǔ)充,幫助企業(yè)了解客戶總體滿意度的變動(dòng)。
參考文獻(xiàn):
[1]周靜,周小宇,王漢生.自我網(wǎng)絡(luò)特征對(duì)電信客戶流失的影響[J].管理科學(xué),2017(5):28-37
[2]張宇,張之明.一種基于C5.0決策樹(shù)的客戶流失預(yù)測(cè)模型研究[J].統(tǒng)計(jì)與信息論壇,2015(1):89-94.
[3]夏國(guó)恩,馬文斌,唐嬋娟,等.融入客戶價(jià)值特征和情感特征的網(wǎng)絡(luò)客戶流失預(yù)測(cè)研究[J].管理學(xué)報(bào),2018,15(3):442-449.
[4]齊佳音,李懷祖,舒華英,等.SMC模型在IT分銷業(yè)的實(shí)證研究[J].中國(guó)管理科學(xué),2003,11(6):71-76.
[5] SCHMITTLEIN D C,MORRISON D G,COLMBO R.Counting your customers: who-are they and what will they do next?[J].Management Science,1987,33(1):1-24.
[6]吳昊,王純,周立娟.BG/NBD模型的手機(jī)閱讀業(yè)務(wù)客戶價(jià)值預(yù)測(cè)實(shí)證研究[J].計(jì)算機(jī)系統(tǒng)應(yīng)用,2013(3):166-169.
[7] OEST R V,KNOX G.Extending the BG/NBD: a simple model of purchases and complaints[J].International Journal of Research in Marketing,2011,28(1):30-37.
[8] BATISLAM E P,DENIZEL M,F(xiàn)ILIZTEKIN A.Formal response to “Erratum on the MBG/NBD Model”[J].International Journal of Research in Marketing,2008,25(3):227-227.
[9] PLATZER M,REUTTERER NADINE S.Leveraging purchase regularity for predicting customer behavior the easy way[J].International Journal of Research in Marketing,2020(12): 194-215.
[基金項(xiàng)目]文章得到教育部人文社科基金(項(xiàng)目編號(hào):19YJA790052)資助。
[作者簡(jiǎn)介]王子君(1998—),女,漢族,湖北人,碩士,研究方向:客戶關(guān)系管理;通訊作者:梁峰(1977—),男,漢族,廣東人,副教授,博士,研究方向:經(jīng)濟(jì)統(tǒng)計(jì)、數(shù)據(jù)挖掘。452F8187-7752-45FF-A17F-EB9E6F421547