亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        電子商務(wù)客戶流失的DBN預(yù)測模型研究

        2022-06-09 11:57:58周婉婷趙志杰王加迎韓小為
        計算機工程與應(yīng)用 2022年11期
        關(guān)鍵詞:活躍天數(shù)權(quán)重

        周婉婷,趙志杰,劉 陽,王加迎,韓小為

        1.哈爾濱商業(yè)大學 計算機與信息工程學院,哈爾濱 150028

        2.哈爾濱商業(yè)大學 黑龍江省電子商務(wù)與信息處理重點實驗室,哈爾濱 150028

        大數(shù)據(jù)時代下,電子商務(wù)的快速發(fā)展使得行業(yè)之間的競爭愈發(fā)激烈,客戶對產(chǎn)品與服務(wù)信息獲取渠道越來越多,電子商務(wù)企業(yè)面臨著產(chǎn)品同質(zhì)化嚴重、同行競爭加劇,從而導致新增客戶獲取困難、成本增加等行業(yè)問題。同時,電子商務(wù)市場不同于傳統(tǒng)線下市場能獲取到穩(wěn)定客源,客戶流失量較高。因此對于電子商務(wù)市場而言,維護好留存客戶,保持客戶忠誠度,降低客戶流失率是當前面臨的主要問題。電子商務(wù)客戶流失預(yù)測可以幫助商家預(yù)測流失趨勢,構(gòu)建適合電子商務(wù)數(shù)據(jù)特性的影響因素指標體系,有針對性地提出挽留措施,提高商家利潤,因此,電子商務(wù)客戶流失預(yù)測是電子商務(wù)領(lǐng)域的一個重要研究方向[1]。

        一般傳統(tǒng)線下的客戶關(guān)系主要靠契約維持,而電子商務(wù)中的客戶關(guān)系屬于非契約關(guān)系,致使客戶流失的可能性增加。針對電子商務(wù)非契約的不穩(wěn)定環(huán)境,學者通常將客戶流失當作二分類任務(wù),選取當下流行的機器學習模型及其集成方法解決預(yù)測精確度問題。然而在上述模型與方法中學者通常使用全數(shù)據(jù)輸入模式進行方法比較從而忽視了不同類型客戶的流失預(yù)測情況。目前,針對于客戶流失原因的研究,學者們遵從Farquhar提出的七大主題處理流失問題,對電子商務(wù)客戶流失具有的隨機性、時變性等變化特性關(guān)注不夠。

        本文將UCI數(shù)據(jù)庫的電子商務(wù)零售數(shù)據(jù)集分為活躍和非活躍用戶兩類。通過考察電子商務(wù)零售的數(shù)據(jù)特性,結(jié)合客戶流失相關(guān)研究,優(yōu)化傳統(tǒng)RFM理論模型,以構(gòu)建較為全面的電子商務(wù)客戶流失因素體系。采用深度信念網(wǎng)絡(luò)(deep belief networks,DBN)實證模型對電子商務(wù)客戶流失進行預(yù)測,以提升模型預(yù)測性能。最后,提取DBN模型的權(quán)重矩陣,計算電子商務(wù)客戶流失影響因素的相對強度,為不同類型電子商務(wù)客戶流失原因提供合理解釋,以便為企業(yè)進行客戶管理提出有針對性的建議與策略。

        1 客戶流失相關(guān)研究

        客戶流失預(yù)測是利用客戶記錄的歷史數(shù)據(jù)對潛在的流失客戶進行判斷的過程[2]。客戶流失的研究自20世紀90年代興起之后便一直深受國內(nèi)外眾多學者的廣泛關(guān)注。目前,客戶流失研究主要集中于電信、金融等行業(yè),而電子商務(wù)作為互聯(lián)網(wǎng)快速發(fā)展所衍生的行業(yè),也受到了學者們的青睞。

        國內(nèi)外學者對于客戶流失的影響因素和流失的原因進行了大量的研究,F(xiàn)arquhar等討論了美國銀行業(yè)的客戶獲取和客戶保持之間的平衡問題,提出客戶價值、最大化信息等七個主題是處理好二者關(guān)系的基礎(chǔ)[3]。Meer等以荷蘭某網(wǎng)上銀行為研究對象,發(fā)現(xiàn)點擊流是研究客戶保持的較好方法[4]。文獻[5]從社交網(wǎng)絡(luò)的視角出發(fā),利用自我網(wǎng)絡(luò)的相關(guān)理論,在電信行業(yè)中,構(gòu)建了個體的度、聯(lián)系強度、個體的信息熵三個自我網(wǎng)絡(luò)特征變量。

        根據(jù)客戶流失發(fā)展歷程和智能化程度的高低,許多機器學習模型及其集成方法在客戶流失預(yù)測中得到成功的應(yīng)用,如決策樹[6]、支持向量機[7]、改進神經(jīng)網(wǎng)絡(luò)[8]等。文獻[9]根據(jù)鐵路零散客戶流失的特征,為提高客戶流失的準確性與高效性采取了C4.5決策樹方法進行仿真預(yù)測。Gordini等利用支持向量機開發(fā)出針對B2B電子商務(wù)行業(yè)量身定制的客戶流失預(yù)測模型[10]。Amin等針對于不同公開可用的電信技術(shù)數(shù)據(jù)集,基于距離因子的分類器確定性估計概念提出了一種新穎的客戶流失預(yù)測方法[11]。

        綜上所述,對客戶流失預(yù)測模型構(gòu)建,研究方法多樣,但預(yù)測模型準確率有待進一步提升。文獻[12]為了驗證DBN算法在分類上存在更好的性能,使用UCI上的多個數(shù)據(jù)集進行對比實驗,實驗結(jié)果表明DBN算法比傳統(tǒng)的SVM、KNN等神經(jīng)網(wǎng)絡(luò)的分類準確度更高。DBN算法是神經(jīng)網(wǎng)絡(luò)的一種,既可以用于非監(jiān)督學習,也可以用于監(jiān)督學習,因此模型可以不受時間、數(shù)據(jù)形式等的限制。基于電子商務(wù)流失數(shù)據(jù)集中冗雜的時間數(shù)據(jù)以及復雜的客戶群體之間的特征選取,DBN算法可以運用BP層在預(yù)測領(lǐng)域中的優(yōu)勢提升電子商務(wù)客戶流失預(yù)測的準確度,并通過訓練其神經(jīng)元間的權(quán)重,可以讓整個神經(jīng)網(wǎng)絡(luò)按照最大概率來生成訓練數(shù)據(jù),并直接得到特征之間的權(quán)重大小確認電子商務(wù)客戶流失的影響因素。對客戶流失因素選擇,學者們大多基于傳統(tǒng)電信、銀行等線下實體店進行研究,鮮有研究考慮電子商務(wù)數(shù)據(jù)的時效性及客戶群體劃分情況,探討電子商務(wù)客戶差異性帶來的影響。因此,本文從客戶活躍角度出發(fā),將客戶分為活躍與非活躍兩類,優(yōu)化傳統(tǒng)RFM模型,確定影響因素指標體系。采用DBN方法構(gòu)建電子商務(wù)客戶流失預(yù)測模型,并利用DBN模型的權(quán)重矩陣,計算權(quán)重系數(shù),對比分析不同類型電子商務(wù)客戶流失因素的差異。以幫助企業(yè)盡可能吸引具有潛在價值的客戶,提升保留客戶的現(xiàn)有價值。

        2 電子商務(wù)客戶流失預(yù)測模型構(gòu)建

        2.1 基于改進RFM的電子商務(wù)客戶流失理論模型構(gòu)建

        在客戶關(guān)系管理上RFM模型理論是一種重要的客戶價值分析模型,1994年RFM模型首次被美國數(shù)據(jù)庫營銷研究所Hughes提出[13],被廣泛應(yīng)用于客戶關(guān)系管理領(lǐng)域中。RFM模型由R(recency)、F(frenquency)及M(money)三個重要指標組成。R表示客戶最近一次購買的時間間隔。從企業(yè)的角度考慮,最近才購買過產(chǎn)品、服務(wù)的客戶是最有可能接受再次購買行為的客戶,吸引一名購買時間間隔短的客戶所花費的成本遠小于吸引一名購買時間間隔長的客戶。R值越小則表明客戶在近段時間內(nèi)有過交易行為,客戶的依賴性較高。F表示客戶單位時間內(nèi)進行的消費次數(shù)。對于商家而言,購買的頻率越高則表明客戶對產(chǎn)品或服務(wù)的滿意度越高、客戶的忠誠度也越高。F值越大,客戶再次購買的意向越高。M表示客戶在一段時間內(nèi)消費總金額。對于企業(yè)來說,購買金額越高則表示客戶的價值越高。M值越大,表明客戶最有可能在未來一段時間內(nèi)產(chǎn)生更高的價值。

        考慮電子商務(wù)客戶沖動購買心理及進入商家的時間長度,結(jié)合學者對客戶價值的研究,除RFM模型中頻率(F)、時間間隔(R)、金錢(M)指標外,還引進了客戶購買的最大金額(MM)、進入店鋪的時間長度(L)、購買天數(shù)(D)以及購買的概率(G)。其中,進入店鋪的時間長度指客戶在觀察期內(nèi)第一次消費的時間距離客戶最后消費時間的長度,概率是指客戶在已消費的天數(shù)中平均每天購買的次數(shù)。本文構(gòu)建的RFM模型假設(shè)如下:

        時間間隔(R):客戶在觀察期間第一次消費的時間距離觀察期最后一次消費時間長度(流失期限中);

        頻率(F):客戶在單位時間上購買的次數(shù);

        金錢(M):客戶在觀察期消費的總金額;

        最大金額(MM):客戶在觀察期消費的最大金額;

        進入店鋪的時間長度(L):客戶在觀察期后第一次消費時間距離客戶最后消費的時間長度;

        購買天數(shù)(D):客戶在觀察期總消費天數(shù);

        概率(G):客戶在觀察期內(nèi)消費的天數(shù)中平均每天購買的次數(shù)。

        RFM電子商務(wù)客戶流失理論模型見圖1。

        圖1 RFM電子商務(wù)客戶流失理論模型Fig.1 Theoretical model of RFM e-commerce customer churn

        2.2 基于DBN的電子商務(wù)客戶流失預(yù)測實證模型構(gòu)建

        DBN是深度學習方法中的一種常用模型,是一種融合了深度學習與特征學習的神經(jīng)網(wǎng)絡(luò)。DBN網(wǎng)絡(luò)結(jié)構(gòu)是由若干層受限玻爾茲曼機(restricted Boltzmann machine,RBM)和一層BP組成的一種深層神經(jīng)網(wǎng)絡(luò)[13]。DBN結(jié)構(gòu)如圖2所示。

        圖2 DBN結(jié)構(gòu)示意圖Fig.2 DBN structure diagram

        DBN訓練過程由預(yù)訓練和微調(diào)構(gòu)成,數(shù)據(jù)首先由輸入層輸入到網(wǎng)絡(luò)結(jié)構(gòu)中,生成一個向量V,通過權(quán)重值W傳給隱藏層得到H,單獨無監(jiān)督訓練每一層RBM網(wǎng)絡(luò),確保特征向量映射到不同特征空間,最后由BP網(wǎng)絡(luò)接收RBM的輸出特征向量作為它的輸入特征向量,反向傳播網(wǎng)絡(luò)自頂向下將錯誤信息傳播給每一層RBM,微調(diào)整個DBN網(wǎng)絡(luò),進行有監(jiān)督的訓練,最終得到網(wǎng)絡(luò)中的權(quán)重以及偏置。

        2.2.1 受限玻爾茲曼機

        RBM是1986年由Smolensky提出的一種可通過輸入數(shù)據(jù)集學習概率分布的隨機生成神經(jīng)網(wǎng)絡(luò)。RBM模型是包含一種可觀察變量(v)和單層隱藏變量(h)的無向概率圖,RBM只有兩層神經(jīng)元,它是一個二分圖,兩層間的單元相互連接,層內(nèi)的任何單元之間不存在連接。RBM結(jié)構(gòu)見圖3。

        圖3 RBM結(jié)構(gòu)示意圖Fig.3 RBM structure diagram

        RBM是一種基于能量的模型,任何兩個連接的神經(jīng)元之間都有一個權(quán)重W來表示連接權(quán)重Wij,Wij表示可觀察變量單元i和隱藏變量單元j之間的權(quán)重,觀察層與隱藏層分別用v和h來表示,則連接權(quán)重與偏差決定的觀察層變量v和隱藏層變量h的聯(lián)合配置能量如下[14]:

        其中,ai是可觀察層單元的偏置,b j是隱藏層單元的偏置,Wij為可觀察層單元與隱藏層單元之間的連接權(quán)重,基于能量函數(shù)的可觀察層和隱藏層可以得到概率分布[15]:

        其中,Z為配分函數(shù)的歸一化常數(shù),即所有參數(shù)下的能量之和,該函數(shù)累加所有可觀察向量和隱藏向量的可能組合。

        RBM中的每層中的神經(jīng)元只存在兩種狀態(tài)0或1,給定任意層中的各神經(jīng)元的狀態(tài),可以得到可觀察層神經(jīng)元和隱藏層神經(jīng)元的狀態(tài)概率如下[14]:

        根據(jù)Hinton在2002年提出的對比散度,可知參數(shù)的變化規(guī)則如下[14]:

        2.2.2 BP神經(jīng)網(wǎng)絡(luò)

        BP神經(jīng)網(wǎng)絡(luò)是一種多層的前饋神經(jīng)網(wǎng)絡(luò),其輸出結(jié)果采用的是前向傳播,誤差采用反向傳播方式進行的。BP神經(jīng)網(wǎng)絡(luò)是含有輸入層、隱藏層和輸出層的三層神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)[16]。具體如圖4所示。

        圖4 BP神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)圖Fig.4 BP neural network structure diagram

        BP神經(jīng)網(wǎng)絡(luò)由上一層神經(jīng)元連接到下一層神經(jīng)元時可以接收到上一層神經(jīng)元傳遞來的信息,并經(jīng)過“激活”將接收到的值傳遞給下一層。對于誤差的反向傳播是從下一層神經(jīng)元傳遞給上一層神經(jīng)元,一次性調(diào)節(jié)隱含層到輸出層的權(quán)重和偏置,輸入層到隱含層的權(quán)重和偏置。

        3 實驗結(jié)果及分析

        本文主要運用拐點理論確定流失期限,利用客戶購買天數(shù)確定個體的活躍度閾值,將其分為活躍與非活躍用戶兩類。對數(shù)據(jù)進行集成、歸一化等預(yù)處理操作,提升數(shù)據(jù)質(zhì)量。優(yōu)化RFM模型,確定影響因素,結(jié)合DBN方法,構(gòu)建活躍與非活躍客戶的流失預(yù)測模型。著重分析活躍客戶流失及非活躍客戶不流失的影響因素權(quán)重大小,提出挽留建議措施,進而幫助企業(yè)更好地進行客戶關(guān)系管理,增強客戶依賴性,減少客戶流失,獲取更大的利潤。電子商務(wù)客戶流失預(yù)測流程主要包括3個步驟:數(shù)據(jù)來源及預(yù)處理,優(yōu)化RFM模型和DBN模型的客戶流失模型構(gòu)建及影響因素權(quán)重計算。具體如圖5所示。

        圖5 電子商務(wù)客戶流失預(yù)測流程圖Fig.5 Flow chart of e-commerce customer churn prediction

        3.1 數(shù)據(jù)來源與預(yù)處理

        3.1.1 數(shù)據(jù)來源

        本文數(shù)據(jù)集來自于加利福尼亞大學機器學習UCI數(shù)據(jù)庫(http://archive.ics.uci.edu/ml/datasets.php),數(shù)據(jù)集中包含2010年12月至2011年12月(包括這一個月)真實的在線零售客戶數(shù)據(jù)。一共包括7個原始數(shù)據(jù)屬性,主要由客戶標號、商品單價、購買數(shù)量、生成交易的日期等組成。從該數(shù)據(jù)集中首先刪除2010年至2011年期間只存在一次購買行為的客戶數(shù)據(jù),其次選取真實進行在線零售的840位客戶進行電子商務(wù)客戶流失研究。

        針對結(jié)構(gòu)化的數(shù)據(jù)所存在的缺失值、數(shù)據(jù)噪聲、標準不規(guī)范等問題,本文對原始數(shù)據(jù)采取數(shù)據(jù)清洗、集成等預(yù)處理操作。將840位客戶都存在首次購買行為的時間段設(shè)為觀察期,根據(jù)數(shù)據(jù)集可知本文研究客戶流失的觀察期為2010年12月到2011年3月,共計4個月。在觀察期間內(nèi)將同一客戶不同時間段購買的多條數(shù)據(jù)整合成一條數(shù)據(jù),將原始數(shù)據(jù)中的157 510條數(shù)據(jù)整合成840條數(shù)據(jù)。通過整合變換原始數(shù)據(jù)集中的屬性生成新的屬性維度,如一位客戶在觀察期內(nèi)存在n天不同的數(shù)據(jù),則這位客戶的購買天數(shù)為n;在觀察期內(nèi)這位客戶的最終購買時間減去最初購買時間得到客戶購買的時間間隔;在觀察期內(nèi)購買天數(shù)中購買的最大金額為最大金額等。具體維度介紹見2.1節(jié)。數(shù)據(jù)集最終選取共840名客戶進行實驗。電子商務(wù)零售業(yè)部分數(shù)據(jù)集如表1所示。

        表1 電子商務(wù)零售業(yè)部分數(shù)據(jù)示例Table 1 Some examples of e-commerce retail data

        3.1.2 客戶流失期限確定

        客戶流失期限的確定一直是電子商務(wù)客戶流失關(guān)注的問題,電子商務(wù)客戶流失管理是基于非契約的客戶關(guān)系,客戶未與商家簽訂契約,存在著隨時進入市場隨時退出市場的可能。對于電子商務(wù)的客戶而言,電子商務(wù)的客戶消費習慣存在著周期性,當客戶首次消費之后,存在著一段時間的無消費周期,但在未來的某一時間若還會出現(xiàn)消費行為,則代表客戶回購,若未出現(xiàn)消費行為,則代表客戶沒有回購,客戶徹底流失,其中首次購買后無消費的周期則為流失期限,具體見公式(8):

        客戶流失期限的長度與客戶的回購率成反比,本文設(shè)定了不同時期的流失期限長度進行客戶回購率的統(tǒng)計,并觀察客戶回購率隨客戶流失期限的增大時的收斂速度,本文以“月”為單位設(shè)定流失期限,根據(jù)不同流失期限回購率的變化曲線,使用拐點理論進行流失期限的設(shè)定,如圖6所示。

        圖6 流失期限與回購率示意圖Fig.6 Schematic diagram of churn period and repurchase rate

        拐點理論是指X軸上的數(shù)值增大時Y軸上的數(shù)值隨之變化,直到到達某個點時,Y軸變化的程度明顯減少,則稱為“拐點”。由圖所知,隨著流失期限增大,用戶回購率一直降低。當流失期限為4個月時,回購率降低幅度明顯減小。因此,設(shè)置4為拐點。

        根據(jù)拐點理論知,客戶流失期限為4個月,具體表現(xiàn)在2010年12月至2011年3月之間有過購買行為,且連續(xù)4個月間未發(fā)生購買行為的客戶,稱之為客戶流失。

        3.1.3 客戶活躍閾值確定

        選取2010年12月到2011年3月份的所有客戶的數(shù)據(jù),統(tǒng)計這4個月中消費者消費的天數(shù),繪制漏斗圖,具體如圖7所示。

        圖7 客戶活躍漏斗圖Fig.7 Customer active funnel diagram

        運用客戶購買的天數(shù)這個屬性加以漏斗圖與其轉(zhuǎn)化率可以解決客戶是否活躍的問題。如圖所示,購買天數(shù)大于等于3天的時候,轉(zhuǎn)換率大于50%,且與購買天數(shù)大于等于4天的轉(zhuǎn)換率差別不大,所以確定活躍的購買天數(shù)為3天及以上,將數(shù)據(jù)分為了活躍與非活躍兩大類,活躍用戶為購買天數(shù)大于等于3天的客戶群體,非活躍用戶為購買天數(shù)小于3天的客戶,將數(shù)據(jù)集劃分成活躍用戶群體380位,非活躍客戶用戶460位。

        3.1.4 數(shù)據(jù)歸一化

        基于活躍與非活躍用戶的數(shù)據(jù)存在穩(wěn)定的標化趨勢,并未具有極端的最大值與最小值。為了確保數(shù)據(jù)的有效性,將整合的數(shù)據(jù)經(jīng)過活躍劃分后進行最大最小值標準化處理,使得數(shù)據(jù)便于比較。對原始數(shù)據(jù)進行了收縮轉(zhuǎn)變,讓數(shù)據(jù)轉(zhuǎn)換成區(qū)間[0,1]中的值,其中屬性的最大值為max,最小值為min,X′為X標準化之后的值,公式如下[17]:

        3.2 DBN實證模型參數(shù)及結(jié)構(gòu)設(shè)定

        根據(jù)DBN流失預(yù)測模型的構(gòu)建,將活躍用戶數(shù)據(jù)集中380位客戶以及非活躍用戶數(shù)據(jù)集中460位客戶導入各自的模型中,運用Matlab工具,得出活躍用戶數(shù)據(jù)集模型的精確率為93.16%,非活躍用戶數(shù)據(jù)集中的模型的精確率為78.7%。分別得到7×13×2的網(wǎng)絡(luò)結(jié)構(gòu)以及7×7×2的網(wǎng)絡(luò)結(jié)構(gòu)。

        3.2.1 DBN實證模型參數(shù)選擇

        DBN模型是一種生成型的神經(jīng)網(wǎng)絡(luò)模型,其組成部分包括三層即輸入層、隱藏層和輸出層。客戶流失模型中將優(yōu)化后的7個指標作為輸入層的神經(jīng)元節(jié)點數(shù),輸出層神經(jīng)元節(jié)點數(shù)就是目標是否流失。其中X1為時間間隔(R)、X2為客戶進入商家的時長(L)、X3為購買頻率(F)、X4為購買概率(G)、X5為消費總金額(M)、X6為最大消費金額(MM)、X7為消費天數(shù)(D);y1為客戶流失、y2為客戶非流失。

        DBN模型隱藏層的選擇至關(guān)重要。增加隱藏層可以適當?shù)亟档途W(wǎng)絡(luò)誤差,提高精度,但同時會使得網(wǎng)絡(luò)復雜化,增加了網(wǎng)絡(luò)的訓練時間導致出現(xiàn)“過擬合”的傾向。因此,本文設(shè)置1層隱含層進行訓練。

        將優(yōu)化得到的RFM模型中的7個指標作為輸入層輸入到DBN網(wǎng)絡(luò)結(jié)構(gòu)中,可知DBN輸入節(jié)點數(shù)n為7,輸出類別l為2,根據(jù)Kolmogorov定理[18]計算隱藏層神經(jīng)元個數(shù)m,公式如下:

        通過公式可確定隱藏層節(jié)點數(shù)m=[4,5,6,7,8,9,10,11,12,13],對兩組數(shù)據(jù)分別訓練DBN模型,共2×10組實驗。通過活躍與非活躍數(shù)據(jù)集實驗結(jié)果對比確定單層隱藏層節(jié)點數(shù)。

        客戶流失函數(shù)設(shè)置為隱層和輸出層神經(jīng)元激活函數(shù)。DBN可分批次進行訓練,每批次訓練數(shù)據(jù)由訓練集樣本數(shù)和訓練批次共同決定,即每批次訓練數(shù)據(jù)為訓練集樣本數(shù)據(jù)與訓練批次的比值,對于活躍與非活躍的數(shù)據(jù)集來說,數(shù)據(jù)樣本不同,則每批訓練數(shù)據(jù)不同,活躍數(shù)據(jù)集的每批訓練數(shù)據(jù)為95次,非活躍數(shù)據(jù)集每批訓練數(shù)據(jù)為115次,最大網(wǎng)絡(luò)循環(huán)次數(shù)為1 000次。學習率的值設(shè)置為1,動量因子的值設(shè)置為0,這些值包含在RBM訓練參數(shù)中。BP訓練參數(shù)包括學習率,其值設(shè)置為2,動量因子,其值設(shè)置為0.9。將兩組預(yù)處理后的數(shù)據(jù)集按1∶1的比例分成訓練集與測試集輸入DBN模型中。

        3.2.2 DBN實驗結(jié)果分析

        設(shè)置并調(diào)整參數(shù)后,構(gòu)建優(yōu)化RFM與DBN電子商務(wù)客戶流失預(yù)測模型?;钴S用戶的DBN實驗結(jié)果如表2。

        表2 活躍用戶DBN實驗結(jié)果Table 2 DBN experiment results of active users

        從表2中可知,在活躍用戶中DBN隱藏層為13層時,實驗誤差最小,準確率最高達到93.16%;由表中可知將活躍用戶的單層隱藏層節(jié)點數(shù)設(shè)置為13時,實驗結(jié)果最佳。輸出層為流失與非流失,得到一個7×13×2的網(wǎng)絡(luò)結(jié)構(gòu)圖如圖8所示。

        圖8 活躍用戶DBN結(jié)構(gòu)Fig.8 DBN structure of active users

        從表3中可知,在非活躍用戶中DBN隱藏層為7層時,實驗誤差最小,準確率最高達到78.7%;由表中可知將非活躍用戶的單層隱藏層節(jié)點數(shù)設(shè)置為7時,實驗結(jié)果最佳。得到一個7×7×2的網(wǎng)絡(luò)結(jié)構(gòu)如圖9所示。

        表3 非活躍用戶DBN實驗結(jié)果Table 3 DBN experiment results of inactive users

        圖9 非活躍用戶DBN結(jié)構(gòu)Fig.9 DBN structure of inactive users

        3.2.3 DBN與其他預(yù)測方法對比

        為進一步驗證DBN模型對活躍客戶細分的電子商務(wù)客戶流失預(yù)測模型的準確度,本文運用了隨機森林、SVM、貝葉斯神經(jīng)網(wǎng)絡(luò)以及BP神經(jīng)網(wǎng)絡(luò)四種預(yù)測方法進行了對比分析。具體實驗結(jié)果如表4所示。

        表4 五種預(yù)測模型的準確率Table 4 Accuracy of five prediction models %

        由表4可知,對于活躍用戶群體細分后的預(yù)測準確率方面,DBN預(yù)測模型無論是活躍用戶還是非活躍用戶的準確率都高于隨機森林、SVM以及BP神經(jīng)網(wǎng)絡(luò)。而對于貝葉斯神經(jīng)網(wǎng)絡(luò)而言,DBN預(yù)測模型中活躍用戶的準確率遠高于它,但對于非活躍用戶群體來說貝葉斯神經(jīng)網(wǎng)絡(luò)的準確率略高于DBN模型。綜合活躍與非活躍用戶客戶流失模型的準確率,DBN模型相比于經(jīng)典的流失預(yù)測模型而言更加有效。

        3.3 電子商務(wù)流失客戶影響因素權(quán)重分析

        經(jīng)由DBN預(yù)測電子商務(wù)的客戶流失可以評估每個輸入變量與輸出變量之間的關(guān)系,得出每個變量之間的權(quán)重值,可由以下公式直接得出每個輸出層變量的最終權(quán)重[19]:

        其中,Wki表示第k個隱藏單元和第i個輸入單元之間的權(quán)重;W jk表示第j個輸出單元和第k個隱藏單元之間的權(quán)重。RS ji是第i個輸入變量和第j個輸出變量之間的相對強度。

        本文主要研究活躍客戶的流失,非活躍客戶的非流失原因,故運用RS ji統(tǒng)計量計算優(yōu)化后的RFM模型中各變量權(quán)重,活躍用戶中影響客戶流失的各因素權(quán)值如表5所示;對于非活躍用戶中影響客戶未流失的各因素權(quán)值如表6所示。

        表5 活躍用戶中影響客戶流失的因素權(quán)重Table 5 Weights of factors affecting customer churn among active users

        表6 非活躍用戶中影響客戶未流失的因素的權(quán)重Table 6 Weights of factors affecting customer churn among inactive users

        根據(jù)表5可知,活躍客戶中的流失與購買頻率、消費天數(shù)、最大消費金額、消費總金額、客戶進入商家的時長以及客戶購買概率成反比。根據(jù)影響因素權(quán)重的大小可知,消費總金額是影響活躍客戶流失的最主要因素,權(quán)重最大為0.147 9;其次為客戶的消費頻率,權(quán)重為0.134 5;第三為客戶進入商家的時長,權(quán)重為0.116 3。其余四個影響因素的重要程度排名依次是客戶的最大消費金額、客戶的購買概率、客戶的消費天數(shù)和客戶購買的時間間隔。

        對于優(yōu)化的RFM模型中同是表示時間間隔的客戶購買時間間隔以及客戶進入商家的時長而言,活躍客戶群體更關(guān)注的是客戶進入商家的時長,對電子商務(wù)客戶而言,客戶可以隨時進入商家的店鋪,也可以隨時流失。但對活躍的客戶群體來說,客戶進入商家的時長(L)權(quán)重系數(shù)為負,表明了進入商家時長越長的活躍客戶,則對商家存在一定的依賴性,時間越長忠誠度越高,則客戶越不容易流失。對于模型中同是表示頻率的購買頻率與購買概率而言,負向影響活躍客戶的流失,說明頻率對于活躍客戶的流失存在抑制作用,因為購買頻率越頻繁則減少了客戶轉(zhuǎn)移商家的風險,節(jié)省了轉(zhuǎn)移成本,在活躍客戶購買頻率越高,依賴性越強的情形下,客戶就自動減少成本,以至于減少流失。就模型中表示金額的消費總金額與最大消費金額而言,對于活躍客戶的流失存在顯著影響,消費總金額(M)的權(quán)重最大,系數(shù)為負,因此對于活躍客戶來說其流失的最大影響因素為消費金額。消費總金額越大說明了客戶對于商店的滿意度越高,信賴度越高,對商家建立了一定的客戶忠誠,有利于商家保持活躍客戶。

        對企業(yè)而言,活躍客戶是企業(yè)的核心客戶,但活躍客戶中依舊存在著流失現(xiàn)象。帕累托原則表示,不同價值的客戶對企業(yè)的利潤貢獻度不同,企業(yè)80%的利益來源于20%有價值的客戶。為挽留活躍用戶中流失的高價值的客戶,由分析結(jié)果可知,企業(yè)應(yīng)首先關(guān)注活躍客戶中客戶的總購買金額、消費頻率以及進入商家的時長?;谏鲜鲆蛩兀瑸橥炝艨蛻?,企業(yè)首先應(yīng)對流失客戶提出個性化金融服務(wù),刺激其消費并提高購買總金額,其次,對客戶進行會員等級登記,根據(jù)會員等級的高低推出個性化商品折扣促銷,保持流失客戶的消費頻率。

        根據(jù)表6可知,非活躍用戶中的未流失客戶與購買頻率、消費天數(shù)、消費的最大金額、消費總金額以及購買概率成正比,與客戶購買的時間間隔成反比。根據(jù)表中權(quán)重大小可知,購買頻率是影響活躍客戶流失的最主要因素,權(quán)重最大為0.758 1;其次為客戶購買的時間間隔,權(quán)重為0.069 2;第三為消費天數(shù),權(quán)重為0.048 7。其余四個影響因素的重要程度排名依次是客戶消費總金額、客戶進入商家的時長、客戶消費最大金額和購買概率。

        在非活躍客戶研究客戶非流失問題中對于優(yōu)化的RFM模型中對比同是時間因素的客戶購買的時間間隔、客戶進入商家的時長和消費天數(shù),可知對于非活躍客戶而言,影響客戶非流失的顯著影響因素為客戶購買的時間間隔和客戶消費天數(shù)。其中客戶購買的時間間隔(R)負向影響非活躍客戶的非流失,客戶消費天數(shù)(D)正向影響非活躍客戶的非流失,說明了在非活躍客戶群體中,客戶購買的時間間隔越短,消費天數(shù)越多,其非流失率越高。就模型中表示頻率的客戶購買頻率和客戶購買概率而言,雖兩者都正向影響客戶的非流失率,但是對比權(quán)重大小可知,就頻率因素而言,客戶購買頻率(F)顯著正向影響非活躍客戶的非流失率。對于模型中表示金額的消費總金額以及最大消費金額而言,兩者對非流失率都存在正向影響,但對比兩者權(quán)重大小可知,消費總金額相對而言影響強度大于最大消費總金額。而對于最大消費金額而言,非活躍客戶存在一定的沖動消費,在沖動消費期間客戶對商家存在短暫的客戶滿意,在此段時間過后,客戶存在著流失的風險,故對于非活躍用戶而言客戶的非流失率并未特別關(guān)注客戶的金額因素。在非活躍客戶群體中,對于購買頻率越高、時間間隔越短、消費天數(shù)越多的這類潛在有價值客戶可期發(fā)展成活躍客戶。

        對企業(yè)而言,非活躍客戶群體中的非流失客戶是企業(yè)的潛在有價值客戶。根據(jù)Rosenberg和Czepiel對客戶價值的調(diào)查研究報告可以得出,開發(fā)一個新客戶所需的花費,相比較對于一個老客戶的維護費用,前者是后者近六倍的成本[20]。對于發(fā)展這部分潛在有價值客戶,由結(jié)果分析可知,企業(yè)應(yīng)該關(guān)注非活躍用戶中客戶購買頻率、客戶購買的時間間隔以及客戶消費天數(shù)。企業(yè)對這類客戶,刻畫其用戶畫像,了解客戶的偏好,采取有針對性地對其推送感興趣商品的措施,提高其購買頻率以及購買天數(shù),以期發(fā)展為活躍客戶。

        4 結(jié)語

        根據(jù)Reicheld的研究可知,如果能夠?qū)⒖蛻舻牧魇式档?%,就會給企業(yè)帶來至少1/4的利潤增長[21]。一個有價值的老客戶比一個新客戶對于商家而言,利益更大。本文針對傳統(tǒng)客戶流失預(yù)測模型全數(shù)據(jù)導入的局限性,提出了一種優(yōu)化RFM理論模型與DBN實證模型,預(yù)測電子商務(wù)客戶流失情況,研究活躍客戶流失及非活躍客戶未流失的影響因素。實驗結(jié)果表明:(1)本文考慮到電子商務(wù)數(shù)據(jù)時變性特點及電子商務(wù)客戶本身的不穩(wěn)定性,優(yōu)化了傳統(tǒng)的RFM模型,構(gòu)建了更全面的電子商務(wù)客戶流失影響因素指標體系,探討了各影響因素的重要性。(2)通過實證研究,對比分析5種客戶流失預(yù)測模型,DBN模型原理清晰,準確率高、效果好,在電子商務(wù)客戶流失預(yù)測模型中凸顯出較好的優(yōu)勢。(3)本文基于活躍用戶流失和非活躍用戶不流失的獨特視角,對比分析了不同類型用戶的影響因素,探討了用戶差異造成的影響,為企業(yè)針對不同類用戶制定有效的管理策略提供參考,進而提升客戶忠誠度,獲得企業(yè)利益。

        猜你喜歡
        活躍天數(shù)權(quán)重
        本周連漲天數(shù)居前個股
        本周連跌天數(shù)居前個股
        權(quán)重常思“浮名輕”
        當代陜西(2020年17期)2020-10-28 08:18:18
        活躍在抗洪救災(zāi)一線的巾幗身影
        海峽姐妹(2019年8期)2019-09-03 01:00:46
        為黨督政勤履職 代民行權(quán)重擔當
        這些活躍在INS的時髦萌娃,你Follow了嗎?
        Coco薇(2017年11期)2018-01-03 20:24:03
        生日謎題
        基于公約式權(quán)重的截短線性分組碼盲識別方法
        電信科學(2017年6期)2017-07-01 15:44:57
        層次分析法權(quán)重的計算:基于Lingo的數(shù)學模型
        河南科技(2014年15期)2014-02-27 14:12:51
        二月為什么天數(shù)最少
        久久AⅤ无码精品为人妻系列| 伊人久久综合无码成人网| 久久中文字幕av一区二区不卡| 日本一区二区不卡精品| 天堂√在线中文官网在线| 久久精品久久精品中文字幕| 激情综合网缴情五月天| av在线播放亚洲天堂| 久久人妻无码一区二区| 国产色诱视频在线观看| 色优网久久国产精品| 日本按摩偷拍在线观看| 九九久久自然熟的香蕉图片| 国产主播一区二区三区在线观看| 亚洲男人在线无码视频| 桃色一区一区三区蜜桃视频| 性做久久久久久久| 日日摸夜夜添夜夜添无码免费视频 | 色婷婷精品久久二区二区蜜桃| 麻豆影视视频高清在线观看| 国产一级毛片AV不卡尤物| av天堂一区二区三区| 国产成人精品无码免费看| 日韩人妻无码一区二区三区| 波多野结衣一区二区三区视频 | 精品久久综合日本久久综合网| 久久精品中文字幕女同免费| 99久久婷婷国产综合精品电影| 无码人妻视频一区二区三区99久久| 日本二区三区视频在线观看| 国产性自爱拍偷在在线播放| 狠狠色噜噜狠狠狠狠色综合久| 欧美日韩中文制服有码| 一区二区三区国产偷拍 | 国产乱人伦av在线a麻豆| 欧美黑人又粗又大久久久| 手机av男人天堂免费网址| 免费国产自拍在线观看| 国内精品伊人久久久久影院对白| 91精品国产91久久久无码色戒| 亚洲男人的天堂av一区|