季 芳
(福建船政交通職業(yè)學院 管理工程系,福建 福州 350007)
大數(shù)據(jù)時代,來源于多平臺的數(shù)據(jù)飛速增長和累積。這些數(shù)據(jù)形態(tài)各異、種類繁多,數(shù)量巨大,利用價值率低。企業(yè)能夠獲得產品銷售數(shù)據(jù)和運營數(shù)據(jù)以及客戶行為數(shù)據(jù)和購買數(shù)據(jù)等多維數(shù)據(jù)。[1]如何通過對數(shù)據(jù)進行分析、挖掘出龐大的客戶群,建模細分客戶,進行準確定位,達到精準營銷是企業(yè)面對的難題。目前,“大數(shù)據(jù)”成為研究的熱點和關注的焦點,在零售、金融、醫(yī)療、電信和制造等各個行業(yè)都在進行“大數(shù)據(jù)”的收集、分析和應用。張勇(天貓前CEO)講到“未來任何一個企業(yè)的商務活動都離不開大數(shù)據(jù)”。[2]對于目前占市場主體超過90%的中小型零售企業(yè),數(shù)據(jù)的價值在于經過采集、處理、分析以后成為有效的數(shù)據(jù)才能給企業(yè)帶來商業(yè)價值。中小型零售企業(yè)大多缺乏科學的客戶價值評估體系和客戶細分方法,客戶細分通常依靠業(yè)務人員的主觀判斷,正確性未免受到個人主觀意識和情感因素的影響。有些中小型零售企業(yè)根本沒有進行客戶細分和客戶價值的評估,同等對待每位客戶,沒有針對客戶的不同特點和需求采用不同的營銷策略,在進行營銷活動時,只是隨機的或者挑選部分客戶發(fā)送微信、短信或者郵件,觸達客戶。[3]本文著眼于中小型零售企業(yè),基于大數(shù)據(jù)對客戶進行分類。將客戶進行分類管理能幫助中小型零售企業(yè)優(yōu)化資源配置,對中小型零售企業(yè)進行高效、精準營銷意義重大。
客戶細分是指將屬性特征相同的客戶群劃分為同一群組,它能有效識別客戶需求,有助于企業(yè)最終實現(xiàn)精準營銷。[4]國內外學者研究發(fā)現(xiàn)客戶細分方法主要基于人口統(tǒng)計、購買行為、生活方式和利益等四類。[5]基于購買行為的客戶細分方法目前采用的比較多,它以信息技術為支撐,以數(shù)據(jù)為基礎。RFM模型是最典型的基于客戶購買行為的細分方法。[6]它是由Hughes提出,由最近一次購買時間(Recency)、購買金額(Monetary)和購買次數(shù)(Frequency)三個維度組成,每個維度只有一個指標。[3]而客戶的消費行為是非常復雜的,三個指標不能完全反映客戶的購買和價值。整理相關的文獻綜述發(fā)現(xiàn),國內外學者基于RFM模型進行客戶細分時,通常細化RFM指標或者對RFM模型進行拓展和延伸。呂斌和張晉東利用RFM模型對商業(yè)銀行客戶細分時,把每個指標細化為三個級別,另外最近購買時間由交易間隔天數(shù)替代。[7]曾小青通過深入研究傳統(tǒng)RFM模型,構建了3個維度10個細分指標的新RFM模型,并選取某大型紙巾生產企業(yè)進行實證研究,說明了多指標客戶細分方法的科學性。[8]趙萌針對企業(yè)客戶線上評論所帶來的價值,改進了傳統(tǒng)的RFM模型,提出RFMP模型。[9]徐翔斌在RFM模型的基礎上,增加了商品總利潤指標,提出了RFP模型,并選取某電子商務企業(yè)進行實證分析,結果顯示比原始RFM模型對客戶細分更加準確。[10]
不同的客戶細分指標重要程度不同,所以要對指標賦予不同的權重。梳理國內外學者對于客戶細分指標的權重的研究結果顯示,指標權重的賦予有兩類:以熵值法為代表的客觀評價賦值法和以層次分析法為代表的主觀評價賦值法。[11]馬玉芳和王扶東、熊蘭和高炳采用層次分析法確定指標權重。[12]趙萌[9]、蔡玖琳[11]采用熵值法確定各指標的權重。主觀評價賦值法易受評價者的判斷能力的影響,評價結果可能產生隨意性;客觀評價賦值法注重應用數(shù)學理論,不受評價者主觀因素的影響。綜合已有研究,很少涉及利用大數(shù)據(jù)指導中小型零售企業(yè)的經營活動。本文基于大數(shù)據(jù)背景下,著眼于中小型零售企業(yè),構建客戶分類指標體系,提出一種改進的RFM模型與K-Means相結合,并應用熵值法確定各指標權重,得出客戶細分模型,為中小型零售企業(yè)決策提供參考。
傳統(tǒng)的RFM模型每個維度只有一個指標,指標的劃分標準過于寬泛。而客戶的購買行為非常復雜,傳統(tǒng)的RFM模型不能全面體現(xiàn)客戶的購買行為,無法體現(xiàn)客戶交易的變化趨勢。因此本文結合中小型零售企業(yè)的特點,對傳統(tǒng)的RFM模式進行改進,拓展維度并細化指標,構建多指標的客戶分類指標體系(見表一)。用客戶的本身指標值與全體客戶對應的指標均值的比值來反映客戶在這個屬性上的相對位置。而客戶已經購買商品種類數(shù)目也在某種程度上體現(xiàn)了客戶的潛在價值,和購買多種相關產品的可能性??蛻舯3謺r間在一定程度上體現(xiàn)客戶的忠誠度。
表一 客戶細分指標體系
細分指標說明:
R1:最近一次交易距離實驗指定時間節(jié)點的時間間隔。
R2:R2的值越小,表明客戶對企業(yè)越依賴,流失概率越小。
F1:客戶在樣本數(shù)據(jù)時間段內的交易頻率。
F2:F2越小,說明客戶的忠誠度越低,其能間接反應客戶對企業(yè)的忠誠度和依賴性。
M1:客戶平均交易金額,其能反映客戶對企業(yè)的貢獻,M1值越大,說明給企業(yè)貢獻的利潤越大。
M2:如果M2大于1,說明該客戶對企業(yè)的貢獻高于平均水平。M2越大客戶對于企業(yè)的貢獻越大。
T:體現(xiàn)顧客忠誠度的指標,T越大忠誠度越高,反之,忠誠度越小。
C:交叉銷售量,C越大說明對該類客戶交叉銷售的可能性越大,更容易促進他們購買品類繁多的商品。
由于每個細分指標對確定客戶類別的影響程度不同,需要對客戶細分指標賦權。熵值法是一種客觀賦權法,是根據(jù)每項指標觀測值所提供的信息的大小來確定指標權重,避免了人為因素的影響[4]。因此本文采用熵值法對各指標賦予權重。假設原始數(shù)據(jù)集存在m個客戶,n個指標,Xij表示第i個客戶的第j個指標的取值。分為以下五個步驟:
1.原始數(shù)據(jù)標準化處理,本文構建的客戶分類指標體系存在正、負向指標,需對它們分別處理。[13]
值越大越好的正向指標:
值越小越好的負向指標:
2.計算第i個客戶第j個指標的比重:
3.計算指標j的信息熵:
4.計算指標j的差異系數(shù):
dj=1-ej
對于指標j,特征值差異越大,其所起的作用就越大,熵值ej就越小,由公式可知dj越大的指標越重要。
5. 計算每個指標的權重:
K-Means算法簡單、快捷,被廣泛應用于科學研究和企業(yè)處理大規(guī)模數(shù)據(jù)聚類分析中。K-Means算法是定量方法,具有“理論上可靠,應用上高效”等優(yōu)點。任何算法都沒有十全十美,K-Means算法的不足在于確定聚類數(shù)目K對初始類質心的依賴,解決此問題可以通過多次聚類進行優(yōu)化,確定初始類質心和聚類數(shù)目。[3]另外,K-Means算法對數(shù)據(jù)比較敏感,均值受到孤立點數(shù)據(jù)和噪聲數(shù)據(jù)的影響很大,解決此問題通常通過數(shù)據(jù)的選擇、清理和整理以及對數(shù)據(jù)進行標準化處理。[14]鑒于K-Means算法的優(yōu)缺點,本文采用K-Means算法對中小型零售企業(yè)客戶進行聚類分析。
改進RFM模式和采用K-Means聚類分析方法,提出中小型零售企業(yè)客戶細分方法(見圖1)。
圖1 基于大數(shù)據(jù)客戶細分流程圖
為了驗證以上所提出的客戶細分方法的有效性,選取某中小型零售企業(yè)的會員客戶的消費數(shù)據(jù)進行測試(由于本文所采用的數(shù)據(jù)涉及商業(yè)機密,所以不便指出該中小型零售企業(yè)的名稱和列出大量的客戶數(shù)據(jù))。數(shù)據(jù)的特征維度有會員客戶基本信息,如會員編號、年齡、職業(yè)、性別、住址、入會時間等;交易信息,如商品編號、商品名稱、交易數(shù)量、交易時間、單價、交易金額,等等。本文選取該中小零售企業(yè)的所有會員的交易行為進行研究,交易數(shù)據(jù)共451 745條。首先對數(shù)據(jù)進行預處理,對存在噪聲、缺失值和不一致的數(shù)據(jù)進行清理,最終保留了38 672條會員客戶信息和421 631條交易信息。本文只考慮與客戶分類指標相關的屬性,因此最終確定會員的入會時間、消費時間、消費商品編號和消費金額等屬性。
經過數(shù)據(jù)準備階段,對本文所構建的客戶分類指標體系中各指標值計算并進行標準化,得到各項指標值特征描述(見表二)。其中前兩項為負向指標,其余為正向指標。
表二 指標值特征統(tǒng)計表
應用熵值法對各指標進行賦權,通過計算各指標的權重為(0.041 266 15,0.045 584 16,0.116 868 89,0.079 890 16,0.358 031 16,0.044 814 16,0.282 545 16,0.031 000 01),通過計算得到加權后的新的數(shù)據(jù)集。
1.K值的確定在使用K-Means聚類方法中非常重要,對聚類結果有很大的影響。聚類數(shù)目K不易過多,一般經驗取值范圍在2到8之間。因此本文按照上述權重調整后得到的數(shù)據(jù)集進行聚類,并采用多次聚類來確定K值。在聚類結果中,通過類內平均距離和泛化能力來觀測聚類質量。[4]K-Means聚類要求類內平均距離盡可能小,而泛化能力盡量大。根據(jù)表三可知,隨著聚類數(shù)目的增加,類內平均距離越來越小,但當K=4時開始減小的幅度越來越少。泛化能力也隨著聚類數(shù)目的增加越來越大,但當K=5時泛化能力大幅增加,此后增長忽略不計。所以K取值為5時最合適。
表三 改進RFM模型聚類數(shù)目結果
2.對相同的數(shù)據(jù)集采用傳統(tǒng)的RFM模型進行聚類,聚類結果如表四所示。
表四 傳統(tǒng)的RFM模型聚類數(shù)目結果
與表三對比說明,改進的RFM模型的聚類結果,在泛化能力上及類內平均距離都優(yōu)于傳統(tǒng)的RFM模型。
聚類數(shù)目K=5,采用改進的RFM模型對新數(shù)據(jù)集進行聚類,經過K-Means算法得出聚類結果如表五所示。
表五 K-Means聚類結果
第一類,VIP顧客(C1)。VIP顧客的特點是其交易頻率高于平均交易頻率,平均消費金額遠高平均水平,而且消費的產品種類繁多,保持時間也遠高于顧客平均保持時間。這類顧客人數(shù)占總顧客的比例不到4%,卻是企業(yè)的購買主力。因此,中小型零售企業(yè)應高度關注并與該類顧客保持良好的顧客關系,為該類顧客提供優(yōu)質服務,提供良好的顧客體驗,提高滿意度。
第二類,忠誠顧客(C2)。忠誠顧客的特點是其平均消費金額略高于整體顧客平均交易金額,但不及VIP顧客,消費的產品種類與平均水平持平,但是其交易頻率和保持時間均高于整體顧客水平。該類顧客消費金額不高,交易頻率比較高,保持時間比較長,屬于忠誠度比較高的一類顧客。這類顧客對企業(yè)非常信任,為企業(yè)帶來了很大的收益,是企業(yè)必不可少的。因此,中小型零售企業(yè)應高度重視此類顧客,激勵此類顧客并把他們逐步發(fā)展成為高忠誠度的VIP顧客。
第三類,一般顧客(C3) 。一般顧客的特點是其平均消費金額、交易頻率、保持時間及消費產品的種類接近整體顧客的平均水平。一般顧客數(shù)量占整體顧客的比例非常高,達到30%左右,屬于比較穩(wěn)定的顧客,有潛力進一步發(fā)展的顧客。針對此類顧客,中小型零售企業(yè)可以加強促銷攻勢,刺激其購買欲望,以提高其消費金額。
第四類,易流失顧客(C4)。易流失顧客的平均消費金額遠遠低于顧客整體平均,交易頻率和保持時間也低于整體顧客的水平,購買產品的種類比較少,該類顧客屬于流動強,易流失的顧客,該類顧客占全部顧客的比例達到30%。易流失顧客給企業(yè)帶來的經濟效益比較少。針對此類顧客,中小型零售企業(yè)可以適當降低對他們的投入,或者選擇部分產品適當采用低價策略去穩(wěn)定此類顧客,以此帶動其他產品的銷售。
第五類,徘徊顧客(C5) 。徘徊顧客的平均消費金額接近顧客整體的平均消費金額,但交易頻率遠遠低于整體顧客的平均水平,而且保持時間也低于顧客整體平均保持時間。針對此類顧客,中小型零售企業(yè)無需投入太多資源,維持現(xiàn)狀即可。
在大數(shù)據(jù)時代背景下,中小型零售企業(yè)如果能從大數(shù)據(jù)中挖掘出有價值的信息,并加工處理,對客戶進行精準營銷,對提高客戶的滿意度和企業(yè)的效益意義重大。[4]傳統(tǒng)的RFM模型不能全面體現(xiàn)客戶的購買行為,指標劃分標準過于寬泛,本文提出了一種改進的客戶細分方法,對傳統(tǒng)的RFM模式進行改進,拓展成5個維度并細化為8個指標,構建多指標的客戶分類指標體系,通過熵值法為各指標賦權,并采用K-Means聚類將客戶分成5類。針對5類客戶采用不同的經營策略。對某中小型零售企業(yè)客戶細分的實證研究說明,該客戶細分方法在類內平均距離和泛化能力上都優(yōu)于傳統(tǒng)的RFM模型,說明方法可行、有效。