崔永生
摘 要:3D(大數(shù)據(jù)、數(shù)字化、發(fā)展中經(jīng)濟(jì)體)背景下金融行業(yè)領(lǐng)域的競爭日益加劇,優(yōu)質(zhì)客戶成為金融企業(yè)爭奪的焦點(diǎn)。如何有效地、精確地運(yùn)用客戶細(xì)分的理論和方法,定位標(biāo)識自己的核心客戶群,是企業(yè)實(shí)現(xiàn)精準(zhǔn)營銷盈利目的的唯一有效途徑。RFM模型是衡量客戶價值和客戶創(chuàng)利能力的重要工具和手段,K-means聚類結(jié)合RFM模型是一種目前企業(yè)客戶細(xì)分應(yīng)用中普遍采用的組合方法。如果K-means聚類結(jié)合傳統(tǒng)的RFM模型來做客戶細(xì)分,由于RFM指標(biāo)取值范圍通常具有灰性,需要人為經(jīng)驗(yàn)判斷,所以在指標(biāo)取值上具有強(qiáng)主觀性,會影響客戶價值評價結(jié)果的準(zhǔn)確性。為此本文針對這一問題,采用灰聚類分析技術(shù),依據(jù)我國某商業(yè)銀行信用卡客戶個人信息和卡消費(fèi)交易統(tǒng)計(jì)數(shù)據(jù),構(gòu)建了基于灰聚類的RFM兩階段細(xì)分模型,并作了實(shí)證分析。分析結(jié)果表明,此模型解決了RFM指標(biāo)灰色屬性取值難以度量的問題,同時對銀行客戶細(xì)分簡單有效,結(jié)果可以為營銷決策提供參考依據(jù)。
關(guān)鍵詞:數(shù)據(jù)挖掘 精準(zhǔn)營銷 RFM模型 灰聚類 客戶細(xì)分 K-means聚類
中圖分類號:F713.50 文獻(xiàn)標(biāo)識碼:A 文章編號:2096-0298(2018)07(c)-131-07
3D(大數(shù)據(jù)、數(shù)字化、發(fā)展中經(jīng)濟(jì)體)背景下金融行業(yè)領(lǐng)域的競爭日益加劇,高質(zhì)量的客戶成為銀行業(yè)爭奪的焦點(diǎn),不同類型的客戶帶給銀行不同的銷售利潤。客戶細(xì)分是成功管理客戶關(guān)系的基礎(chǔ),也是有效實(shí)施市場策略的第一步[1]。銀行只有通過定性和定量相結(jié)合的方法,運(yùn)用現(xiàn)代技術(shù)的方法和手段,精準(zhǔn)地把握客戶的消費(fèi)心理和消費(fèi)行為特征,實(shí)施有真對性的客戶細(xì)分的營銷策略,進(jìn)行市場產(chǎn)品、服務(wù)和管理資源合理的配置,才能達(dá)到少投入多產(chǎn)出。
從客戶價值細(xì)分的維度上,國內(nèi)外學(xué)者研究的較為深入。大多數(shù)針對電信和零售企業(yè)提出了RFM指標(biāo)分析評價方法并構(gòu)建了相關(guān)的客戶細(xì)分模型,但對銀行信用卡客戶消費(fèi)行為特征結(jié)合價值細(xì)分的研究還不多見。另外傳統(tǒng)方法的RFM指標(biāo)在取值范圍常具有灰性,需要人工經(jīng)驗(yàn)界定,因此帶有強(qiáng)主觀性。針對這一問題,本文依據(jù)銀行信用卡客戶的消費(fèi)行為數(shù)據(jù),采用灰色系統(tǒng)理論中的灰聚類分析方法,來解決具有灰色性RFM指標(biāo)其取值難以度量的問題,構(gòu)建了改進(jìn)的RFM兩階段聚類細(xì)分模型,并進(jìn)行了實(shí)證分析,結(jié)果表明該模型對銀行信用卡客戶細(xì)分簡單有效。
1 相關(guān)研究評述
采用數(shù)據(jù)挖掘的技術(shù)對企業(yè)客戶細(xì)分,目前已成為國內(nèi)外專家學(xué)者研究的熱點(diǎn),并取得了豐碩的成果。就研究成果來看,普遍地應(yīng)用了CRM理論中客戶細(xì)分策略并結(jié)合各種數(shù)據(jù)挖掘技術(shù)手段加以實(shí)現(xiàn)?,F(xiàn)將國內(nèi)外近3年來研究現(xiàn)狀總結(jié),如表1所示。
就目前國內(nèi)外專家學(xué)者對企業(yè)客戶細(xì)分的研究成果來看,普遍采用了FRM模型結(jié)合K-means聚類技術(shù),這種組合方法可以觀測客戶的消費(fèi)行為和評估客戶生命周期的價值。從行業(yè)應(yīng)用上看,多數(shù)集中在電信、零售行業(yè);從數(shù)據(jù)挖掘的技術(shù)應(yīng)用上看,多數(shù)集中在綜合運(yùn)用各種聚類算法來提高客戶細(xì)分的準(zhǔn)確性和穩(wěn)定性,但對客戶細(xì)分指標(biāo)的選擇和取值合理性的研究并不多見,這一領(lǐng)域的研究需要進(jìn)一步的深化和探討。
2 相關(guān)概念
2.1 FRM模型
RFM分析模型最早是由Hughes(1994)提出,它根據(jù)客戶的交易歷史記錄,用于分析客戶的消費(fèi)行為,標(biāo)識出差異化的客戶,進(jìn)而評估客戶價值。RFM模型由三個重要的指標(biāo)變量構(gòu)成,其定義如下。
(1)最后一次購買產(chǎn)品的時間間隔(R)。R代表最近的一次購買產(chǎn)品時間和目前的時間間隔。R間隔越短,R代表的客戶價值越大。(2)采購的頻率(F)。F表示頻率,指客戶在某一時間段的購買產(chǎn)品的活動頻率。例如,一年幾次,一個月幾次。F值越大,F(xiàn)代表的客戶價值越大。(3)購買產(chǎn)品的貨幣價值(M)。M代表貨幣價值,指客戶在某一時間段購買產(chǎn)品的消費(fèi)金額。M值越大,M代表的客戶價值越大。
RFM模型被應(yīng)用于許多行業(yè)領(lǐng)域的客戶細(xì)分,經(jīng)典的RFM模型可作為市場營銷產(chǎn)品的客戶價值評分模型。客戶購買產(chǎn)品的消費(fèi)記錄被RFM的三個細(xì)分標(biāo)量指標(biāo)排序,并將三個標(biāo)量指標(biāo)值依次分成五個等級,如R變量,設(shè)最近購買產(chǎn)品的20%的客戶等級為5,前一個最近購買產(chǎn)品20%的客戶等級為4,以此類推到等級為1,這樣客戶記錄按照這三個變量指標(biāo)本分成125的等級組。擁有最高評分等級的客戶則是最有價值的客戶。
2.2 指標(biāo)定權(quán)灰聚類
常用的距離有:閔可夫斯基(Minkowski)距離、蘭式(Lance和Williams)距離、馬哈拉諾比斯(Mahalanobis)距離、歐式(Euclidean)距離等。K-means的劃分?jǐn)?shù)據(jù)集的方法是:給定一個有N個元素組成的數(shù)據(jù)集,分裂法將構(gòu)造K個分組,每一個分組就代表一個聚類,K(1)每一個分組至少包含一個數(shù)據(jù)記錄。
(2)每一個數(shù)據(jù)記錄屬于且僅屬于一個分組。
對于給定的K,算法先給出一個初始的分組方法,以后經(jīng)過反復(fù)迭代的方法改變分組,使得改進(jìn)后的分組都優(yōu)于前一次,即同一分組的記錄距離越近,而不同分組的記錄距離越遠(yuǎn)。
3 模型的構(gòu)建
目前我國商業(yè)銀行客戶信用卡的使用率相比于國外銀行使用率相對低下,造成大量的信用卡開戶后閑置,這主要與銀行只注重客戶信用卡的市場份額,而忽略客戶的信用卡使用情況和消費(fèi)習(xí)慣的記錄有關(guān),進(jìn)而沒有了解和掌握客戶信用卡的消費(fèi)需求,降低了信用卡客戶的對銀行的忠誠度,難以提供個性化的服務(wù)。
本文基于信用卡客戶的消費(fèi)行為,構(gòu)建灰聚類RFM兩階段客戶細(xì)分模型,如圖1所示。
構(gòu)建灰聚類RFM模型的步驟如下。
第一步:抽取銀行信用卡客戶交易記錄,對交易數(shù)據(jù)統(tǒng)計(jì)并預(yù)處理。
第二步:對客戶交易數(shù)據(jù)統(tǒng)計(jì),選擇客戶消費(fèi)行為指標(biāo)變量。
第三步:依據(jù)客戶交易數(shù)據(jù)統(tǒng)計(jì),選擇RFM指標(biāo)變量。
第四步:對客戶消費(fèi)行為指標(biāo)變量進(jìn)行PCA降維處理。
第五步:采用灰聚類,對RFM指標(biāo)數(shù)據(jù)進(jìn)行第一階段聚類,生成信用卡客戶價值評級記錄組。
第六步:采用K-means聚類,將客戶統(tǒng)計(jì)消費(fèi)記錄聯(lián)合信用卡客戶RFM價值評級記錄進(jìn)行第二階段聚類,生成客戶信用卡消費(fèi)細(xì)分組。
4 實(shí)證分析
4.1 數(shù)據(jù)的來源與預(yù)處理
4.1.1 信用卡客戶和交易記錄的來源與統(tǒng)計(jì)
信用卡客戶賬戶數(shù)據(jù)來源于我國某商業(yè)銀行數(shù)據(jù)中心數(shù)據(jù)庫,數(shù)據(jù)包括客戶個人信息(性別、年齡、職業(yè)、文化程度、婚姻狀態(tài)、個人收入、信用額度、失信情況等),總計(jì)31129條。信用卡客戶交易數(shù)據(jù)來源于2015—2016年這些賬戶的交易信息數(shù)據(jù)庫,總計(jì)10,101,098條。統(tǒng)計(jì)剔除在一年中沒有任何消費(fèi)的或有失信情況的客戶,最終選取27129個客戶及其消費(fèi)記錄作為本文研究的指標(biāo)數(shù)據(jù)??蛻糍~戶信息及交易數(shù)據(jù)統(tǒng)計(jì)描述如表2所示。
4.1.2 信用卡客戶細(xì)分指標(biāo)的選取
依據(jù)客戶的消費(fèi)記錄和客戶賬戶信息的分類屬性,選擇客戶細(xì)分的數(shù)據(jù)指標(biāo),如表3所示。
4.2 客戶消費(fèi)數(shù)據(jù)指標(biāo)的PCA降維處理
通過PCA降維處理,可以大大提高維模型數(shù)據(jù)指標(biāo)變量的分類有效性。本文通過對客戶信用卡消費(fèi)百分比數(shù)據(jù)運(yùn)用SPSS統(tǒng)計(jì)分析軟件作主成分分析,即將表3中14個消費(fèi)指標(biāo)進(jìn)行降維處理,從中選出顯著的消費(fèi)指標(biāo)因子作為聚類輸入指標(biāo)。首先采用因子旋轉(zhuǎn)法,提取特征值大于1及因子載荷大于0.7的指標(biāo),通過濾掉交叉落在不同因子上或雖然落在某個具體因子上但顯著性<0.7的指標(biāo),分析得到8個因子如表4所示,主成分累計(jì)方差貢獻(xiàn)率為84.678%,到達(dá)降維的效果。
將上述8個因子總結(jié)歸類,可以得到以下的客戶消費(fèi)細(xì)分指標(biāo)變量,如表5所示。
4.3 定權(quán)灰聚類白化權(quán)函數(shù)和指標(biāo)權(quán)重的選擇
確定定權(quán)灰聚類白化權(quán)函數(shù)和灰聚類指標(biāo)權(quán)重一般是根據(jù)以往專家經(jīng)驗(yàn)和定性分析結(jié)論給出[12],本文參考Ravasan A Z, Mansouri T(2015)[14]德爾菲法,選取銀行信用卡業(yè)務(wù)專家?guī)熘?0個工作年限超過10年的專家,請他們對RFM指標(biāo)灰聚類白化函數(shù)和權(quán)重值給出參考意見,經(jīng)過五輪評測,最后對各專家意見結(jié)果進(jìn)行變異系數(shù)法綜合。其計(jì)算第j方案評價標(biāo)準(zhǔn)差σj公式如下所示:
4.4 第一階段灰聚類的結(jié)果分析
本文采用灰聚類建模軟件GTMS3.0,對第一階段客戶RFM數(shù)據(jù)進(jìn)行灰聚類分析,聚類結(jié)果如表7所示。從表7的聚類結(jié)果可以看出,所有客戶記錄被聚類為五個灰類,即所有客戶被細(xì)分成五個等級組(優(yōu)、好、中、差、劣)。其中優(yōu)質(zhì)客戶占總體15%,好的客戶占總體21%,普通客戶占總體21%,差的客戶占總體20%,劣質(zhì)客戶占總體23%??蛻魯?shù)量和數(shù)量百分比,如圖2所示。
優(yōu)、好的信用卡客戶占總客戶百分比為36%,中、差、劣的客戶數(shù)占客戶總數(shù)64%,優(yōu)質(zhì)客戶數(shù)占客戶總數(shù)約1/3,普通和差的客戶占總客戶約2/3,說明大多數(shù)客戶信用卡使用率不高。針對所有客戶如果在五個等級組的基礎(chǔ)上,結(jié)合他們消費(fèi)行為和習(xí)慣,進(jìn)行進(jìn)一步實(shí)施客戶細(xì)分,可以有效地展開個性化的營銷策略活動。
4.5 第二階段K-means聚類的結(jié)果分析
由第一階段的灰聚類分析,得到了客戶RFM指標(biāo)的五個等級細(xì)分組,在此基礎(chǔ)上,為了進(jìn)一步分析客戶的信用卡的消費(fèi)行為特征及客戶性別、年齡段、婚姻狀態(tài)對信用卡使用率的影響,本文采用軟件IBM SPSS Modeler 16.0,對信用卡客戶進(jìn)行了第二階段K-means聚類分析。取K值為9,得到9個聚類,大小如圖3所示,最大的聚類6包含5812條客戶記錄,最小的聚類9包含1551條客戶記錄。9個聚類的中心分布如圖4所示,整理后如表8所示。由表8可以看出,按照5個質(zhì)量等級基礎(chǔ)上,每個等級又包含一到兩個子細(xì)分聚類組。每個子細(xì)分聚類組客戶由于性別、年齡段和婚姻狀態(tài)個人屬性的差異,在消費(fèi)行為和習(xí)慣存在較大差異。RFM普通客戶等級組中包含最大的消費(fèi)聚類組6,包含5812個客戶,其他的等級組中包含相對較少的客戶。為了更清楚分析各子聚類組客戶的消費(fèi)習(xí)慣和偏好,按照FRM價值聚類等級,畫出各聚類組的條形如圖5~圖9所示。依據(jù)客戶的消費(fèi)傾向,劃分以下客戶群體。
時尚一族。在圖5優(yōu)質(zhì)客戶等級組中,包含聚類1和9,客戶是年齡在25~44歲之間的中青年女性,婚姻狀態(tài)是年輕單身、離異和中年已婚。他們信用卡消費(fèi)著重在時尚消費(fèi)和旅游消費(fèi),百分比分別為35.68%和24.32%。這部分客戶注重生活品質(zhì)及愛好旅游,針對這部分群體消費(fèi)特點(diǎn),銀行適時推出時尚一族優(yōu)惠卡,會得到他們的認(rèn)可和歡迎。
旅游一族。在圖6好的客戶等級組中,包含了聚類10和4,客戶是年齡在35~54歲之間的中年已婚男性。他們的消費(fèi)特點(diǎn)是旅游消費(fèi)百分比為31.28%,高于其他的消費(fèi)百分比。時尚消費(fèi)和醫(yī)療保險(xiǎn)占百分比分別為20.35%和20.18%,可以看出也占有比較大的比例。針對這部分群體的消費(fèi)特點(diǎn),銀行適時推出旅游一族優(yōu)惠卡,會得到他們的認(rèn)可和歡迎。
實(shí)用一族。在圖7普通客戶等級組中,包含聚類6,最大的聚類組。客戶是35~44歲之間的中年已婚男性,這部分客戶群體醫(yī)療消費(fèi)、日用消費(fèi)、通訊消費(fèi)分別為29.35%、27.16%和25.68%,消費(fèi)比例平均,其他方面也占有一定比例,可以看出他們的消費(fèi)特點(diǎn)是注重實(shí)用性。針對這一部分客戶,銀行適時推出實(shí)用性優(yōu)惠卡,會等到他們的認(rèn)可和歡迎。
生活一族。在圖8差的客戶等級組中,包含了聚類2和7,客戶是35~44歲之間的已婚中年群體。他們的消費(fèi)特點(diǎn)是在日用消費(fèi)占有很高的比例,相比于其他的消費(fèi)群體,信用卡使用率不高。針對這一部分消費(fèi)群體,銀行如果采用適當(dāng)?shù)臓I銷策略,培養(yǎng)引導(dǎo)他們的消費(fèi)傾向從日用消費(fèi)向更多的消費(fèi)方面如時尚消費(fèi)和旅游消費(fèi),可以提高客戶價值。
盲從一族。在圖9劣質(zhì)客戶等級組中,包含聚類8和3。客戶是35~44歲和55歲以上的中老年男性,這部分消費(fèi)群體消費(fèi)傾向比較平均,信用卡的使用率低下??赡苁倾y行為了追求客戶賬戶的保有率,盲目優(yōu)惠客戶開卡??蛻粼谛庞每ㄊ褂媚康纳?,并沒有明確的需求。針對這一消費(fèi)群體,銀行已有的客戶,適時回訪,展開信用卡消費(fèi)引導(dǎo),提升客戶價值。同時在沒有明確客戶消費(fèi)需求情況下,減少信用卡開卡量,減少不必要資源浪費(fèi)。
5 結(jié)語
目前FRM模型結(jié)合數(shù)據(jù)挖掘方法,是實(shí)現(xiàn)企業(yè)客戶細(xì)分普遍采用的技術(shù)方法,本文基于FRM模型,提出了灰聚類RFM兩個階段聚類模型,對銀行信用卡客戶細(xì)分進(jìn)行了理論和實(shí)證分析。分析結(jié)果表明,該模型可以解決傳統(tǒng)FRM模型中具有灰色屬性的指標(biāo)數(shù)據(jù)不能直接處理的不足,同時結(jié)合數(shù)據(jù)挖掘K-means聚類的方法,可以有效地對銀行信用卡客戶的消費(fèi)習(xí)慣特征進(jìn)行細(xì)分。在本文的實(shí)證分析中,通過兩階段的聚類方法,根據(jù)客戶的消費(fèi)交易記錄,被細(xì)分成時尚一族、旅游一族、實(shí)用一族、生活一族、盲從一族,從而給銀行的銷售人員針對不同的消費(fèi)群體制定下一步相應(yīng)的營銷策略提供決策依據(jù)。
參考文獻(xiàn)
[1] 劉英姿,吳昊.客戶細(xì)分方法研究綜述[J].管理工程學(xué)報(bào), 2006(1).
[2] Chen Y,Liu Z,Wang Y,et al.Research on User Segmentation based on RFL Model and K-means Clustering Algorithm[C].International Conference on Lo gistics,Engineering,Management and Computer Science(LEMCS 2015).Atlantis Press,2015.
[3] Yuliari N P P, Putra I K G D,Rusjayanti N K D. Customer Segmentation Through Fuzzy C-Means and Fuzzy RFM Method[J].Journal of Theoretical and Applied Information Technology,2015,78(3).
[4] You Z,Si Y W,Zhang D,et al.A decision-making framework for precision marketing[J].Expert Systems with Applications,2015,42(7).
[5] Gü?demir H, Selim H. Integrating multi-criteria decision making and clustering for business customer segmentation[J].Industrial Management&Data Systems,2015,115(6).
[6] Dullaghan C,Rozaki E.Integration of Machine Learning Techniques to Evaluate Dynamic Customer Segmentation Analysis for Mobile Customers[J].2017.
[7] 蔡淑琴,蔣士淼,GDOLLEOLLE,等.基于在線客戶評論的客戶細(xì)分研究[J].管理學(xué)報(bào),2015,12(7).
[8] 郭崇慧,趙作為.基于客戶行為的4S店客戶細(xì)分及其變化挖掘[J].管理工程學(xué)報(bào),2015,29(4).
[9] 張虎,王國華,鄭文芳.基于MaxDiff和潛在類別分析的移動支付客戶細(xì)分研究[J].數(shù)理統(tǒng)計(jì)與管理,2017,36(3).
[10] 宋華,云俊.基于客戶感知價值的客戶細(xì)分研究[J].工業(yè)工程, 2015,18(4).
[11] 鄧聚龍.灰色系統(tǒng)理論教程[M].武漢:華中理工大學(xué)出版社, 1990.
[12] 劉思峰,等.灰色系統(tǒng)理論及其應(yīng)用(第八版)[M].北京:科學(xué)出版社有限責(zé)任公司,2017.
[13] 卓金武,周英.數(shù)據(jù)挖掘技術(shù)與實(shí)踐(MATLAB版)[M].北京:電子工業(yè)出版社,2015.
[14] Ravasan A Z,Mansouri T.A Fuzzy ANP Based Weighted RFM Model for Customer Segmentation in Auto Insurance Sector[J].International Journal of Information Systems in the Service Sector,2015,7(2).