廉 琪,蘇 屹
(哈爾濱工程大學 經濟管理學院,黑龍江 哈爾濱 150001)
●營銷管理
基于 SOM和 PSO聚類組合算法的客戶細分研究
廉 琪,蘇 屹
(哈爾濱工程大學 經濟管理學院,黑龍江 哈爾濱 150001)
文章在對 RFM指標體系進行分析的基礎上,應用自組織特征映射 (SOM)神經網絡和粒子群優(yōu)化(PSO)的聚類組合算法,通過客戶關系的特征衡量分析客戶的內在價值和忠誠度,對客戶數據進行了科學、客觀、深層次的挖掘分析,為企業(yè)有針對性的制定營銷策略提供了依據。
客戶細分;SOM算法;PSO算法;RFM指標體系
當代企業(yè)間的競爭已經從市場份額的爭奪轉向客戶群體的爭奪,事實證明,許多在客戶數據挖掘方面做的出色的企業(yè)都已取得了斐然的銷售業(yè)績。例如,寶潔公司在分析客戶數據時發(fā)現大量客戶都為頭屑問題所困擾,于是寶潔公司立刻研發(fā)生產去屑洗發(fā)水,該洗發(fā)水投入市場后獲得了無數客戶的認可和好評,為寶潔公司帶來了巨大的收益。可見,企業(yè)通過客戶數據信息挖掘出客戶需求的潛在性和多樣性,已經成為企業(yè)提升核心競爭力的重要前提與基礎。因此,如何高效率并準確的挖掘、利用客戶信息,細分不同的客戶群體和客戶需求,進而增加企業(yè)銷量、降低營銷成本、推動企業(yè)發(fā)展,將成為現代企業(yè)間無形的競爭。雖然,我國大部分企業(yè)都已非常重視客戶數據挖掘工作,但是由于目前有些數據挖掘算法本身的不精確性和評價體系構建的不當,致使企業(yè)無法滿足客戶多樣化的需求并保持客戶忠誠度,有時甚至因此流失大量的潛在客戶。
本文提出的以客戶關系特征為指標來細分客戶能重點表達出客戶與企業(yè)之間的多元化的關系結構,即通過一系列定量的指標分析得到最準確的衡量結果。同時采用客戶關系特征分類法中的 RFM模型來細分客戶的行為特征,通過 SOM和 PSO的算法組合來對客戶的這些行為特征進行分類,進而識別不同的客戶群體,為企業(yè)營銷策略的制定提供依據、為核心競爭力的提升奠定基礎。
自組織特征映射神經網絡 (SOM)算法是一種經典的聚類算法。SOM網絡是一個由全連接的神經元陣列組成的無教師自組織、自學習網絡。它根據大腦神經對信號處理的過程模擬而來,當一個神經網絡接受外界輸入模式時,將會分為不同的反應區(qū)域,各區(qū)域對輸入模式具有不同的響應特性[1]。因此,SOM網絡的典型特性就是可以在一維和二維的處理單元陣列上,形成輸入信號的特征拓撲分布,具有抽取輸入信號模式特征的能力。SOM網絡由輸入層和競爭層 (輸出層)組成,輸入層中的每個神經元通過權與輸出層中的每一個神經元項連[2],其結構如圖 1所示。
圖1 SOM神經網絡結構圖
SOM算法的具體過程如下[3]:
(1)初始化,將權值Wij賦予較小的隨機初始值;設置一個較大的鄰域半徑Nc;設置學習次數 T;
(2)采樣,隨機輸入一組訓練矢量 Xk:Xk={X1k+X2k+…+Xnk};
(3)競爭,計算訓練矢量 Xk和所有的輸出神經元的距離 djk,并選擇和 Xk距離最小的神經元 c,則 c即為獲勝的神經元;
(4)自適應,更新結點 c的鄰域,調整輸出節(jié)點的連接權值向量;
(5)輸入訓練矢量集中的下一個矢量 Xk+1;
(6)令 t=t+1,更新學習率并選取另一組訓練矢量輸入網絡,返回步驟 (3);
(7)結束,當 t=T時,結束算法。
粒子群優(yōu)化 (PSO)算法是一種進化的計算算法。PSO算法是模擬鳥群覓食過程中的遷移和群集的模擬。假設在一群鳥搜索食物的空間中只有一塊食物,所有鳥都不知道這塊食物的具體位置,但是它們知道自身離這塊食物的還有多遠[5]。那么找到食物的方法就是搜索當前離食物最近的鳥的周圍區(qū)域。在 PSO中,每個鳥都是一個 “粒子”,粒子群在空間搜索,每個粒子的位置都表示問題的一個解,并通過位置的不斷調整來搜索優(yōu)化的新解[4]。粒子本身的最優(yōu)解設為Pid,粒子群的最優(yōu)解設為 Pgd。粒子自身的調整公式為[3]:
在 SOM算法中,需要對輸入的矢量數據進行大量的網絡訓練才能得到最終收斂的效果,并且在網絡訓練時有些結點始終無法勝出而形成死神經元,最終導致形成局部優(yōu)化的現象[2]。PSO算法是 1995年新提出來的聚類算法,雖然該種算法能有效結局極值陷入局部最優(yōu)解的問題,但在單獨使用對數據進行聚類分析時由于其初始化權值的隨機性,大大降低了 PSO算法的聚類效果[3]。因此,本文通過兩種算法的結合,即通過 SOM算法先得到較優(yōu)的權值,然后用得到的權值來初始化 PSO算法,顯著的提高了單獨使用這兩種算法的聚類效果。
RFM指標體系由美國直接營銷學家Bobstone基于許多數據庫營銷的經驗提出的。R(Recency),表示最近一次消費;F(Frequency),表示消費頻率;M (Monetary),表示消費金額[6]。RFM指標體系是衡量客戶價值和客戶創(chuàng)利能力的重要工具和手段。該模型通過一個客戶的近期購買行為、購買的總體頻率以及花了多少錢三項指標來描述該客戶的價值狀況[7]。同時,RFM指標體系也較為動態(tài)地表示了一個客戶的全部輪廓,這對個性化的溝通和服務提供了依據,此外,如果與該客戶打交道的時間足夠長,也能夠較為精確地判斷該客戶的長期價值 (甚至是終身價值),通過改善三項指標的狀況,從而為更多的營銷決策提供支持[8]。得到精準的數據分類是客戶細分的重要一步,但僅憑借數據分類而沒有具體的客戶價值評價體系則無法識別、挖掘客戶的價值[6],因此本文構建 RFM指標體系來對不同類別客戶的價值進行評價。
本文以電信業(yè)客戶細分為例,建立 RFM指標體系。由于電信行業(yè)中客戶消費頻率很高,幾乎每天甚至每時都在消費,因此基于傳統(tǒng)的 RFM指標 (R:消費近度;F:消費頻率;M:消費金額)中的 R幾乎為零而 F則非常高,這在指標體系的建立中毫無意義[8]。綜合考慮電信業(yè)客戶的消費特點,即交費時間間隔較大,交費次數相對較少,交費額度等于消費額度,本文提出以客戶交費的近度、頻率和金額來替代消費的近度、頻率和金額。構建指標體系見表 1。
表1 電信業(yè)客戶細分的 RFM指標體系及各指標含義
第一步,從客戶資料中提取客戶的詳細資料,以設計好的指標體系作為標準,分解客戶指標;
第二步,經驗顯示,當所有的輸入和輸出值介于 0和 1之間時,SOM神經網絡的計算效果最好[9]。因此在輸入客戶的指標前,將客戶指標做歸一化處理。其具體方法如下:
調整后的標準值 =(初始值 -min)/(max-min),其中,min和max為選擇客戶樣本數據各指標中的的最小和最大值;
第三步,隨機選取各指標的權重作為 SOM神經網絡中各神經元的初始連接權值,將客戶的數據輸入到 SOM神經網絡中得到多個客戶簇,并通過不斷的訓練使模型達到滿意的精度;
第四步,將 SOM神經網絡中得到的優(yōu)化了的權值作為初始聚類中心,對粒子群進行初始化,執(zhí)行改進后的 PSO聚類算法進行聚類;
第五步,本文為了證明 SOM-PSO聚類組合算法的優(yōu)化性,特將運用組合算法得到的客戶細分結果的 F-measure值與單純運用 SOM算法得到的 F-measure[10]值比較,來證明SOM-PSO組合算法更好的客戶細分效果;
第六步,在通過 SOM-PSO組合聚類算法得到較為精確的客戶群后,對每類客戶的 RFM平均值和總 RFM平均值作比較,每次對比中會得到兩個結果:大于等于平均值和小于平均值,通過對比得到每類客戶的 RFM的變動情況;
第七步,根據每類客戶的 RFM的變動情況分析該客戶的類別,如該客戶是有價值客戶還是潛在客戶等,針對不同的客戶類別采取 “一對一”的營銷策略;
第八步,對每類客戶標準化后的每個指標取平均值,再將平均值加權求和,得到每類客戶的終身價值總得分,分析各類客戶終身價值的差別,具體情況如圖 2所示。
本文從某市通信公司 2008年的所有的電信客戶記錄中隨機抽取了 50名客戶的數據信息進行分析,由于篇幅有限,本文僅列出十組經過歸一化處理的客戶數據信息 (見表 2)。
本例所構建的 SOM網絡模型的輸入層幾點為 3個,競爭層設計為一個 3*4的二維平面;由于本例競爭層的二維平面結點相對于所要訓練的客戶數據來說較小,因此 SOM網絡的初始鄰域值設為整個競爭層;初始的學習速率η0=0.2,并隨著時間 t而遞減;訓練次數分別設為 10、50、100次。
圖2 基于 SOM-PSO聚類組合算法的客戶細分流程圖
表2 歸一化處理的客戶信息
使用MATLAB軟件編程,對 SOM神經網絡中輸入的數據訓練進行訓練時發(fā)現,當訓練 10次時分類較為粗糙,訓練 50次時分類效果較好,隨著訓練次數的增加,到 100次時客戶分類過于細化幾乎沒有意義。因此,本例中選取訓練 50次時得到的分類結果作為初步優(yōu)化的分類結果。
用 SOM網絡得到的權值初始化 PSO算法,得到通過SOM-PSO聚類分析后產生的客戶類別。算法的輸出同時為了比較使用 SOM-PSO聚類組合方較單純使用 SOM神經網絡對客戶分類的結果的優(yōu)化性,特通過 F-measure平均 (它組合了信息檢索中查準率 (precision)與查全率 (recall)的思想來進行聚類評價,因此該值越大聚類效果越好[10])來比較 SOM-PSO組合算法和 SOM算法,結果如表 3所示。從表中我們不難發(fā)現,SOM-PSO算法的 F-measure平均值比 SOM算法要高出接近 10個百分點,這充分的說明了使用SOM-PSO算法對客戶數據進行分類的效果要 SOM算法。
表3 兩種算法的比較結果
通過 RFM指標體系對經過聚類后的客戶分成了六個級別,分別是重要保持客戶、重要發(fā)展客戶、重要挽留客戶、一般重要客戶、一般客戶、無價值客戶,如表 4所示。由每一級別的客戶人數我們也可以看出組合算法對客戶分類的實際情況也符合“20/80”法則,即企業(yè)百分之八十的利潤來源于百分之二十的客戶。
雖然通過上述分類確定了客戶的等級,但卻沒有各類客戶間量化了的價值比較,而且有些不同客戶類別屬于一個級別,無法區(qū)分其價值差異。因此,本文利用通過 SOM-PSO組合算法得到的最優(yōu)權值來對每類客戶進行打分,根據最終的總分 C總j對每類客戶排序。C總j的計算方法如下:
其中 C總j表示第 j類客戶的 R,F,M個指標加權后的總得分;j=1,…,m表示聚類后的類別,;ωRj,ωFj,ωMj分別表示第 j類的客戶的 R,F,M各指標的權值,CRj,CFj,CMj分別表示第 j類客戶的 R,F,M各指標歸一化處理的平均值。經計算后的出結果,如表 5。通過比較各類的總得分,可以量化的比較出各類客戶的價值,如類 2是類 3的0.4367/0.3812=1.1456倍。
針對以上客戶的分類情況,企業(yè)可以進行有針對性的營銷,例如對于重要保持型客戶,即 R值低、F值高、M值高。此類客戶的繳費時間間隔短,繳費較為頻繁且繳費額度大。此類客戶一般為社會工作穩(wěn)定且收入較高的人群,消費能力強如銷售經理、業(yè)務員等,這類客戶對價格敏感度低,為該電信公司的長期穩(wěn)定客戶。針對此類客戶,該電信公司可向其進行的多種營銷活動刺激其一次性多繳話費,如預交話費 3000元增 3G手機等高附加值的業(yè)務。此外,還要努力為其提供個性化、親情化的移動業(yè)務和延伸服務,如將單純的通話業(yè)務延伸至話費每月滿 300元增手機上網流量等?;蛘?對于一般重要客戶,即 R值低、F值高、M值低。此類客戶繳費時間間隔短、頻率高,但是費用少,這類客戶是典型的學生群體。他們的消費能力偏弱,所以通常會在優(yōu)惠時段打電話,而且更多使用的是較為便宜的短消息業(yè)務。這部分客戶的利潤率僅為 8.4%,低于平均水平,且客戶人數比例也僅為 8%。但是,如果對該類客戶采取適當的營銷手段,提高他們對短信、上網業(yè)務的使用量,就有可能提高這一群體的利潤水平;此外,該類用戶群體在不久后都將走出校園,他們的消費能力將整體增強。鑒于以上原因,該電信公司可以為他們訂做一個短消息包月和上網流量包月,而且校園網內通話低于預付資費水平的服務套餐,從而提高他們的消息類業(yè)務和上網業(yè)務的使用量。
表4 通過 SOM-PSO聚類分析后產生的客戶類別
表5 各類客戶的加權總得分
本文提出了一種基于 SOM-PSO聚類組合算法的客戶細分方法,并通過實證研究,以電信行業(yè)的部分客戶數據資料驗證了該組合算法的可行性。同時,通過 F-measure平均值與單純使用 SOM算法比較,證明了該組合算法在客戶信息挖掘和分類方面的優(yōu)化性。由于時間和篇幅的限制,本文也存在一些不足之處,例如樣本索取量比較小。在未來研究過程中,作者將進一步完善這一算法的應用。
[1]郭偉業(yè),趙曉丹,龐英智,等.數據挖掘中 SOM神經網絡的聚類方法研究 [J].情報科學,2009,(6):874-876.
[2]楊占華,楊燕.SOM神經網絡算法的研究與進展 [J].計算機工程,2006,(8):201-202.
[3]劉春曉,張翠芳.基于 SOM和 PSO的聚類組合算法[J].通信技術,2010,(1):208-212.
[4]劉靖明,韓麗川,侯立文.一種新的聚類算法——粒子群聚類算法 [J].計算機工程與應用,2005,(2):183-185.
[5]陳永剛,楊鳳杰,孫吉貴.新的粒子群優(yōu)化算法 [J].吉林大學學報,2006,(3):181-184.
[6]BartBaesens,GeertVerstraeten,Dirk Van Den Poel,et al.Bayesian network classifiers for identifying the slope of the customer lifecycle of long-life customers[J]. European Journal of Operational Research. Tourism Management,2004,25:429.
[7]趙曉煜,黃小原,孫福權.基于 RFM分析的促銷組合策略優(yōu)化模型 [J].中國管理科學,2005, (2):60-63.
[8]林盛,肖旭.基于 RFM的電信客戶市場細分方法 [J].哈爾濱工業(yè)大學學報,2006,(5):758-760.
[9]田玲.電子商務中客戶關系管理的研究 [M].知識產權出版社,2009.
[10]楊燕,靳蕃.聚類評價有效性綜述 [J].計算機應用研究,2008,(6):1630-1638.
Investigating the Consumers Segmentation Based on SOM and PSO Algorithm
L IAN Qi,SU Yi
(School of Econom ics and M anagem ent,Harbin Engineering University,Harbin150001,China)
In this paper,a combination algorithm of self-organizing feature map(SOM)neural network and particle swarm optimization(PSO)clustering are applied to mining the consumers’data based on the RFM index system.This combination algorithm can measure consumers’intrinsic value and loyalty quantitatively and offer enterprises a better decision basis formarketing strategies.
consumers segmentation;SOM algorithm;PSO algorithm;RFM index system
F274
A
1007—5097(2011)01—0118—04
10.3969/j.issn.1007-5097.2011.01.028
2010—03—29
黑龍江省科技攻關項目 (GZ09D204)
廉 琪 (1988—),女 (滿族),黑龍江哈爾濱人,本科生,研究方向:數據挖掘;
蘇 屹 (1983—),男,黑龍江哈爾濱人,博士研究生,研究方向:科技管理與創(chuàng)新管理,數據挖掘。
[責任編輯:張 青 ]