鄭博
摘要:大數(shù)據(jù)時代下,企業(yè)營銷焦點從產品中心轉變?yōu)榭蛻糁行模蛻絷P系管理成為企業(yè)核心問題。本文利用K-Means聚類方法對客戶分類,針對不同客戶的特征采取不同的營銷策略,實現(xiàn)企業(yè)利潤最大化。
關鍵詞:K-Means聚類;客戶分類
Abstract:In the era of big data,the focus of enterprise marketing has changed from product center to customer center,and customer relationship management has become the core issue of enterprises. In this paper,K-means clustering method is used to classify customers,and different marketing strategies are adopted according to the characteristics of different customers to maximize the profits of enterprises.
Key words:K-Means cluster;Customer classification
一、引言
在大數(shù)據(jù)時代,客戶關系管理對一個企業(yè)來說越來越重要,而客戶分類又是客戶關系管理中的關鍵問題。面對激烈的市場競爭,嘗試對客戶進行分類,了解不同類型的客戶特征,以便可以向營銷團隊提供意見,針對不同的客戶類別制定不同的營銷策略,實現(xiàn)精準營銷,有助于實現(xiàn)公司利潤目標的最大化。
二、問題分析
由于客戶沒有類別屬性,所以對客戶分類是一個無監(jiān)督學習的任務,對此,我們可以對客戶進行K-Means聚類,根據(jù)聚類結果來判別客戶的類型。本文基于客戶信息的年齡、年收入和消費積分數(shù)據(jù)來進行案例分析。在做K-Means聚類分析之前,本文利用直方圖可視化分析客戶的年齡、年收入、消費積分的特征分布,有助于了解客戶特征。
三、K-Means聚類介紹
K-Means是一種基于距離的聚類算法,其算法過程如下:
1)隨機選取K個樣本對象作為初始的聚類中心點。
2)計算各樣本與每個中心點的距離,并將樣本劃分到距離最近的中心點所在簇。
3)樣本劃分完成后,計算每簇樣本坐標的均值,并以此為新的中心點。
4)重新計算各樣本與每個中心點的距離,若存在樣本所屬簇發(fā)生變化則轉2),否則轉5)。
5)當所有樣本所屬簇不再發(fā)生變化時停止并輸出聚類結果。
四、客戶基本信息特征分析
對企業(yè)客戶的年齡、年收入、消費積分做直方圖有:
由圖可見,年齡上,客戶主要集中在20-50歲左右,其中30-40歲年齡段人數(shù)最多,反映出中青年為主要客戶來源。年收入方面,客戶大多處于40-80千元段,年收入超過80千元后,客戶數(shù)急劇減少??蛻粝M積分主要集中在40-60積分段。
五、建立K-Means聚類模型及可視化
首先對數(shù)據(jù)做標準化處理,再利用Calinski-Harabaz指數(shù)輔助確定聚類的K值取6。利用Python建立K-Means聚類模型,對模型結果做雷達圖有:
圖中Age為年齡,Annual_Income為年收入,Spending_Score為消費積分。
可以看出6類的數(shù)據(jù)特征依次為:第一類客戶:青年人、低收入、高消費。第二類客戶:中年人、低收入、低消費。第三類客戶:青年人、高收入、高消費。第四類客戶:青年人、中等收入、中等消費。第五類客戶:中老年人、中等收入、中等消費。第六類客戶:中年人、高收入、低消費。
六、分析建議
可以看出對于青年人,其消費水平高,但仍有部分中等消費水平的青年人可待挖掘消費潛力。對此可以針對第四類客戶,進一步深入分析,探索這部分客戶的消費需要,完善企業(yè)的產品種類。
對于中年人不論收入高低,其消費水平均偏低,消費潛力沒有被開發(fā)出來??梢娖髽I(yè)產品對于中年人吸引力低,對此研究中年人的客戶需求,開發(fā)相關產品可以彌補企業(yè)對該客戶群體消費的缺失。